A educação é um tema complexo, pois compreende diversos níveis de formação, entidades e atores. Por isso, investigar os dados sobre o tema é uma tarefa que, antes de tudo, demanda um reconhecimento das principais fontes de informação sobre o tema. Neste tutorial, vamos te ajudar nisso, revisando as principais fontes de dados nesta área no Brasil.

O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) é referência, por exemplo, nas estatísticas do Censo Escolar, do Censo da Educação Superior e do desempenho no Exame Nacional do Ensino Médio (Enem) e no Exame Nacional de Desempenho de Estudantes (Enade), voltado aos alunos do ensino superior. As informações encontram-se na página de dados abertos do instituto.

Já o Instituto Brasileiro de Geografia e Estatística (IBGE) é bastante consultado quando o tema é alfabetização, cujas taxas são apresentadas na Pesquisa Nacional por Amostra de Domicílios Contínua (PNAD Contínua). 

Frequentemente, torna-se necessário mergulhar nos microdados (os dados na sua forma mais detalhada possível, normalmente associados às respostas individuais em pesquisas) para compreender a realidade dos alunos matriculados nas redes pública e privada do Brasil. Devido ao caráter de seus levantamentos, tanto o INEP quanto o IBGE são produtores recorrentes de microdados. Bastante granulares, essas informações geralmente são acessadas por meio de linguagens de consulta ou programação tais como SQL, Python e R.

A vantagem de acessar informações detalhadas é obter um recorte mais preciso da realidade, visto que há disparidade de acesso à educação em regiões diferentes do país. Porém, neste tutorial, não falaremos de análise dos dados em uma linguagem de programação. Abaixo, você vai encontrar dicas mais gerais e fontes para você começar a trabalhar com dados relacionados à educação, independente da ferramenta que irá utilizar. 

ATENÇÃO ÀS LIMITAÇÕES

As pesquisas ligadas à área da educação apresentam algumas particularidades e limitações que devem ser levadas em conta na extração de dados. Alguns exemplos: 

  • O Censo Escolar inclui escolas desativadas, e isso deve ser considerado na interpretação de dados correspondentes a um município ou região; 
  • A redução no número de matrículas nas escolas não significa, necessariamente, que há evasão. Há chances de ser apenas uma oscilação no número de alunos em uma instituição; 
  • Os dados do Censo do Ensino Superior são preenchidos pela instituição e por isso não contemplam dados autodeclarados pelos alunos. Isso provoca, por exemplo, altas taxas de não declaração de cor e raça;
  • O Enade é uma prova de desempenho destinada a alunos ingressantes e concluintes em cursos superiores. A cada ano, estudantes de diferentes cursos são submetidos a este exame; 
  • O Enem apresenta dados de escolas públicas e privadas. É preciso ter atenção ao estabelecer paralelos entre os dois tipos de instituições, pois a tendência é que haja menor participação de escolas públicas. 

Como dissemos no início deste tutorial, os microdados usados na cobertura de educação geralmente são do Inep. O Sistema de Seleção Unificada (Sisu) e do Programa Universidade para Todos (Prouni) são geridos diretamente pelo Ministério da Educação (MEC) e, por isso, o tratamento e o detalhamento de dados são diferentes em relação ao Inep. 

A familiaridade com as bases de dados da área e a dedicação a uma cobertura especializada são fatores que auxiliam na identificação de problemas e limitações de dados públicos na área da educação. Por conta de dificuldades como histórico e dicionários de dados limitados, os microdados desses programas são menos utilizados e um pouco mais difíceis de serem analisados. Assim, a equipe do G1 passou a disponibilizar um dashboard com análise de dados do Sisu e do Prouni. 

TRÊS DICAS PARA COMEÇAR

Uma vez definido o recorte e a base de dados com a qual se pretende trabalhar, podemos listar três pontos principais que reduzem a complexidade deste trabalho: 

  • Leia o LEIA-ME – as bases de dados apresentam, além dos dados propriamente ditos, os dicionários das variáveis adotadas na coleta e na estruturação das informações. É fundamental acessar e ler atentamente documentos como este, frequentemente também chamados de “leia-me”. Junto com a nota metodológica, o dicionário é fundamental para que seja possível compreender que tipos de análises e resultados poderão ser obtidos a partir desta base de dados
  • Elimine o que não interessa – depois de conhecer a gama de variáveis disponível em uma base de dados, a dica é delimitá-las, deixando apenas as que interessam à análise.
  • Explore os dados – se você não tem um enfoque definido e não souber por onde começar a análise, uma dica é observar os resumos e as notas estatísticas fornecidas pelo órgão responsável pela coleta de dados. Os pontos destacados nas análises institucionais podem servir de inspiração para novos recortes ou aprofundamento de um resultado. 

Conheça 7 fontes para extrair dados de educação

A escolha da base de dados para interpretar informações sobre educação depende da pergunta que você quer responder na sua análise. Normalmente, veículos de comunicação se utilizam de fontes institucionais, como organizações do terceiro setor e órgãos de governo. Há, ainda, portais que agregam dados públicos – a exemplo do Brasil.io e do QEdu -, tornando-os mais palatáveis para análises simples em softwares de planilhas. 

No caso das fontes oficiais ligadas ao poder Executivo, Legislativo e Judiciário no Brasil, uma opção viável é solicitar diretamente ao órgão, via Lei de Acesso à Informação (LAI), dados de interesse público que porventura não estejam disponíveis publicamente. Listamos, nesta publicação, sete fontes para você começar a explorar dados de educação. 

INEP

O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) autarquia federal vinculada ao Ministério da Educação, apresenta dados abertos dos principais levantamentos da área da educação no Brasil. Também apresenta indicadores financeiros, a exemplo de despesas de pessoal ligadas à educação e encargos sociais. 

IDEB

O Índice de Desenvolvimento da Educação Básica (IDEB), também mantido pelo INEP, tem como objetivo medir o fluxo escolar e o desempenho dos alunos da educação básica do Brasil. O primeiro é obtido através do número de aprovações de ano das escolas no Censo Escolar e o segundo através do rendimento dos alunos no Sistema Nacional de Aprovação da Educação Básica (Saeb). Esse índice visa o equilíbrio dos dois parâmetros, pois pode identificar a defasagem de aprendizado por meio do desempenho de alunos que são aprovados sem a devida triagem, e a retenção desnecessária de estudantes, se houver um grande desnivelamento entre o rendimento no exame e aprovação de alunos na escola.

OBSERVATÓRIO PNE

Denominado Observatório PNE, o site criado pela organização Todos Pela Educação tem como objetivo acompanhar o cumprimento das metas estabelecidas pelo Plano Nacional da Educação (PNE). Trata-se de um conjunto de objetivos, previstos na Constituição, que pretendem alcançar metas de 20 questões diferentes da educação. Essas metas têm um prazo de dez anos, sendo que as atuais foram estabelecidas em 2014 e vencem no ano de 2024. O site apresenta o percentual que cada meta já alcançou, além de também fornecer análises, estudos a situação de diferentes localidades do Brasil. Esse plano não apresenta apenas atribuições do governo federal, mas também do Executivo estadual e municipal. 

PISA

O Programme for International Student Assessment (Pisa), projeto administrado pela Organização para a Cooperação e Desenvolvimento Econômico (OCDE), é realizado a cada três anos e é feito em diversos países membros da organização. Mede o rendimento dos alunos em cinco diferentes áreas: ciências, matemática, leitura, resolução colaborativa de problemas e educação financeira. A iniciativa foi criada com o objetivo de auxiliar as ações de gestores em seus países e fazer comparações de diversas realidades. Consulte também o Mapa de Aprendizagem, que se utiliza de dados do Pisa e permite comparações entre países. 

IOEB

Mantido pela Comunidade Educativa Cedac, o Índice de Oportunidades da Educação Brasileira (IOEB) procura quantificar os resultados educacionais ligados ao Ideb e os insumos educacionais, ou seja, fatores que auxiliam nos resultados educacionais, como escolaridade dos professores, número médio de horas aula/dia, experiência dos diretores, taxa de atendimento na educação infantil. É possível analisar os resultados tanto em nível municipal, quanto estadual e nacional.

IDeA

O Índice de Desigualdades e Aprendizagens (IDeA), mantido pela Fundação Tide Setubal, procura entender a desigualdade na educação do país e o nível de aprendizado de cada município. Para isso, são usadas duas medidas: a primeira é uma meta calculada para os resultados da Prova Brasil a partir do cálculo da diferença do resultado do Brasil no Pisa em relação ao resultado médio dos países desenvolvidos. Já a desigualdade é observada por meio da comparação do rendimento na Prova Brasil de diferentes grupos de alunos a partir de três aspectos: cor, nível socioeconômico e gênero. 

UNICEF

O painel Trajetórias de Sucesso Escolar é uma iniciativa da Fundo das Nações Unidas para a Infância (Unicef) que se concentra nos números sobre fluxo escolar no Brasil. Quantifica as distorções idade-série e os números de reprovação e abandono. O site desse projeto ainda apresenta recomendações para a solução desses problemas e fornece recortes geográficos, de cor e nível socioeconômico. 

Tem outras dicas de bancos de dados relacionados à área da educação? Conta para a gente nos comentários!

* Este tutorial foi elaborado por Luan Rodrigues e Marília Gehrke a partir das anotações de Vladimir de Mello Santana Junior e Wigde Arcangelo no workshop sobre “Como decifrar sem medo os microdados da educação”, realizado por Ana Carolina Moreno na IV Conferência de Jornalismo de Dados e Métodos Digitais, em 2019. O texto contou com a edição de Ana Carolina Moreno e Adriano Belisário.

4 thoughts on “Introdução aos dados educacionais no Brasil”

  1. Guilherme Pallerosi disse:

    Muito útil o conteúdo deste tutorial. Seria interessante ter maior aprofindamento e demonstraçoes das fontes sugeridas. Mas parabéns pela didática e pelo material disponível

  2. Pedro Silva disse:

    Olá, me chamo Pedro Silva e estou cursando uma pós graduação na USP, estou realizando meu TCC com foco em explicar os repasses feitos pelo governo federal (http://repasse.ufabc.edu.br/) na área da educação, e alguns indicadores, como IDH, nota de IDEB etc coletados do IBGE e também dos microdados. No momento estou buscando informações de números de matriculados por município, nos microdados eu tenho dados de matriculados dem todas regiões, mas são muitas linhas. Vocês sabem me dizer onde consigo essa informação em outra base? Queria também saber onde consigo informações do que é cada arquivo de microdados, já que temos os terminados em: _sudeste, _nordeste, _sul, _norte, e arquivos terminados em _co. O que seriam esses arquivos _co.cvs, por exemplo: docentes_co.CSV. Obrigado pela atenção, e também, obrigado pelo lindo trabalho de vocês.

    • Adriano Belisario disse:

      Pedro, obrigado pelo comentário! Sugiro postar a dúvida em nosso Fórum para que mais pessoas possam ver e se beneficiar com a discussão: forum.jornalismodedados.org

Deixe um comentário

O seu endereço de e-mail não será publicado.