APRENDIZADO DE MAQUINA PARA AGRUPAMENTO E ASSOCIACAO DE DADOS DO ENSINO SUPERIOR PUBLICO BRASILEIRO
Resumo
Este trabalho visa à análise de características de Instituições de Ensino Superior (IES) públicas brasileiras e à descoberta de conhecimento sobre os contextos de formação de discentes de cursos de graduação das IES observadas. Para isso, técnicas previstas pelos métodos de Knowledge Discovery in Databases (KDD) e Cross Industry Standard Process for Data Mining (CRISP-DM) foram empregadas sobre bases de dados publicadas pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP). Experimentos de agrupamento e associação de dados, do Aprendizado de Máquina Não Supervisionado, foram executados em dois cenários de estudo. O primeiro cenário usa o algoritmo K-Means para agrupar IES públicas, com a observação de dados sobre despesas, quantidades de docentes e técnicos, localização e categoria administrativa das IES, entre outros. A análise dos quatro grupos obtidos no agrupamento possibilitou a identificação de similaridades e dissimilaridades entre as instituições. Os grupos, além de dados de concluintes de cursos de graduação nas IES (como faixa etária, tempo de graduação e forma de ingresso), são considerados no segundo cenário do estudo, que usa o algoritmo Apriori para geração de regras de associação que podem basear a caracterização dos perfis socioeconômicos dos estudantes.
Palavras-chave
ENADE; Censo da Educação Superior; KDD; CRISP-DM; Aprendizado de Máquina
Todo conteúdo da revista está sob a licença
Revista de Sistemas e Computação. ISSN 2237-2903