ANÁLISE PREDITIVA EM BASES DESBALANCEADAS E COMPARAÇÃO DE TÉCNICAS DE PRÉ-PROCESSAMENTO – ESTUDO DE CASO MOOC

Bruno Bastos Stoll, Lucas Vago Darós, Davidson Cury, Crediné Silva de Menezes

Resumo


O campo da ensino e aprendizado vem sendo revolucionado por cursos online que são ofertados de forma aberta e massiva (MOOC), pois servem como plataforma de conhecimento para qualquer um, a qualquer hora e em qualquer lugar. Contudo, a maioria dos alunos que participam desses cursos o abandonam, tornando-se um desafio prever tal fenômeno devido à natureza do desbalanceamento desses dados, que ocorre quando o atributo classe tem um número muito maior de exemplos que a(s) outra(s) em sistemas de preditivos. O objetivo deste artigo é comparar dois métodos pré-processamento para análise preditiva em bases desbalanceadas, chamados de Oversample e Undersample, ambos relacionados a abordagem de Resampling. Para efetuar a análise, foram gerados os modelos preditivos de diferentes formas usando um conjunto de dados de um MOOC real. Os resultados inicialmente indicam que a abordagem pode melhorar significativamente a acurácia e a eficiência de algoritmos preditivos.

Palavras-chave


Análise do Aprendizado; Mineração de Dados; Pré-Processamento; Aprendizado de Máquina

Texto completo: PDF

Todo conteúdo da revista está sob a licença 

Revista de Sistemas e Computação. ISSN 2237-2903