Educational Data Mining
predição de evasão escolar em colégios públicos de Salvador
Palavras-chave:
Mineração de dados educacionais, Aprendizagem de máquina, Random Forest, K-nearest Neighbor, Naive-bayesResumo
Educational Data Mining diz respeito à aplicação de técnicas de mineração de dados, capaz de reconhecer padrões nos dados, no campo da educação. Este projeto tem como objetivo geral a construção de um modelo de aprendizagem de máquina capaz de realizar predições e classificar um aluno de acordo com a probabilidade do aluno evadir dos estudos. Os objetivos específicos estão alinhados com a metodologia, divididos na coleta e na limpeza dos dados, no treinamento do modelo e na visualização e análise dos resultados. Os dados foram coletados através de um formulário. Os algoritmos usados foram Random Forest, Naive-bayes e KNN. Random Forest obteve o maior desempenho e foi o escolhido para o modelo final.
Referências
BREIMAN, Leo. Random forests. Machine learning, v. 45, n. 1, p. 5-32, 2001.
CARLEO, Giuseppe et al. Machine learning and the physical sciences. Reviews of Modern Physics, v. 91, n. 4, p. 045002, 2019.
EVARISTO, Macaé. Macaé Evaristo - abandono e evasão escolar. Entrevista concedida ao portal Observatório de Educação. Disponível em: <https://observatoriodeeducacao.institutounibanco.org.br/em-debate/abandono-evasão-escolar>. Acesso em: 15 maio 2022.
FERREIRA, João et al. O processo etl em sistemas data warehouse. In: INForum. 2010. p. 757-765.
FIALHO, Marillia Gabriella Duarte et al. A evasão escolar e a gestão universitária: o caso da Universidade Federal da Paraíba. 2014.
GHAHRAMANI, Zoubin. Unsupervised learning. In: Summer school on machine learning. Springer, Berlin, Heidelberg, 2004. p. 72-112.
GIL, Jay S.; DELIMA, Allemar Jhone P.; VILCHEZ, Ramcis N. Predicting students’ dropout indicators in public school using data mining approaches. International Journal of Advanced Trends in Computer Science and Engineering, v. 9, n. 1, p. 774-778, 2020.
HAN, Jiawei; KAMBER, Micheline; PEI, Jian. Data Mining: Concepts and Techniques [Internet]. Waltham. 2011.
HASSAN, M.; MIRZA, T. Prediction of school drop outs with the help of machine learning algorithms. GIS Sci. J, v. 7, p. 253-263, 2020.
KABATHOVA, Janka; DRLIK, Martin. Towards predicting student’s dropout in university courses using different machine learning techniques. Applied Sciences, v. 11, n. 7, p. 3130, 2021.
KINGSFORD, Carl; SALZBERG, Steven L. What are decision trees?. Nature biotechnology, v. 26, n. 9, p. 1011-1013, 2008.
KOTSIANTIS, Sotiris B.; ZAHARAKIS, Ioannis D.; PINTELAS, Panayiotis E. Machine learning: a review of classification and combining techniques. Artificial Intelligence Review, v. 26, n. 3, p. 159-190, 2006.
MANHÃES, Laci Mary Barbosa et al. Previsão de estudantes com risco de evasão utilizando técnicas de mineração de dados. In: Brazilian symposium on computers in education (simpósio brasileiro de informática na educação-sbie). 2012.
NEVES, Felipe et al. Uso de Aprendizado de Máquina para detecção de risco de evasão no curso de Licenciatura em Computação. In: Lynx, v. 1, n. 2, 2021.
PALMER, Michael. Data is the new oil. ANA marketing maestros, v. 3, 2006.
RABAN, Daphne Ruth; GORDON, Avishag; GEIFMAN, Dorit. The information society: The development of a scientific specialty. Information, Communication & Society, v. 14, n. 3, p. 375-399, 2011.
ROMERO, Cristobal; VENTURA, Sebastian. Educational data mining: A survey from 1995 to 2005. Expert systems with applications, v. 33, n. 1, p. 135-146, 2007.
SOOFI, Aized Amin; AWAN, Arshad. Classification techniques in machine learning: applications and issues. Journal of Basic & Applied Sciences, v. 13, p. 459-465, 2017.
SOUZA, Alex Marques de. Machine learning e a evasão escolar: análise preditiva no suporte à tomada de decisão. 2020. Tese de Doutorado. Mestrado em Sistemas de Informação e Gestão do Conhecimento.
DE ALMEIDA TEODORO, Leonardo; KAPPEL, Marco André Abud. Aplicaçao de técnicas de aprendizado de máquina para prediçao de risco de evasao escolar em instituiçoes públicas de ensino superior no brasil. Revista Brasileira de Informática na Educação, v. 28, p. 838-863, 2020.