Thesis
Diseño de un modelo en machine learning para predecir las funciones ejecutivas y validarlas estadísticamente

Loading...
Thumbnail Image

Date

2025-06

Journal Title

Journal ISSN

Volume Title

Program

Ingeniería Civil Informática

Campus

Campus Casa Central Valparaíso

Abstract

En esta investigación se desarrolló un modelo de inteligencia artificial para prever el rendimiento en competencias matemáticas tempranas (CMLR, CMN y CMG) en niños de entre 5 y 9 años. Para ello, se recolectaron 528 registros que incluyen 22 variables relacionadas con funciones ejecutivas (como memoria de trabajo y flexibilidad cognitiva) y datos sociodemográficos. Se entrenaron cinco modelos de regresión multisalida (Decision Tree, Random Forest, XGBoost, CatBoost y LightGBM), ajustando sus hiperparámetros con HalvingGridSearchCV y validándolos en 50 particiones aleatorias del conjunto de datos. El desempeño se midió con el Error Cuadrático Medio en los conjuntos de entrenamiento, validación y prueba. Tras detectar diferencias significativas entre modelos mediante la prueba de Friedman, se aplicaron comparaciones post-hoc (Nemenyi y pruebas de Wilcoxon con corrección de Bonferroni) para identificar cuál modelo resultaba mejor. Los resultados muestran que CatBoost obtuvo el menor MSE promedio en los tres indicadores matemáticos, con poca variabilidad entre ejecuciones, y superó de forma significativa a los otros algoritmos. A partir de este modelo “ganador”, se calculó la importancia de cada predictor usando Permutation Importance, encontrando que la Memoria de Trabajo Verbal y la edad fueron las variables más influyentes, seguidas por la Flexibilidad Cognitiva y la dependencia en tareas ejecutivas. Además, al repetir el análisis con un subconjunto reducido de seis variables, se comprobó que el rendimiento no se vio afectado de manera sustancial, lo cual respalda la viabilidad de un modelo más sencillo e interpretable. La relevancia de estos hallazgos radica en ofrecer una visión cuantitativa sobre qué funciones ejecutivas y factores contextuales explican mejor las habilidades matemáticas en la primera infancia. Esto puede guiar el diseño de intervenciones educativas específicas (por ejemplo, ejercicios para fortalecer la memoria de trabajo) y aportar mayor transparencia acerca de la contribución relativa de cada variable, facilitando su aplicación en otros entornos escolares o poblaciones.
In this study, we built and validated a machine learning model to predict early math skills (CMLR, CMN, and CMG) in children aged 5 to 9. We gathered 528 records with 22 features, including executive function measures (such as verbal working memory and cognitive flexibility) and sociodemographic data. We trained five multi-output regression models—Decision Tree, Random Forest, XGBoost, CatBoost, and LightGBM—tuning their hyperparameters with HalvingGridSearchCV and evaluating performance across 50 random splits of the data. Model accuracy was assessed using Mean Squared Error (MSE) on training, validation, and test sets. After detecting overall differences with Friedman’s test, we applied post-hoc comparisons (Nemenyi and Wilcoxon tests with Bonferroni correction) to identify the best-performing algorithm. Results revealed that CatBoost achieved the lowest average MSE for all three math outcomes, with consistently low variability across runs. Using this “winning” model, we computed feature importances via Permutation Importance and found that verbal working memory and age were the strongest predictors, followed by cognitive flexibility and executive function dependence. A follow-up analysis with a reduced set of six features showed that performance remained largely unchanged, supporting the feasibility of a simpler, more interpretable model. The relevance of these findings lies in quantifying which executive functions and contextual factors most reliably predict early math development. This insight can inform targeted educational interventions (for example, exercises to strengthen working memory) and increase transparency about each predictor’s contribution, making the approach adaptable to other school settings or populations.

Description

Keywords

Inteligencia artificial, Competencias matemáticas, Importancia significativa, Importancia de la permutación, Mathematical competencies, Permutation importance, Significant importance, Artificial intelligence

Citation