Thesis
Diseño de un modelo en machine learning para predecir las funciones ejecutivas y validarlas estadísticamente

dc.contributor.correferenteÑanculef Alegría, Juan Ricardo
dc.contributor.departmentDepartamento de Informática
dc.contributor.guiaValle Vidal, Carlos Antonio
dc.coverage.spatialCampus Casa Central Valparaíso
dc.creatorOlivares del Río, Mario Andrés
dc.date.accessioned2025-08-04T18:07:52Z
dc.date.available2025-08-04T18:07:52Z
dc.date.issued2025-06
dc.description.abstractEn esta investigación se desarrolló un modelo de inteligencia artificial para prever el rendimiento en competencias matemáticas tempranas (CMLR, CMN y CMG) en niños de entre 5 y 9 años. Para ello, se recolectaron 528 registros que incluyen 22 variables relacionadas con funciones ejecutivas (como memoria de trabajo y flexibilidad cognitiva) y datos sociodemográficos. Se entrenaron cinco modelos de regresión multisalida (Decision Tree, Random Forest, XGBoost, CatBoost y LightGBM), ajustando sus hiperparámetros con HalvingGridSearchCV y validándolos en 50 particiones aleatorias del conjunto de datos. El desempeño se midió con el Error Cuadrático Medio en los conjuntos de entrenamiento, validación y prueba. Tras detectar diferencias significativas entre modelos mediante la prueba de Friedman, se aplicaron comparaciones post-hoc (Nemenyi y pruebas de Wilcoxon con corrección de Bonferroni) para identificar cuál modelo resultaba mejor. Los resultados muestran que CatBoost obtuvo el menor MSE promedio en los tres indicadores matemáticos, con poca variabilidad entre ejecuciones, y superó de forma significativa a los otros algoritmos. A partir de este modelo “ganador”, se calculó la importancia de cada predictor usando Permutation Importance, encontrando que la Memoria de Trabajo Verbal y la edad fueron las variables más influyentes, seguidas por la Flexibilidad Cognitiva y la dependencia en tareas ejecutivas. Además, al repetir el análisis con un subconjunto reducido de seis variables, se comprobó que el rendimiento no se vio afectado de manera sustancial, lo cual respalda la viabilidad de un modelo más sencillo e interpretable. La relevancia de estos hallazgos radica en ofrecer una visión cuantitativa sobre qué funciones ejecutivas y factores contextuales explican mejor las habilidades matemáticas en la primera infancia. Esto puede guiar el diseño de intervenciones educativas específicas (por ejemplo, ejercicios para fortalecer la memoria de trabajo) y aportar mayor transparencia acerca de la contribución relativa de cada variable, facilitando su aplicación en otros entornos escolares o poblaciones.es
dc.description.abstract In this study, we built and validated a machine learning model to predict early math skills (CMLR, CMN, and CMG) in children aged 5 to 9. We gathered 528 records with 22 features, including executive function measures (such as verbal working memory and cognitive flexibility) and sociodemographic data. We trained five multi-output regression models—Decision Tree, Random Forest, XGBoost, CatBoost, and LightGBM—tuning their hyperparameters with HalvingGridSearchCV and evaluating performance across 50 random splits of the data. Model accuracy was assessed using Mean Squared Error (MSE) on training, validation, and test sets. After detecting overall differences with Friedman’s test, we applied post-hoc comparisons (Nemenyi and Wilcoxon tests with Bonferroni correction) to identify the best-performing algorithm. Results revealed that CatBoost achieved the lowest average MSE for all three math outcomes, with consistently low variability across runs. Using this “winning” model, we computed feature importances via Permutation Importance and found that verbal working memory and age were the strongest predictors, followed by cognitive flexibility and executive function dependence. A follow-up analysis with a reduced set of six features showed that performance remained largely unchanged, supporting the feasibility of a simpler, more interpretable model. The relevance of these findings lies in quantifying which executive functions and contextual factors most reliably predict early math development. This insight can inform targeted educational interventions (for example, exercises to strengthen working memory) and increase transparency about each predictor’s contribution, making the approach adaptable to other school settings or populations.en
dc.description.programIngeniería Civil Informática
dc.format.extent70 páginas
dc.identifier.barcode3560900288146
dc.identifier.urihttps://repositorio.usm.cl/handle/123456789/75872
dc.language.isoes
dc.publisherUniversidad Técnica Federico Santa María
dc.rightsAttribution 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectInteligencia artificial
dc.subjectCompetencias matemáticas
dc.subjectImportancia significativa
dc.subjectImportancia de la permutación
dc.subjectMathematical competencies
dc.subjectPermutation importance
dc.subjectSignificant importance
dc.subjectArtificial intelligence
dc.subject.ods3 Salud y bienestar
dc.subject.ods4 Educación de calidad
dc.subject.ods9 Industria, innovación e infraestructura
dc.titleDiseño de un modelo en machine learning para predecir las funciones ejecutivas y validarlas estadísticamente
dspace.entity.typeTesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
3560900288146.pdf
Size:
1.81 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: