Thesis Desarrollo de un sistema backend para la automatización de formación de equipos en memorias multidisciplinarias usando aprendizaje por reforzamiento y búsqueda de árbol de Monte Carlo
| dc.contributor.correferente | Martínez Verdugo, José Manuel | |
| dc.contributor.department | Departamento de Electrónica | |
| dc.contributor.guia | Jara Carvallo, Nicolás Alonso | |
| dc.coverage.spatial | Campus Casa Central Valparaíso | |
| dc.creator | Ahumada Calderón, Javier Alfredo | |
| dc.date.accessioned | 2025-11-05T14:56:13Z | |
| dc.date.available | 2025-11-05T14:56:13Z | |
| dc.date.issued | 2025-10 | |
| dc.description.abstract | El Programa de Memorias Multidisciplinarias (PMM) de la Universidad Técnica Federico Santa María enfrenta desafíos críticos en la formación de equipos multidisciplinarios, caracterizados por un proceso manual ineficiente que requiere cuatro horas de procesamiento y genera frustración en el 80% de los participantes. La distribución desigual de preferencias estudiantiles y el crecimiento sostenido del programa intensifican esta problemática. Para abordar estas limitaciones, se desarrolló y evaluó un sistema backend que integra múltiples enfoques algorítmicos: técnicas de aprendizaje por reforzamiento (PPO y DQN) y búsqueda de árbol Monte Carlo (MCTS). La investigación incluyó el desarrollo de un ambiente de simulación personalizado usando Gymnasium, la implementación de agentes con Stable-Baseline3, y la optimización de hiperparámetros con Optuna. La arquitectura final incorpora un servidor con endpoints REST independientes que facilita la evaluación empírica de cada aproximación. La implementación reveló diferencias fundamentales en la aplicabilidad práctica de cada método. Mientras que los algoritmos de aprendizaje por reforzamiento requieren reentrenamiento completo para cada nueva configuración del programa (limitando su viabilidad operacional), MCTS demostró adaptabilidad inmediata a configuraciones cambiantes. Los resultados experimentales muestran que MCTS alcanza 71.5% de satisfacción promedio con tiempos de ejecución de minutos, comparado con 67.83% de PPO tras múltiples horas de entrenamiento. El sistema final reduce el tiempo de formación de equipos de cuatro horas a minutos, automatizando efectivamente el proceso mientras mantiene la calidad de las asignaciones. La investigación proporciona criterios claros para la selección de algoritmos en contextos educativos similares, identificando cuándo el aprendizaje por reforzamiento es apropiado versus cuándo métodos de búsqueda directa resultan más efectivos. | es |
| dc.description.program | Ingeniería Civil Telemática | |
| dc.format.extent | 116 páginas | |
| dc.identifier.barcode | 3560900288811 | |
| dc.identifier.uri | https://repositorio.usm.cl/handle/123456789/77088 | |
| dc.language.iso | es | |
| dc.publisher | Universidad Técnica Federico Santa María | |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Formación de equipos multidisciplinarios | |
| dc.subject | Aprendizaje por reforzamiento | |
| dc.subject | Monte Carlo Tree Search | |
| dc.subject | Automatización de procesos educativos | |
| dc.subject | Algoritmos de asignación | |
| dc.subject | API REST | |
| dc.subject | Optimización combinatoria | |
| dc.subject.ods | 4 Educación de calidad | |
| dc.subject.ods | 9 Industria, innovación e infraestructura | |
| dc.subject.ods | 10 Reducción de las desigualdades | |
| dc.subject.ods | 16 Paz, justicia e instituciones sólidas | |
| dc.title | Desarrollo de un sistema backend para la automatización de formación de equipos en memorias multidisciplinarias usando aprendizaje por reforzamiento y búsqueda de árbol de Monte Carlo | |
| dspace.entity.type | Tesis |
