Thesis Evaluación del desempeño de nuevos algoritmos PBRL al enfrentarse a profesores que pueden cometer errores
dc.contributor.correferente | López Araya, Mauricio | |
dc.contributor.department | Universidad Técnica Federico Santa María. Departamento de Electrónica | |
dc.contributor.guia | Creixell Fuentes, Werner Uwe | |
dc.coverage.spatial | Campus Casa Central Valparaíso | |
dc.creator | Tapia Pino, David Alejandro Israel | |
dc.date.accessioned | 2025-02-25T13:44:08Z | |
dc.date.available | 2025-02-25T13:44:08Z | |
dc.date.issued | 2024-03 | |
dc.description.abstract | Este trabajo presenta la implementación del benchmark para algoritmos de aprendizaje reforzado basado en preferencias llamado B-Pref en la familia de algoritmos Dueling Posterior Sampling para PBRL. El objetivo de esta investigación es evaluar cuál sistema de asignación de crédito resulta ser más resistente a posibles errores humanos, con la intención de servir como un primer paso para el desarrollo de futuros algoritmos cada vez más robustos al error humano y que por ende puedan ser utilizados por usuarios normales. El documento detalla desde la revisión del estado del arte en el aprendizaje reforzado basado en preferencias y las adaptaciones que tuvieron que hacerse para la implementación de la prueba hasta los resultados y conclusiones a las que se llegaron al evaluar las decisiones de diseño de DPS y su desempeño en comparación con otros algoritmos como EPMC y PSRL. | |
dc.description.degree | INGENIERO CIVIL ELECTRÓNICO | |
dc.description.program | Ingeniería Civil Electrónica | |
dc.format.extent | 64 páginas | |
dc.identifier.barcode | 3560900284200 | |
dc.identifier.uri | https://repositorio.usm.cl/handle/123456789/73617 | |
dc.language.iso | es | |
dc.publisher | Universidad Técnica Federico Santa María | |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | |
dc.subject | Aprendizaje reforzado | |
dc.subject | B-Pref | |
dc.subject | Benchmark | |
dc.subject | Preferencias | |
dc.title | Evaluación del desempeño de nuevos algoritmos PBRL al enfrentarse a profesores que pueden cometer errores | |
dspace.entity.type | Tesis |
Files
Original bundle
1 - 1 of 1