EL REPOSITORIO SE ENCUENTRA EN MARCHA BLANCA

 

Thesis
Topic Models Ensembles

dc.contributor.advisorMendoza Rocha, Marcelo Gabriel (Profesor Guía)
dc.contributor.advisorTorres López, Claudio Esteban (Profesor Correferente)
dc.contributor.authorOrmeño Arriagada, Pablo Iván
dc.contributor.departmentUniversidad Técnica Federico Santa María. Departamento de Informáticaes_CL
dc.coverage.spatialCasa Central Valparaísoes_CL
dc.date.accessioned2024-09-13T17:38:33Z
dc.date.available2024-09-13T17:38:33Z
dc.date.issued2022-01
dc.description.abstractLa recuperación de información Adhoc es una tarea desafiante que consiste en hacer ranking de documentos para consultas provenientes desde un enfoque de bolsa de palabras. Los métodos clásicos basados en consultas y documentos de vectores de texto, usan funciones de ponderación de términos para hacer ránking de documentos. Algunos de las limitaciones de estos métodos son que no pueden lidiar con conceptos polisémicos. Además, introducen falsas ortogonalidades entre palabras semánticamente relacionadas. Para superarlas, los enfoques de recuperación de información basados en modelos de temas se pueden explorar. Específicamente, los modelos de temas basados en Latent Dirichlet Allocation (LDA) permiten construir representaciones de documentos de texto en el espacio latente de temas, que modela de mejor manera la polisemia y evitan la generación de representaciones ortogonales entre términos relacionados. Es por esto que se pueden expandir las estrategias de Recuperación basadas en LDA usando estrategias de Aprendizaje de Ensamblado. En este sentido, la selección de modelos obedece a estos paradigmas, por lo que probamos dos enfoques usados exitosamente en el aprendizaje supervisado. Se estudian las técnicas Boosting y Bagging para modelos de temas, usando cada modelo como un experto débil de recuperación. Finalmente, se mezclan las listas de ranking obtenidas de cada modelo usando un enfoque simple pero efectivo de fusión de listas top-k. Se muestra que el enfoque propuesto fortalece los resultados en precisión y en recall, superando a los modelos clásicos de recuperación y las líneas bases de modelos de temas.es_CL
dc.description.degreeDOCTOR EN INGENIERIA INFORMATICAes_CL
dc.description.programDEPARTAMENTO DE INFORMÁTICA. DOCTORADO EN INGENIERÍA INFORMÁTICAes_CL
dc.identifier.barcode152399316UTFSMes_CL
dc.identifier.urihttps://repositorio.usm.cl/handle/123456789/107
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessRightsAes_CL
dc.subjectRECUPERACION DE INFORMACION ADHOCes_CL
dc.subjectLATENT DIRICHLET ALLOCATIONes_CL
dc.subjectENSEMBLE LEARNINGes_CL
dc.subjectBAGGINGes_CL
dc.subjectBOOSTINGes_CL
dc.titleTopic Models Ensembleses_CL
dspace.entity.typeTesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
m15239931-6.pdf
Size:
11.98 MB
Format:
Adobe Portable Document Format