Browsing by Author "Frankenberg Castro, David Gustavo"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Thesis Diseño e implementación de un sistema basado en modelamiento de secuencias para hashing semántico de texto(2019-06) Frankenberg Castro, David Gustavo; Departamento de Informática; Ñanculef Alegría, Ricardo José; Mendoza Rocha, Marcelo GabrielEsta memoria aborda el problema de hashing para búsqueda por similitud sobre colecciones de documentos escritos. Escasos trabajos han abordado este problema formulando un modelo que aproveche la naturaleza secuencial de los textos. En particular y hasta donde sabemos, aun no se ha estudiado el uso de redes neuronales recurrentes, especializadas en el procesamiento de secuencias. Debido a lo anterior se plantea la hipótesis de que el uso de este tipo de redes puede mejorar el desempeño de las técnicas actuales de hashing en términos de precisión en la recuperación. Para comprobar la hipótesis formulada se implementó una arquitectura de tipo encoder-decoder para el procesamiento de secuencias y técnicas de word embedding para la representación de texto. Los resultados obtenidos revelan un desempeño excepcional del método sobre conjuntos de datos conformados por documentos breves y un desempeño aceptable en colecciones de documentos extensos. En base a los resultados obtenidos, se concluye que la efectividad de considerar la estructura secuencial de los textos escritos en tareas de hashing es inversamente proporcional a la extensión de los documentos de la colección. Además, se proponen diversas modificaciones a la arquitectura implementada para mejorar su desempeño sobre colecciones de documentos extensos.
