Thesis METODOLOGÍA DE AGRUPAMIENTO DE DOCUMENTOS EN BASE A LOGS DE CONSULTAS PARA BASES DE DATOS TEXTUALES
Loading...
Date
2014
Journal Title
Journal ISSN
Volume Title
Program
Campus
Universidad Técnica Federico Santa María UTFSM. Campus San Joaquín
Abstract
Diversas funcionalidades comunes en los motores de búsqueda actuales
tales como mostrar snippets en los resultados a una consulta, mostrar la
versión "en cache" de una página dada, a mejorar las funciones de ranking de
los resultados - necesitan del almacenamiento local de la coiección de documentos
sobre la que se busca. Por Io tanto, el almacenamiento eficiente de
colecciones de documentos textuales es de vital importancia para dichos sistemas.
Para lograr este objetivo, imichos sistemas dividen Ia colección en grupos
de documentos, los cuales pueden ser comprimidos y accedidos más eficientemente.
El presente trabajo describe la implenientación de un nuevo método
de agrupamiento de documentos, el cual se basa en el uso de los registros de
consultas del sistema. Los resultados obtenidos indican que este método permite
una mejor compresión de Ia colección de documentos, así como también
un acceso más eficiente a los documentos individuales en tiempo de consulta.
Several functionalities that are nowadays common in search engines such as being able to show a document snippet within the results of a query, show the "in-cache" version of a web page, or improved ranking functions - need a local version of the document collection. Hence, efficiently storing a document collection is very important for said systems. To this end, most systems divide the collection into groups of documents, which can be compressed and accessed more efficiently. The present work introduces and implements a new method for grouping documents, which is based on the use of the system query logs. Experimental results show that this method allows for a better compression of the document collection, as well as a faster access to individual documents at query time.
Several functionalities that are nowadays common in search engines such as being able to show a document snippet within the results of a query, show the "in-cache" version of a web page, or improved ranking functions - need a local version of the document collection. Hence, efficiently storing a document collection is very important for said systems. To this end, most systems divide the collection into groups of documents, which can be compressed and accessed more efficiently. The present work introduces and implements a new method for grouping documents, which is based on the use of the system query logs. Experimental results show that this method allows for a better compression of the document collection, as well as a faster access to individual documents at query time.
Description
Digitalizado de su versión en papel
Keywords
DOCUMENTACION ALGORITMOS, ORGANIZACION DE ARCHIVOS (CIENCIA DE LA COMPUTACIÓN), SISTEMAS DE ALMACENAMIENTO Y RECUPERACION