EL REPOSITORIO SE ENCUENTRA EN MARCHA BLANCA

 

Thesis
METODOLOGÍA DE AGRUPAMIENTO DE DOCUMENTOS EN BASE A LOGS DE CONSULTAS PARA BASES DE DATOS TEXTUALES

Loading...
Thumbnail Image

Date

2014

Journal Title

Journal ISSN

Volume Title

Program

Campus

Universidad Técnica Federico Santa María UTFSM. Campus San Joaquín

Abstract

Diversas funcionalidades comunes en los motores de búsqueda actuales tales como mostrar snippets en los resultados a una consulta, mostrar la versión "en cache" de una página dada, a mejorar las funciones de ranking de los resultados - necesitan del almacenamiento local de la coiección de documentos sobre la que se busca. Por Io tanto, el almacenamiento eficiente de colecciones de documentos textuales es de vital importancia para dichos sistemas. Para lograr este objetivo, imichos sistemas dividen Ia colección en grupos de documentos, los cuales pueden ser comprimidos y accedidos más eficientemente. El presente trabajo describe la implenientación de un nuevo método de agrupamiento de documentos, el cual se basa en el uso de los registros de consultas del sistema. Los resultados obtenidos indican que este método permite una mejor compresión de Ia colección de documentos, así como también un acceso más eficiente a los documentos individuales en tiempo de consulta.
Several functionalities that are nowadays common in search engines such as being able to show a document snippet within the results of a query, show the "in-cache" version of a web page, or improved ranking functions - need a local version of the document collection. Hence, efficiently storing a document collection is very important for said systems. To this end, most systems divide the collection into groups of documents, which can be compressed and accessed more efficiently. The present work introduces and implements a new method for grouping documents, which is based on the use of the system query logs. Experimental results show that this method allows for a better compression of the document collection, as well as a faster access to individual documents at query time.

Description

Digitalizado de su versión en papel

Keywords

DOCUMENTACION ALGORITMOS, ORGANIZACION DE ARCHIVOS (CIENCIA DE LA COMPUTACIÓN), SISTEMAS DE ALMACENAMIENTO Y RECUPERACION

Citation