ESTUDIO E IMPLEMENTACIÓN DE UN MÉTODO DE COMPRESIÓN DE DOCUMENTOS PARA BÚSQUEDAS EFICIENTES EN MEMORIA DE RECURSOS DEL OBSERVATORIO VIRTUAL
Abstract
En este trabajo se presenta una solución que permite la compresión de documentos provenientes de recursos del Observatorio Virtual, que además posibilita la consulta eficiente de los mismos en memoria. Lo anterior se logra mediante el uso de estructuras sucintas que otorgan trade offs entre espacio comprimido y tiempo de consulta. El desempeño de múltiples estructuras sucintas logran resultados interesantes en tiempo y en espacio en el contexto del Observatorio Virtual, siendo estos resultados en muchos casos superiores en tiempo y espacio a lo obtenido con un popular motor de bases de datos relacional sobre los mismos datos. Además, se muestra una aplicación concreta, implementando un prototipo de sistema de búsqueda basado en la solución planteada en este trabajo. Estos resultados muestran que es posible lograr espacios y tiempos competitivos aplicando estructuras sucintas al problema de indexación y búsqueda de recursos del Observatorio Virtual, posibilitando el desarrollo de este tipo de sistemas que irán en directo beneficio de la comunidad cientifíca y astronómica nacional. In this work, a solution is presented that allows the compression of documents obtained from resources of the Virtual Observatory, while enabling efficient querying of them in memory. This is achieved by using succint data structures that offer trade offs between the space required to store the data and time required to query it. We show that the performance of multiple succinct structures that achieve interesting results in time and space in the context of the Virtual Observatory, where these results are in many cases superior in time and space to what was obtained with a popular relational data base engine over the same data. In addition, a real-world application is shown, implementing a prototype search system based on the solution proposed in this work. These results show that it is possible to achieve competitive space and time results by applying succinct structures to the problem of indexing and searching resources of the Virtual Observatory, enabling the development of this type of systems that will directly benefit the national astronomical and scientific community.