Thesis Estrategias de partición en ASAP para Strings con Runs y alfabetos grandes
dc.contributor.advisor | Arroyuelo Billiardi, Diego Gastín (Profesor Guía) | |
dc.contributor.advisor | Montero, Elizabeth (Profesora Guía) | |
dc.contributor.department | Universidad Técnica Federico Santa María. Departamento de Informática | |
dc.coverage.spatial | Campus Casa Central Valparaíso | |
dc.creator | Rojas Morales, Carlos Eugenio | |
dc.date.accessioned | 2024-09-25T13:10:53Z | |
dc.date.available | 2024-09-25T13:10:53Z | |
dc.date.issued | 2024-06 | |
dc.description.abstract | En la actualidad, la compresión de datos y su recuperación son aspectos vitales, especialmente en el contexto de textos largos y repetitivos, que es el enfoque principal de este documento. Se propone la implementación y evaluación de distintas estrategias de particionamiento aplicadas a una variedad de combinaciones de estructuras de datos comprimidas sobre la estructura ASAP. Entre estas estrategias, destaca el rendimiento de la estrategia A4, la cual utiliza "dense partitioning" junto con el uso de las cabeceras de cada run del texto para la estructura que maneja el mapping 𝑚(α). Esta combinación logró resultados superiores al baseline actual, mejorando tanto el manejo del espacio como la velocidad de consulta para las estructuras comprimidas utilizadas. En particular, la estructura ASAP RLMN(INT) RLE demostró el mejor rendimiento. | |
dc.description.abstract | Currently, data compression and retrieval are vital aspects, especially in the context of long and repetitive texts, which is the main focus of this document. We propose the implementation and evaluation of different partitioning strategies applied to a variety of combinations of compressed data structures based on the ASAP structure. Among these strategies, the performance of the A4 strategy stands out, which uses "dense partitioning" along with the use of headers for each run of the text for the structure that handles the mapping 𝑚(𝛼). This combination achieved results superior to the current baseline, improving both space management and query speed for the compressed structures used. In particular, the ASAP RLMN(INT) RLE structure demonstrated the best performance | |
dc.description.degree | INGENIERO CIVIL INFORMÁTICO | |
dc.description.program | Ingeniería Civil Informática | |
dc.identifier.barcode | 3560900285547 | |
dc.identifier.uri | https://repositorio.usm.cl/handle/123456789/5422 | |
dc.identifier.uri | https://doi.org/10.71700/dspace-memorias/928 | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.subject | Alphabet Partitioning | |
dc.subject | Estrategia de partición | |
dc.subject | Wavelet Tree | |
dc.subject | ASAP | |
dc.subject | Compresión de datos | |
dc.title | Estrategias de partición en ASAP para Strings con Runs y alfabetos grandes | |
dspace.entity.type | Tesis |
Files
Original bundle
1 - 1 of 1