COMPARACIÓN DE RENDIMIENTO ENTRE UNA BASE DE DATOS RELACIONAL Y UNA COLUMNAR, PARA EL DISEÑO DE UN DATA WAREHOUSE PARA CUMPLO CHILE S.A.
Abstract
A lo largo del tiempo, arquitecturas enfocadas en el análisis de los datos de las organizaciones, como los data warehouses, han sido ampliamente diseñadas en base a modelos estrellas, copos de nieve u otras variantes. Sin embargo, la llegada de las bases de datos NoSQL proponen una mejora de rendimiento sustancial en cuanto a los tiempos de ejecución de las consultas sobre data warehouses. En este trabajo se presenta un estudio comparativo de los tiempos de ejecución de consultas analíticas realizadas sobre una base de datos columnar versus una relacional, con el objetivo de saber qué tipo de base de datos se comporta de mejor forma de acuerdo con los requerimientos de Cumplo Chile S.A. en el diseño de un data warehouse. Para la implementación de las alternativas evaluadas se usó MySQL como base de datos relacional y Cassandra como alternativa columnar, además de herramientas de visualización como Tableau, Pentaho Data Integration para procesos ETL y Hyper como base de datos en memoria primaria.