Thesis OptiDataLake: plataforma para la gestión de market data en tiempo real
| dc.contributor.correferente | Olivares Roncagliolo, Patricio Andrés | |
| dc.contributor.department | Departamento de Electrónica | |
| dc.contributor.guia | Torres Rudloff, Nicolás | |
| dc.coverage.spatial | Campus Santiago San Joaquín | |
| dc.creator | Bravo Ponce, Ariel | |
| dc.date.accessioned | 2025-10-14T14:26:34Z | |
| dc.date.available | 2025-10-14T14:26:34Z | |
| dc.date.issued | 2025-10 | |
| dc.description.abstract | Este trabajo presenta el diseño e implementación de una plataforma para la gestión y análisis de market data en tiempo real, integrada con Apache Kafka, Apache Spark y MongoDB bajo un enfoque de Data Lake (colecciones Raw, Structured y Analytics). El objetivo es habilitar ingestión continua, procesamiento confiable y recuperación eficiente con baja latencia para analítica operativa y estudios históricos. La solución captura datos de alta frecuencia desde la API de Binance, los valida y enriquece, y los persiste para su consulta. La arquitectura modular y de bajo acoplamiento incorpora prácticas de operación confiable (validadores de esquema, índices por símbolo/tiempo, manejo de idempotencia y control de duplicados), favoreciendo robustez y escalabilidad. Se desarrolló una interfaz de consulta para pruebas que permite filtrar por símbolo y rango de precios y que reporta tamaño recuperado, tiempo de respuesta y ancho de banda efectivo (MB/s). Las pruebas de rendimiento muestran recuperaciones consistentemente por sobre 20~MB/s, incluso con grandes volúmenes de datos, mientras que la tasa de ingestión por minuto se mantiene estable en Raw_data y Structured. Los resultados confirman continuidad del flujo, ausencia de cuellos de botella en escritura y preparación de datos para dashboards, KPIs y análisis históricos. En conjunto, la plataforma cumple los objetivos propuestos y constituye una base escalable para futuras extensiones y despliegues productivos, habilitando analítica en tiempo real sobre datos de mercado de alta frecuencia. | es |
| dc.description.program | Ingeniería Civil Telemática | |
| dc.format.extent | 77 páginas | |
| dc.identifier.barcode | 3560900288913 | |
| dc.identifier.uri | https://repositorio.usm.cl/handle/123456789/76794 | |
| dc.language.iso | es | |
| dc.publisher | Universidad Técnica Federico Santa María | |
| dc.rights | Attribution-NoDerivatives 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nd/4.0/ | |
| dc.subject | Analítica en Tiempo Real | |
| dc.subject | Big Data | |
| dc.subject | Streaming | |
| dc.subject | Apache Kafka | |
| dc.subject | Apache Spark | |
| dc.subject | MongoDB | |
| dc.subject.ods | 8 Trabajo decente y crecimiento económico | |
| dc.subject.ods | 9 Industria, innovación e infraestructura | |
| dc.subject.ods | 12 Producción y consumo responsables | |
| dc.subject.ods | 17 Alianzas para lograr los objetivos | |
| dc.title | OptiDataLake: plataforma para la gestión de market data en tiempo real | |
| dspace.entity.type | Tesis |
