MÉTODOS DE ANÁLISIS PARA BIG DATA Y SU PARTICIPACIÓN EN LA INDUSTRIA: ESTUDIO APLICADO A LA PREVENCIÓN DE FALLOS EN EMPRESAS FERROVIARIAS

MARCHANT MORALES, TOMÁS (2018)

Catalogado desde la version PDF de la tesis.

Tesis Pregrado

Big Data se refiere una base de datos muy grande para ser procesada por los métodos comunes delectura de datos tal que se necesita un sistema de computación distribuida, o bien se define simplementecomo una base de datos de gran volumen, velocidad y variedad. Existen varias herramientas para extraerinformación de estas. Como las cartas de control, Visualización de datos, Hadoop y la minería de datos. Deesta última se usan herramientas conocidas como algoritmos de aprendizajes, la cual se aplicarán a una basede datos que se emulará como Big Data para realizar un modelo predictivo que permita minimizar las fallasde asignación de carga en una empresa ferroviaria. Esta base de datos proviene de lecturas reales provistopor el Instituto de Investigación Operativa y Ciencias de la Gestión, llegando a sumar más de 10 millones demuestras.Dentro de este estudio también se destaca la influencia que ha tenido Big Data dentro de el área de laingeniería industrial, perfeccionando el área de Supply Chain Management, Finanzas y empresas de retail.Tal ha sido la consideración de las empresas por esta nueva tecnología que las inversiones sobrepasan los 30billones de dólares en Estados Unidos sólo para el año 2017. Esto corresponde a un incremento del 300%con respecto al año 2014. Por ello es menester y objetivo de este estudio concientizar del recurso inexplotadode esta área en Chile.Las conclusiones obtenidas del caso aplicado muestran que se obtiene un modelo categorizado comobueno y/o aceptable para la predicción de datos. Teniendo en cuenta que la distribución de los datos esaltamente desequilibrada estos resultados se deben interpretar según un criterio evaluador que se rija por loscostos asociados a fallas, y no simplemente a una categorización generalizada de métricas.

Big Data refers to a very large database to be processed by common methods of reading data suchthat a distributed computing system is needed, or it is simply defined as a database of great volume, speedand variety. There are several tools to extract information from these databases. Such as control charts, datavisualization, Hadoop and data mining. The latter uses tools known as learning algorithms, which will beapplied to a database that will be emulated as Big Data to make a predictive model that minimizes loadallocation failures in a railway company. This database comes from real readings provided by the Institute ofOperations Research and Management Sciences, reaching more than 10 million samplesThis study also highlights the influence that Big Data has had within the area of industrial engineering,perfecting the area of Supply Chain Management, Finance and retail companies. Such has been theconsideration of the companies for this new technology that the investments surpass the 30 trillions of dollarsin the United States only for the year 2017. This corresponds to an increase of 300% with respect to the year2014. Therefore it is necessary and objective of this study to raise awareness of the unexploited resource ofthis area in Chile.The conclusions obtained from the applied case show that a model categorized as good and / oracceptable for the prediction of data is obtained. Bearing in mind that the distribution of data is highlyunbalanced, these results should be interpreted according to an evaluating criterion that is governed by thecosts associated with failures, and not simply a generalized categorization of metrics.