Thesis METODOLOGÍA PARA LA TOMA DE DECISIONES MEDIANTE LA MINERÍA DE DATOS
Loading...
Date
2020-12
Authors
Journal Title
Journal ISSN
Volume Title
Program
DEPARTAMENTO DE INDUSTRIAS. INGENIERÍA CIVIL INDUSTRIAL
Campus
Campus Vitacura, Santiago
Abstract
Considerando la capacidad de las organizaciones para generar datos de forma constante, y la necesidad de que estos sean analizados independiente de la estructura en que se encuentren originalmente, esta investigación tiene como principal propósito establecer una metodología que permita preparar la información para generar modelos predictivos de minería de datos que aporten en la toma de decisiones.
Para la aplicación de la metodología propuesta se utilizan datos pertenecientes a la empresa IBM, los cuales entregan información detallada sobre clientes suscritos a distintos servicios de telecomunicaciones. En este problema en particular se busca principalmente conocer de que manera las distintas variables pertenecientes a los datos en análisis afectan en la decisión de los clientes de dejar o no la compañía, lo cual es logrado a partir de la construcción de un modelo de minería de datos.
Tomando en cuenta las características del problema en particular y de la naturaleza de las variables que se tienen a disposición, se escogen cinco algoritmos de clasificación de datos para llevar a cabo el entrenamiento de los modelos predictivos dividiendo los datos de manera aleatoria; utilizándose un 30% del total de los datos disponibles para la construcción de los modelos, y destinando el 70% de los datos restantes para evaluar el desempeño de los modelos generados.
Dado el carácter desbalanceado de los datos utilizados para la aplicación de la metodología propuesta y el tipo de algoritmo escogido en el entrenamiento del modelo predictivo, se evalúa el desempeño del modelo escogido para conocer su capacidad de predicción. A partir de dicha evaluación se obtiene como resultado una exactitud del 80,41 %, una precisión del 83,60 %, y una sensibilidad del 90,98 %.
Por último, se recalca la relevancia de reducir los errores tipo I y tipo II cuando los modelos son entrenados mediante algoritmos de clasificación de datos, tal que los conocimientos que sean obtenidos a partir de dichos modelos sean capaces de generar valor al prestar apoyo en la toma de decisiones. Además, se destaca que la capacidad predictiva de los modelos depende directamente de la calidad de los datos usados, siendo estos su principal fuente de aprendizaje sobre los problemas que se deseen abordar.
Description
Keywords
TOMA DE DECISIONES, MINERIA DE DATOS, MODELO PREDICTIVO