EVALUACIÓN DEL USO DE LA METODOLOGÍA CART EN EL DIAGNÓSTICO DE FALLAS

RIFFO PEREIRA, RODRIGO ANTONIO (2018)

Catalogado desde la version PDF de la tesis.

Tesis Pregrado

En un contexto de mercados competitivos, surge la necesidad de usar de forma cada vez más eficiente los recursos, por lo tanto, el mantenimiento de las máquinas o equipos se debe hacer en el momento indicado. Es por esto por lo que en el presente documento se pretende evaluar el uso de los árboles de regresión y clasificación en el mantenimiento.El mantenimiento busca mantener en correcto estado los equipos el mayor tiempo posible, pero también se pueden agregar otros beneficios como reducir costos, aumentar la vida útil o evitar accidentes. Existen varios tipos de mantenimiento como el correctivo, preventivo, predictivo y el mantenimiento productivo total, que se usan en distintas situaciones. Otro elemento importante que las compañías consideran es la demostración de su calidad, a través de normas internacionales, para las cuales es importante tener un apropiado plan de mantenimiento.Con el contexto claro, se puede pasar a explicar la herramienta como tal, la cual fue planteada inicialmente en la publicación Classification and Regression Trees de Breiman, Freidman, Olshen y Stone en el año 1984. El árbol tiene una estructura de nodos, los cuales se particionan y generan 2 nodos hijos cada uno cada vez más homogéneos. Cada nodo en el árbol de regresión corresponde a una pregunta o un criterio de división de los datos, por lo tanto, si desea clasificar o determinar el comportamiento de una variable, se debe avanzar por el árbol desde el nodo raíz (primer nodo) hasta que se llegue a la clasificación final.La metodología como tal consta de 3 pasos que son, la construcción del árbol, la selección del tamaño correcto y la clasificación de datos nuevos. Un dato que tomar en cuenta es que las variables pueden ser categóricas o continuas, por lo cual la herramienta puede trabajar con distintos tipos de datos.Para trabajar con los árboles de regresión se puede utilizar una programación de este en el programa Python que se encuentra en los tutoriales de Machine Learning de Josh Gordon publicados el 13 de septiembre del año 2017. Con esta información se puede pasar al desarrollo de esta memoria, donde se busca determinar algunos usos de la metodología en el área de mantenimiento con ayuda de la información recopilada, para posteriormente indicar como podría ser usada la herramienta en esas aplicaciones, mostrando las estructuras necesarias para esto. Finalmente se utilizará una base de datos para probar lo anteriormente planteado.Con la información recopilada y los análisis respectivos se llegó a que existen 3 usos posibles para la herramienta que son la detección de fallas, determinar la causa de las fallas y la predicción de fallas. Con la base de datos se pretende trabajar con los usos sobre la determinación de la causa de la falla y la predicción de la falla, pero se deja de lado la detección de la falla, ya que se considera que la base de datos no aplica para este caso.Para poder trabajar, se crearon 2 formas de estructurar la base de datos, siendo la primera una estructura que busca determinar el tiempo que permanecerá sin fallas una máquina y la segunda busca determinar si una máquina va a fallar en un tiempo determinado, pero complementario a esto se harán análisis de cada una de las variables que tiene la base de datos, para ver cómo se relacionan con lo que se busca obtener. De lo anterior, se puede destacar las formas de estructurar la base de datos para utilizar la herramienta, pero es importante saber si las estructuras planteadas rinden frutos. Un elemento importante que se concluyó es el saber que para el caso particular de la estructura que busca saber si una máquina fallará en un tiempo determinado, los resultados no se deben juzgar por cualquier indicador, ya que se está trabajando con bases de datos desbalanceadas.De lo ejecutado, también se destaca la importancia de hacer los análisis de las distintas variables clasificadoras de forma independiente, ya que no necesariamente más variables implica una mejor predicción, por lo que es importante discriminar correctamente que usar y que no.Respecto al trabajo de las impurezas y su relación con los nodos, se puede decir que permitir más impureza es una opción para reducir los nodos finales, pero hay que ser cuidadosos con la reducción de los porcentajes de predicción, ya que es posible que al permitir más impureza dos nodos se mezclen y se pierda un tipo de respuesta. Esto lleva también a la necesidad de evaluar los porcentajes de predicción de cada una de las respuestas y en el caso de variables continuas se podrían agrupar las respuestas y evaluar el comportamiento de los grupos.Respecto a los resultados de las estructuras, en el caso de si va a fallar una máquina en un periodo de tiempo fijo, se percibieron buenos porcentajes de predicción, superiores al 90%, pero solo cuando era un desfase de 1 día, ya que si se aumentaba el desfase los resultados empeoraban significativamente. De igual manera en el caso del tiempo sin fallas, los resultados no fueron buenos, pero no se puede culpar a la herramienta, sino más bien esto puede motivar a buscar otras formas de tomar y usar los datos.Finalmente se puede decir que la herramienta para analizar las causas de una falla es bastante útil, ya que se presenta de una forma gráfica y fácil de entender, lo que permite seguir el camino de preguntas y respuestas y analizar las causas para poder contemplar posibles soluciones.