Thesis AN ENSEMBLE OF ONE CLASS DOMAIN DESCRIPTORS FOR IMBALANCED CLASSIFICATION
Loading...
Date
2012
Authors
Journal Title
Journal ISSN
Volume Title
Program
Campus
Casa Central, Valparaíso
Abstract
En los últimos aos los algoritmos de reconocimiento de patrones han hecho posible un creciente número de aplicaciones en el ámbito de la ingenier?á biomédica, tales como el análisis de mamograf?ás para la detección de cáncer, el análisis de seales electrocardiográficas para el diagnóstico de enfermedades cardiovasculares, el análisis de imágenes de resonancia magnética para la segmentación de tumores cerebrales, entre muchas otras. Dada la infrecuencia con la que algunas clases de patolog?ás se manifiestan en la vida real, los casos observables están altamente subrepresentados, muchas veces contando por menos del 1% del total de los datos disponibles. Bajo estas condiciones, un examen automático que incondicionalmente emita un diagnóstico negativo estará en lo correcto el 99% de las veces, pero será incapaz de detectar aquellos casos realmente importantes donde la enfermedad está presente. Este simple ejemplo revela que cuando se describen casos infrecuentes el error emp??rico del examen es una medida de desempeo inadecuada, y en consecuencia, los modelos de aprendizaje basados en su minimización también lo son. Esta situación es comúnmente conocida como el problema de desequilibrio de clases, suele presentarse en aplicaciones donde se describe un fenómeno altamente infrecuente pero de vital importancia, y deteriora significativamente el desempeo de los algoritmos de reconocimiento de patrones basados en la minimización del error. Por este motivo surge la necesidad de desarrollar algoritmos capaces de compensar este deterioro, ya sea aplicando algún esquema de remuestreo de datos, o haciendo alguna modificación a algoritmos tradicionales. Esta disciplina en la literatura recibe el nombre de class imbalanced learning o aprendizaje de clases desequilibradas. En esta tesis se propone un nuevo algoritmo para resolver problemas de clasificación desequilibrada, especialmente diseado para mejorar la exactitud de la clase minoritaria, mejorando as?? el desempeo total del clasificador. Simulaciones computacionales muestran que la estrategia propuesta, a la cual se le ha denominado Dual Support Vector Domain Description, tiene mejor desempeo que métodos relacionados de la literatura en instancias del problema especialmente interesantes.
Description
Catalogado desde la versión PDF de la tesis