Thesis
Selección de características: una propuesta de NSGA-II con nuevas estrategias de inicialización

dc.contributor.correferenteRiff Rojas, María Cristina
dc.contributor.departmentDepartamento de Informática
dc.contributor.guiaMontero Ureta, Elizabeth Del Carmen
dc.coverage.spatialCampus Casa Central Valparaíso
dc.creatorPaz Tralma, Nicolás Patricio
dc.date.accessioned2025-08-04T15:39:53Z
dc.date.available2025-08-04T15:39:53Z
dc.date.issued2025-07
dc.description.abstractEsta memoria aborda el problema de selección de características como una tarea de optimización multi-objetivo, motivada por el aumento en el volumen de características de los conjuntos de datos utilizados en aplicaciones modernas de aprendizaje automático. El objetivo es identificar un subconjunto reducido de características que mejore la precisión en la clasificación. Se propone el uso de la prueba estadística chi-cuadrado para inicializar el algoritmo evolutivo NSGA-II, aprovechando su naturaleza basada en población para encontrar un conjunto de soluciones no dominadas y de alta calidad. Se proponen y evalúan dos estrategias de inicialización. Se probaron seis conjuntos de datos de distintas áreas, con un rango de entre 16 y 12,600 características. Se observaron mejoras en la precisión y la generalización, especialmente al inicializar con un 10% de las características. Además, las estrategias propuestas no aumentaron significativamente el tiempo de cómputo y obtuvieron resultados competitivos frente al estado del arte en términos de hipervolumen.es
dc.description.abstract This thesis addresses the feature selection problem as a multi-objective optimization task, motivated by the increasing number of features in datasets used in modern machine learning applications. The goal is to identify a reduced subset of features that improves classification accuracy. We propose using the chi-square statistical test to initialize the evolutionary algorithm NSGA-II, taking advantage of its population-based nature to find a set of non-dominated, high-quality solutions. Two initialization strategies are proposed and evaluated. Six datasets from different domains were tested, ranging from 16 to 12,600 features. Improvements in accuracy and generalization were observed, especially when initializing with 10% of the features. Moreover, the proposed strategies did not significantly increase computational time and achieved competitive results compared to the state of art in terms of hypervolume.en
dc.description.programIngeniería Civil Informática
dc.format.extent64 páginas
dc.identifier.barcode3560900288144
dc.identifier.urihttps://repositorio.usm.cl/handle/123456789/75870
dc.language.isoes
dc.publisherUniversidad Técnica Federico Santa María
dc.rightsAttribution-NonCommercial 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/
dc.subjectSelección de características
dc.subjectNSGA-II
dc.subjectChi-cuadrado
dc.subjectOptimización multi-objetivo
dc.subjectAlgoritmos evolutivos
dc.subjectFeature selection
dc.subjectChi-square
dc.subjectMulti-objetive optimization
dc.subjectEvolutionary algorithms
dc.subject.ods9 Industria, innovación e infraestructura
dc.subject.ods4 Educación de calidad
dc.subject.ods17 Alianzas para lograr los objetivos
dc.titleSelección de características: una propuesta de NSGA-II con nuevas estrategias de inicialización
dspace.entity.typeTesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
3560900288144.pdf
Size:
822.08 KB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: