EL REPOSITORIO SE ENCUENTRA EN MARCHA BLANCA

 

Thesis
Una arquitectura basada en atención para clasificación jerárquica con redes neuronales convolucionales

dc.contributor.advisorÑanculef, Ricardo (Profesor Guía)
dc.contributor.advisorValle, Carlos (Profesor Guía)
dc.contributor.advisorAstudillo Rojas, Hernán (Profesor Correferente)
dc.contributor.authorPizarro Quezada, Iván Andrés
dc.contributor.departmentUniversidad Técnica Federico Santa María. Departamento de Informáticaes_CL
dc.coverage.spatialCasa Central Valparaísoes_CL
dc.date.accessioned2024-09-13T17:38:27Z
dc.date.available2024-09-13T17:38:27Z
dc.date.issued2023-07-22
dc.description.abstractEste estudio, trata con problemas de clasificación donde las etiquetas forman una jerarquía, de conceptos más generales a categorías más específicas. Para abordar este problema, se ha vuelto popular el uso de Redes Neuronales Convolucionales (CNN) que utilizan ramas especializadas por cada nivel de la jerarquía. Tanto para tareas del área de Visión Computacional como en otras. Sin embargo, la consistencia de la clasificación sigue siendo un problema: las clases predichas en diferentes niveles a menudo no respetan las restricciones de clase-subclase codificadas por la jerarquía. Han surgido en la literatura distintos patrones de conectividad entre ramas para tratar con esta limitación. Nosotros proponemos un enfoque más simple y flexible: dejar que la red neuronal decida como se deben conectar dichas ramas. Lo anterior se logró formulando un mecanismo atencional que determina dinámicamente como las ramas se influencian entre ellas durante el entrenamiento e inferencia. La hipótesis asociada, es que la introducción de un mecanismo atencional para combinar representaciones intermedias extraídas de distintas profundidades de una red convolucional, permitirá mejorar el desempeño del model en problemas de de clasificación jerárquica con respecto a modelos presentes en el estado del arte. Los experimentos realizados con datasets ampliamante utilizados para clasificación de imágenes, demostraron que el modelo propuesto puede superar el estado del arte en términos de métricas de rendimiento jerárquicas y consistencia. Además, pese a que lo anterior genera en algunos casos un rendimiento ligeramente inferior en el nivel más profundo de la jerarquía, el modelo predice con mucha más precisión la relación entre un concepto y sus ancestros. Este resultado sugiere que el modelo no solo aprende las pertencencias a clases locales, sino también las dependencias jerárquicas entre conceptos, lo que confirma la hipótesis estudiada.es_CL
dc.description.degreeMAGISTER EN CIENCIAS DE LA INGENIERIA INFORMATICAes_CL
dc.description.programDEPARTAMENTO DE INFORMÁTICA. MAGÍSTER EN CIENCIAS DE LA INGENIERÍA INFORMÁTICAes_CL
dc.identifier.barcode173543425UTFSMes_CL
dc.identifier.urihttps://repositorio.usm.cl/handle/123456789/98
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessRightsAes_CL
dc.subjectAPRENDIZAJE PROFUNDOes_CL
dc.subjectCLASIFICACION JERARQUICAes_CL
dc.subjectREDES NEURONALES CONVOLUCIONALESes_CL
dc.subjectMECANISMOS DE ATENCIONes_CL
dc.titleUna arquitectura basada en atención para clasificación jerárquica con redes neuronales convolucionaleses_CL
dspace.entity.typeTesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
m17354342-5.pdf
Size:
12.73 MB
Format:
Adobe Portable Document Format