BÚSQUEDA DE HIPERPARÁMETROS DE REDES NEURONALES CONVOLUCIONALES UTILIZANDO METAHEURÍSTICAS
Abstract
En los últimos años, en el campo de visión computarizada, las redes neuronales convolucionales (en adelante abreviadas CNNs por su nombre en inglés Convolutional Neural
Networks) han sido utilizadas ampliamente para aplicaciones a problemas reales. Su desempeño de vanguardia, sin embargo, depende fuertemente de la arquitectura de la red dado un
problema. En la mayoría de los casos, estas son optimizadas manualmente por los investigadores, proceso que tarda demasiado tiempo y es difícil de realizar sin tener conocimientos
previos de CNNs. En esta memoria, proponemos un algoritmo genético particular para la
optimización de las arquitecturas de CNNs para el problema de clasificación de imágenes.
Este algoritmo extiende y refina la investigación actual en el campo, permitiendo exploración de la profundidad, cruzamiento secuencial, definiendo de manera más detallada el
problema de optimización subyacente y sus variables, y controlando de maneras especificas
la convergencia del algoritmo. La técnica se valida en tres conjuntos de datos de clasificación de imágenes ampliamente usado en el campo, y se compara con las propuestas
del estado del arte de los pares. En todos menos un caso obtuvimos mejores resultados, o
resultados equivalentes en un número significativamente menor de generaciones. El único
caso donde nuestra propuesta fracasó frente a los pares, lo atribuimos a la inclusión de
técnicas convolucionales recientes y no al algoritmo de optimización propiamente tal.