EL REPOSITORIO SE ENCUENTRA EN MARCHA BLANCA

 

Thesis
Sistema de reconocimiento visual de productos aplicado al retail

dc.contributor.advisorEscobar Silva, María José (Profesora Guía)
dc.contributor.advisorZúñiga Barraza, Marcos David (Profesor Correferente)
dc.contributor.authorÁlvarez Valenzuela, Jorge Rodrigo
dc.contributor.departmentUniversidad Técnica Federico Santa María. Departamento de Electrónicaes_CL
dc.coverage.spatialCasa Central Valparaísoes_CL
dc.creatorÁlvarez Valenzuela, Jorge Rodrigo
dc.date.accessioned2024-10-29T22:30:51Z
dc.date.available2024-10-29T22:30:51Z
dc.date.issued2023-07
dc.description.abstractEl procesamiento digital de imágenes ha experimentado un avance significativo gracias al desarrollo de técnicas de Deep Learning e inteligencia artificial, lo cual ha revolucionado la forma en que se analizan, interpretan y manipulan las imágenes. Como resultado, ha ganado mayor relevancia en la transmisión de información, comunicación entre las personas y en los procesos industriales. Este trabajo de título se enfoca en el potencial del Deep Learning para la clasificación multiclase, específicamente para la clasificación de productos. El objetivo es utilizar imágenes de productos y asociarlas con sus códigos únicos (SKU) proporcionados por una empresa, esto para automatizar la disponibilidad de sus productos en góndolas, ya que el sistema actual requiere escanear uno a uno los productos, lo cual es un proceso lento y costoso. Para solucionar esto, se han seleccionado técnicas de reconocimiento de caracteres (OCR) y de relación de imágenes con texto (CLIP). Estas técnicas se sumarán a un sistema ya desarrollado que detecta bounding boxes de los productos a partir de fotografías de las góndolas. Al utilizar OCR como filtro y CLIP (usando el modelo RN50) para determinar el SKU del producto, se logró un promedio de un 89.34% de productos reconocidos correctamente en tres categorías dadas, con un tiempo promedio inferior a los 0.12 segundos por producto. A pesar de los buenos resultados obtenidos, existen posibles mejoras que podrían considerarse en el futuro. Algunas recomendaciones incluyen mejorar el emparejamiento de palabras mediante técnicas avanzadas de coincidencia de texto basadas en embeddings y explorar la posibilidad de utilizar descriptores visuales para automatizar la creación de descripciones de productos en el modelo CLIP. Estas mejoras permitirían obtener un sistema más completo y robusto.es_CL
dc.description.degreeINGENIERO CIVIL ELECTRÓNICOes_CL
dc.description.programDEPARTAMENTO DE ELECTRÓNICA. INGENIERÍA CIVIL ELECTRÓNICAes_CL
dc.identifier.barcode200714253UTFSMes_CL
dc.identifier.urihttps://repositorio.usm.cl/handle/123456789/54746
dc.rights.accessRightsBes_CL
dc.subjectRECONOCIMIENTO VISUALes_CL
dc.subjectIAes_CL
dc.subjectOCRes_CL
dc.subjectRETAILes_CL
dc.titleSistema de reconocimiento visual de productos aplicado al retailes_CL
dspace.entity.typeTesis

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
m20071425_3.pdf
Size:
12.56 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Plain Text
Description: