EL REPOSITORIO SE ENCUENTRA EN MARCHA BLANCA

 

Thesis
EXTRACCIÓN Y CLASIFICACIÓN ROBUSTA DE INFORMACIÓN DESDE DOCUMENTOS CON ESTRUCTURA HETEROGÉNEA

dc.contributor.advisorCREIXELL FUENTES, WERNER UWE
dc.contributor.authorANTONCICH LOYOLA, LUCAS
dc.contributor.departmentUniversidad Técnica Federico Santa María. Departamento de Electrónicaes_CL
dc.contributor.otherABDELHAMID, MOHAMED
dc.coverage.spatialCasa Central Valparaísoes_CL
dc.date.accessioned2024-10-31T05:15:57Z
dc.date.available2024-10-31T05:15:57Z
dc.date.issued2021-12
dc.description.abstractRecientemente, el desarrollo de la Inteligencia Artificial ha avanzado de manera explosiva, impactando varios campos de la ingeniería muy rápidamente. En este trabajo de título se explora el desarrollo de soluciones basadas en Inteligencia Artificial para la extracción de información desde documentos con estructuras heterogénea. El objetivo final del trabajo es diseñar e implementar un flujo computacional capaz de extraer los datos relevantes de documentos de liquidaciones de sueldo provistos por los clientes de un banco Chileno. De las soluciones exploradas, se escoge la solución basada en la arquitectura transformer llamada LayoutXLM, que consiste en una red neuronal que utiliza el encoder del transformador, modificado para incluir información visual del documento en su representación interna. La red fue pre-entrenada en un conjunto de 11 millones de documentos por la compañía Microsoft, la cual liberó el modelo para uso público en internet. En este trabajo, modelo es entrenado en un conjunto de liquidaciones etiquetado utilizando un software desarrollado específicamente con este propósito, el cual permite la retroalimentación del mismo modelo para generar un etiquetado asistido por IA. Finalmente el modelo es incorporado dentro de un flujo de procesamiento para generar extracción de información de extremo a extremo, de manera de facilitar una posterior implementación dentro de una linea de operación del banco.es_CL
dc.description.degreeINGENIERO CIVIL ELECTRÓNICOes_CL
dc.description.programDEPARTAMENTO DE ELECTRÓNICA. INGENIERÍA CIVIL ELECTRÓNICAes_CL
dc.identifier.barcode19405511UTFSMes_CL
dc.identifier.urihttps://repositorio.usm.cl/handle/123456789/63262
dc.subjectCLASIFICACIÓN ROBUSTAes_CL
dc.subjectDOCUMENTOS CON ESTRUCTURA HETEROGÉNEAes_CL
dc.titleEXTRACCIÓN Y CLASIFICACIÓN ROBUSTA DE INFORMACIÓN DESDE DOCUMENTOS CON ESTRUCTURA HETEROGÉNEAes_CL
dc.typeTesis de Pregrado
dspace.entity.typeTesis

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
m19740551-1.pdf
Size:
6.96 MB
Format:
Adobe Portable Document Format