Thesis
Clasificación de textos multi-etiquetados con representación dependiente de la etiqueta

dc.contributor.departmentDepartamento de Informática
dc.contributor.guiaAllende Olivares, Héctor Manuel
dc.coverage.spatialCampus Casa Central Valparaíso
dc.creatorAlfaro Arancibia, Rodrigo Marcelo
dc.date.accessioned2024-09-13T17:41:13Z
dc.date.available2024-09-13T17:41:13Z
dc.date.issued2021-03
dc.description.abstractLa asignación de una o más categorías, predefinidas a los textos en lenguaje natural, basados en su contenido, es un componente importante y necesario en muchas tareas al interior de las organizaciones. Esta tarea se realiza comúnmente a través de la clasificación automática de textos, esto es, clasificando documentos dentro de un conjunto de categorías predefinidas por medio de un modelo y métodos computacionales. La representación de los textos para propósitos de clasificación automática ha sido tradicionalmente llevada a cabo usando un modelo de espacio vectorial debido a su simplicidad y buen rendimiento. Por otro lado, la clasificación automática de textos por multi-etiquetados ha sido típicamente abordada utilizando métodos de clasificación de etiqueta simple, lo que implica transformar el problema estudiado para aplicar técnicas binarias o adaptar algoritmos binarios para que funcionen con múltiples etiquetas. En esta investigación el objetivo es evaluar una función para la ponderación de las palabras de los textos para modificar la representación de los textos en clasificación multi-etiqueta, usando una combinación de dos enfoques: transformación de problema y adaptación de modelo. Esta función de ponderación y la combinación de enfoques en la clasificación automática fue puesto a prueba con diez diferentes conjuntos de datos textuales utilizados en la literatura especializada y comparado con técnicas alternativas por medio de tres medidas de evaluación. Los resultados presentan mejoras superiores al 10% en el rendimiento de los clasificadores, atribuidas a nuestra propuesta, en todos los casos analizados.es_CL
dc.description.degreeDoctorado en Ingeniería Informática
dc.identifier.barcode14414564KUTFSM
dc.identifier.urihttps://repositorio.usm.cl/handle/123456789/254
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessRightsAes_CL
dc.subjectMULTI-ETIQUETA
dc.subjectCLASIFICACION DE TEXTOS
dc.subjectREPRESENTACION DE TEXTOS
dc.subjectTRANSFORMACION DEL PROBLEMA
dc.subjectPONDERACION DE TERMINOS
dc.titleClasificación de textos multi-etiquetados con representación dependiente de la etiqueta
dspace.entity.typeTesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
m14414564-k.pdf
Size:
5.6 MB
Format:
Adobe Portable Document Format