Doctorado en Ingeniería Informática

Permanent URI for this collection

http://167.71.110.65:4000/handle/11673/55853

Browse

Now showing 1 - 5 of 7

Clasificación de textos multi-etiquetados con representación dependiente de la etiqueta
(2021-03)
Alfaro Arancibia, Rodrigo Marcelo
;
Allende Olivares, Héctor (Profesor Guía)
;
Universidad Técnica Federico Santa María. Departamento de Informática
La asignación de una o más categorías, predefinidas a los textos en lenguaje natural, basados en su contenido, es un componente importante y necesario en muchas tareas al interior de las organizaciones. Esta tarea se realiza comúnmente a través de la clasificación automática de textos, esto es, clasificando documentos dentro de un conjunto de categorías predefinidas por medio de un modelo y métodos computacionales. La representación de los textos para propósitos de clasificación automática ha sido tradicionalmente llevada a cabo usando un modelo de espacio vectorial debido a su simplicidad y buen rendimiento. Por otro lado, la clasificación automática de textos por multi-etiquetados ha sido típicamente abordada utilizando métodos de clasificación de etiqueta simple, lo que implica transformar el problema estudiado para aplicar técnicas binarias o adaptar algoritmos binarios para que funcionen con múltiples etiquetas. En esta investigación el objetivo es evaluar una función para la ponderación de las palabras de los textos para modificar la representación de los textos en clasificación multi-etiqueta, usando una combinación de dos enfoques: transformación de problema y adaptación de modelo. Esta función de ponderación y la combinación de enfoques en la clasificación automática fue puesto a prueba con diez diferentes conjuntos de datos textuales utilizados en la literatura especializada y comparado con técnicas alternativas por medio de tres medidas de evaluación. Los resultados presentan mejoras superiores al 10% en el rendimiento de los clasificadores, atribuidas a nuestra propuesta, en todos los casos analizados.
Prediction of molecular parameters from astronomical emission lines, using neural networks
(2021-08)
Barrientos Sessarego, Alejandro Javier
;
Solar Fuentes, Mauricio (Profesor Guía)
;
Mendoza Rocha, Marcelo Gabriel (Profesor Correferente)
;
Universidad Técnica Federico Santa María. Departamento de Informática
La astronomía molecular es un campo que está floreciendo en la era de los grandes observatorios tales como el Atacama Large Millimeter/submillimeter Array (ALMA). Con tadio telescopios modernos, sensibles y de alta resolución, tales como ALMA y el Square Kilometer Array, el tamaño de los cubos de datos está escalando rápidamente, generando una necesiad de poderosas herramientas automáticas de análisis. Este trabajo explora la habilidad de realizar predicciones de parámetros molecular, tales como temperatura de excitación y densidad de columna desde líneas espectrales astronómicas, mediante el uso de redes neuronales. Se usaron como casos de prueba, los espectros de CO, HCO+, SiO y CH3CN entre 80 y 400 GHz. Los espectros de entrenamiento fueron generados con MADCUBA, una herramienta de análisis espectral, del estado-del-arte. El algoritmo presentado a continuación, fue diseñado para permitir la generación de predicciones para múltiples moléculas en paralelo, de una manera escalable y que presenta una aceleración lineal. Usando redes neuronales, es posible predecir la densidad de columna y la temperatura de excitación de estas moléculas con un error absoluto medio del 8.5% para CO, 4.1% para HCO+, 1.5% para SiO y un 1.6% para CH3CN. La precisión d ela predicción depende del nivel de ruido, la saturación de la línea y el número de transiciones. Se realizaron predicciones sobre datos reales de ALMA. Los valores predichos por la red neuronal para estos datos reales difieren en sólo un 13% de los datos de MADCUBA en promedio. Las limitaciones actuales de la herramienta incluyen la no consideración del ancho de línea, tamaño de la fuente, múltiples componentes de velocidad y mezcla de líneas.
Semi-automatic generation of microservices architectures to satisfy non-functional requirements through architectural patterns and tactics
(2020-09)
Márquez Ortega, Gastón Patricio
;
Astudillo Rojas, Hernán (Profesor Guía)
;
Rosas Olivos, Erika Susana (Profesora Correferente)
;
Universidad Técnica Federico Santa María. Departamento de Informática
Microservicios es un estilo de arquitectura que promueve la facilidad de construir y mantener sistemas desglosando sus capacidades de negocio en servicios más pequeños y distribuidos. A menudo, los profesionales suelen utilizar frameworks y plataformas para proporcionar funcionalidades genéricas que abordan problemas recurrentes relacionados a atributos de calidad de sistemas basados en microservicios. No obstante, en la práctica, la información de los frameworks y plataformas es imprecisa y cambiante, así como los requisitos. Los enfoques de despliegue más realista combinan la exploración de las arquitecturas candidatas con su evaluación en cuanto a la satisfacción de los requisitos y la información confusa e incompleta de los frameworks y plataformas disponibles. Esta tesis doctoral describe una técnica novedosa, llamada Azimut, cuyo propósito es generar, evaluar y comparar los ensamblajes de frameworks y plataformas usando descripciones potencialmente imprecisas y cambiantes de requisitos no funcionales, frameworks y plataformas. La evaluación del ensamblaje de los frameworks y plataformas se basa en una puntuación de apoyo que permite modelar un conocimiento arquitectónico imperfecto. La técnica es evaluada en tres estudios empíricos. Los resultados señalan que Azimut genera soluciones cercanas a las que los arquitectos seleccionan para diseñar e implementar arquitecturas de microservicios.
Topic Models Ensembles
(2022-01)
Ormeño Arriagada, Pablo Iván
;
Mendoza Rocha, Marcelo Gabriel (Profesor Guía)
;
Torres López, Claudio Esteban (Profesor Correferente)
;
Universidad Técnica Federico Santa María. Departamento de Informática
La recuperación de información Adhoc es una tarea desafiante que consiste en hacer ranking de documentos para consultas provenientes desde un enfoque de bolsa de palabras. Los métodos clásicos basados en consultas y documentos de vectores de texto, usan funciones de ponderación de términos para hacer ránking de documentos. Algunos de las limitaciones de estos métodos son que no pueden lidiar con conceptos polisémicos. Además, introducen falsas ortogonalidades entre palabras semánticamente relacionadas. Para superarlas, los enfoques de recuperación de información basados en modelos de temas se pueden explorar. Específicamente, los modelos de temas basados en Latent Dirichlet Allocation (LDA) permiten construir representaciones de documentos de texto en el espacio latente de temas, que modela de mejor manera la polisemia y evitan la generación de representaciones ortogonales entre términos relacionados. Es por esto que se pueden expandir las estrategias de Recuperación basadas en LDA usando estrategias de Aprendizaje de Ensamblado. En este sentido, la selección de modelos obedece a estos paradigmas, por lo que probamos dos enfoques usados exitosamente en el aprendizaje supervisado. Se estudian las técnicas Boosting y Bagging para modelos de temas, usando cada modelo como un experto débil de recuperación. Finalmente, se mezclan las listas de ranking obtenidas de cada modelo usando un enfoque simple pero efectivo de fusión de listas top-k. Se muestra que el enfoque propuesto fortalece los resultados en precisión y en recall, superando a los modelos clásicos de recuperación y las líneas bases de modelos de temas.
Decomposition-based Matheuristics for Green Vehicle Routing Problems
(2022-12)
Fernández Gil, Alejandro
;
Castro Valdebenito, Carlos (Profesor Guía)
;
Riff Rojas, María Cristina (Profesora Correferente)
;
Universidad Técnica Federico Santa María. Departamento de Informática
.

Browse

Recent Submissions