Thesis
Comparación de modelos de lenguaje natural para búsquedas en observatorios virtuales

dc.contributor.correferenteAraya López, Mauricio Alejandro
dc.contributor.departmentDepartamento de Informática
dc.contributor.guiaSolar Fuentes, Mauricio
dc.coverage.spatialCampus Santiago San Joaquín
dc.creatorPinto Muñoz, José Francisco
dc.date.accessioned2025-09-04T20:14:16Z
dc.date.available2025-09-04T20:14:16Z
dc.date.issued2025-08
dc.description.abstractEste trabajo presenta el desarrollo y evaluación de VOAI-Search, una plataforma para consultas en lenguaje natural sobre Observatorios Virtuales astronómicos. Se implementó una arquitectura con frontend interactivo, backend de coordinación, base de datos, motor de búsqueda compatible con protocolos SIAP de IVOA y dos modelos LLM: GPT-4o y DeepSeek-R1. El objetivo fue comparar su desempeño en recuperación de imágenes astronómicas, evaluando precisión, tiempo de respuesta, recursos y sostenibilidad. Se realizaron 21 consultas por modelo agrupadas temáticamente, midiendo métricas como Recall@1, Recall@3, MRR, tokens, costo y huella de carbono. DeepSeek-R1 logró mayor Recall@3 (86 % vs. 71 %), menor costo e impacto ambiental, mientras GPT-4o fue más rápido y usó menos tokens. La evaluación demuestra fortalezas diferenciadas que mejoran el acceso semántico a datos astronómicos.es
dc.description.abstract This work presents the development and evaluation of VOAI-Search, a web platform enabling natural language queries on astronomical Virtual Observatories using state-of-the-art LLMs. The architecture includes an interactive frontend, coordinating backend, database, search engine compatible with IVOA’s SIAP protocols, and two LLMs: GPT-4o and DeepSeek-R1. The main goal was to compare their performance in retrieving astronomical images, assessing precision, response time, resource consumption, and sustainability. Twenty-one thematic queries per model were executed, measuring Recall@1, Recall@3, MRR, tokens, cost, and carbon footprint. DeepSeek-R1 achieved higher Recall@3 (86 % vs. 71 %), lower cost and environmental impact, while GPT-4o was faster and used fewer tokens. The evaluation shows distinct strengths enhancing semantic access to large astronomical datasets.en
dc.description.programIngeniería Civil Informática
dc.format.extent77 páginas
dc.identifier.barcode3560900288570
dc.identifier.urihttps://repositorio.usm.cl/handle/123456789/76332
dc.language.isoes
dc.publisherUniversidad Técnica Federico Santa María
dc.rightsAttribution 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectObservatorio Virtual
dc.subjectModelos de Lenguaje
dc.subjectAstroinformática
dc.subjectGPT-4o
dc.subjectDeepSeek
dc.subjectVirtual Observatory
dc.subjectLanguage Models
dc.subjectAstroinformatics
dc.subject.ods9 Industria, innovación e infraestructura
dc.subject.ods12 Producción y consumo responsables
dc.subject.ods13 Acción por el clima
dc.subject.ods17 Alianzas para lograr los objetivos
dc.titleComparación de modelos de lenguaje natural para búsquedas en observatorios virtuales
dspace.entity.typeTesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
3560900288570.pdf
Size:
2.72 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: