Araya López, Mauricio Alejandro (Profesor Guía)Zañartu Salas, Matías (Profesor Correferente)Tapia Donaire, Bastián Pedro EduardoTapia Donaire, Bastián Pedro Eduardo2024-10-302024-10-302023-04https://repositorio.usm.cl/handle/123456789/56141El siguiente trabajo expone un marco conceptual y una guía práctica para la fusión tardía de scores (distancias) de un sistema de recuperación de información basado en contenidos (CBIR) llamado Proximity 1.0. El trabajo busca contribuir a versiones futuras del sistema en las que se requiera la fusión de información mostrando los procedimientos generales para esta tarea, lo que involucra entre otros la toma de muestras, la aplicación de técnicas de fusión, el reporte de resultados y evaluación de los mismos. El sistema Proximity 1.0 utilizando las arquitecturas de deep learning Xception y Ce-net entrega una distancia euclidiana como medidas de similitud entre un corte de tomografía computarizada (CT) de consulta y las imágenes recuperadas por el sistema. Dado que un examen de CT está compuesto por cientos de cortes, para estudiar posibles extensiones tridimensionales y encontrar así la similitud entre exámenes, surge la necesidad de fusión de las distancias asociadas a múltiples consultas individuales entregadas por Proximity 1.0. Para el problema anterior se aplicaron las técnicas clásicas del estado del arte de fusión tardía sobre matrices que sintetizan la consulta al sistema, además se propone una notación acorde al contexto basada en la literatura. Los experimentos se realizaron con 10 exámenes de CT de tórax para determinar el tamaño de matrices representativas, la cantidad de imágenes recuperadas solicitadas al sistema y el comportamiento de las técnicas de fusión. Las técnicas contemplaron CombSUM, CombMNZ, CombANZ, CombHIB, CombMAX además de combinaciones mediante el método de Yu Suzuki (para distintas particiones de rango) un método conteo basado en ProbFuse (para distintas particiones de lista) y la divergencia de Kullback utilizando la intensidad de píxeles en la imagen para la creación de las distribuciones de probabilidad de las imágenes. Las implementaciones se realizaron principalmente en Python y MATLAB. Dada la falta de un ranking de referencia, las técnicas fueron evaluadas de manera individual, observando la consistencia de la técnica en el rankeo sobre varias matrices de un mismo estudio y de manera integrada, es decir, comparándolas entre ellas, observando las coincidencias de posiciones en elos rankings respectivos. Para facilitar el análisis, se propuso un método de reporte de resultados que favoreciera la visualización de los mismos. Por último, se propone un método de integración simple de las técnicas estudiadas mediante umbrales de mayoría con el objetivo de generar una respuesta de interés al usuario. Se privilegió un análisis cualitativo de los resultados, principalmente por el estado de los datos disponibles y a interpretaciones del grafo. Estos mostraron consistencias elevadas en los métodos CombSUM, CombMNZ, Yu Suzuki, Kullback, ProbFuse y en menor medida en CombMAX y CombANZ. Este último además resultó ser el ranking más discrepante respecto a los métodos Comb. Las técnicas de Yu Suzuki y ProbFuse mostraron consistencias elevadas para la mayoría de las particiones estudiadas. Por otra parte, las técnicas CombSUM, CombMNZ y Comb Max presentan resultados similares. Las técnicas de Kullback y Yu Suzuki discrepan (aunque en menor medida) con los métodos Comb. La divergencia de Kullback reporto en ocaciones una interpretación de similitud discrepante respecto a la de Proximity. Esta memoria se encuentra enmarcada en el proyecto IT21I0019 "Repositorios interoperables para análisis Inteligente de Imágenes Médicas" financiado por Fondef.CBIRTOMOGRAFIA COMPUTARIZADAFUSION TARDIAFUSION DE INFORMACIONAplicación de técnicas de fusión tardía de distancias en espacios latentes para establecer semejanza entre tomografías computarizadasB193934641UTFSM