Show simple item record

dc.contributor.advisorÑANCULEF, RICARDO
dc.contributor.authorVELÁSQUEZ ARAYA, JOAQUÍN EDUARDO
dc.coverage.spatiales_CL
dc.date.accessioned2017-08-08T19:08:58Z
dc.date.available2017-08-08T19:08:58Z
dc.date.issued2017
dc.identifier.urihttp://hdl.handle.net/11673/15561
dc.descriptionCatalogado desde la version PDF de la tesis.es_CL
dc.description.abstractEste trabajo está enfocado en la búsqueda por similaridad de documentos de texto, porello se busca un modelo para obtener una representación binaria de documentos de texto querefleje la similitud semántica entre ellos y alcance una alta precisión.La búsqueda por similitud de documentos de texto corresponde a obtener los documentosdentro de una colección que resultan semánticamente similares respecto a un documentode consulta, es decir, que están relacionados con dicha consulta en función de su significadoo contenido. Una representación binaria de estos documentos que refleje su similitudSemántica permite operar en el espacio de Hamming, en donde las operaciones necesariaspara comparar las representaciones son de menor complejidad. En la recuperación de informaciónsuele ser relevante recuperar una baja cantidad de documentos pero alcanzando unaalta precisión.Se realizó una implementación en Python basado en el modelo propuesto en [28] paraGenerar representación binaria de documentos de texto y se evaluó su desempeño variandoParámetros del modelo. Este modelo fue modificado para experimentar con distintas arquitecturas,utilizar Constrained Poisson Model y se suprimió el ruido. De este modo, se encontraronmodelos con alta precisión y poco profundos para la recuperación de una baja cantidadde documentos.es_CL
dc.description.abstractThis work is focus on similarity search of text documents, for this reason it shows a modelto obtain a binary representation of text documents that reflects the semantics similaritybetween them and reach a high precision.Similarity search of text documents corresponds to obtaining the documents within acollection that is semantically similar to a query document, that is, they are related to thequery according to its meaning or content. A binary representation of these documents thatreflects their semantic similarity allows to operate over Hamming space, where the operationsnecessary to compare the representations have less complexity. In information retrieval it isusual to recover a low number of documents but attaining high accuracy.A model baser on [28] was implemented on Python to generate binary representation oftext documents and its performance was evaluated by varying model parameters. This modelwas modified to experiment with dierent architectures to use Constrained Poisson Modeland the noise was suppressed. In this way, shallow models with high precision and for thelow amount recovery were found.veng
dc.format.extent93 h.
dc.format.mediumCD ROM
dc.format.mimetypeapplication/pdf
dc.subjectBUSQUEDA POR SIMILITUDes_CL
dc.subjectRECONOCIMIENTO POR PATRONESes_CL
dc.subjectREDES NEURONALESes_CL
dc.titleHASHING ADAPTATIVO BASADO EN REDES NEURONALES PARA BÚSQUEDA POR SIMILITUDes_CL
dc.typeTesis Pregradoes_CL
dc.rights.accessRightsA - Internet abierta www.repositorio.usm.cl y otros repositorios a la que la USM se adscriba
dc.description.degreeINGENIERO CIVIL INFORMÁTICOes_CL
dc.contributor.departmentUniversidad Tecnica Federico Santa Maria UTFSM INFORMATICAes_CL
dc.description.programINGENIERÍA CIVIL INFORMÁTICA
dc.identifier.barcode3560902038236
usm.identifier.thesis4500012524
usm.identifier.rut17677857-1
usm.date.thesisregistration2016


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record