Thesis ANÁLISIS ESTRUCTURAL DE BASES DE DATOS CIENTÍFICAS EN EL ÁREA DE LAS CIENCIAS DE LA COMPUTACIÓN
Loading...
Date
2014
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Tecnica Federico Santa Maria
Abstract
Hoy en día tenemos acceso a grandes colecciones de datos gracias a los avances de la tecnología. La mayoría de estos datos se encuentran disponibles para cualquier persona a través de Internet y en algunos casos, en redes privadas como pueden ser instituciones o empresas.
Estos datos están compuestos en su gran mayoría por documentos de texto. Estos documentos contienen información sobre temas como salud, tecnología, historia y economía, entre otros. Por esto, es muy útil el uso de estos datos en la toma de decisiones de una empresa, para descubrir una cura a una enfermedad letal, crear nuevas tecnologías que faciliten las vidas de las personas o descubrir nuevos hechos que acontecieron en la historia de la humanidad. El principal problema con estas grandes cantidades de datos es inferir la información que contienen. Por esto gracias a los avances en la ciencia de la computación, hoy en día existen diferentes técnicas que permiten inferir está información de forma automática y sin la asistencia de un ser humano. El objetivo de este trabajo es presentar un estudio de las distintas técnicas que existen para inferir los temas que componen a una colección de documentos. Facilitar la visualización de los resultados encontrados y a su vez como automatizar el proceso de actualización de dichos resultados.
Today we have access to large collections of data thanks to the advances of technology. Most of these data are available for anyone over the Internet and in some cases, in private networks such as institutions or companies. These data are mostly text documents. These documents contain information on topics such as health, technology, history and economics, among others. Therefore, it is very useful to use this information in making decisions of a company, to find a cure to a deadly disease, develop new technologies to facilitate the lives of people or discover new facts that happened in the history of the humanity. The main problem with these large amounts of data is to infer the information they contain. Therefore thanks to advances in computer science, nowadays there are different techniques to infer this information automatically without the assistance of a human being. The aim of this paper is to present a study of the various techniques that exist to infer the topics covered by a document collection. Facilitate the visualization of the results and automate the process of updating these results.
Today we have access to large collections of data thanks to the advances of technology. Most of these data are available for anyone over the Internet and in some cases, in private networks such as institutions or companies. These data are mostly text documents. These documents contain information on topics such as health, technology, history and economics, among others. Therefore, it is very useful to use this information in making decisions of a company, to find a cure to a deadly disease, develop new technologies to facilitate the lives of people or discover new facts that happened in the history of the humanity. The main problem with these large amounts of data is to infer the information they contain. Therefore thanks to advances in computer science, nowadays there are different techniques to infer this information automatically without the assistance of a human being. The aim of this paper is to present a study of the various techniques that exist to infer the topics covered by a document collection. Facilitate the visualization of the results and automate the process of updating these results.
Description
Digitalizado de su versión en papel
Keywords
ESTRUCTURA DE DATOS (CIENCIA DE LA COMPUTACIÓN), WORLD WIDE WEB (SERVICIO DE INFORMACIÓN SOBRE REDES), AUTOMATIZACIÓN DE ACTUALIZACIÓN DE DATOS
Citation
Campus
Universidad Técnica Federico Santa María UTFSM. Campus San Joaquín