Thesis IMPACTO DEL GRADO DE COMPLETITUD SOBRE ENRIQUECIMIENTO DE METADATOS CON CROWDSOURCING
Loading...
Date
2013
Journal Title
Journal ISSN
Volume Title
Program
Campus
Casa Central, Valparaíso
Abstract
Con la evolución de las tecnologías, la generación de contenido multimedia ha aumentado considerablemente, incluso material físico es traspasado a formato digital para su conservación y mejorar la interacción con el mismo. Sin embargo, la sola digitalización no basta para permitir el uso computacional de los recursos, también es necesario agregar contenido a los mismos: metadata. El crowdsourcing es una metodología usada para licitar trabajos sencillos (por ejemplo el etiquetado de imágenes) a una gran masa humana; particularmente exitoso en términos de costo, calidad y rapidez. Sin embargo, se desconoce si la tarea de completar metadatos de recursos multimedia puede verse afectada por la completitud inicial del formulario, es decir, si el presentar previamente contenido influye el resultado final. A raíz de lo anterior surge la necesidad de determinar cómo y cuánto afecta el grado de completitud (cantidad de metadatos presentes a priori) al comportamiento de los anotadores en el llenado de un formulario. Esta investigación aborda estas incógnitas experimentalmente: se recolectó cientos de imágenes en el dominio de Historia de Chile, se completaron con metadatos por un experto y se presentaron parcialmente a una comunidad de profesionales afines (crowd). La crowd completó y corrigió acorde a los metadatos entregados mediante un formulario. Los resultados fueron analizados y comparados según los distintos grados de completitud y la cantidad y calidad de metadatos resultantes. Finalmente se implementó un sistema de etiquetado de imágenes que permite aprovechar la existencia de etiquetas previamente introducidas. Se determinó que al presentar etiquetas previamente en un formulario aumenta la calidad final del contenido, ya que disminuyen los ingresos de datos erróneos. Por el contrario, es recomendable presentar un formulario vacío si se quiere obtener mayor cantidad y diversidad de etiquetas tras el llenado vía crowdsourcing.
Description
Catalogado desde la versión PDF de la tesis.