Thesis ENTRENAMIENTO DE CLASIFICADORES PARA LA DETECCIÓN DE PLAGIO TRADUCIDO EN DOCUMENTOS ELECTRÓNICOS
Loading...
Date
2014
Journal Title
Journal ISSN
Volume Title
Program
Campus
Casa Central, Valparaíso
Abstract
El presente trabajo se enmarca dentro del proyecto ?Detección del Plagio Traducido en Documentos Electrónicos?, realizado a través del Centro Cient??fico y Tecnológico de Valpara??so que busca crear nuevas metodolog?ás para detectar el plagio traducido. En este trabajo de t??tulo, se realiza un estudio comparativo entre cinco clasificadores implementados por la herramienta Weka y que son conocidos en miner?á de datos. El estudio se basa en la modificación de los parámetros de los clasificadores para encontrar aquel que presente los mejores resultados al clasificar un conjunto de documentos con sospecha de haber sido plagiados desde el idioma inglés. El objetivo de este trabajo es constatar que los mejores resultados en la clasificación de estos documentos se logra con utilizando las Máquinas de Soporte Vectorial. En el plan de pruebas se han utilizado dos técnicas; la técnica de Validación cruzada (cross validation) para dividir los datos en diez grupos y la técnica de validar sobre un conjunto de pruebas (Test Set) que contenga muestras no vistas en el entrenamiento. Con estas técnicas se pretende demostrar que los clasificadores evaluados: Naive Bayes, Arboles de Decisión, Reglas de Decisión, Regresión Log??stica y Máquinas de Soporte Vectorial implementadas por Weka (algoritmo SMO), a pesar de ser usados con sus parámetros óptimos, no presentan tan buenos resultados como lasMáquinas de Soporte Vectorial implementadas por LibSVM que presentan un 85% de aciertos.
Description
Catalogado desde la versión PDF de la tesis.