NUEVO ALGORITMO PARA LA ATRIBUCIÓN DE AUTORES BASADO EN N-GRAMAS

GODOY ÁLVAREZ, GLORIA LORETO (2018)

Catalogado desde la version PDF de la tesis.

Tesis Pregrado

Hay solamente una cosa que no podremos esconder por siempre y es a nosotrosmismos. Cada persona crea una firma autentica y personal en la que si miramos detenidamente, podremos reconocer sin lugar a duda. El problema de Atribución de Autores basa sus necesidades en esta simple afirmación, si podemos identificar patrones de un autor podremos reconocer su autoría. Y el problema de autoría no es ajeno a nuestro día a día, se puede reconocer en áreas tan diversas como en el periodismo, ciencias políticas, criminalística e informática, quien sustituye las convencionales búsquedas manuales y agrupa diferentes propuestas lingüísticas y matemáticas para desarrollar aplicaciones y metodologías que contribuyan con el criterio de identificación. Este trabajo presenta una investigación de las técnicas actuales de atribución de autores, para luego enfocarse en experimentos que identifiquen el aporte de utilizar n-gramas en el problema de verificación de autores.

There is only one thing that we can’t hide forever and that is ourselves. Eachperson creates an authentic and personal signature and if we look carefully, we can recognize this signature without a doubt. The problem of Authorship Attribution bases on this simple statement, if we can identify patterns of an author we can recognize their authorship. And the problem of authorship is not foreign to our daily life, it can be recognized in diferent areas like journalism, political science, criminalist and computer science, in which we can replaces conventional manual searches for a group of different proposals, linguistic and mathematical, to develop applications and methodologies that contribute with the identification criteria.This paper presents an investigation of the current techniques on the Authorship Attribution problem, to later pass on experiments that identify the contribution of using n-grams in the problem of author verification.