Thesis
Análisis y clasificación de textos ilícitos como apoyo para la gestión de espionaje policial

dc.contributor.correferenteTorres López, Claudio Esteban
dc.contributor.departmentDepartamento de Informática
dc.contributor.guiaValle, Carlos
dc.coverage.spatialCampus Casa Central Valparaíso
dc.creatorParra Campos, Franco Enrique
dc.date.accessioned2024-09-25T13:15:17Z
dc.date.available2024-09-25T13:15:17Z
dc.date.issued2023-07
dc.description.abstractDía a día, nuevas generaciones encuentran en internet un lugar más por donde coexistir y donde crear una imagen de sí mismos distinta a la que reciben de sus padres o profesores. Muchas veces, ni ellos, ni sus tutores, cuentan con la madurez y/o las herramientas suficientes para concebir los riesgos inherentes en internet. Uno de los más frecuentes suele ser la captación de menores (grooming) que, tan solo en el año 2020, tuvo un incremento del 97,5% debido a la COVID-19. Parte de las soluciones propuestas por los investigadores, se enfocaron en distinguir línes escritas por pedófilos o pseudovíctimas, y en crear perfiles con base en características psicolinguísticas, empleando clasificadores tradicionales como KNN o SVM, combinados con n-gramas. LIWC o TF-IDF. El problema, sin embargo, es que al no ser alternativas a nivel de conversaciones, resultan poco prácticas. La competencia "PAN 2012" buscó precisamente este objetivo, consiguiendo en el mejor de los casos (BOW con TF-IDF y SVM con NN) un valor F del 87,34%. con la llegada de los modelos atencionales, muchas tareas NLP se vieron beneficiadas. Producto de lo anterior, en este trabajo se propone un modelo de inteligencia rtificial BERT capaz de discriminar conversaciones con fines perversos (manipulación, explotación o abuso sexual) hacia menores. Los resultados muestran una mejora del 7,00% en el valor F con respecto al mejor candidato en "PAN 2012". La aplicación de la solución en diversos diálogos protagonizados por acechadores sexuales, revelan la eficacia, robustex y certinidad de la arquitectura, consolidándola como un primer acercamiento hace un instrumento proventivo que apoye y facilite el trabajo de los agentes policiales durante sus investigaciones.
dc.description.degreeINGENIERO CIVIL INFORMÁTICO
dc.description.programIngeniería Civil Informática
dc.identifier.barcode201387604
dc.identifier.urihttps://repositorio.usm.cl/handle/123456789/5685
dc.identifier.urihttps://doi.org/10.71700/dspace-memorias/233
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess
dc.subjectCaptación de menores en internet
dc.subjectInteligencia artificial aplicada a ciberseguridad
dc.subjectBERT
dc.subjectProcesamiento de lenguaje natural (NLP)
dc.titleAnálisis y clasificación de textos ilícitos como apoyo para la gestión de espionaje policial
dspace.entity.typeTesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
m20138760-4.pdf
Size:
5.21 MB
Format:
Adobe Portable Document Format