Thesis
Comparative analysis of deep learning models versus machine learning algorithms for spam email detection

dc.contributor.correferenteÑanculef Alegría, Juan Ricardo
dc.contributor.departmentDepartamento de Informática
dc.contributor.guiaValle Vidal, Carlos Antonio
dc.coverage.spatialCampus Casa Central Valparaíso
dc.creatorVega Rivera, Paulina Valeria
dc.date.accessioned2025-08-04T14:15:14Z
dc.date.available2025-08-04T14:15:14Z
dc.date.issued2025-07
dc.description.abstractSpam email detection is a critical task in cybersecurity, complicated by constantly evolving spam tactics that are designed to trick the filtering systems. This study compares five machine learning models and nine deep learning models, evaluated using eight performance metrics on a combined dataset of 5,500 email. Statistical tests were applied to the top-performing models to asses significance. Results show that RoBERTa consistently achieves the highest F1 score among all deep learning models, while the fine-tuned GPT models, considered a special case due to being trained on significantly smaller datasets, still perform competitively. Among machine traditional learning models, SVM, NB and RF achieved the highest score, however, they still performed worse than the five Transformer-based models. Overall, the study's goal is to provide a comprehensive benchmark of traditional and modern approaches to spam detection under practical constraints.en
dc.description.abstract La detección de correos spam es una tarea crítica en la ciberseguridad, complicada por la constante evolución de técnicas diseñadas para evadir los filtros. Este estudio compara cinco modelos de aprendizaje automático y nueve de aprendizaje profundo, evaluados con ocho métricas sobre un conjunto de 5,500 correos. Se aplicaron pruebas estadísticas a los mejores modelos para evaluar su significancia. RoBERTa obtuvo consistentemente el F1 score más alto, mientras que los modelos ajustados de GPT, entrenados con menos datos, también lograron resultados competitivos. Entre los modelos tradicionales, SVM, NB y RF fueron los más efectivos, aunque fueron superados por los cinco modelos basados en Transformers. El objetivo general es ofrecer un benchmark amplio entre enfoques tradicionales y modernos de detección de spam bajo condiciones prácticas.es
dc.description.programIngeniería Civil Informática
dc.format.extent63 páginas
dc.identifier.barcode3560900288139
dc.identifier.urihttps://repositorio.usm.cl/handle/123456789/75865
dc.language.isoen
dc.publisherUniversidad Técnica Federico Santa María
dc.rightsAttribution 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectDeep learning
dc.subjectMachine learning
dc.subjectSpam detection
dc.subjectCybersecurity
dc.subjectAprendizaje profundo
dc.subjectAprendizaje automático
dc.subjectCiberseguridad
dc.subjectDetección de correos no deseados
dc.subject.ods4 Educación de calidad
dc.subject.ods9 Industria, innovación e infraestructura
dc.subject.ods16 Paz, justicia e instituciones sólidas
dc.titleComparative analysis of deep learning models versus machine learning algorithms for spam email detection
dspace.entity.typeTesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
3560900288139.pdf
Size:
1.65 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: