Thesis
Robustez y adaptabilidad de los descriptores acústicos en la detección de alteraciones fonológicas mediante un enfoque plurilingüe y multi-patológico: caso Refracted Speech

Loading...
Thumbnail Image

Date

2025-08-07

Authors

García Ramírez, Joaquín

Journal Title

Journal ISSN

Volume Title

Program

Ingeniería Civil Informática

Departament

Departamento de Informática

Campus

Campus Casa Central Valparaíso

Abstract

Desarrollando el videojuego "Arm Around!" nació un interés por considerar su "consumo de segunda mano'' mediante plataformas de streaming de contenido generado por usuarios. Sin embargo, existe poca información sobre buenas prácticas de diseño de videojuegos orientadas específicamente al streaming. Esta memoria explora el impacto de prácticas, patrones y elementos de diseño en la viralización y ventas de videojuegos. Se propusieron dieciséis aspectos investigando fuentes académicas y de la industria, evaluándolos mediante el análisis de casos exitosos y fallidos, y aplicando los más relevantes a "Arm Around!". Realizando entrevistas a diseñadores de videojuegos, streamers y desarrolladores del equipo (n=10), todos los cambios fueron considerados positivos, lo que podría indicar un impacto positivo en la capacidad de viralización y ventas del videojuego.
Phonological impairments associated with neurological disorders such as dysarthria and Parkinson’s disease severely impact oral communication, and their automatic diagnosis remains challenging, particularly in multilingual contexts. This thesis proposes a systematic evaluation of acoustic descriptors to identify the most robust, interpretable, and generalizable features for the automatic detection of speech pathologies. Starting from an experimental framework based on Refracted Speech—an application originally aimed at the automatic diagnosis of dysarthria in English-speaking patients—a feature extraction pipeline was implemented, incorporating correlation-based selection methods, Recursive Feature Elimination with Cross-Validation (RFECV), training and evaluation of machine learning models (Random Forest, SVM, MLP), and explanatory SHAP analysis, applied across multiple languages and pathologies. Results indicate that a small subset of acoustic descriptors—including tVSA, VAI, Pause Percentage, and Autocorr Energy—achieve high diagnostic accuracy and cross-contextual consistency. Moreover, the study validates novel features derived from acoustic signal correlation, proposing more effective alternatives compared to traditional descriptors such as jitter or shimmer. Overall, this research provides concrete tools for the development of automatic diagnostic systems, readily adaptable to real-world clinical and multilingual contexts.

Description

Keywords

Machine Learning, Feature Engineering, IA Explicativa, Análisis de voz, SHAP, SVM, Random Forest, Fonología, Contenido generado por usuarios

Citation