Riveros Carmona, Jullianne de Jesús2025-10-132025-10-132025-08https://repositorio.usm.cl/handle/123456789/76764La presente memoria de título se enmarca en el proyecto FONDEF ID23I10024 y tiene por objetivo general desarrollar un método automatizado basado en medidas espectroscópicas e inteligencia artificial para la evaluación rápida y precisa de características del vino. Esto se abordó mediante la integración de espectroscopía visible, análisis físico-químico y técnicas de aprendizaje automático supervisado, con énfasis en la clasificación de cepas de vino a partir de un volumen limitado de datos y prototipos de bajo costo. La metodología se estructuró en seis etapas: calibración de prototipos, recolección de muestras, medición espectral, caracterización fisicoquímica y procesamiento de datos. Se evaluó la reproducibilidad instrumental, se diseñaron protocolos de captura estandarizados y se generó una base de datos con 36 muestras físicas representativas de cepas provenientes de Viña El Escorial. En la etapa de modelamiento, se exploraron dos configuraciones de entrada: espectros crudos y combinados con variables fisicoquímicas, pero ninguno tuvo un resultado favorable de manera independiente. Por ende, se implementó un árbol de clasificación jerárquica organizado por niveles de separación y clasificación de cepas específicas. El modelo final, compuesto por submodelos con algoritmos supervisados, preprocesamiento de análisis de componentes principales (PCA) y/o análisis discriminante lineal (LDA), escaladores y permutation feature importance (PFI), alcanzó un accuracy del 80% utilizando únicamente espectros (modelo Spec) y un 93% al incorporar propiedades fisicoquímicas (modelo Full), destacando el impacto del %v/v como variable con mayor poder discriminante, complementada levemente por la conductividad, seguido de °Brix y pH en la jerarquía de importancias. Asimismo, se identificaron limitaciones del uso de ruido artificial (gaussiano y salt and pepper) como método de data augmentation, dada la complejidad matricial del vino y la alteración de agrupaciones naturales de cepas. Se concluyó que la estructura espectral y la interacción entre componentes del vino dificultan la extrapolación realista de nuevos datos sintéticos sin degradar el rendimiento del modelo. A pesar de la necesidad de optimización y generalización, este trabajo sienta las bases para futuras validaciones en terreno y escalamiento de volumen de datos, orientado al fortalecimiento de herramientas analíticas accesibles para la industria del vino chileno.This thesis is part of the FONDEF ID23I10024 project and aims to develop an automated method based on visible spectroscopy and artificial intelligence for wine grape variety classification using a limited volume of data. The methodology followed six stages: prototype calibration, sample collection and measurement, physicochemical characterization, and modeling. A database of 36 representative wine samples from Viña El Escorial was created. A hierarchical classification tree of supervised models was implemented, incorporating preprocessing with principal component analysis (PCA) and/or linear discriminant analysis (LDA), along with scalers and permutation feature importance (PFI). The model achieved 80% accuracy using only spectral data Spec model, and 93% when incorporating physicochemical variables Full} model. Limitations were identified in using artificial noise as a data augmentation method due to the spectral complexity of wine. This work lays the groundwork for future field validations and scalability, contributing accessible analytical tools to the Chilean wine industry.118 páginasesAttribution-ShareAlike 4.0 Internationalhttp://creativecommons.org/licenses/by-sa/4.0/Inteligencia ArtificialClasificación de cepas de vinoEspectroscopía visibleMini espectrofotómetroAprendizaje automático supervisadoAlgoritmos supervisadosMatriz de confusiónAnálisis discriminante lineal (LDA)Validación de Medidas espectroscópicas de muestras de vino utilizando inteligencia artificial35609002889028 Trabajo decente y crecimiento económico9 Industria, innovación e infraestructura12 Producción y consumo responsables17 Alianzas para lograr los objetivos