Tesis de Postgrado Acceso Abierto
Permanent URI for this collectionhttps://repositorio.usm.cl/handle/123456789/2
Browse
Browsing Tesis de Postgrado Acceso Abierto by Author "Allende Olivares, Héctor Manuel"
Now showing 1 - 3 of 3
- Results Per Page
- Sort Options
Thesis Clasificación de textos multi-etiquetados con representación dependiente de la etiqueta(2021-03) Alfaro Arancibia, Rodrigo Marcelo; Departamento de Informática; Allende Olivares, Héctor ManuelLa asignación de una o más categorías, predefinidas a los textos en lenguaje natural, basados en su contenido, es un componente importante y necesario en muchas tareas al interior de las organizaciones. Esta tarea se realiza comúnmente a través de la clasificación automática de textos, esto es, clasificando documentos dentro de un conjunto de categorías predefinidas por medio de un modelo y métodos computacionales. La representación de los textos para propósitos de clasificación automática ha sido tradicionalmente llevada a cabo usando un modelo de espacio vectorial debido a su simplicidad y buen rendimiento. Por otro lado, la clasificación automática de textos por multi-etiquetados ha sido típicamente abordada utilizando métodos de clasificación de etiqueta simple, lo que implica transformar el problema estudiado para aplicar técnicas binarias o adaptar algoritmos binarios para que funcionen con múltiples etiquetas. En esta investigación el objetivo es evaluar una función para la ponderación de las palabras de los textos para modificar la representación de los textos en clasificación multi-etiqueta, usando una combinación de dos enfoques: transformación de problema y adaptación de modelo. Esta función de ponderación y la combinación de enfoques en la clasificación automática fue puesto a prueba con diez diferentes conjuntos de datos textuales utilizados en la literatura especializada y comparado con técnicas alternativas por medio de tres medidas de evaluación. Los resultados presentan mejoras superiores al 10% en el rendimiento de los clasificadores, atribuidas a nuestra propuesta, en todos los casos analizados.Thesis Pronóstico probabilístico basado en redes neuronales profundas para series de tiempo de energía(2023-05) Serpell Carriquiry, Cristián Felipe; Pezoa Rivera, Raquel; Departamento de Informática; Allende Olivares, Héctor Manuel; Gil Sagas, Esteban ManuelMuchas actividades dependen del pronóstico fiable de valores futuros. Para hacerlo, se han concebido modelos de redes neuronales que toman valores previamente observados, y proveen una descripción de la distribución de probabilidad de los valores futuros, en vez de solo un valor esperado. Esta tarea, llamada pronóstico probabilístico, permite prepararse para diferentes situaciones potenciales con distinta probabilidad de ocurrencia, en vez de prepararse solo para una situación primedio que podría no ocurrir en la realidad. Estos modelos consideran la incertidumbre de los valores futuros usando diferentes representaciones, que incluyen intervalos de pronóstico, cuantiles, o supuestos distribucionales. En todas ellas, dos fuentes de incertidumbre deben ser consideradas: incertidumbre aleatoria, asociada a la elección del modelo, incluyendo la no consideración de otras variables que podrían otorgar más información sobre la variable pronosticada, e incertidumbre epistémica, relacionada a la falta de suficientes datos de entrenamiento para ajustar los parámetros del modelo. Esta última no es considerada por muchos trabajos, aún siendo especialmente importante para modelos de pronóstico basados en redes neuronales, ya que éstos tienen una gran cantidad de parámetros y los datos de entrenamiento son usualmente escasos para pronóstico de series de tiempo. En este trabajo, se propone un modelo de pronóstico probabilístico de aprendizaje profundo que considera ambas fuentes de incertidumbre. Para la primera, se considera un supuesto distribucional, que permite elegir entre distintas familias de distribuciones, y para la segunda, se usa Monte Carlo Dropout, una técnica que muestrea valores distintos para los parámetros cada vez que se evalua la red neuronal. Este modelo es validado para pronóstico a múltiples pasos de velocidad del viento, potencia eólica y demanda eléctrica, importantes tareas para el sector eléctrico, donde la penetración de fuentes de energía renovables no convencionales ha incrementado la incertidumbre presente en los sistemas eléctricos. Se concluye que el modelo maneja ambas fuentes de incertidumbre para el pronóstico de series de tiempo, y que la elección de la distribución de salida permite mejorar el desempeño para algunas series de tiempo, al usar una distribución diferente a la normal.Thesis Representaciones homogéneas, heterogéneas y mixtas para la estimación de potencial fotovoltaico urbano en Santiago(2023-07) Valderrama Bustos, Álvaro Gabriel; Valle Vidal, Carlos; Departamento de Informática; Allende Olivares, Héctor ManuelLos inminentes problemas asociados al cambio climático han acelerado los esfuerzos para lograr una pronta transición energética hacia fuentes renovables. Por ende, la estimación precisa y a gran escala del potencial de generación de distintas energías renovables tomar una nueva importancia en el proceso de toma de decisiones y políticas públicas. La estimación fotovoltaica sobre las zonas urbanas es particularmente complicada dada la influencia de las oclusiones del sol por edificaciones adyacentes, la disponibilidad incierta de áreas favorables para las instalaciones y la ausencia de datos apropiados públicamente disponibles y confiables. El Ministerio de Energía ha generado una base de datos del potencial fotovoltaico urbano de Santiago, que puede utilizarse para efectos de aprendizaje. Más aún, una segunda base de datos, obtenida desde el Servicio de Impuestos Internos, presenta descriptores de las edificaciones presentes en el territorio nacional, entre otras, el número de pisos o la superficie total construida. Esto permite consolidar una base de datos a nivel de manzana, la cual presenta una lista de edificios con sus respectivos descriptores y el potencial fotovoltaico, en términos del área favorable, de esta. Con estos datos se puede realizar aprendizaje automático para modelar la relación entre las características de las manzanas y su potencial. Esta prometedora aproximación tiene, sin embargo, una dificultad adicional: distintos registros (i.e. manzanas) tienen distinto número de edificaciones, y por ende distinta dimensionalidad. Esto requiere por lo tanto un manejo particular de los datos, los cuales tienen largo variable. En el presente proyecto se propone aprovechar la capacidad de las redes convolucionales uno dimensionales de aprender patrones sobre secuencias de datos para realizar el aprendizaje sobre representaciones secuenciales de los datos disponibles. Más aún, se propone utilizar los datos tanto en la representación habitual “homogénea” (distintas posiciones de la secuencia corresponden a distintas instancias del mismo tipo de dato), como “heterogéneas” (distintas posiciones corresponden a distintos tipos de datos, en nuestro caso, distintos atributos de las edificaciones), como una tercera representación “mixta”, inicialmente homogénea seguida de heterogénea. Además, esto permitirá igualmente a la red aprender representaciones convolucionales significativas de los datos. Si bien estas innovadoras representaciones heterogénea y mixta no permiten mejorar significativamente los resultados del estado del arte homogéneo, si se aprecian diferencias en los costos computacionales asociados, siendo la representación heterogénea significativamente menos costosa en tiempos de entrenamiento y predicción que la representación estándar homogénea. Esto se evidencia igualmente en el aprendizaje realizado sobre las representaciones intermedias, donde la representación heterogénea aprendida logra desempeños similares utilizando órdenes de magnitud menos dimensiones que las otras representaciones.