EL REPOSITORIO SE ENCUENTRA EN MARCHA BLANCA

 

Thesis
EFECTOS DEL CONJUNTO DE VALIDACIÓN EN LA PREDICCIÓN DE RETORNOS.

Loading...
Thumbnail Image

Date

2019-06-24

Journal Title

Journal ISSN

Volume Title

Program

DEPARTAMENTO DE INDUSTRIAS. MAGÍSTER EN CIENCIAS DE LA INGENIERÍA INDUSTRIAL

Campus

Campus Vitacura, Santiago

Abstract

Deep Learning es un área de Machine Learning que permite extraer patrones de distintos datos a través de múltiples “capas” o funciones (de ahí el término profundo). Su gran versatilidad para resolver un conjunto de problemas, y su éxito en tareas como reconocimiento de imágenes, procesamiento de lenguaje natural y algunas tareas secuenciales las hacen herramientas interesantes para la predicción de series de tiempo aplicadas a mercados financieros. Aunque son herramientas versátiles, su uso en la predicción de series de tiempo financieras es difícil debido a la complejidad inherente de los datos, que incluyen cambios de comportamiento en el tiempo, mucho ruido en la información y alta dimensionalidad de la información, problemas que afectan el aprendizaje de los modelos, pero también un proceso muy importante y más descuidado del aprendizaje, la validación del modelo. En este estudio, se analizan los efectos que tienen los datos de validación en la predicción de retornos para los índices del DJIA, Nasdaq y S&P 500 usando redes convolucionales validadas en distintos fragmentos del conjunto de validación, separados a través de criterios de volatilidad en las mismas series. Los resultados demuestran que es posible mejorar la predicción y extracción de patrones usando más y mejores parámetros para los modelos, obtenidos a partir de datos de validación más específicos en vez de un solo conjunto idealmente diverso. El estudio es capaz de obtener las mejores predicciones dentro de un grupo de modelos de comparación, tanto en modelos teóricos como prácticos del procedimiento. Además, la metodología destaca la importancia de las iteraciones de entrenamiento utilizadas y del número de parámetros a optimizar mediante validación.
The ability of deep neural networks to extract patterns of nonlinear data makes them potentially suitable for time series forecasting. Although they are flexible tools, their performance is hindered by complex data such as stock returns. This is true not only for the training phase, which takes most of the researchers’ attention, but also for the validation process where hyperparameters are selected. In this paper, the effect of the validation set and its importance for parameter selection was studied by grouping together returns by their volatility, thus creating a set of k different models trained on the same training set, each one finely tuned towards a specific group of data. Experiments with convolutional networks on the DJIA, S&P 500 and Nasdaq indices show that the model parameter structure is highly dependent on validation data, creating models which better explain information similar to the validation data that generated them. In general, the more specific the validation sets are in terms of volatility, the better the models are at extracting patterns and at improving the forecast, providing the best model if the level of volatility is known.

Description

Keywords

MODELOS ESTADÍSTICOS, MODELO DE PREDICCIÓN, SERIES DE TIEMPO ANALISIS

Citation