Generación de series de tiempo financieras sintéticas para "data augmentation" usando redes neuronales generativas adversarias (GAN)
Аннотация
Los modelos GAN se han usado de forma exitosa para realizar aumento de datos en \nproblemas relacionados con imágenes, audio y video, pues logran representar \nadecuadamente las propiedades de los datos reales, pero incorporando suficiente \ndiversidad en los datos sintéticos generados como para poder mejorar el \ndesempeño de los modelos de machine learning y deep learning en las \nevaluaciones por fuera de muestra. Las series de tiempo financieras se requieren \npara la modelación y solución de problemas en finanzas, sin embargo, dada la \nescasez de datos históricos, no solo originados por problemas de recolección de \ndatos, sino también porque una serie de tiempo es solamente la realización de un \nproceso estocástico y por ende se presenta un sub muestreo. En este trabajo se \ngeneraron series de tiempo sintéticas usando DCGAN y cCGAN para generar datos \nde rendimientos, volúmenes, bid-ask spread, y precios con transformación \nfraccional, de acciones de Estados Unidos de América, con periodicidad diaria e \nintradiaria. Se pudo verificar que estos modelos GAN logran generar series \nsimuladas que representan adecuadamente las propiedades distribucionales de las \nseries históricas. Estas series sintéticas generadas pueden servir como insumo del \ntipo data augmentation en modelos de machine learning y deep learning para \nmejorar su desempeño con datos por fuera de muestra.
Перевод пока недоступен