Inteligencia Artificial
Redes neuronales para finanzas precisas y aprendizaje automático para hacerlo rápido
No se lee mucho sobre inteligencia artificial aplicada las finanzas. Tal vez sea porque aún intenta averiguar cuál es el mejor enfoque para él, o quizá porque quienes lo están usando no quieren que el resto del mundo les quite un trozo de su pastel
Foto: El gráfico muestra el margen de error de precio frente al tiempo de ejecución para distintas técnicas del aprendizaje automático.
Un área en la que el aprendizaje automático y las redes neuronales podrían tener un enorme impacto es en los mercados financieros. Este campo es rico en los dos factores claves para el éxito de las técnicas de aprendizaje automático: dispone de los recursos computacionales requeridos para operar potentes redes neuronales y tiene enormes conjuntos de datos etiquetados de los que pueden aprender.
Para los pioneros de este enfoque, la tecnología ya ofrece oportunidades y beneficios alcanzables, pero resulta difícil averiguar cuál es su impacto real en el mercado. Si las organizaciones financieras están experimentando con redes neuronales (y seguramente lo están haciendo), tal vez prefieren no enseñar sus cartas. Por tanto, hay mucho interés por obtener información sobre los desafíos a los que se enfrentan los analistas a la hora de aplicar redes neuronales a los datos bursátiles.
Aquí entran en escena los investigadores de la Universidad de Stanford en Palo Alto (EEUU) Swetava Ganguli y Jared Dunnmon, que se preguntan cuál es la eficacia de las diferentes técnicas de aprendizaje automático a la hora de predecir el futuro precio de los bonos. Para averiguarlo, han comparado técnicas bastante comunes de "aprendizaje poco profundo" con otras más exóticas basadas en redes neuronales. Y sus resultados dejan claras algunas ventajas de unas sobre otras.
Primero, un poco de contexto. Los bonos son una forma de deuda, una especie de pagaré, que puede venderse en un mercado abierto. Difieren de las acciones de varias maneras importantes. Las acciones son un reclamo sobre los futuros beneficios de una empresa, por lo que su valor está íntimamente vinculado con la rentabilidad de una empresa durante el futuro previsible. Por este motivo, el precio de las acciones se puede disparar si aumenta la rentabilidad de una empresa. También puede desplomarse si una empresa se mete en problemas.
Por su parte, los bonos suelen ser mucho menos volátiles. Son préstamos que los emisores prometen devolver con intereses en una fecha concreta. Su valor está determinado por la cantidad de dinero que tiene probabilidades de pagar durante su ciclo de vida, generalmente de tan solo varios años. Este plazo temporal limitado significa que su precio no suele dispararse ni desplomarse.
Aun así, su precio sí varía en función de factores como los cambios potenciales en los tipos de interés, el rendimiento de la empresa, la probabilidad de que la deuda sea saldada y el tiempo que falta antes de que el bono deba ser abonado, entre otros. Predecir este precio futuro representa una importante tarea de los agentes de bonos, y no resulta fácil.
Un importante problema es la falta de datos disponibles sobre precios. Los agentes de bolsa generalmente pueden ver ofertas, pujas y transacciones unos 15 minutos después de que se realicen. Pero los agentes de bonos están mucho menos servidos, según Ganguli y Dunnmon, porque "acceder a este tipo de datos sobre los bonos requiere un pago, el cual sólo ofrece información de subconjuntos relativamente pequeños frente al volumen total de las transacciones de bonos".
Y eso da paso a su curiosa situación. "Muchos precios de bonos son antiguos y no representan con precisión los acontecimientos recientes del mercado", afirman los investigadores.
Así que Ganguli y Dunnmon plantean una pregunta obvia: ¿podrían mejorar la predicción de su precio al minar datos que sí están disponibles?
Su enfoque emplea un conjunto de datos de precios de bonos y otras informaciones publicadas en la página web de modelos predictivos y conjuntos de datos en línea, Kaggle.com, por Breakthrough Securities en 2014. Este conjunto de datos consta de las últimas 10 transacciones de 750.000 bonos distintos, junto con un amplio abanico de otros parámetros para cada bono, como si su pago puede ser reclamado de manera anticipada, si una transacción representa una compraventa de cliente o una transacción entre agentes, un cálculo justo del precio basado en los riesgos asociados con el bono, y más.
Una importante tarea en este tipo de análisis consiste en determinar cuáles de los parámetros son útiles para predecir los precios futuros y cuáles no. Así que a primera vista, Ganguli y Dunnmon buscaron parámetros que estuviesen altamente correlacionados entre sí y por tanto revelaban una redundancia en el conjunto de datos. Una vez eliminaron las redundancias, probaron varias técnicas de minería de datos para averiguar su rapidez y precisión para predecir los precios futuros.
Las técnicas comparadas debían ser capaces de analizar los componentes principales para eliminar los parámetros redundantes, lo que dejó únicamente aquellas con un poder predictivo real: los modelos de aprendizaje generalizado, que es una forma poco profunda de aprendizaje automático; y el enfoque de redes neuronales, que pueden encontrar patrones en conjuntos de datos altamente no lineales y es considerado como una forma más profunda del aprendizaje automático.
No sorprende que las redes neuronales hayan generado las mejores predicciones, con estimaciones de futuros precios con un margen de error de unos 65 céntimos de euro. Para colocar eso en perspectiva, los bonos cuestan cerca de 1.000 euros. De forma interesante, aumentar la complejidad de las redes tiene relativamente poco efecto sobre su precisión.
Pero una predicción precisa sólo representa la mitad de la utilidad. En el mundo real también es necesario que los modelos predictivos trabajen rápido. Y aquí, las redes neuronales se quedan cortas puesto que necesitan varias horas para obrar su magia.
Por el contrario, el aprendizaje poco profundo logra predicciones con un margen de error de alrededor de unos 75 céntimos de euro, pero lo hace en cuestión de segundos. Ganguli y Dunnmon afirman que un sistema híbrido que las combine podría lograr predicciones con un margen de error de tan solo 78 céntimos de euro en tan solo cuatro segundos.
No resulta difícil imaginar qué sistema de predicción escogería un agente de bonos. Es un trabajo interesante que arroja algo de luz sobre el dilema al que deben de estarse enfrentando las instituciones financieras al aplicar técnicas de aprendizaje automático a datos financieros. Está claro que aún hay bastante margen para mejorar las predicciones, pero ¿podrá hacerse en un plazo temporal que sea relevante?
Tal vez la razón por la que hay tan pocos artículos sobre las increíbles ventajas de las redes neuronales para el mundo financiero sea que quienes ya las están usando no quieren destapar el pastel antes de haberse comido el mayor trozo posible. Desde luego, no sería la primera vez.
Pero existe otra posibilidad. Tal vez estén luchando por encontrar maneras de realizar este trabajo de manera eficiente en un plazo temporal significativo. En tal caso, el pastel seguiría intacto, a la hora de que alguien lo corte.
Ref: arxiv.org/abs/1705.01142: Machine Learning for Better Models for Predicting Bond Prices