Aunque al principio algunos trabajadores del sistema aprendieron a evadir impuestos, la inteligencia artificial fiscal ajustó los parámetros hasta dar con un modelo que maximizaba la productividad y reducía la brecha entre ricos y pobres. El algoritmo todavía es muy limitado, pero podría ayudar a legisladores y economistas
La desigualdad salarial es uno de los problemas más graves de la economía. Una de las herramientas más efectivas que los encargados de formular políticas pueden usar para abordarlo son los impuestos: los gobiernos recaudan dinero de las personas en función de sus ganancias y lo redistribuyen, ya sea directamente, a través de modelos de asistencia social o indirectamente, usándolo para pagar por los proyectos públicos. Pero, aunque una mayor imposición fiscal conduciría a una mayor igualdad, cobrar demasiados impuestos podría hacer que la gente pierda incentivos para trabajar o motivarlas a encontrar formas de evadirlo, lo que reduce la hucha total.
Encontrar el equilibrio no es fácil. Los economistas suelen basarse en suposiciones difíciles de comprobar. El comportamiento económico de las personas es complejo, y recoger datos al respecto es complicado. La investigación económica lleva décadas intentando diseñar la mejor política fiscal, pero el problema sigue abierto.
Los científicos de la empresa estadounidense de tecnología empresarial Salesforce creen que la inteligencia artificial (IA) podría ayudar. Un equipo dirigido por Richard Socher ha desarrollado un sistema llamado AI Economist que utiliza el aprendizaje reforzado, la misma técnica de inteligencia artificial de AlphaGo y AlpahZero de DeepMind. Su objetivo es identificar las políticas fiscales óptimas para una economía simulada. La herramienta sigue siendo relativamente simple (no hay forma de incluir todas las complejidades del mundo real ni del comportamiento humano), pero es un prometedor primer paso para analizar las políticas de una forma completamente nueva. "Sería increíble lograr que la política fiscal fuera menos política y más impulsada por los datos", destaca el miembro del equipo Alex Trott.
En un primer resultado, la IA encontró una política que, en términos de maximizar tanto la productividad como la igualdad salarial, fue un 16 % más justa que un moderno marco fiscal progresivo estudiado por los economistas universitarios. La mejora sobre la política actual de Estados Unidos fue aún mayor. El científico de la Universidad de Brandeis en Massachusetts (EE. UU.) Blake LeBaron, quien ha utilizado redes neuronales para modelar los mercados financieros, opina: "Creo que es una idea muy interesante".
En la simulación, cuatro trabajadores de IA están controlados por sus propios modelos de aprendizaje reforzado. Interactúan con un mundo bidimensional, recogen madera y piedra e intercambian estos recursos con los demás o los usan para construir casas, lo que les permite ganar dinero. Los trabajadores tienen diferentes niveles de habilidad, lo que los lleva a especializarse. Los trabajadores menos cualificados aprenden que les va mejor la recogida de recursos, y los más calificados se dan cuenta de que les va mejor si compran recursos para construir casas. Al final de cada año simulado, todos los trabajadores pagan una tasa de impuestos diseñada por un responsable de políticas controlado por otra IA, que funciona con su propio algoritmo de aprendizaje reforzado. El objetivo del formulador de políticas es aumentar tanto la productividad como los ingresos de todos los trabajadores. Las dos IA convergen en un comportamiento óptimo repitiendo la simulación millones de veces.
Ambos modelos de aprendizaje reforzado empiezan desde cero, sin conocimientos previos de la teoría económica, y aprenden a actuar mediante prueba y error, de la misma manera que las IA de DeepMind, sin intervención humana, consiguieron jugar a Go y StarCraft a niveles sobrehumanos.
¿Es posible aprender algo de solo cuatro trabajadores de IA? En teoría, sí, porque las interacciones simples entre un puñado de agentes no tardan en convertirse en comportamientos muy complejos. (Dada su elevada complejidad, Go sigue siendo un juego solo apto para solo dos jugadores, por ejemplo). Aun así, todos los participantes del proyecto están de acuerdo en que aumentar el número de trabajadores en la simulación será esencial para que la herramienta consiga modelar escenarios realistas.
Convertir el sistema en un juego
La doble IA es la clave. Las redes neuronales se habían utilizado previamente para controlar agentes en economías simuladas. Pero convertir al formulador de políticas en una IA crea un modelo en el que los trabajadores y los formuladores de políticas se adaptan continuamente a las acciones de los demás. Este entorno dinámico fue un desafío para los modelos de aprendizaje reforzado, ya que una estrategia aprendida con una política fiscal puede no funcionar igual de bien con otra. Pero también significaba que las IA encontraron formas de jugar con el sistema. Por ejemplo, algunos trabajadores artificiales aprendieron a evadir impuestos al reducir su productividad para entrar en un nivel fiscal más bajo y luego aumentarla de nuevo. El equipo de Salesforce cree que este proceso de pagar y recibir entre los trabajadores y formuladores de políticas conduce a una simulación más realista que cualquier otra lograda por los modelos anteriores, donde las políticas fiscales generalmente son fijas.
La política fiscal que ideó AI Economist resulta un tanto inusual. A diferencia de la mayoría de las políticas existentes, que son o progresivas (es decir, los que ganan más, pagan más) o regresivas (los que ganan más, pagan menos), la política de IA combinó algunos aspectos de ambas, aplicando las tasas impositivas más altas a los ricos y a los pobres y las más bajas a los trabajadores de ingresos medios. Al igual que muchas otras soluciones planteadas la IA, como algunos de los movimientos ganadores del juego de AlphaZero, el resultado parece contradictorio y no es algo que un ser humano habría ideado. Pero su impacto en la economía condujo a una brecha menor entre los ricos y pobres.
Para comprobar si la política fiscal generada por la IA influiría en el comportamiento humano de una manera similar, el equipo la probó en más de 100 trabajadores contratados a través del Mechanical Turk de Amazon, a quienes se les pidió que tomaran el control de los trabajadores en la simulación. Descubrieron que esa política alentaba a los humanos a jugar de la misma manera que las IA, sugiriendo, al menos en principio, que el AI Economist podría usarse para influir en la actividad económica real.
Ajustes continuos
Otra ventaja de una simulación impulsada por IA es poder ajustar los parámetros para explorar diferentes escenarios. Por ejemplo, sería posible modelar el impacto de una pandemia añadiendo restricciones como el alejamiento social y el acceso limitado a los recursos, o eliminando a las personas de la fuerza laboral. "Es difícil encontrar teorías tributarias óptimas basadas en el pasado cuando el futuro parece muy diferente", explica Socher.
La capacidad de la simulación para modelar el cambio es una gran ventaja, opina LeBaron: "Es bastante interesante ver a los trabajadores ajustarse al código tributario". Esto soluciona una de las grandes críticas de los existentes modelos impositivos en los que el comportamiento suele ser fijo, afirma.
La principal queja de LeBaron es el pequeño número de agentes a los que se limita la herramienta de momento. El experto señala: "Hay gente que defiende que se pueden obtener profundos conocimientos intelectuales con solo unos pocos agentes. Pero yo no soy una de esas personas". Por eso, le gustaría ver una simulación con alrededor de 100 trabajadores, que también es una cantidad objetivo del equipo de Salesforce.
Aun así, cree que la herramienta ya podría usarse para comprobar la validez de los modelos económicos existentes. Y señala: "Si yo fuera legislador, probaría este modelo para ver qué sugiere". Si AI Economist no coincide con los modelos existentes, podría ser una señal de que a dichos modelos les faltaba algo, sostiene.
El informático y economista de la Universidad de Harvard (EE. UU.) que colaboró con el equipo de Salesforce, David Parkes, también es optimista. Está de acuerdo en que deben aumentar bastante el número de agentes. Pero después de hacer eso y añadir a la simulación algunas características adicionales, como las empresas privadas, está seguro de que podrá replicar los resultados teóricos existentes. "Entonces, se volverá útil inmediatamente ", asegura.
Sin embargo, el economista de la Universidad de Oxford (Reino Unido) Doyne Farmer es más escéptico. Aunque le parece bien que se use aprendizaje reforzado en las teorías de juegos económicas, opina: "Se trata de si resulta posible investigar las políticas de la misma manera que AlphaZero juega a Go", y cree que pasará algún tiempo antes de que la herramienta sea realmente útil. "El mundo real es demasiado complicado", subraya.
El equipo sabe que tendrá que convencer a algunos economistas. Con ese fin, van a publicar su código para que otros investigadores puedan ejecutar sus propios modelos a través de él. A la larga, esta apertura también será una parte importante para conseguir que estas herramientas se vuelvan fiables, apunta Socher, y concluye: "Si se utiliza una IA para recomendar que ciertas personas tengan impuestos más bajos o más altos, será mejor poder explicar el porqué".