Libratus está disputando partidas simultáneas contra profesionales. Su victoria significaría que las máquinas han llegado a un nuevo nivel que podría ser aplicado a negocios de distintos sectores
Crédito: Oscar Bolton Green.
Como dijo una vez el gran Kenny Rogers, un buen jugador debe saber cuándo aguantar, y saber cuándo retirarse. En el Casino Rivers de Pittsburgh (EEUU) este mes, un programa informático llamado Libratus podría estar a punto de demostrar que los ordenadores pueden hacerlo mejor que cualquier jugador de cartas humano.
Libratus está disputando miles de partidas de póker Texas hold'em heads-up (para dos jugadores) sin límite contra varios profesionales del póker. A poco más de la mitad de la competición, que dura 20 días, Libratus ya iba ganando por casi 750.000 euros a sus oponentes humanos. Así que la victoria, aunque aún no está garantizada, podría estar en las cartas.
La victoria de Libratus representaría un enorme logro para la inteligencia artificial. El póker requiere el razonamiento y una inteligencia que se ha demostrado difícil de imitar para las máquinas. Es fundamentalmente diferente a las damas, el ajedrez o Go, porque la mano de un oponente sigue oculta durante el juego. En este tipo de juegos de "informaciones imperfectas", resulta enormemente complicado averiguar la estrategia ideal dado cada enfoque posible que el oponente podría estar adoptando. Y la variedad Texas hold'em sin límite resulta especialmente desafiante, básicamente porque el oponente puede apostar cualquier cantidad.
"El póker ha sido uno de los juegos más difíciles de dominar para la inteligencia artificial (IA)", afirma el director científico de Baidu, Andrew Ng. "No existe ninguna jugada óptima, así que el jugador robótico debe actuar de forma aleatoria para sembrar la incertidumbre en su oponente sobre cuándo va de farol".
Libratus fue desarrollado por el profesor del departamento de informática de la Universidad de Carnegie Mellon (EEUU) Tuomas Sandholm y su alumno de posgrado Noam Brown. A Sandholm, que es experto en la teoría de juegos e inteligencia artificial, y emigró de Finlandia para realizar su doctorado, le resulta increíble que los humanos hayan superado a los ordenadores en los juegos durante tanto tiempo. El experto afirma: "Me alucina lo buenos que son estos profesionales. De todos los juegos que ha abordado la IA, [el póker] es el único donde no ha alcanzado un rendimiento superhumano".
Los investigadores de IA emplean la teoría de juegos, o la matemática de la toma de decisiones estratégicas, para encontrar la mejor estrategia frente varias incertidumbres, conocida como equilibrio. Puesto que las posibilidades son tantas, la estrategia suele incluir alguna forma de aproximación.
"Si una acción es buena o no depende de cosas que no se pueden observar", señala el profesor de la Universidad Duke Vincent Conitzer, que enseña IA y teoría de juegos. El investigador señala: "Esto también obliga a ser impredecible. Si nunca vas de farol, no eres un buen jugador. Si siempre vas de farol, no eres un buen jugador. La teoría de juegos te dice cómo aleatorizar tu juego para que resulte óptimo".
El año pasado, Sandholm lideró el desarrollo de otro programa de póker, Claudico, que fue vencido rotundamente por varios jugadores profesionales de póker. Explica que Libratus emplea varios avances nuevos para lograr un nivel de juego tan alto. Estos incluyen una nueva técnica de aproximación por equilibrio, dice Sandholm, además de varios métodos nuevos para analizar posibles resultados a medida que las cartas se van revelando en fases posteriores del juego. Este análisis del juego final es muy exigente computacionalmente, y es realizado durante cada partida en el Centro de Supercomputación de Pittsburgh, unas instalaciones operadas conjuntamente por la Universidad de Carnegie Mellon y la Universidad de Pittsburgh.
Los avances del aprendizaje automático y la inteligencia artificial han permitido el nacimiento de varios programas de juegos de rendimiento superhumano. El año pasado, unos investigadores de DeepMind, una subsidiaria de Alphabet, desarrollaron un programa capaz de vencer a uno de los mejores jugadores de Go del mundo. Este logro fue tan espectacular porque Go es extremadamente complejo, y porque resulta difícil medir el progreso dentro del juego (ver Google logra que un ordenador gane al juego más complejo de la historia).
Varios grupos distintos de investigación intentan abordar el póker. Otro equipo académico de la Universidad de Alberta (Canadá), la Universidad Carlos y la Universidad Politécnica Checa (ambas en la República Checa) ha creado un programa llamado DeepStack que ya ha ganado a varios jugadores profesionales en la versión Texas hold'em heads-up sin límite (ver La "intuición" de la IA le apunta una nueva victoria contra los humanos: el póker). Pero Sandholm señala que los humanos que juegan contra Libratus son mucho más fuertes, y están disputando muchas más partidas contra la máquina, lo que debería proporcionar una mayor importancia estadística a los resultados.
Las técnicas empleadas para desarrollar un bot de póker más inteligente podría tener muchas aplicaciones en el mundo real. La teoría de juegos ya ha sido aplicada a las investigaciones para bloquear ataques y de ciberseguridad, a la dirección automatizada para los servicios de taxi y la planificación robótica, según Sam Ganzfried, que participó en el desarrollo de Claudico y ahora es profesor adjunto de la Universidad Internacional de Florida en Miami (EEUU).
Pero aunque Libratus se alce con la victoria, esto no echará a los humanos de la mesa de cartas. La versión multijugador de Texas hold'em sin límite no puede ser dominada mediante las técnicas que emplea Libratus.