Computación
StarCraft se suma a la lista de videojuegos "perfectos" para lograr una inteligencia artificial más humana
La rapidez, dificultad e información imperfecta que caracterizan al popular videojuego lo convierten en la plataforma para probar nuevos algoritmos
Puede que haya que matar a un montón de Zergs, una de las razas del videojuego StarCraft, para aprender cómo podrían convivir mejor los seres humanos y los sistemas de inteligencia artificial (IA).
DeepMind -la filial de Alphabet centrada en IA- y la compañía de videojuegos Blizzard Entertainment están lanzando un conjunto de herramientas para permitir que los programadores puedan poner a prueba todo tipo de algoritmos de IA dentro del videojuego de temática espacial StarCraft.
El juego es más desafiante que la mayoría de los abordados por los programas de IA hasta la fecha. StarCraft no solo es extremadamente complejo, sino que también requiere una planificación muy anticipada y tratar de adivinar lo que el oponente está haciendo. Esto significa que desarrollar programas de IA capaces de igualar a los seres humanos debería ayudar a los investigadores a explorar nuevas facetas de una potencial inteligencia general de las máquinas. Otro beneficio potencial, según los involucrados, será la exploración de formas para que humanos y los agentes artificiales jueguen juntos.
"StarCraft es interesante por muchas razones", dice el investigador de DeepMind que dirige el proyecto, Oriol Vinyals. El hecho de que los jugadores a menudo solo puedan echar un vistazo a la actividad de sus oponentes, por ejemplo, significa que los algoritmos tendrán que desarrollar mejores formas de almacenar la información en la memoria. "La memoria es crítica", explica Vinyals. "Lo que ves ahora no es lo que viste hace un tiempo, y algo específico que puede haber ocurrido hace un minuto podría hacerte [querer] actuar de manera diferente".
DeepMind se ha labrado una reputación impresionante en lo que al desarrollo de programas de IA capaces de jugar -y mucho mejor que los humanos- diferentes juegos se refiere. La compañía primero dominó varios juegos de Atari y el año pasado se enfrentó al extremadamente complejo y abstracto juego de tablero Go (ver Google logra que un ordenador gane al juego más complejo de la historia).
Para dominar estos juegos los investigadores de DeepMind utilizaron una técnica de aprendizaje automático llamada aprendizaje reforzado. El aprendizaje automático permite a una computadora averiguar cómo hacer algo por sí misma, sin necesidad de instrucciones explícitas. El aprendizaje reforzado, que se inspira en la forma en que los animales parecen aprender, enseña a las máquinas a través de la experimentación y las recompensas positivas (ver 10 Tecnologías Emergentes 2017: Aprendizaje Reforzado). Sin embargo, Vinyals piensa que aplicar el aprendizaje reforzado con StarCraft será más difícil porque se tarda mucho en que cada partida avance. "Una acción que se tome ahora solo tiene consecuencias mucho más tarde", dice.
Dentro de StarCraft los jugadores compiten como una de las siguientes razas: los humanoides Terran, los cíborgs Protoss y los insectoides Zerg. Las batallas exigen decisiones estratégicas complejas como obtener recursos y construir bases a la vez que prolongadas secuencias de combate. StarCraft es también el deporte electrónico de espectadores más popular. En Corea del Sur, por ejemplo, los torneos se disputan a menudo en grandes estadios además de emitirse en directo por la televisión. Jugadores destacados han recibido de buen grado la posibilidad de competir contra programas de inteligencia artificial, pero DeepMind aún no ha dicho cuándo podría suceder esto (ver ¿Quién ganaría al 'StarCraft' en una batalla entre humanos y máquinas? Dos expertos opinan (muy distinto)).
Las herramientas desarrolladas por DeepMind y Blizzard facilitarán mucho implementar y probar algoritmos de aprendizaje automático en StarCraft. Las herramientas permiten que la IA tenga la misma visión del juego e interfaz que los jugadores humanos. También permiten limitar la velocidad con la que un programa puede ejecutar sus acciones, de modo que el algoritmo esté obligado a contar con las mismas capacidades intelectuales que una persona.
Aunque StarCraft se utiliza como plataforma de investigación desde hace tiempo, siempre ha sido relativamente difícil de aprovechar al máximo. El propio Vinyals, un jugador experto de StarCraft, ya hizo un trabajo pionero para programar robots en StarCraft durante su etapa de estudiante en la Universidad de California, Berkeley (EEUU; ver 35 Innovadores Menores de 35, 2016: Oriol Vinyals). Equipos de Facebook y la empresa china Alibaba también han publicado trabajos de investigación relacionados con StarCraft. DeepMind, por su parte, espera dar a conocer la experiencia de sus algoritmos dentro del juego en breves.
Sin embargo, es posible que se necesiten enfoques muy diferentes para llegar a dominar un juego como StarCraft. Otros investigadores han tenido éxito con interpretaciones de la teoría de juegos para lograr avances en otros juegos de información imperfecta en los que los faroles son importantes. A principios de este año, el profesor de la Universidad Carnegie Mellon (EEUU) Tuomas Sandholm y su estudiante Noam Brown crearon un programa llamado Libratus, el cual batió a varios jugadores profesionales en partidas de póker Texas hold'em. Para ello, Libratus empleó un algoritmo muy sofisticado que calculaba y recalculaba la estrategia óptima a lo largo de la partida (ver La importancia (y dificultad) de que una máquina juegue al póker mejor que nosotros). Y, casualidad, Brown ha realizado una estancia de investigación en DeepMind este verano.
El ingeniero principal de Blizzard Jacob Repp explica que su empresa está interesada en ver si los agentes sofisticados de IA pueden hacer que el juego sea más interesante, ya sea al jugar contra personas humanas o colaborar con ellas. De hecho, ya se pueden crear agentes automáticos en el juego que sigan comandos programados. Repp piensa que sería interesante que esos agentes usaran el aprendizaje automático hasta cierto punto, algo que, explica, la compañía ya se plantea: "Pensamos que estas herramientas son muy útiles para el proceso de crear juegos y diseñar sus características y funciones".