El creador de la inteligencia artificial que derrotó al campeón mundial del Go, David Silver de DeepMind, habla de sus algoritmos como si fueran sus hijos, alabando su creatividad y siendo consciente de los retos que tienen por delante
Lo que David Silver inventó podría tener más capacidad de inventiva que él mismo.
Silver fue el investigador principal de AlphaGo, el programa informático que aprendió a jugar al famoso y complicado Go, un juego que en lugar de tener unas reglas claras se basa en la intuición. A través del análisis de cómo jugaban los humanos, la inteligencia artificial (IA) aprendió a jugar por si misma a un nivel con el que fue capaz de derrotar al campeón mundial (ver La nueva victoria de AlphaGo demuestra una inteligencia imbatible para los humanos).
Su siguiente creación fue AlphaZero, una IA que solo necesitó jugar contra sí misma para dominar el Go, el ajedrez y el Shogi (también conocido como el ajedrez chino). Gracias a millones de partidas de prueba, el algoritmo descubrió las estrategias que los humanos tardaron milenios en desarrollar (ver Alpha Zero, la inteligencia artificial "alienígena" que domina tres juegos distintos).
Dados estos espectaculares logros cabe preguntarse si la IA será capaz algún día de resolver problemas inasumibles para el cerebro humano. Para averiguarlo, hablé con Silver en su oficina de DeepMind en Londres (Reino Unido), que ahora propiedad de Alphabet.
Durante el famoso torneo en el que AlphaGo se enfrentó al que probablemente sea el mejor jugador de Go de todos los tiempos, el algoritmo realizó un movimiento tan brillante que, al principio, los observadores humanos pensaron que se trataba de un error. ¿Hubo creatividad en aquella jugada?
El movimiento "Move 37", como se hizo conocido, sorprendió a todos, incluida la comunidad de Go y nosotros, sus creadores. Fue una jugada ajena a la que se esperaría de cualquier jugador humano. Para mí este es un ejemplo de algo creativo.
Ya que AlphaZero no aprende de los humanos, ¿lo considera aún más creativo?
Si tenemos algo que aprende por sí mismo, está creando el conocimiento completamente desde cero, es casi la esencia de la creatividad.
AlphaZero tiene que darse cuenta de todo por sí mismo. Cada paso da un salto creativo. Esos conocimientos son creativos porque no se los dio ningún humano. Y esos saltos continúan hasta que se convierten en algo que va más allá de nuestras capacidades y con potencial de sorprendernos.
AlphaZero jugó contra el mejor motor de ajedrez convencional, Stockfish. ¿Qué ha aprendido de él?
Stockfish tiene un motor de búsqueda muy sofisticado, pero en su núcleo hay un módulo que dice: "Según los humanos, esta es una buena posición o una mala posición". Por lo tanto, los humanos están dentro de sus circuitos. A Stockfish le resulta difícil separarse y comprender una posición fundamentalmente diferente.
AlphaZero aprende a entender las posiciones por sí mismo. Vimos una partida maravillosa en la que sacrificó cuatro peones seguidos y estuvo a punto de perder uno más. Stockfish pensaba que iba ganando, pero AlphaZero estaba realmente satisfecho con sus acciones. Había encontrado una manera de entender qué posiciones son imprescindibles de acuerdo con las normas del ajedrez. Sabe que es mejor tener una determinada posición que cuatro peones.
¿Cree que AlphaZero sugiere que la IA acabará desempeñando un papel en la futura innovación científica?
El aprendizaje automático ha estado dominado por un enfoque llamado aprendizaje supervisado. Eso significa que funciona con todo lo que los humanos saben y se intenta destilar en un programa informático que lo hace todo igual. Lo maravilloso de este nuevo enfoque, el aprendizaje reforzado, es que el sistema aprende por sí mismo, desde los primeros principios, cómo lograr el objetivo que se le marca. Es como un tener millón de mini descubrimientos, uno tras otro, que construyen esta forma creativa de pensar. Y si podemos hacer eso, podemos crear algo con un poder inmenso, una enorme capacidad para resolver problemas y que, esperemos, lleve a grandes avances.
¿Hay aspectos de la creatividad humana que no se pueden automatizar?
Si pensamos en las capacidades de la mente humana, todavía estamos muy lejos de lograrlo. Podemos obtener resultados en dominios especializados como el ajedrez y el Go dedicando una gran cantidad de potencia informática. Pero la mente humana es capaz de generalizar algo radicalmente diferente. Si se cambian las reglas del juego, un humano no necesita otros 2.000 años para descubrir cómo jugar.
Tal ver diría que la frontera actual de la IA, y hacia dónde nos gustaría ir, está en el aumento del alcance y de la flexibilidad de nuestros algoritmos para que descubran todo lo que la mente humana es capaz de hacer. Pero eso todavía está muy lejos.
¿Y cómo podríamos llegar allí?
Me gustaría conservar la idea de que el sistema es libre para crear sin estar limitado por el conocimiento humano.
Un bebé no se preocupa por su carrera ni por cuántos hijos tendrá. Juega con sus juguetes y aprende las habilidades de manipulación. Hay mucho que aprender sobre el mundo en ausencia de un objetivo final. Lo mismo se puede y debe aplicar a nuestros sistemas.