Skip to main content

La frustración de esperar a que las computadoras aprendieran cosas inspiró un mejor enfoque.

Creciendo en una zona rural de Vietnam, Quoc Le no tenía electricidad en casa. Pero vivía cerca de una biblioteca, donde leía compulsivamente sobre grandes inventos y soñaba con algún día sumarse a esa lista. Decidió alrededor de los 14 años que la humanidad se beneficiaría más de una máquina lo suficientemente inteligente como para ser inventora por sí misma—una idea que sigue siendo solo un sueño. Pero ese sueño lo encaminó a convertirse en pionero de un enfoque de inteligencia artificial que podría permitir que el software entienda el mundo más como lo hacen los humanos.

Esa tecnología surgió de la frustración que Le sintió en la Universidad Nacional de Australia y luego como candidato a doctorado en Stanford al aprender sobre el estado de la inteligencia artificial. El software de “aprendizaje automático” necesitaba a menudo mucha ayuda de humanos. Las personas debían etiquetar datos—por ejemplo, clasificando fotos con y sin rostros—antes de que el software pudiera aprender. Luego debían indicarle al software en qué características de los datos debía enfocarse, como las formas características de las narices. Ese trabajo minucioso no le atraía a Le. Aunque es sociable con otros humanos, es exigente con las máquinas. “Soy alguien sin mucha paciencia,” dice riendo.

Mientras estaba en Stanford, Le ideó una estrategia que permitiría al software aprender por sí mismo. Algunos académicos ya estaban obteniendo resultados prometedores (aunque muy lentos) con un método llamado deep learning o aprendizaje profundo, que utiliza redes de neuronas simuladas. Le vio cómo acelerar significativamente ese proceso—construyendo redes neuronales simuladas 100 veces más grandes, capaces de procesar miles de veces más datos. Era un enfoque lo suficientemente práctico como para atraer la atención de Google, que lo contrató para probarlo bajo la guía del investigador en IA Andrew Ng (ver “A Chinese Internet Giant Starts to Dream”).

Cuando los resultados de Ng se hicieron públicos en 2012, desataron una carrera en Facebook, Microsoft y otras empresas por invertir en investigación de aprendizaje profundo. Sin guía humana alguna, el sistema había aprendido a detectar gatos, personas y más de 3,000 objetos simplemente procesando 10 millones de imágenes de videos de YouTube. Demostró que las máquinas podían aprender sin asistencia laboriosa de humanos, y además alcanzar nuevos niveles de precisión.

Hoy en día, la técnica se utiliza en la búsqueda de imágenes y en el reconocimiento de voz de Google. La máquina ultrainteligente que Le imaginaba aún está lejos. Pero ver que sus ideas permiten que el software ayude a las personas en su vida diaria ya es bastante satisfactorio.