La 'start-up' Waabi ha apostado por un nuevo enfoque de simulación digital para los coches autónomos, sin necesidad de vehículos físicos en entornos reales hasta casi el final del proceso. Este tipo de ensayos puede reducir los costes de las comprobaciones y hacerlas más fiables, pero queda por demostrar si bastarán para que estos automóviles se popularicen
Construir coches sin conductor es un negocio lento y costoso. Después de varios años de esfuerzo y miles de millones de euros de inversión, la tecnología aún está estancada en la fase piloto. Pero Raquel Urtasun cree que puede mejor esta situación.
El año pasado, frustrada por el ritmo de la industria, Urtasun dejó Uber, donde durante cuatro años dirigió la investigación de vehículos autónomos, para crear su propia empresa, llamada Waabi. Urtasun, que divide su tiempo entre el sector de los coches sin conductor y la Universidad de Toronto (Canadá), asegura: "En estos momentos, la mayoría de los enfoques relacionados con la conducción autónoma son demasiado lentos para progresar. Necesitamos otro enfoque radicalmente diferente".
Waabi acaba de desvelar el polémico nuevo atajo a los vehículos autónomos por el que apuesta Urtasun. ¿La gran idea? No usar los coches.
Durante los últimos seis meses, Waabi ha estado construyendo un entorno virtual superrealista, denominado Waabi World. En vez de entrenar a un conductor de inteligencia artificial (IA) en vehículos reales, Waabi planea hacerlo casi en su totalidad con la simulación. El plan es que la IA no se probará en vehículos reales ni en carreteras reales hasta una ronda final de ajustes.
El problema consiste en que, para que una IA aprenda a manejar el caos de las carreteras reales, debe estar expuesta a toda la variedad de acontecimientos que podría encontrar. Es por eso por lo que las empresas de coches sin conductor han pasado la última década conduciendo millones de kilómetros en las calles de todo el mundo. Algunas, como Cruise y Waymo, han empezado a probar vehículos sin conductores humanos en un puñado de entornos urbanos tranquilos en EE. UU. Pero el progreso sigue siendo lento. Urtasun pregunta: "¿Por qué no hemos visto una expansión de estos pequeños pilotos? ¿Por qué esos vehículos no están en todas partes?".
Urtasun hace afirmaciones audaces como jefa de una empresa que no solo no ha probado su tecnología sobre la carretera, sino que ni siquiera tiene vehículos. Pero al evitar la mayor parte de los costes de probar el software en las calles reales, Urtasun espera construir un conductor de IA de manera más rápida y económica que sus competidores, lo que le daría a todo ese sector un impulso muy necesario.
Conductores virtuales
Waabi no es la primera empresa en desarrollar mundos virtuales realistas para probar el software de conducción autónoma. En los últimos años, la simulación se ha convertido en un pilar para las empresas de coches sin conductor. Pero la pregunta es si la simulación por sí sola será suficiente para ayudar a esta industria a superar las barreras técnicas finales que han impedido que se convierta en una propuesta viable. "Nadie ha podido construir aún el Matrix para los coches autónomos", afirma el cofundador y director de tecnología de la start-up de vehículos autónomos Zoox (comprada por Amazon en 2020) Jesse Levinson.
De hecho, casi todas las empresas de vehículos autónomos utilizan actualmente la simulación de alguna forma. Aceleran así las pruebas, al exponer la IA a una variedad más amplia de escenarios que encontraría en las carreteras reales, y reduce los costes. Pero la mayoría de las empresas combinan la simulación con las pruebas del mundo real, y en general alternan entre las carreteras reales y virtuales.
Waabi World lleva el uso de la simulación a otro nivel. El mundo en sí es generado y controlado por IA, que actúa como instructor de conducción y director de escena, identificando las debilidades del conductor de IA y luego reorganizando el entorno virtual para ponerlas a prueba. Waabi World enseña a varios conductores de IA diferentes habilidades al mismo tiempo, antes de combinarlas en un solo conjunto de conocimientos. Todo ocurre continuamente y sin intervención humana, según Urtasun.
Situaciones raras
Las empresas de coches sin conductor utilizan la simulación para probar cómo las redes neuronales que controlan los vehículos manejan algunas situaciones raras (un mensajero en bicicleta que lo adelanta, un camión del color del cielo que bloquea el camino o un pollo que cruza la calle) y luego las modifican en consecuencia.
"Cuando pasa algo que ocurre rara vez, se necesitan miles de kilómetros de carretera para probarlo correctamente", explica uno de los responsables de la simulación en la empresa Cruise Sid Gandhi, que ha empezado a probar vehículos totalmente autónomos en un número limitado de carreteras en San Francisco (EE. UU.). Esto se debe a que las situaciones raras, o de larga cola, pueden ocurrir solo una vez entre mil. Gandhi destaca: "Mientras trabajamos para resolver la larga cola, dependeremos cada vez menos de las pruebas del mundo real".
Cada vez que Cruise actualiza su software, ejecuta cientos de miles de simulaciones para probarlo. Según Gandhi, la empresa generará miles de escenarios basados en situaciones específicas del mundo real con las que sus coches tienen problemas, modificando los detalles para cubrir una serie de posibles escenarios. También puede usar los datos de cámaras del mundo real de sus coches para que las simulaciones sean más realistas.
Luego, los ingenieros pueden modificar los diseños de las carreteras, intercambiar diferentes tipos de vehículos o cambiar la cantidad de peatones. Finalmente, utilizan sus propios algoritmos de conducción autónoma para controlar otros vehículos en la simulación, con el fin de que reaccionen de manera realista. Realizar las pruebas con este tipo de datos sintéticos es 180 veces más rápido y millones de euros más barato que usar los datos reales, resalta Gandhi.
Cruise también está experimentando con réplicas virtuales de ciudades estadounidenses distintas de San Francisco, según Gandhi, para probar su software de conducción autónoma en calles simuladas mucho antes de que sus coches reales salgan a la carretera en esos lugares.
Otras empresas están de acuerdo en que la simulación es una parte crucial de la capacitación y prueba de la IA para la conducción autónoma. "En muchos sentidos, la simulación es más útil que la conducción real", destaca Levinson.
Wayve, la empresa de vehículos autónomos con sede en Reino Unido, también alterna entre las pruebas en simulación y otras en carreteras reales. Ha estado probando sus coches en las calles concurridas de Londres (Reino Unido), pero con una persona en el vehículo en todo momento. La simulación no solo acelera el desarrollo de los vehículos autónomos al reducir el coste de las pruebas, sino que también puede hacer que estas sean más fiables, subraya el científico jefe de Wayve, Jamie Shotton. Esto se debe a que las simulaciones facilitan la repetición de pruebas muchas veces. "La clave para una simulación exitosa es trabajar continuamente para aumentar tanto su realismo como su diversidad", explica Shotton.
Aun así, Waabi supera a otros en lo lejos que afirma que puede llegar solo con la simulación. Al igual que Cruise, Waabi basa su mundo virtual en los datos tomados de los sensores reales, incluidos LIDAR y cámaras, que utiliza para crear réplicas digitales de los entornos del mundo real. Luego, Waabi simula los datos del sensor vistos por el conductor de IA, incluidos los reflejos en las superficies brillantes, que pueden confundir a las cámaras, y los gases de escape o la niebla, que pueden despistar el LIDAR, para que el mundo virtual sea lo más realista posible.
Pero el actor clave en Waabi World es su instructor de conducción, que es como un dios. Mientras el conductor de IA aprende a navegar por una variedad de entornos, otra IA aprende a detectar sus debilidades y genera escenarios específicos para ponerlas a prueba.
En efecto, Waabi World enfrenta a una IA contra otra, con el instructor aprendiendo qué hacer para que el conductor falle, lanzándole desafíos específicos, y el conductor aprendiendo cómo superarlos. A medida que la IA del conductor mejora, se vuelve más difícil encontrar casos en los que fallará, asegura Urtasun. "Habrá que exponerla a millones o quizás miles de millones de escenarios para encontrar sus defectos".
Urtasun cree que capacitar al conductor en una rica simulación imita mejor la forma en la que las personas aprenden nuevas habilidades. Señala: "Cada vez que experimentamos algo, reconfiguramos nuestro cerebro".
Entrenar a la IA en una simulación enfrentándola a sí misma o a otra, millones y millones de veces, se ha convertido en una técnica muy poderosa. Así es como DeepMind entrenó su IA a jugar go y Starcraft; también es como los bots de IA aprenden en los patios de juego virtuales como XLand de DeepMind y Hide & Seek o el escondite de OpenAI, que enseñan habilidades básicas pero generales a través de prueba y error.
Sin embargo, un inconveniente de dar rienda suelta a la IA en una simulación es que puede aprender a aprovechar las lagunas que no se ven en el mundo real. Los bots de Hide & Seek de OpenAI aprendieron a cooperar en equipos para esconderse o encontrar a otros. Pero también descubrieron fallos en la simulación que les permitieron desafiar las leyes de la física lanzándose al aire o empujando objetos a través de las paredes.
Waabi deberá asegurarse de que su simulación sea lo suficientemente precisa para evitar que su conductor de IA aprenda esos malos hábitos. Las redes neuronales siempre aprenderán a explotar las discrepancias entre el mundo virtual y el real, afirma Urtasun: "Saben hacer trampa".
Urtasun señala que la compañía ha desarrollado distintas maneras de medir las diferencias entre los entornos de conducción reales y virtuales y mantenerlas al mínimo posible. Todavía no quiere dar detalles sobre esta tecnología, pero indica que Waabi tiene planes de publicar su trabajo.
Hasta dónde puede llegar Waabi usando solo la simulación dependerá de lo realista que sea Waabi World. Levinson considera: "Las simulaciones van mejorando, así que hay cada vez menos cosas que se pueden aprender en la vida real y que no se pueden aprender en la simulación, pero creo que va a pasar mucho tiempo antes de que sean iguales del todo".
"Es importante mantener un equilibrio saludable entre la simulación y las pruebas del mundo real", opina Shotton. "La prueba definitiva para cualquier empresa de conducción autónoma es implementar su tecnología de forma segura en la carretera, con todas las complejidades del hardware real".
Urtasun está de acuerdo en principio. "Todavía hay una necesidad de realizar las pruebas en el mundo real", admite. "Pero muchísimo menor".
Pase lo que pase, Urtasun insiste en que el statu quo no puede continuar. Concluye: "Todo el mundo sigue haciendo lo mismo, aunque no hayamos resuelto el problema. Necesitamos algo que acelere el proceso. Tenemos que llegar hasta el final con esta nueva forma de pensar".