La estrategia general de los coches sin conductor es lenta y difícil. Estas start-ups creen que sería más rápido apostar por la IA
Hace cuatro años, Alex Kendall, fundador y CEO de la empresa de coches sin conductor de Reino Unido Wayve, iba conduciendo un coche por una pequeña carretera de una zona rural británica cuando quitó las manos del volante. El coche, equipado con unas cámaras baratas y una enorme red neuronal, se desvió hacia un lado. Kendall agarró el volante durante unos segundos para corregirlo. El coche giró de nuevo y Kendall lo corrigió otra vez. El coche tardó menos de 20 minutos en aprender a seguir la carretera por sí solo, recuerda Kendall.
Fue la primera vez que se utilizó el aprendizaje reforzado [técnica de inteligencia artificial (IA) que entrena una red neuronal para realizar una tarea a través de prueba y error] para enseñar a un coche a conducir solo desde cero en una carretera real. Fue un pequeño paso en una nueva dirección que la última generación de start-ups cree que podría ser el avance que haga que los coches autónomos sean una realidad cotidiana.
El aprendizaje reforzado ha tenido un enorme éxito en la producción de programas informáticos capaces de jugar a videojuegos y al Go con una habilidad sobrehumana; hasta se ha utilizado para controlar un reactor de fusión nuclear. Pero se pensaba que conducir era demasiado complicado. "Se reían de nosotros", según confiesa Kendall.
Actualmente, Wayve entrena sus coches durante la hora punta en Londres. El año pasado, demostró que un coche entrenado en las calles de Londres se podía conducir en cinco ciudades diferentes: Cambridge, Coventry, Leeds, Liverpool y Manchester (todas en Reino Unido), sin entrenamiento adicional. Es algo que han tenido dificultades para lograr los líderes de este sector como Cruise y Waymo. Este mes, Wayve anunció que se asociará con Microsoft para entrenar su red neuronal en Azure, el superordenador en la nube del gigante tecnológico.
Los inversores han gastado más de 100.000 millones de dólares (95.386 millones de euros) en la construcción de coches capaces de conducirse solos. Eso es un tercio de lo que la NASA gastó en llevar a personas a la Luna. Sin embargo, a pesar de una década y media de desarrollo e incontables kilómetros de pruebas en carretera, la tecnología sin conductor está estancada en la fase piloto. "Estamos viendo que se invierten cantidades extraordinarias para obtener resultados muy limitados", admite Kendall.
Es por eso que Wayve y otras start-ups de vehículos autónomos como Waabi y Ghost, ambas en EE UU, y Autobrains, con sede en Israel, apuestan por la IA. Con la marca AV2.0, creen que una tecnología más inteligente y económica les permitirá superar a los líderes actuales del mercado.
Las máquinas exageradas
Wayve quiere ser la primera empresa en implementar los coches autónomos en 100 ciudades. Pero, ¿es eso aún más exagerado para una industria que se ha estado manteniendo con su propio suministro durante años?
"Hay demasiada exageración en este campo", advierte Raquel Urtasun, experta que durante cuatro años había sido directora del equipo de conducción autónoma de Uber de donde luego se fue para fundar Waabi en 2021. "También existe una falta de reconocimiento de lo difícil que resulta esta tarea en primer lugar. Pero no creo que la actual estrategia general para la conducción autónoma nos lleve a donde debemos estar para implementar la tecnología de manera segura".
Ese enfoque generalizado se remonta al menos a 2007 y al DARPA Urban Challenge, cuando seis equipos de investigadores lograron que sus vehículos robóticos navegaran por una maqueta de un pequeño pueblo en una base de la Fuerza Aérea de EE UU en desuso.
Waymo y Cruise se lanzaron gracias a ese éxito, y el enfoque de robótica adoptado por los equipos ganadores se mantuvo. Su estrategia trata la percepción, la toma de decisiones y el control del vehículo como problemas diferentes, con distintos módulos para cada uno. Pero esto puede hacer que el sistema en general sea difícil de construir y mantener, con errores en un módulo que pasan a otros, explica Urtasun. "Necesitamos la mentalidad de la IA, no la de robótica", señala la experta.
La nueva idea es la siguiente: en lugar de construir un sistema con múltiples redes neuronales conectadas manualmente, Wayve, Waabi y otras empresas están creando una gran red neuronal que descubre los detalles por sí misma. Si la IA tiene suficientes datos, aprenderá a convertir el input (los datos de las cámaras o del LIDAR sobre el camino por delante) en output (girar el volante o pisar el freno), como un niño que aprende a andar en bicicleta.
Pasar directamente del input al output se conoce como aprendizaje de extremo a extremo, y es lo que hizo GPT-3 para el procesamiento del lenguaje natural y AlphaZero para el Go y el ajedrez. "En los últimos 10 años esto ha causado que se resuelvan numerosos problemas aparentemente irresolubles", indica Kendall. "El aprendizaje de extremo a extremo nos empujó hacia las capacidades sobrehumanas. Conducir no será diferente".
Igual que Wayve, Waabi utiliza aprendizaje de extremo a extremo. Sin embargo, no usa (todavía) vehículos reales. Está desarrollando su IA casi por completo dentro de una simulación de conducción superrealista, controlada por un instructor de conducción de IA. Ghost también adopta un enfoque que da prioridad a la IA, utiliza una tecnología sin conductor que no solo circula por carreteras, sino que también aprende a reaccionar ante otros conductores.
200.000 pequeños problemas
Autobrains también apuesta por el enfoque de extremo a extremo, pero hace algo diferente con él. En lugar de entrenar una gran red neuronal que afronte todo lo que un coche pueda encontrar, la empresa está entrenando muchas redes más pequeñas (de hecho, cientos de miles) para que cada maneje un escenario muy específico.
"Estamos traduciendo el problema más difícil de los coches autónomos en cientos de miles de problemas más pequeños de IA", indica Igal Raichelgauz, CEO de la empresa. El uso de un modelo grande hace que el problema sea más complejo de lo que realmente es, explica el CEO: "Cuando conduzco, no intento entender cada píxel de la carretera. Se trata de sacar señales contextuales".
Autobrains toma los datos de los sensores de un coche y los pasa por una IA que encuentra la coincidencia de la situación con uno de los muchos escenarios posibles: la lluvia, el paso de peatones, el semáforo, la bicicleta girando a la derecha, un coche detrás, etc. Al analizar un millón de kilómetros de datos de conducción, Autobrains afirma que su IA ha identificado alrededor de 200.000 escenarios únicos, y la compañía está entrenando sus redes neuronales individuales para manejar cada uno de ellos.
Esta empresa se ha asociado con varios fabricantes de coches para probar su tecnología y acaba de crear una pequeña flota de vehículos propios.
Kendall cree que lo que hace Autobrains podría funcionar bien para sistemas avanzados de asistencia al conductor, pero no ve que tenga una ventaja sobre su propio enfoque. "Al abordar el problema completo de la conducción autónoma, yo esperaría que tuvieran la misma complejidad que con la que se encuentran en el mundo real", afirma.
El piloto automático
De todas formas, ¿deberíamos confiar en esta nueva ola de empresas que persiguen a las compañías líderes? Como era de esperar, Mo ElShenawy, vicepresidente ejecutivo de ingeniería de Cruise, no está convencido. "El estado del arte tal y como existe hoy en día no es suficiente para llevarnos a la etapa en la que se encuentra Cruise", señala.
Cruise es una de las empresas de coches autónomos más avanzadas del mundo. Desde noviembre del año pasado ha estado ofreciendo un servicio de robot-taxi en directo en San Francisco (EE UU). Sus vehículos operan en un área limitada, pero actualmente cualquiera puede pedir con la app Cruise un coche sin conductor que se parará junto a la acera. "Vemos una gran variedad de reacciones de nuestros clientes", resalta ElShenawy. "Es muy emocionante".
Cruise ha construido una gran fábrica virtual para respaldar su software, con cientos de ingenieros que trabajan en diferentes partes de la empresa. ElShenawy argumenta que el enfoque modular convencional es una ventaja porque le permite a la compañía intercambiar nuevas tecnologías a medida que surgen.
También descarta la idea de que el enfoque de Cruise no se generalice a otras ciudades. "Podríamos habernos lanzado hace años en un suburbio de algún lugar, y eso nos hubiera arrinconado", explica. "Fue deliberada la razón por la que elegimos un entorno urbano complejo, como San Francisco, donde hay cientos de miles de ciclistas y peatones y vehículos de emergencia y coches que cortan el paso. Nos obliga a construir algo que se pueda ampliar fácilmente".
Pero antes de que Cruise entre en una nueva ciudad, primero tiene que mapear sus calles con detalles a niveles centimétricos. La mayoría de las empresas de coches sin conductor utilizan este tipo de mapas 3D de alta definición ya que ofrecen información adicional al vehículo además de datos sin procesar de sensores que recibe sobre la marcha, que generalmente incluyen sugerencias como la ubicación de los bordes de los carriles y semáforos, o si hay bordillos en un tramo concreto de la calle.
Estos llamados mapas HD se crean combinando datos de carreteras recogidos por cámaras y LIDAR con imágenes satelitales. Cientos de millones de kilómetros de caminos han sido mapeados de esta manera en Estados Unidos, Europa y Asia. Pero el diseño de las carreteras cambia todos los días, lo que significa que la creación de mapas es un proceso interminable.
Muchas empresas de coches autónomos utilizan mapas HD creados y mantenidos por empresas especializadas, pero Cruise crea los suyos propios. "Podemos recrear ciudades enteras: condiciones de conducción, diseños de las calles y todo", asegura ElShenawy.
Esto le da a Cruise una ventaja frente a los principales rivales, pero los más recientes como Wayve y Autobrains han abandonado los mapas HD por completo. Los coches de Wayve tienen GPS, pero por lo demás aprenden a leer la carretera usando solo los datos de los sensores. Puede ser más difícil, pero significa que no están vinculados a una ubicación en particular.
Para Kendall, esta es la clave para el uso generalizado de coches autónomos. "Vamos a tardar más en llegar a nuestra primera ciudad", admite. "Pero cuando lleguemos a una ciudad, podremos escalar a todas partes".
Además de tanto debate, queda un largo camino por recorrer. Mientras que los robot-taxis de Cruise conducen a los clientes que pagan por sus servicios en San Francisco, Wayve, la empresa más avanzada de la nueva ola, aún tiene que probar sus coches sin conductor de seguridad. Waabi ni siquiera usa coches reales.
Aun así, estas nuevas compañías AV2.0 tienen la historia reciente de su lado: el aprendizaje de extremo a extremo reescribió las reglas de lo que es posible en la visión artificial y en el procesamiento del lenguaje natural. Así que esa confianza no está fuera de lugar. "Si todo el mundo va en la misma dirección y resulta equivocada, no vamos a resolver este problema", concluye Urtasun. "Necesitamos diversidad de enfoques, porque aún no hemos encontrado la solución".