Computación
Un circuito analógico podría ofrecer una alternativa energéticamente eficiente a los chips digitales
El nuevo enfoque creativo podría conducir a un hardware de aprendizaje automático más eficiente desde el punto de vista energético
En una mesa de su laboratorio de la Universidad de Pensilvania (Filadelfia, Pensilvania, EE UU), el físico Sam Dillavou ha conectado una serie de placas de prueba mediante una red de cables de colores brillantes. Parece un proyecto casero de bricolaje electrónico, y no especialmente elegante. Pero este sencillo conjunto, que contiene 32 resistencias variables, puede aprender a clasificar datos como un modelo de aprendizaje automático.
Aunque su capacidad actual es rudimentaria, se espera que el prototipo ofrezca una alternativa de bajo consumo a los chips de unidades de procesamiento gráfico (GPU, por sus siglas en inglés), que consumen mucha energía y se utilizan ampliamente en el aprendizaje automático.
"Cada resistencia es simple y carece de sentido por sí sola", explica Dillavou. "Pero cuando las pones en una red, puedes entrenarlas para que hagan una gran variedad de cosas".
Una tarea que ha realizado el circuito: clasificar flores por propiedades como la longitud y la anchura de los pétalos. Cuando se le dieron estas medidas de flores, el circuito pudo clasificarlas en tres especies de iris. Este tipo de actividad se conoce como un problema de clasificación "lineal", porque cuando la información del iris se representa en un gráfico, los datos pueden dividirse limpiamente en las categorías correctas utilizando líneas rectas. En la práctica, los investigadores representaron las medidas de las flores como tensiones, que introdujeron como entrada en el circuito. El circuito producía entonces un voltaje de salida, que correspondía a una de las tres especies.
Se trata de una forma de codificar los datos radicalmente distinta a la utilizada en las GPU, que representan la información como 1 y 0 binarios. En este circuito, la información puede adoptar un voltaje máximo o mínimo, o cualquier valor intermedio. El circuito clasificó 120 iris con una precisión del 95%.
Ahora el equipo ha conseguido que el circuito realice un problema más complejo. En una prepublicación actualmente en revisión, los investigadores han demostrado que puede realizar una operación lógica conocida como XOR, en la que el circuito toma dos números binarios y determina si las entradas son iguales. Se trata de una tarea de clasificación "no lineal", dice Dillavou, y "las no linealidades son la salsa secreta detrás de todo aprendizaje automático".
Sus demostraciones son una tarea muy fácil para los dispositivos que usas a diario. Pero no se trata de eso: Dillavou y sus colegas construyeron este circuito como un esfuerzo exploratorio para encontrar mejores diseños informáticos. La industria informática se enfrenta a un reto existencial en su empeño por ofrecer máquinas cada vez más potentes. Entre 2012 y 2018, la potencia de cálculo necesaria para los modelos de IA de vanguardia se multiplicó por 300.000. Ahora, entrenar un gran modelo lingüístico requiere la misma cantidad de energía que el consumo anual de más de cien hogares estadounidenses. Dillavou espera que su diseño ofrezca un enfoque alternativo y más eficiente desde el punto de vista energético para construir una IA más rápida.
Entrenamiento por pares
Para realizar correctamente sus diversas tareas, el circuito requiere entrenamiento, al igual que los modelos de aprendizaje automático contemporáneos que se ejecutan en chips informáticos convencionales. ChatGPT, por ejemplo, aprendió a generar texto con sonido humano después de que se le mostraran muchos ejemplos de texto humano real; el circuito aprendió a predecir qué medidas correspondían a cada tipo de iris después de que se le mostraran medidas de flores etiquetadas con su especie.
Para entrenar el dispositivo, se utiliza un segundo circuito idéntico para "instruir" al primero. Ambos circuitos parten de los mismos valores de resistencia para cada una de sus 32 resistencias variables. Dillavou alimenta ambos circuitos con las mismas entradas —un voltaje correspondiente, por ejemplo, a la anchura de los pétalos— y ajusta el voltaje de salida del segundo circuito para que corresponda a la especie correcta. El primer circuito recibe información del segundo y ambos ajustan sus resistencias para converger en los mismos valores. El ciclo vuelve a empezar con una nueva entrada, hasta que los circuitos se han asentado en un conjunto de niveles de resistencia que producen la salida correcta para los ejemplos de entrenamiento. En esencia, el equipo entrena el dispositivo mediante un método conocido como aprendizaje supervisado, en el que un modelo de IA aprende de datos etiquetados para predecir las etiquetas de nuevos ejemplos.
Puede ser útil pensar en la corriente eléctrica del circuito como si fuera agua fluyendo por una red de tuberías, dice Dillavou. Las ecuaciones que rigen el flujo de fluidos son análogas a las que rigen el flujo de electrones y el voltaje. La tensión corresponde a la presión del fluido, mientras que la resistencia eléctrica corresponde al diámetro de la tubería. Durante el entrenamiento, las distintas "tuberías" de la red ajustan su diámetro en varias partes de la red para alcanzar la presión de salida deseada. De hecho, al principio, el equipo se planteó construir el circuito con tuberías de agua en lugar de con componentes electrónicos.
Para Dillavou, un aspecto fascinante del circuito es lo que llama su "aprendizaje emergente". En un ser humano, "cada neurona hace lo suyo", afirma. "Y entonces, como fenómeno emergente, aprendes. Tienes comportamientos. Andas en bicicleta". En el circuito ocurre algo parecido. Cada resistencia se ajusta según una regla sencilla, pero colectivamente "encuentran" la respuesta a una pregunta más complicada sin instrucciones explícitas.
Una ventaja energética potencial
El prototipo de Dillavou es un tipo de ordenador analógico, que codifica la información a lo largo de un continuo de valores en lugar de los 1 y 0 discretos de los circuitos digitales. Los primeros ordenadores eran analógicos, pero sus homólogos digitales los sustituyeron después de que los ingenieros desarrollaran técnicas de fabricación para introducir más transistores en los chips digitales con el fin de aumentar su velocidad. Aun así, los expertos saben desde hace tiempo que, a medida que aumentan su potencia de cálculo, los ordenadores analógicos ofrecen una mayor eficiencia energética que los digitales, afirma Aatmesh Shrivastava, ingeniero eléctrico de la Universidad Northeastern (Boston, Massachusetts, EE UU). "Las ventajas de la eficiencia energética no son discutibles", afirma. Sin embargo, añade, las señales analógicas son mucho más ruidosas que las digitales, lo que las hace poco adecuadas para cualquier tarea informática que requiera gran precisión.
En la práctica, el circuito de Dillavou aún no ha superado a los chips digitales en eficiencia energética. Su equipo calcula que su diseño consume entre 5 y 20 picojulios por resistencia para generar una única salida, donde cada resistencia representa un único parámetro de una red neuronal. Según Dillavou, esto supone una décima parte de la eficiencia de los chips de inteligencia artificial más avanzados. Pero la promesa del método analógico reside en ampliar el circuito para aumentar el número de resistencias y, por tanto, su potencia de cálculo.
Explica así el potencial de ahorro energético: los chips digitales como las GPU gastan energía por operación, por lo que fabricar un chip que pueda realizar más operaciones por segundo solo significa un chip que consume más energía por segundo. En cambio, el consumo energético de su ordenador analógico se basa en el tiempo que permanece encendido. Si hicieran su ordenador el doble de rápido, también sería el doble de eficiente energéticamente.
El circuito de Dillavou es también un tipo de ordenador neuromórfico, es decir, inspirado en el cerebro. Al igual que otros esquemas neuromórficos, el circuito de los investigadores no funciona según instrucciones descendentes como un ordenador convencional. En su lugar, las resistencias ajustan sus valores en respuesta a la retroalimentación externa en un enfoque ascendente, similar a cómo responden las neuronas a los estímulos. Además, el dispositivo no tiene un componente dedicado a la memoria. Esto podría suponer otra ventaja en términos de eficiencia energética, ya que un ordenador convencional gasta una cantidad considerable de energía transportando datos entre el procesador y la memoria.
Aunque los investigadores ya han construido diversas máquinas neuromórficas basadas en distintos materiales y diseños, los diseños tecnológicamente más maduros se basan en chips semiconductores. Un ejemplo es el ordenador neuromórfico Loihi 2 de Intel, al que la empresa empezó a dar acceso a investigadores gubernamentales, académicos e industriales en 2021. Este año está previsto que entre en funcionamiento DeepSouth, una máquina neuromórfica basada en chips de la Universidad del Oeste de Sídney (Australia) diseñada para poder simular a escala las sinapsis del cerebro humano.
El sector del aprendizaje automático también ha mostrado interés por la computación neuromórfica basada en chips, y en febrero una empresa emergente de San Francisco llamada Rain Neuromorphics recaudó 25 millones de dólares (unos 23,4 millones de euros). Sin embargo, los investigadores aún no han encontrado una aplicación comercial en la que la computación neuromórfica demuestre definitivamente una ventaja sobre los ordenadores convencionales. Mientras tanto, investigadores como el equipo de Dillavou proponen nuevos planes para impulsar este campo. Algunos miembros de la industria se han interesado por su circuito. "Lo que más les interesa es la eficiencia energética", afirma Dillavou.
Pero su diseño es aún un prototipo, y su ahorro energético no está confirmado. Para sus demostraciones, el equipo mantuvo el circuito en placas de prueba porque es "lo más fácil de trabajar y lo más rápido para cambiar cosas", dice Dillavou, pero el formato adolece de todo tipo de ineficiencias. Están probando su dispositivo en placas de circuito impreso para mejorar su eficiencia energética, y planean ampliar el diseño para que pueda realizar tareas más complicadas. Queda por ver si su ingeniosa idea puede arraigar fuera del laboratorio.