.

BAIDU

Inteligencia Artificial

Baidu planta cara a OpenAI con el lanzamiento de su propio ChatGPT

1

El CEO de Baidu confesó que Ernie Bot no es perfecto, pero "afectará a todas las empresas"

  • por Zeyi Yang | traducido por
  • 20 Marzo, 2023

El pasado jueves, Robin Li, cofundador y CEO de Baidu, subió al escenario en Pekín para enseñar a Ernie Bot, el nuevo gran modelo lingüístico de la empresa. Acompañado de imágenes creadas por la inteligencia artificial (IA) de Baidu, también mostró ejemplos de lo que puede hacer este chatbot, como resolver preguntas de matemáticas, escribir textos de marketing, responder preguntas sobre literatura china y generar respuestas multimedia.

Desde Baidu llevaban meses planeando el lanzamiento de este producto para mediados de marzo. Pero han sido sorprendidos por el inesperado lanzamiento de GPT-4 de OpenAI hace unos días. Esto se convirtió en un punto de referencia para todos los que siguen de cerca las actividades de Baidu, incluido el propio CEO. "La gente espera comparar Ernie Bot con ChatGPT, o incluso con GPT-4. Es un listón muy alto", afirmó Li al principio de su presentación.

Ernie Bot significa Enhanced Representation from kNowledge IntEgration y su nombre chino es 文心一言, o Wenxin Yiyan (representación mejorada de la integración del conocimiento, en español). Como era de esperar, su rendimiento es bueno en tareas específicas de la cultura china, como explicar un hecho histórico o escribir un poema tradicional. Li afirma que, como empresa china, Baidu "debe tener un rendimiento mejor que cualquier LLM" en cuanto a comprensión del chino.

No obstante, lo más destacado del lanzamiento del producto fue la función de salida multimodal de Ernie Bot, que ChatGPT y GPT-4 no ofrecen. OpenAI ha presumido de la capacidad de GPT-4 para analizar una foto del contenido de un frigorífico y proponer sugerencias de recetas, pero el modelo solo es capaz de generar texto. Li mostró una interacción grabada con el robot donde generaba una ilustración de un sistema de transporte urbano futurista, utilizaba dialecto chino para leer en voz alta una respuesta textual y, además, editaba y subtitulaba un vídeo basado en ese mismo texto. Sin embargo, en pruebas posteriores al lanzamiento, una publicación china no consiguió reproducir la generación del vídeo.

El público chino ansía una alternativa a ChatGPT, y tanto OpenAI como el Gobierno chino han prohibido a los ciudadanos del país utilizar el chatbot estadounidense. Por el momento, Ernie Bot solo ha estado disponible para un grupo muy selecto de creadores chinos. Las empresas pueden solicitar acceso a la API (abreviatura de interfaz de programación de aplicaciones, en español). Pero Baidu no ha dicho si la tecnología estará disponible para los consumidores. Tampoco está claro cuándo se integrará el chatbot en otros productos de Baidu, como su motor de búsqueda o en los coches autónomos, tal y como prometió la empresa.

En comparación con las presentaciones de ChatGPT y GPT-4, la de Ernie Bot ha parecido precipitada. En la exhibición no ha habido demostración en directo, sino que se han utilizado cinco sesiones pregrabadas. Li también ha asegurado repetidamente que Ernie todavía es imperfecto y que mejorará cuando llegue a más usuarios. El precio de las acciones de Baidu cayó un 6,4% el jueves y las redes sociales están llenas de reacciones de decepción.

Li parecía preparado para esta respuesta. "La gente lleva tiempo preguntándome: ¿Por qué sacas [Ernie Bot] tan pronto? ¿Estáis preparados? Por lo que he visto al realizar pruebas internas con Ernie Bot, no es perfecto. Pero ¿por qué lo lanzamos hoy? Porque el mercado lo exige", reflexionó el CEO durante su presentación.

La carrera por ser el primero

Aunque empresas e investigadores chinos ya han lanzado bots parecidos a ChatGPT, ninguno de ellos ha tenido resultados satisfactorios. MOSS, un chatbot en inglés desarrollado por investigadores de la Universidad Fudan de Shanghái (China), tuvo una demanda tan alta que su servidor sufrió una avería al día siguiente de su lanzamiento a finales de febrero y todavía no funciona. MiniMax, una start-up china, lanzó a principios de marzo un chatbot llamado Inspo, pero se sospecha que solo reempaqueta el modelo GPT-3.5 desarrollado por OpenAI.

Muchos esperaban que Baidu fuera la primera empresa china en hacer frente a ChatGPT. Ya en el año 2019, Baidu lanzó un equivalente a GPT-3: Ernie 3.0. También lanzó un potente modelo de texto a imagen llamado Ernie-ViLG en 2022.

Pese a ello, la empresa cuenta con algunas ventajas que le permiten destacar entre sus homólogas chinas. Por ejemplo, ha diseñado su propio chip informático de IA, Kunlun, que se utilizó en el entrenamiento y funcionamiento de los modelos Ernie y podría proteger a la empresa de la creciente tensión entre EE UU y China en torno a los semiconductores. Además, ha creado un motor de búsqueda, una enciclopedia online, un foro de debate y una plataforma de publicación de medios de comunicación desde el año 2000. Es decir, Baidu puede acceder a material de formación en chino procedente de diversos recursos propios. Ernie Bot está entrenado con "billones de webs, decenas de miles de millones de datos de búsqueda e imágenes, cientos de miles de millones de datos de voz diarios y un gráfico de conocimiento de 550.000 millones de hechos", según el comunicado de prensa de Baidu.

En la presentación, Li comparó a Baidu con las grandes empresas tecnológicas occidentales. "Baidu es el primero de los gigantes tecnológicos internacionales en lanzar [una alternativa a ChatGPT desarrollada internamente]. Microsoft solo utiliza el acceso a OpenAI. Google, Meta, Amazon... ninguno de ellos ha lanzado un producto parecido y al mismo nivel", afirmó Li.

La inevitable comparación con GPT-4

Con el reciente lanzamiento de la GPT-4, la comparación no es de extrañar, pero es difícil hacerla, ya que ambas empresas se muestran reservadas en cuanto a los detalles técnicos de sus chatbots.

Al igual que OpenAI, Baidu también ha decidido no revelar cuántos parámetros tiene la última versión de Ernie. Y el número de parámetros de un modelo suele considerarse un indicador de su potencia. Aunque ya hay cifras disponibles para sus productos de última generación. Por ejemplo, GPT-3 de OpenAI, lanzado en junio de 2020, tenía 175.000 millones de parámetros, y Ernie 3.0 Titan de Baidu, lanzado en diciembre de 2021, tenía 260.000 millones de parámetros.

Aunque Ernie Bot no puede analizar imágenes como lo hace GPT-4, sí que ofrece más opciones de salida. En la presentación, el chatbot leyó la respuesta textual en sichuanés, un dialecto popular hablado en el suroeste de China. Li también aseguró que el modelo puede generar audio en otras variedades del chino, como el cantonés, el hokkien y el dialecto dongbei.

Tema aparte es la calidad de las respuestas. En una retransmisión en directo tras el lanzamiento, X.Pin, una publicación tecnológica china, formuló tanto a Ernie Bot como a GPT-4 las mismas preguntas en chino. La tecnología de Baidu pudo responder a la mayoría de cuestiones de forma coherente, pero cometió más errores. Le costó responder correctamente a preguntas de Trivial sobre la historia de China, recordar el contexto en el que se planteaban las preguntas y generar código para crear un minijuego. Los revisores tampoco pudieron probar la capacidad de generación de vídeo. Ernie Bot se negó a hacerlo, alegando que necesitaba tiempo para editar y procesar los datos.

Apresurándose para conseguir socios comerciales

A principios de la semana anterior, 'The Wall Street Journal' informó de que, para que Ernie Bot estuviera listo para el gran lanzamiento, Baidu pidió a sus empleados que trabajaran durante los días festivos, contrató a más personas para revisar las respuestas del bot y reunió recursos, como los chips informáticos A100 de Nvidia, de otros equipos de IA de la empresa.

Desde entonces, hubo otros indicios de que el chatbot no estaba listo para un despliegue generalizado. Baidu ya había dicho que Ernie se integraría en muchos de los productos de la empresa, incluidos los vehículos autónomos y su motor de búsqueda insignia. Sin embargo, en la presentación del producto no se incluía ninguna de esas aplicaciones, ni se explicaba cómo funcionaría esa integración.

Muchos participantes se han mostrado decepcionados por el hecho de que en el evento de presentación solo se utilizaran vídeos pregrabados de interacciones con el chatbot, vídeos que pueden filtrarse y editarse fácilmente. También se ha hablado de que muchas de las funciones multimodales mostradas el pasado jueves ya se pueden conseguir con las actuales herramientas de IA de Baidu, como la IA de creación de imágenes del año 2022 o una herramienta de edición de vídeo que lanzó en 2020, por lo que la innovación consiste en integrarlas en una interfaz más accesible.

Aunque Baidu lleva años desarrollando distintos modelos de IA, Ernie Bot parece más bien una forma de reunir las capacidades existentes de la empresa para que los usuarios empresariales las adopten más fácilmente.

Está claro que el objetivo principal de este evento de lanzamiento eran los clientes empresariales y no el público general. "Ernie Bot no solo afectará a los motores de búsqueda y a las empresas de Internet, lo hará a todas las empresas. Acortará la distancia entre cada empresa y sus clientes", vaticinó Li durante su presentación.

Antes del lanzamiento de Ernie Bot 650 empresas se habían inscrito para utilizar la tecnología y más de 30.000 han solicitado el acceso a la API desde el evento, según Baidu. De acuerdo con noticias anteriores, entre las empresas interesadas en utilizar el chatbot figuran Lenovo, fabricante de ordenadores, Trip.com, el portal de viajes, y varias compañías automovilísticas chinas. Por el momento, no hay indicios de cómo serán estas colaboraciones, pero es probable que sepamos más a medida que Baidu vaya desplegando su API en los próximos meses.

Inteligencia Artificial

 

La inteligencia artificial y los robots están transformando nuestra forma de trabajar y nuestro estilo de vida.

  1. Al habla con la IA: el reto de lograr voces más diversas e inclusivas

    La iniciativa Common Voice, de Mozilla, busca que las voces generadas por inteligencias artificiales sean más inclusivas y reflejen una mayor variedad de dialectos para asegurar que las particularidades de cada lugar y cultura se preserven frente al avance tecnológico

    La iniciativa Common Voice, de Mozilla, busca que las voces generadas por IA sean más inclusivas y diversas
  2. Estos robots aprendieron a superar obstáculos reales desde un entorno virtual gracias a la IA

    Un nuevo sistema podría ayudar a entrenar robots usando exclusivamente mundos generados mediante inteligencia artificial

  3. Por qué la IA podría comerle la tostada a la computación cuántica

    Los rápidos avances en la aplicación de la inteligencia artificial a las simulaciones físicas y químicas hacen que algunos se pregunten si de verdad necesitamos ordenadores cuánticos