A pesar de la caída en el número de clics, las disputas sobre derechos de autor y las respuestas a veces poco fiables, la IA podría abrir nuevas maneras de acceder y aprovechar todo el conocimiento disponible en internet
Todos entendemos lo que implica, en términos coloquiales, buscar algo en Google. Escribes unas palabras clave en la barra de búsqueda y obtienes una lista de enlaces azules con los resultados más relevantes. A veces aparecen resúmenes rápidos, mapas, marcadores deportivos o vídeos destacados. Sin embargo, en esencia, el objetivo es reunir información que ya está en internet y presentarla de forma organizada.
En la actualidad, las reglas del juego están cambiando: estamos ante un momento clave de transformación.
Estamos presenciando el mayor cambio en los motores de búsqueda desde la década de los 90. Las palabras clave y la selección de enlaces están quedando atrás. Hemos entrado en la era de la búsqueda conversacional. Esto significa que, en lugar de introducir palabras clave, formularás preguntas completas en lenguaje natural. En lugar de una lista de enlaces, recibirás respuestas elaboradas por inteligencia artificial generativa que estarán basadas en información actualizada de toda la web y serán presentadas de manera directa y comprensible.
Google, la empresa que ha liderado el ámbito de las búsquedas durante los últimos 25 años, está dando pasos para mantenerse a la vanguardia. En mayo de 2023 comenzó a probar un sistema de respuestas generadas por inteligencia artificial a las consultas de búsqueda. Utilizando su avanzado modelo de lenguaje (LLM), Google pretende ofrecer respuestas de manera resumida similar a como lo haría una fuente experta o un amigo de confianza. Esta función se ha llamado AI Overviews y, según Sundar Pichai, CEO de Google, representa "uno de los cambios más positivos que hemos introducido en las búsquedas en mucho, mucho tiempo", tal como señaló en una entrevista con MIT Technology Review.
Estos resúmenes generados por IA transforman por completo el tipo de consultas que Google puede responder. Ahora, puedes preguntar cosas como: "Me voy a Japón una semana el mes que viene. Estaré en Tokio, pero quiero hacer algunas excursiones de un día. ¿Hay algún festival cerca? ¿Cómo estará el surf en Kamakura? ¿Hay buenos conciertos?". Tras esto no solo recibirás un enlace a Reddit, sino una respuesta completa con información actualizada.
Además, ahora es posible realizar búsquedas que antes eran casi imposibles y obtener respuestas precisas. Ya no es necesario expresar con exactitud lo que buscas. Puedes describir el aspecto de un pájaro en tu jardín, el problema de tu frigorífico o el ruido extraño que hace tu coche, y recibir una explicación clara, casi como si fuera humana, basada en fuentes de internet. Es fascinante y, una vez te acostumbras a este tipo de búsquedas, resulta difícil dejarlas.
Esto no solo afecta a Google. ChatGPT, de OpenAI, ahora tiene acceso a internet y ofrece respuestas actualizadas a las preguntas. En septiembre de 2024, Microsoft implementó resultados de búsqueda generados por IA en Bing. Meta también cuenta con su propia versión. La start-up Perplexity sigue el mismo camino, pero con una filosofía de move fast and break things (en español, "muévete rápido y rompe cosas"). Estas empresas están compitiendo por billones de dólares y luchan por convertirse en la próxima gran fuente de búsqueda de información. Es decir, en el sucesor de Google.
No todo el mundo recibe este cambio con entusiasmo: los medios están muy preocupados. Este giro ha intensificado el temor a un futuro "sin clics", en el que el tráfico de referencia procedente de las búsquedas, un pilar fundamental de la web desde antes de la existencia de Google, desaparezca por completo.
El pasado mes de junio, al recibir una alerta push de Perplexity en mi teléfono, vislumbré el futuro que se avecina. Perplexity es una start-up que busca reinventar la búsqueda en internet. Además de ofrecer respuestas a las consultas recibidas, generará artículos enteros sobre las noticias del día, creados por la IA a partir de distintas fuentes.
Ese día, Perplexity me mostró una historia sobre una nueva empresa de drones de Eric Schmidt. Reconocí la noticia, porque Forbes la había publicado de forma exclusiva a principios de semana, aunque estaba bloqueada por su muro de pago. La imagen y el texto en Perplexity eran casi idénticos a los de Forbes. Era la misma historia, pero ahora accesible para cualquiera en internet. Tras esto, envié un mensaje a un amigo que había trabajado en el artículo original para preguntarle si Forbes había llegado a un acuerdo con la start-up para republicar su contenido, pero me dijo que no había ninguno. Esto me sorprendió, me enfadó y me dejó perplejo. No fui el único. Forbes, The New York Times y Condé Nast enviaron a la empresa órdenes de cese y desistimiento, y News Corp hasta la demandó por daños y perjuicios.
La gente está preocupada por lo que estos resultados, impulsados por grandes modelos de lenguaje, van a significar para nuestra visión de la realidad. Podría suponer el fin de las respuestas definitivas.
Esa exactamente la pesadilla que tanto temían los medios: la IA recoge sus contenidos premium, los reorganiza y los presenta sin necesidad de hacer clic en el artículo original. De hecho, en la sección "Acerca de" de Perplexity, la primera razón que se menciona para elegir su motor de búsqueda es "saltarse los enlaces".
No obstante, esto no solo afecta a los medios de comunicación.
La gente está preocupada por lo que estos resultados, impulsados por grandes modelos de lenguaje (LLM), van a significar para nuestra visión compartida de la realidad. Tienden a inventar información y, en ocasiones, a generar respuestas sin sentido. Además, la IA generativa puede ofrecer respuestas completamente distintas a la misma pregunta, o dar respuestas personalizadas según lo que sepa de cada persona. Esto podría poner fin a las respuestas definitivas.
Este es el futuro de las búsquedas. Pruébelo usted mismo durante un rato y lo comprobará
Siempre vamos a seguir utilizando los motores de búsqueda para navegar por la red y descubrir nuevas fuentes de información. Sin embargo, los enlaces están perdiendo protagonismo. La capacidad de la inteligencia artificial para ofrecer respuestas razonadas a casi cualquier tipo de pregunta, basándose en datos en tiempo real de toda la web, proporciona una experiencia superior. Esto es evidente si echamos un vistazo a la búsqueda en internet de los últimos años. Aunque no se puede decir que esté completamente rota (los datos muestran que cada vez más gente utiliza Google), lo cierto es que la búsqueda se ha vuelto más desordenada y cada vez es más difícil de gestionar.
¿Quién quiere tener que hablar el idioma de los motores de búsqueda para encontrar lo que necesita? ¿Quién desea navegar por enlaces cuando puede obtener respuestas directas? Y, quizás lo más importante: ¿quién quiere aprender cuando puede, simplemente, saber?
Al principio estaba Archie, el primer motor de búsqueda real en internet. Su función era rastrear archivos ocultos en servidores remotos. No decía lo que había en esos archivos, solo sus nombres. No ofrecía vistas previas de imágenes, ni organizaba los resultados de manera jerárquica, y su interfaz no destacaba por su diseño. No obstante, fue un comienzo y, para la época, funcionaba bastante bien.
Más tarde, Tim Berners-Lee creó la World Wide Web y empezaron a surgir todo tipo de páginas. The Mosaic, Internet Movie Database (IMDB), Geocities, memes como Hampster Dance, eBay, CNN, la web del Gobierno federal de los Estados Unidos e incluso la página de una persona en Turquía.
Al final, había tanta web que resultaba difícil saber por dónde empezar. Necesitábamos una forma más eficaz de encontrar lo que buscábamos
Así fue como, en 1994, Jerry Yang creó Yahoo, un directorio jerárquico de sitios web. Pronto se convirtió en la página de inicio de millones de personas. Y estaba… bueno, estaba bien. Mirándolo en retrospectiva, creo que todos pensábamos que era mucho mejor de lo que realmente era.
Internet seguía creciendo y expandiéndose, cada día con más información en línea. Ya no bastaba con una simple lista de sitios por categorías; necesitábamos algo que analizara y indexara todo ese contenido. A finales de los 90, eso significaba elegir entre varios motores de búsqueda: AltaVista, AlltheWeb, WebCrawler o HotBot. Eran buenos, una gran mejora. Al menos, al principio.
Con el auge de los motores de búsqueda llegaron también los primeros intentos de aprovechar su capacidad para generar tráfico. Un tráfico valioso y preciado del que dependían los medios para vender anuncios y los empresarios para atraer la atención hacia sus productos. A veces, esto implicaba llenar las páginas con palabras clave o texto sin sentido, diseñado únicamente para impulsar las páginas en los resultados de búsqueda. La situación se fue complicando.
Entonces llegó Google. Es difícil no exagerar lo revolucionario que fue su lanzamiento en 1998. En lugar de limitarse a escanear el contenido, analizaba las fuentes que enlazaban a un sitio web y esto ayudaba a evaluar su relevancia. En pocas palabras: cuanto más se citaba un sitio en otros lugares, más fiable lo consideraba Google, y más arriba lo posicionaba en los resultados. Este avance permitió que Google mejorara la relevancia de los resultados en comparación con todo lo que había antes. Fue asombroso.
Durante 25 años, Google dominó las búsquedas. Para la mayoría de la gente, Google era sinónimo de buscar en internet. De hecho, el gran alcance de ese dominio está siendo investigado actualmente en varias instancias judiciales, tanto en Estados Unidos como en la Unión Europea.
Sin embargo, como señala Pandu Nayak, científico jefe de Google de búsquedas, hace tiempo que su compañía dejó de limitarse a ofrecer solo una serie de enlaces azules
"No se trata solo de los resultados web, sino que también debemos tener en cuenta las imágenes, los vídeos y los contenidos especiales de las noticias. Hemos implementado respuestas directas, definiciones de diccionario, información sobre deportes, respuestas con Knowledge Graph, y fragmentos de texto destacados", explica Nayak, enumerando los diversos pasos que Google ha dado a lo largo de los años para ofrecer respuestas más directas.
Es cierto, Google ha evolucionado con el tiempo y se ha transformado en un portal de respuestas. Ha incorporado herramientas que permiten obtener directamente el resultado en vivo de eventos, como el de un partido, las horas de apertura de una cafetería o un fragmento de la página de la FDA, en lugar de redirigir a un sitio web donde podría encontrarse la información.
Sin embargo, cuando usas un poco AI Overviews, te das cuenta de que hay grandes diferencias.
Tomemos como ejemplo los fragmentos destacados, esos pasajes que Google a veces decide resaltar y mostrar por encima de los propios resultados. Esas palabras se extraen directamente de una fuente original. Lo mismo ocurre con los paneles de conocimiento, que se generan a partir de información almacenada en diversas bases de datos públicas y en el Knowledge Graph de Google, su base de datos que contiene billones de datos sobre el mundo
Aunque pueden ser inexactos, la fuente de la información se puede identificar. Está en una base de datos y se puede consultar, pero eso ya no es así: AI Overviews pueden ser completamente nuevos en cada ocasión, generados al instante por el texto predictivo de un modelo lingüístico combinado con un índice de la web.
"Creo que estamos en un momento emocionante, en el que hemos recopilado y organizado la información del mundo. Podemos comprenderlo de manera detallada gracias a herramientas como Knowledge Graph y estamos utilizando LLM e IA generativa para mejorar ese nivel de detalle", dijo Pichai a MIT Technology Review. "Ahora somos capaces de generar y componer a partir de todo eso", añade el CEO.
El resultado se asemeja menos a consultar una base de datos y más a preguntar a una persona muy inteligente y culta. Con la salvedad de que, a veces, se inventa cosas si no sabe la respuesta.
Esto será aún más relevante en un futuro donde las búsquedas vayan más allá de las consultas de texto. Por ejemplo, Google Lens, que permite tomar una foto o subir una imagen para obtener más información sobre algo, utiliza la inteligencia artificial para identificar lo que estás viendo. Google ha mostrado incluso la posibilidad de realizar consultas sobre vídeos en directo.
Cuando un modelo de IA no tiene una respuesta, genera una de todos modos. Para Google, esto podría ser un problema real. Para nosotros, podría resultar peligroso
"Sin duda, estamos al principio de un viaje en el que las personas podrán hacer preguntas mucho más complejas y obtener respuestas", afirma Pichai.
Existen algunos peligros reales. El primero y más importante: los grandes modelos lingüísticos pueden mentir. Alucinan. Se equivocan. Cuando no tienen una respuesta, un modelo de IA puede generar una, con total confianza. Para Google, que ha construido su reputación en los últimos 20 años basándose en la fiabilidad, esto podría ser un gran problema. Para nosotros, podría ser peligroso
En mayo de 2024, AI Overviews se lanzó en EE UU y las cosas no salieron bien. Google, que durante mucho tiempo ha sido una referencia en términos de búsqueda, acabó diciendo a sus usuarios cosas como que comieran piedras o que pusieran pegamento en la pizza. La mayoría de estas respuestas surgieron a partir de lo que la empresa denomina "consultas adversas". Es decir, aquellas diseñadas para hacer que el sistema falle. A pesar de eso, la situación no pintaba bien. La empresa se puso a trabajar para solucionar los problemas. Por ejemplo, eliminando contenido generado por usuarios en sitios como Reddit, de donde procedían algunas de las respuestas más extrañas.
Aunque errores como decir a la gente que comiera piedras acapararon toda la atención, el verdadero peligro puede surgir cuando se equivoca en algo menos evidente. Por ejemplo, al investigar para este artículo, pregunté a Google cuándo se lanzó MIT Technology Review. Me respondió que "MIT Technology Review se lanzó a finales de 2022". Para mí estaba claro que era incorrecto. Sin embargo, para alguien que no estuviera familiarizado con la publicación, ¿sería tan evidente el error?
He encontrado varios ejemplos de este tipo, tanto en Google como en la búsqueda de ChatGPT de OpenAI. Respuestas que están lo suficientemente alejadas de la realidad como para no ser consideradas erróneas de inmediato. Google confía en que podrá seguir mejorando estos resultados con el tiempo, basándose en lo que sabe sobre fuentes de calidad.
"Al crear AI Overviews, nos aseguramos de que la información y los resultados estuvieran respaldados por fuentes confiables. Estos son algunos de los mecanismos que hemos implementado para garantizar que, si decides quedarte solo con AI Overviews y no seguir buscando, recibas una respuesta fiable y precisa", explica Pandu Nayak.
En el caso anterior, la respuesta de 2022 parecía provenir de una fuente confiable: un artículo sobre lasnewsletters de MIT Technology Review, que se lanzaron ese año. No obstante, la máquina se equivocó. Esta es una de las razones por las que Google utiliza a personas (calificadores) para evaluar la precisión de los resultados. Las valoraciones no corrigen ni controlan a AI Overviews, sino que ayudan a entrenar el modelo para generar mejores respuestas. A pesar de ello, los humanos pueden cometer errores y Google también está trabajando en esto.
"Los evaluadores que examinan los experimentos pueden no darse cuenta de la alucinación porque parece algo natural", dice Nayak. "Así que hay que trabajar mucho en la preparación de las personas para asegurarse de que, cuando se produzca una alucinación, alguien pueda señalarla y decir: «Esto es un problema»", añade.
La nueva búsqueda
Google ha desplegado AI Overviews a más de mil millones de personas en más de 100 países, pero se enfrenta a advenedizos con nuevas ideas sobre cómo deben funcionar las búsquedas.
Motor de búsqueda
|
Para qué es bueno
|
Google
El gigante de las búsquedas ha añadido los resúmenes de IA a los resultados de búsqueda. Estos resúmenes toman información de toda la web y del Knowledge Graph de Google y utilizan el modelo de lenguaje Gemini de la empresa para crear respuestas a las consultas de búsqueda. |
Los resúmenes de IA de Google son excelentes para ofrecer un resumen fácil de digerir en respuesta incluso a las consultas más complejas, con cuadros de fuentes junto a las respuestas. Entre las principales opciones, su índice de web profunda parece el más «interno». Pero los editores web temen que sus resúmenes den a la gente pocas razones para hacer clic en el material de origen
|
Perplexity
Perplexity es un motor de búsqueda conversacional que utiliza grandes modelos lingüísticos de terceros, como OpenAI y Anthology para responder a las consultas. |
Perplexity es fantástico a la hora de profundizar en las respuestas a las consultas de los usuarios, produciendo respuestas que son como mini libros blancos sobre temas complejos. También es excelente resumiendo la actualidad. Pero tiene mala reputación entre los editores, que dicen que juega con sus contenidos a la ligera.
|
ChatGPT
Si Google introdujo la IA en las búsquedas, OpenAI lo ha hecho en ChatGPT. Las consultas que el modelo determina que se beneficiarán de una búsqueda en la web la activan automáticamente, o los usuarios pueden seleccionar manualmente la opción de añadir una búsqueda en la web. |
Gracias a su capacidad para preservar el contexto a lo largo de una conversación, ChatGPT funciona bien para realizar búsquedas que se benefician de preguntas de seguimiento, como la planificación de unas vacaciones a través de múltiples sesiones de búsqueda.
|
Cuando hablé con Pichai sobre este tema, se mostró optimista sobre la capacidad de la empresa para mantener la precisión incluso con el LLM generando respuestas. Esto se debe a que AI Overviews se basa en Gemini, el gran modelo lingüístico insignia de Google, pero también se nutre de Knowledge Graph y de lo que considera fuentes reputadas de la web.
"Siempre se trata de porcentajes. Lo que hemos hecho ha sido ofrecer lo que yo llamo unos cuantos 'nueves’ de confianza, veracidad y calidad. 99,59 puntos de porcentaje de confianza, diría yo. Creo que ese es el listón en el que nos movemos, y lo mismo ocurre con los resúmenes de IA", afirma. "La pregunta es si somos capaces de hacerlo a gran escala y yo creo que sí".
Pero hay otro peligro: la gente le pregunta a Google todo tipo de cosas raras. Si quieres conocer los secretos más oscuros de alguien, mira su historial de búsquedas. A veces las cosas que la gente pregunta a Google son extremadamente oscuras. A veces son ilegales. Google no sólo tiene que ser capaz de desplegar sus visiones generales de la IA cuando una respuesta pueda ser útil; tiene que ser extremadamente cuidadoso para no desplegarlas cuando una respuesta pueda ser perjudicial.
"Si vas y le dices '¿cómo construyo una bomba?' está bien que haya resultados en la web. Es la web abierta. Puedes acceder a cualquier cosa", dice Reid. "Pero no necesitamos tener una visión general de la IA que te diga cómo construir una bomba, ¿verdad? No creemos que merezca la pena".
Pero tal vez el mayor peligro -o el mayor desconocimiento- sea para cualquiera que se encuentre en una fase posterior a una búsqueda en Google. Por ejemplo, los editores, que durante décadas han dependido de las búsquedas para llegar a los usuarios. ¿Qué razón tendrán los usuarios para hacer clic en la fuente original si toda la información que buscan está ahí mismo, en el resultado de la búsqueda?
Rand Fishkin, cofundador de la empresa de estudios de mercado SparkToro, publica una investigación sobre las llamadas búsquedas sin clic. A medida que Google ha ido entrando cada vez más en el negocio de las respuestas, la proporción de búsquedas que terminan sin hacer clic ha ido subiendo y subiendo. Su sensación es que los resúmenes de IA van a disparar esta tendencia.
"Si dependes de Google para el tráfico, y ese tráfico es lo que impulsó tu negocio, estás en problemas a largo y corto plazo", dice.
"Que no cunda el pánico", es el mensaje de Pichai. Argumenta que, incluso en la era de los resúmenes de IA, la gente seguirá queriendo hacer clic y profundizar en muchos tipos de búsquedas. "El principio subyacente es que la gente viene buscando información. No buscan siempre una respuesta de Google", afirma. "A veces sí, pero la gran mayoría de las veces, lo están viendo como un punto de partida".
Reid, por su parte, sostiene que, dado que los resúmenes de IA permiten a la gente hacer preguntas más complicadas y profundizar más en lo que quieren, podrían incluso ser útiles para algunos tipos de editores y pequeñas empresas, especialmente las que operan en los nichos: "Esencialmente llegas a nuevas audiencias, porque ahora la gente puede expresar lo que quiere de forma más específica, y así alguien especializado no tiene que posicionarse para la consulta genérica".
"Voy a empezar con algo arriesgado", me dice Nick Turley desde los confines de una ventana de Zoom. Turley es el jefe de producto de ChatGPT, y está mostrando la nueva herramienta de búsqueda web de OpenAI unas semanas antes de su lanzamiento. "Normalmente debería probar esto antes, pero te voy a buscar a ti", dice. "Siempre es una demostración de alto riesgo, porque la gente tiende a ser exigente con lo que se dice de ellos en Internet".
Escribe mi nombre en un campo de búsqueda y el prototipo de motor de búsqueda le devuelve unas frases, casi como la biografía de un orador. Me identifica correctamente con función actual. Incluso destaca una historia que escribí hace años y que probablemente sea la más conocida. En resumen, es la respuesta correcta… ¿no?
Unas semanas después de nuestra llamada, OpenAI incorporó la búsqueda a ChatGPT, complementando las respuestas de su modelo lingüístico con información de toda la web. Si el modelo cree que una respuesta se beneficiaría de información actualizada, realizará automáticamente una búsqueda en la web (OpenAI no dice quiénes son sus socios de búsqueda) e incorporará esas respuestas a su respuesta, con enlaces hacia fuera por si quieres saber más. También puedes optar por obligarle manualmente a buscar en Internet si no lo hace por sí solo. OpenAI no revela cuántas personas utilizan su buscador web, pero afirma que unos 250 millones de personas utilizan ChatGPT semanalmente, todas ellas potencialmente expuestas a él.
"Hay una cantidad increíble de contenidos en la red. Suceden muchas cosas en tiempo real. Quieres que ChatGPT sea capaz de utilizar eso para mejorar sus respuestas y ser un mejor superasistente para ti".Kevin Weil, jefe de producto de OpenAI
Según Fishkin, estas nuevas formas de búsqueda asistida por IA aún no están desafiando el dominio de las búsquedas de Google. "No parece que esté canibalizando las formas clásicas de búsqueda web", asegura.
OpenAI insiste en que no trata de competir en el campo de las búsquedas, aunque a mí me parece un poco exagerado. Más bien, dice, la búsqueda en Internet es sobre todo un medio para obtener información más actual que los datos de sus modelos de entrenamiento, que tienden a tener fechas de corte específicas que a menudo son meses, o incluso un año o más, en el pasado. Como resultado, aunque ChatGPT puede ser genial para explicar cómo funciona un ataque de la Costa Oeste, durante mucho tiempo ha sido inútil para decirte cuál es la última puntuación de un equipo de la Liga de Fútbol Americano. Ahora ya no.
Me lo planteo desde la perspectiva de "¿Cómo podemos hacer que ChatGPT responda a todas las preguntas? ¿Cómo podemos hacer que te resulte más útil en tu día a día? Y ahí es donde entra la búsqueda para nosotros", me dice Kevin Weil, jefe de producto de OpenAI. "Hay una cantidad increíble de contenidos en la web. Suceden muchas cosas en tiempo real. Quieres que ChatGPT sea capaz de utilizar eso para mejorar sus respuestas y poder ser un mejor superasistente para ti."
En la actualidad, ChatGPT es capaz de generar respuestas para noticias muy actuales, así como información casi en tiempo real sobre asuntos como las cotizaciones bursátiles. Y aunque la interfaz de ChatGPT ha sido durante mucho tiempo, bueno, aburrida, los resultados de las búsquedas ofrecen todo tipo de contenidos multimedia: imágenes, gráficos e incluso vídeos. Es una experiencia muy diferente.
Weil también sostiene que ChatGPT tiene más libertad para innovar y seguir su propio camino que competidores como Google, incluso más que su socio Microsoft con Bing. Ambos son negocios que dependen de la publicidad. OpenAI no. (Al menos no todavía.) Obtiene ingresos de los desarrolladores, empresas y particulares que la utilizan directamente. En estos momentos, la mayor parte del dinero que mueve está en juego: según algunos informes, perderá 14.000 millones de dólares en 2026. Pero de lo que no tiene que preocuparse es de poner anuncios en sus resultados de búsqueda, como hace Google.
Al igual que Google, ChatGPT extrae información de los editores web, la resume y la incluye en sus respuestas. Pero también ha llegado a acuerdos financieros con los editores, a cambio de proporcionar la información que se incluye en sus resultados. (MIT Technology Review ha mantenido conversaciones con OpenAI, Google, Perplexity y otros, pero no ha llegado a ningún acuerdo. El departamento Editorial no ha participado ni ha sido informada del contenido de esas conversaciones).
Pero para que la búsqueda web consiga lo que OpenAI quiere (estar más actualizada que su modelo lingüístico), también tiene que obtener información de todo tipo de editores y fuentes con los que no tiene acuerdos. Varun Shetty, responsable de asociaciones con medios de comunicación de OpenAI, ha declarado a MIT Technology Review que no dará un trato preferente a sus socios editores.
En lugar de eso, según me dijo OpenAI, el propio modelo encuentra la fuente más fiable y útil para cualquier pregunta. Y eso también puede ser extraño. En el primer ejemplo que me mostró -cuando Turley realizó la búsqueda de nombres- describía una historia que escribí hace años para Wired sobre un hackeo. Esa historia sigue siendo una de las más leídas que he escrito. Pero ChatGPT no lo enlazó. En lugar de eso, enlazó a una breve reescritura de The Verge. Hay que reconocer que era sobre una versión prototipo de la búsqueda, lo que, como dijo Turley, era "arriesgado".
Cuando le pregunté al respecto, no supo explicarme por qué el modelo eligió las fuentes que eligió, porque el propio modelo realiza esa evaluación. La empresa ayuda a orientarlo identificando, a veces con la ayuda de los usuarios, lo que considera mejores respuestas, pero el modelo en realidad las selecciona.
“En muchos casos, se equivoca, por eso tenemos trabajo por hacer”, dijo Turley. “Tener un modelo en el circuito es un mecanismo muy, muy diferente a cómo funcionaba un motor de búsqueda en el pasado”.
¡Ya lo creo!
El modelo, ya sea el GPT-4o de OpenAI, el Gemini de Google o el Claude de Anthropic, puede explicar las cosas muy, muy bien. Pero la lógica que subyace a sus explicaciones, sus razones para seleccionar una fuente concreta e incluso el lenguaje que puede utilizar en una respuesta son bastante misteriosos. Claro que un modelo puede explicar muchas cosas, pero no cuando se trata de sus propias respuestas.
Fue hace casi una década, en 2016, cuando Pichai escribió que Google estaba pasando de "móvil primero" a "IA primero": En los próximos 10 años, pasaremos a un mundo que priorice la IA, un mundo en el que la informática se vuelva universalmente disponible (ya sea en casa, en el trabajo, en el auto o en movimiento) e interactuar con todas estas superficies se vuelva mucho más natural e intuitivo y, sobre todo, más inteligente”.
Ya estamos allí, más o menos. Y es un lugar extraño para estar. Y cada vez será más raro. Sobre todo, porque estas cosas que ahora consideramos distintas -consultar un motor de búsqueda, preguntar a una modelo, buscar una foto que hemos hecho, decidir qué queremos leer o ver o escuchar, pedir una foto que nos gustaría haber hecho y no hicimos, pero que nos gustaría ver- empiezan a fusionarse.
Los resultados de búsqueda que vemos gracias a la IA generativa se entienden mejor como un punto de ruta que como un destino. Lo más importante quizá no sea la búsqueda en sí misma, sino que la búsqueda ha proporcionado a los desarrolladores de modelos de IA una vía para incorporar información en tiempo real a sus entradas y salidas. Y eso abre todo tipo de posibilidades.
"Un ChatGPT capaz de entender y acceder a la web no se limitará a resumir resultados. Podría hacer cosas por ti. Y creo que ahí hay un futuro bastante emocionante", afirma Weil, de OpenAI. "Podemos imaginarnos que en el futuro el modelo nos reserve un vuelo, nos haga un pedido a DoorDash o simplemente realice tareas generales por nosotros. Una vez que el modelo entiende cómo usar Internet, el cielo es el límite".
Este es el futuro "agéntico" del que venimos oyendo hablar desde hace tiempo, y cuanto más utilicen los modelos de IA los datos en tiempo real de Internet, más cerca estaremos de él.
Supongamos que tiene un viaje dentro de unas semanas. Un agente capaz de obtener datos de Internet en tiempo real puede reservarle vuelos y habitaciones de hotel, hacer reservas para cenar, etc., basándose en lo que sabe de usted y de su próximo viaje, sin que usted tenga que guiarle. Otro agente podría, por ejemplo, vigilar la salida de aguas residuales de su casa en busca de determinadas enfermedades, y ordenar pruebas y tratamientos en respuesta. No tendrás que buscar ese ruido raro que hace tu coche, porque el agente de tu vehículo ya lo habrá hecho y concertado una cita para arreglar el problema.
"No siempre va a ser solo hacer búsquedas y dar respuestas", dice Pichai. "A veces serán acciones. A veces interactuará con el mundo real. Así que hay una noción de asistencia universal a través de todo".
Y las formas en que estos sistemas podrán ofrecer respuestas también están evolucionando rápidamente. Por ejemplo, hoy Google no sólo puede buscar texto, imágenes e incluso vídeo, sino que puede crearlos. Imagínate superponer esa capacidad a la búsqueda en toda una serie de formatos y dispositivos. "Muéstrame qué aspecto tiene una curruca de Townsend en el árbol que tengo delante". O "utiliza mis fotos y vídeos familiares para crear un tráiler de nuestras próximas vacaciones en Puerto Rico el año que viene, asegurándote de que visitamos los mejores restaurantes y los lugares más emblemáticos".
"Lo hemos hecho sobre todo en el lado de la entrada", dice, refiriéndose a las formas en que Google puede ahora buscar una imagen o dentro de un vídeo. "Pero también se puede imaginar en el lado de salida".
Este es el tipo de futuro que Pichai dice estar deseando poner en línea. Google ya ha mostrado algo de lo que podría ser con NotebookLM, una herramienta que permite subir grandes cantidades de texto y convertirlo en un podcast. Imagina que este tipo de funcionalidad -la capacidad de tomar un tipo de entrada y convertirla en una variedad de salidas- transformará la forma en que interactuamos con la información.
En una demostración de una herramienta llamada Proyecto Astra este verano en su conferencia de desarrolladores, Google mostró una versión de este resultado, en la que las cámaras y micrófonos de los teléfonos y las gafas inteligentes entienden el contexto que te rodea -en línea y fuera de línea, auditivo y visual- y tienen la capacidad de recordar y responder de diversas maneras. Astra puede, por ejemplo, mirar un dibujo en bruto de un coche de carreras de Fórmula 1 y no sólo identificarlo, sino también explicar sus distintas partes y sus usos.
Pero puedes imaginarte que las cosas van un poco más allá (y lo harán). Supongamos que quiero ver un vídeo sobre cómo arreglar algo en mi moto. El vídeo no existe, pero la información sí. En teoría, la búsqueda generativa asistida por IA podría encontrar esa información en algún lugar de Internet (por ejemplo, en un manual de usuario enterrado en el sitio web de una empresa) y crear un vídeo que me mostrara exactamente cómo hacer lo que quiero, igual que podría explicármelo hoy con palabras.
Estos son los tipos de cosas que empiezan a suceder cuando se pone todo el compendio del conocimiento humano -conocimiento que previamente ha sido capturado en silos de lenguaje y formato; mapas y registros de empresas y SKUs de productos; audio y vídeo y bases de datos de números y libros antiguos e imágenes y, realmente, cualquier cosa jamás publicada, jamás rastreada, jamás registrada; cosas que suceden ahora mismo, en todas partes- y se introduce un modelo en todo eso. Un modelo que tal vez no pueda entender con precisión, pero que tiene la capacidad de reunir esa información, reorganizarla y devolverla de diferentes maneras, que esperamos sean útiles. Formas que un simple índice no podría.
Eso es lo que estamos a punto de conseguir y lo que estamos empezando a ver. Y cuando Google ponga esto en manos de mil millones de personas, muchas de las cuales interactuarán con una IA conversacional por primera vez, ¿qué significará? ¿Qué haremos de forma diferente? Todo está cambiando muy deprisa. ¡Esperen un poco…!