La 'start-up' SkyPhrase espera ayudarnos a encontrar respuestas a preguntas complejas más facilmente.
Algunas búsquedas en Internet son fáciles de imaginar y describir, pero complicadas de realizar. Si por ejemplo deseamos encontrar "un vuelo directo desde Las Vegas a San Diego la próxima semana en JetBlue", hay que rellenar un serie de campos en una web de viajes.
SkyPhrase, una start-up creada por Nick Cassimatis, profesor asociado del Instituto Politécnico Rensselaer (EE.UU.), ofrecerá en breve un software que permite a las empresas convertir preguntas en lenguaje natural como la anterior en un formato que puedan manejar sus bases de datos.
La nueva herramienta de búsqueda de Facebook, Graph Search, pone de relieve tanto el progreso que se está llevando a cabo en el procesamiento del lenguaje natural y las dificultades que siguen existiendo. A diferencia de las viejas barras de búsqueda, Graph Search permite a los usuarios hacer consultas tal y como las harían al hablar. Sin embargo, esto todavía está limitado a un rango relativamente pequeño de tipos de consulta.
Mientras que el procesamiento de lenguaje natural normalmente implica enseñar vocabulario y reglas gramaticales a un programa de software, o el uso de análisis estadístico, la tecnología de SkyPhrase usa una combinación de algoritmos y estructuras de datos.
La compañía planea lanzar un sitio web en febrero, así como una extensión para el navegador web Chrome, que permitiría a los usuarios de Google Analytics filtrar información mediante consultas en lenguaje natural.
Cassimatis señala que esto podría facilitar encontrar patrones o puntos de datos que de otra manera tardarían mucho tiempo en ser encontrados, incluso para un usuario experimentado. Con el tiempo, la compañía espera ofrecer SkyPhrase como interfaz de programación para otros sitios web.
La búsqueda en lenguaje natural podría facilitar que las personas con poca o ninguna formación hagan preguntas complicadas que normalmente requieren buscar a través de grandes volúmenes de datos. Además de los esfuerzos de Facebook, Wolfram Alpha puede responder consultas en lenguaje natural, y el asistente virtual de Apple, Siri, también anima a los usuarios a hacer preguntas en voz alta con oraciones completas (algunas de sus respuestas provienen de Wolfram Alpha).
Percy Liang, profesor asistente en el departamento de ciencias informáticas de Stanford (EE.UU.), dedicado a estudiar el procesamiento del lenguaje natural y el aprendizaje automático, cree que la idea de SkyPhrase es buena, pero advierte que hay mucho trabajo por hacer para que el procesamiento del lenguaje natural funcione. Señala que entre los desafíos está el poder determinar qué significa una palabra o frase en función de su contexto, como por ejemplo saber que Obama no es solo el nombre del presidente de EE.UU., sino también una ciudad en Japón, y la posibilidad de captar el sentimiento, como por ejemplo una crítica de un restaurante en Yelp que use el sarcasmo para decir algo como "después de solo una hora, por fin llegó la comida".
Los usuarios también necesitan saber qué pueden hacer con el sistema. Si se produce una gran diferencia entre las expectativas del usuario y las capacidades del sistema, el usuario acabará decepcionado, señala Liang. El servicio Graph Search de Facebook, por ejemplo, trata de resolver este problema autocompletando las consultas para que los usuarios sepan qué cosas puede buscar. Del mismo modo, Siri trata de responder solo una gama limitada de consultas.
SkyPhrase sigue estando claramente en su infancia. Probé una versión capaz de realizar búsquedas complejas en lenguaje natural en Twitter, Gmail, Orbitz y la tienda MP3 de Amazon. No pudo entender una serie de consultas (muchas veces porque traté de conseguir que hiciera cosas que aún no ha sido entrenado para hacer), pero no se le dio mal buscar en Gmail, o comprender algunas consultas complejas sobre correos electrónicos que tenía que encontrar a medida que organizaba uno de mis próximos viajes.
SkyPhrase entiende solo búsquedas de palabras completas (buscar simplemente 'banana' no abre ningún correo que mencione el juego Bananagrams) y no infiere el significado de las palabras (no encuentra mensajes o tuits con palabras relacionadas con las palabras que estás buscando). Sin embargo, puede entender conjunciones. Pude buscar, por ejemplo, "correos de Bob Loblaw en diciembre y enero sobre recetas con un PDF" o "correos electrónicos de Bob Loblaw o Tobias Funke sobre galletas en diciembre".
La compañía también está construyendo una interfaz de programación que, según Cassimatis, facilitará que terceros puedan ofrecer capacidades de búsqueda de lenguaje natural para sus propios servicios, lo que podría permitir a personas sin conocimientos de inteligencia artificial o lingüística realizar rápidamente análisis complejos de datos que normalmente llevarían mucho tiempo a un empleado especializado.
Cassimatis prevé que esta API se utilice para obtener información de una gran cantidad de fuentes, desde información financiera a resultados deportivos. En última instancia, podría también servir como fuente de ingresos si la compañía cobrara a los desarrolladores por su licencia.