.

Inteligencia Artificial

El aprendizaje automático se automatiza a sí mismo para que la IA llegue a todos los públicos

1

La gran barrera de la inteligencia artificial es lo difícil que resulta usarla y la falta de profesionales capaces de hacerlo. Por eso, cada vez más empresas intentan automatizar y simplificar los procesos para que sea tan fácil como trabajar en Excel, y los primeros ejemplos parecen bastante prometedores

  • por Will Knight | traducido por Maximiliano Corredor
  • 24 Octubre, 2017

La primera impresión que da Scot Barton no es la de un pionero de la inteligencia artificial (IA). No está construyendo automóviles autónomos ni enseñando a los ordenadores a machacar a los humanos en los juegos. Pero, como parte de su trabajo en Farmers Insurance, sí está despejando el camino de la tecnología.

Barton lidera un equipo que analiza datos para responder preguntas sobre el comportamiento de los clientes y el diseño de diferentes políticas. Su grupo usa todo tipo de técnicas de aprendizaje automático de vanguardia, desde redes neuronales profundas hasta árboles de decisión. Pero para conseguir hacer todo esto, Barton no contrató a un ejército de magos de la IA. En lugar de eso, su equipo utiliza una plataforma llamada DataRobot, que automatiza gran parte de las labores más difíciles que hacen falta para aplicar estar tecnologías.

El trabajo de la compañía de seguros con DataRobot sugiere cómo podría evolucionar la inteligencia artificial en los próximos años si se quiere aprovechar su enorme potencial. Más allá de demostraciones espectaculares, como AlphaGo, el software de juego de DeepMind, la IA podría revolucionar industrias enteras y hacer que todos los tipos de negocio sean más eficientes y productivos. Esto, a su vez, podría ayudar a rejuvenecer la economía al aumentar la productividad general. Pero, para que esto suceda, la tecnología necesitará ser mucho más fácil de usar.

El problema es que muchos de los pasos requeridos para usar las técnicas existentes de inteligencia artificial obligan a ser un experto en la materia. No es tan sencillo como construir una interfaz más amigable para el usuario, porque los ingenieros a menudo tienen que aplicar su juicio y conocimientos técnicos cuando elaboran y modifican sus códigos.

Pero los investigadores y empresas de inteligencia artificial están intentando solucionarlo con la misma tecnología como herramienta. Están utilizando el aprendizaje automático para automatizar los aspectos más complicados del desarrollo de algoritmos de inteligencia artificial. Algunos expertos incluso están construyendo el equivalente a sistemas operativos con tecnología de IA, diseñados para hacer que las aplicaciones de la tecnología sean tan accesibles como lo es Microsoft Excel en la actualidad.

DataRobot va justo en esa dirección. Se le introducen datos en bruto, sin procesar, y la plataforma los limpia y reformatea automáticamente. Luego ejecuta docenas de algoritmos distintos sobre ellos simultáneamente y analiza su rendimiento. Primero Barton intentó usar la plataforma para introducir un montón de datos de seguros para ver si podía predecir un valor específico en dólares. Comparado con un enfoque estadístico estándar, elaborado a mano, el modelo seleccionado tuvo una tasa de error un 20% menor. El responsable cuenta su experiencia: "Es muy original y funciona con solo presionar un botón; es bastante impresionante".

Brecha de talento en inteligencia artificial

La realidad de lo difícil que es aplicar técnicas de inteligencia artificial se puso de manifiesto en un informe de la consultora McKinsey publicado en junio de este año. Concluye que la inteligencia artificial, especialmente el aprendizaje automático, podría reestructurar las grandes industrias, incluida la de fabricación, las finanzas y la atención sanitaria, con el potencial de añadir más de 100.000 millones de euros a la economía de los Estados Unidos para el año 2025. Pero el informe tiene una salvedad importante: una escasez crítica profesionales cualificados.

Hay muchas razones para fomentar que la gente domine la inteligencia artificial (ver "La revolución del aprendizaje profundo en la inteligencia artificial ha sucedido demasiado rápido"). Pero hará falta su tiempo, y no todo el mundo puede convertirse en un maestro del campo. La mejor manera de maximizar el impacto de cualquier tecnología es que sea lo más accesible posible. Solo entonces podrá hacerse hueco en las oficinas y lugares de trabajo corrientes. DataRobot ya se está utilizando en alguna de esas situaciones.

Una tarde, la oficina de DataRobot está desierta, a excepción de un puñado de ingenieros arremolinados en torno a una gran pantalla. Cuando el consultor de la empresa Jonathan Dahlberg me hizo una demostración, me quedé impresionado por el servicio. Dahlberg cargó un conjunto público de datos de solicitudes de préstamos y pagos, y luego hizo que el sistema desarrollara un montón de modelos para ver si había patrones de por qué las personas no pagaban.

En pocos segundos, docenas de algoritmos alternativos aparecieron en la pantalla. En la parte superior se veía una técnica de aumento de gradiente relativamente poco llamativa pero ampliamente utilizada llamada XGBoost. Según ella, los ingresos de los solicitantes son especialmente importantes, pero también lo es la razón que dan para querer un préstamo. Resulta que las personas que mencionan "comenzar un negocio" en su solicitud son una apuesta especialmente mala.

DataRobot podría igualar la experiencia o habilidad de un científico de datos realmente bueno, dice Dahlberg, pero puede ofrecer una perspectiva más amplia. Una persona puede confiar demasiado en una determinada técnica, y DataRobot podría descubrir automáticamente un enfoque fundamentalmente mejor. Un usuario puede modificar manualmente el algoritmo mediante los lenguajes de programación Python o R. Sin un examen detallado, es difícil saber cómo de bien automatiza el sistema algunos de los aspectos más complicados de la ciencia de datos, como la limpieza de datos y la desarrollo de atributos, pero parece ocuparse de una cantidad sorprendente.

El director ejecutivo de la compañía, Jeremy Achin, tuvo la idea de fundar una empresa después de ver La red social, como admite un poco tímidamente cuando nos encontramos para tomar un café cerca del MIT (EEUU). Pero la idea concreta de DataRobot nació mientras participaba en competiciones de ciencia de datos en la plataforma colaborativa Kaggle, que fue adquirida por Google este mismo año. Kaggle ofrece premios para el algoritmo que tenga el mejor rendimiento a la hora de hacer una predicción específica a partir de un gran conjunto de datos. Esta tarea generalmente implica desarrollar un algoritmo de aprendizaje automático alimentado con los datos. Achin, que fue uno de los mejores concursantes iniciales de Kaggle, se dio cuenta de que ya estaba automatizando muchos de los pasos presentes en cada competición. El responsable recuerda: "Pensé que si reuníamos suficientes conjuntos de datos, suficientes problemas y realizábamos suficientes experimentos, podríamos hacer aprendizaje automático sobre el aprendizaje automático. Esa fue la idea original".

La idea claramente caló en los inversores. DataRobot, fundada en 2014, ha recaudado más de 85 millones de euros, de los que 46 millones de euros llegaron este marzo, más o menos a la vez que la compra de Kaggle. La empresa afirma que ya más de 100 clientes. Achin explica que su idea no gusta tanto a los científicos de datos, quienes se debaten entre los que creen que sus habilidades no pueden automatizarse y los que se preocupan por que lo sean. Pero él cree que la mayoría de las empresas interesadas en utilizar servicios de inteligencia artificial no tendrán otra opción. Achin afirma: "No me importa cuántas personas cambien su cargo a 'científico de datos' en LinkedIn. No se va a mover la aguja".

Sistemas que se enseñan a si mismos

La escasez de científicos de datos está haciendo que muchos se esfuercen por automatizar el trabajo. Cada vez aparecen más artículos de investigación sobre el uso de sus técnicas para automatizar más y más aspectos de la inteligencia artificial.

Google, uno de los actores más relevantes del sector, también está interesado en la idea. El gigante ya ha invertido enormes sumas en el desarrollo de potentes algoritmos de inteligencia artificial y en su implementación a través de sus servicios. Pero la compañía también quiere añadir más servicios de este tipo a su negocio en la nube. E ir más allá de las simples herramientas para la clasificación de imágenes o textos significará automatizar más el trabajo necesario para la formación de modelos de aprendizaje automático.

"El objetivo es hacer que esta tecnología sea más accesible. De modo que cualquiera pudiera decir: 'Constrúyeme un modelo predictivo' y se pusiera en marcha y lo hiciera", dice el ingeniero informático escocés John Giannandrea, que dirige los esfuerzos de inteligencia artificial de Google. Este mismo año la compañía anunció algunos avances significativos en esa dirección al demostrar una forma experimental de automatizar el proceso de ajuste de las redes neuronales de aprendizaje profundo (ver La inteligencia artificial roba empleo hasta a los expertos en inteligencia artificial). Estos quizás sean los algoritmos de aprendizaje automático más potentes que hay, y han mejorado significativamente el rendimiento en el reconocimiento de imagen y voz. Pero también son mucho más difíciles de diseñar. Giannandrea afirma que esta investigación está empezando a producir algunos resultados muy prometedores, en algunos casos igualando el rendimiento de los sistemas desarrollados a mano. Y espera que Google haga públicos más resultados en los próximos meses.

Pero hay planes incluso más ambiciosos. El profesor de la Universidad Carnegie Mellon (EEUU) Eric Xing, por ejemplo, está desarrollando lo que equivale a un sistema operativo construido a partir de diferentes componentes de aprendizaje automático. Este sistema operativo utiliza la virtualización y el aprendizaje automático para abstraer gran parte de la complejidad en el diseño y entrenamiento de la inteligencia artificial. Cuenta incluso con una interfaz de usuario gráfica que se puede utilizar para enseñar a un modelo de aprendizaje automático con un conjunto de datos particular.

Xing se educó en China y estudió en la Universidad de California en Berkeley (EEUU) junto a Andrew Ng, una personalidad ampliamente conocida ahora en el mundo de la inteligencia artificial. Es muy educado y se muestra sorprendentemente relajado sobre la idea de querer reinventar la forma en que las personas usan las computadoras. Xing aspira a que su sistema operativo sea tan fácil de usar como Excel, el paquete de hojas de cálculo de Microsoft. El esperto detalla: "Este es un problema central de la inteligencia artificial, la barrera de entrada es simplemente demasiado alta".

Xing ha fundado la empres Petuum para desarrollar su sistema operativo, y ya ha creado una serie de herramientas destinadas a llevar el aprendizaje automático a la medicina. "Los médicos quieren una interfaz y registros médicos, imágenes; cada cosa requiere un enfoque distinto de aprendizaje automático", dice. Petuum también se está preparando para lanzar su plataforma.

El sistema operativo de Petuum y otras herramientas para automatizar la inteligencia artificial se enfrentarán a unos desafíos particulares. Ya existe la preocupación de que los algoritmos de aprendizaje automático asimilen inadvertidamente los sesgos presentes en los datos de entrenamiento y algunos modelos son sencillamente demasiado opacos para ser examinados al detalle (ver El secreto más oscuro de la inteligencia artificial: ¿por qué hace lo que hace?). Si la inteligencia artificial se vuelve mucho más fácil de usar, es posible que estos problemas se masifiquen y arraiguen en la sociedad.

"Para hacer el aprendizaje automático realmente bien, necesitas un doctorado y unos cinco años de experiencia", critica el veterano investigador de Microsoft  Rich Caruana que lleva 20 años haciendo ciencia de datos. El experto detalla: "Hay muchos escollos. ¿Caduca tu algoritmo pasados seis meses y es interpretable?"

Caruana cree que debería ser posible automatizar algunas de las medidas que un científico de datos debe tomar para protegerse de tales problemas, algo similar a la lista de verificación previa al vuelo de un piloto. Pero advierte en contra de confiar demasiado en sistemas que prometen automatizarlo todo. El experto concluye: "Lo sé porque yo mismo me he encontrado estos problemas por el camino".

Inteligencia Artificial

 

La inteligencia artificial y los robots están transformando nuestra forma de trabajar y nuestro estilo de vida.

  1. El gobierno de EE UU pone bajo la lupa a las empresas de IA por publicidad engañosa

    La Comisión Federal de Comercio (FTC) de Estados Unidos ha tomado medidas contra varias empresas de IA por mentir y realizar publicidad engañosa, una lucha que continuará durante el próximo mandato de Donald Trump

    La Comisión Federal de Comercio (FTC) de Estados Unidos ha tomado medidas contra varias empresas de IA
  2. Las emisiones de la IA están a punto de dispararse aún más

    Las emisiones de los centros de datos se han triplicado desde 2018. A medida que modelos de IA más complejos como Sora de OpenAI comiencen a generalizarse, es probable que esas cifras se disparen

    Ordenador portátil echando humo
  3. La IA llega al campo de batalla para redefinir la toma de decisiones en la guerra moderna

    Anduril, fabricante de drones y misiles con IA, ha firmado un acuerdo con el Pentágono de EE UU para integrar sus sistemas en conflictos armados y optimizar la toma de decisiones, un aspecto que ya ha generado preocupación en organismos internacionales como Human Rights Watch

    La IA llega al campo de batalla