En lugar de usar fotos reales (y potencialmente sesgadas) para entrenar a una inteligencia artificial, un equipo ha utilizado imágenes de fractales generadas de forma automática. Su enfoque reduce el tiempo de entrenamiento y los posibles sesgos del contenido de internet, aunque se enfrenta a sus propios retos
La mayoría de los sistemas de reconocimiento de imágenes se entrenan mediante grandes bases de datos que contienen millones de fotos de objetos cotidianos, desde serpientes hasta batidos y zapatos. Mediante la exposición repetida, los modelos de inteligencia artificial (IA) aprenden a distinguir un tipo de objeto de otro.
Ahora, investigadores de Japón han demostrado que la IA puede aprender a reconocer los objetos cotidianos después de ser "entrenada" mediante fractales generados por ordenador. Es una idea extraña, pero podría ser importante. Generar datos de entrenamiento de forma automática es una tendencia interesante del aprendizaje automático. Y el uso de un suministro interminable de imágenes sintéticas frente a las fotos sacadas de internet evita los problemas de los conjuntos de datos existentes creados manualmente.
Problemas de entrenamiento: el entrenamiento previo es la fase en la que una IA aprende algunas habilidades básicas antes de ser entrenada con otros datos más especializados. Los modelos previamente entrenados permiten que más personas utilicen una IA potente. En vez de tener que entrenar un modelo desde cero, pueden adaptar a sus necesidades un modelo ya existente. Por ejemplo, un sistema para diagnosticar exploraciones médicas podría aprender primero a identificar algunas características visuales básicas, como la forma y el contorno, al ser previamente entrenado en una base de datos de objetos cotidianos, como ImageNet, que contiene más de 14 millones de fotos. Luego, se adaptará a una base de datos más pequeña de imágenes médicas para que aprenda a reconocer signos sutiles de enfermedad.
El problema consiste en que la creación manual de un conjunto de datos como ImageNet requiere mucho tiempo y esfuerzo. Las imágenes las suelen etiquetar los trabajadores colaborativos cuyos salarios son muy bajos. Los conjuntos de datos también pueden contener etiquetas sexistas o racistas que sesgan un modelo de manera oculta, así como imágenes de personas que han sido incluidas sin su consentimiento. Hay evidencia de que estos sesgos pueden infiltrarse incluso en el entrenamiento previo.
Formas naturales: se pueden encontrar patrones fractales en todo, desde los árboles y las flores hasta nubes y olas. Por eso, el equipo del Instituto Nacional de Ciencia y Tecnología Industrial Avanzada (AIST) de Japón, el Instituto de Tecnología de Tokio y la Universidad Denki de Tokio (todos en Japón) quiso investigar si estos patrones se podrían usar para enseñar a un sistema automatizado los conceptos básicos del reconocimiento de imágenes, en vez de usar fotos de objetos reales.
Los investigadores crearon FractalDB, un sinfín de fractales generados por ordenador. Algunos se parecen a hojas; otros a copos de nieve o caracoles. Cada grupo de patrones similares recibió automáticamente una etiqueta. Luego usaron FractalDB para el entrenamiento previo de una red neuronal convolucional (un tipo de modelo de aprendizaje profundo comúnmente utilizado en los sistemas de reconocimiento de imágenes) antes de completar su entrenamiento con un conjunto de imágenes reales. Descubrieron que su enfoque funcionaba casi tan bien como los modelos entrenados en los conjuntos de datos de última generación, incluidos ImageNet y Places, que contiene 2,5 millones de imágenes de escenas al aire libre.
¿Funciona? El investigador de la Universidad de Auburn en Alabama (EE. UU.) Anh Nguyen, que no participó en el estudio, no está convencido de que FractalDB sea tan compatible con ImageNet. Nguyen ha estudiado cómo los patrones abstractos pueden confundir los sistemas de reconocimiento de imágenes. "Existe una conexión entre este trabajo y los ejemplos que engañan a las máquinas", asegura. Nguyen quiere explorar con más detalle cómo funciona este nuevo método. Pero los investigadores japoneses piensan que al ajustar su enfoque, los conjuntos de datos generados por ordenador como FractalDB podrían sustituir los existentes.
Por qué fractales: los investigadores también intentaron entrenar su IA utilizando otras imágenes abstractas, incluidas las generadas mediante la función matemática Ruido Perlin, que crea patrones moteados, y mediante curvas de Bezier, que se usan en el diseño gráfico. Pero los fractales dieron los mejores resultados. "La geometría fractal existe en el conocimiento básico del mundo", concluye el autor principal Hirokatsu Kataoka del AIST.