Aunque las máquinas ya superan a los humanos a la hora de reconocer elementos como un melanoma, algo tan simple como el musgo se les resistía. Gracias a esta investigación, estas plantas amorfas ya no podrán esconderse de los ojos de los robots
En los últimos años, los algoritmos de aprendizaje profundo han revolucionado la manera en la que las máquinas reconocen objetos. Los algoritmos de última generación superan con facilidad a los seres humanos a la hora de identificar cosas comunes como mesas, sillas, coches e incluso caras.
Pero estos algoritmos tienen un talón de Aquiles: hay algunas cosas que, sencillamente, no pueden reconocer. Por ejemplo, la visión artificial no es buena para reconocer elementos como el césped y la hierba, porque tienen estructuras amorfas difíciles de definir.
Una mesa generalmente tiene cuatro patas y una superficie plana, características que el aprendizaje automático es capaz de identificar bien. Por el contrario, pastos y hierbas de la misma especie pueden tener diferentes tamaños, números de hojas, semillas, etcétera, en función de las condiciones de crecimiento. Esto hace que para la visión artificial sea difícil reconocerlos, en particular si no están en flor.
Y a las máquinas también les cuesta mucho identificar árboles de imágenes aéreas y cosechas de imágenes por satélite. Por eso, es necesario un nuevo enfoque que permita entrenar a los algoritmos de aprendizaje profundo para que hagan su magia en objetos con forma ambigua. Y eso es lo que ha intentado el investigador de la Universidad de Kioto (Japón) Takeshi Ise. Junto a sus compañeros, han desarrollado una técnica sencilla que ayuda a las máquinas de aprendizaje profundo a reconocer plantas amorfas. Han puesto a prueba la nueva técnica enseñándola a reconocer diferentes tipos de musgo, una planta con una forma difícil de definir.
El equipo está en un buen lugar para estudiar el musgo, dado que el clima cálido y húmedo de Kioto promueve su crecimiento. Ise y su equipo comenzaron fotografiando musgo en un jardín japonés tradicional en Kioto, llamado Murin-An, donde se cultiva.
Identificaron tres tipos de musgo y fotografiaron cada uno individualmente, pero también tomaron fotografías en lugares donde aparecen todas las variedades, además de otras plantas y rasgos no musgosos. Cada imagen se tomó con una cámara digital, como la Olympus OM-D E-M5 Mark II, con una lente de 50 milímetros (o equivalente) desde una distancia de 60 centímetros directamente sobre de las alfombras de musgo. Estas imágenes tienen 4608 x 3456 píxeles.
El objetivo de su algoritmo de aprendizaje profundo es identificar los diferentes tipos de musgo en una sola imagen, así como distinguir el musgo de otros objetos y plantas.
Su método es sencillo. Para entrenar el algoritmo, el equipo divide cada imagen de un tipo de musgo específico en regiones mucho más pequeñas de 56 x 56 píxeles, con un 50% de superposición. De esta manera, la imagen original genera unas 90.000 imágenes, de las cuales el 80% se utiliza para entrenar el algoritmo y el resto para probarlo.
Aunque las imágenes de entrenamiento se tomaron de una alfombra uniforme de un musgo en concreto, estas secciones pueden contener pequeñas regiones de otros musgos. Así que el equipo examinó todos los archivos de entrenamiento y eliminó a mano las imágenes de musgos extraños. Esto dejó imágenes de tres tipos de planta: Polytrichum , Trachycystis y Hypnum, así como características no musgosas. Todas las imágenes de entrenamiento podían entonces ser etiquetadas como uno de estos tres tipos y utilizadas para el aprendizaje profundo.
Los resultados son impresionantes. Usando este método, el algoritmo rápidamente aprendió a reconocer cada tipo de musgo con buena precisión. Cuando los investigadores dejaron el algoritmo a su libre albedrío en una sola imagen que contenía varios tipos de musgo, fue capaz de identificarlos correctamente en diferentes áreas de la fotografía. "El modelo clasificó correctamente las imágenes de prueba con una precisión superior al 90%", indica la investigación.
El algoritmo funciona mejor para algunos tipos de musgo que para otros. "El rendimiento estimado para Polytrichum es del 99% [precisión de reconocimiento], Trachycystis del 95%, y Hipnum del 74%", detallan Ise y sus compañeros. La menor precisión de Hypnum se debe a que esta planta es más amorfa que las otras, con formas de crecimiento peor definidas. Por el contrario, Polytrichum tiene una forma distintiva y bien definida.
El equipo dice que hay varias formas de mejorar la precisión, como la construcción de un conjunto para entrenar formado por fotografías tomadas en diferentes épocas del año, cuando el musgo Hypnum, en particular, presenta una apariencia más diferenciada. Otra posibilidad es estandarizar el balance de blancos en la cámara digital para obtener una reproducción de color más precisa para cada musgo.
En cualquier caso, los resultados muestran una promesa muy significativa y esperanzadora para el futuro. La técnica podría aplicarse a imágenes aéreas para identificar mejor árboles y plantas en fotografías tomadas desde arriba. Eso sería verdaderamente útil para recopilar datos en el medio silvestre o en grandes áreas gestionadas como granjas y bosques.
Mientras tanto, Ise y sus compañeros cuentan que planean desarrollar una aplicación que permita a las personas identificar el musgo con un teléfono inteligente. Una idea que podría resultar popular para los jardineros.
Ref: arxiv.org/abs/1708.01986: Identifying 3 Moss Species By Deep Learning, Using The “Chopped Picture” Method.