.

Inteligencia Artificial

Esta IA sabe identificar las secuencias matemáticas más 'bellas'

1

El algoritmo ha aprendido a distinguir las secuencias numéricas totalmente aleatorias y sin sentido, de otras sujetas a algún patrón, como la secuencia de números primos. La parte más compleja es que, a veces, estos patrones son empíricos y no se sabe por qué funcionan, como la ley de Moore

  • por Emerging Technology From The Arxiv | traducido por Mariana Díaz
  • 13 Junio, 2018

Las matemáticas son una ciencia que destaca por su belleza, pero resulta bastante complicado representar gráficamente aquello que los matemáticos entienden por bello. Tal vez el ejemplo más famoso de belleza matemática es la fórmula de Euler: e + 1 = 0,  que refleja un profundo vínculo entre varias áreas matemáticas que, a simple vista, no guardan ninguna relación.  Por ejemplo, π viene de la geometría, la i y la e vienen del álgebra y los primitivos 0 y 1, así como las operaciones = y + provienen de la teoría de números. El hecho de que todos estos elementos estén relacionados de una manera tan simple e inesperada es una de las grandes maravillas del mundo matemático.

Esto apunta a otro factor de la belleza matemática: los patrones matemáticos deben ser interesantes de alguna forma. Reconocer patrones siempre ha sido una capacidad única de los humanos. Pero en los últimos años, las máquinas han adquirido una enorme capacidad de reconocer patrones. De hecho, ya han superado a los humanos en algunas cosas como el reconocimiento facial, el reconocimiento de objetos y el desempeño en algunos juegos.

Eso plantea una posibilidad interesante, ¿los algoritmos de aprendizaje automático serán capaces de identificar patrones matemáticos interesantes o bellos? ¿Podrían llegar a juzgar la belleza matemática?

El nuevo trabajo del investigador del Centro de Investigación TJ Watson de IBM en Nueva York (EE. UU.) Chai Wah Wu ofrece una respuesta. Wu ha construido un algoritmo de aprendizaje automático que ha aprendido a identificar ciertas formas de elegancia en las estructuras matemáticas, y lo utiliza para filtrar las secuencias más interesantes de las que resultan totalmente aleatorias.

La técnica utiliza una base de datos inusual llamada Enciclopedia Electrónica de Secuencias de Enteros (OEIS, por sus siglas en inglés), creada en la década de 1960 por el matemático Neil Sloane y alojada en la web en 1996.

Una secuencia de números enteros es una serie de números ordenados en función de una regla. Entre los ejemplos más famosos están: los números primos, números que solo pueden dividirse por sí mismos y por el uno (A000040); la sucesión de Fibonacci, en la que cada término es la suma de los dos términos anteriores (A000045); e incluso cosas más triviales, como la secuencia de números impares y los números primos que comienzan con un siete.

Los matemáticos responsables del OEIS se dedican a buscar secuencias numéricas "interesantes" y ya cuentan con una amplia gama de ejemplos con un significado puramente cultural. Estos incluyen números primos que contienen la secuencia 666, el llamado número de la bestia.

La base de datos también incluye la secuencia de números primos que contienen el número 667 (A138563). Este número cobró en importancia en la época del fax, ya que el número de fax de una persona era igual su número de teléfono más uno. En otras palabras, si su número de teléfono era 123-4567, su número de fax sería 123-4568. Siguiendo esta lógica, 667 sería el número de fax de la bestia, y de ahí su importancia cultural (los editores son humanos).

En la actualidad, la base de datos de Secuencias Enteras contiene unas 300.000 secuencias y cada día, aficionados y profesionales, muchos de los cuales lanzan problemas nuevos e interesantes en matemáticas, envían secuencias nuevas.

La tarea que asumió Wu fue la de encontrar una manera de distinguir estas secuencias "interesantes" de las generadas al azar. Su objetivo consistía en encontrar leyes empíricas que pudieran actuar como medidas de "interés" que permiten distinguirlas de las menos interesantes.

"Las leyes empíricas no son teoremas matemáticos per se, son observaciones empíricas de las relaciones que parecen aplicarse a muchos conjuntos de datos naturales y hechos por el hombre", explica Wu. Algunos ejemplos son la Ley de Moore en ingeniería eléctrica y el principio de Pareto 80/20 en economía. Todavía no se sabe qué es lo que sustenta a estas "leyes", pero funcionan.

Un principio empírico que se aplica a muchos conjuntos de datos es la ley de Benford, descubierta por el matemático y astrónomo canadiense Simon Newcomb en 1881. Newcomb observó que las primeras páginas de los libros de tablas logarítmicas pesaban más que las últimas, lo que sugiere que los logaritmos que comienzan con el dígito uno son más comunes.

Esto lo llevó a formular el principio de que, en cualquier conjunto de datos, habrá más número que empiecen en uno que con cualquier otra cifra. La misma idea fue redescubierta y popularizada por Frank Benford en la década de 1930.

Esta ley se aplica a una amplia gama de conjuntos de datos, como facturas de electricidad, direcciones de calles, precios de acciones, etcétera. Es tan predecible que puede usarse para detectar fraudes en cuentas financieras. Pero no se aplica a las secuencias aleatorias; exactamente por qué, no se sabe con exactitud.

De hecho, el simple hecho de que los matemáticos hayan descubierto que la ley de Benford se aplica a algunas secuencias enteras ya es un misterio. Y Wu quería saber hasta qué punto se aplica esta ley a este tipo de secuencias. Para averiguarlo, midió la precisión con la que la ley predice la distribución de los primeros dígitos en 40.000 secuencias elegidas al azar de la base de datos OEIS.

Resulta que la ley de Benford es mucho más frecuente de lo esperado. "Los resultados muestran que muchas, pero no todas, las secuencias satisfacen hasta cierto punto la ley de Benford", señala Wu, quien descubrió que otro principio empírico llamado ley de Taylor también estaba ampliamente presente.

La siguiente pregunta iba un paso más allá: ¿podrían utilizarse ambas leyes para distinguir las secuencias aleatorias de las del OEIS? Para descubrirlo, Wu generó 40.000 secuencias de enteros aleatorios y las agregó a las 40.000 secuencias seleccionadas del OEIS. Después, entrenó un algoritmo de aprendizaje automático para detectar secuencias OEIS mediante ley de Benford y la ley de Taylor y para distinguirlas de las secuencias aleatorias.

Los resultados son impresionantes. El algoritmo trabajó con una exactitud de 0,999 y una precisión de 0,9984. Esto es importante ya que significa que sí es posible automatizar la detección de secuencias "interesantes".

Una aplicación es inmediatamente evidente. Los matemáticos que dirigen el OEIS tienen que procesar unas 10.000 solicitudes al año, por lo que contar con una forma de detectar automáticamente las más interesantes podría ser útil.

Pero el enfoque tiene algunas limitaciones importantes. Los matemáticos han definido muchas secuencias interesantes e importantes, y estas están compuestas por un número infinito de términos que son difíciles de calcular. Así que la base de datos solo trabaja con unos pocos términos de cada secuencia.

La pregunta central es si este enfoque puede identificar la elegancia o belleza en las matemáticas. Wu se pregunta: "¿Puede el aprendizaje automático identificar los atributos cualitativos del conocimiento científico?, es decir, ¿podemos decir si un resultado científico es elegante, simple o interesante?".

La pregunta tiene sentido. Si las leyes empíricas como las de Benford y Taylor son un indicador de "interés", como sugiere este trabajo, entonces tal vez este algoritmo pueda considerarse como un árbitro de la elegancia, al menos en algún nivel. Probablemente, Euler estaría fascinado.

Ref: https://arxiv.org/abs/1805.07431:  Can Machine Learning Identify Interesting Mathematics? An Exploration Using Empirically Observed Laws

Inteligencia Artificial

 

La inteligencia artificial y los robots están transformando nuestra forma de trabajar y nuestro estilo de vida.

  1. Al habla con la IA: el reto de lograr voces más diversas e inclusivas

    La iniciativa Common Voice, de Mozilla, busca que las voces generadas por inteligencias artificiales sean más inclusivas y reflejen una mayor variedad de dialectos para asegurar que las particularidades de cada lugar y cultura se preserven frente al avance tecnológico

    La iniciativa Common Voice, de Mozilla, busca que las voces generadas por IA sean más inclusivas y diversas
  2. Estos robots aprendieron a superar obstáculos reales desde un entorno virtual gracias a la IA

    Un nuevo sistema podría ayudar a entrenar robots usando exclusivamente mundos generados mediante inteligencia artificial

  3. Por qué la IA podría comerle la tostada a la computación cuántica

    Los rápidos avances en la aplicación de la inteligencia artificial a las simulaciones físicas y químicas hacen que algunos se pregunten si de verdad necesitamos ordenadores cuánticos