.

Thierry Ehrmann | Flickr

Inteligencia Artificial

La visión artificial podría desvelar los mayores secretos del Vaticano

1

Los archivos secretos de la Santa Sede son tan extensos que ni sus responsables saben con certeza toda la información que contienen. Como transcribirlos a mano sería imposible, un equipo de investigación ha echado mano de la inteligencia artificial para automatizar el proceso 

  • por Emerging Technology From The Arxiv | traducido por Mariana Díaz
  • 20 Marzo, 2018

El Archivo Secreto Vaticano es legendario. Según dicen, las estanterías de este centro de investigación ocupan unos 85 kilómetros en la ciudad del Vaticano (Italia) y contienen cartas privadas y otros documentos de los Papas anteriores; algunos de ellos datan del siglo VIII.

El archivo siempre está custodiado. Desde 1881, los académicos han recibido acceso limitado a algunos de los documentos, pero incluso con esta restricción han encontrado mucha información.

Por ejemplo, hay un rollo de 60 metros que detalla los juicios de los Caballeros Templarios, que comenzaron en 1307 y duraron varios años. Hay cartas a varios papas escritas por el artista Miguel Ángel; otras escritas por el rey de Inglaterra Enrique VIII solicitando una anulación matrimonial y cartas de María Estuardo (conocida popularmente como María I de Escocia) solicitando ayuda antes de su decapitación.

Los documentos también contienen correspondencia más reciente, como cartas de Abraham Lincoln y Jefferson Davis que intentaban persuadir al Papa Pío IX para que favoreciera a la Unión (los bandos formados por los estados del norte de EE. UU. durante la Guerra Civil) y a la Confederación (los 11 estados que se separaron brevemente de EE. UU.), respectivamente. Luego están los registros relacionados con el Papa Pío XII y su trato con el régimen nazi durante la Segunda Guerra Mundial, que nunca se han publicado. De hecho, todos los registros a partir de 1939 son completamente secretos.

Pero aunque esté prohibido publicar los registros, el archivo tiene sus propios estudios fotográficos y de conservación. Y al igual que muchos archivos históricos en todo el mundo, ya se están llevando a cabo tareas para guardar imágenes de ciertos documentos para preservarlos y permitir su estudio.

De nuevo, dado el enorme tamaño de los registros del Vaticano, transcribirlos a mano resultaría poco práctico dentro de cualquier período razonable de tiempo. Así que tal vez la visión artificial podría ayudar. Así lo cree la investigadora de la Universidad Roma Tre (Italia) Donatella Firmani y su equipo, quienes han lanzado un proyecto llamado In Codice Ratio (latín para "El Código del Sistema"), cuyo objetivo es transcribir automáticamente una parte del Archivo Secreto Vaticano llamado los Registros del Vaticano.

Este corpus consta de más de 18.000 páginas de correspondencia oficial del siglo XIII entre la Iglesia Católica y reyes, reinas e instituciones políticas y religiosas en toda Europa. "Nunca se han transcrito, estos documentos tienen una relevancia histórica sin precedentes", afirma el equipo.

Pero los textos medievales plantean un problema único para la visión artificial. Los algoritmos convencionales de reconocimiento óptico de caracteres no funcionan bien, porque los manuscritos están escritos en diferentes estilos con diferentes ligaduras (caracteres que combinan letras adyacentes) y con abreviaturas que ya no se usan.

Para evitarlo, los expertos han desarrollado sistemas de visión artificial especializados en palabras enteras en lugar de letras. Pero su precisión no es suficiente porque la mayoría de las palabras aparecen pocas veces, incluso en los documentos largos. Por lo tanto, es difícil crear conjuntos de datos para entrenar a las máquinas.

Firmani y su equipo han ideado una nueva forma de entrenar un sistema óptico de reconocimiento de caracteres que divide cada palabra en una serie de trazos que encajan como un rompecabezas. La investigación detalla: "Nuestro objetivo es desarrollar un sistema completo que transcriba lo máximo posible de los manuscritos".

Después de dividir cada palabra en trazos, el sistema intenta unirlos para formar letras que conoce y luego analiza todas las posibles permutaciones de letras. Finalmente, descarta todas las que no tienen sentido gramatical. Por ejemplo, un patrón común de trazos se puede interpretar como "iii" o como "m", pero el primero se puede descartar, ya que resulta gramaticalmente inadmisible. Los mismos trazos también pueden representar "la" o "al", así que para decidir entre ellos, el sistema debe estudiar la palabra y su contexto en detalle.

El primer paso del equipo fue crear un conjunto de datos para entrenar un sistema de visión artificial basado en una red neuronal. Este conjunto de datos debe etiquetarse para que el sistema sea capaz de aprender qué letras están representadas por diferentes combinaciones de trazos. Los investigadores completaron esta tarea mediante el trabajo colaborativo (crowdsourcing). Presentaron la segmentación del puzle de palabras como un problema de reconocimiento de patrones a 120 estudiantes de educación secundaria, quienes lograron etiquetar un conjunto de datos de entrenamiento de 15.000 caracteres a mano en un par de horas.

Los resultados fueron impresionantes. La investigación afirma: "Fuimos capaces de transcribir con exactitud el 65 % de las imágenes de nuestro conjunto de datos".

Ese es un importante paso hacia adelante para la transcripción de textos medievales y para los historiadores en general. Sin embargo, todavía queda trabajo por hacer. Por ejemplo, de momento la transcripción solo funciona con letras minúsculas, así que el siguiente objetivo es ampliar el vocabulario para incluir letras mayúsculas y algunas de las abreviaturas utilizadas en el texto medieval.

Aún no está claro cómo se utilizará esta tecnología al Archivo Secreto Vaticano, y tampoco se sabe si los registros se publicarán cuando estén transcritos.

Pero aunque nunca se publiquen, las herramientas que Firmani y su equipo están desarrollando deberían avanzar las investigaciones. Por ejemplo, podrían dar lugar a un estudio basado en datos de documentos históricos que podrían ver las frecuencias de palabras o frases, por ejemplo, y cómo cambian con el tiempo. Eso puede proporcionar importantes conocimientos culturales. Será fascinante ver si el Vaticano decide compartir este conocimiento u ocultarlo.

Ref: arxiv.org/abs/1803.03200Towards Knowledge Discovery from the Vatican Secret Archives. In Codice Ratio – Episode 1: Machine Transcription of the Manuscripts.

Inteligencia Artificial

 

La inteligencia artificial y los robots están transformando nuestra forma de trabajar y nuestro estilo de vida.

  1. El gobierno de EE UU pone bajo la lupa a las empresas de IA por publicidad engañosa

    La Comisión Federal de Comercio (FTC) de Estados Unidos ha tomado medidas contra varias empresas de IA por mentir y realizar publicidad engañosa, una lucha que continuará durante el próximo mandato de Donald Trump

    La Comisión Federal de Comercio (FTC) de Estados Unidos ha tomado medidas contra varias empresas de IA
  2. Las emisiones de la IA están a punto de dispararse aún más

    Las emisiones de los centros de datos se han triplicado desde 2018. A medida que modelos de IA más complejos como Sora de OpenAI comiencen a generalizarse, es probable que esas cifras se disparen

    Ordenador portátil echando humo
  3. La IA llega al campo de batalla para redefinir la toma de decisiones en la guerra moderna

    Anduril, fabricante de drones y misiles con IA, ha firmado un acuerdo con el Pentágono de EE UU para integrar sus sistemas en conflictos armados y optimizar la toma de decisiones, un aspecto que ya ha generado preocupación en organismos internacionales como Human Rights Watch

    La IA llega al campo de batalla