Tecnología

Inteligencia artificial para digitalizar los secretos vaticanos

Escrito por Marcos Merino

El proyecto ‘In Codice Ratio’, de las universidades de Roma y La Sapienza, pretende digitalizar 53 kilómetros de estanterías de los Archivos Vaticanos llenos de antiguos documentos que se resisten a los sistemas actuales de OCR.

Tecnología de última generación y antiguos secretos del Vaticano. Parece la sinopsis de un libro de Dan Brown, pero en realidad son los pilares sobre los que se asienta el proyecto “In Codice Ratio”, desarrollado por investigadores de dos universidades y cuyo objetivo es el de convertir 53 kilómetros de estanterías alojadas en los Archivos Vaticanos (con documentos de hasta 12 siglos de antigüedad) en contenidos digitales indexados en una base de datos para facilitar su búsqueda.

La razón de la puesta en marcha de “In Codice Ratio” es que los valiosos documentos en poder del Vaticano carecen de utilidad para los académicos si no pueden realizar búsquedas entre los mismos… pero las técnicas de digitalización habituales carecen de utilidad en este caso, dado el volumen de documentos y la diferencia entre las tipografías modernas y las medievales, de estilo decorativo y trazadas a mano, una pesadilla para cualquier software OCR.

Por ello, las universidades de Roma y de La Sapienza (también romana) han desarrollado un sistema que recurre a redes neuronales convolucionales y algoritmos de procesamiento de imágenes para identificar las letras. Antes de llegar a este último punto el software lleva a cabo un proceso denominado ‘segmentación de rompecabezas’, en el que las palabras se dividen en algo que se aproxima a los trazos de lápiz individuales y luego se reconstruyen como palabras.

El Vaticano digitalizará 82.000 manuscritos, algunos de hace más de 2.000 años

Para verificar la exactitud de los resultados de dicho proceso automático, el proyecto ha contado también con la colaboración de 120 estudiantes de 24 escuelas de secundaria italianas, encargados de juzgar la precisión del sistema (ahora mismo, en torno al 65%) y de ayudar, con sus respuestas, a entrenarlo.

Entrevistado por ‘Digital Trends’, el investigador Paolo Merialdo ha explicado los objetivos del proyectos: “Nuestro principal objetivo es completar la tarea de transcripción y comenzar a extraer información de los manuscritos. Hasta ahora, hemos estado trabajando en una muestra de 1000 páginas digitalizadas de los registros del Vaticano. Una vez contemos con un sistema de transcripción fiable, el siguiente paso será solicitar a los Archivos Secretos del Vaticano los manuscritos restantes“.

Lo que puedan descubrir una vez finalice con éxito el proyecto ya sí será una tarea para Dan Brown (o para Javier Sierra).

Vía | Digital Trends

Imagen | Michal Osmenda 

Sobre el autor de este artículo

Marcos Merino

Marcos Merino es redactor freelance y consultor de marketing 2.0. Autodidacta, con experiencia en medios (prensa escrita y radio), y responsable de comunicación online en organizaciones sin ánimo de lucro.