Análisis Tecnología

La importancia de los datos estructurados en la Web Semántica

Autorretrato de Modigliani - ReadWriteWeb en espanolEn nuestros recientes artículos sobre Datos Estructurados hemos enfatizado que la mayoría de las iniciativas actuales tienen que ver con subir datos nuevos a la red, sea cual sea el formato. Los gobiernos estadounidense y británico han tomado la iniciativa con sus sitios Web de “datos abiertos”, pero gran parte de esos datos aún no son “vinculados”. En otras palabras, están online, pero en silos. Así pues, ¿cómo pasamos a la siguiente fase de la Web Semántica, enlazando conjuntos de datos separados para que se puedan comenzar a usar?

El punto de inflexión para la esperada Web Semántica podría ser el poder consultar a un conjunto de datos sobre alguien no demasiado famoso y obtener como respuesta una larga lista de resultados estructurados. He decidido denominar a esto “El test Modigliani”.

Amedeo Modigliani es uno de mis artistas favoritos. Era moderadamente famoso a comienzos del siglo XX, y en la actualidad hay cierto seguimiento de culto alrededor de él. Sin embargo, no es famoso al nivel de Da Vinci o Picasso. Lo que me gustaría hacer en una Web Semántica es introducir la siguiente consulta en un buscador y obtener una larga lista de resultados: dime todas las ubicaciones de los cuadros originales de Modigliani.

A fecha de hoy no hay un lugar donde introducir esta consulta y obtener una lista de datos estructurados. Lo más cercano que puedo encontrar es la entrada de Modigliani en la Artcyclopedia, que incluye una lista de ubicaciones de las obras de arte de Modigliani. Es estupendo que tengan los datos de ubicaciones enumerados en una página Web. Sin embargo, no son datos estructurados, así que no podemos consultarlos. Estos datos tampoco están muy ordenados, no tenemos idea de si es una lista completa, no son datos verificados, etc.

Lista ubicaciones Modigliani - ReadWriteWeb en espanol

En resumen, hay muchos datos en la red sobre la ubicación de obras de arte originales, pero gran parte de ellos están en páginas Web tradicionales tipo “documento”. Lo que buscamos es una especie de base de datos gigante que todo el mundo pueda consultar y reutilizar.

Aquí tenemos una imagen primera y totalmente geek de cómo serían los Datos Vinculados de las ubicaciones de los cuadros (gracias a @dakoller):

Lista en sparql - ReadWriteWeb en espanol

Lo anterior no es en absoluto una lista completa de obras de arte de Hieronymus Bosch (buscando por Modigliani, por cierto, no sale ningún resultado). Además, por supuesto, necesitamos una interfaz mucho más intuitiva para que los no geeks también puedan usarla.

¿Qué opinan los lectores, cuándo aprobará la red el Test Modigliani?

Original: Richard MacManus

Sobre el autor de este artículo

Editorial RWWES