General Tecnología

La web semántica del Mundial ha sido posible en la BBC

worldcup_final-ReadWriteWeb-esEl Mundial de fútbol ya ha terminado con España como vencedora. A Inglaterra la echaron bruscamente antes de los cuartos de final, pero si hubo un Mundial de la Web Semántica, entonces la BBC tendría que haber levantado el trofeo por su país. Una entrada en la página de Internet de la BBC explica cómo la web BBC World Cup 2010 utilizó tecnología de “publicación semántica dinámica”.

Es una demostración impresionante de cómo una web grande y generalista puede añadir significado y estructura.

La página del Mundial de la BBC incluía unas 700 webs y estaba impulsada por un marco de trabajo de publicación semántica. El sitio disponía de ontología exhaustiva (un mapa de conceptos), que daba como resultado “páginas web automatizadas basadas en los metadatos” creadas sobre la marcha.

Jem Rayfield, arquitecto técnico senior de BBC News and Knowledge lo explicó después:

“El marco de publicación subyacente no crea el contenido directamente; en su lugar publica datos sobre el contenido, metadatos. Los metadatos publicados describen el contenido del Mundial como un nivel detallado de particularidad, lo que produce relaciones ricas de contenido y navegación semántica. Haciendo llamadas a estos metadatos publicados somos capaces de crear agregaciones de páginas dinámicas por equipos, grupos y jugadores”.

La base de este sistema fue una ontología que describía cómo se relacionaban entre sí los hechos del Mundial. Por ejemplo, “Frank Lampard” era parte del “Equipo de Inglaterra” y el “Equipo de Inglaterra” competía en el “Grupo C” del “Mundial de la FIFA 2010”. La ontología también incluía “activos creados por periodistas” como noticias, blogs, perfiles, imágenes, vídeo y estadísticas.

La plataforma de publicación tenía funciones para insertar etiquetas tanto manuales como automáticas. Los periodistas de la BBC podían, por ejemplo, etiquetar a Frank Lampard en una noticia sobre el gol no concedido a Inglaterra en la derrota de dieciseisavos de final frente a Alemania. Esto es algo normal en la mayoría de los sistemas de publicación de hoy en día (así etiquetamos el contenido aquí en ReadWriteWeb). Pero la página web el Mundial de la BBC además analizada automáticamente el contenido del periodista y lo enlazada “contra la ontología del Mundial”. Lo hacía utilizando lo que describe como un “proceso de lenguaje natural y determinante ontológico”. Muy probablemente fue software como el Calais de Thomson Reuters o el nuevo producto Extractiv que analizamos ayer. En el caso de la BBC, las etiquetas resultantes eran moderadas antes de ser creadas.

La BBC utilizó tecnología de la Web Semántica como RDF y SPARQL para hacer su página del Mundial. El objetivo declarado era lograr “mapeado inteligente de los archivos de los periodistas en conceptos y cuestiones.”

Según se ha informado, la web ha servido millones de páginas consultadas al día durante el Mundial. Quizá la BBC use esta plataforma de publicación semántica para otras partes de BBC Sports. Y por supuesto tendría que hacer uso de ello de nuevo en los Juegos Olímpicos de Londres 2012.

El post explicativo oficial tiene los detalles técnicos, con los que tendrías que seguir. Haznos saber mediante los comentarios qué otros usos de la Web Semántica a gran escala conoces.

Original: Richard MacManus

Sobre el autor de este artículo

Redacción TICbeat

Actualidad y análisis en tecnología, tendencias, aplicaciones web, seguridad, educación, social media y las TIC en la empresa.