Las 5 principales tendencias en Internet de 2009: Datos Estructurados

Ilustración floresEsta semana, ReadWriteWeb publica una serie de posts en los que describimos las 5 tendencias que consideramos más importantes e innovadoras aparecidas en 2009. Publicaremos un análisis de tendencia por día. Después, al final de la semana, publicaremos una importante actualización de nuestra presentación estándar (en inglés) sobre tendencias tecnológicas en Internet.

La primera tendencia importante que vamos a examinar son los Datos Estructurados. En anteriores presentaciones, nos hemos referido en ocasiones a ella bajo el término general de “Web Semántica”. Sin embargo, por cómo se ha ido desarrollando 2009, está claro que esta tendencia va mucho más allá de la Web Semántica. En este post vamos a analizar los avances en Datos Estructurados de este año, y ofrecemos tres ejemplos de productos: OpenCalais, Google, Wolfram Alpha.

Red de datos, no de documentos

Tim Berners-Lee afirmó en febrero de este año que ahora estamos dentro de una Red de Datos, más que de una Red de Documentos. La organización dirigida por Berners-Lee, el W3C, ha realizado una intensa promoción de dos iniciativas clave que están ayudando a desarrollar esta Red de Datos: la Web Semántica y, más recientemente, los Datos Vinculados.

Sin embargo, en el transcurso de los últimos años, hemos observado que hay muchos otros modos de estructurar datos y de permitir a otros aprovechar esta estructura. El mejor ejemplo actual seguramente sea Twitter, cuya API ha generado históricamente cerca del 90% de su actividad (mediante aplicaciones de terceros).

El principio básico de la Red de Datos sigue siendo el mismo que Alex Iskold describió en ReadWriteWeb en marzo de 2007 (en inglés): “la información desestructurada dará paso a la información estructurada, lo que allanará el camino para una computación más inteligente”.

Gráfica páginas -> servicios

Ejemplo 1: OpenCalais

Logo OpenCalaisNuestro primer ejemplo de producto, OpenCalais, probablemente sea el mejor ejemplo actual de Datos Vinculados (un tipo de datos estructurados por el que apuesta el W3C). Thomson Reuters, el gigante internacional de la información empresarial y financiera, lanzó una API llamada OpenCalais en febrero de 2008. En pocas palabras, OpenCalais convierte el HTML desestructurado en datos marcados semánticamente. Éste ordena los datos en grupos como “gente”, “lugares”, “empresas” y más. De este modo, las aplicaciones y páginas de terceros pueden desarrollar cosas nuevas interesantes a partir de esos datos (uno de los principios definitorios de los Datos Vinculados).

Para ver una explicación completa de lo que son los Datos Vinculados, se puede leer la introducción técnica de Alexander Korth, La Web de Datos: creación de información accesible para máquinas de abril de 2009. También he descrito el trasfondo y las ventajas de los Datos Vinculados en un post de mayo de 2009 titulado El desarrollo de los Datos Vinculados: por qué prestarles atención.

Gráfica OpenCalais

Ejemplo 2: Rich Snippets de Google

google_options_logoEn mayo de este año, Google incorporó datos estructurados a su búsqueda básica, en forma de función denominada “rich snippets”. Básicamente, esta función extrae y muestra información útil de de páginas Web por medio de estándares abiertos de datos estructurados, tales como microformatos y RDFa. Al lanzarla en mayo, Google invitaba a los autores a marcar su HTML. Aunque este marcado tardará un tiempo en extenderse, el hecho de que una empresa enorme como Google lo incorpore, es indicativo de la importancia cada vez mayor de los datos estructurados en la red.

rich-snippets

Otras grandes empresas también están encaminando sus esfuerzos en esta dirección. Concretamente, Yahoo! fue un pionero.

Ejemplo 3: Wolfram Alpha

Logo Wolfram AlphaDesde el cacareado lanzamiento en mayo de Wolfram|Alpha, hemos estado siguiendo este innovador producto de cerca. Se autodenomina como un “motor de conocimiento computacional”, y aunque no es el peligroso rival de Google que algunos pensaron, tiene muchos posibles usos.

Wolfram|Alpha ha creado una interfaz similar a la de un motor de búsqueda, que permite introducir en ella expresiones en lenguaje natural. Sin embargo, la parte importante del producto son las computaciones sobre datos que se pueden hacer. El producto está diseñado con la premisa de usar y computar datos. Si la Web 2.0 se centraba en la creación de datos (esto es, contenido generado por los usuarios), la siguiente generación de Internet se centra sobre todo en el uso de esos datos.

Conclusión

De los tres ejemplos anteriores podemos deducir que los datos estructurados se están convirtiendo rápidamente en un rasgo característico del Internet actual. Empresas como Thomson Reuters y Google están permitiendo estructurar los datos, y los nuevos tipos de productos (como Wolfram|Alpha) utilizarán datos estructurados de maneras que quizá no podamos imaginar ahora mismo.

Administrador Ticbeat- Pruebas y desarrollo www.ticbeat.com

Contenidos Relacionados

Top