Análisis Social Media

¿Quiere realmente Facebook una Web semántica?

Logo Open Graph - ReadWriteWeb-esHace dos semanas, Facebook anunció una importante iniciativa nueva llamada Facebook Open Graph. Se trata de un intento no sólo de reinventar Facebook, sino, en muchos sentidos un intento de redefinir cómo funciona la red. Ya hemos hablado en profundidad de lo que implica esta iniciativa para todos los interesados.

Gran parte de la noticia es el concepto de Facebook de una Web semántica para consumidores. En este nuevo mundo, los publicadores tienen un incentivo para anotar páginas marcando actividades, eventos, personas, películas, libros, música y más. A su vez, un marcado apropiado nos llevaría a una red mucho más interconectada: los usuarios estarían conectados entre sí en diferentes sitios Web y alrededor de las cosas que les interesan.

En cuanto a dirección, este concepto es correcto e importante. Llevamos tiempo hablando sobre cómo utilizar la Web semántica de un modo pragmático, y nos entusiasma la posibilidad de que suceda finalmente. Sin embargo, dos semanas después del anuncios, cada vez está más claro que hay lagunas en la oferta y las intenciones de Facebook. Si lo examinamos de cerca, veremos que quizá la intención de Facebook no es la de hacer que la red esté más estructurada, sino encontrar un modo de que entren más datos (principalmente desestructurados) en las bases de datos de Facebook.

“Más bien parece que la semántica es una idea secundaria en la carrera por hacerse con la identidad y la información del usuario a cambio de enviar tráfico a los publicadores.”

Como veremos en el resto del artículo, parece que hacer un buen trabajo con la semántica no ha sido una gran prioridad para Facebook, al menos no antes del anuncio. Estos son los problemas que hemos identificado:

  1. El protocolo Open Graph no permite la desambiguación de objetos
  2. El protocolo Open Graph no permite tener múltiples objetos en la página
  3. Los partners de este lanzamiento no han incorporado correctamente el protocolo Open Graph en sus sitios
  4. Facebook no tiene en sus propias páginas el marcado que está pidiendo al mundo que adopte
  5. Cada vez hay más datos en los perfiles de usuario llenos de duplicados y ambigüedad

Preocupaciones por el protocolo Open Graph

Hace una semana alabábamos la simplicidad del protocolo Open Graph, pero al examinarlo de cerca hemos encontrado un par de defectos. En primer lugar, no hay modo de desambiguar los objetos. Por ejemplo, dos películas que tengan el mismo nombre se considerarían la misma. Un modo adecuado de solucionar esta clase de situación sería introducir atributos secundarios, como el director o el año, que puedan ayudar a identificar objetos específicos, pero el protocolo no define atributos secundarios.

El segundo problema es que no hay modo de marcar los objetos dentro de la página. En su versión actual, el protocolo sólo permite declarar que toda la página es sobre una persona, un evento de noticias, un músico o una película, pero no hay modo de identificar los objetos dentro de la página. Se trata de un caso práctico importante para bloggers y sitios de reseñas: cada entrada de un blog suele mencionar muchas entidades, y estaría bien que desde el principio se contemplara este tipo de uso.

Ambos defectos son fáciles de corregir. Lo bueno es que el protocolo es sencillo y minimalista, por lo que añadir los elementos que se ocupan de la desambiguación y las entidades múltiples es algo simple. Los demás aspectos que vamos a comentar son mucho más problemáticos.

Partners de lanzamiento: ¿por qué no tienen marcado?

El trillado concepto de hacer la red más estructurada es añadir más marcado. Por muy limitado que sea, tener algo de marcado en las páginas siempre es mejor que no tener nada. Cuando Facebook anunció el protocolo Open Graph, resaltaba varios sitios que ya lo usaban. Entre ellos estaban Yelp, IMDB y Pandora.

Hemos examinado cómo realizan el marcado de sus páginas exactamente estos sitios. Lo que hemos encontrado resulta bastante chocante: ninguno de estos sitios ha incorporado el marcado correctamente. Hemos buscado la película Cómo entrenar a tu dragón en IMDB, la página de Brad Pitt en IMDB, la página de Muse en Pandora y la página de Acquagrill en Yelp.

Así es como define Facebook las propiedades requeridas:

Protocolo de Facebook Open Graph - ReadWriteWeb-es

Y esto es lo que hemos encontrado en las páginas de sus partners:

Codigo en paginas de partners de Open Graph - ReadWriteWeb-es

¿Qué significa esto entonces? Significa que Facebook ha incorporado un manejo especial para estos sitios. Cuando a un usuario le gusta una película en IMDB o una estrella de cine, Facebook realmente no puede distinguirlos, ya que IMDB no está transmitiendo la información correcta mediante el protocolo. El único motivo por el que funciona es que IMDB cuenta con “hard code” insertado tal cual específicamente por Facebook.

La puesta en funcionamiento para el lanzamiento no era genérica, sino personalizada, más enfocada a las relaciones públicas que a la corrección. Lo que no queda claro es por qué permitiría Facebook que esto fuese así en lugar de dejar que sean sus partners quienes incorporen el marcado correcto. Es muy sencillo de incorporar, y las páginas de los partners ya cuentan con toda la información necesaria. Nuestra conclusión es que el intentar asegurarse de que todo fuese correcto no ha sido una prioridad durante el lanzamiento.

Utilizar tus propios productos

Resulta que no es sólo que los publicadores no hayan marcado las páginas… Facebook tampoco lo ha hecho. En el momento de escribir este artículo, ninguna de las páginas de entidades de Facebook.com cuentan con marcado de Open Graph. Mucho hablar de apertura… pero las propias páginas de Facebook siguen cerradas. Irónicamente, podría ser no porque la empresa no quiera marcar las páginas, sino porque no puede. Al menos todavía.

Averiguar lo que hay en la página no es un asunto trivial. Sobre esto es sobre lo que se han estado desarrollando tecnologías semánticas como Freebase, Powerset, Open Calais, Evri, Zemanta y GetGlue entre otras durante los últimos años. Para poder marcar las páginas correctamente, especialmente aquellas creadas por los usuarios, Facebook necesita realizar algún tipo de procesado semántico y desambiguación en ellas. Éste no es un asunto trivial.

Datos desestructurados en perfiles de usuario

Codigo en Perfil de Facebook - ReadWriteWeb-es
Todo esto vuelve al punto de partida y repercute en los usuarios. A medida que se esparcen los botones de Me gusta por la red, también lo hacen los datos desestructurados y duplicados por los perfiles de usuario. La ausencia de semántica crea conexiones fragmentadas y ruido por toda la red.

A continuación tenemos el listado de películas que me gustaban y he recuperado mediante la API de Facebook Open Graph. Cómo entrenar a tu dragón aparece dos veces porque la marqué como “me gusta” una vez en IMDB y después otra vez en Fandango. Los amigos que puedo ver en Fandango son distintos de los que veo en IMDB. Lo peor de todo es que todos estos datos sin limpiar aparecen en mi perfil: el título de la película contiene un año en un caso y el sitio de origen en otro.

Por eso, ahora mismo Facebook no correlaciona los elementos entre sitios. En lugar de esto sólo captura la información tal como está, esperando quizá limpiarla más adelante.

Conclusión: ¿un objetivo diferente?

Cuando sumamos todos estos factores, llegamos a una conclusión obvia: el objetivo de Facebook no es el de crear una red mejor y más estructurada. Más bien parece que la semántica es una idea secundaria en la carrera por hacerse con la identidad y la información del usuario a cambio de enviar tráfico a los publicadores.

A medida que entran más y más datos en Facebook mediante los botones “Me gusta”, tanto la red como los publicadores obtienen el beneficio de reciclar amigos mediante el contenido de sitios de toda la red. Sin embargo, al mismo tiempo, los datos de los perfiles de usuario cada vez son más ruidosos. Como no hay muchos usuarios que estén prestando atención aún, al mirarlo más de cerca parece una tontería.

Sin embargo, para poder ofrecer las recomendaciones, para que los plugins sociales sean un éxito, y para facilitar una buena experiencia de usuario, Facebook literalmente tendrá que limpiar su nombre. Los duplicados y datos sucios van a echar par atrás a los usuarios, y cuanto más tiempo persista el problema, más difícil le va a resultar a Facebook solucionarlo.

En las próximas semanas y los próximos meses veremos cómo se ocupa el gigante de las redes sociales de esta cuestión. Mientras tanto, nos gustaría girar las tornas. Nos gustaría que los lectores nos contasen qué piensan de las ambiciones de Facebook respecto a la Web semántica. ¿Deberían haber hecho lo más básico bien antes del lanzamiento, o así está bien y podrán ponerse al día rápidamente?

Nota: Alex Iskold es el fundador y CEO de GetGlue.com, una red social de entretenimiento. GetGlue ha desarrollado la capacidad de conectar a usuarios entre distintos sitios mediante una combinación de complementos de navegador y bases de datos semánticas de cloud computing.

Original: Alex Iskold

Sobre el autor de este artículo

Editorial RWWES