Novedades Tecnología

Google podría empezar a indexar a tiempo real

Logo GoogleGoogle está desarrollando un sistema que permitirá a los publicadores de material en la red de cualquier envergadura enviar contenido nuevo automáticamente al buscador para que se indexe segundos después de su publicación. El analista de la industria de las búsquedas Danny Sullivan nos contaba que éste podría ser “el siguiente capítulo” para Google.

El otoño pasado, Brett Slatkin, de Google, que fue el desarrollador principal del protocolo Pubsubhubbub (PuSH) de sindicación a tiempo real, nos contaba que tenía la esperanza de que Google utilizase algún día PuSH para indexar la red en lugar del crawling de enlaces mediante el que los buscadores llevan años haciendo este trabajo.

Dylan Casey, product manager senior de Google afirmaba el martes en la feria de marketing de búsquedas de Sullivan en Santa Clara, California, que la empresa piensa publicar pronto un modo estándar de que los propietarios de sitios Web participen en un programa muy parecido.

Cómo podría funcionar el sistema

PuSH es un sistema de sindicación basado en el formato ATOM, en el que un publicador habla con el mundo mediante un punto de enlace que notificará cada vez que se publique contenido nuevo. A continuación, los suscriptores dicen al punto de enlace “cuando este publicador tenga contenido nuevo, por favor, envíamelo inmediatamente”. Así pues, en lugar de tener al suscriptor consultando al publicador constantemente para ver si hay contenido nuevo, éste puede sentarse y esperar a que el punto de enlace le avise de que lo hay. El publicador publica algo, y después indica al punto de enlace que el contenido está disponible, después el punto de enlace lo entrega a todos los suscriptores. Esto puede hacerse en cuestión de segundos.

Si Google es capaz de poner en funcionamiento un programa de indexación mediante PuSH, pediría a todos los sitios Web que adoptasen esta tecnología y declarasen al principio de cada documento a qué punto de enlace envían el contenido, al igual que declaran dónde se pueden encontrar los feeds RSS que publican. A continuación Google se suscribiría a esos feeds PuSH para descubrir el contenido nuevo cuando se publique.

PuSH probablemente no sustituiría al crawling, de hecho, haría falta hacer crawl para descubrir los feeds de PuSH a los que suscribirse, pero el formato a tiempo real se usaría para aumentar el índice existente de Google.

Como nos contaba Danny Sullivan, Google tendría que introducir algún tipo de control del spam y no dejar simplemente que el contenido se enviara en directo al índice sin análisis previo. Según nos contó, eso fue lo que sucedió en los primeros días de la red, y fue un completo desastre.

Las ventajas de una indexación de Google a tiempo real

PuSH es mucho más eficiente en términos de computación para Google, pero Slatkin afirma que es más importante aún el impacto que tendrá una iniciativa así para los pequeños publicadores. Ahora mismo, Google visita muchos sitios pequeños, quizá una vez a la semana. Si existiese un sistema PuSH, podrían enviar su contenido a Google automáticamente al instante.

Un Internet más rico, rápido y eficiente sería bueno para todo el mundo, pero las ventajas para la búsqueda tampoco se limitarían a Google. El Pubsubhubbub es un protocolo abierto, y los feeds serían tan visibles para Yahoo y Bing como para Google.
“Mis jefes de ingeniería me han pedido que promueva abiertamente esta metodología abierta, incluso a nuestra competencia”, afirma Slatkin. Esto es muy buena señal.
Esperamos que esto sea algo muy importante, y le daremos una cobertura más completa en los próximas días, así como cuando Google tenga algo que anunciar más formalmente

Originl: Marshall Kirkpatrick

Sobre el autor de este artículo

Editorial RWWES