Social Media

Twitter permitirá recuperar cualquiera de los tuits publicados desde 2006

twitter_dancing
Escrito por Redacción TICbeat

La red social se acerca a su meta de construir un índice de contenidos que permita a los usuarios rastrear con facilidad toda la información publicada desde su nacimiento.

La red social Twitter está ya mucho más cerca de la que, según asegura, es una de sus metas desde hace años: indexar todos los tuits que se han publicado en su plataforma desde su nacimiento, en 2006, y construir con ellos una gigantesca base de datos que pueda ser rastreada en busca de información.

Como informa Yi Zhuang, del equipo de ingenieros de la compañía, en una entrada en el blog oficial de ésta, Twitter ha creado una nueva infraestructura que empezará a estar disponible para los usuarios en los próximos días y que permitirá recuperar tuits en muchos supuestos: temporadas de programas y series de televisión, conferencias y eventos, discusiones etiquetadas con hashtags y geolocalizaciones, entre otros.

Hasta ahora, el buscador de Twitter funcionaba solo “en tiempo real”; es decir, solo recuperaba los tuits cuya antigüedad no excedía la semana. Dicho índice fue construido en 2012, y en 2013 fue actualizado con la capacidad de recuperar tuits anteriores, siempre que cumplieran criterios como un elevado número de retuits, favoritos e interacciones. Esta nueva infraestructura supone la construcción de un índice que es alrededor de cien veces mayor que el actual y crece a un ritmo de varios miles de millones de tuits por semana.

“Nuestro motor de búsqueda ya había trascendido los titulares de última hora y los eventos en tiempo real, y hemos estado haciendo énfasis en ello desde nuestra infraestructura de búsqueda, pero nuestra meta a largo plazo siempre ha sido permitir que la gente pueda encontrar todos y cada uno de los tuits que se han publicado”, ha recordado Zhuang.

En el post oficial Zhuang explica con todo lujo de detalles las implicaciones técnicas del proyecto, con un significativo coste operativo, para el que han tenido que recurrir, por ejemplo y entre otras cosas, a la partición de la memoria en la que almacenan toda esta información. “Nuestro sistema de búsqueda en tiempo real está almacenado en RAM, pero haber usado esa tecnología para el índice completo nos habría resultado prohibitivo”, ha justificado.

Hace ya tiempo que Twitter coquetea con ideas como la posibilidad de rebobinar su imparable timeline o de separar la señal de su ruido, para ayudar a los usuarios a filtrar aquellos contenidos que les resultan más relevantes y recuperarlos antes de que se pierdan en su avalancha de información diaria. Desde su nacimiento, la red social almacena grandes cantidades de información, y parece que ha llegado la hora de que todos podamos rastrearla.

Sobre el autor de este artículo

Redacción TICbeat

Actualidad y análisis en tecnología, tendencias, aplicaciones web, seguridad, educación, social media y las TIC en la empresa.