Tecnología

La Biblioteca Nacional ofrece acceso a miles de sitios web archivados

Escrito por Marcos Merino

El ‘Archivo de la web española’ es la colección formada por las webs que se recolectan con el fin de preservar el patrimonio documental español en Internet.

La Biblioteca Nacional de España, junto con varios centros de conservación de las Comunidades Autónomas, han puesto a disposición de sus usuarios un portal de acceso a los sitios web archivados (incluidos blogs, foros, cuentas de Twitter, imágenes, vídeos, etc.) que se recolectan con el fin de preservar el patrimonio documental español en Internet, puesto que desde hace ahora 6 años son considerados objeto de depósito legal. La BNE comenzó a capturar páginas y sitios web españoles albergados en el dominio .es, así como en otros dominios y subdominios genéricos (los .com, .edu, .gob, .org, .net, etc.), en 2009, con la colaboración de Internet Archive.

Los responsables de la Biblioteca avisan de que “debido al enorme tamaño de Internet y a los medios tecnológicos de los que disponemos actualmente, a día de hoy es imposible aspirar a la exhaustividad en el archivado web“, por lo que “se ha optado por un modelo mixto que combina recolecciones masivas y selectivas, como hacen otras bibliotecas nacionales del mundo”.

La metodología de la recolección de los sitios web se ha realizado siguiendo el modelo de Archive.org: haciendo uso de ‘robots rastreadores’ que recorren las URL seleccionadas previamente y guardan todo lo que encuentran enlazado. El resultado de estas recolecciones son los archivos web, donde se guarda y se puede consultar lo recolectado en distintas versiones según la fecha, y cuidando que la réplica del sitio web sea tan navegable y funcional como su versión “en vivo”.

Para poder acceder a la colección de sitios web archivados, los usuarios deben dirigirse a unos ordenadores especialmente habilitados en las salas de consulta de la BNE y en los centros de conservación de las CCCAA. Por ahora, en esta primera fase del portal, la consulta debe realizarse por URL, pero se prevé que en el futuro esté disponible una nueva versión que permita una búsqueda por materias y por títulos.

Vía | BNE

Sobre el autor de este artículo

Marcos Merino

Marcos Merino es redactor freelance y consultor de marketing 2.0. Autodidacta, con experiencia en medios (prensa escrita y radio), y responsable de comunicación online en organizaciones sin ánimo de lucro.