Tecnología

La ‘Deep Web’: allí donde no llega Google

deepweb
Escrito por Marcos Merino

El dominio de Google no se extiende por toda la Red. Puede que ni siquiera a la mayor parte: hay una Internet invisible esperando ser descubierta.

Hay quien piensa que Google puede encontrar cualquier cosa que haya en Internet, todo es cuestión de repasar suficientes páginas de resultados. Pero eso no es cierto. Realmente, Google y el resto de motores de búsqueda no hacen más que arañar la superficie de Internet. Todo lo que queda por debajo de la misma es conocido como la Deep Web (la ‘Internet Profunda’).

En realidad, en muchos casos el contenido de la Deep Web no tiene nada de especial: aquí estarían incluidos, por ejemplo, los foros privados y las intranets de instituciones y empresas, que requieren de contraseña para su visualización (y por tanto, para su indexado). Los artículos de publicaciones periódicas ocultos tras muros de pago tampoco son indexables, al igual que, por ejemplo, ciertas páginas dinámicas creadas en el momento a consecuencia de una consulta del usuarios (consultas de las bases de la web del Instituto Nacional de Estadística, por ejemplo). Incluso es posible, al funcionar los motores de búsqueda mediante el seguimiento de enlaces, que una web normal y corriente pero sin ningún enlace entrante se mantenga igualmente lejos del radar de Google, Bing, y compañía.

El concepto (que no el término) de Deep Web se creó en 1994, cuando Mike Bergman publicó un artículo en el Journal of Electronic Publishing hablando de las webs que no estaban registradas por algún motor de búsqueda (en aquellos tiempos, muchos buscadores dependían más de que los webmasters dieran de alta sus webs que de la potencia de sus motores de búsqueda). Sin embargo, en aquel momento Bergman hizo uso del término “Internet Invisible”. Cuatro años más tarde, Bergman escribió otro artículo en el que estimaba que el tamaño de esa Internet Invisible era 45 veces mayor que el de la recogida en las bases de datos de los buscadores (75000 Tb de datos frente a 167 Tb).

Sin embargo, en 2002 debutó una tecnología que cambió el significado de “Deep Web” para siempre, diversificando enormemente su contenido: entraba en escena TOR.

TOR (The Onion Routing) es una tecnología que permite la comunicación anónima y encriptada entre los usuarios de la misma, y es aplicable tanto al e-mail, como a la mensajería instantánea… como a las webs. Cualquiera que tenga instalado el software adecuado podrá acceder a las webs ocultas tras esta tecnología, reconocibles por sus “nombres de dominio” encriptados y con extensión “.onion” (por ejemplo: asd67asdt124byasdfyieep9rbhi34y8.onion). Al abrigo de la muralla de anonimato que proporciona TOR se han desarrollado múltiples comunidades de disidencia política, subcultura hacker… y crimen (desde la pedofilia hasta los mercados negros online de armas, mercenarios, números de tarjeta de crédito, etc. pasando también por la célebre Silk Road, dedicada fundamentalmente a la venta de drogas).

Sin embargo, la reciente aparición de redireccionadores como onion.to, que actúan de proxy para permitir el acceso de usuarios ajenos a la tecnología TOR (incluyendo aquí al propio Google), ha servido en los últimos tiempos para hacer emerger a la superficie la que quizás sea la parte más polémica de la Deep Web.

Sobre el autor de este artículo

Marcos Merino

Marcos Merino es redactor freelance y consultor de marketing 2.0. Autodidacta, con experiencia en medios (prensa escrita y radio), y responsable de comunicación online en organizaciones sin ánimo de lucro.