Tecnología

¿Qué demonios es eso del Big Data?

Big Data
Escrito por Óscar Condés

Muy probablemente has oído hablar de ello a menudo, pero ¿realmente sabes qué es eso del Big Data y para qué sirve? Os lo desvelamos paso a paso.

Cuando navegamos por una página web, si pagamos con nuestra tarjeta en una tienda (ya sea física o virtual), cuando dejamos un comentario en un blog o en una red social, si colgamos una foto en nuestro Instagram o si, sencillamente, mantenemos una conversación telefónica… Cada vez que cualquiera de nosotros (de los miles de millones de habitantes de nuestro planeta en realidad) realizamos uno de estos gestos hoy día cotidianos estamos dejando una huella, más o menos grande, en forma de datos.

Estos datos poco a poco se van acumulando y conformando nuestra identidad digital, una identidad que puede ser muy valiosa para, por ejemplo, las empresas que quieran saber qué tipo de productos consumimos.

Y eso es precisamente de lo que va el Big Data, del análisis de esos conjuntos de datos a través del cual podemos obtener valiosas informaciones. Claro que antes hay que afrontar la tarea que supone la labor de almacenaje y clasificación de toda esa ingente cantidad de información. Tan ingente es que las aplicaciones de software convencional habitualmente usadas en la captura, gestión y procesamiento de datos no son capaces de abordarla, por lo que es necesario recurrir a software especializado en Big Data. Y es que no estamos hablando de Gigas o Teras de información, sino de Petabytes y Exabytes, cuyas cifras de ceros si lo pasamos a bytes se nos escapan por todos lados (para hacerse una idea, un Petabyte = 1015 = 1,000,000,000,000,000 de bytes).

Las “uves” del Big Data

Tradicionalmente, a la hora de trabajar con esta tecnología se ha hablado de tres “uves” que representan los aspectos clave necesarios para manejar estos volúmenes de datos: Volumen, Variedad y Velocidad. A esta ecuación las empresas pioneras en este terreno suelen añadir dos uves más, las que se refieren a la Veracidad y al Valor.

Comenzando por el volumen, no hace falta explicar mucho porque ya hemos mencionado la ingente cantidad de información que supone el Big Data. Información que puede presentarse con una variedad apabullante de formatos según el lugar de donde provengan (tal y como os contamos más adelante). Si sumamos estas dos magnitudes, volumen y variedad, lo que nos queda considerar es la velocidad que será necesaria para procesar todo esto. La idea, lógicamente, es obtener la información correcta en el momento preciso y poder responder con la rapidez necesaria, incluso en tiempo real, para no perder ni una sola oportunidad (por ejemplo con la realización de ofertas personalizadas a los clientes).

Al introducir la variable de la veracidad, entra en juego la necesaria confianza en los datos obtenidos, algo que sin duda puede entenderse como muy importante. Finalmente, se añadiría el valor, que se referiría a la importancia de el dato en concreto para un determinado negocio.

¿De dónde salen y cómo se clasifican?

Según su origen, los datos brutos manejados en este campo se dividen básicamente en datos estructurados y no estructurados, según tengan o no un formato específico que se pueda almacenar en tablas.

Los primeros constan de datos que tienen bien definidos su longitud y formato (como fechas, números o cadenas de caracteres) y por tanto se pueden almacenar en tablas más o menos estándar. Estos datos pueden recopilarse de muchas maneras: Pueden ser creados a propósito por empresas de investigación de mercados (a través de encuestas a clientes, grupos de discusión o programas de fidelización), provocados a través de la invitación a usuarios a expresar sus puntos de vista (sobre una experiencia de compra, por ejemplo) o recogidos en base a transacciones de compra completadas (ya sean off o online). También es importante considerar los datos compilados a través de censos y, en general, toda la información básica que se encuentra registrada sobre la población (identificación, estudios, antecedentes, datos médicos…).

Por su parte, los datos no estructurados son aquellos que no se almacenan en bases de datos tradicionales. Contienen información que, como su propio nombre indica, no está estructurada y, por tanto, no puede ser almacenada en estructuras de datos predefinidas. Dentro de esta categoría de datos se suelen incluir una tercera que es la de los datos semiestructurados. Estos serían los datos que no residen en bases de datos relacionales pero presentan una organización interna que facilita su tratamiento (por ejemplo el HTML o los documentos XML).

En cualquier caso, podemos encontrar que este tipo de datos pueden ser generados por el usuario o capturados. Los primeros serían los datos que las personas introducen en Internet diariamente (tweets, mensajes de Facebook, comentarios en webs…), mientras que los segundos se obtienen de a partir de la actividad pasiva de una persona, por ejemplo con la información del GPS de nuestro smartphone al introducir una dirección. Por otro lado, los datos no estructurados también se dividirían según sean de tipo texto (comentarios en RRSS, emails, documentos…) o no-texto (ficheros de  imagen, audio, video…).

Que es Big DataPara qué se utiliza el Big Data

Como venimos diciendo, los individuos creamos una enorme cantidad de datos que las empresas pueden utilizar para mejorar su relación con nosotros y obtener información sobre sus productos. El objetivo último del Big Data es convertir ese dato en información que facilite la toma de decisiones. Es, por tanto, una oportunidad de negocio. Muchas compañías ya lo utilizan para entender a sus clientes y su relación con productos y/o servicios que les ofertan. Gracias al Big Data las organizaciones empresariales pueden adecuar la forma en la que prestan servicio e interactúan con sus clientes. Sus aplicaciones abarcan casi todo el elenco de actividades económicas y sociales del mercado actual. Sin embargo, aún son pocas las empresas que saben aprovechar las ventajas de los nuevos ecosistemas.

Y lo cierto es que hacerlo puede llevarles a obtener importantes ventajas competitivas, como se ha demostrado en varias ocasiones. Un buen ejemplo es un caso que saltó a la opinión pública y que resulta muy significativo por tratarse de una compañía de las que operan fuera de Internet. Hablamos de Wallmart, conocida tienda de supermercados minoristas de los EEUU, que en 2004 experimentó las ventajas de la minería de datos. Revisando el contenido de sus gigantescas bases de datos con las transacciones realizadas en sus locales se fijaron en qué es lo que se había vendido y cuando relacionándolo con un dato en el que difícilmente se habrían fijado antes: la metereología.

Lo que descubrieron es que justo cuando se acercaba un huracán crecía la venta de ciertos artículos. Algunos de ellos (los utensilios de bricolaje) ya los conocían, pero se dieron cuenta de que también aumentaba la venta de una determinada marca de galletas, de la que los norteamericanos hacían acopio en sus despensas para capear el temporal. Con este dato en la mano, la cadena decidió que siempre que se acercara uno de estos fenómemos metereológicos se colocaran estratégicamente mostradores de estas galletas. Debían situarse junto a los productos básicos para protegerse de los huracanes y cerca de las cajas registradoras. El resultado, como podéis imaginar, fue un notable ascenso de sus ventas.

Una tecnología prometedora pero peligrosa

Ya entendemos mejor qué es el Big Data y para qué sirve, y quizá para cerrar este artículo deberíamos también hablar de sus riesgos. Sin duda, el principal problema en la adopción de esta tecnología está en los abusos que pueden derivarse del mal uso de la información. El Big Data, como motor de transformación de actividades económicas y sociales, tiene la capacidad de predecir el comportamiento humano, y esto puede llevar a que se juzgue a las personas sobre la base de lo que desvelan sus datos. Como en Minority Report, la conocida película protagonizada por Tom Cruise en la que se detiene a los delincuentes antes de que cometan los delitos basándose en la probabilidad de que los cometan de acuerdo a la información recopilada sobre ellos. ¿Llegaremos a ver un Gran Hermano como el que pronosticó Orwell en su libro 1984?

Sobre el autor de este artículo

Óscar Condés

Periodista todoterreno especializado en tecnología y con una amplia experiencia en medios de comunicación. Fotógrafo, realizador, bloguero, viajero y apasionado por la tecnología desde la era analógica. Asistiendo en primera línea de trinchera a los cambios de la revolución digital.