Big Data

Pongamos el big data a dieta

Escrito por Autor Invitado

Big data es uno de los temas del momento pero ¿saben las empresas qué tienen que medir y cómo pueden ayudarles los datos en la toma de decisiones?

Big data es uno de los temas del momento. De hecho, dependiendo de en qué sector te muevas, big data es ‘EL tema’. Nos dicen que se trata del “nuevo petróleo” que nos dará una ventaja competitiva nueva y, sobre todo, medible. Con el tiempo, dicen, podría dejar obsoleto el método científico. Estas predicciones dan por hecho con total certeza y fé ciega que la revolución del big data es inminente. Sin embargo, se olvidan de mencionar qué deberían hacer las empresas con los datos. Esta insistencia en hacerse grande (previo pago, por supuesto) parece extraña en el actual momento económico, en el que las grandes empresas aspiran a actuar cada vez más como startups. Y las preguntas que los evangelistas del big data ignoran son, precisamente, las más reveladoras: ¿qué debería medir? ¿Cómo pueden ayudarme los datos en la toma de decisiones? ¿En qué debo invertir para utilizar bien los datos?

El big data puede hacer la mayoría de cosas que hace un portátil. La diferencia es, simplemente, que lo hace a escala industrial. En contraste, podemos usar el término lean data para referirnos a una aproximación en la línea de la Navaja de Occam a la captura y análisis de datos: el modo más ligero y simple para alcanzar los objetivos es el mejor.

Aquí van cuatro razones para preferir lean data a big data.

 

1. Empezar a lo “grande” es empezar la casa por el tejado

Sin saber cuáles son tus necesidades de datos, es contraproducente partir de la asunción de que lo que necesitas son datos a escala industrial. Si tu estrategia consiste en recopilar unos cuantos miles de puntos de datos al día, entonces no estás en el club del big data. Y puede que los datos más relevantes sean bastante pequeños, como le ocurre, por ejemplo, a la startup de Austin Food on the Table (descrita por Eric Ries en su libro The Lean Startup), que al principio ofercía su servicio de planificación de menus familiares solamente a unos pocos clientes.

2. Las herramientas que necesitas ya las tienes

Es más que probable que la cantidad óptima de almacenamiento de datos y capacidad de procesamiento de tu negocio sea menor que la de Google. El concepto de Lean Data se basa en elegir las herramientas adecuadas para lograr objetivos adecuados al tamaño y orientación del negocio, y seguramente ya dispones de ellas.

3. La ley de los rendimientos decrecientes aún está vigente

Afirmaciones como “los datos son el nuevo petróleo” hacen que parezca que los datos son divisas, cuando realmente son una inversión. En todas las mediciones estadísticas, una vez que se han reunido suficientes datos para establecer un resultado, añadir más puntos de datos puede suponer una disminución de la precision. Esto debería ser una preocupación acuciante para todo aquel que está invirtiendo grandes cantidades de dinero, tiempo y recursos en la captura y análisis de datos.

El experto en estadística estadounidense Nate Silver utiliza con frecuencia encuestas con tamaños de muestra que oscilan de cientos a miles, y su modelo representa explícitamente los rendimientos decrecientes.

4. La parte más difícil todavía la hacen los seres humanos

El pequeño secreto del big data es que ningún algoritmo puede decirte lo que es relevante o desvelarte su significado. Los datos se convierten entonces en otro problema que resolver. El enfoque del Lean Data supone empezar con preguntas relevantes para el negocio y encontrar maneras de contestarlas a través de datos, en lugar de dedicarnos a cribar incontables conjuntos de datos.

Es más, la extracción puramente algorítmica de reglas a partir de datos tiende a generar conexiones falsas, como correlaciones incorrectas.

No quiero decir con todo esto que no haya oportunidades en el big data. Constantemente se producen nuevos avances que requieren mayores cantidades de capacidad de procesamiento de datos, y las grandes compañías, casi por definición, necesitan hacer frente a vastos conjuntos de datos. Pero el actual hype del big data parece darle más importancia al acopio indiscriminado de datos que a ayudar de verdad a los negocios a tomar las decisiones acertadas.

 

El autor de este artículo es Matti Keltanen, consultor de diseño en Fjord, experto en diseño de servicios digitales y unos de los encargados de definir cómo se deberían utilizar los datos en el proceso de creación de un nuevo servicio digital para cualquier plataforma.

 

 

 

Sobre el autor de este artículo

Autor Invitado