Quien trabajando en una profesión relacionada con la obtención e interpretación de información no hubiese oído hablar de “Big Data” durante 2012 tiene alguna razón para preocuparse. Sus redes no le han servido para estar al día. Porque “Big Data” fue “the hot IT buzzword of 2012”. Pero todavía no es demasiado tarde, pues el término “Big Data” sigue siendo “the buzzword du jour” y el “marketing theme du jour” (Admap, September, 2013).
Big Data es un tema complejo y evaluar su interés y repercusión no es tarea fácil. Todo el ruido en torno a Big Data, no cabe duda, tiene una parte de moda que, como a menudo ocurre en este tipo de fenómenos, cuenta con apóstoles que mantienen opiniones exageradas y no siempre desinteresadas. Pero evitemos la tentación de desestimar el fenómeno sin darle una oportunidad. ¿Qué es Big Data? ¿Qué relevancia tiene para la investigación de mercados?
Para entender que es Big Data es importante recordar un hecho que determina nuestra época. La cantidad de información almacenada en el mundo crece de manera exponencial. Se estima que en 2013 esta información, que en más de un 98% está en formato digital, llegará a los 1.200 exabytes. La información almacenada se estima que crece 4 veces más rápidamente que la economía mundial. A esto hay que añadir el crecimiento de la capacidad de procesamiento computacional, que se estima crece aún más rápidamente, a una tasa 9 veces superior.
Para Viktor Mayer-Schönberger y Kenneth Cukieres, autores de “BIG DATA: A Revolution that will transform How We Live, Work, and Think”, estos cambios cuantitativos en la cantidad de información y en la capacidad de tratarla automáticamente han producido un salto cualitativo. Este libro es una buena referencia para conocer lo que podríamos denominar posición maximalista respecto a Big Data. Desde este enfoque, los rasgos básicos de la nueva forma de entender el análisis de datos serían los siguientes.
- No es necesario entender el porqué, solo el qué. Debemos y podemos desprendernos de la obsesión por la causalidad y centrarnos simplemente en las correlaciones, para conocer el qué sin importar el porqué.
- El objetivo esencial de Big Data está en la predicción. Pero no una predicción inteligente intentando entender la realidad. No, no se trata de hacer que los ordenadores piensen; se trata simplemente de aplicar matemáticas a inmensas cantidades de datos con el objetivo de inferir probabilidades.
- Al ser capaces de analizar tal cantidad de datos es posible establecer conexiones que ni tan siquiera habíamos imaginado que pudieran existir. Las hipótesis ya no son necesarias. Ahora es posible dejar a los datos hablar por sí mismos para que nos revelen patrones ocultos y obtener insights que nos permitirán decidir y actuar más eficientemente.
- Nos adentramos en un mundo de continuas predicciones dirigidas por los datos en el que a menudo no seremos capaces de explicar las razones de nuestras decisiones.
El libro de Viktor Mayer-Schönberger y Kenneth Cukieres recoge un buen número de ejemplos donde las técnicas y la filosofía de Big Data se han aplicado exitosamente y es un buen exponente de una posición maximalista y diría que exagerada respecto a Big Data. Como alguien ya ha dicho, hablan de Big Data y parece que lo hacen de Magic Data.
Estoy convencido que el conjunto complejo de enfoques y técnicas que se ha venido en denominar Big Data supone un cambio importante en la forma de tratar, entender y utilizar la información. Pero para aprovechar el nuevo enfoque no es necesario aceptar los principios más maximalistas. Desde una aproximación más crítica a Big Data me gustaría señalar un par de puntos:
- Los principios analíticos de Big Data no necesariamente han de ser aplicados a una gran cantidad de datos. El énfasis en cantidades enormes de datos es seguramente una posición interesada de los desarrolladores de software. La esencia de Big Data es la búsqueda de patrones y la detección de insights desde un enfoque más abierto que el que aplica el estadístico frecuencialista tradicional.
- El imperio de la correlación y la erradicación de las hipótesis en el análisis de datos no son, en mi opinión, más que exageraciones, algunas veces interesadas (a fin de vender sistemas que analizan solos), otras simplemente ingenuas. No nos hagamos ilusiones: los datos nunca van a hablar solos
Una buena introducción a lo que es y supone Big Data se puede encontrar en el ebook “Big Data Now”, O`Really Media, Inc. Por otro lado, en el número de septiembre de Admap se dedica un especial a Big Data que incluye interesantes artículos desde la perspectiva del márketing.
BIG DATA is big enough y suficientemente interesante para merecer la atención de los profesionales de la investigación de mercado.
Miguel Muñoz
Director General, CONECTA R&C