La revolución de los datos

260

Cada vez los humanos generan más datos de todo tipo. Transacciones de tarjeta de crédito, visitas a las web, encuestas, compras, ventas, y un largo etcétera. Información que es imposible de procesar para un ser humano. De Erasmo de Rotterdam se decía que había leído todos los libros escritos hasta su época. Hoy no se podría decir eso de nadie. La cantidad de información que se ha almacenado ha superado los 1020 bytes, acercándose a la cantidad de información almacenada en el DNA del hombre. Y sigue creciendo exponencialmente. Internet y los teléfonos celulares ha jugado un rol fundamental en esta expansión. Desde la década de los 80 hasta la última década la información disponible en el mundo se ha quintuplicado.

En la última década se ha utilizado el término Big Data para referirse a un conjunto de datos gigante, que proviene de distintas bases de datos y cuyo tamaño excede la capacidad de las herramientas actuales para almacenarla, procesarla y analizarla. Sin embargo, no existe una definición exacta y ésta depende siempre de los usuarios (algunos añaden que la velocidad con la que se crean los datos es un requisito para ser clasificado como Big Data, mientras otros hablan de un umbral de 200 gigabytes). Se asume además que el uso de este tipo de información presenta beneficios que no se obtendrían al trabajar con bases de datos más pequeñas. Que sea complicado trabajar con este tipo de datos no quiere decir que sea imposible. La reducción en los costos de almacenamiento de datos y el incremento en la capacidad de procesamiento de las computadoras han hecho posible el uso de una mayor cantidad de datos. ¿Quiénes son los usuarios? El principal motor hasta el momento ha sido el sector privado, que ha analizado patrones en las compras de sus consumidores para diseñar mejores estrategias de marketing y ser más rentables. Sin embargo, los hacedores de política económica y las organizaciones dedicadas al desarrollo internacional han empezado a utilizar estas herramientas para obtener mejores resultados. Einav y Levin (2014) señalan que la política económica podría beneficiarse al hacer uso de datos administrativos del gobierno, estimar nuevas medidas de la actividad económica del sector privado, mejorar las operaciones y servicios del gobierno, así como la calidad de los mismos.

Por lo general, siempre es costoso obtener datos en tiempo real y ahí radica una de las ventajas del Big Data. Por ejemplo, muchas veces puede servir para obtener estimados más confiables de las estadísticas oficiales. Así, la generación de luz eléctrica en se ha usado para estimar de manera no oficial el Producto Bruto Interno en países africanos donde la disponibilidad de datos oficiales es escasa. En otros, se han usado los “tuits” que hacen referencia a aumentos de precios como medida de la inflación. En Centroamérica, se está utilizando la información de celulares para predecir el estatus socioeconómicos de los habitantes por región. En el Massachusetts Institute of Technology, Alberto Cavallo, ha diseñado el Proyecto del Billón de Precios para obtener precios de miles de productos en distintas regiones de Argentina y estimar un índice de inflación más confiable que el oficial. El Ministerio de Finanzas de Colombia utiliza Google Trends para estimar un indicador en tiempo real de la actividad económica, y tomar decisiones en base al mismo, y así no esperar el mes y medio que toma la publicación del indicador oficial. Cuando aún trabajaba en el Banco Central de Reserva del Perú, teníamos un proyecto para medir la evolución del precio de viviendas en algunos distritos de Lima utilizando Google Trends.

El análisis económico se ha visto afectado. De acuerdo a Varian, el tamaño de los datos requiere herramientas informáticas más potentes; la cantidad de variables podría confundir al investigador y por ello es necesario hacer una selección adecuada de las variables a usar; y los datos podrían mostrar relaciones que no se podrían obtener con los modelos lineales que la economía suele usar, y los cuales favorecen la causalidad sobre la correlación. Sin embargo, algunos críticos señalan que no por tener más datos se piensa mejor, y que no se puede reemplazar la intuición y el buen juicio. Además, se incrementa el riesgo de asumir que ciertas correlaciones son relevantes cuando no lo son.

No todos se muestran optimistas con el uso de Big Data. Una preocupación válida es el efecto que puede tener sobre la privacidad de los agentes. Sin embargo, conforme la humanidad siga generando más datos sobre sus patrones de comportamiento y consumo, y mejores herramientas se creen para analizarlos, el uso de Big Data tiene el futuro asegurado.