Big Data y las políticas públicas, por Karelys Abarca

"Éxito del uso y aplicación de sistemas de grandes datos depende de la óptima complementación de los métodos tradicionales de estadística y econometría con las nuevas fuentes de creación de datos"

0
4841

Artículo publicado originalmente en América Economía

El mundo de hoy se caracteriza porque los datos son los nuevos factores productivos fundamentales de la economía digital, tal como las materias primas, bienes de capital o capital humano lo son en el modelo económico tradicional. Con el desarrollo de las tecnologías disruptivas de la Cuarta Revolución Industrial, los datos han pasado de ser escasos a masivos, y esto es así porque cualquier agente económico conectado, a través de un dispositivo electrónico, es un productor permanente de datos.

Big Data o los “grandes datos”, llamados también datos masivos, se caracterizan por su gran volumen, la velocidad con la que se generan, la variedad de sus fuentes (texto, audio, video, redes sociales) y variabilidad (cambio de patrones de comportamiento), toda una complejidad en acción. No obstante, los datos masivos, como los denomina el Banco Interamericano de Desarrollo (BID) son una importante palanca para hacer transparente y eficiente la política pública, bien sea desde su diseño (ayudando a definir hacia dónde debe enfocarse la política, dadas las necesidades que manifiestan los ciudadanos a través de datos de origen digital) o en el monitoreo de las mismas (gracias a los resultados que pueden recogerse directamente de los agentes o actores involucrados en tiempo real).

Los datos masivos sin procesar no revisten de valor si no se construye con ellos aplicaciones valiosas, como lo son políticas públicas apalancadas en la respuesta oportuna a las necesidades ciudadanas. Para el procesamiento y análisis de los “grandes datos” (Big Data) ha surgido una nueva ciencia llamada “Ciencia de Datos” (Data Science) que combina computación, matemáticas, estadística, econometría e investigación de operaciones en una misma disciplina, para lo que resulta necesario realizar un proceso donde se exploran los datos disponibles, se formulan hipótesis, se recopilan datos, se limpian datos, se analiza la consistencia de los mismos, se elaboran modelos y algoritmos adecuados, se implementan esos algoritmos, se interpretan resultados y se toman decisiones planificando y asignando recursos.

El procesamiento de los grandes datos o Big Data se realiza en dos etapas principalmente: la gestión de datos y la analítica de datos. La gestión de datos comprende la adquisición y almacenamiento de datos, limpieza y depuración de los mismos y su preparación para el análisis. Mientras la analítica de datos se refiere a dar respuestas a las preguntas a partir de las hipótesis planteadas en el modelamiento de datos.

Big Data y Data Science son proveedores de evidencia fundamental para el diseño y seguimiento de políticas públicas, porque enfocan la toma de decisiones en datos relevantes que produce la misma sociedad, como información sobre pobreza, crimen y seguridad, transporte y salud, así como necesidades o percepciones de la prestación de servicios públicos. Especialmente, los datos masivos y la nueva ciencia de datos, representan una importante oportunidad para incorporar activamente en las decisiones a la sociedad civil, además de garantizar una mayor eficiencia en los mercados, al mitigar las asimetrías en la información.

Eso sí, aunque estas nuevas palancas disruptivas de la economía digital podrían hacer más eficiente la política pública en tiempo real, también hay que tomar en cuenta que la masividad de datos no significa necesariamente representatividad y que la analítica de datos no es una disciplina enteramente objetiva. También hay que tomar en cuenta que es altamente probable que el alto volumen estadístico produzca correlaciones espurias entre variables, que no siempre sean fáciles de corregir.

De hecho, el éxito del uso y aplicación de Big Data y Data Science depende de la óptima complementación de los métodos tradicionales de estadística y econometría con las nuevas fuentes de creación de datos, por lo que es importante reconocer que la nueva ciencia de datos es un medio para enfocar la toma de decisiones óptimas y no un fin en sí mismo, ni mucho menos una moda.

Los temas pendientes por resolver en el uso de datos masivos, dado que contienen información personal de los usuarios de dispositivos móviles, tienen que ver con la protección de la información privada de personas, el análisis de datos privados que puede vulnerar la privacidad de los usuarios, la propiedad de esos datos masivos (es decir, derechos y licencias para su uso y aprovechamiento) y la responsabilidad legal de la analítica de datos.

Las potencialidades del Big Data y Data Science para tener políticas públicas más efectivas son muy amplias, pues representan palancas innovadoras para articular la planificación de recursos, optimizando la inversión pública al dirigirla directamente a las necesidades reales de la ciudadanía. Es por este motivo, que en los países debe incentivarse a la formación de ecosistemas digitales, que permitan el uso de estas herramientas para promover la participación de los ciudadanos en la toma de decisiones y en el diseño de políticas públicas, enfocándolas en lo que la misma sociedad civil revela a través de las fuentes de datos digitales.

En casos como el de Venezuela, donde la opacidad en el manejo de los recursos y políticas públicas (especialmente las económicas) se ha institucionalizado gracias a la falta de datos, la aplicación de Big Data y Data Science ha sido vital para desvelar fenómenos ocultos formalmente, como la hiperinflación, que se conoce en magnitud gracias a aplicaciones móviles a través de las cuales los consumidores recopilan información de precios directamente en establecimientos en tiempo real. Por lo tanto, si el objetivo es que la sociedad civil recupere su participación activa en la vida democrática y en la definición de las  políticas que directamente la impactan, así como lograr el pleno restablecimiento de la economía de mercado, es necesario que la ciudadanía cuente con los datos pertinentes para la mejor toma de decisiones, aunque las fuentes gubernamentales puedan negar permanentemente el acceso a la data oficial.