El INE quiere acceder al big data de los grandes retailers para medir el IPC
El Instituto Nacional de Estadística negocia con grandes empresas de supermercados como Mercadona y Lidl el acceso a sus bases de datos. De momento, el INE ya tiene el sí de El Corte Inglés, Auchan Retail España y Carrefour.
El Instituto Nacional de Estadística (INE) negocia con grandes empresas de supermercados como Mercadona y Lidl el acceso a sus bases de datos para medir el Índice de Precios de Consumo (IPC) de una manera más eficiente, precisa y completa. La idea es que este proceso de recogida de información pueda aplicarse ya en 2020, según han indicado a Europa Press fuentes del organismo.
De momento, el INE ya tiene el sí de El Corte Inglés y de Auchan Retail España (Alcampo y supermercados Sabeco), con los que ha suscrito un convenio por el que proporcionarán semanalmente al INE información sobre los productos comercializados en todos sus establecimientos. El organismo estadístico también está colaborando ya con Carrefour, aunque aún no ha firmado el correspondiente convenio, precisaron las mismas fuentes.
La mayor parte de la información que utiliza el INE para el cálculo del IPC se obtiene mediante la visita de su personal a establecimientos representativos de cada sector, seleccionados previamente en cada provincia. En total, se recogen 220.000 precios todos los meses en 33.000 establecimientos.
Los 'visitadores' del INE todavía trabajan en papel, aunque se espera que en breve puedan salir a realizar su labor de campo con tablets, lo que les permitirá recoger la información de los precios de los productos en tiempo real.
CAMBIOS EN LA RECOGIDA DE DATOS: SCANNER DATA Y WEB SCRAPING
Pero además de cambiar el sistema de recogida de datos (de papel a instrumentos electrónicos), el INE quiere conseguirlos a través de nuevas fuentes: el 'scanner data' y lo que se conoce como 'web scraping'.
El 'scanner data' consiste en utilizar la información registrada por los comercios minoristas en la línea de caja de cada uno de sus establecimientos. Normalmente, esta información incluye el número de unidades vendidas y los ingresos para cada uno de los productos comercializados y que cada compañía clasifica según sus propios criterios.
Este método de recogida de información ya se utiliza en otros países y Eurostat promueve su uso en el ámbito de la armonización de los índices de precios de los Estados miembros de la UE. Para que sea una realidad en España, el INE recuerda que se necesita la colaboración de las empresas.
Mediante el 'scanner data' se obtendría información de todas las variedades vendidas de un producto, a diferencia del procedimiento habitual para calcular el IPC, en el que se realiza un seguimiento de precios de una única variedad en cada establecimiento. Además, este sistema permitiría 'captar' ofertas y promociones, lo que puede o no suceder con el sistema actual.
La otra fuente de la que espera 'beber' el INE para mejorar el cálculo del IPC es lo que se conoce como 'web scraping', que consiste en la obtención automatizada de información sobre precios de algunas páginas web de empresas que prestan servicios a través de Internet, como las agencias de viajes.
El problema para aplicar este método de recogida de datos es el recelo de las empresas: algunas activan cortafuegos para evitar la obtención de estos datos. El INE ya ha iniciado contactos para conseguir que las compañías que venden productos por Internet autoricen al organismo a recabar la información que precisa para incluirla en el cálculo del IPC.
Desde el INE defienden que la utilización de fuentes de Big Data en la estadística oficial reduce los costes de las encuestas, tanto a los informantes como a los productores de las mismas, acorta los plazos de publicación y puede proporcionar nuevos datos sobre aspectos sociales y económicos aún no estudiados.
La estadística del INE que moviliza más recursos es el Censo, que se publica cada diez años. En muchos países de América Latina los censos se elaboran a partir de 'toques de queda': nadie sale de casa hasta que se le censa, una operación que lleva varios días y que da lugar a muchos errores.
Archivado en
No hay comentarios