Росстат разместил заказ на обслуживание системы сбора и аналитики больших данных из различных источников для их использования в расчете инфляции и ведении статистики торговли. Судя по техзаданию, исполнитель будет заниматься обработкой чеков контрольно-кассовой техники, которые Росстату передает ФНС. Сумма контракта – 20 млн руб. При этом Росстат собирался внедрить новую методику по расчету инфляции с использованием данных онлайн-чеков уже в этом году. В конце 2021 г. в ведомстве объявили, что проведут эксперимент по использованию новых источников данных в расчете индекса потребительских цен в течение 2022 г. и, если результаты будут корректны, начнут внедрять их в методику с 2023 г. Планы использовать big data в статистике анонсировал руководитель Росстата Павел Малков еще в 2020 г. (сейчас он работает губернатором Рязанской области, а ведомство возглавляет Сергей Галкин).
Согласно информации на сайте Росстата, основная проблема при автоматическом сборе заключается в том, что каждая организация сама вносит названия товаров в базу, а потому в разных магазинах они отличаются. Например, только в Москве батончик Snickers имеет 1500 вариантов внутреннего наименования. Предполагается, что в будущем нейросеть Росстата сможет автоматически распознавать названия товаров и точно идентифицировать их. На ПМЭФ-2023 Росстат заключил рамочное соглашение с X5 Group, которое предусматривает обмен информацией и реализацию совместных проектов в области статистики цен, отметил представитель Росстата. Сейчас обсуждаются параметры этих проектов и алгоритм участия. Как сообщил директор по взаимодействию с госорганами X5 Group Станислав Богданов, сейчас происходит процесс обкатки информационного обмена между сетью и Росстатом. «Пока все это тестируется на данных по ценам в нескольких товарных категориях в отдельных магазинах Х5 с прицелом на дальнейшее масштабирование», – сообщил он.