Во имя «безопасности Ирины Яровой» операторам придется хранить 157 млрд гигабайт данных

Развитие событий: Сохранение тайны переписки в мессенджерах и соцсетях будет стоит 1 млн рублей (20 июня 2016)

В случае принятия поправок к законам "О связи..." и "Об информации...", операторам придется хранить в 100 раз больше информации о текстовых и голосовых сообщениях своих пользователей. Такое заявление сделала "дочка" "Ростелекома" - сообщил "Коммерсант".

По оценкам представителей отрасли, данные о голосовых вызовах и текстовых сообщениях всех пользователей за 3 года составят около 157 млрд гигабайт. Для этого требуется создать специальную систему для анализа массивов информации, разработать специальное ПО и построить несколько ЦОДов. Для этого потребуется затраты в размере трети годового бюджета России: от 4 трлн до 5,2 трлн рублей - отметили в РБК.

Для хранения информации необходимо будет закупать огромное количество жестких дисков и другого оборудования, которое не производится в России. "Указанные огромные затраты будут вложены в экономику Китая и других стран",— сказал один из участников совещания.

Принятие нового законопроекта, инициированного Ириной Яровой и Виктором Озеровым, обсудили вчера на заседании профильного комитета Совета Федерации. Проект входит в так называемый пакет антитеррористических законопроектов, который был принят в первом чтении 7 апреля этого года.

ТАСС распостранил замечание к закону чиновника надзорного ведомства:

Заместитель главы Роскомнадзора Олег Иванов считает практически невозможным контролировать исполнение законопроекта, обязывающего операторов хранить в РФ в течение трех лет записи разговоров, текстовых сообщений и изображений. Значит закон без ответственности операторов за его несоблюдение не будет работать.

"Тут очень много вопросов, на которые законопроект ответов не дает. Как возможно проверить полноту хранения этих данных? Если оператор по кому-то "затер" интересующую вас информацию, как вы это проконтролируете? Это практически невозможно".

Лучшие комментарии

  • Контекст комментария

    ZayunyaTyan

    1 мб в минуту
    60 мин
    24 часов
    365 дней
    3 лет
    146 000 000 людей
    230 212 800 000 000 итого, мб
    224 817 187 500 итого, гб
    157 372 031 250 итого*0,7 (сон)

    Какая точность :) Правда это для mp3, для звуковых файлов можно в десяток раз поменьше. Но лучше накрутить еще пару нулей и хранить заодно и видео. Раз уж собрались.

  • Контекст комментария

    Альтер Эго

    Ошибаетесь.

    Сотовые операторы и интернет-компании должны будут в течение 3 лет хранить информацию об активности своих абонентов и пользователей.

  • Контекст комментария

    Roman

    Упоминаемую оценку в 157 млрд гигабайт дал неназванный эксперт, в том и то и фишка )

    Давайте я тоже пожгу как «эксперт»:

    1. примем цену минуты для разговора двух абонентов в 50 копеек с взодящего, с потолка, меньше того что нашел за 3 мин.

    2. возьмем амазон гласир https://aws.amazon.com/ru/s3/pricing/ для хранения — 45 коп за гигабайт в мес:
    3.24 копеек за 2 мегабайта за три года (оба конца же храним)

    3. строим свой амазон гласир — если амазону выгодно так продавать, оптом большой тройке выйдет дешевле хранить.

    осознаем ужас ситуации — нужно с абонента + 6.5% (ноль целых восемнадцать сотых процента) дополнительно взять чтобы не разориться (на тарифе в 50 копеек).

    вспоминаем что битрейт на hd voice 64 килобит/сек (минута уже не 2 мб в оба конца а меньше 1 мб) и делим на 2 надбавку, получаем 3.3% роста тарифов.

    как-то так.

Добавить 25 комментариев

  • Ответить

    1 мб в минуту
    60 мин
    24 часов
    365 дней
    3 лет
    146 000 000 людей
    230 212 800 000 000 итого, мб
    224 817 187 500 итого, гб
    157 372 031 250 итого*0,7 (сон)

    Какая точность :) Правда это для mp3, для звуковых файлов можно в десяток раз поменьше. Но лучше накрутить еще пару нулей и хранить заодно и видео. Раз уж собрались.

  • Ответить

    > А интернет-провайдерам и операторам хостинга тоже
    > нужно будет весь трафик хранить?

    Не. Там обязали форумные площадки и прочие соцсети хранить полгода все действия пользователей, если не ошибаюсь.

  • Ответить

    Ну под активностью понимается что, вообще весь трафик, или всё же только доступ к адресам тех или иных ресурсов? Насчет журналов доступа, мне казалось, они и так сто лет в обед это делают. Иначе как-то же работают ОРМ (типа «я тебя по ай пи вычислю!»)?

  • Ответить

    Упоминаемую оценку в 157 млрд гигабайт дал неназванный эксперт, в том и то и фишка )

    Давайте я тоже пожгу как «эксперт»:

    1. примем цену минуты для разговора двух абонентов в 50 копеек с взодящего, с потолка, меньше того что нашел за 3 мин.

    2. возьмем амазон гласир https://aws.amazon.com/ru/s3/pricing/ для хранения — 45 коп за гигабайт в мес:
    3.24 копеек за 2 мегабайта за три года (оба конца же храним)

    3. строим свой амазон гласир — если амазону выгодно так продавать, оптом большой тройке выйдет дешевле хранить.

    осознаем ужас ситуации — нужно с абонента + 6.5% (ноль целых восемнадцать сотых процента) дополнительно взять чтобы не разориться (на тарифе в 50 копеек).

    вспоминаем что битрейт на hd voice 64 килобит/сек (минута уже не 2 мб в оба конца а меньше 1 мб) и делим на 2 надбавку, получаем 3.3% роста тарифов.

    как-то так.

  • Ответить

    «Как мы будем это хранить? Как мы будем контролировать исполнение?» — милые пушистые вопросы. Вопросов о необходимости этого решения, о контроле доступа и о контроле злоупотреблений не стоит?

  • Ответить

    там в моих скобочках про проценты должно быть «шесть с половиной», ну да ладно, экспертам как видно и не такое прощают.

  • Ответить

    Отличная методика и очень хорошее замечание, что надо, действительно, считать 3 года, начиная от момента введения закона в действие. То есть складировать некоторые данные начиная со дня посадки яровых, а не всё что было в теории 3 года назад непонятно когда.

    P. S. Предложу альтернативную методику. Так как Яровая предложила хранить трафик, то и для исходной точки отсчёта и надо брать трафик. Тот же магистральный трафик «Ростелекома» — вполне измерим, загрузка каналов понятна. Именно эту «нагрузку гигабит в секунду» по всей сети Ростелекома (и не только Ростелекома, а ещё и сотовых операторов и микроскопических провайдеров) и надо брать за единицу для умножения. А не объём чистого голоса с компрессией.

  • Ответить

    с трафиком магистральным мне лично тяжко связываться в расчетах — нужно знать как он агрегируется, расходы на сигнальную сеть, это все потом вычитать.

    по части других методик оценки ситуации — можно втупую MOU среднюю на заявленное количество абонентов и на 36 месяцев помножить и узнать сколько реально тысяч петабайт нужно за три года хранить. потом сравнить с выручкой за сотовую связь и осознать что на 1 петабайт приходится XXX млн руб выручки. это уже домашка для пытливых читателей.

    MOU и выручка по «гроссе тройке» тут: http://www.rbc.ru/technology_and_media/19/05/2015/555b4a569a79476442eee0cc

  • Ответить

    Ну как бы яровая то вкурсе что есть шифрование в мобилках? То есть у злодеев и шпионов сначала пройдёт обмен уникальными симметричным ключами, зашифрованными открытыми ключами, а потом пройдёт обмен голосовым трафиком по зашфрованному каналу, это самый простой способ классический так сказать (не как у дурака дурова) любой школяр на питоне слобает пагу за полчасика, на базе клиента ssh и какого нибудь Twofish 256, который никогда никем даже теоритически не вскрывался. Раз злодеев и шпионов так ловить бесполезно, то почему бы и не сохранить весь голосовой трафик навсегда, к чему эти несчастные три года? Давайте сразу весь с 1 июня (чё тянуть) 2016 и до скончания времён, через 50 лет всё в открытый доступ, сервис я думаю себя отобьёт, всем инетересно о чём говорили твои родители 50 лет назад, круче бессметрного полка будет, так сказать застрянем в прошлом, послушаем, подрочим, может вспкланём о прекрасном ушедшем времени, когда тупые бабы писали законы для IT идустрии.

  • Ответить

    Експерты… В энторнетах можно прочитать
    1. Сколько голосовых потоков поддержит один поток сигнализации.
    2. Что используемые голосовые кодеки — ни разу не HD.

    У Ивана Ильина отличная методика перевода килограммов в километры. Какую-нибудь топологию РТК Х-летней давности, я думаю, тоже можно в энторнетах найти. Может скажете, сколько Мб/Гб? Заодно узнаете, что на магистрали — она самая компрессия и есть…

  • Ответить

    1. Официальное мнение больших операторов по минутам есть в открытой отчетности. Ширину канала берите FR — это учтет и жадных и добрых. Долю больших операторов возьмите по guesstimates — сильно не ошибетесь.
    2. Зачем Вам голос, когда дата его на порядок перекроет? Не говоря уже о том, что вычитать/делить/умножать сигнализацию — это морочиться с ошибкой округления.

  • Ответить

    Всё это в рамках тенденции полного удушения малого и среднего бизнеса. Это видно по инициативам. Здесь — операторов.

    Последний «СОРМ-3» требует от операторов иметь «кольцевой буфер» для хранения трафика за 12 часов. Это значительные затраты. Теперь это надо будет выкинуть и покупать новое.

    Хотя как доходит до дела — присылают запрос по факсу.

  • Ответить

    Пришёл в голову альтернативный метод подсчёта «на глазок». Если закон об «архиве Большого брата» предусматривает сохранение текстов, переговоров, видео и картинок, переданных через русских операторов, то логично посмотреть на систему, где с 10 октября 2006 сохраняются тексты, видео, картинки и музыка (грубо говоря «переговоры») всех россиян. Известно, что ВК охватывает всех подключённых россиян и не только россиян, и умещается в Селектеле и ИЦВА. Эти дата-центры ни в коем случае не стоят триллиард-трилионов, но и переговоры, и даже всё полнометражное кино России в себя вмещают. Объём SMS, наверняка, меньше объёма текстовых реплик в ВК. Музыкальный архив заведомо имеет в разы лучшее качество, чем качество голоса в сотовой сети.

    Отсюда вывод — закон Яровой исполним. Трилиард-трилионов рублей и дата-центр очередного Богданчикова, размером со всю Тверскую область — не нужен. Всё значительно скромнее.

  • Ответить

    80 миллионов человек заходят в ВК каждый день и что-то там кликают или даже пишут друг-другу. 80 миллионов — цифра того же порядка, что и население РФ. Даже если будут заходить 160 миллионов, а не 80 — для хранения всех данных потребуется просто два Селектела и две ИЦВА. На фоне триллион-триллиардов рублей — это всё-равно небольшое число дата-центров.

  • Ответить

    По моему мы обсуждаем бред сивой кабылы ;) это ничего не изменит. Всё это уже было и не отменит никак свободное общение, VPN и эру мессанджеров с полностью зашифрованным трафиком, товарищ Joshua Happytree кстати прав кодеки сильно снижают качество и объём голосового трафика, это вам не музло на mp3, так что надеемся операторам сильно больно не будет, ну и верим, скрестив пальцы, что американцы сделают побыстрее квантовую связь, тогда весь этот понос прекратиться, развлекаться слежкой за населением будет невозможно в принципе, придётся оторвать жопы от стульев и как до изобретения сотовых телефонов занятся оперативной работой и ловлей преступников не по звонкам сотовых.

  • Ответить

    >80 миллионов человек заходят в ВК каждый день и что-то там кликают или даже пишут друг-другу. 80 миллионов — цифра того же порядка, что и население РФ.

    80 миллионов — это влажные мечты вконтакте. Фраза «Более 80 000 000 посетителей заходят на сайт каждый день.» совершенно не тождественна фразе «80 000 000 реальных анкет». Верю ли я, что каждый второй житель там топчется каждый день? Нет. А если есть одна лжа, значит, смело делим на 10 и получаем более точное значение и полученные 8 млн от 146 больше похоже на статистическую погрешность :).

  • Ответить

    В этом случае вы с равной вероятностью не верите во влажные мечты билайно-мегафона-мтс-ростелеком о двух сотнях пользователей телефона. Поэтому «правило» продолжает действовать. Если везде числы правда — работает. Если везде числа завышают — тоже работают. Нужно не более двух Селектелов и двух ИЦВА на всё про всё.

    P. S. Основной владелец ВКонтактов, Мейл.ру и МегаФонов (и телеканалов) — одинаковый. Поэтому либо он врёт всегда, а МТС и Билайн с Ростелекомом ему это позволяют (так как в ответ выяснится, что и они врут), либо он не врёт, и цифры правильные и у Мегафонов и у ВК. Но на самом деле это не имеет значения вообще никакого. Даже если допустить, что линейка измерения у нас со сбитым нулём — всё равно получается, что гигантский объём человеческого общения русских за 10 лет умещается (де факто) в скромные Селектелы и ИЦВУ.

  • Ответить

    > не верите во влажные мечты билайно-мегафона-мтс-ростелеком о двух сотнях пользователей телефона.

    Верю, у многих по две симки, у меня тоже не менее двух.

    >Даже если допустить, что линейка измерения у нас со сбитым нулём

    А если с тремя сбитыми нулями? :) Во-первых, точная статистика людей неизвестная (нам. мне.). Во-вторых, только 10% (как ранее где-то указывалось) контент не создают и хранить ничего не надо. 3) Очень вероятно, что сервера чистятся, т.к. если, например, погуглить раздел «Документы» не особо там и много чего интересного, как раз по ощущениям 1/10, значит, может и остальное удаляют. Ну вот, три порядка ушли. Осталось 800 000 активных.