29 января арбитражный апелляционный суд удовлетворил иск «ВКонтакте», обязав компанию Double Data, которая занимается созданием Big Data решений с помощью открытых данных, прекратить использовать данные пользователей соцсети. Во взыскании символической компенсации в размере 1 рубля истцу отказали. Об этом сообщают представители «Сколково», чьим резидентом является Double Data. В «Дабл» собираются обжаловать постановление апелляционной инстанции. Решение может быть оспорено в течение двух месяцев.
В январе 2017 года «ВКонтакте» подала иск в Арбитражный суд Москвы на Double Data и Национальное бюро кредитных историй. Представители социальной сети были недовольны, что те используют открытые данные пользователей и продают собранную информацию банкам. За нарушение прав «ВКонтакте» требовала взыскать с Double Data и НБКИ по одному рублю. НБКИ предлагала кредитным организациям сервисы на основе технологий, которые были разработаны Double Data, - они оценивают кредитоспособность заемщиков по данным. Последняя компания извлекала из базы данных ВК фамилии, имена, сведения о месте работы и учебы, анкеты друзей, информацию о месте рождения, регионе проживания, фотографии, сведения о количестве посещений соцсети и типе устройства. 15 августа соцсеть и НБКИ заключили мировое соглашение.
В октябре Московский арбитражный суд полностью отклонил все требования «ВКонтакте» к Double Data. Тогда представитель соцсети сообщил, что, судя по всему, суд не до конца разобрался в технической стороне вопроса, и они «обязательно будут разъяснять все детали». «Считаем, что возможность бесконтрольно собирать данные внутри соцсети нарушает права пользователей и ВК», - заявляли в компании. Согласно материалам суда, «истец представил доказательства, которые не были раскрыты». Тогда «ВКонтакте» не удалось доказать свои права на базу данных и факт извлечения ответчиком материалов с помощью поиска информации о пользователях соцсети.
По словам генерального директора ООО «Дабл» Максима Гинжука, решение апелляционного суда ограничивает свободу поиска и доступа к открытой информации в интернете. Он добавил, что их поисковая система работает по аналогии с поисковыми системами «Яндекс», «Гугл» и другими, она работает с сайтами и не позволяет извлекать что-либо из баз данных этих сайтов. «Данное решение опасно для развития Цифровой экономики, поскольку это первый шаг к запрету деятельности многих Big Data стартапов, поисковиков Yandex, Google и других компаний», - также по словам Гинжука.
Управлящий партнер Центра интеллектуальной собственности «Сколково» Антон Пушков заявил, что постановление суда противоречит материалам дела. «Представленные «ВКонтакте» материалы подтверждают техническую закрытость базы данных социальной сети для доступа третьих лиц. Поиск ООО «Дабл» по страницам сайта «ВКонтакте» не приводит к переносу содержания базы данных и нарушению исключительных прав, так как сайт и база данных не одно и то же», - объяснил Пушков.
Добавить 29 комментариев
Такая корова нужна исключительно самому
Во. Опять реквестую сюда в тредик Ашманова. :)
И не очередного срачика ради, а поскольку, как я понимаю, он тоже использует технологию по извлечению и обработке публичных данных пользователей. В прошлый раз он мне ответил что-то вроде «пока еще по этому предмету ничего не ясно», к сожалению, ссылку нагуглировать никак не удалось. А ведь предмет интересный.
Ну, эта история не закончена.
Пока нет закона о БПД. Такой закон разрабатывает, в частности, ФРИИ. С целью не только упорядочить и отрегулировать оборот с защитой прав пользователей, но и создать цивилизованный рынок БПД.
Сейчас ВК точно так же является нарушителем.
И уж точно НЕ является собственником данных своих пользователей.
Закон этот будет разработан и принят где-то в 2019.
Можно по разному относиться к Контакту, но рассеянцам изображающим из себя продвинутых либерлов, техноилиту, и прочая, прочая, прочая… «не совков» — пора привыкнуть к цивилизованным принципам работы, а не пытаться сидеть на двух стульях — слюняво мечтая о возможности вести некий «цивилизованный» бизнес, при этом в деревенском стиле тупо воруя, все что гвоздями не прибито.
Говоря словами героя фильмов Степаныча — не все можно, что стоит, а говоря словами цивилизованных людей — не все выложенное в свободный доступ, разрешено использовать на цели бизнеса всем подряд.
Да возможно сам контакт как и мордокнига будет использовать мои данные в этих же целях, но им я дал на это разрешение подписав соглашение при регистрации.
А вот всяким мутным шарашкам, бюро и прочим «посанам с раёна» я ничего не разрешал. Хочешь? Спроси разрешения… А принцип «некогда нам у каждого холопа разрешения спрашивать» мы вроде уже проходили. Причем не только в вашей стране…
Ого. Мегазнаток глобального закона отметился.
уже не первый раз это пишу и наверно становится все более актуальным)))
Судя по обилию «стартапов» мечтающих нажица на бигдата, а также вообще переводу этих бигдата чутьли не в статус «госнедра» (ктото делал и такое предложение), возникает массоава необходимость в «эмуляторе соц.активности», кторая сама, за пользователя, имитируя ручной ввод, будет шароебица по соцсетям и прочим ресурсам, оставлять «правильные» комменты, и вообще, создавать о своем «пользователе» потрясающее впечатление.
Тексты за основу можно демидовские взять. Творчески перелопатить и сувать везде как точку зрнеия.
Очень умный и образованный прохиндей — он и сам, вручную, о себе такое впечатление создаст. Потом весь наализ его активности будет показывать — это суперправильный чувак!
Ну а кто поглупее — тот (как и диплом и диссер) купит себе эту прогу и она будет молотить за него, создавать «репутацию». Для среднего кадровика или глупово начальника — это сойдет.
До кучи можно и тексты всяких исповедей скачивать. Небесполезно сходить типо раскрыть душу, чтобы офигели, какой чувакто правильный!
Эта технология подробно описано задолго до соцсетей, у писателя Бокаччо, в первой новелле Декамерона.
Там примерно в таком духе:
«Сэр Чаппеллетто обманывает лживой исповедью благочестивого монаха и умирает; негодяй при жизни, по смерти признан святым и назван San Ciappelletto»
«Жизнь этого Чаппеллетто была такова: был он нотариусом, и для него было бы величайшим стыдом, если бы какой-нибудь из его актов (хотя их было у него немного) оказался не фальшивым; таковые он готов был составлять по востребованию и охотнее даром, чем другой за хорошее вознаграждение. Лжесвидетельствовал он с великим удовольствием, прошеный и непрошеный; в то время во Франции сильно веровали в присягу, а ему ложная клятва была нипочем, и он злостным образом выигрывал все дела, к которым его привлекали с требованием: сказать правду по совести. Удовольствием и заботой было для него посеять раздор, вражду и скандалы между друзьями, родственниками и кем бы то ни было, и чем больше от того выходило бед, тем было ему милее. Если его приглашали принять участие в убийстве или каком другом дурном деле, он шел на то с радостью, никогда не отказываясь, нередко и с охотой собственными руками нанося увечье и убивая людей….»
ну и т.д.
https://ru.wikisource.org/wiki/%D0%94%D0%B5%D0%BA%D0%B0%D0%BC%D0%B5%D1%80%D0%BE%D0%BD_(%D0%91%D0%BE%D0%BA%D0%BA%D0%B0%D1%87%D1%87%D0%BE/%D0%92%D0%B5%D1%81%D0%B5%D0%BB%D0%BE%D0%B2%D1%81%D0%BA%D0%B8%D0%B9)/I,_1
ну а поскольку проверить, реальный чел на кнопки жал или эмулятор — невозможно пока, то всю эту досье по соцсетям и портфолио на базе БПД ( о котором грезит г-н Ашманов) можно составить — пальчики оближешь, думаю, сей продукт будет пользоваться высоким спросом среди прохиндеев и карьеристов.
Вообще, в классической литературе есть масса инструкций для стартапов))))
>>Потом весь наализ его активности будет показывать — это суперправильный чувак!
Именно) Но тут важно не перемудрить. Нужно дозировано и компромат на себя создавать автоматически — чтобы не выделяться. Ведь главное — попадать в серединку.. Но это всё уже настройки индивидуального автомата имитирующего индивидуальность.»ИаИи».
Да возможно сам контакт как и мордокнига будет использовать мои данные в этих же целях, но им я дал на это разрешение подписав соглашение при регистрации.
Думаю, вы не знаете, на что именно дали разрешение.
И сейчас не сможете вспомнить. Только, чур, не гуглить!!!
В этом и проблема.
А ещё проблема в том, что данные пользователей не могут быть собственностью ВКонтакта (даже если ему что-то «разрешили», не глядя ткнув в галочку при регистрации).
Поэтому он не является надлежащим истцом в данном деле.
ну, а поскольку проверить, реальный чел на кнопки жал или эмулятор — невозможно пока
Это у вас иллюзия, Джигсо. От незнания и зашоренности.
Вы старый, за новыми технологиями уже не успеваете. У вас, замшелых беби-бумеров, всё так.
Вы небось даже не знаете, что такое Убер. На своей тачке ездите или даже на метро!
Это мы, творческие энергичные миллениалы, следим за новинками.
Вот ко мне, например, недавно приходил за инвестициями стартап, который продаёт услугу по распознаванию эмуляторов на мобильниках. В том числе по акселерометру, GPS и т.п. Внутри у нея нейронка.
И таких сервисов уже несколько.
А нейронку не обманешь! Она как женщина, глубоким слоем чует.
Нужно дозировано и компромат на себя создавать автоматически — чтобы не выделяться.
Правильно, рядовой Карабас. Можете приступать, об исполнении доложить.
Впрочем, можете не докладывать, мы и так всё увидим.
«всяким мутным шарашкам, бюро и прочим «посанам с раёна» я ничего не разрешал. Хочешь? Спроси разрешения…»
А зачем им какое-то разрешение? Обрабатывать общедоступную информацию им разрешает закон «Об информации…» Обрабатывать общедоступные персданные — закон о ПД. И вы им даже запретить это не сможете, прикиньте. Не хотите, чтобы посаны с раёна что-то там видели — не делайте общедоступным.
Кстати, если такой подход возобладает, взвоет не только бигдата, но и поисковики, у них такая же модель использования чужой информации. И она даже более тяжкая: они еще куски найденного в результатах поиска показывают.
А вот ведь, если владелец сайта не хотел, чтобы поисковый робот индексировал страницы, он это прописывал в robots.txt Предположим, сейчас SMM-щики выиграют, и их роботы получат право обрабатывать информацию о пользователях и продавать результат. Не станет ли это сигналом для поисковиков — игнорировать любые пожелания сайтов, выраженные через robots.txt или как-либо ещё?
Когда хакеры вспороли брюхо сайта Ashley Madison, то оказалось, что никаких блудливых жёнушек в базе нет, а есть только сотрудники и роботы его владельца, которые и фабриковали пользовательские данные. Как роботу определить без содействия владельца сайта, какой профиль — действительно пользовательский, а какой сочинил сам владелец сайта? Вряд ли робот может претендовать на художественное произведение, созданное самим владельцем сайта — по крайней мере на использование такого произведения в коммерческих целях. Но захочет ли владелец сайта раскрывать эту информацию — кто из его пользователей — реальный, а кто — нет, владельцу робота? Фактически владелец робота может удостоверить реальность только собственных данных, данных друзей и сотрудников.
>>А нейронку не обманешь! Она как женщина, глубоким слоем чует.
Вот и будут две нейронки слоями биться, как женщины бюстами. А люди будут иметь (с двух сторон) бигбигбиг биг…дату в качестве информационного гумоса. P.S. И опять будут востребованы спецы старой школы — наружка, агенты, вербовка, паяльник. А что? Мастерство не пропьешь.
А вот ведь, если владелец сайта не хотел, чтобы поисковый робот индексировал страницы, он это прописывал в robots.txt
Лёня, ну это ж просто благое пожелание. И много кто всё равно индексировал. Иногда индексировали, но не показывали в результатах поиска, только и всего.
Но ведь если владелец сайта считал, что робот начал причинять ему неприятности, то он мог воспользоваться каким-нибудь клоакингом, то есть отомстить роботу. Ведь и социальные сети, если сочтут, что разбогатевшие СММ-щики не несут оброк, наверное, технически имеют возможность обесценить данные, которые собирают роботы СММ-щиков.
как роботу определить без содействия владельца сайта, какой профиль — действительно пользовательский, а какой сочинил сам владелец сайта?
Ну, в социальных сетях ещё надо отделить ботов и спамеров, а также виртуалов, созданных НЕ владельцем сайта, а пользователями.
Случаев сочинения пользователей самим фесбучеком и вконтактегом — мало.
У них другие задачи и проблемы.
На это имеются технологии. Ботов можно распознавать по графику появления, по графику размещение постов и каментов, по характеру распространения, по неестественному социальному графу, по накоплению фактов участия во вбросах и т.п.
Кроме того, есть такой метод, как матчить базу аккаунтов и постов с более другими базами. На рынке или в стране есть те, у кого есть чувствительные данные в «закрытом контуре», которые публиковать вообще нельзя. Менты, медики, мобильные операторы, провайдеры, ритейлеры.
НО.
Можно у них подтверждать или опровергать реальность пользователей — по API, без раскрытия чего угодно.
Я выкачал из русских сетей, допустим, 110 миллионов аккаунтов, отправил их такому держателю закрытой базы, он их поматчил, а кто не поматчился — про того ответил «не подтверждается». Секретность не нарушена, данные не разглашены, права ничьи не нарушены.
Например.
Пока рынка такого нет — но будет закон, будет и рынок.
Фактически владелец робота может удостоверить реальность только собственных данных, данных друзей и сотрудников.
Нет, это неверно. Есть много способов косвенного подтверждения: социальный граф, активность комментов и постов, друзья и подписчики, аккаунты в разных соцсетях, номера телефонов, проверка профиля (образование, город), анализ окружения на картинках, сравнение в закрытых базах, как я написал выше.
Много кого можно разъяснить и верифицировать.
Ведь и социальные сети, если сочтут, что разбогатевшие СММ-щики не несут оброк, наверное, технически имеют возможность обесценить данные, которые собирают роботы СММ-щиков.
Они и так противодействуют. Фейсбук никому не отдаёт данные, Твиттер и ВК постоянно ухудшают API, все они борются с внешними сборщиками данных.
Специально портить данные, создавать фальшивые аккаунты они не будут.
распознавать роботов и подсовывать им искажённые данные — тоже. Непонятно, зачем это нужно, это ведь работа.
Проще ведь забанить робота, если ты его распознал уже. Они так и делают. Самый лучший клоакинг — ничего не давать вообще.
Клоакинг в оптимизации имел целью повлиять на выдачу — а тут им зачем и на кого влиять? Поисковик оптимизатору нужен, а мониторинговые системы социальным сетям не нужны.
Игорь Станиславович, знаю Вы способствуете развитию программы «Цифровая Экономика» и вовлечены в задачу связанную с информационной безопасностью. В 2019 году будет введен в эксплуатацию информационный ресурс, обеспечивающий гражданам
России доступ к информации о случаях использования их персональных
данных. Означает ли это, что будут ограниченны возможности работы с телефонными базами данных? Я имею в виду обращение к целевой аудитории посредством таких инструментов как: вк таргет, я.аудитории, смс, звонки
Интересная темка (пока) без интернет-семейных разборок. Спасибо Игорю Ашманову за информацию, это крайне забавно.
Это сведения из Программы «ЦЭ». Там действительно есть такое мероприятие.
Для того, чтобы мог такой сервис заработать, должен быть принят закон о больших пользовательских данных, определён их статус, кто может быть оператором и т.п.
Этот закон тоже перенесён в Программе ЦЭ с 2018 на 2019 год. На 2018 оставлены разные подходы к нему. НИРы и т.п.
Тем временем во ФРИИ пишется проект закона о больших данных, он уже в завершающей стадии. Основная мысль — создать регулируемый рынок БПД. Как его удастся продвинуть — это отдельный разговор.
Пока такого закона нет — нельзя сказать, что будет разрешено, а что запрещено.
Практически наверняка можно сказать что большие пользовательские данные не будут собственностью площадки, которая их собирает.
«которая их собирает»
и публикует. Она ведь может и не публиковать. Всё это напоминает метапоисковые системы, они существовали, пока поисковиков было много, и потеряли смысл, когда остался один Google. Скажем, возникает комплекс Mail.Ru Group — Мегафон — Газпромбанк. Ему самому нужны данные, есть всё необходимое, чтобы их утилизовать. Каковы тут будут шансы Билайна или МТС, или ВТБ поживиться этими данными через компании-посредники, минуя перечисленных ранее? Думаю, что маленькими.
Я лично считаю, что даже если площадка сама создала и развила свою пользовательскую базу, собирает пользовательские данные тильки для сэбе, ничего не публикует и ничего не продаёт — это данные не её, и майнить их дальше определённой глубины — нельзя.
Например, нельзя выяснять наличие у человека болезней, психических отклонений, беременности, даже если ты хорошо натренировал свою нейросеточку и работаешь только с данными своих пользователей, которые в пользовательском соглашении на всё согласились.
Комплексу «Mail.Ru Group, Мегафон, Газпромбанка» де-факто и де-юре прямо сегодня запрещается делать комплекс из данных. Тем более, что комплекс будет функционировать не в интересах тройки, а вообще на благо четвёртой не упомянутой стороны. В доках ВКонтакте, например, нет ничего про банковскую деятельность. Есть оговорка, что некоторые данные могут получать разработчики приложений — проблема в том, что никто не ставит себе ВК приложение Мегафона и Газпромбанка, так как это не нужно ни за чем.
И одновременно в законе о ПД написано:
Даже если в TOS каждого из цепочки «Mail.Ru Group / Мегафон / Газпромбанка» внести разрешение на функционирование цепочки — тут нет бенефициара. Как не крути — Mail.ru никаких кредитных карточек не выдаёт, а МегаФон не занимается ипотекой. Поэтому очевидно, что бенефициар — это четвёртое (пятое, шестое, семьдясетседьмое) лицо. Бенефициар — это портфельный владелец трех компаний. С этим четвёртым — я вообще никаких договорённостей не заключал и заключать не мог, никогда в ToS Усманова не видел и видеть не мог, не говоря о более мелких совладельцах тройки исходных компаний. Никаких разрешений четвёртой стороне ни на что по поводу моих ПД — я не выдавал.
P. S. Дело не в Mail.ru. «Сомнительных» «комплексов» — навалом. Яндекс/Едадил/Foodfox/Яндекс.Касса/Яндекс.Такси; Рамблер.Касса, киносети Мамута, онлайновый Рамблер и офлайновые книжные сети Александр Леонидовича. Билайн, Deezer, Lamoda и другие проекты близкие Блаватнику.
Facebook, Instagram, WhatsApp. И так далее.
>>Сомнительных» «комплексов» — навалом
И когда те, «кому надо» разберутся, то от обладателей данных потребуют «всё забыть»?!)
Нет. Пока в том законе, который разрабатывает ФРИИ, предполагается, что оборот будет упорядочен, создан рынок, создано место для операторов БД, которые будут аналогом кредитных бюро.
«»Как не крути — Mail.ru никаких кредитных карточек не выдаёт, а МегаФон не занимается ипотекой»‘
А вот это — вопрос времени. Банк у Мегафона есть. Просто банки операторов оказались не так прытки, как надеялись. Конвергенция банков с телекомами завершится слияниями, поскольку и телекомы, и банки — маленькие. Вот всё это в один момент окажетcя «оператором дигитального стиля жизни»
Закон и сейчас требует стирать ПД. Тут особо не в чем разбираться.
Например ВК внёс в договорённости со мной прямо так и сформулированный пункт — «буду передавать ПД Газпромбанку, с целью оценки твоей кредитной истории и возможностей ипотечного кредитования». Окей! Данные ушли, он оценил, что-то решил и тут же обязан стереть. Вторая серия. МегаФон у нас заложен в Сбербанк и по каким-то причинам Усманов решил, всё-таки, оставить сотового оператора банку. В контуре появляется новый банк. Может ли он взять, что-нибудь у ВК по старым соглашениям «меня, где я разрешил ВК передать профиль Газпромбанку»? Конечно не может. Но мне почему-то кажется, что данные стёрты не будут и Сбер их плучит «просто так».
PS
Бегтин называл эту ерунду с ПД «цифровым неравенством». Сложно не согласиться:
вся эта затея закончится ничем ( с точки зрения востребованности для чего либо практического, типо кредитования или ректутинга) и вот почему.
Для подобного рода отбора и вообще ведедния досье, достаточно тех данных, которые и были спокон веку присвоены (государством) людям, как индикаторы и иднетификаторы.
А именно: происхождение ( + родственники на 2-3 колена), место рождения, образование, оценки дипломомв и аттестатов (и вообще их наличие), спортивные достижения, служба, места работы и характеристики, сепейное положение, число браков и детей, национальность(таки), физ.параметры (рост, вес, инвлалидности и т.д.), пробелмы с криминалом, учоты в диспансерах…. блабла.
В последние годы теперь еще есть и ИНН, который дает всю историю по собственности и легольным доходам\налогам.
Этого — выше крыши для любого анализа всего и вся. Полное понимание, что за чел и чего от нено можно ожидать и как использовать. И данные объективные, надежные (что крайне важно).
Посколкку практическив все — генерируются опосредованно от индивида.
А не им самим ( что он там постит сдуру или спьяну в соцсети, либо покупает на алибабае).
А если к этому всему массиву добавить еще и всю эту кашу — кроме сумбура это не даст ровным счетом ничего.
Посокольку, для начала, надо будет (помимо просто сбора этих дурацких данных) както наложить их на реальных людей, дабы провести реальную ( а не умозрительную) корреляцию зависимости тех или иных данных от тех или иных объективных поступков и действий человека, кому данные данные могут быть приписаны ка отражение модели поведения.
Говоря грубо: чел может постить любую хрень и лазить по чортикаким сайтам, при этом быть прекрасным специалистом и исправным заемщиком и ипотечником.
Т.е. всему этому проекту — грош цена в базарный день. Уже ясно, что число ошибок будет превышать анализ объекта по обычным, объективным данным (тот же просто НДФЛ и тп).
Да и меняется все в этих соцсетях. Сегодня чел в одном настроении, через два года — навострился писать и круг интересов поменялся.
Был бабник и пьяница — а стал семьянин, подкаблучник и многодетный отец.
И чо?