Битвы роботов в Рунете

16 мая 2012 в 13:34

Игорь Ашманов, С.В. Туков

Этот документ написан в рамках подготовки к передаче «Профилактика» на телеканале Россия-1. Понятно, что для многих читателей Roem.ru этот текст – сборник боянов, но надо понимать, какой уровень изложения требуется для разговора на полчаса на федеральном телеканале. Понятно, что дорвейщики, спамеры и троянописатели могут рассказать нам гораздо больше, как мы не правы и «как оно на самом деле». Ну вот и пусть расскажут в комментах, если сочтут нужным нас просветить.

Как писали недавно в новостях, трафик, генерируемый роботами в Интернете, превысил человеческий: больше 50% разных транзакций в сети совершают роботы.

Это и индексирующие роботы поисковых систем, и роботы оптимизаторов, проверяющие позиции сайтов в поисковиках, и роботы сравнения цен на сайтах магазинов, и боты, имитирующие пользователей в социальных сетях, и спамерские роботы, имитирующие поведение пользователей в результатах поисковых машин, и DDoS-атаки на сайты, и роботы ищущие уязвимости на сайтах, и роботы, накликивающие контекстную рекламу в рекламных сетях, чтобы разорить конкурентов-рекламодателей, и т.п.

Мы здесь будем говорить в основном про использование роботов в политических сетевых схватках.

Отмазка:

Нужно сказать, что на самом деле мы не сертифицированные по ISO специалисты по роботизированным информационным войнам. Хотя собственный опыт противодействия сетевым роботам у нас есть. Мы много боролись с почтовым спамом (с 2001 по 2005 год, создали самый популярный фильтр спама в стране - Спамтест), сталкиваемся с производителями поискового спама и ферм дорвеев/сателлитов/псевдосайтов/… в течение последних 10 лет.

Близкое общение с разработчиками антивирусов (сотрудничество с Лабораторией Касперского и встройка антиспама в их антивирус) тоже добавило нам некоторых знаний про ботнеты.

А сейчас мы косвенно имеем дело с поведением стад виртуалов в социальных сетях в ходе мониторинга и анализа тональности мнений о продуктах/брендах/персонах (для наших заказчиков системы Крибрум).

Так что кое-что мы про роботов знаем, но, конечно, далеко не всё.

Значительная часть активности спамерских роботов проходит в компьютерном и сетевом андеграунде, она тесно переплетена с незаконной деятельностью вирусописателей и сетевых мошенников, так что серьёзное расследование этой темы требует гораздо больших полномочий и ресурсов, чем есть у нашей частной компании.

Этим должно, по-хорошему, заниматься государство.

1. Немного истории

Использование всяких автоматических средств доставки информации и рекламы появилось давно, до соцсетей. Сначала это был почтовый спам, а потом появился ещё и поисковый спам. И тот и другой долго были массовым способом доставки именно коммерческой рекламы разной (в основном высокой) степени черноты. Методы и часто содержание спама всегда были на грани этики/законности или за гранью её, да и рекламируют они в большинстве своём незаконные услуги (порно, лекарства, поддельные дипломы, финансовые пирамиды и т.п.)

И тот и другой виды спама (почтовый и поисковый) имеют конечной целью заставить как можно больше людей прочитать рекламное сообщение или выполнить какое-то коммерчески полезное для автора спама действие. Тут используются два разных пути доставки.

а) почтовый спам - это прямая доставка рекламы в почту:

заказчик -> распространитель -> человек

Для доставки использовались сначала мощные фермы серверов, а потом (с появлением в некоторых странах закона против спама и уменьшением количества спамоустойчивых хостингов) спамеры перешли к использованию ботнетов, то есть сетей заражённых компьютеров. Рассылка производится с компьютеров пользователей, которых даже нельзя привлечь к ответственности. Управление бот-сетью централизованное, сеть сама скачивает на заражённые компьютеры апдейты трояна и рассыльщика и т.п.

Произошла смычка спамеров с вирусописателями - и обретение большого коммерческого смысла в написании вирусов (не считая, конечно, прямой кражи паролей от банковских счетов и тому подобной прямой уголовщины).

б) поисковый спам использует более длинный путь, в середине цепочки доставки – третья сторона, то есть введенный в заблуждение поисковик (общий, специальный, любой). Рекламное сообщение не доставляется человеку напрямую, вместо этого поисковые спамеры манипулируют поисковыми машинами для поднятия спам-страницы в Top-10 результатов поиска:

заказчик -> распространитель -> сайт(ы) и методы накрутки распространителя -> Top-10 поисковой машины -> человек

Спам - старая по меркам Интернета подотрасль, она довольно сильно структурирована, в ней уже сложилось развитое разделение труда.

Писатели вирусов создают генераторы вирусов, сеятели вирусов захватывают компьютеры пользователей, спамеры получают у них доступ к ботнетам за деньги, вливают туда спам. Поиск и пополнение списков адресов, генерация текстов писем (чтоб не поймали по схожести), поиск заказчиков - часто делают отдельные конторы. Даже подбор списков обратных адресов (казалось бы, весьма малозначительная деталь) – часто отдельный бизнес. Спам с вирусами (для захвата новых компьютеров) тоже распространяется через те же ботнеты, и так далее.

2. Спам, роботы и политика

До самого недавнего времени политики в Интернете вообще было мало, а в спаме - еще меньше.

Одной из причин этого, по нашему мнению, является то обстоятельство, что, например, в РФ спам не является уголовным преступлением. Это означает, что по спаму не разрешена ОРД (розыск делается по уголовщине), то есть найти спамера практически нельзя. Можно, конечно, искать и сажать за чёрный нал и уклонение от налогов, делать контрольные закупки, но на практике это не работает – неинтересно налоговым органам и всяким ОБЭПам искать таких хорошо конспирированных электронных мошенников и ловить их за косвенные и труднодоказуемые нарушения.

А вот выход в политическую область мог, казалось бы, привести спамера к тому, что бизнес прихлопнут спецслужбы, занимающиеся именно политикой, которые не поленятся найти исполнителя и сделать контрольную закупку. Спамерам это было не нужно, их бизнес и так процветал. С 2001 по 2010 год в Рунете было всего два-три случая политического почтового спама.

А сейчас всё резко изменилось – мы видим десятки политических почтовых массовых незапрошенных рассылок в месяц. То ли спамеры перестали бояться, то ли в пошли серьёзные деньги, и это стало оправдывать риск. То ли почему-то спамерам стало ясно, что никакое ФСБ за ними всё-таки не придёт.

Возможно, причина позднего прихода политики в сеть также в том, что политические организации довольно традиционалистские, в них всё делается по аналогии с прошлым. Высоких политических постов (даже в оппозиции) люди достигают обычно в немолодом возрасте. Интернет не очень принимался во внимание такими политиками, считался чем-то неважным по сравнению с ТВ и газетами. Но жизнь не стоит на месте, в какой-то момент выяснилось, что в интернетах уже много десятков миллионов пользователей, что там жизнь, деньги, влияние.

Политика, в свою очередь, резко помолодела и наконец обратила на Интернет своё внимание.

Таким образом, совпало два события:

Во-первых, изменился сетевой ландшафт - появились и стали популярны соцсети разного рода, в Интернете обнаружилось много-много людей,

во-вторых, в помолодевших партиях и оппозиционных группах в 2005-2010 годах окрепла идея использовать Интернет в целях политической пропаганды.

Легко видеть, что технически политическая пропаганда от коммерческой рекламы отличается не так уж сильно. В обоих случаях речь идет об "убеждении" как можно большего числа людей в привлекательности определенной "идеи". Только в одном случае "идея" состоит в том, что надо купить такой-то товар, а в другом – что верной является такая-то политическая платформа.

"Традиционные" спамеры в коммерческом смысле освоили новую среду (соцсети/блоги) довольно быстро, почти в момент их появления. Коммерческий спам появился в блогах и социальных сетях практически сразу.

И вот представим себе: политики обнаружили Интернет на своих радарах и решили, что хорошо использовать его в целях своей пропаганды. Политики - это организации, мало что понимающие в устройстве Интернета, но зато:

а) имеющие деньги (часто большие или условно неограниченные), и

б) имеющие серьезные цели (куда уж серьёзнее – целью является получение власти).

Эти люди подошли к Интернету и начали его осматривать, чтобы понять, с какой стороны за него ухватиться. Но не только они осматривали интернеты, но и их тоже осматривали с другой стороны стекла.

Среди интернет-деятелей разного рода всегда было немало желающих погреться на политических деньгах. Только раньше им денег почти не давали (не считали это серьёзным), разве что разные алегархи и сурковцы отстёгивали немножко на создание квазиобъективных общеполитических интернет-СМИ.

А тут интернет-шустрики видят, что у входа на рынок стоят богатые клиенты и присматриваются с намерением в конце концов дать кому-то денег. Конечно, желающие втюхать услугу тут же нашлись, и прежде всего из числа самых ушлых и алчных. Вполне естественно, что таковые нашлись в первую очередь в "серой" и "черной" области Интернета.

Можно даже представить себе, по аналогии, что кристально честные и благородные политические силы стали жертвой низкого обмана со стороны прохиндеев-спамеров, как часто бывало на ранних этапах жизни Интернета с заказчиками коммерческого спама.

А именно: им рассказали про низкую стоимость и высокую эффективность спама (и то, и другое - правда), но забыли рассказать про темную сторону спама (что это не вполне этично или даже за гранью закона, а значит, рискованно для репутации и прочее).

На самом деле, скорее всего, роман политиков и спамеров не был такой уж возвышенной драмой: политики и политтехнологи при них – публика жёсткая и циничная, они - не наивные идиоты (по большей части). Скорее всего, стороны просто нашли друг друга – одни готовы оплатить дешевый и эффективный способ массовой пропаганды, другие готовы его предоставить.

Надо заметить, что для политической пропаганды в Интернете используются не только серые и черные методы. Обычные методы, похожие на традиционную благонамеренную рекламу – тоже в ходу. Но это не входит в тему данной статьи.

3. Про методы робототехники

Мы будем всё описывать на примере Твиттера, используя его терминологию, но в других местах (соцсети и блоги) всё устроено более или менее похоже.

3.1. Прямое донесение нужной информации до публики

Это делается в первую очередь с помощью долгоживущих сетей виртуалов.

Что из себя представляет такая сеть? Это несколько сотен или тысяч аккаунтов, каждый из которых имеет десятки-сотни последователей (фолловеров) из этой же сети, каждый из которых стремится попасть в "друзья" к внешним по отношению к этой сети аккаунтам обычных людей.

В "мирное" время эти аккаунты изображают некую активность, похожую на человеческую - пишут какие-то (обычно в меру бессмысленные, но в Твиттере это – обычное дело) сообщения, отвечают друг другу на эти сообщения и т.д. Тексты этих сообщений в мирное время часто надёрганы из других мест. Зачерпнули ковшом десятки тысяч сообщений и потом долгие месяцы обмениваются ими.

"Другие места" – это записи в Твиттере из других аккаунтов, какие-то заголовки веб-страниц, просто предложения из произвольного текста и т.д.

Часто виртуалы пытаются быть "на виду", для этого они публикуют сообщения с популярными хэштэгами из текущих "трендов" Твиттера. Расчёт на то, что ленту сообщений по хэштегам "трендов" читает множество пользователей, и эти сообщения из бот-сети тоже попадутся на глаза многим пользователям.

Сценарий «приклеивания к тренду» примерно такой (там много вариаций):

а) есть текущий тренд #abc,

б) выбираем в его ленте какое-то сообщение «Твит-1#abc», от автора A,

в) пишем от автора Б (нашего бота) этому автору А сообщение «Твит-2#abc» в ответ, с социотехникой внутри, наподобие "В точку, молодец!" ,

г) тут же "фолловим" автора А,

д) с большой вероятность автор А "фолловит" нашего бота Б в ответ,

е) PROFIT!!!

Таких фейковых аккаунтов можно найти много, но для их достоверной детекции приходится довольно пристально их рассматривать. Выявляются они чаще всего по ошибкам, по действиям, которые человек не может сделать. Например, по обмену очень старыми сообщениями, которые зачерпнули ковшом ещё полтора-два года назад. Или по именам аккаунтов, которые часто представляют собой случайную перемешку букв, например, @cimroefqap, @ssarathdr, @psqharlef (реальные имена реальной сети виртуалов).

Эти сети ботов, вообще говоря, штатный инструмент и коммерческих спамеров.

И примкнувших к ним «SMM-специалистов с 20-тилетним опытом» – ну тех, которые

- Алё, это SMM-агентство?

- Дааа…

- А почему шёпотом?

- Я на алгебре…

С помощью таких ботов, например, создается видимость пользовательской активности в «официальной группе» какого-то бренда. Помните недавнюю историю с разоблачениями "социального маркетинга" такого рода от ВКонтакта? Там иногда только 10-20% членов группы транснационального бренда – настоящие люди. Также такие боты размещают в социальных сетях и просто заказные рекламные сообщения.

Они же сейчас используются и для донесения какой-то политической информации до публики в социальных сетях и Твиттере.

Поскольку у аккаунтов этих бот-сетей есть цель находиться во френдах у живых людей, владельцы их пекутся о том, чтобы фейковые аккаунты выглядели как можно более похожими на настоящих людей, чтобы их не забанил сам Твиттер и не вынесли из френдов настоящие пользователи.

3.2. «Военные действия» или «хулиганство» в соцсети

Бывают случаи, когда надо любыми способами быстро опубликовать огромную массу сообщений, несмотря на возможное разоблачение, отфренживание и другие последствия.

Для этого используются массовые "временные" аккаунты. Они заводятся автоматически или полуавтоматически, мгновенно выполняют целевую функцию и бросаются. Часть их потом относительно быстро распознаётся и банится за спам Твиттером, часть остаётся в брошенном состоянии и умирает сама.

Пример 1, традиционный коммерческий: специализированные тематические атаки.

Чаще всего такие атаки производятся на близкие к деньгам коммерческие темы – банковские услуги, например. Выглядит это так. Пользователь заходит в Твиттер и решает поинтересоваться какой-то банковской услугой или определенным банком. Он задаёт поисковый запрос по слову или хештэгу:

#alfabank

кредит сбербанка

кредит малому бизнесу воронеж

и тому подобные.

Вместо настоящих сообщений на эту тему пользователь в результатах поиска Твиттера видит тысячи фейковых сообщений, опубликованных спамерскими ботами. Эти сообщения содержат в себе короткую ссылку, ведущую как бы на сайт банка. На самом деле, это ссылка на сайты-клоны настоящих банков. Эти клоны ничем не отличаются от настоящих сайтов копируемых банков, кроме двух вещей:

а) они находятся по другому адресу,

б) на всех страницах добавлена форма заявки на кредит (или карту, или другой банковский продукт).

Форма заявки содержит много полей – ФИО, телефон, адрес, иногда даже поля под паспортные данные.

Скорее всего, механика обмана и втюхивания тут такая. У всего этого спама есть заказчик - какой-то настоящий банк.

Он покупает у спамеров (какой-то «системы продажи лидов») лиды – то есть вот эти заполненные формы с контактами. Мотив банка покупать эти лиды такой: если вот этот человек-лид (ФИО, телефон, адрес и т.д.), которому нужен кредит, не поленился заполнить форму – то наш колл-центр с ним свяжется, возьмёт в оборот и наш кредит ему впарит. С какой-то известной конверсией.

Мы имеем предположения, какие именно банки балуются этим видом продвижения. Но называть их пока не будем, хотя это может относительно легко выяснить любой досужий наблюдатель, который поищет такие сообщения и посмотрит, на какие настоящие сайты иногда ведут ссылки с них.

Пример 2, политический: зашумление канала (хэштега #5dec во время митингов 5-го декабря).

Этот канал использовался для координации действий митингующих на Чистых Прудах 5 декабря 2011 года – в нём сообщалось, куда идти, чего делать и что скандировать, и т.д. В частности, для того, чтобы побудить всех протестантов в определённый момент прорываться на Лубянку. В какой-то момент в этом канале Твиттера пошли тысячи сообщений с цитатами из произведений русской классики, так что найти среди них истинные сообщения про митинги стало трудно или вообще невозможно.

Часть митингующих сумели как-то договориться и перешли на другие хэштеги, но часть по дороге потерялась и никуда не перешла. Фактически, была включена "глушилка" канала, как когда-то использовались глушилки радиостанций типа "Голос Америки" в 80-х годах.

3.3. Ворованные аккаунты

Это аккаунты, которые когда-то были созданы настоящими людьми, а потом управление ими было перехвачено злоумышленниками (с помощью троянов/вирусов в основном).

Аккаунты эти до перехвата жили какой-то жизнью, у них есть фолловеры/френды – живые люди, аккаунты могут быть созданы давно и имеют развитую историю. То есть, некоторое время после захвата записи в них имеют большую ценность и для френдов (они думают, что это их давний знакомый пишет), и для Твиттера (хорошая история аккаунта). Но только некоторое время, не навсегда, потому что истинный владелец может попытаться восстановить доступ, а френды его что-то могут заподозрить или узнать о захвате аккаунта от его владельца или по другим каналам.

Весь потенциал ворованного аккаунта надо выбрать за короткое время, а потом бросить. Потенциал у него такой, что можно использовать для любой из вышеописанных целей – и для прямой доставки сообщений, и для массового спама.

3.4. DDoS-атаки

Здесь нет смысла много рассказывать: тема сетевых атак довольно сильно распиарена в СМИ. Сети заражённых компьютеров – ботнеты - используются для создания пиковой нагрузки на заданные сайты и для обрушивания их. Конечно, сайты типа Гугла, Яндекса, ВКонтакте или ФСБ.ру завалить практически нельзя, там приняты меры, а вот сайты отдельных СМИ, госорганов, а также сервисы вроде ЖЖ завалить вполне можно.

Впрочем, сейчас зачастую за атаку выдаётся просто непрофессионализм службы поддержки сайта или какое-то другое событие (неудачный переезд на другой хостинг, смена DNS-серверов и т.п.).

То есть по сути DDoS-атаки, реальные или вымышленные, сейчас часто используются «на вторичном рынке», в формате инфоповодов («ааа, подонки на нас напали! вот мы какие важные и непримиримые! нас не сломить!!!») для дальнейшей раскрутки в формате новости.

3.5. Официальные боевые боты

Есть как минимум один известный пример создания долгоживущей сети виртуалов силами правительства, а точнее, даже военных:

Речь идёт про пропаганду демократических ценностей в арабских (и других вражеских странах) с использованием виртуалов в Твиттере, Фейсбуке, Ютьюбе и т.п.

«В документе приводится список технологий, которые, по мнению специалистов DARPA, стоит иметь в виду при разработке программы: лингвистический анализ, распознавание информационных паттернов, анализ трендов, настроений, общественного мнения и "культурных нарративов", теория графов, автоматическое создание контента, боты, краудсорсинг. То есть, по сути, речь идет об использовании социальных сетей в разведывательно-пропагандистских целях».

Сообщившие об этом проекте чиновники Пентагона обещали американским гражданам, что действовать будут только за пределами США, пропаганды внутри страны вести не будут. Механика предполагалась такая. Создается сколько-то (много) аккаунтов в Facebook, как бы от лица «арабов». Они должны вести себя как настоящие люди, с историей, увлечениями и т.д., вступать в дружбу с другими «арабами», время от времени по определённому поводу говорить им правильные, идеологически верные слова. У каждого сотрудника этого департамента спецслужбы есть "пульт управления", специальное рабочее место(АРМ), позволяющее ему в одиночку вести десятки виртуалов. Жить одновременно пятьюдесятью или ста сетевыми жизнями.

Такая технология ручного управления ботами позволяет создавать гораздо более естественных ботов, неотличимых от людей.

Тут как бы все формально законно, в том смысле, что у правительства нет претензий, по крайней мере - у американского.

Конечно, из прессы трудно понять, создана ли уже такая лаборатория информационной войны или это только планы, применяется ли она только в арабских и азиатских странах, или уже пришла в Рунет и т.п. Большинство экспертов предполагает, что речь идёт просто о следующей, более автоматизированной и мощной версии, а информационная война в соцсетях ведётся силами Пентагона/ЦРУ уже давно, просто чуть более кустарно, вручную. В том числе и в Рунете.

Не будет сюрпризом, если выяснится, что этот случай не уникальный, что другие правительства (наше, например, или китайское) тоже что-то в этом направлении делают, только тайно. Пример с зашумлением канала #05dec показывает, что что-то такое у нас делается.

Конечно, есть ещё много разных способов информационной войны, мы здесь просто ставили себе целью показать, что в сети сейчас для политической борьбы используются как маленькие мирные роботизированные люди, так и гигантские боевые человекоподобные роботы.

4. Информационные вбросы

Все описанное выше (и не только это), используется при информационных вбросах и раскрутке политических тем в Интернете. Вот некоторые используемые техники и приёмы.

4.1. Генерация инфоповодов с дальнейшей раскруткой

Происходит или искусственно создаётся какое-то событие. В естественной форме оно не вызывает большого интереса.

Тогда применяются автоматические методы раскрутки: автоматические перепосты, копирование, комментирование.

Часто это делается топорно, зато массово: например, вечером 5 мая в соцсетях был очередной вброс «против Патриарха», начавшийся с интервью в Ленте.ру о решении суда по спорной квартире Юрия Шевченко. Этот вброс породил около 2000 постов в ЖЖ и во ВКонтакте, состоявших из анонса новости на Ленте с как бы авторским комментарием хозяина блога по поводу этого анонса:

«Очень интересная история, особенно решение суда понравилось, молодцы, прям как в военное время, решения принимают очень быстро что бы не создавать очередь. Надеюсь по этой истории поставят оперу ну или пьесу, так как всё очень драматично и главное в этой истории непонятно кому уж так насолил Юрий Шевченко».

Очевидная топорность этого вброса заключалась в том, что и сам анонс со ссылкой, и самое главное, этот как бы «авторский комментарий» - были во всех случаях идентичны. Видимо, по какой-то причине было решено вбросить тему как можно быстрее, невзирая на то, что она была шита белыми нитками.

Распространение в блогосфере сообщений, цитирующих интервью Юрия Шевченко. Данные "Крибрума".

Часто инфоповод просто раскручивается таким вот образом напрямую, без генерации промежуточных событий, иногда же генерируется промежуточное событие типа «смотрите – тренд в Твиттере!», таким образом:

а) с помощью ботов изображается большой интерес публики к событию под определенным хэштэгом Твиттера,

б) тэг выходит в тренды, российские или даже мировые,

в) далее в СМИ публикуется новость "тэг такой-то про событие сякое-то вышел в тренды", тем самым подразумевая, что, следовательно, и событие "сякое-то" - значимое, раз стало трендом в Твиттере.

г) Дальше СМИ делают саму эту новость о тренде "событием", перепечатывают и распространяют её саму, боты поддерживают её в Твиттере и т.д.

Заметим при этом, что для попадания в Top-10 трендов Твиттера по России иногда достаточно нескольких тысяч ретвитов, что с помощью ботов достигается довольно легко.

4.2. "Вывод в топ"

Раньше таким «топом» был рейтинг постов Яндекса, сейчас есть рейтинг ЖЖ и тренды Твиттера.

Механика и цель одни и те же: изобразить видимость активности (перепечатки, комментирование и т.д.) для определенной записи или группы записей (в Твиттере - хэштег), так чтобы она попала в топ, и там ее прочитало много людей, часть из которых уже по своей воле понесут ее дальше.

5. Заключение

Во всех этих методах используются не только сети роботов, но и люди тоже. Это всегда человеко-машинные процедуры. Спамерами используется масса социотехники – всякие психологические приемы, заставляющие живых людей поверить в сообщение, принять «мнение» бота как свое, прокомментировать и распространить его дальше и т.д.

Всегда есть человек, управляющий роботом для более естественного поведения и быстрой реакции на нештатные ситуации. Скажем, в примере с зашумлением канала в Твиттере ясно, что при переходе массы пользователей на новый канал боты тоже могут легко переключиться туда – но сделать это должен человек, управляющий «глушилкой». Сами боты пока не в состоянии распознать призыв перейти на новый тэг.

Некоторые детали дают основание предполагать, что олдскульные почтовые спамеры и прогрессивные спамеры в Твиттере и Фейсбуке - это просто одни и те же люди. Просто нашедшие новую сферу применения своим талантам в социальных сетях для политиков.

И применяющие там более чем десятилетний опыт борьбы за контакт с пользователем сети.

Вот примеры таких деталей:

1) В почтовом спаме есть такой прием - письма от выдуманных пользователей, имена которых генерируются по словарям имен и фамилий, причем часто затейливых, но не согласованных по роду:

Твердислав Давыдкина

Силантий Семёнова

Тарас Онегина

Никон Карандашова

Леокадия Никонов

Точно такой же прием виден и в Твиттере – с теми же ошибками несогласованности (выше даны именно примеры реальных твиттерных имен).

2) Широко применяемый в почтовом и поисковом спаме прием - генерация псевдотекстов марковскими цепями (обычно 2-3-го порядка) – он же виден сейчас в спаме в ЖЖ и Твиттере.

3) Коммерческий твиттерный спам часто ведет на те же адреса сайтов (URL), что и современный почтовый спам.

А если это те же люди, то там сосредоточены отличные кадры (ещё пять лет назад выпускнику Мехмата или Филфака МГУ спамеры предлагали оклад заметно больше, чем в Яндексе), мощные технологические наработки и большие денежные ресурсы.

Короче говоря, трафик от роботов в социальных сетях тоже, скорее всего, составляет очень значительную долю, десятки процентов. Дальше ситуация будет только ухудшаться, а средства для управления роботами – совершенствоваться. Вероятно, со временем потребуется и настоящий, мужской антиспам.

Лучшие комментарии

Контекст комментария
soomrack
Я бы еще добавил то, что самые проблемные роботы — это сами люди. 1. Роботы-люди стимулируемые деньгами. Опасность исходит от «партнерских программ» — то, что в оффлайне называется «сетевым бизнесом», причем именно от тех, у которых порог минимальных выплат отсутствует или очень низкий. Люди готовы вручную спамить своих друзей в социальных сетях, на форумах, да и просто везде, где только возможно, за потенциальный доход в 1000-3000 руб./мес. Подозреваю, что это люди либо с еще несформировавшимся мировоззрением (т.е. школьники), либо те, кому просто нечего делать (некоторые офисные служащие, возможно основная их масса сосредоточена в гос.учреждениях). Этот спам побороть техническими средствами очень сложно, ибо непонятно в какой момент рекомендации перерастают в спам. 2. Роботы-люди стимулируемые идеей. Это фанаты и работники компаний с жесткой корпоративной политикой. И тем и другим достаточно кинуть ссылку и сказать «там поливают грязью ваш продукт/бренд/…», в частности, так погибают соц.опросы. Кроме того, и те и другие пользуясь случаем везде оставляют хвалебные или ругательные про конкурентов сообщения. По п.2 я недавно провел эксперимент. Его целью было пронаблюдать это явление, а также подтвердить предположение о возможностях использовать его, как инструмент давления на крупные компании. Эксперимент, как вы помните, прошел удачно. В течение 2х недель удалось сделать так, что Google и Yandex внесли изменения в свои пользовательские соглашения. Анализ результатов эксперимента еще закончен, наверное, если редакция пропустит, я выложу про это текст на роем. Правда данных для анализа удалось собрать меньше, чем хотелось. Игорь, у Вас ведь есть инструмент мониторинга и анализа новостей. Не могли бы Вы дать мне немного статистики по темам Google Disk и Яндекс Диск?

Добавить 75 комментариев

16 мая 2012 в 13:48 Ответить
Bakalov
Когда выйдет эта передача?
16 мая 2012 в 13:50 Ответить
Альтер Эго
Вышла сегодня ночью.
16 мая 2012 в 13:51 Ответить
soomrack
Я бы еще добавил то, что самые проблемные роботы — это сами люди. 1. Роботы-люди стимулируемые деньгами. Опасность исходит от «партнерских программ» — то, что в оффлайне называется «сетевым бизнесом», причем именно от тех, у которых порог минимальных выплат отсутствует или очень низкий. Люди готовы вручную спамить своих друзей в социальных сетях, на форумах, да и просто везде, где только возможно, за потенциальный доход в 1000-3000 руб./мес. Подозреваю, что это люди либо с еще несформировавшимся мировоззрением (т.е. школьники), либо те, кому просто нечего делать (некоторые офисные служащие, возможно основная их масса сосредоточена в гос.учреждениях). Этот спам побороть техническими средствами очень сложно, ибо непонятно в какой момент рекомендации перерастают в спам. 2. Роботы-люди стимулируемые идеей. Это фанаты и работники компаний с жесткой корпоративной политикой. И тем и другим достаточно кинуть ссылку и сказать «там поливают грязью ваш продукт/бренд/…», в частности, так погибают соц.опросы. Кроме того, и те и другие пользуясь случаем везде оставляют хвалебные или ругательные про конкурентов сообщения. По п.2 я недавно провел эксперимент. Его целью было пронаблюдать это явление, а также подтвердить предположение о возможностях использовать его, как инструмент давления на крупные компании. Эксперимент, как вы помните, прошел удачно. В течение 2х недель удалось сделать так, что Google и Yandex внесли изменения в свои пользовательские соглашения. Анализ результатов эксперимента еще закончен, наверное, если редакция пропустит, я выложу про это текст на роем. Правда данных для анализа удалось собрать меньше, чем хотелось. Игорь, у Вас ведь есть инструмент мониторинга и анализа новостей. Не могли бы Вы дать мне немного статистики по темам Google Disk и Яндекс Диск?
16 мая 2012 в 13:56 Ответить
neuymin
«с как бы авторским комментарием хозяина блога по поводу этого анонса:» — у вас там ссылка пропала
16 мая 2012 в 14:35 Ответить
megapinion
«… имена которых генерируются по словарям имен и фамилий, причем часто затейливых, но не согласованных по роду: Твердислав Давыдкина …» — поясните, пожалуйста, «не согласованность по роду» задаётся преднамерено (зачем?) или возникает по (пещерной) глупости исполнителей?
16 мая 2012 в 14:43 Ответить
soomrack
> поясните, пожалуйста, «не согласованность по роду» задаётся преднамерено (зачем?) или возникает по (пещерной) глупости исполнителей? Думаю, что причина в использовании старого или иностранного софта для генерации имен.
16 мая 2012 в 14:44 Ответить
Альтер Эго
> «не согласованность по роду» задаётся преднамерено (зачем?) или возникает по (пещерной) глупости исполнителей? Неизвестно. Общий паттерн такой что генерятся пары имя+фамилия так что имя берется очень экзотическое, но они бывают и согласованными по роду. Пещерной тупости среди этой публики нет. Алчность и беспринципность есть, а тупости нет. Спаммеры разных родов шустрые и очень продвинутые в своем темном деле. Думаю, им просто эти детали не очень важны, берут какие-то словари имен и фамилий и составляют из них пары, редкие имена предпочитают для создания видимости уникальности, а на род не смотрят вовсе.
16 мая 2012 в 14:50 Ответить
soomrack
Уверен, что это из-за использования софта, нацеленного на западную аудиторию (основные деньги ведь там). Пример: В Нидерландах «Ivanov» и «Ivanova» это две разные фамилии. Если у «Petr Ivanov» родится в той стране дочь «Katya», то ее фамилия будет «Ivanov» и если не предпринять определенные шаги, то в документах будет значится «Katya Ivanov». Смешно? А некоторым не очень.
16 мая 2012 в 14:55 Ответить
Альтер Эго
> это из-за использования софта, нацеленного на западную аудиторию Да, это очень правдоподобная версия. Там же разделение труда и международный размах, все делают свой кусок, вот этот (генерация имен) сделана кем-то не имевшим ввиду русский язык.
16 мая 2012 в 15:12 Ответить
megapinion
Извините за занудство, так какая всё-таки основная версия: 1) это делают иностранцы, не знающие русского языка; 2) это делаю раздолбаи, которым наплевать; 3) там такая высоко-интегрированная «машинка» (иностранного производства), что добавить в неё русскоязычное согласование рода имени и фамилии невозможно? ? И отдельный вопрос: это рассогласование никак не снижает, что ли, эффективности спама?
16 мая 2012 в 15:14 Ответить
Альтер Эго
Статья интересная. Но последний абзац «Покупайте Ашмановское!» смазывает впечатление.
16 мая 2012 в 15:20 Ответить
Альтер Эго
> так какая всё-таки основная версия Я не знаю, у меня нет основной версии, все три правдоподобные, и еще можно придумать 10 не менее похожих на. Я не занимаюсь изучением устройства этой отрасли (спам), разделением труда в ней и т.д., только смотрю на результат деятельности, на манер черного ящика. Возможно, тут присутствуют знатоки поболее меня.
16 мая 2012 в 15:24 Ответить
Альтер Эго
> это рассогласование никак не снижает, что ли, эффективности спама? В этих сообщениях их фейковая природа для опытного глаза видна по структуре и содержанию, и без имени, а для неопытного и имя не вызовет подозрений. Один человек, как правило, видит сообщения кого-то одного из них, не всех скопом.
16 мая 2012 в 15:29 Ответить
soomrack
> там такая высоко-интегрированная «машинка» (иностранного производства), что добавить в неё русскоязычное согласование рода имени и фамилии невозможно? Не иностранного производства, а нацеленная на иностранную аудиторию. Очень много раз в прессе публиковалась информация, что подавляющее большинство спамеров это выходцы из бывшего СССР, причем большинство из них (по объемам спама) обретается на Украине. Зачем менять что-то работающее? Изменения в инструмент вносятся только если есть причина. Причина тут может быть только одна: сильное падение доходов (именно падение, а не возможное увеличение в будущем). Пока ее нет, никто ничего делать не будет. Тем более, что процент несогласованных имен вряд ли слишком большой. Проще увеличить объемы в 2 раза, чем вносить (пусть мелкие) изменения в софт (чужой, встроенный в систему).
16 мая 2012 в 15:52 Ответить
Alex D
Для твиттера такая штука есть http://spam-index.dk-soft.net Иногда интересные колебания бывают.
16 мая 2012 в 18:44 Ответить
Валентин Домбровский Travelabs
Очевидная топорность этого вброса заключалась в том, что и сам анонс со ссылкой, и самое главное, этот как бы «авторский комментарий» — были во всех случаях идентичны. Видимо, по какой-то причине было решено вбросить тему как можно быстрее, невзирая на то, что она была шита белыми нитками. Теория шита белыми нитками — это просто механизм «взятия оригинала» в ЖЖ. Есть, правда и одно «но» — репосты действительно судя по всему, делались ботами, судя по названиям аккаунтов. В общем, выводы те же, но из других фактов.
16 мая 2012 в 19:03 Ответить
Альтер Эго
Вывод про ботов сделан не по совпадению «авторского» комментария, и не по именам аккаунтов, а на основании анализа содержимого перепечатывающих журналов и главное — анализа скорости и «ускорения» распространения этих перепечаток. А совпадение авторской приписки — это иллюстрация, но не основание для выводов. Все эти перепечатки — это одна сеть аккаунтов, управляемых из одного места. Видно кто там выступает как затравка, и даже более-менее понятен принцип по которому ведомые черпают из этой затравки.
16 мая 2012 в 19:05 Ответить
Александр Яковлев
Вот они, войны XXI века…
16 мая 2012 в 19:33 Ответить
Валентин Домбровский Travelabs
Хорошо. Но Вы судили о репостах практически нулевого аккаунта, который в основном и «читается» ботами, по-видимому. А что делать, если это аккаунт Навального, к примеру? Понятное дело, что будет волна живых репостов — можно ли среди них вычислить ботов, учитывая, что скорость распространения будет велика в любом случае? Ну и вопрос, имеет ли смысл использование ботов в этом случае, в принципе.
16 мая 2012 в 19:52 Ответить
Альтер Эго
Живые перепосты от неживых сильно отличаются всем, в первую очередь распределением их по времени, во вторую — первоисточником (живые перепосты часто, почти всегда имеют несколько первоисточников. Исключение составляют самый топ нипа Навального, который обычно на виду у почти всех тех кто может иметь намерение перепостить). Вычислить ботов когда они размешаны с живыми людьми — не возьмусь, особенно если ботов мало на фоне людей. Случаи полностью или почти полностью роботизированного массового перепоста увидеть довольно легко. Насчет смысла использования ботов ничего не скажу, не моя тема. По мне так лучше бы и вовсе их никто не использовал. Из наблюдений — роботы обычно используются (в этом конкретном сценарии — массовая раскрутка новости) одним из двух способов — а) полностью или почти полностью роботизированный перепост б) роботы используются на ранних стадиях, наряду с ручными человечьими затравками и с использованием всяких психотехник, с целью заставить живых людей понести новость дальше. Дальше люди либо новость понесли сами (раскрутка сработала), либо не понесли (не сработала), но в этом случае обычно роботами потом не происходит массовых каких-то явлений. Так чтобы был и массовый человечий перепост, и в него же замешан не менее массовый роботизированный — не встречал. Но — я и не занимаюсь целенаправленным их выявлением и наблюдением за ними. Что попалось — то вижу, но специально не выискиваю.
16 мая 2012 в 19:57 Ответить
Альтер Эго
Как программа называется где про это показывали?
16 мая 2012 в 19:57 Ответить
Игорь Ашманов Сам себе компания
То, что этот конкретный вброс делался именно роботами — очевидно. Как распознать роботов в конкретном случае, если источником служит популярный блоггер — отдельная задача. Очевидно, выделить левые аккаунты и полные дубли тоже можно. Но, поскольку обсуждалась в этих передачах в основном не эта задача, а задача распознавания искусственной накрутки вброса, то там первична форма распространения. Естественно, есть много разных факторов, указывающих на искусственность. Время старта, крутизна графика, срок затухания волны, количество и пропорция оригиналов и дублей, медийный вес оригинального аккаунта, … У факторов разные веса. Если сошлось несколько факторов и взвешенная сумма большая — можно делать вывод, что порог превышен. В этом смысле волна перепостов за Навальным может быть естественной, а может быть и искусственной. Если у неё график такой, как в статье выше — она в любом случае искусственная.
16 мая 2012 в 20:04 Ответить
Альтер Эго
>Как программа называется где про это показывали? Профилактика http://russia.tv/video/show/brand_id/5200/video_id/127321
16 мая 2012 в 20:23 Ответить
megapinion
Уважаемые господа Ашманов и Туков, ответьте пожалуйста, как вы сами оцениваете — на сколько процентов эта ваша деятельность есть, скажем, объективное научное исследование, а на сколько — борьба с «оранжевой чумой» и американской агрессией? Если вы какие-то ещё компоненты в этой своей работе выделяете — назовите, пожалуйста, и тоже оцените в процентах.
16 мая 2012 в 20:55 Ответить
Альтер Эго
Да, и еще еще несколько вопросов: 1) Правда ли что Ашманов делает это по просьбе Партии Жуликов и Воров? 2) Правда ли что ему время на федеральных каналах в рамках этой работы? 3) Правда ли что для поддержания («подогрева» как вы говорите) интереса к этим сюжетам в дальнейшем используются захваченные у спамеров ботнеты? Не надо процентов, ответьте мне только да или нет!!
16 мая 2012 в 21:00 Ответить
Игорь Ашманов Сам себе компания
Ах, в процентах оценить! А число Пи до десятимиллиардного знака вам не назвать? Или это такой риторический кагбэ вопрос? Это ни разу не научное исследование, и об этом в статье сказано прямо. Статья выше вообще исследований не содержит. Вы когда-нибудь научные статьи в своей жизни читали? Если да, то должны были бы сразу заметить разницу. Это рассуждение о сетевых роботах, на уровне большинства статей на Роем.ру, то есть мнение игроков отрасли об этой самой отрасли. Вот предыдущие передачи в Профилактике, про вбросы, содержат несколько больше объективных данных, полученных нашим коммерческим сервисом. Данные, они вещь такая, поддаются, конечно, интерпретации, но в известных пределах, так что явно искусственный вброс останется искусственным, как его ни интерпретируй. Но науки тут немного (есть развитая инженерия: автоматический синтаксис, поиск по блогам, анализ тональности, сведение вместе нечётких дублей, вычисление ранга блогера и поста и т.п.). Про американскую агрессию: да, таковая агрессия в Рунете, несомненно, наблюдается. Мы (как и весь мир) давно уже находимся в самой гуще информационной войны. Люди, которые это отрицают, представляют собой либо типичную жертву поездных карточных шулеров, которая убеждена, что это вокруг просто приятные попутчики, помогающие скоротать время, либо кого-то из группы поддержки этой банды шулеров. Моё мнение, что с информационной агрессией и манипуляцией обязательно нужно бороться. Это должно делать государство, министерство идеологии или департамент информационных войн, что там наконец сообразят создать у нас. Моя простая цель в этих передачах Профилактика» была — просто назвать вещи своими именами, указать на факт информационной войны и показать, как можно относительно просто отличать естественные новости и темы от искусственных. Для ещё большего упрощения сформулирую Правило Ашманова, которое я для себя вывел ещё в советское время: Эмпирическое правило Ашманова для верного восприятия СМИ: Если СМИ на чём-то особенно настаивают, это точно враньё. Для блогов и соцсетей это, похоже, также верно. Просто теперь слово «особенно» можно выразить количественно.
16 мая 2012 в 21:06 Ответить
Игорь Ашманов Сам себе компания
1) Правда ли что Ашманов делает это по просьбе Партии Жуликов и Воров? Нет. А это что за партия такая, кстати? 2) Правда ли что ему время на федеральных каналах в рамках этой работы? Нет. Нет никакого «времени на федеральных каналах». Есть безбашенная передача Профилактика, куда я попал относительно случайно и вряд ли пойду в ближайшее время ещё раз, утомился уже про это говорить. 3) Правда ли что для поддержания («подогрева» как вы говорите) интереса к этим сюжетам в дальнейшем используются захваченные у спамеров ботнеты? Нет. Для подогрева сюжетов нами используются люди с вживлёнными в моск чипами, это гораздо эффективнее, они рассылают сообщения высокого лингвистического качества 18-20 часов в сутки. Последнее время на замену чипам мы отрабатываем захват сотовых станций, для передачи видоизменённого GSM-сигнала напрямую в мозг пользователя соцсети. Как ни странно, легендарные шапочки от фольги — это реальное средство противодействия, мы работаем над преодолением его, но пока неуспешно.
16 мая 2012 в 21:23 Ответить
megapinion
Дык, эта, после того, как вопрос задан — инициатива переходит к отвечающему. И там возможен как содержательный ответ на риторический вопрос, так и риторический ответ на содержательный вопрос. Но вы ведь закалённый боец полемических баталий — вцепились в слово «научный» (проигнорировав вводное «скажем»), хотя вопрос-то был, конечно, о соотношении объективности и ангажированности. А сейчас вы, видимо, придерётесь к слову «объективность». Впрочем, ответ ваш более-менее понятен. _
16 мая 2012 в 21:34 Ответить
megapinion
> Эмпирическое правило Ашманова для верного восприятия СМИ: Если СМИ на чём-то особенно настаивают, это точно враньё. То есть в советское время вы понимали, что в официальных СМИ (а других-то и не было) очень много вранья? Ну прямо диссидент-антисоветчик! Может вы и самиздат с тамиздатом читали? А сегодня «правило Ашманова для верного восприятия СМИ» распространяется только на оппозиционные либеральные СМИ или на «государственно-патриотических» тоже?
16 мая 2012 в 21:50 Ответить
sunshine
Прочитал с интересом, спасибо. Однако, пример с Патриархом выбран, на мой взгляд, не удачно. Ибо новости о его, так скажем, необычных поступках весьма интересны и сами по себе. А следовательно, в раскрутке особо и не нуждаются. И даже соответствующий график не особо убеждает (именно в данном случае), т.к., имхо, такая кривая вполне может быть вызвана естественным ходом событий. Но, допустим, данная новость всё же была раскручена искусственно. Уменьшается-ли от этого степень вопиющести поведения гражданина Гундяева? Думаю, что нисколько не уменьшается. Но в статье ощущается определённый подтекст, а именно — что чего вы прицепились к Патриарху, видите же — ведь жареные факты раскручены злопыхателями. У меня есть даже ощущение (нисколько, впрочем, на нём не настаиваю, это моё личное впечатление), что вся статья имела целью подлечить репутацию Патриарха. Одним словом, если тут спамеры и приложили руку, то во благо, а не во зло. Народ должен знать своих героев :).
16 мая 2012 в 23:37 Ответить
Игорь Ашманов Сам себе компания
Ибо новости о его, так скажем, необычных поступках весьма интересны и сами по себе. А следовательно, в раскрутке особо и не нуждаются Нуждаются или нет, решаете, похоже — не вы. А те, кто решает, те вливают довольно много денег и ресурсов в раскрутку именно этого наезда. В вашем рассуждении упущена довольно существенная деталь: примерно половина вбросв про Патриарха — никакие не новости, а заботливо раскопанный тухляк двухгодичной давности (часы, пансионат, квартира — это всё тухляк, а не новости). Например, история с часами. Её пыталась пару лет назад раскрутить знаменитая Украинская Правда, когда Патриарх приезжал на Украину; все успели это дело забыть, сама фотка лежала на сайте чуть не три года. Потом, внезапно, какая-то девушка решает стереть никому не интересные часы на старой фотке (зачем?), тут же кто-то внезапно и случайно наутро же узнаёт об этом? а дальше — раскрутка пикового типа. Это просто «интересная новость»? Ага, щас. Это сфабрикованное событие. Не знаю, уволили ли девушку, я бы уволил, не за ошибку, а за предательство. Тут никаких сомнений быть не может. Ну и остальные факторы искусственности здесь тоже присутствуют: и постоянное вбрасывание, и пиковая раскрутка в 9 и 15 дня, и использование ботов в некоторых из вбросов, и т.п. такая кривая вполне может быть вызвана естественным ходом событий. Нет, не может. См. выше. В качестве упражнения по личностному росту предлагаю вам задуматься о том, как вы пишете здесь свои умозаключения. Вы же не знаете ничего о кривых и ходе событий, вы просто это написали здесь и всё. Ведь не знаете, верно? Не изучали, не сравнивали, ничего такого. Это не очень далеко укатилось от прямой лжи — уверенно говорить о том, в чём на самом деле не разобрался.
16 мая 2012 в 23:39 Ответить
Игорь Ашманов Сам себе компания
Может вы и самиздат с тамиздатом читали? Читал, как и все. И размножал на ксероксе, в начале 80-х ксероксы уже кое-где были. А сегодня «правило Ашманова для верного восприятия СМИ» распространяется только на оппозиционные либеральные СМИ или на «государственно-патриотических» тоже? На любые.
16 мая 2012 в 23:41 Ответить
Альтер Эго
>Это не очень далеко укатилось от прямой лжи — уверенно говорить о том, в чём на самом деле не разобрался. А это вы сейчас кровно оскобили всех Альтерэг просто. И ilyaka заодно. :-(
16 мая 2012 в 23:52 Ответить
Альтер Эго
> а на сколько — борьба с «оранжевой чумой» и американской агрессией? а агрессии, конечно, нет. а Пентагон просто соврал про систему управления информационными войнами.
16 мая 2012 в 23:55 Ответить
Игорь Ашманов Сам себе компания
Но последний абзац «Покупайте Ашмановское!» смазывает впечатление. У нас нет антиспама для соцсетей. Продать не можем. Если занесёте миллионов тридцать рублей, тогда сделаем, наверно. За полгода-год.
17 мая 2012 в 00:14 Ответить
Глеб Суворов https://t.me/itsocial
Да ну какая система управления информационными войнами, это же чистой воды распил американского бюджета :) такой софт уже давно существует. как бы даже не фришный (хотя флок загубили). и можете снимать шапочки из фольги — никакие цру, анб и пры-пры за вами не следят. http://lenta.ru/news/2012/05/12/nsagoogle/ ——— проблема не в ботах, поддержу мысль сумрака — проблема в головах людей. не проблема отличить бота от человека. проблема отличить человека от программы! :(
17 мая 2012 в 00:20 Ответить
Альтер Эго
«Отношения Google с американскими разведчиками оставили в секрете Апелляционный суд округа Колумбия, США, поддержал решение Агентства национальной безопасности (АНБ) не публиковать документы, подтверждающие или опровергающие связи ведомства с корпорацией Google. » Ага, не следят, ага.
17 мая 2012 в 00:22 Ответить
Игорь Ашманов Сам себе компания
поддержу мысль сумрака Я бы предложил вам всё-таки поддержать мысль света.
17 мая 2012 в 00:37 Ответить
megapinion
Alter Ego 16.05.2012 23:52:06 # > а агрессии, конечно, нет. Несомненно, страна А осуществляет агрессию против страны Б. Вместо А и Б можете подставить название любых двух стран.
17 мая 2012 в 00:37 Ответить
Глеб Суворов https://t.me/itsocial
а кто у нас за свет нынче?
17 мая 2012 в 08:31 Ответить
Юрий Синодов Roem.ru
Да, с тегами следующая ерунда — они похожи на гуглобомбинг. В принципе они нафиг никому не нужны, точно также как и запросы в духе «путин краб», «жалкий» и все такое. Соответственно, простота раскрутки и попадания в СМИ невысока, ну может чуть проще чем в поиске
17 мая 2012 в 09:22 Ответить
Игорь Ашманов Сам себе компания
Нет, в поиске гораздо проще. Дешевле. Берёшь слово, которого не существует, типа «говноговноговно», покупаешь горсть ссылочек на нужный сайт, на сто рублей с анкорами «говноговноговно», ждёшь сколько-то, пока Гугль-Яндекс прочихается, и вуаля!, информационный повод готов, дальше — только его посев нужен. Причём сайт будет по этому запросу в топе долго, иногда месяцы. И конкурентов по выдуманному запросу — нет. А в тренды Твиттера загнать — нужны сотни и тысячи ретвитов, всё плывёт, другие тренды мешаются, а назавтра все усилия уже не видны, тренды новые.
17 мая 2012 в 09:24 Ответить
Игорь Ашманов Сам себе компания
не проблема отличить бота от человека. проблема отличить человека от программы! :( Не проблема отличить бота от человека, человека от программы, программу от бота, человека от человека. Проблема отличить свет от сумрака.
17 мая 2012 в 10:16 Ответить
soomrack
Странно, что тут никто не упомянул про [URL=http://www.loebner.net/Prizef/loebner-prize.html]конкурс Лебнера[/URL]. Движки роботов-собеседников там открытые, а успехи в обмане судей впечатляющие.
17 мая 2012 в 10:24 Ответить
Игорь Ашманов Сам себе компания
По-моему, там нет никаких успехов. Когда я ещё этим конкурсом интересовался, ситуация там была такая — давали только бронзовую премию. За лучшесть среди прочих, но не за обман судей. То есть тест Тьюринга никто (или ничто?) не проходил никогда.
17 мая 2012 в 10:27 Ответить
Игорь Ашманов Сам себе компания
Да и движки там, по-моему, в среднем не открытые. Там есть открытая Алиса профессора Ричарда Волласа на своём диалекте XML, а есть и проприетарные движки.
17 мая 2012 в 10:30 Ответить
Альтер Эго
http://www.towave.ru/news/kheshegi-barrikadnaya-i-okkupaibarrikadnaya-v-tope-trendovtwitter-po-rossii.html
17 мая 2012 в 10:30 Ответить
Альтер Эго
> Несомненно, страна А осуществляет агрессию против страны Б. Вместо А и Б можете подставить название любых двух стран. взял карту, стал подставлять. в большинстве случаев какая-то чушь получается. Андорра осуществляет агрессию против Монголии? Россия против Новой Зеландии? Монако против Чили?
17 мая 2012 в 10:34 Ответить
Альтер Эго
>взял карту, стал подставлять. в большинстве случаев какая-то чушь получается Да пожалуйста Россия против Грузии Россия против Украины Россия против Латвии Россия против Литвы Россия против Эстонии Россия против Польши Мало вам??? Живём как на военном положении, постоянно под страхом ареста или начала войны!
17 мая 2012 в 10:41 Ответить
soomrack
Лучшие движки открытые. На счет базы знаний не уверен. После A.L.I.C.E. там много изменилось. В последние два года присуждается бронзовая медаль, т.е. за обман судей (одного из 4-х). Судьи не абы кто, плюс у них есть задача распознать робота за 5 минут активного разговора (финал соревнования). Это гораздо сложнее, чем сгенерировать пост/письмо/ветку в форуме, которую никто детально не изучает на предмет искусственного происхождения.
17 мая 2012 в 11:01 Ответить
megapinion
> http://www.towave.ru/news/kheshegi-ba…ossii.html Не сомневаюсь, что объективный (хотя и не научный) исследователь Ашманов представит нам непредвзятый (хотя и не научный) анализ этого кейса. _
17 мая 2012 в 11:23 Ответить
Альтер Эго
>Не сомневаюсь, что объективный (хотя и не научный) исследователь Ашманов представит нам непредвзятый (хотя и не научный) анализ этого кейса. Ну, если вы смотрели передачу или читали текст, то там одним из примеров было зашумление хэштега #05dec
17 мая 2012 в 15:08 Ответить
Игорь Ашманов Сам себе компания
Не сомневаюсь, что объективный (хотя и не научный) исследователь Ашманов представит нам непредвзятый (хотя и не научный) анализ этого кейса. Вероятно, раз вы настолько не сомневаетесь, у вас уже запланирован бюджет на заказ этих исследований нам? Давайте сверим часы: у нас средний чек по кампании мониторинга — 250-300 тысяч рублей в месяц. Это при мониторинге брендов/продуктов/персон для корпораций, то есть кампания мониторинга с более-менее фиксированным семантическим ядром. Анализ политических трендов, которые возникают буквально каждый день, будет стоить раза в 2-3 дороже — потому что нужна постоянная поддержка и обновление СЯ. Если же нужно обнаруживать в медийном пространстве любые новые тренды, когда они только взлетают — то стоимость может быть больше и на порядок.
17 мая 2012 в 16:28 Ответить
megapinion
Не понял: вы серьёзно меня за уже прибывшего к вам эмиссара «вашингтонского обкома» приняли? Типа, кто платит, тот и заказывает музыку? Но предыдущие-то кейсы ваши были за свой счёт, правда ведь? Продвижение на рынок B2G, так сказать. _
17 мая 2012 в 17:38 Ответить
Игорь Ашманов Сам себе компания
Нет, почему, я принял вас за конкретного пацана, который готов ответить баблом за свои хотелки. Видимо, я ошибся… Вот и верь после этого людям…
17 мая 2012 в 18:00 Ответить
Альтер Эго
—Мало вам??? Живём как на военном положении, постоянно под страхом ареста или начала войны! Тебя посодют, а ты не воруй!
17 мая 2012 в 22:21 Ответить
Dan_Te
Ashmanov и Туков, спасибо за хорошую статью.
18 мая 2012 в 16:39 Ответить
Yuri Novosad
Dan_Te +1
18 мая 2012 в 17:26 Ответить
neuymin
Кстати, о ботах. Пользователи вконтактика, набегавшие в обсуждение прошлой передачи Игоря Станиславовича — тоже боты?
18 мая 2012 в 20:57 Ответить
Альтер Эго
писал, и не один раз, что при подсчёте цены коммунистического эксперимента на территории бывшей Российской Империи у меня оставалось где-то около 5 (4-6) млн. чел. «неучтённых потерь». Не дискуссии ради, а просто для справки обращаю внимание не исследования уважаемого corporatelie — в частности, это: *САЗЛАГ ОГПУ-НКВД как лагерь перманентной катастрофы: сравнение с концлагерями Третьего Рейха 1943г. (В качестве дополнения и развития вот этого поста,- СазЛаг ОГПУ-НКВД против Бухенвальда СС :сравнение статистики смертности заключенных на микроуровне.)* http://corporatelie.livejournal.com/38967.html?style=mine#cutid1 и другое: http://corporatelie.livejournal.com/
18 мая 2012 в 21:41 Ответить
Альтер Эго
А я вот что скажу http://mn.ru/images/31803/95/318039512.jpg
18 мая 2012 в 22:30 Ответить
Игорь Ашманов Сам себе компания
писал, и не один раз, что при подсчёте цены коммунистического эксперимента на территории бывшей Российской Империи А вы это писали и не один раз точно так же — ни к селу, ни к городу?
19 мая 2012 в 19:39 Ответить
Иван Крючков TS
Спасибо господину Ашманову за прекрасный материал и видео выступления на данную тему, побольше бы таких людей как вы.
19 мая 2012 в 21:54 Ответить
neuymin
О, партийная помощь подошла.
19 мая 2012 в 23:55 Ответить
Альтер Эго
И я тоже считаю что Ашманов говорить дельные вещи. И готов его всячески поддерживать.
20 мая 2012 в 08:40 Ответить
Yury Dvorkin University of Washington, Ph.D. Candidate
Конечно, сайты типа Гугла, Яндекса, ВКонтакте или ФСБ.ру завалить практически нельзя, там приняты меры, а вот сайты отдельных СМИ, госорганов, а также сервисы вроде ЖЖ завалить вполне можно. ==== Первые три компании — успешные коммерческие проекты, и даже кратковременный выход из строя их сайтов может привести как прямым (например, рекламным), так и к косвенным (например, репутационным) убыткам. Какой смысл кому бы то ни было взламывать сайт ФСБ, представляющий из себя жалкое зрелище: каталог ссылок, телефон горячей линии и раздел новостей, обновляемый раз в несколько суток, а то и реже? Мне с трудом представляется, что кто-то будет тратить время, чтобы дидосить страницу, посещаемость которой сравнима с посещаемостью местечкого шиномонтажа. Видимо, дидосы на сайты ФСБ такие же виртуальные, как и террористы, о поимке которых сообщается в разделе новостей оного ресурса.
20 мая 2012 в 09:28 Ответить
Игорь Ашманов Сам себе компания
Я думаю, там атаки идут всё время, так же как и на сайт президента и премьера. По понятным причинам, среди которых деньги — пятнадцатая.
20 мая 2012 в 20:31 Ответить
Альтер Эго
> настоящий, мужской антиспам. а такой как действует? или сразу на ноги/голову/анус спамера?
21 мая 2012 в 00:50 Ответить
Yury Dvorkin University of Washington, Ph.D. Candidate
Я думаю, там атаки идут всё время, так же как и на сайт президента и премьера. По понятным причинам, среди которых деньги — пятнадцатая. Если вы так думаете, то не могли бы перечислить четырнадцать предшествующих причин, которые, как вы признались, вам понятны? Мне до сих пор это представляется надуманным — дидосить сайт, который представляет себе каталог ссылок, сопоставимый по объему с сайтом любой московской среней школы.
21 мая 2012 в 17:04 Ответить
Альтер Эго
Дурачка не нужно строить. Вот прямо кажется надуманным, прям не понимаю, дааааа. Завалить сайт президента или ФСБ — дело доблести и геройства для любой сепаратистской или либеральной мрази. Вон как дидосят сайт в поддержку ОМОНа.
21 мая 2012 в 20:10 Ответить
Yury Dvorkin University of Washington, Ph.D. Candidate
Дурачка не нужно строить. Вот прямо кажется надуманным, прям не понимаю, дааааа. Завалить сайт президента или ФСБ — дело доблести и геройства для любой сепаратистской или либеральной мрази. Вон как дидосят сайт в поддержку ОМОНа. Я в полемику с анонимами не вступаю :( Вопрос был задан не вам, а пользователю Ashmanov, который протрындел, на мой взгляд, глупость :)
21 мая 2012 в 20:47 Ответить
Игорь Ашманов Сам себе компания
Дворкин, вы не отвлекайтесь, давайте ищите нестыковки в моей биографии. Вдруг найдёте что-то ужасное? Фальшивый диплом! Вам ведь, видимо, скучно там кандидатом на пиэйчди сидеть в Юсах. А тут дискуссия! Можно почувствовать себя важным человеком. Мнене высказать. Чудеса Интернета. Насчёт сайта ФСБ — очевидно, он является объектом непрерывной атаки. Всегда, 24*365. Так же, как сайт ЦРУ или сайт Белого дома. По понятным причинам. Они что, вам непонятны? Вам выше уже указали, что вы, вероятно, нарочно включаете дурака. Мне кажется, автор того комментария рассмотрел не вполне полную систему гипотез.
21 мая 2012 в 20:57 Ответить
Yury Dvorkin University of Washington, Ph.D. Candidate
Насчёт сайта ФСБ — очевидно, он является объектом непрерывной атаки. Очевидно дословно означает «глазами видно», вы с какой стороны свечку-то держали? Со стороны нападения или со стороны кровавых застенок? Вам выше уже указали, что вы, вероятно, нарочно включаете дурака. Вы, наверное, не поняли, но мне искренне не понятно, как можно ставить Я, Г, В в один ряд с Ф? Кому нужен этот нефункциональный каталог ссылок?
28 мая 2012 в 15:10 Ответить
Ангелина Костикова
не понятно правда, только зачем это нужно, давать чей то номер телефона, который вам не принадлежит? на мой взгляд, телефон должен ассоциироваться с компанией и быть легко запоминающимся, что в этом сервисе не представляется возможным. К тому же и потенциального клиента теряете, в случае дисконекта не сможете ему перезвонить. Да и вообще зачем отслеживать звонки, когда можно просто платить за каждый входящий звонок или покупку, фиксированную сумму с продаж.
10 июня 2012 в 13:34 Ответить
Евгений Коровин
Здесь тоже робот есть: http://luckyea.ucoz.ru/index/chat/0-134

Важное

Обсуждаемое