Качество поиска в перспективе

Точка зрения

"КТ": А насколько качество поиска коррелирует с популярно-стью поискового сервиса?Себрант:

Ни насколько.Волож: Да нет, если наш поиск долго будет хуже гугловского или рамблеровского, то люди начнут уходить.

Себрант: Но не наоборот. Если предположить, что гугловский поиск будет на два процента лучше, то… Во-первых, что значат эти два процента? Во-вторых, что значит "лучше"?

Волож: Неизвестно, как устроена эта материя. Почему пользо-ватели приходят туда, а не сюда - никто не знает.

Сегалович: Ну, нет, я знаю.

Волож: У тебя теории. У всех свои гипотезы. Я вот считаю, что просто не надо вредить. Надо стараться делать хорошо…

«Яндекс. Сегодня» - Сергей Леонов, Владимир Гуриев,

опубликовано в журнале "Компьютерра" №11 от 22 марта 2006 года - http://offline.computerra.ru/2006/631/259144/

 

Такая вот была три года назад приятная добродушно-расслабленная беседа первых лиц Яндекса, безусловного лидера русского поиска, с корреспондентами «Компьютерры». Хорошо-то ведь как: пользователи почему-то приходят сюда, а не туда; что такое "лучшее качество поиска" - непонятно, а гипотез разных много, ну их к лешему; надо просто стараться делать хорошо, стараться делать лучше… Спустя два года, в 2008-м получилось "как всегда": 25% новых сайтов, по данным Яндекса, были классифицированы как поисковый спам, на бесплатных хостингах – свыше 50%.

Появление новых сайтов и поиск – звенья единой цепи в деле обеспечения нас качественным Интернетом. Похоже на завод: продукция - сайты, поиск – отдел упаковки и доставки до потребителей. Сравнение хорошее, сразу видно: что-то здесь не так. Не может быть все в порядке на заводе, где каждое четвертое изделие официально признано браком. И сколько их, "почти хороших" сайтов, до потребителей все же дошло.

Пользователей поиска в Рунете десятки миллионов человек. Говорить от имени такой аудитории позволяют себе только поисковики. Мол, мы даем ответы на десятки миллионов запросов, значит, пользователям это нравится, иначе бы не спрашивали. Или, как сказал вице-президент Google Марио Коэйрос, "мы можем оценить адекватность своих представлений о качестве поиска по работе Google в сотне стран". Поэтому, когда я вижу – который год уже - в ответ на запрос "рассказы" в первой десятке Яндекса и Google девять ссылок на сайты с низкопробной порнографией, начинаю сомневаться в первую очередь в собственной адекватности; авторитет опыта организации поиска для миллионов пользователей и в сотне стран давит бетонной плитой. Выдача не нравится категорически, так ведь Google!, ведь Яндекс же!.. Но вспоминаю анекдот: "Если на стене сарая видишь надпись из трёх букв - не верь глазам своим. В сарае дрова лежат", - и становится как-то легче.

Попытаюсь сформулировать претензии к нашим "зеркалам Интернета" именно с точки зрения пользователя. Личной, а не десятков миллионов. Совпадают ли наблюдения с вашими, читатель, вам и решать.

Что не нравится

Итак, что не нравится. Думайте сами - тенденции это или мелкие единичные недостатки, которые не очень-то и портят общую радужную картину замечательного русского поиска.

 

- Не нравится, что в результатах поиска по запросам, совпадающим с названием товара или услуги, показывают большей частью а) адреса продавцов, б) продавцов московских. Если я, проживая в Казани, ввожу запрос "мебель" - это не значит, что я уже готов покупать мебель в Москве. Думаю, пользователи поиска из "немосквы" картину узнают.

- Не нравится навязчивая порнография. Я не принципиальный ее противник, просто меру знать надо. "Рассказы", "бесплатное видео", "девушки", "брюнетка", "крупный план", "негры", "пляж" и так далее – это не те запросы, по которым нужно показывать по 3-10 порноссылок.

- Не нравится бессистемность, бесструктурность выдачи. По запросу "литература" должен выдаваться подробный рубрикатор, позволяющий быстро представить себе состояние дел в этой области в Сети, а не пять ссылок на электронные библиотеки, статью из Википедии и пару известных литературных ресурсов. То же самое касается и других информационных запросов.

- Не нравится низкое качество текстов на сайтах, "оптимизированных" для поисковых систем. Именно они чаще всего хорошо видны в результатах поиска. "Вы спросили в Яндексе «шкаф-купе». Вы хотите купить шкаф-купе, потому что нужно сложить вещи в шкаф, который может быть купе. Правильно, шкаф-купе это самое лучшее решение. Наши шкафы-купе помогут вам. Мы уже триста лет делаем эти самые шкафы-купе и в производстве шкафов-купе приобрели изрядный шкафокупейный опыт. Купейношкафные мастера, изготовляющие шкафы-купе нашей компании размножаются в наших же шкафах-купе и передают опыт шкаф, irfa, купе, regt из поколения в поколение…" Иными словами, "SEO-копирайтинг".

- Не нравится практика поисковых систем вываливать в ответ на точный - длинный - запрос кучу ссылок ни к селу, ни к городу. Видимость "поиска" создается, но результат нулевой. В ответ на запрос "где в Казани починить часы" предлагают тексты "Затем он посетил митрополита, оттуда был в монастыре Девичьем, где чудотворный образ Явления Казанской Богородицы. Потом был у вице-губернатора Кудрявцева, 18. За три дня пребывания в Казани Петр I осмотрел кожевенный и суконный заводы…", По дороге он тяжело заболел и был времен-но оставлен в Казани, в доме профессора Казанского... Важную роль сыграл он в организации и дея-тельности факультета восточных языков СПбу, где дважды избирался на пост декана (1855-1858, 1866-1870) и т.п. Всего 56 тысяч страниц, и ни одной ссылки по делу. Пример, понимаете, не единственный. Судя по всему, в недалеком будущем нас ждет появление возможности голосового ввода запроса в поисковые системы, что приведет к стремительному сдвигу потока запросов в сторону более длинных, естественных формулировок. Чтобы увидеть, с какой проблемой столкнутся тогда и пользователи, и поисковики, "наговорите" с клавиатуры что-нибудь вроде "сломался генератор на Suzuki, где в Москве находятся фирменные автосервисы" и насладитесь результатами поиска в ответ на отлично сформулированный запрос.

- Не нравятся расплодившиеся в последние годы "мэшапы", "информационные ресурсы", "развлекательные порталы", сайты, состоящие большей частью из ворованной информации на самые разные темы – без указания авторов, источников. Нашпигованные рекламой и желтыми заголовками, провоцирующие кликать и кликать по ним. Воровство информации поставлено на промышленную основу, свежие украденные статьи на таких сайтах в поисковом индексе появляются раньше, чем оригиналы.

- Не нравятся сайты несуществующих компаний, созданные для продажи ссылок.

- Не нравится ссылочный мусор на хороших, живых проектах.

- Не нравятся сайты, на которых "партнерская" реклама самих же поисковых систем занимает центральное место на странице, либо является основным содержанием.

- Не нравится откровенный спам – страницы, напичканные галиматьей, нечитаемым текстом, "рерайтом", авторефератами, автоматические дорвеи.

- Не нравятся многочисленные "каталоги", "доски объявлений" и "энциклопедии", использующие одну и ту же базу данных, но пролезающих в индекс и результаты поиска в виде разных сайтов.

- Не нравятся проекты, у которых хорошо видна цель продвинуть как можно больше страниц в поисковые индексы. Доходит до абсурда, "Войну и мир" пытаются разбить чуть ли не по предложениям, по одному на каждой странице. Естественно, с блоком рекламы на каждой.

- Не нравятся "партнерские программы", как "товарные", так и "знакомств" - база данных одна, сайтов в индексе тысячи, везде одни и те же рожи.

Все упомянутое только мне кажется, или вы тоже замечали что-то подобное?

Но больше всего не нравится, что весь этот мутный вал некачественной, анонимной, недостоверной, неструктурированной информации, за которую "владельцы сайта не несут никакой ответственности, ссылка при копировании обязательна", не уменьшается, он растет с каждым годом. Ни Интернет, ни поиск лучше не становятся. Впрочем, как философски заметил руководитель спецпроектов Яндекса Андрей Себрант, "что значит лучше"?

Что значит "лучше"?

Вопрос, конечно, интересный. Подходы к оценке результатов поиска описаны в статье "Парадоксы релевантности" и дополнены в 9-м выпуске рассылки "Проблемы качества поиска". Если уж браться за этот вопрос, стоит изучить терминологию. Иначе может быть непонятно, почему единственный пертинентный ответ на сотой позиции при наличии 99 вышестоящих релевантных ссылок может считаться как вполне качественным, так и не очень, дело в методиках. Общепринятой пока нет, поэтому без "теорий и гипотез" не обойтись. Рассматривать лучше крайние подходы, истина окажется где-то между.

Вот первый. Поисковики служат пользователям, пользователи и решают, насколько хорош тот или иной поиск. Кому что нравится. Если опросить всех пользователей, а каждого пользователя по всем сделанным им запросам, можно получить достоверные данные. Что-то вроде: 100000 человек в Яндексе задали вопрос такой-то, остались довольны результатом 50000, недовольны 20000, 30000 сами еще не поняли. И так для каждого запроса. В итоге выйдет цифра некоей "удовлетворенности" аудитории своим поисковиком – 75%, 50%... Всех, конечно, не опросить, но с помощью выборочных опросов можно получить более-менее приближенную цифру. Примерно так сегодня и делается.

Другой подход. Попытаться сравнить реальные результаты поиска с неким "эталоном", идеальными результатами. Прием хорошо используется во многих науках, но в поисковых технологиях с эталонами явная проблема. Есть хорошее описание идеального поиска от бывшего руководителя исследовательских лабораторий Yahoo! Гари Флейка: "Если бы веб-поиск был совершенен, он бы выдавал ответ на каждый запрос, и это происходило бы так, будто на вопрос отвечает умнейший человек в мире, у которого есть под рукой вся справочная информация, и все это выполняется меньше, чем за мгновение. Другими словами, поисковик был бы ... таким умным, что если правильный ответ теоретически может быть найден в стремящихся к бесконечности ресурсах, он бы нашел его. Если бы верного ответа не существовало, тогда ... выдавал наиболее близкий по смыслу ответ, или даже объяснение, почему ваш запрос не может получить идеальных результатов".

Как видим, определение не так-то просто применить для оценки результатов по отдельно взятым запросам, например, любимыми оптимизаторами "кондиционерам", "пластиковым окнам" или "шарикоподшипникам". А руководитель спецпроектов Яндекса Андрей Себрант, скорее всего, философски заметит: "Что значит «умнейший»?".

Стоит отметить следующее. В случае сравнения с идеалом значение имеет каждый (!) анализируемый ответ. При статистической же оценке миллион некачественных ответов на разные запросы вполне можно списать на ошибки измерений. Первый подход обычно применяют представители поисковиков: "Мы не знаем, как должны выглядеть идеальные результаты в ответ на запрос «шарикоподшипники». Зачем думать об одном запросе, наш поиск отвечает на десятки миллионов разных запросов". Второй - пользователи: "Я искал схему агрегата N, куча мусора в ответ, ничего не нашел. Какой же отвратительный этот поиск M!".

Теории идеального ответа, которую можно применять на практике, сегодня не существует. По методике РОМИП (описана в "Парадоксах релевантности"), "идеальным алгоритмом ранжирования считается тот, для которого выводы, сделанные системой, согласуются с мнением оценивающих экспертов". А экспертам рекомендовано использовать… здравый смысл. Цитирую инструкцию для асессора дорожки поиска: "Ключевое правило - используйте ваш здравый смысл и попробуйте представить себя на месте человека, задавшего этот запрос".

Здравый смысл - вещь, конечно, хорошая, но сложно представить себе результаты работы врача, архитектора, конструктора, основанные исключительно на здравом смысле, без предварительной специальной теоретической подготовки.

Мой здравый смысл говорит, что девять ссылок на порнуху в топе выдачи по запросу "рассказы" - это уже за гранью здравости; асессоры, оценивающие релевантность каждой такой ссылки, ничего плохого не нашли.

Спросил "рассказы"? – Это рассказы.

Рассказы могут быть эротическими? - Могут. Значит, релевантно.

И так девять раз подряд. И нет никакого теоретического положения, согласно которому асессор должен понижать оценку качества выдачи в ответ на нечеткий запрос, если она состоит из однотипных предложений, являющихся ответами на более точный, узкий запрос.

Гипотеза первая

Вряд ли поисковики смогут кардинально изменить качество результатов поиска до тех пор, пока не появится более-менее приличная рабочая теория формирования идеальной выдачи в ответ на поисковый запрос. Это даст хотя бы возможность сравнивать версии ответов, что уже лучше, чем "во-вторых, что значит «лучше»?".

Конечно, "надо стараться делать хорошо". Но, как писал А.В. Суворов, "надобно ж и умение", на одном здравом смысле далеко не уедешь.

Экономика антикачества

Вернемся к нашей заводской аналогии, где каждое четвертое изделие бракуется. Почему? Продукцию делают не роботы, люди, у каждого спам-сайта всегда есть автор, чей творческий замысел так негативно оценила поисковая система. Считать спамеров клиническими дебилами, не понимающими смысл слов Аркадия Воложа "просто не надо вредить", не получается, таких сайтов сотни тысяч, слишком много. Налицо четко выраженная мотивация для их изготовления и порожденные ей технологии. Которые технический директор Яндекса Илья Сегалович еще в 2000 году назвал "антипоисковыми".

Давайте взглянем, что сегодня выгодно.

- Воровать контент - выгодно. О масштабах воровства можно судить по тому факту, что крупнейшие западные издательские дома и компании в марте попросили Google избавиться от медиапаразитов, использующих чужой эксклюзивный контент для перехвата посетителей из верхних строчек результатов поиска.

- Уродовать оригинальный текст, завышая частоты ключевых слов – выгодно.

- Генерировать бессмысленный, но грамматически правильный текст – выгодно.

- На базе одной хорошей статьи с помощью ручного или автоматического "рерайта" делать пять и больше – выгодно.

- Разбивать большие тексты по одному абзацу на странице для увеличения количества страниц в поисковых индексах – выгодно.

- Создавать сайты несуществующих компаний – выгодно.

- Обвешивать сайты партнерской рекламой на самых видных местах – выгодно. - Создавать псевдопроекты, единственной целью которых является попадание в индекс, для продажи ссылок – выгодно.

- Посредничать в торговле ссылками – выгодно.

- Размещать на хороших сайтах блоки "продвигающих" ссылок – выгодно.

- Взламывать сайты и размещать втайне от их владельцев блоки ссылок – выгодно.

Вышеперечисленное никак не может улучшить качество Интернета и поиска, но активно применяется в самых различных комбинациях. Доход обеспечивается при необходимом участии в схеме поисковых систем, без них ни один из упомянутых приемов не работает.

Это не попытка морализаторства, это попытка констатации факта, что экономика сайтостроительства сегодня ориентирована не на улучшение, а на ухудшение сетевого контента. Сегодня, чтобы зарабатывать на продаже ссылок, необходимо выполнить единственное условие: добиться, чтобы сайт был проиндексирован; качество содержимого сайта при этом не имеет никакого значения.

Тем же владельцам сайтов, которые смысл слов "не надо вредить" понимают хорошо, предложен тяжелый выбор. Или "не вредить" и находиться на сотых позициях в поиске в надежде, что поисковики когда-нибудь научатся фильтровать поисковый спам, отличать лучшее от худшего, и все праведники, наконец-то, честно попадут в рай, т.е. в топ выдачи. Дожить бы. Или заплатить специалистам, которые "оптимизируют тексты", "пропишут сайт в каталогах" и "разместят ссылки на сайт", т.е. профинансировать откровенное вредительство. При этом позиции в поиске, за которые поисковики, как гусары с женщин, денег не берут, свободно продаются SEO-компаниями с гарантией: нет позиции – не нужно платить.

Гипотеза вторая

Пока не будут созданы экономические условия прибыльности производства действительно хорошего контента, надеяться на общее улучшение качества поиска вряд ли возможно. Каждый веб-мастер, создающий хороший сайт, должен точно знать, чем это ему выгодно, и как эта выгода будет реализована. Спамеры и оптимизаторы механизмы получения дохода от своих действий знают прекрасно.

Вспомним Крылова: "Навозну кучу разрывая, Петух нашел жемчужное зерно…". Поисковики, конечно, будут все больше и больше настраивать свои "сотни параметров ранжирования" в поисках жемчужных зерен, но дело уже не в факторах, а в сравнении экономик производства жемчуга и навоза. В условиях современной концепции поиска производить дерьмо намного выгоднее. То есть искать по-настоящему хорошую информацию будет все трудней.

SEO – друзья или враги

19 марта известный SEO-специалист Евгений Трофименко опубликовал объявление, что готов выплатить от $1000 сотруднику Яндекса, который согласится продать служебный документ - инструкцию для асессоров.

Обоснование Евгения: "Я хочу уметь делать качественные сайты. А в инструкции написано, какие сайты качественные, а какие - нет. Так что реального секрета здесь быть не может, по крайней мере, вреда в этом нет".

Разработчик поисковых систем "Апорт" и Gogo.ru Михаил Костин так прокомментировал это заявление. "На самом деле, поисковые системы не скрывают информацию о том, какие сайты они считают качественными, а какие нет, наоборот, постоянно стараются об этом рассказывать. Но публиковать с этой целью внутреннюю инструкцию для асессоров было бы странно - у нее другое назначение, и она не подходит для использования в качестве справочника веб-мастера".

Интерес к такой инструкции со стороны SEO-специалистов связан, я думаю, все же не с недостатком информации о том, что поисковики считают качественным сайтом. Скорее, с тем, что из нее можно попытаться извлечь какую-то информацию о внутренней кухне поисковиков, о том, как трактуются какие-то пограничные ситуации, на что особо обращается внимание асессоров и т.п. В предоставлении оптимизаторам такой информации поисковики, естественно, не очень заинтересованы - хотя чего-то особо секретного в подобных инструкциях и нет".

Через четыре часа предложение было снято, видимо, кто-то продал. По слухам, через пару дней империя нанесла ответный удар – Яндекс сократил на треть количество своих асессоров.

Отношения с SEO-сообществом - пожалуй, самая спорная тема в позиционировании поисковых систем. Пользователи – понятно, поисковики работают для них. Спамеры – тоже понятно, они откровенно работают против поисковиков и иллюзий не имеют: поисковики в этой войне пленных не берут, но и спамеры не обязаны проявлять к поисковикам лояльность и понимание. А кто такие "оптимизаторы", чего от них больше – вреда или пользы?

Оптимизаторы сообщают саппорту поисковой системы о наличии в выдаче по интересующим их запросам поискового спама – это хорошо.

Оптимизаторы активно предлагают своим клиентам пользоваться контекстной рекламой, ведут клиентские кампании, консультируют, иными словами, помогают поисковику заработать – это тоже хорошо.

Оптимизаторы привлекают в Интернет новые компании, новые бизнесы, новую информацию – и это хорошо.

Оптимизаторы продвигают наверх в результатах поиска, как правило, профессионально сделанные качественные сайты, выдача по запросам, где эти сайты уместны, становится лучше – и даже это хорошо.

Но оптимизаторы также делают почти все, что перечислено в "Экономике антикачества". По данным компании "Ашманов и Партнеры", в 2008 году только на платные ссылки ими было потрачено около 50 миллионов долларов.

Таким образом, оптимизаторы привлекают в Сеть деньги клиентов, часть которых достается поисковым системам и расходуется на обеспечение качества поиска. С другой стороны, те же оптимизаторы от тех же клиентов привлекают в Сеть деньги, которые финансируют откровенное вредительство - платные ссылки поисковики не приветствуют. Оборот контекстной рекламы в 2008 году оценивается в 300-350 миллионов долларов, и неизвестно, какая часть этих денег поступила благодаря авторизованным рекламным агентствам, являющихся подразделениями SEO-компаний.<.p>

Проблема поисковиков не в сложности выбора, стоит ли ради прибыли в n миллионов терпеть в заднице шило стоимостью в 50 миллионов. Суть ее в пункте 3.4 лицензии Яндекса: "Яндекс (читай – поисковая система) понимает релевантность как наилучшее соответствие интересам пользователей, ищущих информацию, что может в общем случае не совпадать с интересами авторов сайтов".

Соответствие интересам пользователей всегда определяется по паре "запрос – ответ". Например, очень хороший качественный сайт "Анекдоты из России". Давайте продвинем его по запросам "яндекс", "сбербанк", "роем" - пусть пользователи с такими запросами улыбнутся. Пользователи, может, и улыбнутся, а вот поисковики вряд ли и обязательно постараются убрать из выдачи этот "юмор". Такой пример несовпадения интересов авторов сайтов и интересов пользователей понятен всем, ситуация доведена до абсурда.

Вот другой пример. Можно ли сайт funkeprofi.ru продвигать по запросу "пластиковые окна в Москве" (Яндекс, 10 позиция)? Не можно, а нужно, это московская компания, продающая пластиковые окна, ссылка будет отличным ответом.

А можно ли этот сайт продвигать по запросу "пластиковые окна" (Яндекс, 11 позиция)? Это уже непростой вопрос, об "оконной" выдаче стоит почитать две статьи - "Коммерческое и некоммерческое" и "Транзакционность и ранжирование" в архиве рассылки "Проблемы качества поиска".

А можно ли этот сайт продвигать по запросу "пластиковые окна в Казани" (Яндекс, 13 позиция)? Сайт в выдаче с ремаркой "найден по ссылке с текстом «пластиковые окна казань»", т.е. намерение продвинуть очевидно. Нельзя, да?

В данном примере все три запроса для продвижения были выбраны оптимизатором. В первом случае результат улучшает выдачу, в третьем ухудшает, а во втором мнения разделяются на прямо противоположные; я знаю точки зрения как за, так и против, и доказательства для каждой. Но какой точки зрения придерживаются поисковые системы по этому вопросу и почему – вот это – тайна. То ли скрывают, то ли просто еще серьезно не думали на эту тему.

Инструкция для асессоров, действительно, может быть нужна лишь для выяснения пограничных ситуаций в оценке сайтов только для случаев, когда речь идет о создании сайтов линкоподдержки, чья задача одна – удержаться в индексе. В случае клиентских сайтов вопрос об их качестве не возникает, по крайней мере, ни разу о таком не слышал. А вот споры о целевых запросах для продвижения – постоянно. И точка зрения поисковых систем по этому вопросу, что же лучше для пользователей, к сожалению, является крайне неопределенной. Впрочем, это уже относится к рассмотренной выше проблеме теории идеальной выдачи.

Гипотеза третья

Поисковым машинам вряд ли удастся принципиально улучшить ситуацию с качеством поиска по нечетким информационным запросам без диалога с профессиональным сообществом, активно влияющим на выдачу. Суть диалога – обсуждение не темы "качества сайтов", а темы качества выдачи по запросам разных типов.

Нет смысла обсуждать, сколько исходящих ссылок должно быть на странице, каков максимальный процент ключевых слов, какую площадь на веб-странице можно использовать под PPC-рекламу и т.п. Обсуждать нужно простой вопрос, который уже много лет не решаются четко поставить ни поисковики, ни представители околопоискового бизнеса: кто, по какому запросу и почему имеет право находиться в поисковой выдаче.

 

Андрей Иванов,

"Ашманов и Партнеры"

Лучшие комментарии

  • Контекст комментария

    Анатолий Орлов ex-Яндекс

    Раз Саша, Илья или Ден до сюда не дочитали давайте я опровергну. Асессоров не сокращали и наоборот их количество постоянно увеличивается. Оценка в 25 человек была верна 2−3 года назад. По поводу оценки порно и прочего: оно сейчас не считается высокорелевантным ответом, тем не менее оно лезет т.к. переоптимизировано. Оценка непосредственно на ранжирование не влияет, только через формулу, а на нее так же влияют много других запросов которые говорят толковать высокую текстовую и линковую релевантность, как положительные факторы. Оценивать один сайт как релевантный, а следующий такой же как не релевантный асессор не может — это только собьет с толку настройку формулы (2 сайта с одинаковыми факторами оценены по разному → вывод: факторы не значимы). Т.е. к сожалению это не та проблема, которую, можно победить именно таким методом, что однако не означает, что мы ее не знаем и не пытаемся с ней бороться.

  • Контекст комментария

    Андрей Иванов Нейрон Ру

    =ключевой вопрос не то что= Это два разных вопроса, оба очень важных и связанных друг с другом. Управляя правилами выдачи, поисковики могут стимулировать тех же сеошников на подтаскивание в Сеть любой информации.

  • Контекст комментария

    Кирилл Готовцев Маньяко

    Некоторая существенная проблема современного поиска состоит в том, что он ищет слова, а не смыслы. Посему требовать от него чтобы он находил то что вы спрашивете — наивно. Пока поиск не перейдет в состояние, когда он сможет, к примеру, каталогизировать в разные подветви одного дерева «медицина» медицинскую популярную статью, инструкцию от лекарства, и академический текст — ничерта с места не сдвинется. Гадать по словам можно очень и очень много. Кстати оптимизаторы в этих условиях быстро отомрут, потому что частотное ранжирование перестанет работать.

Добавить 91 комментарий

  • Ответить
    Альтер Эго

    Через четыре часа предложение было снято, видимо, кто-то продал. По слухам, через пару дней империя нанесла ответный удар — Яндекс сократил на треть количество своих асессоров. Не вижу связи. Треть ассесоров за что сокращать?

  • Ответить
    Альтер Эго

    девять ссылок на порнуху в топе выдачи по запросу «рассказы» Хмм проверил ни у Яндекса, ни у Гугла нет такого количества порнухи п запросу рассказы у Гугла две ссылки на эротические, а не порно рассказы http://www.google.ru/search?hl=ru&q=рассказы у Яндекса только восемь, а не девять ссылок на порнуху http://yandex.ru/yandsearch?text=рассказы

  • Ответить
    Альтер Эго

    как талантливо первый комментатор выделил основную суть статьи! Просто что сразу бросилось в глаза своей очевидной нелепостью. «Страшная месть», прямо гоголь какой-то

  • Ответить
    Альтер Эго

    у Яндекса только восемь, а не девять ссылок на порнуху Мне кажется, это вот, что там на восьмом месте, даже менее релевантно запросу, чем сайт эротических рассказов :) впрочем, я могу ошибаться. Насчёт эротических рассказов — извините, а какая разница? И вообще, и в свете обсуждеия качества поиска?

  • Ответить
    Альтер Эго

    кто, по какому запросу и почему имеет право находиться в поисковой выдаче. Ну как. Всё как в жизни. В одном месте — по количеству занесённого ответственным лицам бабла откатом В другом месте — на основании открытого тендера, кто больше заплатит В третьем — субъективное определение лучшести владельцами заведения или например госоргана. Непонятно, что тут обсуждать. Пусть расцветут сто миллионов цветов.

  • Ответить

    а никто не задумывался почему Яндекс не пессимизирует в ноль все ссылки со всех сайтов учавствующих в сапах ксапах и прочее? по мне, им проще и дешевле смотреть со стороны как за место аксессоров и новых поисковых алгоритмов бесплатная армия сеошников сидит и влияет на выдачу улучшая ее и выводя наиболее коммерческие сайты в топ10. разве нет?)

  • Ответить
    Альтер Эго

    А мне понравился эпиграф. Особенно слова Себранта. По сути так и есть. На массовом рынке качество не так уж и важно. Совсем необязательно пользователю нужно что-то качественное и хорошее. А «2% лучше у конкурента» могут остаться незамеченным. Главное действительно «не навредить», а вовсе не «сделать мега-качественно, лучше по всем показателям». Очень похоже на App Store, где ЯПукалка продается лучше, чем Spore или SimCity

  • Ответить

    Некоторая существенная проблема современного поиска состоит в том, что он ищет слова, а не смыслы. Посему требовать от него чтобы он находил то что вы спрашивете — наивно. Пока поиск не перейдет в состояние, когда он сможет, к примеру, каталогизировать в разные подветви одного дерева «медицина» медицинскую популярную статью, инструкцию от лекарства, и академический текст — ничерта с места не сдвинется. Гадать по словам можно очень и очень много. Кстати оптимизаторы в этих условиях быстро отомрут, потому что частотное ранжирование перестанет работать.

  • Ответить

    мегаинтересная тема, спасибо, но вообще тут ключевой вопрос не то что и почему выдает поисковик в выдаче, а какая информация доступна в интернет и как поисковик способствует «улучшению"/"ухудшению» (куда направляет/не направляет трафик), по факту в инет работает ухудшающий отбор — информации море, качественной часто просто нет и найти ничего нельзя — ну, а отношения поисковики/оптимизаторы иначе как некую игру воспринимать нельзя, очевидно что яндекс может эту все лавочку мгновенно прикрыть, но не прикрывает, потому что ему без них будет во многом сложней и есть риски что будет придумано что то еще более изощренное….

  • Ответить
    seo

    если лавочку совсем прикрыть, то и будет по всем коммерчески запросам вакханалия с включением непонятных блогов, доров и прочего мусора. если бы был алгоритм, позволяющий отображать выдачу релевантную запросу, игнорируя потуги сеошников, то его бы давно использовали. а по факту, все сайты в топе коммерческих тематиках более-менее соответствуют продвигаемым с помошью SEO словам. спасибо нам) собственно, роль ПС тут регулирующая соотношение более-менее. лучше задумайтесь о лентяях юзерах, которые очень редко конкретизируют свой запрос. даже просто город обозначить, и то, нет такой привычки. я бы вообще запретил к поиску однословные запросы)

  • Ответить

    насчет «более-менее соответствуют» это большой вопрос, запросам без слова купить/продать скорее «менее» ;)…. не нужно себя обманывать

  • Ответить
    Андрей Иванов Нейрон Ру

    =ключевой вопрос не то что= Это два разных вопроса, оба очень важных и связанных друг с другом. Управляя правилами выдачи, поисковики могут стимулировать тех же сеошников на подтаскивание в Сеть любой информации.

  • Ответить

    просто на мой взгляд все упирается в мой вопрос, а что все связано понятно — «Управляя правилами выдачи, поисковики могут стимулировать тех же сеошников на подтаскивание в Сеть любой информации.» проблема в том что сеошники не создают контент, а только его отстраивают и все опять же упирается в создание контента, по факту сейчас контент во многом создается не для людей, а для поисковиков

  • Ответить
    seo

    internet_gign, возможно вы не в курсе, но через интернет с каждым днем увеличивается число продаж. большинство продвигаемых запросов определенно сложно считать запросами информации. обычно как раз таки ищут услугу-товар. на мой взгляд, выдача по таким запросам достаточно релевантна. беда только в том, что фирм много, а на странице всего-лишь десять результов. тут даже при анализе этих сайтов человеку сложно сказать, какой из них более релевантен запросу и почему. стало быть необходимо проводить насильственное обучение формированию запроса к ПС. или можно и дальше продолжать вводить «рассказы», в надежде, что поисковик прочтет мысли и выдаст то, что имеется ввиду. большинство, что очевидно, выбор из 8 порно сайтов вполне устраивает. я даже тест придумал для определения релевантности ваших запросов: попробуйте пообщаться со своим знакомым также как и с ПС :) всяко лексикон придется расширять? то-то и оно.

  • Ответить
    seo

    «проблема в том что сеошники не создают контент, а только его отстраивают и все опять же упирается в создание контента, по факту сейчас контент во многом создается не для людей, а для поисковиков» смотря что подразумевать под контентом. веб студии сдают пустые сайты заказчику, чуть ли не с «lorem pisum…". и чего? наполнять сайт статьями, которые никому не нужны? много ли вы напишете контента для сайта по автоперевозкам? :)

  • Ответить

    кстати — это не верно: *** Мой здравый смысл говорит, что девять ссылок на порнуху в топе выдачи по запросу «рассказы» — это уже за гранью здравости; асессоры, оценивающие релевантность каждой такой ссылки, ничего плохого не нашли. Спросил «рассказы»? — Это рассказы. Рассказы могут быть эротическими? — Могут. Значит, релевантно. И так девять раз подряд. И нет никакого теоретического положения, согласно которому асессор должен понижать оценку качества выдачи в ответ на нечеткий запрос, если она состоит из однотипных предложений, являющихся ответами на более точный, узкий запрос.

  • Ответить
    Андрей Иванов Нейрон Ру

    =большинство продвигаемых запросов определенно сложно считать запросами информации= Это как раз любимый аргумент SEO: раз что-то продается, значит, это ищут те, кто хочет это купить. Остальные разбегайтесь и переформулируйте запросы, Его Величество Товар продвигается. :0) В итоге «дизайн» — это «заказать сайт» и «заказать ремонт квартиры с дизайном интерьера». А чем не подходит точка зрения, что пользователи по запросу «дизайн» будут в первых строчках находить именно информационные материалы, а девелоперы и ремонтники конкурировать будут по точным запросам — «Заказать дизайн сайта» и «Дизайн интерьера в Москве», например? Покупатель не увидит коммерческого предложения, запрос переформулирует (да он еще и подсказан сразу же будет) и тут же будет выбирать продавца.

  • Ответить

    про то что и кто в инет делает и где денежный потоки создаются я в курсе и довольно давно ;)…. -- с тем что оптимизация в сегменте покупки/продажи работает я в общем то и написал (sorry если непонятно) но я бы долю покупающих запросов не стал бы преувеличивать иначе мы бы маркет обсуждали, а не поиск…. а вот с информационными запросами (в том числе и по товарам) все сложно, часто ничего не удается найти

  • Ответить
    Андрей Иванов Нейрон Ру

    =пожмотился сцылко поставить= Женя, я поставил прямо на твой пост в Я.ру. Юра, видимо, убрал. =кстати — это не верно:= Поясни. Меня этот вопрос давно интересует. Не про порнуху, естественно, а именно об оценке такой вот «одноплановой» выдачи.

  • Ответить

    нюанс в том что продающие запросы (и вообще инет бизнес) могут жить только на фоне условно «информационного» инет, а поисковики плюс оптимизации создают перекос -- а контент это все и веб студии очень разные продукты сдают сайт по автоперевозкам наполнить вполне реально, но это очень специфичный пример -- рассмотрите к примеру нетбуки, по факту нет ни одного сайта (или непонятно как найти) с нормальными описаниями/отстроенными спецификациями (что бы было можно посмотреть к примеру наличие BT и разрешение у всего что есть на рынке в данный момент) приходится пользоваться непонятно чем и нету такого нормального контента потому что продвинуть нереально (все закрыто оптимизаторами) а когда человек набирает нетбук в поиске он еще не покупатель конкретного товара…

  • Ответить
    Андрей Иванов Нейрон Ру

    =первое правило= :0) Насчет напрямую не влияют знаю, конечно. Блин… надо тоже штуку из бюджета выделить и аналогичное объявление подать. Видимо, в этой инструкции есть то, чего я явно не ожидал. Максим Азаров прокомментировал, мол, в Гугле выдача в целом тоже оценивается. Осталось лишь дождаться, когда кластеризовать научатся.

  • Ответить
    seo

    «А чем не подходит точка зрения, что пользователи по запросу «дизайн» будут в первых строчках находить именно информационные материалы» какие информационные материалы? одних только дизайнов можно штук 20 сходу перечислить. будет тоже самое — тот кто ищет конкретный «дизайн» — не найдет про нетбуки: из первых 4 результатов в яндексе — три сайта как раз информационные. так что не надо.

  • Ответить
    Андрей Иванов Нейрон Ру

    =одних только дизайнов можно штук 20 сходу перечислить= Перечислено пять штук — http://www.neiron.ru/search.php?query= Давайте еще 15, добавлю. :0) =из первых 4 результатов в яндексе — три сайта как раз информационные. так что не надо= :0))) Ай, да Яндекс! Ай да молодец!

  • Ответить

    по нетбукам — wiki, два (полу)мертвых и не поддерживаемых ресурса (один не обновлялся с 13 января, второй с начала марта) и хабр, ценность стремится к нулю… ну и посмотри «ноутбук»

  • Ответить

    Если бы конфликт был просто на уровне «товары и услуги, продвигаемые SEO-шниками, мешают всем остальным получать общетеоретические знания», то проще всего было бы, как раз, услуги и товары оттащить в сторону (а-ля Маркет), читай пессимизировать в общей выдаче. Они-то как раз очень легко классифицируются и систематизируются, чем весь массив данных мирового интернета

  • Ответить

    а как оттащить то, особенно услуги (они вообще слабо формализуются) и прибыли всех участников упадут -- по факту проблемы со всех сторон, есть целые сегменты в которых ничего кроме оптимизации и копирайтного/маркетингового контента нет

  • Ответить
    Андрей Иванов Нейрон Ру

    =Если бы конфликт был просто на уровне «товары и услуги, продвигаемые SEO-шниками, мешают всем остальным получать общетеоретические знания"= Михаил, а можно подробнее про другие уровни конфликта?

  • Ответить
    seo

    «по нетбукам — wiki, два (полу)мертвых и не поддерживаемых ресурса (один не обновлялся с 13 января, второй с начала марта) и хабр, ценность стремится к нулю… ну и посмотри «ноутбук»» вот вам пример некоммерческой выдачи, за которую никто не борется. заполонили весь топ говном) очевидно, что виноваты во всем SEO, Яндекс и магазины нетбуков )) на самом деле отрасль новая, когда мы туда придем, в топе будут качественные сайты, в частности интернет-магазины, в которых между прочим почти всегда реализована возможность сравнения товаров по Тех.Хар. и очень часто есть и обзоры и отзывы.

  • Ответить

    не похоже только по мне на некоммерческую выдачу… а похоже на убитую/бессмысленную… -- последовательность виновников интересная ;)…. -- какая отрасль новая, о чем Вы, очнитесь (посмотри в инет динамику и объемы продаж ноутов)… -- в инет-магазинах нюансы в том что там неполная информация (узкий ассортимент, выбор происходит из того что есть, а не из того что могло бы быть), плюс по каждой позиции только одно предложение -- ну и в данном сегменте (ноут/нетбуки) информацию при желание найти можно, но только гиморойно и требует погружение (хотя теже нетбуки можно без проблем охватить в рамках одного сайта)

  • Ответить
    seo

    почему же не сделать такой сайт? о чем разговор то? если нет нормальных сайтов, тут не виноват ни SEO, ни Яндекс. другое дело, что мало кто захочет создавать серьезный ресурс, вкладывать в него время и деньги, не зная как потом это дело монетизировать. повторяю, отрасль для рунета новая. http://wordstat.yandex.ru/?cmd=months&page=1&ts=1238598023&text_geo=&key=c3bf5f27a42a550ba39dc5fdc9df9cf3&text= оттого и бардак в выдаче. покамест.

  • Ответить

    а как оттащить то, особенно услуги (они вообще слабо формализуются) и прибыли всех участников упадут Ну от хороших позиций на маркете прибыли только растут. Просто, мне кажется, что услуги очень легко систематизируются и этими «ассесерами» и автоматически (например, для участия в каталоге как-то решают, кому платить денежку, а кому бесплатно; вот вам и база коммерческих проектов) Михаил, а можно подробнее про другие уровни конфликта? Я может быть, как-то не так читал, но мне показалось, что статья как раз об этом — о том, что сегодняшняя конструкция отношений, по сути, мотивирует участников «портить», а не «улучшать» (мне показалось это главной мыслью) Порно-сайты, дорвейщики, копипастеры — это ведь не услуги и товары?

  • Ответить

    не новое: http://wordstat.yandex.ru/?cmd=months&text= нетбук это нюанс -- ну и я выше написал что нормальная информация по теме фактически отсутствует на русском в одном месте, нужно погружаться плотно -- сделать нельзя потому работать с монетизацией нормальной будет только на поисковом трафике который абсолютно непредсказуем по ноутбукам сделать сложно, посколько их слишком много, но тоже можно -- и это пример из около IT области, для инет фактически родной ситуация со стиральными, швейными машинами, etc в инет вообще смешная — информации ноль по факту, только продажа и все

  • Ответить

    у меня, к сожалению, нет данных по сравнительной эффективности (когда что лучше) продвижения на маркете, в поиске (директ и оптимизация) и очевидно что тут очень все индивидуально (десятки параметров) -- как действуют «ассесеры» я честно говоря не понимаю, но ощущение того что яндекс и ко оптимизируют только собственную прибыль (декларируется что для них первичен посетитель) у меня все больше крепнет…

  • Ответить
    seo

    по-моему, мы все-таки начали с нетбуков и с выдачи по ним. про нОУтбуки я ничего не говорил и не буду. у вас какой-то извращенный стиль полемики. без меня в ней я думаю обойдетесь)) ситуация такая, что примитивно набирая «стиральная машина», вы получаете список сайтов, радеющих бюджетами за возможность попасться вам на глаза. и что-то мне подсказывает, что фанклубов стиральных машин нет, поэтому каталогов «всех моделей всех фирм» просто не существует. так что придется вам и далее внедрятся в поиск. да, кстати. какая именно монетизация имеется ввиду «на поисковом трафике»? ежели сайт ничего не продает, то остается реклама. опять продажи. опять обман и дескридитация Великой Объемной Всеописывающей Свободной Некоммерческой Информации в ваших глазах:) вобщем пустое. будут тупые запросы — будет коммерческий примитивный топ. ибо массовость решает. вы не купите, он не купит, а кто-то возьмет, да затарится. просто иначе массы искать не умеют.

  • Ответить

    я невольно расширил тему (изначально я следил за ноутами, нетбуки просто новые штрихи добавили) -- но суть в том что оптимизация резко сужает «информационное» поле это медицинский факт и спорить с ним бессмысленно -- фан клубов стиральных машин нет, но у швейных машин вполне может быть (у ноутов/нетбуков есть) -- монетаризация рекламная (в основном) — при полной информации и возможности высказывать разные мнения никакой дискредитации нет -- а насчет масс — они действуют как умеют, все под них подстраиваются, получается что получается….

  • Ответить
    Альтер Эго

    По поводу трети ассесоров Илья Сегалович, Иван Расковалов, А Садовский, опровергнете? Опровергну. Расковалова зовут Денис. Асессоров было человек 20−25. И вообще вы дурак, уважаемый. Убедительно?

  • Ответить
    Андрей Иванов Нейрон Ру

    =фан клубов стиральных машин нет= Зато есть производители. Интересный выбор — дать позиции в топе производителям товара, которых от силы пара десятков или продавцам, которых десятки тысяч. Производители напрямую через интернет, конечно, не торгуют, т.е. информация о них вполне «некоммерческая». :0)

  • Ответить

    вот-вот и что бы у производителя на сайте было все отстроено под инет торговлю (и такие производители есть) по факту могут быть очень разные варианты, думать тут серьезно нужно текущая система явно ведет в никуда (при этом и с точки зрения дохода она не всегда оптимально действует)

  • Ответить
    Анатолий Орлов ex-Яндекс

    Раз Саша, Илья или Ден до сюда не дочитали давайте я опровергну. Асессоров не сокращали и наоборот их количество постоянно увеличивается. Оценка в 25 человек была верна 2−3 года назад. По поводу оценки порно и прочего: оно сейчас не считается высокорелевантным ответом, тем не менее оно лезет т.к. переоптимизировано. Оценка непосредственно на ранжирование не влияет, только через формулу, а на нее так же влияют много других запросов которые говорят толковать высокую текстовую и линковую релевантность, как положительные факторы. Оценивать один сайт как релевантный, а следующий такой же как не релевантный асессор не может — это только собьет с толку настройку формулы (2 сайта с одинаковыми факторами оценены по разному → вывод: факторы не значимы). Т.е. к сожалению это не та проблема, которую, можно победить именно таким методом, что однако не означает, что мы ее не знаем и не пытаемся с ней бороться.

  • Ответить
    Андрей Иванов Нейрон Ру

    Спасибо, Анатолий. =мы ее не знаем и не пытаемся с ней бороться= Если не секрет, о какой проблеме речь: порно по несвоим запросам или однотипные сайты в выдаче? P. S. Женя, выходит, насчет «и так 9 раз подряд» все ж верно.

  • Ответить
    Альтер Эго

    Анатолий, а кого именно ваш анонимизированный сотрудник чуть выше дураком обозвал? Иванова что ли?

  • Ответить
    Альтер Эго

    Это был я, а я не сотрудник Яндекса. Скорее конкурент ихий. Обозвал одного глупого альтерэгу.

  • Ответить
    Альтер Эго

    > Пока поиск не перейдет в состояние, когда он сможет, к примеру, каталогизировать в разные подветви одного > дерева «медицина» медицинскую популярную статью, инструкцию от лекарства, и академический текст — ничерта с > места не сдвинется. Тут недавно Браславского ругали, а он ведь в «Яндексе» занимается как раз жанровой классификацией. И по тематической классификации тоже работы ведутся, Масловым и Ко. Остается дождаться результатов.

  • Ответить
    Альтер Эго

    Классифицировать страницы совершенно не трудно Для каталога среднего уровня гранулированности, скажем тем 30-50 вы сможете это сделать с достаточной точностью и coverage Вопрос в том что дальше? Для каких запросов следует продвигать какие темы и насколько Жанровая классификация штука прикольная. Я думаю поисковик по жанрам не помешал бы, был бы вполне полезен школьникам и любителям, иностранцам, изучающим русский язык » кот по дереву гуляет стихи» «мальчик из одессы проза» «текст уровня первоклассника по теме путешествия » В принципе, неплохая штучка, наверное, в год парочку миллионов запросов бы набрал. А как функция встроенная в большой поисковик в надежде повысить «релевантность» абсолютно бесполезная вещь, впрочем, браславский сам это показал в своем докладе Думаю стоит сделать отдельный нанопроект если это не займет больше человеко-месяца или двух

  • Ответить
    Альтер Эго

    Анатолий, А Вы свои реплики в форумах с Воложем согласуете? А то будет как с увольнениями, когда народ говорил, что не увольняют, а Волож потом всех подвел.

  • Ответить
    Анатолий Орлов ex-Яндекс

    Нет не согласую. Но и рассогласований особых не вижу. Любая большая компания время от времени увольняет людей. По их инициативе с формулировкой «уволен по собственному желанию» или по своей с «уволен по соглашению сторон», и иногда с другими. Наверняка, из наших ассессоров кто-нибудь в последнее время тоже нас покинул. Просто здесь утверждение было про 1/3 ассесоров, которое совершенно точно реальности не соответствует.

  • Ответить
    Андрей Иванов Нейрон Ру

    =утверждение было про 1/3 ассесоров= Это утверждение начинается со слов «по слухам». Здесь же было утверждение, что в Яндексе 25 асессоров. Оно было — авторитетно — дополнено, что то данные старые. Опять же — по слухам, см. в я.ру — сегодняшнее количество асессоров Яндекса — несколько сотен. :0)

  • Ответить
    Альтер Эго

    > Классифицировать страницы совершенно не трудно. Если взять готовое решение, то не трудно. Если делать самому и с приличным качеством, то трудно и долго. В «Яндексе» стараются делать сами, вроде как (и это правильно). > Вопрос в том что дальше? Для каких запросов следует продвигать какие темы и насколько. Т. е. вопрос в определении тематики самих запросов? Эта проблема обсуждается уже довольно давно и как-то решается разными коллективами, пусть не идеально. > Я думаю поисковик по жанрам не помешал бы, был бы вполне полезен школьникам и любителям, иностранцам, > изучающим русский язык » кот по дереву гуляет стихи» «мальчик из одессы проза» «текст уровня первоклассника по > теме путешествия » Кирилл Готовцев не этот вариант имел в виду, как я понял. Надо так — человек вводит запрос «кот по дереву гуляет», а ему выдаются: текст искомого произведения, литература о нем, «сочинения, рефераты», ссылки на книжные магазины и т. д. И жанровый классификатор тут вполне может помочь.

  • Ответить

    Есть мнение. По сути, проблемы поиска обусловлены не только технической стороной, «несовершенностью» поисковиков, SEO, и определенным «загаживанием» поиска. Тут еще существует несколько других аспектов: 1 — как уже говорилось, не умением делать грамотный запрос 2 — не знание процессов вывода поисковиками релевантных ссылок в выдаче и не релевантных тоже 3 — ленью пользователей в формулировке запроса и просмотре списка выдачи 4 — идеализация поисковой машины и поисковых процессов пользователями по умолчанию, что приводит к негативным результатам поиска, порой 5 — ориентация рынка, а соответственно, и создание интернет среды, нацеленной на продажу тов./усл. (поэтому, собственно и говорят:"хочешь, чтобы тебе чего-нить «впарили», пользуйся яндексом"). Ведь сейчас оптимизаторы, предлагая свои услуги компаниям кричат, что ваш сайт это инструмент продаж — отсюда и кеси-меси в поиске. 6 — очень многие утверждают, что 70%, а то и больше, в интернете — это порно трафик. вот вам и подтверждение по «рассказы» 7 — отсутствие интернет грамотности — отсутствие нормального интернет образования в школе/институте у людей, в своей массе. Кто учит итернет-серфингу? 8 — деньги. сейчас в интернете и на услугах, связанных с интернетом не зарабатывает только ленивый — это утверждение уже, как аксиома. Утверждение — не навредить — это не пользовательское, скорее коммерческое, на мой взгляд. «Здесь все просто так, кроме денег» — Брат2

  • Ответить
    Юрий Синодов Основатель Roem.ru, sinodov.com

    (залили в открытки, думаю логичнее тут обсудить, раз уж все в сборе) Почему Яндекс, активно боровшийся в прошлом году за оригинальность источников в выдаче, продолжает индексировать агрегаторы, которые вообще не содержат оригинального контента? Например, Newsland.ru иц — 3600 http://search.yaca.yandex.ru/yca/cy/ch/www.newsland.ru/ Pcnews.ru иц — 1700 http://search.yaca.yandex.ru/yca/cy/ch/www.pcnews.ru/ Про newsland не совсем верно — его выкинули из News.yandex.ru, например. А под автоматические фильтры на «Яндексе» он, похоже, не попал.

  • Ответить

    Ну, если говорить о механизмах работы яндекса, то совершенно логично, что у Newsland.ru и тиц имеется))) Если же вести разговор о первоисточнике контента Newsland.ru — то машина же не делает различий, даже по времени публикации материала. и порой, в самом тексте не ставят гиперссылку на первоисточник, а, либо, просто пишут «как сообщает то-то СМИ или вот то-то», а на Newsland.ru есть вот такая фигня: «В соответствии с пользовательским Соглашением ответственность за контент, размещенный в этом разделе, несет Пользователь, разместивший этот контент без предварительной модерации через форму на сайте. Вы можете связаться с редакцией и администрацией Портала по вопросам контента и модерации.» да мы знаем, что они агрегаторы, но поисковик на это не смотрит — SEO — все для вас)))

  • Ответить
    mim

    Идёт бычок качается… Ну сколько можно? Если про выгоду поисковиков гнать траф на сайты-болванки с блоками поисковой рекламы (Директ/Адвордс) зачем-то скромно умолчали, то к чему все эти пафосные благие пожелания? Интеренет как бизнес — это прежде всего реклама и политика, а то и другое — дело обычно грязное, некрасивое, ни разу не благородное. Зачем тогда ожидать какой-то чести от основных трафогенераторов? Обзоры техники/мебели и схемы агрегатов вовсе не должны появляться в поиске (который, ещё раз: прежде всего трафогенератор для рекламы) по общим запросам, без уточнения. Потому сначала идёт спам-трэш. Фильтруйте. Вы же фильтруете рекламу по ящику… А кластеровыйпоик неплохо реализован у Нигмы. Сколько можно возносить молитвы одним и тем же давно залапанным идолам?

  • Ответить
    Альтер Эго

    А кластеровыйпоик неплохо реализован у Нигмы Да-да, просто охуительно реализован! Вот кластеры для запроса «Нигма»: поисковик нигма (5) nigma (58) компания (5) заработок в интернете (13) нигма рекламировалась (5) форум (6) главная страница (6) ищи (13) зарабатывай (5) книга (6) заработать (5) проект (9) поисковая система nigma (8) ссылка (6) интернет магазины (6) Это про что кластеры? Вот допустим, кластер «ссылка» — скажите, не заглядывая, про что он? Что там внутри? Или «заработать», «ищи», «зарабатывай» — про что?

  • Ответить
    Альтер Эго

    Если делать самому и с приличным качеством, то трудно и долго. Для каталога-дерева 30−50 названий разных областей знаний (скажем, медицина, медицина-для пациентов, медицина — для врачей, физика, электроника, электроника-бытова техника) это совершенно нетрудно и Если ваши программисты говорят вам, что для того, чтобы сделать это нужно больше, чем 8−10 человеко-месяцев (включая инфраструктуру, способную обработать пару биллионов документов и настройку алгоритмов) они вам безбожно врут

  • Ответить
    mim

    Да, даже на такой запрос как «Нигма» куча разнообразия, и уж никак не «и так девять раз подряд» (да, это мем! :)). «Ссылка» у нигмы обычно означает ссылку на то, о чём запрос (точнее, контекст такой ссылки по ссылки с Нигмы) — это же очевидно, хотя НЕпостоянный пользователь поисковика может не догадываться. А непостоянный пользователь любого другого поисковика вообще замучается. Вот мне приходилось обучать пользователей компьютеру/интернету. Для обучения пользования поисковиками отдельный урок нужен (+ объяснение — почему они столько мусора в результаты выдачи получают и как с этим бороться). Когда на запроc типа transcend mp840 я сразу получаю ссылку с навигатора «технические характеристики» — это удобнее, чем рыться в выдаче или уточнять запрос.

  • Ответить
    LMM

    Добрый день. Про агрегаторы вчера я пытался вопрос разместить. Юрий, спасибо, что он не пропал, я сам потом подумал, что в этой дискуссии он более логичен. Я надеюсь, что кто-нибудь с яндекса читает роем и даст не анонимный ответ. Примеров агрегаторов много, хотя бы по этим понять ситуацию. Понимаю, что яндексовские асессоры должны находить такие ситуации и реализовывать обещания руководства поисковика. Но этого не происходит. На мой взгляд, такие ситуации сильно подрывают имидж яндекса.

  • Ответить
    Альтер Эго

    > А вот что можно получит при запросе Елена Беркова в images.yandex.ru, А что Вы ожидали увидеть по такому запросу?

  • Ответить
    Альтер Эго

    Андрей, а что, по-вашему, должен показывать Яндекс по запросу «яблоко»? Сейчас там в первой десятке восемь партий «Яблоко», один женский журнал и одно Apple.com, найденное по ссылке. А фрукты-то где?

  • Ответить
    Альтер Эго

    Илья, а почему в выдаче Яндекса столько много порнухи по совершенно непорнографическим запросам вроде «рассказы» И почему Яндекс тратит свои ресурсы на очень глупые с точки зрения технологий и совершенно нулевые с точки зрения привлечения трафика проекты вроде «ответы"(42), в то время как те же ресурсы можно было направить на удаление порнухи их поисковой выдачи.

  • Ответить
    Альтер Эго

    Если ваши программисты говорят вам, что для того, чтобы сделать это нужно больше, чем 8−10 человеко-месяцев (включая инфраструктуру, способную обработать пару биллионов документов и настройку алгоритмов) они вам безбожно врут Не врут, а распиливают бабло

  • Ответить
    Альтер Эго

    А по запросу Питон это Яндекс, что выдает? Есть ли там и змея, и язык программирования? А Леопард? Есть ли таи и животное, и версия операционной системы от Эппл?

  • Ответить
    Альтер Эго

    последний Альтер, что вы этим хотите сказать? Яндекс объявлял, что стремится к максимально информативной и охватывающей выдаче. Выдачу по запросу «яблоко» такой назвать нельзя. Зато в выдачу по коммерческим запросам гвоздями прибивают информационные сайты и Википедию, чтобы она стала разнообразнее.

  • Ответить
    Альтер Эго

    Да, даже на такой запрос как «Нигма» куча разнообразия, и уж никак не «и так девять раз подряд» Не надо придуриваться. Там никакое не разнообразие, а чушь. Названия кластеров не соответствуют тому, что внутри, да и кластеризации никакой нет — перемешаны сайты равномерно. Кластеризация — штука на порядки более сложное, чем то, что могут сделать студенты в Нигме. У них нет даже нормальной теории, что такое смысловые кластеры, просто один тупой технический прием объединения сниппетов по частотности слов. И он стабильно, надежно ни хера не работает уже года четыре. Ребята, не надо писать программистской ерунды про 8−10 человеко-месяцев. Нигма вот за долгие годы ниасилела. Кластеризовать выдачу, раскладывать по типам или по смыслу непросто. И не все могут, и стоит это дорого в разработке.

  • Ответить

    Был бы благодарен Alter Ego за примеры по: «Зато в выдачу по коммерческим запросам гвоздями прибивают информационные сайты и Википедию, чтобы она стала разнообразнее.»

  • Ответить

    спасибо как давно это? -- я смотрел вокруг ноутбук/ноутбуки и т. п., вроде совсем недавно не было (на уровне той недели), но естественно мог и ошибиться

  • Ответить

    Выдача Нейрона по запросу «рассказы» такая же однобокая, она исходит из предустановки, что рассказы — это жанр литературы (в смысле издаваемой классической литературы), и никуда от этого не отклоняется. Однако рассказы — это еще и широкий пласт устного/фольклорного творчества, типа рассказы бывалого, байки и т. п., зачастую публикуемые в личных дневниках/сайтах. Да и эротические рассказы — это нечто жопы поиска, делать вид, что их нет в природе или их мало выкладывают в инет — очевидно глупо. В этом плане подход Нейрона хуже. Если выдача поисковика атоматическая, т.е. можно предположить, что она разнообразится при выранивании качества (включая поисковую оптимизацию) сайтов с различными трактовками «рассказов», то Нейрону исправиться будет много сложнее, бо «эксперты» упираются рогами в свои убеждения правильности будь здоров, они ж эксперты…

  • Ответить
    mim

    2 Резонер Амгин Не спорю, что реализация кластерного поиска Нигмы оставляет желать лучшего. И я её привожу только как пример попытки. Что касается самой задачи кластеризации данных, то я не думаю, что она недоступна по техническим причинам (см. что на этот счёт лежит в открытом доступе). Тут дело, скорее в принципах, а именно — бизнес-модели, работы существующих поисковиков. Как альтернатива см., например, http://search.carrot2.org/stable/search По крайней мере на запрос python — о том, что питон — это ещё животное там можно узнать почти сразу :) и это ещё 4ая ссылка в выдаче. У Я. на этот запрос тоже неплохо, в общем-то (чего н скажешь про гугль) А с apple — везде проблема, однако :)

  • Ответить
    Альтер Эго

    Глупо продвигать Википедию, только потому, что это Википедия 1 там много некачественых статей 2 оптимизаторы узнав, что поисковик продвигает википедию немедленно начнут использовать это для продвижения своих результатов (статьи на вики, ссылки с вики)

  • Ответить
    Андрей Иванов Нейрон Ру

    =Выдача Нейрона по запросу «рассказы» такая же однобокая, она исходит из предустановки, что рассказы — это жанр литературы (в смысле издаваемой классической литературы), и никуда от этого не отклоняется.= :0) Это я от этого не отклоняюсь. Но в Нейроне к формированию выдачи допуск есть у всех желающих. Если Вам кажется, что «байки» вполне достойный жанр и может быть представлен в выдаче, сделать это просто: а) формируете подборку ссылок в ответ на запрос «байки» б) ставите «байки» как экспертную подсказку в выдачу по запросу «рассказы». То же самое можно проделать и с «притчами», «рассказами о животных», «рассказами о жизни», «о любви», «приключенческими рассказами» и любыми другими видами рассказов. Каждый упирается рогом в свое видение вопроса, но в Нейроне точки зрения не воюют, а дополняются. =можно предположить, что она разнообразится при выранивании качества= А вот это вряд ли. Я давно поисковой оптимизацией занимаюсь; механизмов перекашивания выдачи в SEO сколько угодно, а вот «разнообразиия» и «выравнивания» нет.

  • Ответить
    Альтер Эго

    Может ли Яндекс или Гугл помочь выяснить сколько киллограмов ладана расходуют храмы РПЦ в год?