Мобильная версия | Купить рекламу на Roem.ru
roem.ru
roem.ru

Статьи / 31.03.2009 20:00:00 / Качество поиска в перспективе

Распечатать rss поток комментариев к этой статье

Качество поиска в перспективе

Точка зрения

"КТ": А насколько качество поиска коррелирует с популярно-стью поискового сервиса?

Себрант:
Ни насколько.

Волож: Да нет, если наш поиск долго будет хуже гугловского или рамблеровского, то люди начнут уходить.


Себрант: Но не наоборот. Если предположить, что гугловский поиск будет на два процента лучше, то… Во-первых, что значат эти два процента? Во-вторых, что значит "лучше"?

Волож: Неизвестно, как устроена эта материя. Почему пользо-ватели приходят туда, а не сюда - никто не знает.

Сегалович: Ну, нет, я знаю.

Волож: У тебя теории. У всех свои гипотезы. Я вот считаю, что просто не надо вредить. Надо стараться делать хорошо…


«Яндекс. Сегодня» - Сергей Леонов, Владимир Гуриев,
опубликовано в журнале "Компьютерра" №11 от 22 марта 2006 года - http://offline.computerra.ru/2006/631/259144/



Такая вот была три года назад приятная добродушно-расслабленная беседа первых лиц Яндекса, безусловного лидера русского поиска, с корреспондентами «Компьютерры». Хорошо-то ведь как: пользователи почему-то приходят сюда, а не туда; что такое "лучшее качество поиска" - непонятно, а гипотез разных много, ну их к лешему; надо просто стараться делать хорошо, стараться делать лучше… Спустя два года, в 2008-м получилось "как всегда": 25% новых сайтов, по данным Яндекса, были классифицированы как поисковый спам, на бесплатных хостингах – свыше 50%.

Появление новых сайтов и поиск – звенья единой цепи в деле обеспечения нас качественным Интернетом. Похоже на завод: продукция - сайты, поиск – отдел упаковки и доставки до потребителей. Сравнение хорошее, сразу видно: что-то здесь не так. Не может быть все в порядке на заводе, где каждое четвертое изделие официально признано браком. И сколько их, "почти хороших" сайтов, до потребителей все же дошло.

Пользователей поиска в Рунете десятки миллионов человек. Говорить от имени такой аудитории позволяют себе только поисковики. Мол, мы даем ответы на десятки миллионов запросов, значит, пользователям это нравится, иначе бы не спрашивали. Или, как сказал вице-президент Google Марио Коэйрос, "мы можем оценить адекватность своих представлений о качестве поиска по работе Google в сотне стран". Поэтому, когда я вижу – который год уже - в ответ на запрос "рассказы" в первой десятке Яндекса и Google девять ссылок на сайты с низкопробной порнографией, начинаю сомневаться в первую очередь в собственной адекватности; авторитет опыта организации поиска для миллионов пользователей и в сотне стран давит бетонной плитой. Выдача не нравится категорически, так ведь Google!, ведь Яндекс же!.. Но вспоминаю анекдот: "Если на стене сарая видишь надпись из трёх букв - не верь глазам своим. В сарае дрова лежат", - и становится как-то легче.

Попытаюсь сформулировать претензии к нашим "зеркалам Интернета" именно с точки зрения пользователя. Личной, а не десятков миллионов. Совпадают ли наблюдения с вашими, читатель, вам и решать.

Что не нравится

Итак, что не нравится. Думайте сами - тенденции это или мелкие единичные недостатки, которые не очень-то и портят общую радужную картину замечательного русского поиска.


- Не нравится, что в результатах поиска по запросам, совпадающим с названием товара или услуги, показывают большей частью а) адреса продавцов, б) продавцов московских. Если я, проживая в Казани, ввожу запрос "мебель" - это не значит, что я уже готов покупать мебель в Москве. Думаю, пользователи поиска из "немосквы" картину узнают.

- Не нравится навязчивая порнография. Я не принципиальный ее противник, просто меру знать надо. "Рассказы", "бесплатное видео", "девушки", "брюнетка", "крупный план", "негры", "пляж" и так далее – это не те запросы, по которым нужно показывать по 3-10 порноссылок.

- Не нравится бессистемность, бесструктурность выдачи. По запросу "литература" должен выдаваться подробный рубрикатор, позволяющий быстро представить себе состояние дел в этой области в Сети, а не пять ссылок на электронные библиотеки, статью из Википедии и пару известных литературных ресурсов. То же самое касается и других информационных запросов.

- Не нравится низкое качество текстов на сайтах, "оптимизированных" для поисковых систем. Именно они чаще всего хорошо видны в результатах поиска. "Вы спросили в Яндексе «шкаф-купе». Вы хотите купить шкаф-купе, потому что нужно сложить вещи в шкаф, который может быть купе. Правильно, шкаф-купе это самое лучшее решение. Наши шкафы-купе помогут вам. Мы уже триста лет делаем эти самые шкафы-купе и в производстве шкафов-купе приобрели изрядный шкафокупейный опыт. Купейношкафные мастера, изготовляющие шкафы-купе нашей компании размножаются в наших же шкафах-купе и передают опыт шкаф, irfa, купе, regt из поколения в поколение…" Иными словами, "SEO-копирайтинг".

- Не нравится практика поисковых систем вываливать в ответ на точный - длинный - запрос кучу ссылок ни к селу, ни к городу. Видимость "поиска" создается, но результат нулевой. В ответ на запрос "где в Казани починить часы" предлагают тексты "Затем он посетил митрополита, оттуда был в монастыре Девичьем, где чудотворный образ Явления Казанской Богородицы. Потом был у вице-губернатора Кудрявцева, 18. За три дня пребывания в Казани Петр I осмотрел кожевенный и суконный заводы…", По дороге он тяжело заболел и был времен-но оставлен в Казани, в доме профессора Казанского... Важную роль сыграл он в организации и дея-тельности факультета восточных языков СПбу, где дважды избирался на пост декана (1855-1858, 1866-1870) и т.п. Всего 56 тысяч страниц, и ни одной ссылки по делу. Пример, понимаете, не единственный. Судя по всему, в недалеком будущем нас ждет появление возможности голосового ввода запроса в поисковые системы, что приведет к стремительному сдвигу потока запросов в сторону более длинных, естественных формулировок. Чтобы увидеть, с какой проблемой столкнутся тогда и пользователи, и поисковики, "наговорите" с клавиатуры что-нибудь вроде "сломался генератор на Suzuki, где в Москве находятся фирменные автосервисы" и насладитесь результатами поиска в ответ на отлично сформулированный запрос.

- Не нравятся расплодившиеся в последние годы "мэшапы", "информационные ресурсы", "развлекательные порталы", сайты, состоящие большей частью из ворованной информации на самые разные темы – без указания авторов, источников. Нашпигованные рекламой и желтыми заголовками, провоцирующие кликать и кликать по ним. Воровство информации поставлено на промышленную основу, свежие украденные статьи на таких сайтах в поисковом индексе появляются раньше, чем оригиналы.

- Не нравятся сайты несуществующих компаний, созданные для продажи ссылок.

- Не нравится ссылочный мусор на хороших, живых проектах.

- Не нравятся сайты, на которых "партнерская" реклама самих же поисковых систем занимает центральное место на странице, либо является основным содержанием.

- Не нравится откровенный спам – страницы, напичканные галиматьей, нечитаемым текстом, "рерайтом", авторефератами, автоматические дорвеи.

- Не нравятся многочисленные "каталоги", "доски объявлений" и "энциклопедии", использующие одну и ту же базу данных, но пролезающих в индекс и результаты поиска в виде разных сайтов.

- Не нравятся проекты, у которых хорошо видна цель продвинуть как можно больше страниц в поисковые индексы. Доходит до абсурда, "Войну и мир" пытаются разбить чуть ли не по предложениям, по одному на каждой странице. Естественно, с блоком рекламы на каждой.

- Не нравятся "партнерские программы", как "товарные", так и "знакомств" - база данных одна, сайтов в индексе тысячи, везде одни и те же рожи.

Все упомянутое только мне кажется, или вы тоже замечали что-то подобное?

Но больше всего не нравится, что весь этот мутный вал некачественной, анонимной, недостоверной, неструктурированной информации, за которую "владельцы сайта не несут никакой ответственности, ссылка при копировании обязательна", не уменьшается, он растет с каждым годом. Ни Интернет, ни поиск лучше не становятся. Впрочем, как философски заметил руководитель спецпроектов Яндекса Андрей Себрант, "что значит лучше"?

Что значит "лучше"?

Вопрос, конечно, интересный. Подходы к оценке результатов поиска описаны в статье "Парадоксы релевантности" и дополнены в 9-м выпуске рассылки "Проблемы качества поиска". Если уж браться за этот вопрос, стоит изучить терминологию. Иначе может быть непонятно, почему единственный пертинентный ответ на сотой позиции при наличии 99 вышестоящих релевантных ссылок может считаться как вполне качественным, так и не очень, дело в методиках. Общепринятой пока нет, поэтому без "теорий и гипотез" не обойтись. Рассматривать лучше крайние подходы, истина окажется где-то между.

Вот первый. Поисковики служат пользователям, пользователи и решают, насколько хорош тот или иной поиск. Кому что нравится. Если опросить всех пользователей, а каждого пользователя по всем сделанным им запросам, можно получить достоверные данные. Что-то вроде: 100000 человек в Яндексе задали вопрос такой-то, остались довольны результатом 50000, недовольны 20000, 30000 сами еще не поняли. И так для каждого запроса. В итоге выйдет цифра некоей "удовлетворенности" аудитории своим поисковиком – 75%, 50%... Всех, конечно, не опросить, но с помощью выборочных опросов можно получить более-менее приближенную цифру. Примерно так сегодня и делается.

Другой подход. Попытаться сравнить реальные результаты поиска с неким "эталоном", идеальными результатами. Прием хорошо используется во многих науках, но в поисковых технологиях с эталонами явная проблема. Есть хорошее описание идеального поиска от бывшего руководителя исследовательских лабораторий Yahoo! Гари Флейка: "Если бы веб-поиск был совершенен, он бы выдавал ответ на каждый запрос, и это происходило бы так, будто на вопрос отвечает умнейший человек в мире, у которого есть под рукой вся справочная информация, и все это выполняется меньше, чем за мгновение. Другими словами, поисковик был бы ... таким умным, что если правильный ответ теоретически может быть найден в стремящихся к бесконечности ресурсах, он бы нашел его. Если бы верного ответа не существовало, тогда ... выдавал наиболее близкий по смыслу ответ, или даже объяснение, почему ваш запрос не может получить идеальных результатов".

Как видим, определение не так-то просто применить для оценки результатов по отдельно взятым запросам, например, любимыми оптимизаторами "кондиционерам", "пластиковым окнам" или "шарикоподшипникам". А руководитель спецпроектов Яндекса Андрей Себрант, скорее всего, философски заметит: "Что значит «умнейший»?".

Стоит отметить следующее. В случае сравнения с идеалом значение имеет каждый (!) анализируемый ответ. При статистической же оценке миллион некачественных ответов на разные запросы вполне можно списать на ошибки измерений. Первый подход обычно применяют представители поисковиков: "Мы не знаем, как должны выглядеть идеальные результаты в ответ на запрос «шарикоподшипники». Зачем думать об одном запросе, наш поиск отвечает на десятки миллионов разных запросов". Второй - пользователи: "Я искал схему агрегата N, куча мусора в ответ, ничего не нашел. Какой же отвратительный этот поиск M!".

Теории идеального ответа, которую можно применять на практике, сегодня не существует. По методике РОМИП (описана в "Парадоксах релевантности"), "идеальным алгоритмом ранжирования считается тот, для которого выводы, сделанные системой, согласуются с мнением оценивающих экспертов". А экспертам рекомендовано использовать… здравый смысл. Цитирую инструкцию для асессора дорожки поиска: "Ключевое правило - используйте ваш здравый смысл и попробуйте представить себя на месте человека, задавшего этот запрос".

Здравый смысл - вещь, конечно, хорошая, но сложно представить себе результаты работы врача, архитектора, конструктора, основанные исключительно на здравом смысле, без предварительной специальной теоретической подготовки.

Мой здравый смысл говорит, что девять ссылок на порнуху в топе выдачи по запросу "рассказы" - это уже за гранью здравости; асессоры, оценивающие релевантность каждой такой ссылки, ничего плохого не нашли.

Спросил "рассказы"? – Это рассказы.

Рассказы могут быть эротическими? - Могут. Значит, релевантно.

И так девять раз подряд. И нет никакого теоретического положения, согласно которому асессор должен понижать оценку качества выдачи в ответ на нечеткий запрос, если она состоит из однотипных предложений, являющихся ответами на более точный, узкий запрос.

Гипотеза первая

Вряд ли поисковики смогут кардинально изменить качество результатов поиска до тех пор, пока не появится более-менее приличная рабочая теория формирования идеальной выдачи в ответ на поисковый запрос. Это даст хотя бы возможность сравнивать версии ответов, что уже лучше, чем "во-вторых, что значит «лучше»?".

Конечно, "надо стараться делать хорошо". Но, как писал А.В. Суворов, "надобно ж и умение", на одном здравом смысле далеко не уедешь.

Экономика антикачества

Вернемся к нашей заводской аналогии, где каждое четвертое изделие бракуется. Почему? Продукцию делают не роботы, люди, у каждого спам-сайта всегда есть автор, чей творческий замысел так негативно оценила поисковая система. Считать спамеров клиническими дебилами, не понимающими смысл слов Аркадия Воложа "просто не надо вредить", не получается, таких сайтов сотни тысяч, слишком много. Налицо четко выраженная мотивация для их изготовления и порожденные ей технологии. Которые технический директор Яндекса Илья Сегалович еще в 2000 году назвал "антипоисковыми".

Давайте взглянем, что сегодня выгодно.

- Воровать контент - выгодно. О масштабах воровства можно судить по тому факту, что крупнейшие западные издательские дома и компании в марте попросили Google избавиться от медиапаразитов, использующих чужой эксклюзивный контент для перехвата посетителей из верхних строчек результатов поиска.

- Уродовать оригинальный текст, завышая частоты ключевых слов – выгодно.

- Генерировать бессмысленный, но грамматически правильный текст – выгодно.

- На базе одной хорошей статьи с помощью ручного или автоматического "рерайта" делать пять и больше – выгодно.

- Разбивать большие тексты по одному абзацу на странице для увеличения количества страниц в поисковых индексах – выгодно.

- Создавать сайты несуществующих компаний – выгодно.

- Обвешивать сайты партнерской рекламой на самых видных местах – выгодно. - Создавать псевдопроекты, единственной целью которых является попадание в индекс, для продажи ссылок – выгодно.

- Посредничать в торговле ссылками – выгодно.

- Размещать на хороших сайтах блоки "продвигающих" ссылок – выгодно.

- Взламывать сайты и размещать втайне от их владельцев блоки ссылок – выгодно.

Вышеперечисленное никак не может улучшить качество Интернета и поиска, но активно применяется в самых различных комбинациях. Доход обеспечивается при необходимом участии в схеме поисковых систем, без них ни один из упомянутых приемов не работает.

Это не попытка морализаторства, это попытка констатации факта, что экономика сайтостроительства сегодня ориентирована не на улучшение, а на ухудшение сетевого контента. Сегодня, чтобы зарабатывать на продаже ссылок, необходимо выполнить единственное условие: добиться, чтобы сайт был проиндексирован; качество содержимого сайта при этом не имеет никакого значения.

Тем же владельцам сайтов, которые смысл слов "не надо вредить" понимают хорошо, предложен тяжелый выбор. Или "не вредить" и находиться на сотых позициях в поиске в надежде, что поисковики когда-нибудь научатся фильтровать поисковый спам, отличать лучшее от худшего, и все праведники, наконец-то, честно попадут в рай, т.е. в топ выдачи. Дожить бы. Или заплатить специалистам, которые "оптимизируют тексты", "пропишут сайт в каталогах" и "разместят ссылки на сайт", т.е. профинансировать откровенное вредительство. При этом позиции в поиске, за которые поисковики, как гусары с женщин, денег не берут, свободно продаются SEO-компаниями с гарантией: нет позиции – не нужно платить.

Гипотеза вторая

Пока не будут созданы экономические условия прибыльности производства действительно хорошего контента, надеяться на общее улучшение качества поиска вряд ли возможно. Каждый веб-мастер, создающий хороший сайт, должен точно знать, чем это ему выгодно, и как эта выгода будет реализована. Спамеры и оптимизаторы механизмы получения дохода от своих действий знают прекрасно.

Вспомним Крылова: "Навозну кучу разрывая, Петух нашел жемчужное зерно…". Поисковики, конечно, будут все больше и больше настраивать свои "сотни параметров ранжирования" в поисках жемчужных зерен, но дело уже не в факторах, а в сравнении экономик производства жемчуга и навоза. В условиях современной концепции поиска производить дерьмо намного выгоднее. То есть искать по-настоящему хорошую информацию будет все трудней.

SEO – друзья или враги

19 марта известный SEO-специалист Евгений Трофименко опубликовал объявление, что готов выплатить от $1000 сотруднику Яндекса, который согласится продать служебный документ - инструкцию для асессоров.

Обоснование Евгения: "Я хочу уметь делать качественные сайты. А в инструкции написано, какие сайты качественные, а какие - нет. Так что реального секрета здесь быть не может, по крайней мере, вреда в этом нет".

Разработчик поисковых систем "Апорт" и Gogo.ru Михаил Костин так прокомментировал это заявление. "На самом деле, поисковые системы не скрывают информацию о том, какие сайты они считают качественными, а какие нет, наоборот, постоянно стараются об этом рассказывать. Но публиковать с этой целью внутреннюю инструкцию для асессоров было бы странно - у нее другое назначение, и она не подходит для использования в качестве справочника веб-мастера".

Интерес к такой инструкции со стороны SEO-специалистов связан, я думаю, все же не с недостатком информации о том, что поисковики считают качественным сайтом. Скорее, с тем, что из нее можно попытаться извлечь какую-то информацию о внутренней кухне поисковиков, о том, как трактуются какие-то пограничные ситуации, на что особо обращается внимание асессоров и т.п. В предоставлении оптимизаторам такой информации поисковики, естественно, не очень заинтересованы - хотя чего-то особо секретного в подобных инструкциях и нет".


Через четыре часа предложение было снято, видимо, кто-то продал. По слухам, через пару дней империя нанесла ответный удар – Яндекс сократил на треть количество своих асессоров.

Отношения с SEO-сообществом - пожалуй, самая спорная тема в позиционировании поисковых систем. Пользователи – понятно, поисковики работают для них. Спамеры – тоже понятно, они откровенно работают против поисковиков и иллюзий не имеют: поисковики в этой войне пленных не берут, но и спамеры не обязаны проявлять к поисковикам лояльность и понимание. А кто такие "оптимизаторы", чего от них больше – вреда или пользы?

Оптимизаторы сообщают саппорту поисковой системы о наличии в выдаче по интересующим их запросам поискового спама – это хорошо.

Оптимизаторы активно предлагают своим клиентам пользоваться контекстной рекламой, ведут клиентские кампании, консультируют, иными словами, помогают поисковику заработать – это тоже хорошо.

Оптимизаторы привлекают в Интернет новые компании, новые бизнесы, новую информацию – и это хорошо.

Оптимизаторы продвигают наверх в результатах поиска, как правило, профессионально сделанные качественные сайты, выдача по запросам, где эти сайты уместны, становится лучше – и даже это хорошо.

Но оптимизаторы также делают почти все, что перечислено в "Экономике антикачества". По данным компании "Ашманов и Партнеры", в 2008 году только на платные ссылки ими было потрачено около 50 миллионов долларов.

Таким образом, оптимизаторы привлекают в Сеть деньги клиентов, часть которых достается поисковым системам и расходуется на обеспечение качества поиска. С другой стороны, те же оптимизаторы от тех же клиентов привлекают в Сеть деньги, которые финансируют откровенное вредительство - платные ссылки поисковики не приветствуют. Оборот контекстной рекламы в 2008 году оценивается в 300-350 миллионов долларов, и неизвестно, какая часть этих денег поступила благодаря авторизованным рекламным агентствам, являющихся подразделениями SEO-компаний.<.p>

Проблема поисковиков не в сложности выбора, стоит ли ради прибыли в n миллионов терпеть в заднице шило стоимостью в 50 миллионов. Суть ее в пункте 3.4 лицензии Яндекса: "Яндекс (читай – поисковая система) понимает релевантность как наилучшее соответствие интересам пользователей, ищущих информацию, что может в общем случае не совпадать с интересами авторов сайтов".

Соответствие интересам пользователей всегда определяется по паре "запрос – ответ". Например, очень хороший качественный сайт "Анекдоты из России". Давайте продвинем его по запросам "яндекс", "сбербанк", "роем" - пусть пользователи с такими запросами улыбнутся. Пользователи, может, и улыбнутся, а вот поисковики вряд ли и обязательно постараются убрать из выдачи этот "юмор". Такой пример несовпадения интересов авторов сайтов и интересов пользователей понятен всем, ситуация доведена до абсурда.

Вот другой пример. Можно ли сайт funkeprofi.ru продвигать по запросу "пластиковые окна в Москве" (Яндекс, 10 позиция)? Не можно, а нужно, это московская компания, продающая пластиковые окна, ссылка будет отличным ответом.

А можно ли этот сайт продвигать по запросу "пластиковые окна" (Яндекс, 11 позиция)? Это уже непростой вопрос, об "оконной" выдаче стоит почитать две статьи - "Коммерческое и некоммерческое" и "Транзакционность и ранжирование" в архиве рассылки "Проблемы качества поиска".

А можно ли этот сайт продвигать по запросу "пластиковые окна в Казани" (Яндекс, 13 позиция)? Сайт в выдаче с ремаркой "найден по ссылке с текстом «пластиковые окна казань»", т.е. намерение продвинуть очевидно. Нельзя, да?

В данном примере все три запроса для продвижения были выбраны оптимизатором. В первом случае результат улучшает выдачу, в третьем ухудшает, а во втором мнения разделяются на прямо противоположные; я знаю точки зрения как за, так и против, и доказательства для каждой. Но какой точки зрения придерживаются поисковые системы по этому вопросу и почему – вот это – тайна. То ли скрывают, то ли просто еще серьезно не думали на эту тему.

Инструкция для асессоров, действительно, может быть нужна лишь для выяснения пограничных ситуаций в оценке сайтов только для случаев, когда речь идет о создании сайтов линкоподдержки, чья задача одна – удержаться в индексе. В случае клиентских сайтов вопрос об их качестве не возникает, по крайней мере, ни разу о таком не слышал. А вот споры о целевых запросах для продвижения – постоянно. И точка зрения поисковых систем по этому вопросу, что же лучше для пользователей, к сожалению, является крайне неопределенной. Впрочем, это уже относится к рассмотренной выше проблеме теории идеальной выдачи.

Гипотеза третья

Поисковым машинам вряд ли удастся принципиально улучшить ситуацию с качеством поиска по нечетким информационным запросам без диалога с профессиональным сообществом, активно влияющим на выдачу. Суть диалога – обсуждение не темы "качества сайтов", а темы качества выдачи по запросам разных типов.

Нет смысла обсуждать, сколько исходящих ссылок должно быть на странице, каков максимальный процент ключевых слов, какую площадь на веб-странице можно использовать под PPC-рекламу и т.п. Обсуждать нужно простой вопрос, который уже много лет не решаются четко поставить ни поисковики, ни представители околопоискового бизнеса: кто, по какому запросу и почему имеет право находиться в поисковой выдаче.


Андрей Иванов,
"Ашманов и Партнеры"



Реклама:

- Читай Roem.ru в Google Reader!


Лучшие комментарии

 
msado
 
01.04.2009 13:16:02

Некоторая существенная проблема современного поиска состоит в том, что он ищет слова, а не смыслы. Посему требовать от него чтобы он находил то что вы спрашивете - наивно. Пока поиск не перейдет в состояние, когда он сможет, к примеру, каталогизировать в разные подветви одного дерева "медицина" медицинскую популярную статью, инструкцию от лекарства, и академический текст - ничерта с места не сдвинется. Гадать по словам можно очень и очень много.

Кстати оптимизаторы в этих условиях быстро отомрут, потому что частотное ранжирование перестанет работать.
Контекст


andre
 
01.04.2009 15:33:22

=ключевой вопрос не то что=
Это два разных вопроса, оба очень важных и связанных друг с другом. Управляя правилами выдачи, поисковики могут стимулировать тех же сеошников на подтаскивание в Сеть любой информации.
Контекст


anatolix anatolix
  Поисковая.психиатрия
01.04.2009 22:01:09

Раз Саша, Илья или Ден до сюда не дочитали давайте я опровергну. Асессоров не сокращали и наоборот их количество постоянно увеличивается. Оценка в 25 человек была верна 2-3 года назад.

По поводу оценки порно и прочего: оно сейчас не считается высокорелевантным ответом, тем не менее оно лезет т.к. переоптимизировано. Оценка непосредственно на ранжирование не влияет, только через формулу, а на нее так же влияют много других запросов которые говорят толковать высокую текстовую и линковую релевантность, как положительные факторы.

Оценивать один сайт как релевантный, а следующий такой же как не релевантный асессор не может - это только собьет с толку настройку формулы(2 сайта с одинаковыми факторами оценены по разному -> вывод: факторы не значимы). Т.е. к сожалению это не та проблема, которую, можно победить именно таким методом, что однако не означает, что мы ее не знаем и не пытаемся с ней бороться.


Контекст




Чтобы оставлять комментарии, необходимо залогиниться или зарегистрироваться.


Alter Ego
 
01.04.2009 11:45:35 #

Через четыре часа предложение было снято, видимо, кто-то продал. По слухам, через пару дней империя нанесла ответный удар – Яндекс сократил на треть количество своих асессоров.


Не вижу связи. Треть ассесоров за что сокращать?


Alter Ego
 
01.04.2009 11:46:51 #

как талантливо первый комментатор выделил основную суть статьи!


Alter Ego
 
01.04.2009 11:52:29 #

девять ссылок на порнуху в топе выдачи по запросу "рассказы"


Хмм
проверил ни у Яндекса, ни у Гугла нет такого количества порнухи п запросу рассказы

у Гугла две ссылки на эротические, а не порно рассказы
http://www.google.ru/search?hl=ru&q=рассказы
у Яндекса только восемь, а не девять ссылок на порнуху
http://yandex.ru/yandsearch?text=рассказы


Alter Ego
 
01.04.2009 11:53:21 #

как талантливо первый комментатор выделил основную суть статьи!


Просто что сразу бросилось в глаза своей очевидной нелепостью. "Страшная месть", прямо гоголь какой-то


01.04.2009 12:18:36 #

у Яндекса только восемь, а не девять ссылок на порнуху
Мне кажется, это вот, что там на восьмом месте, даже менее релевантно запросу, чем сайт эротических рассказов :)
впрочем, я могу ошибаться.
Насчёт эротических рассказов - извините, а какая разница? И вообще, и в свете обсуждеия качества поиска?


Alter Ego
 
01.04.2009 12:20:23 #

>Яндекс сократил на треть количество своих асессоров.

откуда дровишки?


01.04.2009 12:29:27 #

Придётся вводить ручное модерирование, нанять n тысяч модераторов и пускай выкидывают сайты из индекса.


Alter Ego
 
01.04.2009 12:34:22 #

кто, по какому запросу и почему имеет право находиться в поисковой выдаче.

Ну как. Всё как в жизни.
В одном месте - по количеству занесённого ответственным лицам бабла откатом
В другом месте - на основании открытого тендера, кто больше заплатит
В третьем - субъективное определение лучшести владельцами заведения или например госоргана.

Непонятно, что тут обсуждать. Пусть расцветут сто миллионов цветов.


Onlooker
 
01.04.2009 12:37:52 #

всё бы хорошо, впихнуть бы сто миллионов цветов в десять позиций топа :)


seva
 
01.04.2009 12:43:42 #

а никто не задумывался почему Яндекс не пессимизирует в ноль все ссылки со всех сайтов учавствующих в сапах ксапах и прочее?
по мне, им проще и дешевле смотреть со стороны как за место аксессоров и новых поисковых алгоритмов бесплатная армия сеошников сидит и влияет на выдачу улучшая ее и выводя наиболее коммерческие сайты в топ10.
разве нет? )


Alter Ego №1
 
01.04.2009 12:44:44 #

А мне понравился эпиграф. Особенно слова Себранта.
По сути так и есть. На массовом рынке качество не так уж и важно. Совсем необязательно пользователю нужно что-то качественное и хорошее. А "2% лучше у конкурента" могут остаться незамеченным. Главное действительно "не навредить", а вовсе не "сделать мега-качественно, лучше по всем показателям".

Очень похоже на App Store, где ЯПукалка продается лучше, чем Spore или SimCity


01.04.2009 12:48:42 #

по поводу рассказов - а пипл хавает

по поводу кучи мусора - Андрей, это видишь только ты :) миллионы не видят, они не добираются до таких закоулков


msado

 
01.04.2009 13:16:02 #

Лучший комментарий. Развернуть?


01.04.2009 13:25:40 #

мегаинтересная тема, спасибо
но вообще тут ключевой вопрос не то что и почему выдает поисковик в выдаче, а какая информация доступна в интернет и как поисковик способствует "улучшению"/"ухудшению" (куда направляет/не направляет трафик), по факту в инет работает ухудшающий отбор -- информации море, качественной часто просто нет и найти ничего нельзя
---
ну а отношения поисковики/оптимизаторы иначе как некую игру воспринимать нельзя, очевидно что яндекс может эту все лавочку мгновенно прикрыть, но не прикрывает, потому что ему без них будет во многом сложней и есть риски что будет придумано что то еще более изощренное....


Seo
 
01.04.2009 14:05:30 #

если лавочку совсем прикрыть, то и будет по всем коммерчески запросам вакханалия с включением непонятных блогов, доров и прочего мусора.
если бы был алгоритм, позволяющий отображать выдачу релевантную запросу, игнорируя потуги сеошников, то его бы давно использовали. а по факту, все сайты в топе коммерческих тематиках более-менее соответствуют продвигаемым с помошью SEO словам. спасибо нам) собственно, роль ПС тут регулирующая соотношение более-менее.

лучше задумайтесь о лентяях юзерах, которые очень редко конкретизируют свой запрос. даже просто город обозначить, и то, нет такой привычки. я бы вообще запретил к поиску однословные запросы)


01.04.2009 14:50:24 #

насчет "более-менее соответствуют" это большой вопрос, запросам без слова купить/продать скорее "менее" ;)....
не нужно себя обманывать


andre
 
01.04.2009 15:33:22 #

Лучший комментарий. Развернуть?


01.04.2009 15:51:45 #

просто на мой взгляд все упирается в мой вопрос, а что все связано понятно
---
"Управляя правилами выдачи, поисковики могут стимулировать тех же сеошников на подтаскивание в Сеть любой информации."
проблема в том что сеошники не создают контент, а только его отстраивают и все опять же упирается в создание контента, по факту сейчас контент во многом создается не для людей, а для поисковиков


Seo
 
01.04.2009 16:06:41 #

internet_gign, возможно вы не в курсе, но через интернет с каждым днем увеличивается число продаж.
большинство продвигаемых запросов определенно сложно считать запросами информации. обычно как раз таки ищут услугу-товар.
на мой взгляд, выдача по таким запросам достаточно релевантна. беда только в том, что фирм много, а на странице всего-лишь десять результов. тут даже при анализе этих сайтов человеку сложно сказать, какой из них более релевантен запросу и почему.
стало быть необходимо проводить насильственное обучение формированию запроса к ПС.

или можно и дальше продолжать вводить "рассказы", в надежде, что поисковик прочтет мысли и выдаст то, что имеется ввиду. большинство, что очевидно, выбор из 8 порно сайтов вполне устраивает.

я даже тест придумал для определения релевантности ваших запросов: попробуйте пообщаться со своим знакомым также как и с ПС :) всяко лексикон придется расширять? то-то и оно.


Seo
 
01.04.2009 16:11:20 #

"проблема в том что сеошники не создают контент, а только его отстраивают и все опять же упирается в создание контента, по факту сейчас контент во многом создается не для людей, а для поисковиков"

смотря что подразумевать под контентом.
веб студии сдают пустые сайты заказчику, чуть ли не с "lorem pisum...". и чего? наполнять сайт статьями, которые никому не нужны? много ли вы напишете контента для сайта по автоперевозкам?? :)


01.04.2009 16:15:06 #

Андей пожмотился сцылко поставить? :)

Еще тема БДБД не раскрыта :)


01.04.2009 16:17:39 #

кстати - это не верно:
***

Мой здравый смысл говорит, что девять ссылок на порнуху в топе выдачи по запросу "рассказы" - это уже за гранью здравости; асессоры, оценивающие релевантность каждой такой ссылки, ничего плохого не нашли.

Спросил "рассказы"? – Это рассказы.

Рассказы могут быть эротическими? - Могут. Значит, релевантно.

И так девять раз подряд. И нет никакого теоретического положения, согласно которому асессор должен понижать оценку качества выдачи в ответ на нечеткий запрос, если она состоит из однотипных предложений, являющихся ответами на более точный, узкий запрос.


andre
 
01.04.2009 16:19:06 #

=большинство продвигаемых запросов определенно сложно считать запросами информации=
Это как раз любимый аргумент SEO: раз что-то продается, значит, это ищут те, кто хочет это купить. Остальные разбегайтесь и переформулируйте запросы, Его Величество Товар продвигается. :0) В итоге "дизайн" - это "заказать сайт" и "заказать ремонт квартиры с дизайном интерьера".

А чем не подходит точка зрения, что пользователи по запросу "дизайн" будут в первых строчках находить именно информационные материалы, а девелоперы и ремонтники конкурировать будут по точным запросам - "Заказать дизайн сайта" и "Дизайн интерьера в Москве", например? Покупатель не увидит коммерческого предложения, запрос переформулирует (да он еще и подсказан сразу же будет) и тут же будет выбирать продавца.


01.04.2009 16:19:39 #

про то что и кто в инет делает и где денежный потоки создаются я в курсе и довольно давно ;)....
-----
с тем что оптимизация в сегменте покупки/продажи работает я в общем то и написал (sorry если непонятно)
но я бы долю покупающих запросов не стал бы преувеличивать
иначе мы бы маркет обсуждали, а не поиск....
а вот с информационными запросами (в том числе и по товарам) все сложно, часто ничего не удается найти


andre
 
01.04.2009 16:27:14 #

=пожмотился сцылко поставить=
Женя, я поставил прямо на твой пост в Я.ру. Юра, видимо, убрал.
=кстати - это не верно:=
Поясни. Меня этот вопрос давно интересует. Не про порнуху, естественно, а именно об оценке такой вот "одноплановой" выдачи.


01.04.2009 16:32:21 #

=Поясни. Меня этот вопрос давно интересует=
-все они нормально оценят, не беспокойся. :)


01.04.2009 16:32:27 #

нюанс в том что продающие запросы (и вообще инет бизнес) могут жить только на фоне условно "информационного" инет, а поисковики плюс оптимизации создают перекос
----
а контент это все и веб студии очень разные продукты сдают
сайт по автоперевозкам наполнить вполне реально
но это очень специфичный пример
----
рассмотрите к примеру нетбуки, по факту нет ни одного сайта (или непонятно как найти) с нормальными описаниями/отстроенными спецификациями (что бы было можно посмотреть к примеру наличие BT и разрешение у всего что есть на рынке в данный момент)
приходится пользоваться непонятно чем
и нету такого нормального контента потому что продвинуть нереально (все закрыто оптимизаторами)
а когда человек набирает нетбук в поиске он еще не покупатель конкретного товара...


01.04.2009 16:33:15 #

больше сказать мне не позволяет первое правило бойцовского клуба :)


01.04.2009 16:35:16 #

кроме того: вообще-то напрямую оценки асессоров не влияют, они используются для обучения алгоритмов - это боян!


Alter Ego
 
01.04.2009 16:39:47 #

Женя, поцитируй еще боянов. Первое апреля никто не поверит ;)


andre
 
01.04.2009 16:42:00 #

=первое правило=
:0)
Насчет напрямую не влияют знаю, конечно.

Блин... надо тоже штуку из бюджета выделить и аналогичное объявление подать. Видимо, в этой инструкции есть то, чего я явно не ожидал. Максим Азаров прокомментировал, мол, в Гугле выдача в целом тоже оценивается. Осталось лишь дождаться, когда кластеризовать научатся.


seva
 
01.04.2009 16:44:29 #

а что бдбд? ГС как раз их тема, с тех 50% им принадлежит солидная часть!


Seo
 
01.04.2009 17:05:18 #

"А чем не подходит точка зрения, что пользователи по запросу "дизайн" будут в первых строчках находить именно информационные материалы"
какие информационные материалы? одних только дизайнов можно штук 20 сходу перечислить. будет тоже самое - тот кто ищет конкретный "дизайн" - не найдет

про нетбуки:

из первых 4 результатов в яндексе - три сайта как раз информационные. так что не надо.


andre
 
01.04.2009 17:12:34 #

=одних только дизайнов можно штук 20 сходу перечислить=
Перечислено пять штук - http://www.neiron.ru/search.php?query...7%E0%E9%ED
Давайте еще 15, добавлю. :0)

=из первых 4 результатов в яндексе - три сайта как раз информационные. так что не надо=
:0))) Ай, да Яндекс! Ай да молодец!


01.04.2009 17:37:23 #

по нетбукам -- wiki, два (полу)мертвых и не поддерживаемых ресурса (один не обновлялся с 13 января, второй с начала марта) и хабр, ценность стремится к нулю...
ну и посмотри "ноутбук"


01.04.2009 17:53:50 #

Если бы конфликт был просто на уровне "товары и услуги, продвигаемые SEO-шниками, мешают всем остальным получать общетеоретические знания", то проще всего было бы, как раз, услуги и товары оттащить в сторону (а-ля Маркет), читай пессимизировать в общей выдаче. Они-то как раз очень легко классифицируются и систематизируются, чем весь массив данных мирового интернета


01.04.2009 18:14:44 #

а как оттащить то, особенно услуги (они вообще слабо формализуются)
и прибыли всех участников упадут
----
по факту проблемы со всех сторон, есть целые сегменты в которых ничего кроме оптимизации и копирайтного/маркетингового контента нет


andre
 
01.04.2009 18:33:55 #

=Если бы конфликт был просто на уровне "товары и услуги, продвигаемые SEO-шниками, мешают всем остальным получать общетеоретические знания"=
Михаил, а можно подробнее про другие уровни конфликта?


Seo
 
01.04.2009 18:37:55 #

"по нетбукам -- wiki, два (полу)мертвых и не поддерживаемых ресурса (один не обновлялся с 13 января, второй с начала марта) и хабр, ценность стремится к нулю...
ну и посмотри "ноутбук""

вот вам пример некоммерческой выдачи, за которую никто не борется.
заполонили весь топ говном)

очевидно, что виноваты во всем SEO, Яндекс и магазины нетбуков ))

на самом деле отрасль новая, когда мы туда придем, в топе будут качественные сайты, в частности интернет-магазины, в которых между прочим почти всегда реализована возможность сравнения товаров по Тех.Хар. и очень часто есть и обзоры и отзывы.


01.04.2009 18:57:29 #

не похоже только по мне на некоммерческую выдачу...
а похоже на убитую/бессмысленную...
----
последовательность виновников интересная ;)....
----
какая отрасль новая, о чем Вы, очнитесь (посмотри в инет динамику и объемы продаж ноутов)...
----
в инет-магазинах нюансы в том что там неполная информация (узкий ассортимент, выбор происходит из того что есть, а не из того что могло бы быть), плюс по каждой позиции только одно предложение
----
ну и в данном сегменте (ноут/нетбуки) информацию при желание найти можно, но только гиморойно и требует погружение (хотя теже нетбуки можно без проблем охватить в рамках одного сайта)


Alter Ego
 
01.04.2009 19:00:37 #

По поводу трети ассесоров
Илья Сегалович, Иван Расковалов, А Садовский, опровергнете?


Seo
 
01.04.2009 19:03:30 #

почему же не сделать такой сайт? о чем разговор то?
если нет нормальных сайтов, тут не виноват ни SEO, ни Яндекс.
другое дело, что мало кто захочет создавать серьезный ресурс, вкладывать в него время и деньги, не зная как потом это дело монетизировать.

повторяю, отрасль для рунета новая.
http://wordstat.yandex.ru/?cmd=months...0%BA%D0%B8

оттого и бардак в выдаче. покамест.


01.04.2009 19:11:29 #

а как оттащить то, особенно услуги (они вообще слабо формализуются)
и прибыли всех участников упадут


Ну от хороших позиций на маркете прибыли только растут. Просто, мне кажется, что услуги очень легко систематизируются и этими «ассесерами» и автоматически (например, для участия в каталоге как-то решают, кому платить денежку, а кому бесплатно; вот вам и база коммерческих проектов)

Михаил, а можно подробнее про другие уровни конфликта?

Я может быть, как-то не так читал, но мне показалось, что статья как раз об этом – о том, что сегодняшняя конструкция отношений, по сути, мотивирует участников «портить», а не «улучшать» (мне показалось это главной мыслью)

Порно-сайты, дорвейщики, копипастеры – это ведь не услуги и товары?


01.04.2009 19:12:08 #

не новое:
http://wordstat.yandex.ru/?cmd=months...0%BA%D0%B8
нетбук это нюанс
----
ну и я выше написал что нормальная информация по теме фактически отсутствует на русском в одном месте, нужно погружаться плотно
----
сделать нельзя потому работать с монетизацией нормальной будет только на поисковом трафике который абсолютно непредсказуем
по ноутбукам сделать сложно, посколько их слишком много, но тоже можно
----
и это пример из около IT области, для инет фактически родной
ситуация со стиральными, швейными машинами, etc в инет вообще смешная -- информации ноль по факту, только продажа и все


andre
 
01.04.2009 19:14:23 #

=Порно-сайты, дорвейщики, копипастеры – это ведь не услуги и товары=
А, прошу прощения, дошло.


01.04.2009 19:23:24 #

у меня, к сожалению, нет данных по сравнительной эффективности (когда что лучше) продвижения на маркете, в поиске (директ и оптимизация) и очевидно что тут очень все индивидуально (десятки параметров)
----
как действуют «ассесеры» я честно говоря не понимаю, но ощущение того что яндекс и ко оптимизируют только собственную прибыль (декларируется что для них первичен посетитель) у меня все больше крепнет...


Seo
 
01.04.2009 19:26:39 #

по-моему, мы все-таки начали с нетбуков и с выдачи по ним. про нОУтбуки я ничего не говорил и не буду. у вас какой-то извращенный стиль полемики. без меня в ней я думаю обойдетесь))

ситуация такая, что примитивно набирая "стиральная машина", вы получаете список сайтов, радеющих бюджетами за возможность попасться вам на глаза. и что-то мне подсказывает, что фанклубов стиральных машин нет, поэтому каталогов "всех моделей всех фирм" просто не существует. так что придется вам и далее внедрятся в поиск.

да, кстати. какая именно монетизация имеется ввиду "на поисковом трафике"? ежели сайт ничего не продает, то остается реклама. опять продажи. опять обман и дескридитация Великой Объемной Всеописывающей Свободной Некоммерческой Информации в ваших глазах:)

вобщем пустое. будут тупые запросы - будет коммерческий примитивный топ. ибо массовость решает. вы не купите, он не купит, а кто-то возьмет, да затарится. просто иначе массы искать не умеют.


01.04.2009 19:39:08 #

я невольно расширил тему (изначально я следил за ноутами, нетбуки просто новые штрихи добавили)
-----
но суть в том что оптимизация резко сужает "информационное" поле это медицинский факт и спорить с ним бессмысленно
-----
фан клубов стиральных машин нет, но у швейных машин вполне может быть (у ноутов/нетбуков есть)
-----
монетаризация рекламная (в основном) -- при полной информации и возможности высказывать разные мнения никакой дискредитации нет
-----
а насчет масс -- они действуют как умеют, все под них подстраиваются, получается что получается....


Alter Ego
 
01.04.2009 19:51:57 #

По поводу трети ассесоров Илья Сегалович, Иван Расковалов, А Садовский, опровергнете?

Опровергну. Расковалова зовут Денис. Асессоров было человек 20-25.
И вообще вы дурак, уважаемый.
Убедительно?


andre
 
01.04.2009 20:22:19 #

=фан клубов стиральных машин нет=
Зато есть производители. Интересный выбор - дать позиции в топе производителям товара, которых от силы пара десятков или продавцам, которых десятки тысяч. Производители напрямую через интернет, конечно, не торгуют, т.е. информация о них вполне "некоммерческая". :0)


01.04.2009 20:29:28 #

вот-вот
и что бы у производителя на сайте было все отстроено под инет торговлю (и такие производители есть)
по факту могут быть очень разные варианты, думать тут серьезно нужно
текущая система явно ведет в никуда (при этом и с точки зрения дохода она не всегда оптимально действует)


01.04.2009 20:31:58 #

кстати кое кто через инет торгует тоже, классика тут: http://www.sonystyle.ru/
и это будет развиваться (не будет банальный Dell в пример приводить)


anatolix
  Поисковая.психиатрия
01.04.2009 22:01:09 #

Лучший комментарий. Развернуть?


andre
 
01.04.2009 22:25:42 #

Спасибо, Анатолий.

=мы ее не знаем и не пытаемся с ней бороться=
Если не секрет, о какой проблеме речь: порно по несвоим запросам или однотипные сайты в выдаче?

P.S. Женя, выходит, насчет "и так 9 раз подряд" все ж верно.


Onlooker
 
01.04.2009 22:33:42 #

Анатолий, а кого именно ваш анонимизированный сотрудник чуть выше дураком обозвал? Иванова что ли?


Alter Ego
 
01.04.2009 22:54:59 #

Это был я, а я не сотрудник Яндекса. Скорее конкурент ихий.
Обозвал одного глупого альтерэгу.


Не Браславский
 
02.04.2009 02:21:33 #

> Пока поиск не перейдет в состояние, когда он сможет, к примеру, каталогизировать в разные подветви одного
> дерева "медицина" медицинскую популярную статью, инструкцию от лекарства, и академический текст - ничерта с
> места не сдвинется.

Тут недавно Браславского ругали, а он ведь в "Яндексе" занимается как раз жанровой классификацией. И по тематической классификации тоже работы ведутся, Масловым и Ко. Остается дождаться результатов.


Alter Ego
 
02.04.2009 09:52:49 #

Классифицировать страницы совершенно не трудно
Для каталога среднего уровня гранулированности, скажем тем 30-50 вы сможете это сделать с достаточной точностью и coverage
Вопрос в том что дальше? Для каких запросов следует продвигать какие темы и насколько


Жанровая классификация штука прикольная. Я думаю поисковик по жанрам не помешал бы, был бы вполне полезен школьникам и любителям, иностранцам, изучающим русский язык " кот по дереву гуляет стихи" "мальчик из одессы проза" "текст уровня первоклассника по теме путешествия "
В принципе, неплохая штучка, наверное, в год парочку миллионов запросов бы набрал. А как функция встроенная в большой поисковик в надежде повысить "релевантность" абсолютно бесполезная вещь, впрочем, браславский сам это показал в своем докладе
Думаю стоит сделать отдельный нанопроект если это не займет больше человеко-месяца или двух


Alter Ego
 
02.04.2009 09:55:36 #

Анатолий
А Вы свои реплики в форумах с Воложем согласуете?
А то будет как с увольнениями, когда народ говорил, что не увольняют, а Волож потом всех подвел.


anatolix
  Поисковая.психиатрия
02.04.2009 13:59:02 #

Нет не согласую. Но и рассогласований особых не вижу. Любая большая компания время от времени увольняет людей. По их инициативе с формулировкой "уволен по собственному желанию" или по своей с "уволен по соглашению сторон", и иногда с другими. Наверняка, из наших ассессоров кто-нибудь в последнее время тоже нас покинул. Просто здесь утверждение было про 1/3 ассесоров, которое совершенно точно реальности не соответствует.


andre
 
02.04.2009 14:29:50 #

=утверждение было про 1/3 ассесоров=
Это утверждение начинается со слов "по слухам". Здесь же было утверждение, что в Яндексе 25 асессоров. Оно было - авторитетно - дополнено, что то данные старые. Опять же - по слухам, см. в я.ру - сегодняшнее количество асессоров Яндекса - несколько сотен. :0)


Alter Ego
 
02.04.2009 14:50:43 #

> Классифицировать страницы совершенно не трудно.

Если взять готовое решение, то не трудно. Если делать самому и с приличным качеством, то трудно и долго. В "Яндексе" стараются делать сами, вроде как (и это правильно).

> Вопрос в том что дальше? Для каких запросов следует продвигать какие темы и насколько.

Т. е. вопрос в определении тематики самих запросов? Эта проблема обсуждается уже довольно давно и как-то решается разными коллективами, пусть не идеально.

> Я думаю поисковик по жанрам не помешал бы, был бы вполне полезен школьникам и любителям, иностранцам, > изучающим русский язык " кот по дереву гуляет стихи" "мальчик из одессы проза" "текст уровня первоклассника по > теме путешествия "

Кирилл Готовцев не этот вариант имел в виду, как я понял. Надо так - человек вводит запрос "кот по дереву гуляет", а ему выдаются: текст искомого произведения, литература о нем, "сочинения, рефераты", ссылки на книжные магазины и т. д. И жанровый классификатор тут вполне может помочь.


02.04.2009 14:59:57 #

Есть мнение.
По сути, проблемы поиска обусловлены не только технической стороной, "несовершенностью" поисковиков, SEO, и определенным "загаживанием" поиска. Тут еще существует несколько других аспектов:
1 - как уже говорилось, не умением делать грамотный запрос
2 - не знание процессов вывода поисковиками релевантных ссылок в выдаче и не релевантных тоже
3 - ленью пользователей в формулировке запроса и просмотре списка выдачи
4 - идеализация поисковой машины и поисковых процессов пользователями по умолчанию, что приводит к негативным результатам поиска, порой
5 - ориентация рынка, а соответственно, и создание интернет среды, нацеленной на продажу тов./усл. (поэтому, собственно и говорят:"хочешь, чтобы тебе чего-нить "впарили", пользуйся яндексом"). Ведь сейчас оптимизаторы, предлагая свои услуги компаниям кричат, что ваш сайт это инструмент продаж - отсюда и кеси-меси в поиске.
6 - очень многие утверждают, что 70%, а то и больше, в интернете - это порно трафик. вот вам и подтверждение по "рассказы"
7 - отсутствие интернет грамотности - отсутствие нормального интернет образования в школе/институте у людей, в своей массе. Кто учит итернет-серфингу?
8 - деньги. сейчас в интернете и на услугах, связанных с интернетом не зарабатывает только ленивый - это утверждение уже, как аксиома.

Утверждение - не навредить - это не пользовательское, скорее коммерческое, на мой взгляд.
"Здесь все просто так, кроме денег" - Брат2


sinodov

  главный редактор
02.04.2009 15:27:49 #

(залили в открытки, думаю логичнее тут обсудить, раз уж все в сборе)

Почему Яндекс, активно боровшийся в прошлом году за оригинальность источников в выдаче, продолжает индексировать агрегаторы, которые вообще не содержат оригинального контента?
Например,
Newsland.ru иц - 3600
http://search.yaca.yandex.ru/yca/cy/c...wsland.ru/
Pcnews.ru иц - 1700
http://search.yaca.yandex.ru/yca/cy/ch/www.pcnews.ru/

Про newsland не совсем верно - его выкинули из News.yandex.ru, например. А под автоматические фильтры на "Яндексе" он, похоже, не попал.


02.04.2009 16:01:11 #

Ну, если говорить о механизмах работы яндекса, то совершенно логично, что у Newsland.ru и тиц имеется)))
Если же вести разговор о первоисточнике контента Newsland.ru - то машина же не делает различий, даже по времени публикации материала. и порой, в самом тексте не ставят гиперссылку на первоисточник, а, либо, просто пишут "как сообщает то-то СМИ или вот то-то", а на Newsland.ru есть вот такая фигня:
"В соответствии с пользовательским Соглашением ответственность за контент, размещенный в этом разделе, несет Пользователь, разместивший этот контент без предварительной модерации через форму на сайте. Вы можете связаться с редакцией и администрацией Портала по вопросам контента и модерации."

да мы знаем, что они агрегаторы, но поисковик на это не смотрит - SEO - все для вас)))


mim
 
02.04.2009 18:21:04 #

Идёт бычок качается... Ну сколько можно?
Если про выгоду поисковиков гнать траф на сайты-болванки с блоками поисковой рекламы (Директ/Адвордс) зачем-то скромно умолчали, то к чему все эти пафосные благие пожелания?
Интеренет как бизнес — это прежде всего реклама и политика, а то и другое — дело обычно грязное, некрасивое, ни разу не благородное. Зачем тогда ожидать какой-то чести от основных трафогенераторов?

Обзоры техники/мебели и схемы агрегатов вовсе не должны появляться в поиске (который, ещё раз: прежде всего трафогенератор для рекламы) по общим запросам, без уточнения. Потому сначала идёт спам-трэш. Фильтруйте. Вы же фильтруете рекламу по ящику...
А кластеровыйпоик неплохо реализован у Нигмы. Сколько можно возносить молитвы одним и тем же давно залапанным идолам?


Alter Ego
 
02.04.2009 18:52:25 #

А кластеровыйпоик неплохо реализован у Нигмы

Да-да, просто ****** реализован!
Вот кластеры для запроса "Нигма":

поисковик нигма (5)
nigma (58)
компания (5)
заработок в интернете (13)
нигма рекламировалась (5)
форум (6)
главная страница (6)
ищи (13)
зарабатывай (5)
книга (6)
заработать (5)
проект (9)
поисковая система nigma (8)
ссылка (6)
интернет магазины (6)

Это про что кластеры?
Вот допустим, кластер "ссылка" - скажите, не заглядывая, про что он? Что там внутри?
Или "заработать" , "ищи", "зарабатывай" - про что?


Alter Ego
 
02.04.2009 19:24:19 #

Если делать самому и с приличным качеством, то трудно и долго.


Для каталога-дерева 30-50 названий разных областей знаний (скажем, медицина, медицина-для пациентов, медицина - для врачей, физика, электроника, электроника-бытова техника ) это совершенно нетрудно и
Если ваши программисты говорят вам, что для того, чтобы сделать это нужно больше, чем 8-10 человеко-месяцев (включая инфраструктуру, способную обработать пару биллионов документов и настройку алгоритмов ) они вам безбожно врут


mim
 
02.04.2009 20:06:29 #

Да, даже на такой запрос как «Нигма» куча разнообразия, и уж никак не «и так девять раз подряд» (да, это мем! :)) .
«Ссылка» у нигмы обычно означает ссылку на то, о чём запрос (точнее, контекст такой ссылки по ссылки с Нигмы) — это же очевидно, хотя НЕпостоянный пользователь поисковика может не догадываться.
А непостоянный пользователь любого другого поисковика вообще замучается. Вот мне приходилось обучать пользователей компьютеру/интернету. Для обучения пользования поисковиками отдельный урок нужен (+ объяснение — почему они столько мусора в результаты выдачи получают и как с этим бороться).

Когда на запроc типа transcend mp840 я сразу получаю ссылку с навигатора «технические характеристики» — это удобнее, чем рыться в выдаче или уточнять запрос.


LMM
 
02.04.2009 23:01:43 #

Добрый день.
Про агрегаторы вчера я пытался вопрос разместить. Юрий, спасибо, что он не пропал, я сам потом подумал, что в этой дискуссии он более логичен.
Я надеюсь, что кто-нибудь с яндекса читает роем и даст не анонимный ответ. Примеров агрегаторов много, хотя бы по этим понять ситуацию. Понимаю, что яндексовские асессоры должны находить такие ситуации и реализовывать обещания руководства поисковика. Но этого не происходит. На мой взгляд, такие ситуации сильно подрывают имидж яндекса.


03.04.2009 15:01:26 #

А вот что можно получит при запросе Елена Беркова в images.yandex.ru -
http://images.yandex.ru/yandsearch?te...type=image

Ну, что тут еще скажешь


Alter Ego
 
03.04.2009 21:29:49 #

> А вот что можно получит при запросе Елена Беркова в images.yandex.ru

А что Вы ожидали увидеть по такому запросу?


iseg
  программист
05.04.2009 20:50:24 #

Андрей.

Очень яркая и интересная статья, я пишу ответный комментарий, но он еще не готов.

Илья


andre
 
05.04.2009 21:18:14 #

Спасибо за отзыв, Илья. Буду ждать.


Alter Ego
 
06.04.2009 10:27:20 #

Андрей, а что, по-вашему, должен показывать Яндекс по запросу "яблоко"? Сейчас там в первой десятке восемь партий "Яблоко", один женский журнал и одно Apple.com, найденное по ссылке.
А фрукты-то где?


Alter Ego
 
06.04.2009 11:12:23 #

Илья
а почему в выдаче Яндекса столько много порнухи по совершенно непорнографическим запросам вроде "рассказы"

И почему Яндекс тратит свои ресурсы на очень глупые с точки зрения технологий и совершенно нулевые с точки зрения привлечения трафика проекты вроде "ответы"(42), в то время как те же ресурсы можно было направить на удаление порнухи их поисковой выдачи.


Alter Ego
 
06.04.2009 11:13:58 #

Если ваши программисты говорят вам, что для того, чтобы сделать это нужно больше, чем 8-10 человеко-месяцев (включая инфраструктуру, способную обработать пару биллионов документов и настройку алгоритмов ) они вам безбожно врут


Не врут, а распиливают бабло


Alter Ego
 
06.04.2009 11:18:29 #

А по запросу Питон это Яндекс, что выдает? Есть ли там и змея, и язык программирования?
А Леопард? Есть ли таи и животное, и версия операционной системы от Эппл?


Alter Ego
 
06.04.2009 11:55:35 #

последний Альтер, что вы этим хотите сказать?
Яндекс объявлял, что стремится к максимально информативной и охватывающей выдаче. Выдачу по запросу "яблоко" такой назвать нельзя. Зато в выдачу по коммерческим запросам гвоздями прибивают информационные сайты и Википедию, чтобы она стала разнообразнее.


Резонер Амгин
 
06.04.2009 14:04:41 #

Да, даже на такой запрос как «Нигма» куча разнообразия, и уж никак не «и так девять раз подряд»

Не надо придуриваться. Там никакое не разнообразие, а чушь. Названия кластеров не соответствуют тому, что внутри, да и кластеризации никакой нет - перемешаны сайты равномерно.
Кластеризация - штука на порядки более сложное, чем то, что могут сделать студенты в Нигме. У них нет даже нормальной теории, что такое смысловые кластеры, просто один тупой технический прием объединения сниппетов по частотности слов. И он стабильно, надежно ни хера не работает уже года четыре.

Ребята, не надо писать программистской ерунды про 8-10 человеко-месяцев. Нигма вот за долгие годы ниасилела. Кластеризовать выдачу, раскладывать по типам или по смыслу непросто. И не все могут, и стоит это дорого в разработке.


06.04.2009 14:08:46 #

Был бы благодарен Alter Ego за примеры по:
"Зато в выдачу по коммерческим запросам гвоздями прибивают информационные сайты и Википедию, чтобы она стала разнообразнее."


sinodov

  главный редактор
06.04.2009 14:11:45 #

http://yandex.ru/yandsearch?text=%D0%...0%BB%D0%B8


Alter Ego
 
06.04.2009 14:17:08 #

черепица
Википедия там, ага.
Стоматолог
доктор.ру


06.04.2009 16:42:05 #

спасибо
как давно это?
----
я смотрел вокруг ноутбук/ноутбуки и т.п., вроде совсем недавно не было (на уровне той недели), но естественно мог и ошибиться


Maxime
 
06.04.2009 16:59:38 #

Выдача Нейрона по запросу "рассказы" такая же однобокая, она исходит из предустановки, что рассказы - это жанр литературы (в смысле издаваемой классической литературы), и никуда от этого не отклоняется. Однако рассказы - это еще и широкий пласт устного/фольклорного творчества, типа рассказы бывалого, байки и т.п., зачастую публикуемые в личных дневниках/сайтах. Да и эротические рассказы - это нечто жопы поиска, делать вид, что их нет в природе или их мало выкладывают в инет - очевидно глупо.
В этом плане подход Нейрона хуже. Если выдача поисковика атоматическая, т.е. можно предположить, что она разнообразится при выранивании качества (включая поисковую оптимизацию) сайтов с различными трактовками "рассказов", то Нейрону исправиться будет много сложнее, бо "эксперты" упираются рогами в свои убеждения правильности будь здоров, они ж эксперты...


mim
 
06.04.2009 17:47:51 #

2 Резонер Амгин
Не спорю, что реализация кластерного поиска Нигмы оставляет желать лучшего. И я её привожу только как пример попытки.
Что касается самой задачи кластеризации данных, то я не думаю, что она недоступна по техническим причинам (см. что на этот счёт лежит в открытом доступе). Тут дело, скорее в принципах, а именно — бизнес-модели, работы существующих поисковиков.

Как альтернатива см., например, http://search.carrot2.org/stable/search
По крайней мере на запрос python — о том, что питон — это ещё животное там можно узнать почти сразу :) и это ещё 4ая ссылка в выдаче. У Я. на этот запрос тоже неплохо, в общем-то (чего н скажешь про гугль)
А с apple — везде проблема, однако :)


Alter Ego
 
06.04.2009 18:55:43 #

Глупо продвигать Википедию, только потому, что это Википедия
1 там много некачественых статей
2 оптимизаторы узнав, что поисковик продвигает википедию немедленно начнут использовать это для продвижения своих результатов (статьи на вики, ссылки с вики)


andre
 
06.04.2009 19:31:02 #

=Выдача Нейрона по запросу "рассказы" такая же однобокая, она исходит из предустановки, что рассказы - это жанр литературы (в смысле издаваемой классической литературы), и никуда от этого не отклоняется.=
:0) Это я от этого не отклоняюсь. Но в Нейроне к формированию выдачи допуск есть у всех желающих. Если Вам кажется, что "байки" вполне достойный жанр и может быть представлен в выдаче, сделать это просто: а) формируете подборку ссылок в ответ на запрос "байки" б) ставите "байки" как экспертную подсказку в выдачу по запросу "рассказы". То же самое можно проделать и с "притчами", "рассказами о животных", "рассказами о жизни", "о любви", "приключенческими рассказами" и любыми другими видами рассказов. Каждый упирается рогом в свое видение вопроса, но в Нейроне точки зрения не воюют, а дополняются.

=можно предположить, что она разнообразится при выранивании качества=
А вот это вряд ли. Я давно поисковой оптимизацией занимаюсь; механизмов перекашивания выдачи в SEO сколько угодно, а вот "разнообразиия" и "выравнивания" нет.


offtsa

 
20.04.2009 16:53:04 #

привет. Таки ты воплотил тот рисунок на песке...


offtsa

 
20.04.2009 16:56:50 #

Сорри за оффтоп,
Андрей, дай твою асю пжалста. Очень рада тебя видеть. Долго искала.


Alter Ego
 
01.05.2009 08:27:39 #

Может ли Яндекс или Гугл помочь выяснить сколько киллограмов ладана расходуют храмы РПЦ в год?






Соотношение CPM: 07'2010
Медиатаргет - 47
Яндекс.Директ - 29
Бегун - 22
Google - 21



Новые
комментарии



momus > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

momus > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

сплетник со стажем > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

momus > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

сплетник со стажем > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

сплетник со стажем > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

momus > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

Alter Ego > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

momus > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

Alter Ego > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

illyn > Живой Журнал запустил ботов в массовую эксплуатацию

illyn > К ЖЖ припилили экспорт в Facebook и Twitter и внутриЖЖшные Pingback'и

Alter Ego > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

Muchacho > Google потерял два года на российском рынке

ivan777 > Публичный саппорт: Почему Вконтакте блокирует аккаунты с деньгами без следа?

Гросс > Колыбельная для СМИ

СМИшник > Колыбельная для СМИ

Матфей > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

satisfactor > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора

HR > Кадры: Михаил Ханов ушел из InfoWatch с должности исполнительного директора


Почитать


От читателей


чтобы добавлять свои ссылки, надо зарегистрироваться на сайте




Учитесь торговать на Forex вместе с нами! | Все Цены на Швейные машины
   
© ООО "Гейзер"