Свежие новости и твиты выделили в большом поиске Яндекса

Развитие событий: "Яндекс" заинтересовался политическим таргетингом (7 августа 2012)

В поиске «Яндекса» для ряда запросов (от 3 до 10% из всех) появился ясно видимый блок со свежими в Сети материалами. Твиттами, видеороликами и простыми публикациями. Ссылки на популярные в «Твиттере» документы «Яндекс» находит с помощью партнёра, калифорнийской компании Topsy Labs. Остальные разновидности контента Яндекса ранжирует сам. Проиндексированное быстрым роботом Orange упорядочивается по новой формуле и с пометками вида: «Позавчера», «Вчера», «4 часа назад» вклеивается в традиционный SERP. Есть возможность и отдельно просмотреть только свежие публикации, появившиеся за последние 3 дня.

Под руководством Федора Романенко Яндекс «боролся» за свежесть в выдаче несколько лет. Скоростной робот Orange был запущен в 2010. В декабре 2011 стало известно об ускорении «Новостей». В 2012-м компания представила индексацию Twitter.

Персонализация лучших ссылок из «Твиттера» (они аккумулируются в отдельном проекте «Яндекса» The Tweeted Times) в сегодняшнем пресс-релизе поисковика не упоминается. Хотя место для напоминаний о большой программе «поиска по социальному интернету» всё-таки нашлось.

Комментарий представителя компании

Добавить 3 комментария

  • Ответить

    К слову, без особых к тому анонсов (?), индексация в Google сейчас тоже очень и очень быстра. Их выдача задекорирована совсем по другому, менее навязчиво, но работает впечатляюще. Вот пример очень быстрой индексации страницы и включения его в SERP большого Google. http://img-fotki.yandex.ru/get/6201/13158792.14/0_6528c_db8a30a4_orig Запись сделана в 12:48, А в 12:50 она уже выдаётся в индексе большого Google. P. S. Наткнулся случайно, просто вводил запрос и выдало.

  • Ответить

    На самом деле, все несколько сложнее. Гугл, Яндекс и Бинг давно занимаются свежестью и время от времени пиарятся на эту тему, Гугл в последний раз осенью 2011. Обходить, индексировать и выкладывать на поиск за минуту умеют и Гугл, и Яндекс, но это только небольшая часть дела. Гугл у старых морд подписывает дату обновления. Не совсем понятно, зачем это нужно пользователю, но PR эффект, как мы видим, это имеет ;) Самое сложное — ранжирование, т.е., во-первых, нужно понять, что запрос подразумевает свежие ответы в большей или меньшей степени, также нужно найти самые главные свежие материалы по запросу. Ситуация осложняется тем, что сигнала для ранжирования свежих документов меньше, чем для старых. А текст документа, особенно по широким запросам, не сильно влияет на ранжирование. Т.е. есть некоторый миф про поисковики: достаточно проиндексировать текст документа и выложить его на поиск, и все будет в шоколаде, он начнет находиться. Но на самом деле это верно только для очень-очень длинных (узких) запросов.