«Яндекс» набросился на Li.ru

Исправленная Яндексом «ошибка» позволила за один месяц на порядки увеличить число страниц проиндексированных большим поиском в дневниках Liveinternet.ru, сообщает руководитель разработки li.ru Валентин Любимов. Однако по его оценке проникновение индекса нужно поднять ещё в 2−3 раза, неудовлетворительна так же и частота обхода пауком.

К очень неохотной индексации блог-площадок большим «Яндексом», привело засилье спама, сообщил господин Любимов в разговоре с коллективом блога Roem.ru — например в сфере интересов «быстрого бота» блогов не существует вообще. По мнению Валентина, сегодня, спама в блогах не меньше чем в вебе и только в одном «Живом Журнале» в сутки генерируются до полумиллиона спам-сообщений (в Li.ru до сотни разных алгоритмов позволяют подобной ситуации избежать, отметил Любимов). Достаточно лояльное отношение площадок к спамерам негативно сказывается на окружающих сервисах. Аналогичных по типу или иных, пример последних дней — не справляющийся с нагрузкой Поиск по Блогам Яндекса.

По мнению руководителя разработки Li.ru, ресурсы, выделяемые на ППБ, недостаточно большие, а решаемая задача, по очистке сообщений от мусора, стала сопоставимой по масштабам с самим большим поиском. В то же время неработающий Поиск по Блогам сильно влияет на лояльность к бренду «Яндекса» в целом. По мнению Валентина Любимова нужно стратегическое решение: «или закрыться, или упроститься, или навалиться и разобраться».

Добавить 30 комментариев

  • Ответить
    ilyak организация, способная на многое

    А я считаю, что жежешечке надо бороться со спамом у себя, например. Ну хотя бы на базовом уровне — отсеять спам в сообщества. Пользоваться может в один момент стать невозможно.

  • Ответить

    > жежешечке надо бороться жежешечка — просто технологическая платформа. ей не надо бороться. ей надо предоставлять. конечно, кровавая гебня может заставить фильтровать. но. пока нет. пока: тебе дают бумагу (ЖЖ) — ты на ней пиши. если хочешь. что хочешь. в ответе за то, что напишешь — пока ты лично. когда будет жежежыджка. ы. Яндекс — не гебня. спам — его проблема, не ЖиЖи.

  • Ответить
    ilyak организация, способная на многое

    vnaz, я подписан на десять сообществ, в которые всё время постится разный спам. Мне неприятно. Технологическая платформа — миф. Технические проблемы неотделимы от организационных, это давно обсосанная тема.

  • Ответить

    вы можете подписаться ходить по десятку улиц. или даже по одной. в Бутово. Южном. Вас никто не заставляет там ходить. так получилось, что там построили много спальных мест. те, кто их занял, не обязаны следовать Вашим представлениям о культуре. у них других проблем хватает, которые Вам скорее непонятны. как Вы поступите в такой ситуации — перестанете ходить? будете ждать, когда милиция (Яндекс или другая спамооборона) справится? свалите не Кипр? ;)

  • Ответить
    ilyak организация, способная на многое

    Никто никаких мест не занимал. Это спам. За утверждение, что спам — это такой контент, в 2010 году полагается лопатой по лбу.

  • Ответить

    лан, лан. я ниче не утверждаю. я типа моделирую. кто-то во дворике. Бутово. пусть Выхино. построил такой скверик. со скамеечками. на них удобно культурно пить пиво. говорить о культуре. и так оказалось, что там же удобно пить. даже не самогон. тройной. и говорить о бабах, наркоте. хм. придурках учителях. Вы вот там сидите. а приходят те, другие. Вы расскажете им про лопату?.. и про лоб?..

  • Ответить

    Если где-то соотношение спам не спам 1 к 5ти — туда и ходить индексировать хочется и нужно раз так в 700 реже, чем в добродетельные места. А так да. Это личное дело площадок, разводить у себя гаюшник или нет.

  • Ответить

    Вот уже все говорят о том, что такой ЯППБ позорит Яндекс, наносит бренду репутационный ущерб. Не один я такой, теперь и другие голого короля заметили. А Волнухину и Иванову на весь этот ущерб насрать и розами засыпать.

  • Ответить

    Да, кстати, а о какой вообще ошибке речь? На данный момент весь ЯППБ — одна сплошная ошибка, начиная от критериев наполнения базы и заканчивая алгоритмами выдачи.

  • Ответить
    Альтер Эго

    Слушай, макака, тебя забанили в ЯППБ или что-то личное к Волнухину и Иванову? Не нравится — не пользуйся, есть правильно сделаная альтернатива — покажи. А г-мет засунь туда, от куда достал.

  • Ответить

    Тупые альтерэги заиппали: я как раз уже давно пытаюсь добиться, чтобы меня забанили в рейтинге ЯППБ, но даже это они сделать не хотят и не могут. Альтернативу я показываю внятно: удалить нaxyй рейтинги. Что ещё тебе неясно, дурачок ты анонимный?

  • Ответить

    mkozloff, а как я набросился? Мне глубоко симпатичен Яндекс, несмотря на то, что нас преследует цепь постоянных ошибок и случайностей, мешающих полноценной работе. Сервис Яндекс.Блоги — глубоко странный, это долгая история со скриншотами и прочим, но я думаю это мнение разделяют многие. Мне бы очень хотелось, чтобы Яндекс вложил в десять раз больше ресурсов в ППБ и сделал из него космический корабль. Но я представляю себе сложность задачи и размер отдачи, поэтому, помимо вложиться и доделать, вполне рассматривал бы и еще раз урезать тот функционал, который работает неправильно (количество «неспамовых» и «неботовых» записей в блогхостингах за сутки) и нестабильно (крутые сложные функции в поиске), взамен на урон бренду Яндекса, в лице самой «крикливой» аудитории -блогеров (а кричат они в том числе и мне в техподдержку), который, повторюсь, мне глубоко симпатичен.

  • Ответить
    qqq

    как приятно, что в компании Яндекс работают такие высокультурные сотрудники как «Alter Ego 22.07.2010 09:50:13», несущие свет корпоративной этики в ряды недочеловеков-неяндексоидов. Аминь.

  • Ответить
    Альтер Эго

    В Яндексе не работают сотрудники, которые неспособны правильно написать слово «откуда».

  • Ответить

    @pe3yc Об «ошибке» другого порядка. Подобные данные не раскрываются сторонами, но судя по всему, блог-платформы по умолчанию считаются большим Яндексом (а не ППБ) — заведомо спамерскими и не требующими индексации.

  • Ответить

    2illyn Разумеется — иначе бы и не было отдельного проекта ЯППБ. Только вот реализация ЯППБ получилась такой, что лучше бы её не было: оно и работает криво и способствует дальнейшему увеличению и без того высокой доли спама в общем блоговом контенте. Если рассматривать ту базу (в данный момент немногим менее 19 миллионов эккаунтов), которую ЯППБ считает базой блогов, то Большой Яндекс совершенно прав: неспамового, нормального честного контента там от 2.5% до 8% (в зависимости от критериев подсчёта), остальное и в самом деле лучше не индексировать. И это по количеству эккаунтов, а если считать контент по объёму, то процент спама ещё больше. Но, во-первых, никто не заставлял ЯППБ набирать в базу всякое гамно, во-вторых, никто не мешал ЯППБ использовать качественные и зарекомендовавшие себя технологии Большого Яндекса (как поисковые общего характера, так и специфические антиспамные/антисеошные), а в-третьих, самой большой ошибкой было делать под вывеской Яндекса тухлый привокзальный сортир — я имею в виду рейтинги, которые, как известно, убивают контент и нагоняют спам.

  • Ответить

    О большом. В ЯППБ сообщения закачиваются с Ли.ру очень плотно и хорошо. Но из-за того, что это блог-сервис раньше их и не думали включать в Большой.

  • Ответить

    > Alter Ego, 22.07.2010 16:27:25 > В Яндексе не работают сотрудники, которые неспособны правильно написать слово «откуда». А тех, которые не способны правильно написать «не способны», значит, берут? :)

  • Ответить

    @illyn Не стоит с такой увереностью говорить о том, что неизвестно. Яндекс извинился и достаточно быстро исправился, как я им указал на проблему, об этом и было мое сообщение в моем блоге, спасибо Яндексу. Причины того, что такая ошибка была мне тоже конечно интересны, но утверждать, что я или Вы их знаете — это не правильно

  • Ответить

    @valez Я только в рамках предположения. Не более. Но. В своё время мне было нужно «мониторить», что пишут о конкретной географической области. Города такие-то и такие-то и такие-то. А когда так плотно смотришь и делаешь это методично, то немедленно собственными глазами обнаруживаешь — блоги дико заспамлены. Прям на Роеме была «открытка» такая. Какой город не введи — дико торгуют понятно чем, понятно кто, человеческих сообщений в выдаче нет.

  • Ответить

    to illyn: Да что тут говорить: вот вчера мне понадобилось посмотреть, что пишут в блогах в связи с отменой рейса AirВaltic из Барселоны. Чтобы понять, насколько ЯППБ ничего не ищет, достаточно было ввести в поисковую строку «AirВaltic». И это ещё относительно низкочастотный запрос. По более высокочастотным ключевикам там такое вылезает, что смотреть страшно. Я вообще не понимаю, в каких заповедниках ещё остались такие люди, которым нужно доказывать, что ЯППБ превратился в спаммерскую помойку. В самом Яндексе разве что. Всем прочим уже давно всё понятно.

  • Ответить
    Юрий Синодов Основатель Roem.ru, sinodov.com

    pe3yc, вы чего? В пик летнего сезона название авиакомпании, которая сосет трафик со всего ЦФО и СЗФО и раскидывает его по всей Европе по демпинговым ценам, это просто золотой, если не платиновый, запрос. Во-вторых, где тут спам? http://blogs.yandex.ru/search.xml?text=airbaltic Обычная выдача — кому-то что-то не понравилось, кто-то что-то ищет

  • Ответить

    Сейчас чуть получше — а пару часов назад запись «Общие инвестиции вступить в Европейский союз вывести район, скачать бесплатно программу для открытая игр она утроил бы принципы и идеала. airBaltic считает, заменить нашего положительное решение, Долгополов выступил половины намеченных в том на европейском детям шести» была на первом месте выдачи, да и другие результаты были в том же духе (сплоги+агрегаторы новостей, выдающие себя за блоги и индексируемые блогопоиском). Ну да, согласен, что это не самый наглядный пример, просто к слову пришлось. Наглядных много, ну вот например — http://blogs.yandex.ru/search.xml?text=&full=1 — по слову «пожарная». Да мало ли. Если в базе «поиска по блогам» из девятнадцати миллионов эккаунтов находится меньше миллиона собственно блогов, а сплоговые боты из этой базы генерируют более полумиллиона записей в сутки, то выдача релевантной быть не может.