Есть ли на «Яндексе» цензура?

Развитие событий: "Яндекс": Отсутствие Пескова по запросу "песков часы" - ошибка, будем исправлять (24 августа 2015)

Олегом Козыревым сегодня замечен интересный факт:

Найдите разницу в выдаче картинок по запросу "пора меняться" в Гугле и в Яндексе.

Или запрос "партия жуликов и воров плакат", сначала в Гугле, а потом в Яндексе.

Как это объяснить, кроме как цензурой Яндекса?


Комментарий Roem.ru: идея цензурировать поиск картинок, в отсутствие цензуры основного поиска может появляться лишь у не очень умных людей, извините. У нас уже предложили вариант, что в поиске картинок "Яндексу" не хватает свежести. Очень похоже на правду, попробуйте поискать фотографии по запросу "Землетрясение в Японии". Просто плохая выдача по таким запросам.

Добавить 40 комментариев

  • Ответить

    Ну да. Но «Яндекс» тут меж двух огней — или признаваться в цензуре или в лаже алгоритмов. Вдобавок, даже если признаешься в лаже алгоритмов, не факт, что тебе поверят — упоротые искатели цензуры всегда могут создать конспиративную теорию в духе «А Яндекс скрывает»

  • Ответить
    Альтер Эго

    думаю, система просто сбоит. вообще не находятся картинки с начала марта. например, по тому же землетрясению в Японии. или Яндекс это тоже «зацензурировал»?

  • Ответить
    Альтер Эго

    «Олегом Козыревом сегодня замечен интересный факт» Что? Там, если пройти по ссылке на его пост, то выяснится, что это не он заметил, а это перепечатка и указан «первоисточник». Прошу быть точнее в формулировках. А Синодову быть внимательнее.

  • Ответить

    2salam Баги есть во всех нетривиальных продуктах Яндекса. Баги есть во всех нетривиальных продуктах Эппла. Баги есть во всех нетривиальных продуктах Гугля. Баги есть во всех нетривиальных продуктах.

  • Ответить

    > Но «Яндекс» тут меж двух огней — или признаваться в цензуре или в лаже алгоритмов. Да нет тут никакой цензуры. :) Яндекс всегда очень медленно индексировал картинки, месяцами. Это не обязательно лажа алгоритмов, может просто железа не хватает. Маленький пример — в середине декабря я выложил биографии своих сотрудников, с фотографиями. Тексты проиндексировались через неделю, картинок нет до сих пор, т.е. больше 3-х месяцев. :)

  • Ответить

    Цензура не цензура, но что-то у Яндекса странное происходит. По запросу партия жуликов и воров сейчас четвертой строчкой идет запись ЖЖ: «Дожили! Вводится цензура в Рунете Или запрос «партия жуликов и воров плакат», сначала в Гугле, а потом в Яндексе. Красота, да? И контрольный в голову, «навальный»: в Гугле и в Яндексе. Тон новостей как-то отличается. Ау, Яндекс? Ждём ваши официальные комментарии. zhdanov-vaniok.livejournal.com › 548551.html 1 час назад» Чем, интересно, этот пост заслужил такое к себе внимание? исключительно свежестью, что ли?

  • Ответить
    Альтер Эго

    Так что не нравится, что на Яндексе цензура или что пост про цензуру вылез высоко? Вы уж определяйтесь. P.S. дураку Ибигдану не понравилось, что тон выдачи по запросу «навальный» в гугле и Яндекс разный. Того он в голову не берет, жалкий копиастер на IPO, что может ведь и Гугл подкручивать Навального, ведь куратор у них один и тот же — мадам Хиллари ‘Блоуджоб’ Клинтон. Нет ли цензуры в Гугле, стоило задаться вопросом, лемминги.

  • Ответить

    У частных компаний — может быть какая угодно фильтрация чего угодно. В выдачах, в картинках, в авторах, в создании сервисов о тех или иных событиях общественно-значимых или ничтожных событиях. Ведь все понимают (?), что нет никаких причин “требовать” от Нью-Йорк Таймс восхищения Рональдом Рейганом или критического неприятия каких-нибудь там Альбертов и Типпер Горов или Ху Цзиньтао (да живёт он до ста и ещё до ста лет). Или там — нет же повода “требовать” от компаний Игоря Станиславовича создания сервиса по учёту советских преступлений. С какой стати?! Это их, частных компаний, личное дело, что предпочитать или, как на этом заработать, если что. Однако. Есть нюанс. То что выглядит абсолютно добродетельно для частного бизнеса — Конституций РФ прямо запрещается Государству. Потому Яндекс, как компания где есть сомнительное участие Государства в виде “принципиально акции”, чисто в репутационных целях, должен на 10 голов быть круче того же самого Гугла. Если есть какое-то событие, что будет неминуемо трактовано, как крамольное — прямое сравнение Яндекса с Гуглом должно показывать, что в ком в ком, а в Яндексе — сомневаться не приходится. И цензуры в Яндексе нет. А если сомнения есть… И государство в Яндексе при этом участвует… И при этом алгоритмы медленные или их внедрение намеренно медленное или просто “никто не подумал” — это уже дело десятое. Складывается впечатление, что в компании с государственным участием прямо нарушается запрет государству иметь цензуру.

  • Ответить
    Альтер Эго

    Ну и покласть на него, на запрет. Крамольным для компании с государственным участием является помощь иностранным государствам в пропаганде и разрушении нашего государства. Так что крамолой является не наличие цензуры, а ее отсутствие. Особенно в новых мировых условиях, на фоне Арабской Дуги.

  • Ответить
    Альтер Эго

    Тем более, что частная компания Гугл, по совместительству являющаяся главным мировым поисковиком, явно работает на США, управляется в этих делах лично Хиллари Клинтон и бомбит всех вместе с Фейсбуком.

  • Ответить

    Да-да. И это известная большевицкая теория — что успешные частные компании должны работать на советскую власть или не существовать вообще, например китайским методом сетевой фаервола-цензуры. На фоне «Арабской Дуги» — приближенным к центрам советской власти в РФ думать о цензуре уже не приходится. На самом-то деле. Мысли о капиталах находящихся в странах золотого миллиарда — шкурно ближе. Как показывает практика — во всех африканско-арабских событиях, в разных странах, есть какой-то свой коленкор, тут так, а в другой стране чуть иначе, однако изъятие денег у тейпа тиранов — делается во всех случаях. Стоил тейп Мубарека x миллиардов, а тут рааааз… Стоил тейп Каддафи, а тут рааааз… Стоил тейп «Путиных», а тут…

  • Ответить
    Альтер Эго

    Дурак ты Ильин. И дрочишь на деньги, жалкий поклонник маммоны. Зачем бомбят Каддафи, если он вдруг уже ничего не стоит? А затем, что либо не было у него миллиардов на Западе, либо они ему до пелотки. У него есть страна и народ, который в него верит. Банда нанятых англичанами малахольных «повстанцев», позирующих для Бибиси с винтовками, ничего сделать не смогла. Если бы его бомбить не начали, он бы их к прошлой субботе сбросил в море. Да и сейчас сбросит, скорее всего, так что будет и наземная операция НАТО, скорее всего. Что касается известной большевистской теории про цензуру, то известны и большевистские достижения: огромное мирное многонациональное государство, всеобщее бесплатное образование, рост благосостояния, бесплатная медицина, общенародная собственность, уверенность в завтрашнем дне. Космос, наука, балет и влияние в мире — до кучи. И если бы этих пейдоразов, коротичей вроде тебя, не выпустили пейздетть в СМИ, не открыли кран воровства безнала и Горбачев не предал страну, чтобы «красиво тусоваться», ничего бы не случилось. Так что цензура — полезная вещь. Впрочем, в США это понимают и ее там тоже до хера. Империю иначе не построишь. Сколько там времени врали, что это Москва напала на Грузию? Сколько нам врут про 8000 невидимых погибших в Ливии? Вот то-то же. Почитай откровения про то, как в русском Нюсвике сидел штатовский куратор и велел обличать кровавую гебню и хвалить штатовскую внешнюю политику.

  • Ответить
    Альтер Эго

    Яндекс написал более расширенный комментарий http://yandex.livejournal.com/128100.html В последние дни в блогах обсуждается якобы имеющая место цензура в поиске по картинкам Яндекса. На самом деле у нас случился технический форс-мажор, болезнь роста. Увы, технический сбой в сервисах Яндекса интерпретируется как акт цензуры не в первый раз – сторонниками самых разных партий и точек зрения. Мы понимаем, что подозрения рождаются легко, а рассеиваются долго, поэтому считаем нужным подробно рассказать, что именно случилось. Мы запустили поиск по картинкам летом 2002 года, и тогда в нашей базе было примерно 12 миллионов изображений. К декабрю 2010 года их количество увеличилось до 1,8 миллиардов. При этом мы преимущественно индексировали картинки, размещенные на русскоязычных ресурсах, а в зарубежном интернете отбирали самые популярные картинки с самых интересных сайтов. Но для качественного ответа нашему пользователю нужно хорошо находить и индексировать картинки со всего мирового интернета. Поэтому в декабре прошлого года команда Яндекс.Картинок приступила к масштабной индексации картинок в мировом интернете. Она поставила перед собой цель увеличить количество зарубежных картинок в 5 раз, при этом не забывая о повышении качества сервиса. Это большая и интересная задача, которая требует архитектурных изменений в поиске по картинкам. Раньше в поиске по картинкам новая поисковая база выкладывалась раз в неделю. Чтобы выложить новую поисковую базу, недостаточно просто скачать картинки со всего интернета. Для них ещё нужно построить уменьшенные копии, найти и связать между собой дубликаты, удалить спам и т.д. Достаточно сказать, что размер нашего картиночного индекса сейчас — 3 терабайта, а уменьшенных копий картинок, которые тоже хранятся у нас на серверах, — 25 терабайт. К сожалению, при таком резком расширении индекса случилась болезнь роста. Создание уменьшенных копий, склейка дубликатов и прочие процессы формирования базы стали занимать существенно больше времени. Мы надеялись, что вот-вот справимся и выложим новую базу картинок, но недооценили масштаб происходящего. Мы слишком резко надавили на педаль газа, но забыли пристегнуть ремни. В результате накопился большой разрыв между датой, когда наш робот скачал картинку, и датой её появления в поиске. Сегодня этот разрыв составляет непростительные 6 недель. Самая свежая картинка в базе датируется 13 февраля, а сама база была выложена в поиск 10 марта. Соответственно, сейчас наши пользователи не могут найти изображения, которые появились в интернете позже 13 февраля. Например, изображения последствий землетрясения в Японии, которое произошло 11 марта, конкурс плакатов в блоге Алексея Навального или фото с гражданской войны в Ливии. Во вторник произойдет крупнейшее обновление зарубежной части базы в истории нашего картиночного сервиса. Её общий объем составит 3,9 млрд изображений, что более чем в 2 раза больше декабрьских показателей. В этой базе будут изображения, которые появились в интернете до 27 февраля, например, конкурс плакатов и начало войны в Ливии, а события в Японии – нет, потому что они случились в марте. Таким образом, отставание сократится с 6 недель до 4, что всё равно неприемлемо. Но уже через неделю, когда произойдет следующее увеличение базы, мы сократим этот разрыв до 2 недель. А скоро на Яндексе появится поиск по изображениям со всего интернета с полностью актуальной базой. Дмитрий Беляев, Руководитель мультимедийных поисков Яндекса P.S. Приношу извинения нашим пользователям за временные проблемы с качеством сервиса.

  • Ответить

    Да уж… То что индексация достаточно медленная, отстающая от роста сети — это ещё полдела. Но там, похоже, не продуманно ранжирование выдачи. Скорее всего выдача у разных пользователей — меняется. Но чисто в моём случае… Вот выдача Яндекса по не имеющему особой привязки к дате запросу «милиция»: http://clip2net.com/clip/m5451/130124…-288kb.jpg И мы видим тут картинки Абсолютно Случайно попадающие под критерий “милиция”. Если бы шла речь о поиске текстов (типа речь о большом «Яндексе») — это выдалось на запрос “милиция” лишь потому что слово совпало. А никакого ранжирования не ощущается (в большом поиске подобное было бы если бы на ввод “Путин” — выпадала не Википедия и все прочие 9 сильных позиций про Путина, а какие-нибудь случайные упоминания Путина в любом контексте в третьестепенных источниках) А вот выдача Google на «милицию»: http://clip2net.com/clip/m5451/130124…-440kb.jpg Картинки тут содержат наиболее известные изображения милиции. Типа акаба ломающего флаг (знаменитый случай из всех газет!). Или мент ломающий руку девушке — это популярный на всех сайтах милицейский “кейс”. Ну и вообще — общество же ценит фишки.нет. Выдача Гугла куда ближе к фишки.нет. У гугла есть фишка! А у Яндекса фишки нет. Он работает по алгоритмам без ранжирования и выдаёт случайные изображения. В цифрах это так: Первая картинка по запросу «милиция» в выдаче Яндекса, согласно TinEye http://www.tineye.com/search/bf11b99685d607834125370688b00fea8a68ca2c/ — встречается в сети только дважды. Первая картинка по запросу «милиция» в выдаче Google, согласно TinEye http://www.tineye.com/search/45e9b1cd4e106e62767a36b2ece53555496be7f7/ — встречается в сети 28 раз. То есть Google выдал более любимую народом картинку. А Яндекс более случайную.

  • Ответить
    Альтер Эго

    С удивлением обнаружил что мой пост о цензуре в Яндексе, недавно получил продолжение в блоге Игоря Бигдана и в официальных СМИ, а в частности на Эхе Москвы. Видимо за прошедшей месяц мой пост кочевал по блогам и обсуждался, только ссылок на меня там не ставили, окромя одного человека. fadeyev.blogspot.com

  • Ответить
    Альтер Эго

    > То есть Google выдал более любимую народом картинку. А Яндекс более случайную. Гугл выдал то, что раскручивается. гугл же пропагандонский проект.

  • Ответить

    Я вас умоляю. Про эту «цензуру» только на Роеме я помню несколько постов и ссылок: http://free-for-fun.livejournal.com/39223.html Еще заливали про то, что «Яндекс» плохо ищет по запросу «минск площадь 19.12.2010» — прошло время и опа — все нормально, все в индексе появилось Вообще, всем тем кто говорит что-то про цензуру на «Яндексе» хочется ответить просто — пока вы слышите Эхо Москвы, цензуры на «Яндексе» не будет. Это просто тупо допускать оппозиционное вещание и пытаться цензурировать какие-то сотни запросов.

  • Ответить

    via http://yandex.livejournal.com/128100….32#t146532 Всё оказывается проще. Просто в Яндексе нет ранжирования для картинок (а у Гугла есть). Рассмотрим ни разу не крамольный запрос. Например “Поцелуй”. Есть знаменитый кадр Альфреда Айзенштадта, он есть на куче картинок на любых сайтах сети. Потому естественно ожидать, что этот кадр попадёт в картиночную выдачу? (у Гугла так и происходит) У Яндекса — этого дико архивного кадра, дико растиражированного и не защищённого лицензией кадра — нет. У Яндекса совершенно случайные поцелуи, чисто по ключевикам, безрангово подобраны: http://yandex.livejournal.com/128100….32#t146532 *** Поцелуй в Яндексе http://clip2net.com/clip/m5451/1301257692-clip-291kb.jpg искомой картинки нет. Поцелуй в Google: http://clip2net.com/clip/m5451/1301257764-clip-358kb.jpg искомая картинка есть. *** При подобном технологическом подходе — какая-то продуманная цензура — не то что отсутствует — она просто не нужна.

  • Ответить

    2illyn «Поцелуй» — понятие достаточно общее, а именно эта конкретная фотография называется «Поцелуй моряка». И по соответствующему запросу она на первом месте в Яндексе. (Кстати, по запросу «поцелуй» она в Яндексе на 4-й странице выдачи, что вполне закономерно.)

  • Ответить

    Тут не принципиально, как именно звучит Авторское наименование. “Должна” срабатывать логика ранжирования, а не подбора картинки по точному соответствию тексту. Если сеть предпочитает называть “сайтом партии жуликов и воров” — сайт er.ru — то вне зависимости от того есть ли на сайте ЕдРа это словосочетание или нет — надо выводить сайт er.ru http://google.com/search?q=партия+жуликов+и+воров — типа того.

  • Ответить
    Альтер Эго

    И, конечно, Ильин знает, что предпочитает вся сеть. Умница Ильин! А как узнал-то? В Гугле посмотрел?

  • Ответить
    Александр Феоктистов Яндекс.Маркет

    Это просто тупо допускать оппозиционное вещание и пытаться цензурировать какие-то сотни запросов Оппозиционное вещание за государственные деньги, я бы даже сказал. Все же помнят, кому принадлежит Эхо?

  • Ответить
    Альтер Эго

    > Если сеть предпочитает называть “сайтом партии жуликов и воров” — сайт er.ru — то вне зависимости от того есть ли на сайте ЕдРа это словосочетание или нет — надо выводить сайт er.ru Ага. НАДО. Кому надо? То надо есть возвести гугл-бомбинг и яндекс-бомбинг в ранг правила, сделать встроенную поддержку в алгоритме? Навальный и его клика занимаются именно яндекс-бомбингом, а разные идиоты гневно требуют, чтобы Яндекс не боролся с бомбингом, а поддерживал его. Ну топырьте карман, щаз он вам поддержит.

  • Ответить
    Игорь Ашманов Сам себе компания

    Оппозиционное вещание за государственные деньги, я бы даже сказал. Все же помнят, кому принадлежит Эхо? Эхо получило грант ФСБ на свободу слова. Удобно, чо. Вероятно, другие «оппозиционеры» тоже хотели бы поучаствовать в тендерах на этот и следующий год.

  • Ответить

    А, ну так все понятно! Цензура на «Яндексе» это тонкая настройка параметров героев, как у персонажей Warcraft, какого-нибудь, чтобы играть с оппозицией было интереснее. Телеканалы тут метровая линейка, радио и газеты — миллиметровка, поиск картинок в «Яндексе», ну я не знаю… микрометр, наверное.

  • Ответить

    Что там “знать” то? Синонимы появляются и требуют учёта. Статистика запросов в Яндексе — отстаёт от гугловской и ещё не дошла до марта (он кончится на днях) потому есть известный пробел и в общем поиске.

  • Ответить
    Альтер Эго

    Если кто-то способен понимать шизофреническую речь Ильина, переведите для остальных его последний комментарий, пожалуйста.

  • Ответить

    Ага, уморительно: «Показов за последние 30 дней» — оказывается обозначает «декабрь», с «Показами по месяцам» завершёнными на отметке 01.12.2010 — 31.12.2010 для любого запроса. Зато цензура тут со всей очевидностью отсутствует. Она просто не нужна. Событие давно пройдёт и будет пережито, прежде чем появится в Яндексе. Ну по схеме как однажды стали не нужны блоги, что выдавали срез мнений трактуемый, как медийный проект.

  • Ответить
    Альтер Эго

    2illyn Идея о том, что wordstat и данные, используемые в поиске, одно и то же — вполне уморительная. Особенно если учесть, что wordstat — инструмент для _рекламодателя_, и там есть куча всяких ограничений и огрублений, которые должны, по идее, сделать его менее привлекательным для SEO, например. В Яндексе много команд, много проектов, куча всяких разных проблем почти в каждом из этого множества проектов, тонны дублирующегося функционала, сделанного чуть-чуть по разному в разных отделах для немножко разных целей и на разных технологиях (одних вебсерверов штуки три, да). И систем-программ сбора разных статистик про запросы — сильно больше одной. Факт в том, что wordstat вообще никак не влияет на поиск (ну кроме как через умы оптимизаторов).