«Яндекс» слил свой интранет в Google

Развитие событий: "Яндекс" думает о выходе в Турцию и Польшу (25 марта 2011)

У «Яндекса» произошла смешная (для неяндексоидов) утечка данных из внутренней Wiki, доступными оказались около двух сотен документов.

В частности, инструкция по общению в Интернетах:

Этот документ — внутренний, то есть находится под NDA. Как было сказано выше, любой письменный документ имеет ненулевую вероятность быть распространенным за пределы круга читателей, которому он был предназначен. Поэтому любой внутренний текст должен быть написан так, чтобы в случае утечки за него не было стыдно ни автору, ни компании.

На данный момент все зачищено и заблокировано.

Чем еще нас порадует «Яндекс» в ближайшее время?

Добавить 53 комментария

  • Ответить
    Альтер Эго

    Нечего там на викиликс выкладывать, там распилов нету Да и то, что попало в гугл — ничего интересного вообще, даже роадмап

  • Ответить

    Разнообразие + подсветка интентов Эксперимент на 4% Тестируем правило переранжирования Diversity, по части запросов добавляет в десятку результаты, максимизирующие wide pfound, и подсвечивает в найденных результатах пользовательские интенты. Метрики: abandonment, click_count, first_click_pos, long_dwelltime_rate Ожидания: на затронутых запросах abandonment падает, click_count растет, first_click_pos становится немного больше (чуть чаще кликают в середину и конец десятки), long_dwelltime_rate увеличивается Интересно, а где же широко рекламируемый Себрантом churn_rate?

  • Ответить

    Хочется оторвать у Zaycev иконку, и посмотреть как будут реагировать пользователи. Ожидаем рост CTR муз.источника. Возможно, рост доли длинных кликов у муз.источника. :-) Вот оно — лоббирование своих некачественных проектов и занижение качественных чужих :-)

  • Ответить
    Альтер Эго

    EXPERIMENTS-24 Closed Переранжирование авто-запросов [марка модель] kaaЭксперимент нацелен на разнообразие выдачи согласно поисковым прагматикам, указанных запросов. Подробнее тут: _http://wiki.yandex-team.ru/Auto/Pragmatics#markamodel-vprocesse Запросов в потоке (по последней оценке Андрея) — 0.87%. Нужно понять хватит ли нам 4% аудитории для проведения эксперимента. В эксперименте в первую очередь мы смотрим на пользовательские метрики (клики и т. п.). Оценку денег, наверное, стоит провести, ведь мы задвинем подальше автосалоны, поэтому может быть на них вырастут клики в директе.

  • Ответить
    Альтер Эго

    Яндексоиды из сортировочной говорят, что клики у них самый сильный сигнал. Интересно было найти потверждение во внутренней документации. СЕОшники, наверное, радуются.

  • Ответить
    dima5ty гасконец

    Яндексоиды из сортировочной говорят, что клики у них самый сильный сигнал. как то так и есть, клики по выдаче и Директу идут неотделимо :)

  • Ответить
    Альтер Эго

    как то так и есть, клики по выдаче и Директу идут неотделимо Это привело бы к падению качества поиска, а значит и привлекательности яндекса, А яндекс за краткосрочными прибылями не бегает Клики от директа на поиск не влияют, только клики на поисковой выдаче

  • Ответить
    Альтер Эго

    Ну меняли что-то и забыли файрвол включить. Чего тут действительно интересного? Обычный сисадминский про2.71б.

  • Ответить
    Альтер Эго

    >в яндексе не знают про robots.txt не стоило так явно показывать свою некомпетентность, дорого альтерега. роботс.txt не для защиты от индексирования

  • Ответить
    Альтер Эго

    Хорошо. Тогда так: в Яндексе не знают, что дизаллоу в роботс.тхт не защищает от индексирования. Они же честные роботы, а не как Гагл.

  • Ответить
    Альтер Эго

    > не стоило так явно показывать свою некомпетентность, дорого альтерега. юмор в том, что если бы на wiki.yandex-team.ru был robots.txt с Disallow /, этой новости бы не было. его не было, новость есть. Если бы сайт не был доступен снаружи. без авторизации новости тоже бы не было

  • Ответить
    jet

    Интересно, а нафига им вообще интранет на публичном домене. Сделали бы внутренний домен, который не резолвится через обычные DNS, что-нибудь типа wiki.yandex и подсеть c серыми ip 192.168.x.x И избежали бы в принципе подобных проблем.

  • Ответить
    Альтер Эго

    Смкшно говорили про машинное обучение, А тут полно вручную подкрученных функций «давайте по таким-то запросам будем двигать такие-то сайты» Какое тут обучение? Все подкручено вручную. Может и «матрикснет» никакого нет, и он придуман для отвода глаз?

  • Ответить
    Альтер Эго

    В принципе, не важно, получили ли алгоритм автоматически или подкрутили вручную Важно, что пользователям хорошо и удобно

  • Ответить

    О той части документов, которые еще есть в открытом доступе могу сказать следующее. % выдачи на которой ставятся эксперименты в основном совпадают с озвученными в кулуарах последнего Я.Субботника (в СПб). Есть довольно много деталей и жаргонных словечек, по которым можно судить о том, что этот документ написали сотрудники Яндекса непосредственно связанные с разработкой, причем сотрудников, писавших эти документы было достаточно много. Это не позволяет сделать вывод планировании или случайности «слива», скорее о том, что в документах содержатся следы достоверной информации о работе команды Яндекса. К сожалению, никакой ценной информации, которую нельзя было бы собрать из открытых источников, в документах нет. Жаль, что там не расписаны задачи и методы оценок экспериментов — то, что есть выглядит кустарно и несистемно, в большинстве случаев создается впечатление что статистика получается а-ля «средней температурой по больнице», в духе, а давайте отключим кондиционеры и тогда средняя температура наших больных понизится на %%1. Alter Ego: Я подозреваю, что алгоритмы машинного обучения используются для настройки весов таких параметров как «содержание ключевого слова в » и пр., их много и человеку их оптимальные значения не очевидны и не интересны (кроме сеошников). Другое дело, если выдача сегментирована по тематикам, тогда можно ставя вручную ряд экспериментов узнать статистические предпочтения пользователей. Это подход, в отличие от машинного обучения более гибок прозрачен, он может дать новые знания (понимание предпочтений), которые упустит машинное обучение.

  • Ответить

    Удивляет то, сколько желчи идёт в сторону Яндекса, хотя в документах нет чего-то позорного. Во-первых, было бы странно ожидать во внутренней переписке какого-то трепетного отношения к сайтам коммерческой тематики. Ну да, почему бы не задвигать, если это повысит разнообразие? СЕОшники же аж пищат от удовольствия, узнали наконец правду, что «10 из 10 сайтов автосалоны» — не очень разнообразная выдача. Давайте на минутку сравним с Мылом. Было бы странно, если бы в Мыле не говорили прямо «выжать из игрушки в два раза больше», а политически корректно думали о многоуважаемом пользователе и о том, как бы его не разорить лишний раз. Ну ведь ясно же, что чушь. Ну, а во-вторых, я вообще искренне убеждён, что такой слив давно пора было бы сделать самому Яндексу. Это как сиськи показать Волочковой. Да и странен сам слив: у Яндекса 100500 проектов, а вылезло 200 документов и все про поиск, и все про качество. Так что моя версия, что лектор специально ошибся, чтобы проверить насколько слушатели внимательны. :)

  • Ответить
    Альтер Эго

    Удивляет то, сколько желчи идёт в сторону Яндекса, хотя в документах нет чего-то позорного. Док, как считаете, это холевая или хенодезоксихолевая желчь?

  • Ответить

    Яндекс медленно жрет SEO. Вот и весь итог. На серчах развели полемику, уже не знают что высосать из этих текстов. Слив это был или не слив, лично мне плевать. В работе большие сайты, бюджет из SEO перетекает в Директ, только клики в клиентов не конвертятся. Выдачу колбасит, цена за посетителя растет каждый день. Лошить можно долго, только Яндекс делает большой бизнес, а мне смотреть на то как бабло уходит на Ipad`ы для новых сотрудников и «кукусики» для старых — тошно! Если всем на «рынке рунета» на раздадут акции после того как они отIPO`шатся, буду молиться чтобы великий Google съел их с потрохами.

  • Ответить

    Psycho, посмотрел на Ваш профиль. Задам Вам пару вопросов как профессионалу. 1. Если у Вас есть крупный клиент — как у него изменились пропорции бюджета контекстseo за последний год? 2. Как меняется объем вложений в контекст, при падении позиций сайта? 3. Как меняется количество (заказов-звонков-клиентов) если компенсировать падение посещаемости сайта с помощью Директа? 4. Как меняется цена «за голову»? Я на эти вопросы в своем посте ответил :) Возвращаясь к теме — Яндекс, прежде всего, коммерческий проект, его НЕ делали ребята-энтузиасты сидя за ноутами в гараже. Если бы кто-то слошил и случайно слил в сеть инфу, там был бы хоть кусочек полезных данных, а не словоблудие. С огромной долей вероятности, ребята зондируют сеть в поисках благодатной почвы для PR перед размещением акций. Если их никто не обсуждает — они просто подливают масла в огонь, чтобы ухватить тренд и понять о чем надо рассказать. «Утечки» данных — очень модный способ узнать мнение о себе и его скорректировать.

  • Ответить
    Альтер Эго

    Mista X, это не пиарская утечка, не в меру много интима (судя по всему вы не читали). Да и странный пиар удалять кеши и архивы отовсюду, куда руки дотянутся.

  • Ответить
    Альтер Эго

    яндексоиды активно пользуються мейл листами в 21 веке? о ужас) кто нить точно всю цепочку не туда пошлет :)

  • Ответить

    Миста X, я вкратце: у нас основная работа не на крупных, а на много мелких. А направление контекстной рекламы мы начали развивать относительно недавно. Да, в том числе в силу того, что требуется как минимум компенсировать увеличившиеся сроки продвижения. Но это нормально, рынок есть рынок. Насчёт утечки: не вижу в ней ничего «пиарного». Начнём с того, что «распиарил» её почему-то Гугл и закончим тем, что слив закрытых данных (пусть даже чисто номинальный) — явно не лучшая реклама проекта перед IPO (жаль, что выход на IPO ещё не состоялся, а то мы бы посмотрели на колебания стоимости акций в результате утечки).

  • Ответить
    Альтер Эго

    все что утекло — все для пиара. неужели яндекс не знает что для доступа к корпоративным ресурсам, закрытым извне необходим VPN, а вики в яндексе любит кукуц. надеюсь кукуца за слив вики уволили уже нафик.

  • Ответить
    Альтер Эго

    >для доступа к корпоративным ресурсам, закрытым извне необходим VPN ну так 3-го марта vpn гугльботу не нужен был чтобы их проиндексировать, значит тогда они еще не были закрыты.

  • Ответить
    Альтер Эго

    Интересно какая информация утекла не через кеш гугла. Кто-то на searchengines вроде хвастался гигабайтами награбленного.

  • Ответить
    Альтер Эго

    : Ну как мог «пиарно» утечь документ с заголовком «Календарь запусков — 2011»? а если типа период молчания, а пиариться надо, вот тебе и викиликс.

  • Ответить

    Я бы на их месте слил «Календарь запусков 2011 — 2020». Где на 2015 была бы продажа индусам поглощенного Google и покупка Microsoft в 2018. За эту неделю их PR отдел собрал столько инфы, что теперь они знают о чем и как надо писать на год вперед. Завтра Яндекс «стошнит» пресс-релизом или интервью в корпоративном бложике одного из отцов, где будет написано об увольнении виновника ужасной «утечки информации, повлекшей за собой распространение сведений способных нанести вред имиджу компании». Как обычно, во всем был виноват «Вася» — старший помощник младшего маус-клинера из доп.офиса в городе Конотоп.

  • Ответить
    Альтер Эго

    Нашли виновного, чтобы публично его осудить во внутренних списках рассылки? Кого-то уволили?