У "Яндекса" произошла смешная (для неяндексоидов) утечка данных из внутренней Wiki, доступными оказались около двух сотен документов.
В частности, инструкция по общению в Интернетах:
Этот документ – внутренний, то есть находится под NDA. Как было сказано выше, любой письменный документ имеет ненулевую вероятность быть распространенным за пределы круга читателей, которому он был предназначен. Поэтому любой внутренний текст должен быть написан так, чтобы в случае утечки за него не было стыдно ни автору, ни компании.
На данный момент все зачищено и заблокировано.
Чем еще нас порадует "Яндекс" в ближайшее время?
Добавить 53 комментария
Тем, что было написано в Roadmap на 2011 год
интересно, кто слил из подзамка?
это контролируемый слив, выложите на викиликс посмеяться =)
Нечего там на викиликс выкладывать, там распилов нету Да и то, что попало в гугл — ничего интересного вообще, даже роадмап
Разнообразие + подсветка интентов Эксперимент на 4% Тестируем правило переранжирования Diversity, по части запросов добавляет в десятку результаты, максимизирующие wide pfound, и подсвечивает в найденных результатах пользовательские интенты. Метрики: abandonment, click_count, first_click_pos, long_dwelltime_rate Ожидания: на затронутых запросах abandonment падает, click_count растет, first_click_pos становится немного больше (чуть чаще кликают в середину и конец десятки), long_dwelltime_rate увеличивается Интересно, а где же широко рекламируемый Себрантом churn_rate?
Хочется оторвать у Zaycev иконку, и посмотреть как будут реагировать пользователи. Ожидаем рост CTR муз.источника. Возможно, рост доли длинных кликов у муз.источника. :-) Вот оно — лоббирование своих некачественных проектов и занижение качественных чужих :-)
Последнее время Яндекс просто невероятен… Жги еще!!
EXPERIMENTS-24 Closed Переранжирование авто-запросов [марка модель] kaaЭксперимент нацелен на разнообразие выдачи согласно поисковым прагматикам, указанных запросов. Подробнее тут: _http://wiki.yandex-team.ru/Auto/Pragmatics#markamodel—vprocesse Запросов в потоке (по последней оценке Андрея) — 0.87%. Нужно понять хватит ли нам 4% аудитории для проведения эксперимента. В эксперименте в первую очередь мы смотрим на пользовательские метрики (клики и т.п.). Оценку денег, наверное, стоит провести, ведь мы задвинем подальше автосалоны, поэтому может быть на них вырастут клики в директе.
Яндексоиды из сортировочной говорят, что клики у них самый сильный сигнал. Интересно было найти потверждение во внутренней документации. СЕОшники, наверное, радуются.
Яндексоиды из сортировочной говорят, что клики у них самый сильный сигнал. как то так и есть, клики по выдаче и Директу идут неотделимо :)
как то так и есть, клики по выдаче и Директу идут неотделимо Это привело бы к падению качества поиска, а значит и привлекательности яндекса А яндекс за краткосрочными прибылями не бегает Клики от директа на поиск не влияют, только клики на поисковой выдаче
первый коммент от яндексоида, наконец то
Совершенно не понятно, каким образом произошла утечка. Вот это действительно интересно.
Ну меняли что-то и забыли файрвол включить. Чего тут действительно интересного ? Обычный сисадминский про2.71б.
> Совершенно не понятно, каким образом произошла утечка. в яндексе не знают про robots.txt
>в яндексе не знают про robots.txt не стоило так явно показывать свою некомпетентность, дорого альтерега. роботс.txt не для защиты от индексирования
Хорошо. Тогда так: в Яндексе не знают, что дизаллоу в роботс.тхт не защищает от индексирования. Они же честные роботы, а не как Гагл.
> не стоило так явно показывать свою некомпетентность, дорого альтерега. юмор в том, что если бы на wiki.yandex-team.ru был robots.txt с Disallow /, этой новости бы не было. его не было, новость есть. Если бы сайт не был доступен снаружи. без авторизации новости тоже бы не было
Интересно, а нафига им вообще интранет на публичном домене. Сделали бы внутренний домен, который не резолвится через обычные DNS, что-нибудь типа wiki.yandex и подсеть c серыми ip 192.168.x.x И избежали бы в принципе подобных проблем.
Вся инфа про эксперименты утекла — http://goo.gl/SDxRF (http://forum.searchengines.ru/showthread.php?t=610997&page=11)
Не понял А зачем они это сделали? С какой целью?
осмысленные страницы, которые успели сохранить http://mastertalk.ru/topic129660.html?pid=1074538
Смкшно говорили про машинное обучение А тут полно вручную подкрученных функций «давайте по таким-то запросам будем двигать такие-то сайты» Какое тут обучение? Все подкручено вручную. Может и «матрикснет» никакого нет, и он придуман для отвода глаз?
В принципе, не важно, получили ли алгоритм автоматически или подкрутили вручную Важно, что пользователям хорошо и удобно
О той части документов, которые еще есть в открытом доступе могу сказать следующее. % выдачи на которой ставятся эксперименты в основном совпадают с озвученными в кулуарах последнего Я.Субботника (в СПб). Есть довольно много деталей и жаргонных словечек, по которым можно судить о том, что этот документ написали сотрудники Яндекса непосредственно связанные с разработкой, причем сотрудников, писавших эти документы было достаточно много. Это не позволяет сделать вывод планировании или случайности «слива», скорее о том, что в документах содержатся следы достоверной информации о работе команды Яндекса. К сожалению, никакой ценной информации, которую нельзя было бы собрать из открытых источников, в документах нет. Жаль, что там не расписаны задачи и методы оценок экспериментов — то, что есть выглядит кустарно и несистемно, в большинстве случаев создается впечатление что статистика получается а-ля «средней температурой по больнице», в духе, а давайте отключим кондиционеры и тогда средняя температура наших больных понизится на %%1. Alter Ego: Я подозреваю, что алгоритмы машинного обучения используются для настройки весов таких параметров как «содержание ключевого слова в » и пр., их много и человеку их оптимальные значения не очевидны и не интересны (кроме сеошников). Другое дело, если выдача сегментирована по тематикам, тогда можно ставя вручную ряд экспериментов узнать статистические предпочтения пользователей. Это подход, в отличие от машинного обучения более гибок прозрачен, он может дать новые знания (понимание предпочтений), которые упустит машинное обучение.
Удивляет то, сколько желчи идёт в сторону Яндекса, хотя в документах нет чего-то позорного. Во-первых, было бы странно ожидать во внутренней переписке какого-то трепетного отношения к сайтам коммерческой тематики. Ну да, почему бы не задвигать, если это повысит разнообразие? СЕОшники же аж пищат от удовольствия, узнали наконец правду, что «10 из 10 сайтов автосалоны» — не очень разнообразная выдача. Давайте на минутку сравним с Мылом. Было бы странно, если бы в Мыле не говорили прямо «выжать из игрушки в два раза больше», а политически корректно думали о многоуважаемом пользователе и о том, как бы его не разорить лишний раз. Ну ведь ясно же, что чушь. Ну а во-вторых, я вообще искренне убеждён, что такой слив давно пора было бы сделать самому Яндексу. Это как сиськи показать Волочковой. Да и странен сам слив: у Яндекса 100500 проектов, а вылезло 200 документов и все про поиск, и все про качество. Так что моя версия, что лектор специально ошибся, чтобы проверить насколько слушатели внимательны. :)
> Важно, что пользователям хорошо и удобно Конечно. «Задвинем автосалоны» и пользователям будет удобней кликать по Директу.
Удивляет то, сколько желчи идёт в сторону Яндекса, хотя в документах нет чего-то позорного. Док, как считаете, это холевая или хенодезоксихолевая желчь?
Яндекс медленно жрет SEO. Вот и весь итог. На серчах развели полемику, уже не знают что высосать из этих текстов. Слив это был или не слив, лично мне плевать. В работе большие сайты, бюджет из SEO перетекает в Директ, только клики в клиентов не конвертятся. Выдачу колбасит, цена за посетителя растет каждый день. Лошить можно долго, только Яндекс делает большой бизнес, а мне смотреть на то как бабло уходит на Ipad`ы для новых сотрудников и «кукусики» для старых — тошно! Если всем на «рынке рунета» на раздадут акции после того как они отIPO`шатся, буду молиться чтобы великий Google съел их с потрохами.
Миста X, убейте себя — всё плохо и дальше будет только хуже.
Psycho, у кого как ;)
Ваш депрессивный пост навёл меня на мысль, что Вы в этом плане безнадёжны. Извините, если ошибался.
Psycho, посмотрел на Ваш профиль. Задам Вам пару вопросов как профессионалу. 1. Если у Вас есть крупный клиент — как у него изменились пропорции бюджета контекстseo за последний год? 2. Как меняется объем вложений в контекст, при падении позиций сайта? 3. Как меняется количество (заказов-звонков-клиентов) если компенсировать падение посещаемости сайта с помощью Директа? 4. Как меняется цена «за голову»? Я на эти вопросы в своем посте ответил :) Возвращаясь к теме — Яндекс, прежде всего, коммерческий проект, его НЕ делали ребята-энтузиасты сидя за ноутами в гараже. Если бы кто-то слошил и случайно слил в сеть инфу, там был бы хоть кусочек полезных данных, а не словоблудие. С огромной долей вероятности, ребята зондируют сеть в поисках благодатной почвы для PR перед размещением акций. Если их никто не обсуждает — они просто подливают масла в огонь, чтобы ухватить тренд и понять о чем надо рассказать. «Утечки» данных — очень модный способ узнать мнение о себе и его скорректировать.
Mista X, это не пиарская утечка, не в меру много интима (судя по всему вы не читали). Да и странный пиар удалять кеши и архивы отовсюду, куда руки дотянутся.
Призываю сотрудников Яндекса в комментарии к этому сообщению.
Ага, сотрудники Яндекса уже бегут стройными рядами комментировать это сообщение
не комментируют, но активно читают номер один обсуждение во внутренних мэйл листах
яндексоиды активно пользуються мейл листами в 21 веке? о ужас) кто нить точно всю цепочку не туда пошлет :)
«А у неё усики растут!», «А у него, вы только подумайте, старая Копейка!»
Миста X, я вкратце: у нас основная работа не на крупных, а на много мелких. А направление контекстной рекламы мы начали развивать относительно недавно. Да, в том числе в силу того, что требуется как минимум компенсировать увеличившиеся сроки продвижения. Но это нормально, рынок есть рынок. Насчёт утечки: не вижу в ней ничего «пиарного». Начнём с того, что «распиарил» её почему-то Гугл и закончим тем, что слив закрытых данных (пусть даже чисто номинальный) — явно не лучшая реклама проекта перед IPO (жаль, что выход на IPO ещё не состоялся, а то мы бы посмотрели на колебания стоимости акций в результате утечки).
Вы че, граждане? Ну как мог «пиарно» утечь документ с заголовком «Календарь запусков – 2011»?
все что утекло — все для пиара. неужели яндекс не знает что для доступа к корпоративным ресурсам, закрытым извне необходим VPN а вики в яндексе любит кукуц. надеюсь кукуца за слив вики уволили уже нафик.
>для доступа к корпоративным ресурсам, закрытым извне необходим VPN ну так 3-го марта vpn гугльботу не нужен был чтобы их проиндексировать, значит тогда они еще не были закрыты.
Интересно какая информация утекла не через кеш гугла. Кто-то на searchengines вроде хвастался гигабайтами награбленного.
:: Ну как мог «пиарно» утечь документ с заголовком «Календарь запусков – 2011»? а если типа период молчания, а пиариться надо, вот тебе и викиликс.
Я бы на их месте слил «Календарь запусков 2011 — 2020». Где на 2015 была бы продажа индусам поглощенного Google и покупка Microsoft в 2018. За эту неделю их PR отдел собрал столько инфы, что теперь они знают о чем и как надо писать на год вперед. Завтра Яндекс «стошнит» пресс-релизом или интервью в корпоративном бложике одного из отцов , где будет написано об увольнении виновника ужасной «утечки информации, повлекшей за собой распространение сведений способных нанести вред имиджу компании». Как обычно, во всем был виноват «Вася» — старший помощник младшего маус-клинера из доп.офиса в городе Конотоп.
Ну как мог «пиарно» утечь документ с заголовком «Календарь запусков – 2011»? Поделитесь для полноты коллекции, плиз :) charlielarshuh@yahoo.com
нету у них пока периода молчания.
ну есть, значить, период мычания.
Гулина или Плахова в личке спросите Или Орлова они словоохотливые
Теперь я понял, на викиликс тоже всё правда!
Нашли виновного, чтобы публично его осудить во внутренних списках рассылки? Кого-то уволили?
В курилке об него сигаретные «бычки» тушили