Яндекс: найдутся все

В пятницу, 17 февраля, в Яндексе презентовали журналистам новый сервис компании. Он представляет собой "поиск людей", который будет существовать как отдельный сервис и как вертикаль для основного поиска. По сути он представляет собой метапоисковик по наиболее популярным социальным сетям Рунета. Выдача будет состоять из метапрофайлов людей, собранных из их аккаунтов в разных социальных сетях.

Поиск на субдомене people.yandex.ru станет первым шагом в реализации "глобальной программы социального поиска", которая запланирована Яндексом на 2012 год. В этом году у Яндекса будет много запусков, связанных с социальными сетями. В том числе, как сказал Илья Сегалович, "поиск, который знает про вас лично и помогает искать вам лично" - персонализированный на основе данных из соцсетей.

Яндекс не имеет и не планирует заводить собственной крупной социальной сети. Вместо этого он завёл дружественные отношения со всеми важными соцсетями Рунета и договорился о развитии совместных сервисов.

Найти контакт одноклассника в фейсбуке

Илья Сегалович рассказал, что примерно 4%-5% поисковых запросов - это запросы о людях. Из них около 2% - это не запросы о знаменитостях, литературных героях и т.п., а запросы с целью поиска "обычных людей". Традиционно поисковые системы отвечают на эти запросы, просто отыскивая в индексе страницы с упоминаниями этих людей. В выдаче оказываются социальные профили, блоги, ссылки на упоминания в СМИ... На такие запросы можно отвечать гораздо качественнее, если относиться к ним как к поиску объекта. У такого объекта есть определенные свойства - дата рождения, место жительства, работа, и т.д. Один и тот же объект может быть представлен несколькими профилями в социальных сетях.

С поиском "обычных людей" есть проблема: если спросить в Яндексе, например, "Сергей Иванов", то вся выдача будет занята знаменитыми Сергеями Ивановыми, а пользователь может искать своего школьного друга, который не имеет к ним отношения. В новом поиске по людям любая звезда будет занимать только одну строчку в выдаче, а остальные будут заняты разными Сергеями Ивановыми. Справа в интерфейсе поиска по людям есть поля для ввода дополнительных данных - возраста, места работы, и прочих - что поможет точнее и быстрее найти нужного пользователя, особенно если у него распространенная фамилия.

Присутствующим на презентации журналистам восприятие этой идеи далось не очень легко: тестируя новый сервис, гости вводили туда имена Путина, Медведева, Прохорова и выражали недовольство тем, что в выдаче не тот Медведев. Яндексоиды терпеливо объясняли, что так и должно быть. "Большой" Яндекс умеет понимать, чего хочет автор поискового запроса, и если у него спросить про Дмитрия Медведева, то он покажет президента.

Аскетизм во имя приватности

Яндекс получает из социальных сетей достаточно много данных о людях, и может их анализировать и извлекать немало информации о связях между пользователями. Но в компании сознательно ограничивают свои возможности принципом: заниматься только явными, публично продемонстированными пользователем связями. И не заниматься неявными связями, не пытаться "объединять профили на основании каких-то эвристик", чтобы не нарушить правила приватности.

В частности, поэтому сейчас профили в результатах поиска ранжируются по степени заполненности информации "о себе". Такие данные, как посещаемость, количество подписчиков, кто такие эти подписчики, Яндекс в первой версии алгоритма не использует - создатели сервиса "пока не понимают, насколько важно для пользователя сохранить такую информацию приватной". Такой принцип ранжирования удобен тем, что по наиболее заполненным профилям можно понять, тот ли это человек, который нужен, не заходя в социальную сеть - сразу в выдаче Яндекса.

Минусом ранжирования по заполненности данных является то, что наверх могут вылезти старые, заброшенные аккаунты. Но создатели вертикали видят в этом положительные стороны: поискав себя и обнаружив такой аккаунт, пользователь о нём вспомнит, и либо актуализирует, либо свяжет с новыми аккаунтами, либо удалит.

Принцип "опираться только на открытые данные" заставляет Яндекс относить к одному человеку только те его представительства в социальных сетях, которые он сам связал. Есть два способа связать аккаунты. Первый - поставить в них взаимные ссылки друг на друга. Второй вариант - "ссылки, когда из одного социального сервиса можно войти в другой, введя свой пароль". Наконец, в Яндекс.Паспорте есть раздел "социальные профили", где можно сообщить Яндексу о своих аккаунтах в разных социальных сетях.

Помимо забот о приватности, Яндекс увидел и другие причины требовать от пользователя сознательной связи аккаунтов. Во-первых, спамеры или просто "шутники" могут создать в одной из социальных сетей профайл с вашим именем, фото и другими данными, и написать там что-то в своих интересах. Такой профайл нельзя автоматически добавлять к уже имеющимся ссылкам на человека.

Во-вторых, некоторые люди ведут в Сети "двойную жизнь", и, связав их аккаунты автоматически, можно нечаяно показать "вторую жизнь" друзьям из "первой жизни".

Индексация, добровольная и принудительная

Яндекс уже имеет в своем распоряжении 250 млн. профайлов из социальных сетей. Он получает их двумя способами. От сервисов, с кем есть соответствующая договоренность, Яндекс получает специально сформированный фид. В число таких соцсетей не входят "Одноклассники", "Мой Мир@Mail.ru" и пока не входит "ВКонтакте", так как у них технические проблемы и они пока могут отдавать не всё, что нужно.

Второй способ - самостоятельная индексация Яндексом открытой информации в социальной сети.

Среди отдающих фид - ЖЖ, Facebook и Twitter. Последние две соцсети хранят настолько большой объем данных, что проиндексировать их для Яндекса стало бы неподъемной задачей. И Twitter, и Google+ из-за интереса к ним поисковых машин имеют возможность зарабатывать, отдавая им специальный фид, и стоят такие фиды достаточно дорого. Но с "Твиттером" Яндексу "удалось договориться", а с Google не удалось - "кроме того, у Google есть свои амбиции". Подробностей о договоренностях журналистам не сообщили.

Скорость обновления информации в поиске по людям зависит как раз от способа получения данных. Если соцсеть отдает их Яндексу сама, то изменения, внесенные в свои профайлы пользователями социальной сети, отразятся в поиске по людям в течение суток, "а может и быстрее". Если Яндекс самостоятельно индексирует, то данные обновятся, "когда робот дойдет". Это может занять и неделю.

Удалиться из результатов поиска нельзя - можно только пойти в конкретную соцсеть и там закрыть или отредактировать свой профайл. Яндекс старается не держать в кэше удаленную или изменившуюся информацию - это, конечно, пригодилось бы ищущим, но вступило бы в противоречия с правами и интересами владельцев информации.

В планах есть связь, но нет контактов

Журналистам позволили заглянуть в недалекое будущее people.yandex.ru. Может поменяться принцип ранжирования профилей в выдаче. Ранжирование результатов по заполненности профиля - это первая, экспериментальная версия. Разработчики пока не придумали хороших метрик, по которым можно мерять качество поиска людей.

Планируется верификация аккаунтов селебрити, интеграция с Пресс-портретами, сервисом Яндекс.Новостей.

Известно также, чего скорее всего не будет. Яндекс не планирует показывать контактную информацию пользователя и искать людей по контактам. Во-первых потому, что тот мог указать ее в соцсети непродуманно, не понимая, что "всем это видно". Во-вторых, людям свойственно писать в полях для контактной информации вообще всё, что угодно, вольный текст, и это сложно автоматически обработать и отличить от "полноценных" контактов.

Зато, если соцсети-партнеру это будет интересно, Яндекс сможет добавить в свои результаты поиска по людям кнопки для добавления в друзья и отправки сообщения найденному пользователю через конкретную соцсеть.

На данный момент принято решение не учитывать регион в поиске людей (искомый не обязан быть из одного региона с ищущим, мало ли, кого куда жизнь разбросала).

Новый сервис может повлиять на всю экосистему Рунета. Например, дать Яндексу информацию для размышления о сравнительном качестве социальных сетей: где больше заполненных профайлов, где больше разных людей и т.д. Журналисты поинтересовались, не упадет ли резко количество открытых профилей в социальных сетях, не испугаются ли люди своей видимости в поиске, но Илья Сегалович предположил, что пользователи этой видимости захотят и, наоборот, станут открывать профайлы.

People.yandex.ru возник в Яндексе как внутренний стартап, его сделали "люди, которым было больше всех надо" - они придумали идею и реализовали ее. Такой сервис особенно ценен для Рунета, в большинстве других стран он был бы лишним, потому что там "все сидят в Facebook", и поиска по Фейсбуку для обнаружения людей в Сети вполне достаточно.

Юрий Синодов, Людмила Кудрявцева

Комментарий представителя компании

  • Контекст комментария

    Елена Минц Mail.Ru Group

    Хотелось бы прояснить ситуацию о технической составляющей реализации поиска профилей пользователей в социальных сетях Одноклассники и Мой Мир@Mail.ru. В данной публикации наше внимание привлекла вот такая фраза: «От сервисов, с кем есть соответствующая договоренность, Яндекс получает специально сформированный фид. В число таких соцсетей не входят «Одноклассники», «Мой Мир@Mail.ru» и пока не входит «ВКонтакте», так как у них технические проблемы и они пока могут отдавать не всё, что нужно. » Мы попытались выяснить, какие же технические сложности у нас возникли в момент запуска поиска по соцсетям? И не нашли их. Вот комментарий руководителя сервиса «Поиск Людей» Александра Чубинского, полученный в ответ на наше письмо в Яндекс с просьбой прокомментировать приведенную выше фразу: «Между «Одноклассниками» и Яндексом не имеется каких-либо технических и/или организационных трудностей. На данный момент ведется работа по улучшению качества индексации профилей данной социальной сети. Что касается «Мой Мир@Mail.ru», то, насколько мне известно, на текущий момент времени данные по профилям этой социальной сети, нам не предоставляются. Но этот вопрос также не связан с техническими или организационными трудностями». Действительно, Мой Мир@Mail.ru пока не предоставляет информацию для индексации – так как в начале года мы решали другие, более приоритетные для нас на данный момент, задачи. Но в ближайшее время мы подготовим и предоставим необходимые данные для подключения сети Мой Мир@Mail.ru к поисковому сервису. При этом хочу подчеркнуть, что мы технически хорошо подготовились для передачи в Яндекс информации об Одноклассниках – и на данный момент все открытые профили успешно индексируются.

Лучшие комментарии

  • Контекст комментария

    Роман Иванов Яндекс, а также ljsear.ch по выходным

    Люда, тут дело такое: мало добавить профили на social.yandex.ru, нужно еще явно разрешить использовать информацию на поиске. Эта возможность появилась только сегодня. Любая частная информация из я.паспорта на поиске не использовалась и без явного разрешения пользователя использоваться не будет.

Добавить 41 комментарий

  • Ответить
    Альтер Эго

    Это что-то типа поиска по гугл плюс, который гугл недавно запустил и про который все до сих пор спорят хорош он или плох?

  • Ответить
    Альтер Эго

    А какая дополнительная польза по сравнению с вконтакте/одноклассники? А я был очень поражен когда моя мать (68 лет) сказала, что нашла многих своих однокурсников и одноклассников при помощи в контакте. Это люди, которые учились в школе в 50ые, в вузах в 60ые. «Современных» людей от тинейджеров одноклассников ребенка, своих одноклассников и однокурсников до сотрудников и друзей можно найти там же. Некоторые, более продвинутые прячутся на фейсбуке, хотя в большинстве случаев присутствуют и в контакте. Я не вижу дополнительной ценности от всеобщего поиска, вконтакте дает, наверное под 90 процентов полноты на людей возраста от 10 до 70 лет от тех которые присутствуют в сети. Одноклассники и фейсбук покрывают оставшихся. Сейчас человек старшего возраста впервые вышедший в интернет по звонку от своих одноклассников впервую очередь заходил на вконтакте до того, как узнал, что такое электронная почта и поисковик. Вконтакте это кнопка номер один.

  • Ответить
    Альтер Эго

    Путина, Медведева, Прохорова и выражали недовольство тем, что в выдаче не тот Медведев. Яндексоиды терпеливо объясняли, что так и должно быть. Почему так и должно быть? Скажем если я ищу «Медведева», известно, что я учился в школе 8, класс 7Б города Брянска, в котором учился Юра Медведев, то наиболее вероятная интерпретация для моего поиска — Юра Медведев. Если же про меня ничего не известно, то Юра Медведев из Брянска не более вероятен, чем Серега Медведев из Тюмени, а Дмитрий Медведев, президент более вероятен, чем любой другой Медведев — если я ищу персону, я не обязательно ищу кого-то из своего близкого круга, могу искать известного мне человека, из которых Дм Медведев, Кремль наиболее вероятен.

  • Ответить
    Альтер Эго

    Все эти баги пофиксировала бы простай байсевская модель. Если про юзера ничего не известно, есть стандарное распределение интерпретаций общее для всех юзеров Дм Медведев — первое место и пошло вниз. Допустим известно, что юзер из Брянска или что любит русскую рок музыку, это может поменять распределение. еще известно, что ему 29 лет, меняем распределение. Работает программистом, меняем распределение. Учился в 8 школе Брянска, потом ВМиК МГУ, меняем распределение.

  • Ответить

    Вы ошибаетесь. Это же не служба знакомств, а способ найти человека, от которого вам известны имя-фамилия. И которого, скорее всего, вы практически не знаете. Если я, например, где-то нашёл в интернете, что некто Юра Медведев четыре года назад что-то написал важное для меня, то когда я его ищу, мне глубоко плевать на то, что я юзер из Брянска и слушаю Наше радио. Для этих нужд правда лучше поискать во вконтакте, про которые вы написали.

  • Ответить

    Не думаю, что мечтой человека является доступность к вашей персоне столь лёгким путём. Учитывая же общую продвинутость пользователей в интернете, идеальный сервис для ленивых кредиторов, военкомов, родителей, «бывших», маньяков, насильников, грабитилей. (С каждого аккаунта по кусочку, вот и найдётся цельный портрет человека, осталось только иностранные социалки добавить и вуаля). Разумеется локальная версия ala’ https://people.mvd.ru предоставлена по месту востребования, со всеми третьеми-четвёртыми связями и прочими радостями? http://imageshack.us/photo/my-images/443/mvdpyf.jpg/ Hello, Russian Big Google.

  • Ответить

    «И не заниматься неявными связями, не пытаться «объединять профили на основании каких-то эвристик», чтобы не нарушить правила приватности.» Все заботы только о приватности, ага. «Яндекс старается не держать в кэше удаленную или изменившуюся информацию». Это типа как «старались, но опять не получилось?» :-) Чем-то это всё напоминает ЯППБ. «Внутренний» проект, отделение от основного поиска, попытка оценить качество информации исходя из места ее нахождения (антисемантический веб? :-)) Фейлы, видимо, будут те же — нестабильная непредсказуемая работа, показывание данных, которых какбы нет, а на самом деле есть (старые копии, приватные профили случайно отданные соц.сетями, синтетические данные «на основе эвристик»), спам, скам и т.п.

  • Ответить

    People are strange В комментариях к новости про то, что Apple разрешает любым приложениям выкачивать себе адресную книгу, и приложения с удовольствием этим пользуются, проходит митинг антипараноиков — «а вам что, жалко?», «а вам есть что скрывать?» В комментариях к новости про то, что Яндекс индексирует открытые профайлы из соцсетей — «аааа, идеальный сервис для маньяков и грабителей!»

  • Ответить

    Есть всё-таки небольшая разница: люди доверяют Apple (а какие у них варианты хахахаха), более-менее доверяют авторам приложений (за них поручилась Apple) и Яндексу тоже, наверное, доверяют — но не доверяют тем, кто будет ходить в открытый поиск Яндекса. Не говорю, что это правильно.

  • Ответить

    Поискала Людмилу Кудрявцеву, нашла себя на первых двух местах, правда, без аватарок http://gyazo.com/06618ae3111c9ce8536d9acfa4957410 Про проблему с аватарами на презентации говорили — дескать, аватарок много, яндексоидам было сложновато сразу все их выкачать, постепенно появятся. Непонятно только, почему меня две, вчера я Яндексу сдала все свои соцпрофайлы на social.yandex.ru. По логике, их должны были бы связать?

  • Ответить

    Людмила, А я яндекс не ругаю, просто отмечаю, что данный инструмент будет печален для среднестатистического пользователя интернета. Страшат только кулуарные варианты развития событий, так как взломать/подкупить/выбить можно всё и вся, в связи с чем наличие структурированных данных с взаимосвязями вызывает некий butthurt.

  • Ответить

    http://help.yandex.ru/peoplesearch ссылка на группировку профилей ведёт на 403404 Поиск по моему никнейму выдал на третьем месте аккаунт в твиттере, который я лично удалил в мае 2011 года. То есть, либо актуальность базы настолько низка, либо Твиттер выдаёт и такие вот удалённые профили. И это при том, что в нём нельзя аккаунт восстановить и даже зарегистрировать новый с таким же именем. С аккаунтом на Li.ru то же самое, он удалён года 2 назад, а может и раньше.

  • Ответить

    Teodorix, С актуальностью будет весело, особенно если страница была открыта «тогда, когда забрали информацию», сейчас закрыто или нет — не суть важно, данные собраны — данные выведены, что как-бы намекает. Счастливые обладатели яндекс.бара.

  • Ответить

    Goodoff, особенно весело то, что я сейчас зарегистрировал аккаунт в Твиттере со своим старым именем, несмотря на то, что в прошлом году в правилах там постулировалась невозможность занятия удалённого ника… :)

  • Ответить

    вроде, в Твиттере ник можно даже менять … так что если бы была «невозможность занятия удалённого ника» — так никакого «именного пространства» не хватило бы!

  • Ответить
    Роман Иванов Яндекс, а также ljsear.ch по выходным

    Люда, тут дело такое: мало добавить профили на social.yandex.ru, нужно еще явно разрешить использовать информацию на поиске. Эта возможность появилась только сегодня. Любая частная информация из я.паспорта на поиске не использовалась и без явного разрешения пользователя использоваться не будет.

  • Ответить
    Альтер Эго

    Да ну, скучный сервис — ну ищет по базам соцсетей, ну находит, ну ссылки на профили. А разорались, будто по меньшей мере новый радарикс или 123people.com выкатили. Впишите только там в синонимы Ленинград = Санкт-Петербург и Москва = default city. > «Илья Сегалович рассказал, что примерно 4%-5% поисковых запросов — это запросы о людях. Из них около 2%…» А переформулируйте, плз, на «примерно половина».

  • Ответить
    Альтер Эго

    имя-фамилию выдал трех совпадающих девушек и одного непонятного парня Имя-фамилию? То есть искали к примеру Татьяна Сергеева, а он вам парня выдал? Вот парень обрадуется когда узнает.

  • Ответить
    Альтер Эго

    Дарю Яндексу идея Реклама нового поиска на основе песни из фильма «С Легким Паром» Я спросил у Яндекса где моя любимая

  • Ответить

    1. Яндекс теперь ищет по социальным сетям. Нас как обычно забыли :) Вывод: не хотите светиться в поиске — регистрируйтесь во vkrugudruzei.ru :) 2. так вы говорите, что на одноклассниках есть удаление профилей? Ага, а что тогда с правого конца (http://img-fotki.yandex.ru/get/25/15986035.a/0_5fc80_8a28ff82_L.jpg) ? Ничего, что я давно удалился оттуда? Как меня тогда Яндекс там видит?

  • Ответить

    advertu >> Ничего, что я давно удалился оттуда? Как меня тогда Яндекс там видит? Как давно удалили профиль? Как вариант — не переиндексировали еще, если эта гипотеза верна, любопытна какова скорость индексации…

  • Ответить

    advertu, ну дык если по той ссылке пойти, ведь ничего не показывается, значит в Одноклассниках-то страницу удалили, а вот зачем это все хранит Яндекс…

  • Ответить

    advertu, ну, казалось бы, это легко проверяется — сделайте заброс как бы от бота и посмотите, что вам ответят Одноклассники

  • Ответить
    Альтер Эго

    Пишут, что для поиска будет использоватся весь социальный контент — что написал этот пользователь, его комментарии итд то есть это все как GooglePlus.

  • Ответить

    Нововведения Ларри Пейджа, конечно, раздражают. Но отличие Г+ и дикой зачистки-объединения аккаунтов в гугловских сервисах в том, что Гугл создает свою точку проверки пользователей, т.е. акк. в Г+ сам является вершиной социального графа, из которой дальше Гугл может переносить доверие по другим вершинам. Т.е. Гуглик собирает информацию, которую ему дали добровольно и которой он может доверять, и затем учитывает её в поиске (скажем, указанные в Г+ профили других сетей работают для отображения авторства в поиске). А Яндекс получает данные, которые неизвестно как и зачем собрали третьи стороны, смешивает их в бочке (намек на правило бочки меда) и выдает для поиска. Это, конечно, тоже интересно, и Яндекс даже может в будущем начать делать свой Г+ (спешное прикручивание social.yandex.ru), но пока это не одно и то же.

  • Ответить
    Елена Минц Mail.Ru Group

    Хотелось бы прояснить ситуацию о технической составляющей реализации поиска профилей пользователей в социальных сетях Одноклассники и Мой Мир@Mail.ru. В данной публикации наше внимание привлекла вот такая фраза: «От сервисов, с кем есть соответствующая договоренность, Яндекс получает специально сформированный фид. В число таких соцсетей не входят «Одноклассники», «Мой Мир@Mail.ru» и пока не входит «ВКонтакте», так как у них технические проблемы и они пока могут отдавать не всё, что нужно. » Мы попытались выяснить, какие же технические сложности у нас возникли в момент запуска поиска по соцсетям? И не нашли их. Вот комментарий руководителя сервиса «Поиск Людей» Александра Чубинского, полученный в ответ на наше письмо в Яндекс с просьбой прокомментировать приведенную выше фразу: «Между «Одноклассниками» и Яндексом не имеется каких-либо технических и/или организационных трудностей. На данный момент ведется работа по улучшению качества индексации профилей данной социальной сети. Что касается «Мой Мир@Mail.ru», то, насколько мне известно, на текущий момент времени данные по профилям этой социальной сети, нам не предоставляются. Но этот вопрос также не связан с техническими или организационными трудностями». Действительно, Мой Мир@Mail.ru пока не предоставляет информацию для индексации – так как в начале года мы решали другие, более приоритетные для нас на данный момент, задачи. Но в ближайшее время мы подготовим и предоставим необходимые данные для подключения сети Мой Мир@Mail.ru к поисковому сервису. При этом хочу подчеркнуть, что мы технически хорошо подготовились для передачи в Яндекс информации об Одноклассниках – и на данный момент все открытые профили успешно индексируются.

  • Ответить

    sokins: Мне кажется, ты неправильно распарсил предложение Правильное дерево такое: В число таких соцсетей не входят: [«Одноклассники»,] [«Мой Мир@Mail.ru»] [и пока не входит «ВКонтакте», так как у них технические проблемы и они пока могут отдавать не всё, что нужно. «] Про технические проблемы, похоже, к вам не относилось.

  • Ответить
    Альтер Эго

    Роман А как этот новый поиск будет монетизироваться? Если он станет популярным, то скорее всего одноклассники и прочие социальные сети будут соревноваться между собой и платить за рекламу, чтобы по запросу «Иван Петров» «Иван Петров на одноклассниках» был на первом месте в рекламном блоке, иначче юзер уйдет в другую сеть, а в социалке если они уходят, то надолго.

  • Ответить

    Sokins, действительно, ilyak прав и слова про технические проблемы относились ко ВКонтакте. Я специально переслушала всю более чем часовую диктофонную запись, там про фиды было сказано вообще так: «Мой Мир и Одноклассники, конечно, не отдают». Комментарий сотрудников Яндекса, который вы получили, никак не противоречит тому, что написали мы: Яндекс сам индексирует социальные сети, которые не отдают специально подготовленную информацию. Мы ничего не писали о том, есть ли у Яндекса технические трудности по индексации «Одноклассников».

  • Ответить
    Елена Минц Mail.Ru Group

    Людмила, хорошо, что прояснили, что вы имели в виду :) но вообще когда идет перечисление проектов через запятую, то создается полное ощущение, что «у них» — это значит «у всех».. Кстати, я далеко не одинока в такой трактовке этой фразы :)

  • Ответить

    advertu , а ты что ли первый раз дохлую ссылку на Яндексе увидел? скока раз было — в поисковой выдаче есть, а по ссылке — нет.. максимум — кэшиваронная версия самого же яндекса