Новый поисковик Blekko

Развитие событий: "Яндекс" списал $15M инвестиций в американский поисковик Blekko? (18 февраля 2015)

Сегодня открыли новый поисковик http://blekko.com. Основан на слештегах, что-то вроде тегов или ограничителей темы.

Добавить 28 комментариев

  • Ответить
    Игорь Ашманов Сам себе компания

    Ну, у меня сформированного мнения пока нет, я не понял пока, как будут работать эти слеш-теги. И не смог ничего внятного прочесть про то, откуда движок, сколько денег потратили и т.п. Вроде у них есть собственный большой индекс всего Интернета. Казалось бы. Вроде это не Бинг и не Гугл. Либо это чей-то ещё индекс, лицензированный. Если свой — денег нужно до черта. Десятки тысяч серверов как минимум. Если лицензированный, то это просто социальный поисковик, нашлёпка на чей-то индекс. Во Флексуме мы ниасилили сделать заранее большой индекс, что дорого и долго, а для каждого из 8000 существующих поисков сделали индивидуальную выкачку. Это хуже по скорости получения своего поиска, но лучше по настройкам. А большой индекс хуже тем, что автор поиска зависит от общего расписания и глубины выкачки. Нет сайта — значит, и не будет. Здесь, видимо, вы строите свой срез большого индекса с помощью слештегов. Этакий Твиттер поверх индекса. То есть поверх того, что выкачано. Но таких социальных поисковиков было много (например, Rollio поверх индекса Яхи, подбор и обмен запросов в Livesearch). Почему-то эти социальные поисковики не запускаются, точнее, не взлетают. А традиционные, централизованные поисковики сейчас тоже не взлетают — вон Cuil вообще умер. В общем, пока не понял. Может, если будет много тегов и они будут выдаваться в подсказке, будет проще подбирать запрос. Такая поисковая Википедия. А может, нет. Прикольно, что теги могут высекать не только темы, но и типы (форумы), да и вообще всё, что угодно. При этом часть типовых тегов заранее сделаны разработчиками (потому что иначе тег наподобие /blogs не поддержать). Впрочем, я давно уже Яндексу предлагал ввести формат операторов в виде префиксов типа «порно: ***», примерно с той же целью.

  • Ответить
    Игорь Ашманов Сам себе компания

    По-моему, у вас проблема с терминами. Это типичная генерация контента пользователями и обмен им, что в этом Блекко, что во Флексуме. Ну назовите это Веб 2.0. Мне как-то говорил один "гуру Рунета", только я забыл кто, что настоящая социальная сеть должна состоять из трёх вещей: а) выкладывать свои фотки, б) френдить, в) знакомиться. Да, в Блекко этого нет. А UGC — есть.

  • Ответить

    По-моему, «социальность» это взаимодействие, коллективное действование. Вот на narod.ru я создал хомячка, а мой сосед Вася может его посмотреть. Это разве социальность? Точно также на Флексуме я создал персональный поиск, Вася может его посмотреть, в смысле — запросы поисковые позадавать … Это не социальность. Вот Википедия — пример социального проекта: я написал, Вася исправил. Я должен с ним договориться, чтобы осталась формулировка, устраивающая обоих.

  • Ответить
    Игорь Ашманов Сам себе компания

    Вы не путайте формальную «социальность» и то, взлетело ли это взаимодействие. Во Флексуме можно взять соавторов и вместе делать поисковик. В Блекко можно вместе делать теги. В Лайвсёрче можно было вместе делать запросы и обмениваться ими. Проблема не в формальных основаниях отнести что-то к социальности, а в том, цепляет ли социальная фича аудиторию или нет.

  • Ответить

    2megapinion Социальный поиск такой социальный не потому что он идет к сообществу, а потому что он (типа) уходит от machine learning в ранжировании. Т.е это buzzword, журналисткая (для журналов) или стартаперская (для power point) адаптация чуть менее размытого термина social computing. Пока не будет killer app в этой сфере (т.е удачного примера рыночной адаптации определенных технологий) social search так и останется полем для экспериментов.

  • Ответить

    Он все время пытается уйти, но по пути генерирует столько данных, что периодически возвращается к ML. Вообще, про scoial search пока не понятно как предметно разговаривать — это сумма направлений исследований и экспериментов, а не некая утвердившаяся технология. Но тем не менее это новая скрипка в оркестре, на которой в подобных blekko проектах пытаются делать больший акцент чем в традиционных поисковых системах. Пока как-то не прет т.е очевидного для масс юзера выигрыша по сравнению с ML нет. Возможно это связано с тем что само понятие поиска трансформируется и размывается (с приходом social media), что ставит в шаткое положение крупные поисковые системы, а уж всякие мелкие проекты с тем же репертуаром и подавно.

  • Ответить
    Алексей Иванов ЗАО "Ашманов и парнеры"

    сей поисковик — такой же как cuil, quintura и имя им — легион. Поиск сам по себе — очевидно хуже гуглового, в такой ситуации никакие примочки в виде слештегов не помогут. Побултыхается и закроется.

  • Ответить

    Mahalo еще забыли. Он, в отличии от перечисленных, из социального поиска странсформировался в контент-ферму и спокойно себе конвертирует поисковый траф в клики адсенса и показы баннеров. Воистину, нет в силиконовой долине инноваций — одни бизнес-модели…

  • Ответить

    >Прикольно, что теги могут высекать не только темы, но и типы (форумы), да и вообще всё, что угодно. При этом часть типовых тегов заранее сделаны разработчиками (потому что иначе тег наподобие /blogs не поддержать). Да не особо прикольно, т.к. пока только заранее сделанные теги и интересны (может быть, кому-нибудь). Пользовательские теги работают криво-косо, вообще не понятно, зачем это все. Надеяться на то, что blekko по набору (ключи, список урлов) сможет сделать вменяемый фильтр на выдачу не стоит, он сейчас этого не может и не сможет никогда, походу. >сей поисковик — такой же как cuil, quintura и имя им — легион. Поиск сам по себе — очевидно хуже гуглового, в такой ситуации никакие примочки в виде слештегов не помогут. Побултыхается и закроется. Ну да. С таким подходом шансов у них нет.

  • Ответить
    kpblca Rambler

    > Если свой — денег нужно до черта. Десятки тысяч серверов как минимум. Ну что вы перебарщиваете — нолик уберите.

  • Ответить
    Игорь Ашманов Сам себе компания

    Ну что вы перебарщиваете — нолик уберите. Я вижу, мсье знаток. А сколько серверов у Гугла, по-вашему? И сколько у Яндекса, который работает практически только с Рунетом? Вы назовите цифры, а мы посмотрим, нужно нолик убирать или нет. Конечно, десятки тысяч серверов нужно, если у тебя есть посещаемость; если это для запуска, для показа 10 пользователям от инвестора, то можно и тысячами обойтись. на первые полгода.

  • Ответить
    kpblca Rambler

    Игорь, извините если резко. Да, мсье работал в поиске одной компании, в которой вы тоже работали, и как бы нахожусь в курсе серверных потребностей хранения индекса и ранжирования. Я считаю, что для запуска такого проекта достаточно тысяч серверов, а не десятков тысяч. Я имею в виду современные Сервера и NASы, разумеется, а не гуано 5-летней давности.

  • Ответить
    Игорь Ашманов Сам себе компания

    Для запуска-то да. А что вы будете делать, когда наберёте первые десять миллионов запросов в сутки? А когда вы захотите конкурировать с Яндексом или даже с Гуглом (а Блекко-то с Гуглом хочет, а у Гугла миллионы серверов и сотня дата-центров), то надо будет выдерживать сотни миллионов запросов в сутки. Вот здесь и потребуются десятки тысяч серверов. Я слышал истории про то, что изменение скорости выдачи результатов поиска с 2 секунд до 1 меняло рыночную долю на несколько процентов. Гугл не зря имеет такой фетиш «поиск выполнен за 0,04 секунды».

  • Ответить
    Анатолий Орлов AliExpress Россия, ex-Ozon.ru, ex-Яндекс

    Игорь, разница в том, что когда у тебя начинается большое количество запросов это значит, что поисковик у тебя летит. И любой инвестор с удовольствием даст тебе бабла на эти десятки тысяч серверов. А выкидывать тонну денег не зная полетит или не полетит(и думая что с вероятностью 99% не полетит) стремно как-то… kpЫса, а куда тебе для поисковика NAS?

  • Ответить

    Интернеты — это такой навороченный форекс-клуб. Типа сравнительно честный отъем бабла у балбесов. Даю рупь за сто, что инвестор у этого блекко — какой-нибудь гениальный сынок какого-нибудь сердобольного сенатора.

  • Ответить
    Игорь Ашманов Сам себе компания

    А выкидывать тонну денег не зная полетит или не полетит(и думая что с вероятностью 99% не полетит) стремно как-то… Да это всё очевидные соображения. Не вижу, зачем их обсуждать. Что касается «тонны денег». Это только звучит страшно. Одна бумажка в 100 долларов весит 1 грамм. 1 миллион долларов — 10 кг. Миллиард — 10 тонн. Таким образом, тонна денег — это всего лишь 100 миллионов долларов. Это и есть по порядку величины та сумма, которая нужна для запуска большого поисковика по всему Интернету. Ну, сначала можно потратить миллионов сорок, как на Cuil, а потом сотку таки выложить. Скажем, Powerset был за столько куплен Микрософтом. Вон даже на создание НПС столько хотели потратить. А уж Яндекс на развитие уже существующего поисковика тратит несколько тонн американских денег в год. И кстати, в купюрах по 5000 рублей выгоднее. Вес меньше в полтора раза.

  • Ответить
    kpblca Rambler

    Ого! Я не знал что у них такие аппетиты. Ну судя по текущему качеству поиска, Blekko до гугла еще очень далеко. Для того чтобы конкурировать с гуглом нужны: команда и ресурсы хотя бы вполовину гугловских, качество выдачи на очень высоком уровне (сейчас оно, мягко сказать, плохое), локализация поиска для десятка-двух языков и т.д. Игорь, вопрос весь в том, чтобы эти первые 10-ки миллионов запросов в сутки набрать и иметь растущий тренд на графике посетителей. Тогда уже можно и десятки тысяч серверов просить. Кстати, для 10 млн запросов в сутки тоже не нужно 10 тыс. серверов, думаю что достаточно будет около 3-4 тыс. Это я не с потолка, а серьезно и по своему опыту говорю. Просто (правда, без обид) вечно вы, бизнесмены, всё раздуваете. =) anatolix> а у вас все по нодам размазано? ну ладно индекс, а кеш?

  • Ответить
    kpblca Rambler

    Кстати, о том что 1млрд $ весят 10 тонн. Был в Древнем Египте такой иероглиф, обозначающий цифру в 10.000, рисовался он как человечек с поднятыми вверх руками, как бы в удивлении от такого огромного числа. Для десятков, сотен и тысяч тоже были свои иероглифы. Если ничего не путаю, этот значок также был синонимом "много". Потому что больше чем 10000, чисел египтяне не знали. 4 тысячи лет назад им больше не надо было, всё что надо было считать укладывалось в цифры < 10000.

  • Ответить

    to kpblca, >> обозначающий цифру в 10.000, Вы путаете с миллионом. >> рисовался он как человечек с поднятыми вверх руками как бы в удивлении от такого огромного числа Как бы он рисовался с ПРИПОДНЯТЫМИ разведенными в стороны руками — как рыбаки больших рыб показывают, тут также — удивлением и не пахнет. И не человек это был. >> Потому что больше чем 10000, чисел египтяне не знали Смотрим пункт первый. >> 4 тысячи лет назад им больше не надо было Оу, оу, оу…

  • Ответить

    >изменение скорости выдачи результатов поиска с 2 секунд до 1 меняло рыночную долю на несколько >процентов. http://live.visitmix.com/MIX10/Sessions/CL06 там говорят что на 7% падает поисковые kpi при задержке 1сек, на 14% при 2х сек. цифры условные, но лекция и сама по себе интерестная)