roem.ru

Пользовательское » Новый поисковик Blekko

Сегодня открыли новый поисковик http://blekko.com. Основан на слештегах, что-то вроде тегов или ограничителей темы.

Комментарии

Текст закрыт для комментирования
Интерестно узнать мнение Ашманова - скажем, в связи с флексумом, да и вообще.
Спасибо.
Игорь Ашманов Сам себе компания
Ну, у меня сформированного мнения пока нет, я не понял пока, как будут работать эти слеш-теги. И не смог ничего внятного прочесть про то, откуда движок, сколько денег потратили и т.п.

Вроде у них есть собственный большой индекс всего Интернета. Казалось бы. Вроде это не Бинг и не Гугл. Либо это чей-то ещё индекс, лицензированный.
Если свой - денег нужно до черта. Десятки тысяч серверов как минимум.
Если лицензированный, то это просто социальный поисковик, нашлёпка на чей-то индекс.

Во Флексуме мы ниасилили сделать заранее большой индекс, что дорого и долго, а для каждого из 8000 существующих поисков сделали индивидуальную выкачку. Это хуже по скорости получения своего поиска, но лучше по настройкам. А большой индекс хуже тем, что автор поиска зависит от общего расписания и глубины выкачки.
Нет сайта - значит, и не будет.

Здесь, видимо, вы строите свой срез большого индекса с помощью слештегов. Этакий Твиттер поверх индекса.
То есть поверх того, что выкачано. Но таких социальных поисковиков было много (например, Rollio поверх индекса Яхи, подбор и обмен запросов в Livesearch). Почему-то эти социальные поисковики не запускаются, точнее, не взлетают.
А традиционные, централизованные поисковики сейчас тоже не взлетают - вон Cuil вообще умер.

В общем, пока не понял. Может, если будет много тегов и они будут выдаваться в подсказке, будет проще подбирать запрос. Такая поисковая Википедия. А может, нет.

Прикольно, что теги могут высекать не только темы, но и типы (форумы), да и вообще всё, что угодно. При этом часть типовых тегов заранее сделаны разработчиками (потому что иначе тег наподобие /blogs не поддержать).

Впрочем, я давно уже Яндексу предлагал ввести формат операторов в виде префиксов типа "порно: ***", примерно с той же целью.
> Если ... , то это просто социальный поисковик ...

А в чём там социальность-то, извините?
Игорь Ашманов Сам себе компания
По-моему, у вас проблема с терминами.
Это типичная генерация контента пользователями и обмен им, что в этом Блекко, что во Флексуме. Ну назовите это Веб 2.0.

Мне как-то говорил один "гуру Рунета", только я забыл кто, что настоящая социальная сеть должна состоять из трёх вещей:
а) выкладывать свои фотки,
б) френдить,
в) знакомиться.

Да, в Блекко этого нет. А UGC - есть.

Комментарий Игорь Ашманов отредактирован Игорь Ашманов 03.11.2010 00:26:27

По-моему, "социальность" это взаимодействие, коллективное действование. Вот на narod.ru я создал хомячка, а мой сосед Вася может его посмотреть. Это разве социальность?

Точно также на Флексуме я создал персональный поиск, Вася может его посмотреть, в смысле - запросы поисковые позадавать ... Это не социальность.

Вот Википедия - пример социального проекта: я написал, Вася исправил. Я должен с ним договориться, чтобы осталась формулировка, устраивающая обоих.
Игорь Ашманов Сам себе компания
Вы не путайте формальную "социальность" и то, взлетело ли это взаимодействие.
Во Флексуме можно взять соавторов и вместе делать поисковик.
В Блекко можно вместе делать теги.
В Лайвсёрче можно было вместе делать запросы и обмениваться ими.
Проблема не в формальных основаниях отнести что-то к социальности, а в том, цепляет ли социальная фича аудиторию или нет.
2megapinion
Социальный поиск такой социальный не потому что он идет к сообществу, а потому что он (типа) уходит от machine learning в ранжировании. Т.е это buzzword, журналисткая (для журналов) или стартаперская (для power point) адаптация чуть менее размытого термина social computing. Пока не будет killer app в этой сфере (т.е удачного примера рыночной адаптации определенных технологий) social search так и останется полем для экспериментов.
Он все время пытается уйти, но по пути генерирует столько данных, что периодически возвращается к ML. Вообще, про scoial search пока не понятно как предметно разговаривать - это сумма направлений исследований и экспериментов, а не некая утвердившаяся технология. Но тем не менее это новая скрипка в оркестре, на которой в подобных blekko проектах пытаются делать больший акцент чем в традиционных поисковых системах. Пока как-то не прет т.е очевидного для масс юзера выигрыша по сравнению с ML нет. Возможно это связано с тем что само понятие поиска трансформируется и размывается (с приходом social media), что ставит в шаткое положение крупные поисковые системы, а уж всякие мелкие проекты с тем же репертуаром и подавно.
Алексей Иванов ЗАО "Ашманов и парнеры"
сей поисковик - такой же как cuil, quintura и имя им - легион. Поиск сам по себе - очевидно хуже гуглового, в такой ситуации никакие примочки в виде слештегов не помогут. Побултыхается и закроется.
Mahalo еще забыли. Он, в отличии от перечисленных, из социального поиска странсформировался в контент-ферму и спокойно себе конвертирует поисковый траф в клики адсенса и показы баннеров. Воистину, нет в силиконовой долине инноваций - одни бизнес-модели...
>Прикольно, что теги могут высекать не только темы, но и типы (форумы), да и вообще всё, что угодно. При этом часть типовых тегов заранее сделаны разработчиками (потому что иначе тег наподобие /blogs не поддержать).

Да не особо прикольно, т.к. пока только заранее сделанные теги и интересны (может быть, кому-нибудь). Пользовательские теги работают криво-косо, вообще не понятно, зачем это все. Надеяться на то, что blekko по набору (ключи, список урлов) сможет сделать вменяемый фильтр на выдачу не стоит, он сейчас этого не может и не сможет никогда, походу.

>сей поисковик - такой же как cuil, quintura и имя им - легион. Поиск сам по себе - очевидно хуже гуглового, в такой ситуации никакие примочки в виде слештегов не помогут. Побултыхается и закроется.
Ну да. С таким подходом шансов у них нет.
kpblca Rambler
> Если свой - денег нужно до черта. Десятки тысяч серверов как минимум.
Ну что вы перебарщиваете - нолик уберите.
Игорь Ашманов Сам себе компания

Ну что вы перебарщиваете - нолик уберите.


Я вижу, мсье знаток.
А сколько серверов у Гугла, по-вашему?
И сколько у Яндекса, который работает практически только с Рунетом?

Вы назовите цифры, а мы посмотрим, нужно нолик убирать или нет.

Конечно, десятки тысяч серверов нужно, если у тебя есть посещаемость; если это для запуска, для показа 10 пользователям от инвестора, то можно и тысячами обойтись. на первые полгода.
kpblca Rambler
Игорь, извините если резко. Да, мсье работал в поиске одной компании, в которой вы тоже работали, и как бы нахожусь в курсе серверных потребностей хранения индекса и ранжирования.

Я считаю, что для запуска такого проекта достаточно тысяч серверов, а не десятков тысяч. Я имею в виду современные Сервера и NASы, разумеется, а не гуано 5-летней давности.
Игорь Ашманов Сам себе компания
Для запуска-то да.

А что вы будете делать, когда наберёте первые десять миллионов запросов в сутки?
А когда вы захотите конкурировать с Яндексом или даже с Гуглом (а Блекко-то с Гуглом хочет, а у Гугла миллионы серверов и сотня дата-центров), то надо будет выдерживать сотни миллионов запросов в сутки.
Вот здесь и потребуются десятки тысяч серверов.

Я слышал истории про то, что изменение скорости выдачи результатов поиска с 2 секунд до 1 меняло рыночную долю на несколько процентов. Гугл не зря имеет такой фетиш "поиск выполнен за 0,04 секунды".
Игорь, разница в том, что когда у тебя начинается большое количество запросов это значит, что поисковик у тебя летит. И любой инвестор с удовольствием даст тебе бабла на эти десятки тысяч серверов. А выкидывать тонну денег не зная полетит или не полетит(и думая что с вероятностью 99% не полетит) стремно как-то...

kpЫса, а куда тебе для поисковика NAS?
Интернеты - это такой навороченный форекс-клуб. Типа сравнительно честный отъем бабла у балбесов. Даю рупь за сто, что инвестор у этого блекко - какой-нибудь гениальный сынок какого-нибудь сердобольного сенатора.
Игорь Ашманов Сам себе компания

А выкидывать тонну денег не зная полетит или не полетит(и думая что с вероятностью 99% не полетит) стремно как-то...


Да это всё очевидные соображения. Не вижу, зачем их обсуждать.

Что касается "тонны денег". Это только звучит страшно.
Одна бумажка в 100 долларов весит 1 грамм.
1 миллион долларов - 10 кг. Миллиард - 10 тонн.

Таким образом, тонна денег - это всего лишь 100 миллионов долларов. Это и есть по порядку величины та сумма, которая нужна для запуска большого поисковика по всему Интернету. Ну, сначала можно потратить миллионов сорок, как на Cuil, а потом сотку таки выложить. Скажем, Powerset был за столько куплен Микрософтом.

Вон даже на создание НПС столько хотели потратить. А уж Яндекс на развитие уже существующего поисковика тратит несколько тонн американских денег в год.

И кстати, в купюрах по 5000 рублей выгоднее. Вес меньше в полтора раза.
kpblca Rambler
Ого! Я не знал что у них такие аппетиты. Ну судя по текущему качеству поиска, Blekko до гугла еще очень далеко. Для того чтобы конкурировать с гуглом нужны: команда и ресурсы хотя бы вполовину гугловских, качество выдачи на очень высоком уровне (сейчас оно, мягко сказать, плохое), локализация поиска для десятка-двух языков и т.д.

Игорь, вопрос весь в том, чтобы эти первые 10-ки миллионов запросов в сутки набрать и иметь растущий тренд на графике посетителей. Тогда уже можно и десятки тысяч серверов просить. Кстати, для 10 млн запросов в сутки тоже не нужно 10 тыс. серверов, думаю что достаточно будет около 3-4 тыс. Это я не с потолка, а серьезно и по своему опыту говорю. Просто (правда, без обид) вечно вы, бизнесмены, всё раздуваете. =)

anatolix> а у вас все по нодам размазано? ну ладно индекс, а кеш?
kpblca Rambler
Кстати, о том что 1млрд $ весят 10 тонн. Был в Древнем Египте такой иероглиф, обозначающий цифру в 10.000, рисовался он как человечек с поднятыми вверх руками, как бы в удивлении от такого огромного числа. Для десятков, сотен и тысяч тоже были свои иероглифы. Если ничего не путаю, этот значок также был синонимом "много". Потому что больше чем 10000, чисел египтяне не знали. 4 тысячи лет назад им больше не надо было, всё что надо было считать укладывалось в цифры < 10000.

Комментарий kpblca отредактирован kpblca 10.11.2010 13:27:37

to kpblca,

>> обозначающий цифру в 10.000,

Вы путаете с миллионом.

>> рисовался он как человечек с поднятыми вверх руками как бы в удивлении от такого огромного числа

Как бы он рисовался с ПРИПОДНЯТЫМИ разведенными в стороны руками - как рыбаки больших рыб показывают, тут также - удивлением и не пахнет. И не человек это был.

>> Потому что больше чем 10000, чисел египтяне не знали

Смотрим пункт первый.

>> 4 тысячи лет назад им больше не надо было

Оу, оу, оу...

Комментарий Роман Королёв отредактирован Роман Королёв 10.11.2010 14:56:30

>изменение скорости выдачи результатов поиска с 2 секунд до 1 меняло рыночную долю на несколько >процентов.

http://live.visitmix.com/MIX10/Sessions/CL06
там говорят что на 7% падает поисковые kpi при задержке 1сек, на 14% при 2х сек.
цифры условные, но лекция и сама по себе интерестная)
Текст закрыт для комментирования

новости

инсайды, слухи, открытки