Большее количество данных всегда побеждает более умные алгоритмы. И Гугл конечно здесь выигрывает. Фигню говорите. Как англоговорящий и пользователь англоязычного поиска, утверждаю: качество англоязычного поиска у Гугла последние пару лет скатилось в полное дерьмо. Конечно же, большее количество данных с лихвой компенсирует любые алгоритмические выкрутасы — говорю это как автор большого количества больших поисковиков :) Проще всего это продемонстрировать, сравнив районную библиотеку на общественных началах с Библиотекой Вернадского, Ленинкой или Библиотекой конгресса США: ну вот как бы эффективно Вы не искали, все равно не найдете в районной публикаций, к примеру, Ильи Сегаловича. А ткнув наугад в индекс на слово «Сегалович» в БКС, вы, вероятнее всего, найдете именно его статьи. Англоязычность же — не самый лучший аргумент в пользу качества поиска или его отсутствия, не правда ли? :)
Пуджранк был новой прорывной технологией. Вообще говоря, «алгоритм Ларри Пейджа» не был оригинальным. На семь, кажется, лет раньше был предложен оригинальный алгоритм для поиска в базах научных статей — кажется, для Р.Ж.Хим его впервые применили, хотя я могу и ошибаться. Речь шла о ранжировании научный статей на основании ссылок на них в литературных обзорах других статей. Пейдж лишь применил его к Web, что, конечно, немало.
…сидя на балконе наслаждаться закатом с бутылкой дорогого вискаря. Это что? Воплощение светлой мечты чернокожего подростка из Гарлема? Или трудного ребенка «с квАртала» где-то в Капотне? :) Тем более, что наслаждаться видом моря, получив в башку заряд некачественного крепкого алкоголя, весьма и весьма сложно. Хоть бы вино — там можно говорить о ценности и качестве :)
eremeev.ru, В индексе сейчас 86 млн. документов на русском язхыке, 48 млн. на украинском, 27 млн. на английском, полмиллиона остальных — всего около 165 миллионов уникальных документов, или около 220 миллионов страниц. Индексируются только сайты, административно (модератором) признанные информативными и «украинскими».
Игорь, а вы не в курсе случайно, meta.ua все еще на своем двигуне работает? Да. На своем. Сколько там машин сейчас? Игорь не знает :) Коваленко справляется один также? У Коваленко есть еще Данила, Доктор, Валера и Вовчик :)
Цифры очень интересные. Если посмотреть, то после распила 1.2 млрд. рублей это будет «студенческая» искалка: масштабирование системы, то есть возможность работать не на одной машине, отложена «на потом». Просто неприятно.
Дискуссии пользователя
Большее количество данных всегда побеждает более умные алгоритмы. И Гугл конечно здесь выигрывает. Фигню говорите. Как англоговорящий и пользователь англоязычного поиска, утверждаю: качество англоязычного поиска у Гугла последние пару лет скатилось в полное дерьмо. Конечно же, большее количество данных с лихвой компенсирует любые алгоритмические выкрутасы — говорю это как автор большого количества больших поисковиков :) Проще всего это продемонстрировать, сравнив районную библиотеку на общественных началах с Библиотекой Вернадского, Ленинкой или Библиотекой конгресса США: ну вот как бы эффективно Вы не искали, все равно не найдете в районной публикаций, к примеру, Ильи Сегаловича. А ткнув наугад в индекс на слово «Сегалович» в БКС, вы, вероятнее всего, найдете именно его статьи. Англоязычность же — не самый лучший аргумент в пользу качества поиска или его отсутствия, не правда ли? :)
Пуджранк был новой прорывной технологией. Вообще говоря, «алгоритм Ларри Пейджа» не был оригинальным. На семь, кажется, лет раньше был предложен оригинальный алгоритм для поиска в базах научных статей — кажется, для Р.Ж.Хим его впервые применили, хотя я могу и ошибаться. Речь шла о ранжировании научный статей на основании ссылок на них в литературных обзорах других статей. Пейдж лишь применил его к Web, что, конечно, немало.
…сидя на балконе наслаждаться закатом с бутылкой дорогого вискаря. Это что? Воплощение светлой мечты чернокожего подростка из Гарлема? Или трудного ребенка «с квАртала» где-то в Капотне? :) Тем более, что наслаждаться видом моря, получив в башку заряд некачественного крепкого алкоголя, весьма и весьма сложно. Хоть бы вино — там можно говорить о ценности и качестве :)
eremeev.ru, В индексе сейчас 86 млн. документов на русском язхыке, 48 млн. на украинском, 27 млн. на английском, полмиллиона остальных — всего около 165 миллионов уникальных документов, или около 220 миллионов страниц. Индексируются только сайты, административно (модератором) признанные информативными и «украинскими».
Игорь, а вы не в курсе случайно, meta.ua все еще на своем двигуне работает? Да. На своем. Сколько там машин сейчас? Игорь не знает :) Коваленко справляется один также? У Коваленко есть еще Данила, Доктор, Валера и Вовчик :)
Вообще говоря, пользоваться CVS — это НОРМАЛЬНО. А SVN — это для мальчиков-пэхапэшников. IMHO.
Цифры очень интересные. Если посмотреть, то после распила 1.2 млрд. рублей это будет «студенческая» искалка: масштабирование системы, то есть возможность работать не на одной машине, отложена «на потом». Просто неприятно.