После объявленного 3 ноября во вторник закрытия рейтинга блогов Яндекса и открытия API (программных интерфейсов), в Рунете, как грибы после дождя, начали появлятся новые клоны ЯППБ. Примечательно, что ни один из них, не смог предложить ничего, более или менее оригинального и отличного от Яндекса.
Вот только некоторые из них:
* http://www.artlebedev.ru/tools/blogs/ - версия от скандально известной студии Артемия Лебедева
* http://whoyougle.ru/blogs/ - от Whoyougle (проект Антона Носика)
* http://top-50.ru/ - альтернативный вариант
Можно предположить, что со временем их станет только больше. Любоптно: появится ли хоть один, который сможет предложить пользователям что-нибудь интересное? Что думаете по этому поводу
Добавить 21 комментарий
Чтобы из рейтинга вышло что-то полезное, нужна не только математика с хабра, но и хотя бы минимальная автоматическая классификация текстов. Этого пока никто не сделал.
На какие категории будет классифицировать посты из блогов (в большинстве свое меньше 50 слов) Как классифицируете пост с текстом «посмотрите очень интересно видео милиционера, обращаюшегося к Путину » и ссылкой на ютуб?
Такой пост классифицируется именно по ссылке, тоже мне бином ньютона. Хуже, когда дублей ролика много.
и как вы его классифицируете по ссылке? «ссылка»?
Ссылка на один и тот же ролик.
Все эти рейтинги обречены быть всеобщим посмешищем ещё почище топа яндекса, потому что вообще неспособны бороться со спамблогами и накрутками. http://pe3yc.livejournal.com/913782.html
Резус Вы заклинились на своем мнение Рейтинг полезен Я хочу знать что нового и интересного, а круг друзей у меня узок Есть конкретные решаемые технические проблемы — спам и накрутка, а вы считаете, что эти проблемы не решаемы.
[URL=http://alltopnews.ru]alltopnews.ru[/URL] — вот хороший рейтинг с рубрикатором тем.
Резус а вв заметили, что новые популярные темы вроде этого миллиционера, что к Путина обращался очень широко распостраняются без всяких топов?
Странные вы. У непопулярного (не создающего трафика) рейтинга проблемы со спамом и накруткой — технические. А у популярного (создающего большой трафик) не технические, а настоящие. И популярный вынужден будет тратить в это место ненулевые ресурсы.
Яндекс мудр — вместо одного большого (или не очень, но потенциально большого) по трафику рейтинга, вызывающего споры о медийном влиянии, появилось много рейтингов поменьше, но в целом выводящих в топ то же самое (потому что рейтинг считался автоматически, а не составлялся вручную; разные веса и алгоритмы могут корректировать их, но не менять капитально). Теперь, недовольным блогами клименкам надо будет или наезжать сразу на 10 кукуцев. Ведь давить на Яндекс, чтобы он перестал выдавать сырые данные — уж точно было бы стремлением к цензуре.
Узок круг друзей? Ну что ж поделать, такая ваша судьба, стало быть. Никакой рейтинг вам тут не поможет. Проблемы спама и накрутки решаемы в ограниченном объеме, немалыми ресурсами и только в рамках поисковика. В рамках рейтинга они нерешаемы — в первую очередь (но не только) потому, что ни один рейтинг не станет тратить на такую борьбу достаточные ресурсы. Даже Яндекс, располагая немалыми ресурсами, не смог решить эту проблему. Тем более её не решат другие. Дело в том, что отсеять спаммеров, накрутчиков и прочих оптемезадоров можно только с помощью ручного или полуавтоматического (частично ручного) управления рейтингом. Полностью автоматизировать этот процесс пока невозможно (и думаю, что вряд ли будет возможно). Поэтому ручное управление в той или иной степени неизбежно будет сопутствовать всякому рейтингу. Ручное управление — это всегда возможность медийного влияния. И опыт показывает, что рано или поздно любая возможность такого рода — реализуется. Если рейтинг можно использовать в каких-то целях, он всегда будет использован, рано или поздно. И не виноват в этом Яндекс, он не может изменить базовые психосоциальные и поведенческие законы. Этот рейтинг — не вина Яндекса, а его беда. А остальные рейтинги будут ещё хуже Яндексового. Производная от провала — ещё более наглядный провал.
Столько альтерэг, замучаешься каждому отвечать. Сырые данные Яндекса плохи не тем, что они неоткорректированы по весам и алгоритмам. А тем, что они не отфильтрованы вообще. Это грязная, некачественная руда. И никто не сможет, не затратив значительных усилий, отделить породу от шлама. Поэтому накруток, спама и прочего гaмнa в новых рейтингах будет ещё больше, чем в яндексовом. В Яндексе хотя бы осознавали проблему и имели наработки по борьбе с ней, а новые властители рейтингов будут либо выдавать сырой говёный продукт, либо вручную ранжирование нарезать.
Вот ещё один взгляд на статистику во времени: tema — http://blometer.ru/?blogid=1344 drugoi — http://blometer.ru/?blogid=11759 dolboeb — http://blometer.ru/?blogid=1540
Прикольно что слово «d_o_l_b_o_e_b» без знаков нижнего подчеркивания экранируется. ;)
Я, честно говоря, не знаю, какие именно данные выдает сейчас Яндекс, но ведь может же среди прочих параметров выдавать коэффициент «спамоподобия» — т.е. давать не просто сырой набор данных, кто что где и как комментировал (т.е. копию блогов), а те уже обработанные данные, к которым остается применить алгоритм с весами, временем с момента написания и прочим (той формулой/функцией, о которой здесь когда-то шла речь).
В общем, рейтинг блогов повторяет путь от файлохранилищ к торрентам — многоголовую гидру сложнее и контролировать, и убить.
А где исходник рейтинга взять можно?
Исходников нет, есть API http://blogs.yandex.ru/faq/entriesapi
Прикольно, скоро будут готовые конструкторы рейтингов просить. Совсем обленились
Да хорошо бы если готовый конструктор, тогда у пользователей действительно будет выбор между рейтингами :))