В начале следующей недели включим на постоянную работу. А в мобильной выдаче подмес поиска по контенту приложений, который мы получаем от Осмино, уже включён и работает.
Юрий, модерацию, конечно, усилим. Вообще, наши текущие планы по развитию загрузчика — включение туда антивирусной проверки (сейчас мы проверяем выборочно скачиваемое, хотим проверять всё).
Юрий, в таком виде заголовок ближе к истине, спасибо. Содержание статьи, впрочем, всё равно неверное: В описываемом случае это был новейший троян. Свежий, ещё не детектирующийся Антивирусом Касперского и встроенной защитой Windows. Не было там никаких троянов. Заголовок же я могу прокомментировать так: тулбар на упомянутом в статье на Хабре сайте действительно был, он туда попал через субпартнёра нашего партнёра, с этого сайта было зафиксировано несколько тысяч скачиваний в сутки на момент его отключения. Мы такое распространение (запугивание пользователя неверной информацией, запускание скачивания по любому действию пользователя) запрещаем, такие сайты от раздачи отстраняем, что с этим сайтом и произошло.
Вообще, это неправда. Прямо начиная с заголовка «Новый троян распространяют с валидной подписью Mail.Ru» — это неправда. Нет трояна, подписанного подписью Mail.Ru. Нет его распространения. Ничего этого нет.
Качество поиска для нас важно, потому мы его и растим. Но вот качество поиска по анализаторам АиП — это немного другое. Хорошо, когда мы чего-то сделали и это подтверждается сторонней, независимой от нас системой сравнения поисковиков. Но в конечном итоге мы пользуемся своими метриками качества и формулируем их так, как считаем нужным. Пример с подмесами он просто явный: подмесы должны быть на выдаче, но анализаторами они не меряются, что же теперь — их не показывать? Да и вообще — «сознательно ухудшаем», «пользователей не жалко» — вы довольно сильно преувеличиваете. Вы посмотрите на интегральные показатели качества по тем же анализаторам. Их там два, асессорский и общий по всем анализаторам. Разница между ними в том (и авторы отчёта как раз и пишут об этом), что анализаторы специально подбираются так, чтобы показать разницу между поисковиками. Ну, т.е., был анализатор навигационных запросов, по нему все поисковики хороши, значит надо идти дальше и создавать специфические анализаторы с более редкими запросами, на которых разница видна. Но насколько эти редкие ситуации важны — непонятно, поэтому общий анализатор не говорит ничего об абсолютных значениях. Он только показывает разницу, а в каком масштабе — неясно (он же ещё и меряет от самого плохих показателей поиска к самым хорошим). Асессорский же интгеральный показатель, наоборот, абсолютный. Есть набор запросов, он оценивается людьми, потом эти оценки как-то аггрегируются. И по нему видно, что разница между всеми поисковиками мала — 0.01, при том что у лидера 0,79. Ну вот и всё ухудшение: у Гугла 0,78 условных попугаев, у нашего гибрида — 0,77. Но зато мы, например, компенсируем это показом подмесов, которые тоже что-то добавляют к выдаче.
По анализаторам видно, что чистый гугл лучше чем гугл+мэйл (иногда заметно хуже). Решение о том, показать свой поиск или гугловый не обязательно принимается на основании качества поиска, как его меряют анализаторы. Например, мы показываем свой поиск тогда, когда хотим показать какой-нибудь подмес, например, картинки или видео — мы не можем изменять чужую выдачу, поэтому нужно показывать свою. А подмесы анализаторами не измеряются. Ну и другие подобные причины.
Процент запросов, обслуживаемый нашим поиском, мы действительно не раскрываем. Но к росту качества это отношения практически не имеет. В отчёте АиП приведены числа по росту гибридного поиска (мы + Гугл), т.е. такого, который видит конечный пользователь. И основные составляющие этого роста, отмеченные в отчёте (например, навигация или региональность) реализованы нами в нашем движке и рост там — за счёт наших разработок. Если вы в этом сомневаетесь, то вы можете посмотреть на качество именно нашего движка, он представлен в анализаторах под названием MailBeta. Это выдача с o.go.mail.ru, там только наш движок и Гугла нет — а рост качества есть.
Обсуждение хиреет, чтобы не терять драйва, добавлю ещё. Вот это место: Началось всё с традиционного вопроса анонимного пользователя к Mail.ru: следует читать немного иначе. Это не просто анонимный пользователь, это, судя по всему, ещё один распространитель какого-то своего тулбара. Почему так? Потому что пользователь с ником NFM есть на том же forum.searchengines.ru. В 2009-м году он отчитывался за программу nicetest, раздавал деньги «партнёрам»: http://forum.searchengines.ru/showthread.php?p=5490475#post5490475 В 2010-м году он уже хозяйничает в другой программе, nicegroups: http://forum.searchengines.ru/showthread.php?p=6149319#post6149319 А сейчас пользователь nicetest распространяет собственный тулбар: http://forum.searchengines.ru/showthread.php?t=658686 Ситуация, по-моему, сюрреалистическая, но про поиск я писать продолжу.
Вот я никакого тарифного плана не выбирал, ничего не делал. Этот модем есть. Только что вошёл в интернет через него, всё работает, по спидтесту 27мб/с на скачивание и 12 на закачивание. (у меня там, правда, немного денег есть на счету, совсем чуть-чуть)
Я вчера знакомому устанавливал uTorrent. Так инсталлятор uTorrent’а тоже предложил Яндекс-Бар поставить и сделать Яндекс поисковой системой по-умолчанию.
Что же им быстро-то не работать. Не пользуется ими никто. В этой статистике нет XML и JS экспорта. Но вы как-то скачете с одного на другое теперь. А вам эта конференция, организуемая Ашмановым, нужна? Чем плохо проведение отраслевой конференции? И зачем? Как обычно на всех конференциях: пообщаться.
Игорь, уровень ваших поисковых «технологий» легко оценить на примере флексума. По несколько десятков секунд на ответ это за пределами добра и зла. Я могу ответить про Флексум. _Все_ наши тематические поисковики работают быстро, а это, собственно и есть главный сервис, который предоставляет Флексум. Поиск поисков, действительно, притормаживает время от времени (хотя в последнее время всё-таки не десятки секунд, быстрее): чтобы его ускорить туда банально нужно поставить больше поисковых фронтендов. Или переделать логику самого поиска. Мы это сделаем, но пока что заняты крупными изменениями внутри проекта для тематических поисковиков (каталогом запросов и реферерированием поисковой выдачи). Просто у нас сейчас получили приоритеты работы для частных поисков, а не общего: его полнота из-за специфики наполнения и так оставляет желать лучшего, поэтому мы им особенно не занимаемся. Но вообще, вы, конечно, правы: после редизайна поиск поисков попал на видное место и его нужно ускорить. Ну, сделаем это, это не является какой-то серьёзной проблемой: если решена задача разделения индекса на части, то дальше нужная скорость может быть получена просто дроблением индекса на более мелкие части, чем раньше. Я же говорю, щеки бы не надували. Не надуваем.
Что касается счётчика Тор100, то это самый поразительный пример: там основной код (написанный Тутубалиным и Калининым) бинарно был ровно такой же до лета 2008 года. Всё-таки, так говорить немного некорректно. В Рамблере до 2008-го года TOP100, конечно, никто не занимался особенно, но некоторые изменения в рамках «тушения пожара» при его поломках всё-таки были сделаны: его перенесли на 64-х битную платформу, немного оптимизировали внутренние структуры данных, разнесли на три сервера (до того он работал на двух). Это немного, но, всё-таки, совсем в том же виде, что его оставили в 2001-м он, конечно же, дожить бы не смог, чуть-чуть его правили. Что не отменяет общего восхищения простотой и надёжностью архитектуры, которую придумал Тутубалин в 2000-м и которая позволила вот так проработать варезу 8 лет практически без присмотра. К весне 2008 счётчик наконец начал чихать и падать под нагрузкой, иногда лежал полночи, терял данные. Это да, тогда его пришлось немного чинить. А сейчас им в Рамблере активно занимаются, сильно переработали архитектуру и принялись наконец-то за идеологию (вовсю рекламируется nova.top100.rambler.ru, интересно что из этого получится в итоге)
Ашманов говорит про сложные решения, а вы про решения какой фильм смотреть и куда идти танцевать вечером. Да, там толпа может быть умнее индивидуума. Ну, Игорь писал вообще, про то что один человек всегда умнее толпы, я исключительно про этот тезис и написал. Но я вот тут подумал, про перекрёсток, то там ведь мнение толпы неизвестно. Никто же не интересовался её мнением, вероятно, если всех опросить (ну вот чтобы вместо починки светофора сотрудник ГАИ обошёл бы все машины и записал бы мнения водителей, а потом бы выбрал наиболее частое, а в случае очевидного клинча, когда каждый голосует сам за себя, устроил бы переголосование), то решение было бы в духе «пусть проедет первым вон тот лексус». Проблема с исполнением этого решения. Это я, понятно, теоретизирую. На практике я бы предпочёл, чтобы светофор работал. А какое бабло Яндекс платит приглашенным докладчикам? Я не из Яндекса, не знаю.
Ещё Гельвеций, кажется, писал в 18 веке, что толпа умных людей, собранных вместе, глупее каждого из из них в отдельности. Не так давно вышла популярная книжка, «Wisdom of Crowds (между прочим, она на Амазоне находится в списках «Customers Who Bought This Item Also Bought» для книг Гладуэла), в которой утверждается, что в некоторых случаях и при выполнении определённых условий толпа людей может оказаться умнее или прозорливее любого из них. Её сейчас часто цитируют авторы, занимающиеся анализом поведения большого количества людей, к примеру, в поисковой выдаче. Тот же Рикардо Баеса-Ятес, когда в Яндексе делал доклад Mining Web Queries, начал его именно с упоминания Wisdom of Crowds. Там основная идея, грубо говоря, в том, что если опросить случайных людей относительно какого-то вопроса (и не давать им особено думать над ним, воспользоваться первыми впечатлениями), то если они ничего в этом вопросе не понимают, их ответы будут случайными и, образно, усреднённый результат окажется «нулевым». Но если среди них будут попадаться люди, которые что-то в этом вопросе понимают, то они сместят результат в сторону правильного ответа. То же самое с поисковой выдачей, где для частотных запросов распределение кликов по ссылкам обычно имеет один и тот же вид и если для какого-то запроса наблюдается изменение этого распределения, то там, скорее всего, что-то не так. Но нерегулируемый перекрёсток, очевидно, не является примером мудрости толпы. Наверное, потому, что тут вопрос не столько в уме, а в централизованом управлении, иначе достаточно нескольких идиотов, чтобы создать затор. Так что с упрвлением, да, лучше чтобы был кто-то один за пультом светофора, чем демократичное голосование.
umkalive: Меня всегда учили — если чего чего не понимаешь — переспроси. А если понимаешь? Как проверить, понял верно, или нет? К примеру, преподаватели проверяют на экзамене и прочих контрольных мероприятиях, но там ведь условия: сессия и всё такое. И как их можно перепутать мне не приходит в голову. Пардон, поставил неправильный союз. Южной Корее и Колумбии. Предлагаю свести к одному. О пользе редиректа при смене почтового ящика, например. Давайте, будет чуть ближе к обсуждаемой теме.
umkalive: Аргументы я привел. Проблема в том, что Вы не умеете их прочитать. Это очень важный философско-практический вопрос: кто ответственен за понимание в диалоге? Говорящий, или слушающий? Т.е., если один сказал, а слушающий его не понял, то это слушающий должен переспросить или говорящий повторить свою мысль, переформулировать её чтобы слушающий таки понял? К примеру, я читал, будто в Южной Корее или Колумбии принято, что за понимание отвечает слушающий. А в США — говорящий. Таковы национальные различия. Соответственно американец, если увидит что его не поняли, будет добиваться своего, а кореец вздохнёт и ничего не будет делать, считая что его поняли, но не приняли во внимание. Боюсь, что мы опять здесь столкнулись лбами: лично я считаю, что всё прекрасно понял. Перечитайте пост, после которого вас стошнило, подумайте. Тошнило вас. Неудержимо рвало на Роем, почему-то с кучей опечаток и прочими признаками интоксикации организма. Если чего не понимаете, попросите — я поясню. Я считаю, что прекрасно всё понимаю, зачем мне вас о чём-то просить? Какие глубины мысли могут быть скрыты за фразой «И геморроем еще обзаведетесь»? Без двенадцати семь по Москве пипл как ветром сдуло. Да, вы правы. Пора прекращать с этим сидением на Роеме.
itman: Яховская почта выросла не на 22%, а где-то на 16%. Да, в ночи перепутал. Значит, прирост в абсолютных числах у Yahoo не в три, а всего-лишь в два раза больше, чем у GMail. А как только гугл скорефанится с каким-нибудь комкастом, то хомячки несомненно перейдут на более качественную почту. Всё может быть. Но в этой ситуации они перейдут (или не перейдут, а увеличится количество новых пользователей) не из-за качества, а из-за лучшего продвижения почты от Google. (кстати, а «хомячок» перестает быть хомячком, если он начнёт пользоваться GMail’ом?) Maxime: неудачей назвать Gmail можно только из очень черной зависти к Гуглу… При чём тут неудача? Тезис был в том, что GMail не является успехом. И что у него обычные показатели для почты одного из крупнейших порталов мира, не зависящие сильно от инновационности, качества и т.п. И это логично, судя по всему почта должна быть достаточно качественной, как говорится, «на уровне», дальше на распространение влияют другие характеристики.
Переход на личности был осусчествлен товарисчем. А-а-а, так вы обиделись. Не обижайтесь, лучше чуть подумайте. На личности я, конечно же, не переходил (да и не мог в принципе: ваша личность мне неизвестна), а указал на полное отсутствие аргументов в вашем комментарии от 17.08.2009 21:55:52. Собственно, это и есть «отвержение» по Беклемишеву, после чего обсуждать что-то становится бессмысленно, мы с вами очевидно будем говорить на разных языках. И это как раз видно по вашим дальнейшим постам. Что же касается почты, то на мой взгляд проблемы смены почтового ящика вообще не существует. «Продавщица из Пятёрочки» будет пользоваться той почтой, которую ей порекомендуют друзья, и никакой мотивации поменять почтовый ящик у неё не будет вплоть до тех пор, пока почта работает стабильно и нет больших провалов по качеству сервиса. Вот itman выше утверждал, что у Yahoo Mail такой провал есть (на его почте, его сообщениях), но приведённая выше статистика роста американских почтовых сервисов показывает, как я думаю, обратное: Yahoo Mail растёт, и растёт очень сильно, 22%-ный прирост 106-миллионной почты Yahoo раза в три больше в абсолютных числах 25%-ного прироста 37-миллионной почты GMail. Ну а если кого всё-таки останавливает смена почтового ящика, то сравнивать адрес бесплатной почты с номером телефона странно, сменить адрес почты проще. Во-первых, редирект конечно спасает (аргументов «против», напомню, вы не привели); упомянутая выше продавщица пятёрочки если ей вдруг почему-то приспичит, может это сделать бесплатно и в течение долгого времени спокойно всем своим друзьям сообщить новый адрес, указывать его везде в качестве обратного, писать почтовые сообщения только с нового ящика и т.п. Во-вторых, она может вообще не мучаться и просто забросить старый ящик (собственно, некоторые и с телефонными номерами так поступают). Раз она завела адрес на бесплатном сервисе, то, наверное, не очень его и ценила. Но, повторю, это всё надумано, потому что самое главное, на мой взгляд, в отсутствие мотивации у «простых смертных» по смене почтового ящика. Гики и прочие странные люди могут этим заниматься, бегать с одной бесплатной почты на другую, вопить в форумах о преимуществах одной почты над другой, но на основную часть пользователей они не смогут повлиять.
О, пир духа. Кроме того мне совсем непонятно нахрена нужен проект к которому себя относит товарисч. Ведь есть яндекс.хмл и иже с ним. То чем он с гордостью занимается, на мой взгляд, пустая трата спонсорских денех. И об этолм я прямо написал. Яндекс.XML — он у Яндекса. Флексум — у нас.
umkalive: Редирект не позволит вам поменять пощту. Вы, просто, обзаведетесь еще одним пощтовым ящиком. И геморроем еще обзаведетесь. Из заметок о женской логике Беклемешева: В женской логике каждое утверждение может быть не только опровергнуто, но и отвергнуто. Отвергая высказывание, вы признаете его бессмысленным и оставляете без внимания. Если вы отвергли последнее высказывание собеседницы, ваше предпоследнее утверждение остается без ответа и, таким образом, становится доказанным. Например, самые основательные соображения можно отвергнуть словами «Ну и что?» или «А больше ничего не смог придумать?».
itman: У меня, кстати, никаких пока ложных срабатываний не наблюдалось. А откуда вы это знаете? С публичными почтами вообще есть серьёзная проблема в их оценке, т.к. большую часть спама они в принципе пользователям не доставляют, а отвергают сразу, следовательно оценить количество ложных срабатываний можно только снизу. О том, что есть ложные срабатывания, отвергнутые почтой, вы можете узнать только по жалобам отправителей, но не всякий отправитель будет это делать. А яховская почта — отстой, с которого пользователи будут уходить на гмейл. Наконец-то, хоть кто-то нашёл в себе смелость и сказал ПРАВДУ. А то всё ложные срабатывания, антиспам, доли какие-то, операционные системы… голова кругом идёт. А тут всё просто: Yahoo — sucks, Google — rulez. Или вы это прикалывались так?
Оркут, оркут… Это, конечно, мои личные проблемы, но в моей голове Оркут связан с этим постом бывшего сотрудника Гугла: http://ivan-ghandhi.livejournal.com/948953.html : ну это гугл, там всякий сельский идиот считает себя умнее усех, т.к. он умеет на распределённой системе вычислять медиану Уж не знаю, какава там доля личной обиды и правды.
что за бред вы несёте? Мой бред поближе к реальности будет, чем ваш, как-никак я 6 лет занимался антиспамом. Вот все эти DNSBL и прочее — это первый этап проникновения антиспама в компанию. Потом начинается этап ложных срабатываний, сисадмин долго что-то там прикручивает, постоянно этим хвастается, но через пару лет выясняется что он тратит на это слишком много времени и купить нормальное решение становится дешевле. (Честно признаться, я думал что такое чудо природы, как сисадмин устанавливающий какой-нибудь SpamAssassin на корпоративную почту и сильно горядщийся этим, уже лет пять как не существует. Ан нет, они бессмертны.) ну и какова же разница между KAS/спамобороной и этим? неужели они настолько великолепны, что нужно отдавать огромные деньжищи? объясните её. «Огромные деньжищи» — о да. За те же 300 евро можно купить годовую лицензию на 50 ящиков, а при продлении — на 150. Это для компании с 50-150 ящиками эти 300 евро в год — огоромные деньжищи? Вы действительно понимаете, о чём пишете? А так, да, про Спамооборну говорить не буду, но KAS вполне себе великолепен. Ложных срабатываний у него очень мало при достойном уровне определения спама. Представьте себе, Virus Bulletin ему VBSpam Platinum выдал по результатам тестов: http://www.virusbtn.com/news/2009/07_06.xml когда случается ложное срабатывание — отправляю на спецадрес asspnotspam@mydomain — он отправляет в ящик получателя и у себя чото там перелопачивает, больше такие письма ложно не попадают в спам. Точно больше не попадают? Как проверяете? Как вообще обнаруживаете ложные срабатывания? Вот человек жалуется: http://www.mail-archive.com/assp-user@lists.sourceforge.net/msg13136.html the first user was trying to send some .gif-created postcards. I’ve told them not to send images through e-mail, just plain text but no one listens. И ответ: You can always whitelist the domain but you’ll always be chasing your tail on other domains that fall foul of Bomb checking in my experience. I always disable DoBombRe — there are always too many false positives for me. Т.е. такой современный SpamAssassin, хоть быстрее работает и удобнее ставится — и то хлеб.
vladon: бесплатно, надёжно, у нас работает (не поверите — на виртуалке с 256 мб памяти) уже два года и отлично фильтрует даже при отключенном байесе (учить неохота было в своё время). О, да. DNSBL, SPF, грейлистинг — что ещё нужно человеку, чтобы не принимать почту? Ведь главное — не нагрузить сервер! Впрочем, ещё нужен Байес. Куда же без него? Высокоинтеллектуальный фильтр настроится на вашу почту и будет её терять в самых неожиданных случаях, совершенно непредсказуемо. Вы совсем-совсем не понимаете разницы между KAS/Спамооборной и бесплатной штукой от малоизвестных авторов? Вот что вы делаете, когда в вашем антиспаме случается ложное срабатывание? PS. И вот что интересно. Единственный оригинальный метод в этой системе, Global Penalty Box, опять-таки платный: To use the global-PB you’ll need a subscription. The global-PB service will be charged per year. At this time the price will be between 240,00 and 300,00 Euro per year and client! Until 30.09.2008 the registration and usage of the global-PB service is free! Вот он, звериный оскал капитализма.
durov: Пользователям в описании приложения предлагалась ссылка: «необходим новый флеш-плеер, скачать здесь». С него пользователи переходили на наше предупреждение о небезопасной ссылке Да вы же все ссылки предваряете этим предупреждением, невзирая на их опасность. Такое предупреждение — всё равно что его отсутствие, может вызвать только раздражение. Вот, к примеру, если бы там была ссылка на настоящий адобовский плеер, то разве предупреждение об опасности не показалось бы? А тогда какой с него толк, если оно всегда одинаковое даже для вполне легальных ссылок?
Материал нужно признать «экстремистским» по суду, внести его в список, и только после этого — привлекать по 20.29. У вас есть сомнения что в случае обращения в суд материал будет признан экстремистским? Вот в списке, который привели, есть: 265. Видеоролик под названием «Казнь таджика и дага. 2007 НСПР (операция НСПР по аресту и казни двух колонистов из Дагестана и Таджикистана 2007 год)» (решение Майкопского городского суда Республики Адыгея от 27.05.2008); Эти ролики чем-то отличаются? На мой взгляд речь не о том, что нужно снимать по суду, а о том что и до суда нечего доводить. А по закону — состава преступления в ее действиях действительно нет, по-моему, это очевидно. Мне неочевидно, поясните. Очевидно другое, что никто не будет заморачиваться с обращением в суд, признанием роликов экстремисткими и т.п.
studiomade: И попытались бы бороться за свои жизни. И что бы они предприняли? PS. Меня не то чтобы интересует ответ, но этот пассаж демонстрирует особенную глубину вашей мысли.
Andorro: Пока эти материалы выбираются по понятным и прозрачным криетриям (количество ссылок, активность комментаторов и т.п.) — это не цензура. А эти критерии не работают, потому что всегда найдутся те, кто захочет их «проспамить» и гарантированно попасть наверх простого рейтинга. И спам здесь может быть как автоматический, так и социальный. Все эти желтушные приёмы в виде ужасных видероликов — тоже приём повышения «простых и прозрачных» показателей своих записей в блогах. Автоматический спам Яндексом точно режется. А почему социальный спам вдруг стал лучше? Ну и ещё про прозрачность. Вот описание устройства рейтинга популярных записей: Сводный рейтинг популярных записей рассчитывается на основании данных за последние 24 часа о количестве ссылок и комментариев на запись, а также её посещаемости. Топ-5 списка популярных записей отображается при раскрытии сводного рейтинга на главной странице Поиска по блогам. К этим записям применяются понижающие коэффициенты за каждый час пребывания в топ-5. Это позволяет сделать сводный рейтинг динамичным и актуальным. Где здесь прозрачность и понятность? Как учитываются три разных параметра? Что такое «посещаемость»? Яндекс честно признаётся, что «Данные о посещаемости собраны из различных источников и являются приблизительными», это хорошо, но не имеет никакого отношения к прозрачности. И что такое понижающие коэффициенты и как они были подобраны? Так что цель этого рейтинга — сделать его «динамичным и актуальным», а не прозрачным и понятным. А вот если к выбору самых резонансных тем дня в блогосфере подключится ещё и неавнодушная общественность, то ценность ЯППБ как информационной площадки для меня существенно упадёт. Я думаю, что вам будет совершенно без разницы и если Яндекс что-то поменяет, вы этого не заметите. А главное, это невыгоджно самому Яндексу: такая инициатива создаст благоприятную среду для конкурентов на ниве обзора блогосферы. Да где они, эти конкуренты? Вы путаете: поиск Яндекса по блогам имеет ценность прежде всего потому что это проект Яндекса. Это Яндекс даёт траффик блогам, а не наоборот (и если будет подмешивать выдачу поиска по блогам в основной поиск, то даст ещё больше траффика). Именно поэтому авторы пытаются проникнуть в топ записей блогосферы. Так что если Яндекс будет менять правила рейтингования то авторы будут пытаться пробить их, а не удовлетворятся первым местом в каком-нибудь доморощенном рейтинге без траффика. Только я бы переформулировал: я против ограничений на распространение информации. Но да, я также против убийств, смертной казни, воровства, изнасилований и т.п. Не вижу противоречия в своей позиции: «кто предупреждён — тот вооружён», сокрытие же информации делает людей беззащитнее перед. Во многих странах действует запрет на публикацию требований террористов, киднепперов и прочих экстремистов. Как вы думаете, почему? Кроме того, существуют не очень большие группы людей, которые производят массу различных эпатажных информационных поводов и если их оценивать по простым и прозрачным критериям, то они забьют всё. С этим тоже нужно бороться при подаче информации конечным пользовтелям. И опять, есть лимит на распространение информации: нельзя вставить больше заметок в газету, а в рейтинг из 30 записей 31-я уже не влезет. Так что нужно выбирать, каким образом будет составлена газета или рейтинг и это не имеет никакого отношения к свободе распространения информации.
Andorro: Где я сказал «всё»? Я вижу тридцать заголовков постов в сводке ЯППБ, и выбираю, какие из них мне интересны, а какие нет. И уверен, что могу справиться с этим без помощи цензоров. Замечательно, т.е. вы смотрите только 30 заголовков постов, а не все. И что? При чём тут вообще тогда ваша возможность отобрать «интересное»? Вы пользуетесь тем, что для вас отобрал сервис Яндекс-Блогов, если бы он работал иначе, вы бы этого, скорее всего, и не заметили, так как «интересные» посты из такого громадного объёма можно выбирать по самым разным критериям. Более того, для вас было бы лучше, если бы он работал «чище», потому что тогда интересных постов (для вас) в его списке было бы больше. Как вообще можно говорить о цензуре при выборе 30 материалов на голову сервиса! Ведь тогда сам факт отбора туда материалов уже можно считать цензурой. По-моему, совершенно очевидно, что если есть выбор из сотен тысяч записей и есть популярный сервис ранжирования этих записей, то важным становится в каком порядке и как этот сервис будет обеспечивать доступ к материалам. Надо же, убирание дерьма с главной страницы, оказывается теперь цензура. Тогда чем не цензура ранжирование в поиске или борьба со спамом? А контекстная реклама, это же ведь вообще жуть. На козырных местах, за деньги, показывается чёрт знает что… Вы слишком много внимания уделяете голосам в своей голове, а не словам собеседника. В вашем исходном комментарии после слов «я пойду даже дальше» содержался чистый незамутнённый бред, никакого отношения к моим словам и моему мнению не имеющий. Ах, бред. Вот и хорошо. На самом деле я хотел узнать, насколько вы последовательны в своём стремлении к свободе и узнал: совершенно не последовательны. Получается, что вы считаете правильным чтобы закон защищал вас в тех случаях когда вы действительно можете оказаться в опасности, а вот в интернете, где ролик убийства других людей вам никакой непосредственной угрозы не представляет, вы закон отвергаете, считая что такому шибко умному и свободному индивидууму как вы, он тут ни к чему. То есть, такое мировосприятие, кажется будто всё изображенное на экране монитора нереально и происходит где-то очень-очень далеко и к вам отношения не имеет, тем более вы туда не полезли же смотреть, а значит тем более всё хорошо.
Неверно. Можно показывать всё, а я сам решу, что смотреть. Это сильный, мужской ответ. И что, вы действительно всё просматриваете и решаете что смотреть, а что нет? Ну вот сегодня вы просмотрели все записи в блогах, чтобы принять это мужское решение, или как? Идите-идите. Ну, то есть, по существу вам возразить нечего. Как нынче говорят, «слив засчитан».
Andorro: Я этот пост не стал смотреть… Всё что вы не смотрите можно показывать, верно? Детскую порнографию там, сцены убийств и изнасилований? Это ведь всё мелочи, а вот цензура — это да. Это такое страшное слово! Это так ужасно! Просто всё внутри переворачивается, как подумаешь, на что способна цензура! Я даже дальше пойду. Надо вообще весь УК выкинуть. Потому что здоровому человеку такое не нужно. Он сам способен решить, что смотреть, а что — нет. Здоровому человеку УК не нужен. Он сам способен решить, что ему можно делать, а что — нет. А когда на дороге повстречаются два здоровых человека, то более здоровый, очевидно, может больше менее здорового.
zotov: С год назад они уже переставали работать на очень долгий срок (с апреля по октябрь 2008), yozheck: Имеет место быть обычный сбой работы сервиса по техническим причинам (железо, увы, выходит из строя- жарко). Всё просто: Спамтест теперь зимний сервис! И действительно: зачем вам в такую жару почта?
представитель нюсмайкера беспонтновый Это не представитель, это сотрудник, как его правильно определил Синодов. И повёл он себя точно так же, как и остальные сотрудники, у которых я поинтересовался судьбой Спамтеста и показал, в частности, это тред: «ну что же это они вместо того, чтобы в техподдержку обратиться, сразу пидарасами обзываются?» А как вообще её можно найти, эту техподдержку, из текущего содержания сайта, на который редиректит spamtest.ru, непонятно.
Вы, Saxon, всё-таки действительно как-то превратно понимаете события. Да, конечно, всё крутится вокруг Seemore, но, тем не менее: Гиперновости не были связаны с Seemore никоим образом, это было скрещение идей обменной сети Новотеки с Гиперпоиском. Относитесь к этому как хотите. LinkedWords, конечно, вещь. Там есть поиск? Что там можно найти? Гиперпоиск предоставляет полнотекстовый регулярно обновляемый поисковый сервис, с учётом разделов, сортировками по дате и релевантности и т.д. В дополнение к этому можно установить автоматическую разметку страниц. При чём тут LinkedWords? PS. И что, действительно на сайте Икеи можно было зайти, сделать говорящего человечка и поставить к себе на сайт?
Саксон, Гипепоиск ( http://hypersearch.novoteka.ru ) появился в 2006-м году, как его можно было скопировать у Seemore, запущенным в 2008-м? Это поиск для СМИ, установлен на Известиях, Регнуме, Спорт-Экспрессе и т.п., позволяет, в частности, разметить страницу терминами из словаря и найти свои статьи по связанным с этими терминами запросам. Затем были выпущены Гиперновости, которые от Гиперпоиска отличались тем, что поиск производился не только по одному сайту, а по нескольким, и была приделана система учёта кликов.
о какой-такой тематике тут говорится? Там вообще все зависит от конкретного запроса Вот как раз тематика, порождённая запросом. Или, вернее, документами, найденными по запросу.
Можно ли с уверенностью утверждать. что у них ПР не тематический? Нет; более того, очевидно что там не одна метрика, а комбинация многих, с весами. И простой PR (вернее, какая-то «мера общей авторитетности») тоже есть, потому что если бы его не было, то вряд ли бы на странице про Русский Апач имелись бы ссылки «пилы и шиномонтажное оборудование». Они бы тогда были бы неэффективными. Ну и банить за такие ссылки тоже не имело бы большого смысла. И я вообще не про Яндекс и Google, а про HITS и PR, которые, в отличие от реальных алгоритмов Яндекса и Google, опубликованы.
Я не хотел ничего писать в этой теме, но раз тут уже дошло до сотни комментариев и PageRank’а, то, наверное, уже можно. Отличие HITS от PageRank кардинальное. PR расстанавливает авторитетность документам вне зависимости от тематики, за счёт чего, к примеру, какой-нибудь top100.rambler.ru может запросто стать ответом на все вопросы (потому что ссылок на него очень много). HITS же работает, фактически, только с однотематическими страницами. То есть, если под сутью понимать, что и там и там анализируется ссылочный граф, то да, суть не меняется. Но смысл этих алгоритмов разный, кроме того, они не являются взаимоисключающими. Вообще, если предположить гипотетическую ситуацию, что PR или его аналоги вдруг перестали бы использоваться поисковыми системами, а использовался бы только HITS, то покупка ссылок не имела бы смысла: однотематические сайты ставить ссылки на конкурентов скорее всего не стали бы, а ссылки из других тематик не работали бы. Однако как-то расставить авторитетность страницам перед выполнением запроса всё равно нужно, а здесь PR и его аналоги не особенно хуже других автоматических способов рейтингования.
Вы крайности предполагаете, да к тому же такие крайности… А вы — высокопарные банальности («24 часа думать на 24 месяца вперёд»), да ещё и внутренне противоречащие самим себе (это я про длительность планирования и изменяемость отрасли) А, ну конечно! Нужно найти в десятый раз нового человека, верить в волшебство, он придет в ту же структуру и все волшебным образом изменит своей волей. Нужно: — найти правильного, заинтересованного в результате человека. — дать ему полномочия и взвалить ответственность. А он уж сам разберётся, причём самым материальным образом.
Но не в таком динамичной отрасли. Здесь действительно 24 часа в сутки надо думать на 24 месяца вперед, и делать это должен КАЖДЫЙ, понимая, что от него зависит конкретное. Скажите, а зачем думать на 24 месяца вперёд, если отрасль — такая вся из себя динамичная? Толку же ведь никакого? И как вы будете КАЖДОГО контроллировать? Очень всё неустойчиво получается, если хотя бы один отлынивает (может и не со зла, а по болезни), то всё пропало. Так что здесь дело не совсем в людях, а в архитектуре процессов как таковых. Да. Нужно, всё-таки, кровати подвигать. Ещё не все варианты расстановки перепробовали.
Дискуссии пользователя
В начале следующей недели включим на постоянную работу. А в мобильной выдаче подмес поиска по контенту приложений, который мы получаем от Осмино, уже включён и работает.
Юрий, модерацию, конечно, усилим. Вообще, наши текущие планы по развитию загрузчика — включение туда антивирусной проверки (сейчас мы проверяем выборочно скачиваемое, хотим проверять всё).
Юрий, в таком виде заголовок ближе к истине, спасибо. Содержание статьи, впрочем, всё равно неверное: В описываемом случае это был новейший троян. Свежий, ещё не детектирующийся Антивирусом Касперского и встроенной защитой Windows. Не было там никаких троянов. Заголовок же я могу прокомментировать так: тулбар на упомянутом в статье на Хабре сайте действительно был, он туда попал через субпартнёра нашего партнёра, с этого сайта было зафиксировано несколько тысяч скачиваний в сутки на момент его отключения. Мы такое распространение (запугивание пользователя неверной информацией, запускание скачивания по любому действию пользователя) запрещаем, такие сайты от раздачи отстраняем, что с этим сайтом и произошло.
Вообще, это неправда. Прямо начиная с заголовка «Новый троян распространяют с валидной подписью Mail.Ru» — это неправда. Нет трояна, подписанного подписью Mail.Ru. Нет его распространения. Ничего этого нет.
Качество поиска для нас важно, потому мы его и растим. Но вот качество поиска по анализаторам АиП — это немного другое. Хорошо, когда мы чего-то сделали и это подтверждается сторонней, независимой от нас системой сравнения поисковиков. Но в конечном итоге мы пользуемся своими метриками качества и формулируем их так, как считаем нужным. Пример с подмесами он просто явный: подмесы должны быть на выдаче, но анализаторами они не меряются, что же теперь — их не показывать? Да и вообще — «сознательно ухудшаем», «пользователей не жалко» — вы довольно сильно преувеличиваете. Вы посмотрите на интегральные показатели качества по тем же анализаторам. Их там два, асессорский и общий по всем анализаторам. Разница между ними в том (и авторы отчёта как раз и пишут об этом), что анализаторы специально подбираются так, чтобы показать разницу между поисковиками. Ну, т.е., был анализатор навигационных запросов, по нему все поисковики хороши, значит надо идти дальше и создавать специфические анализаторы с более редкими запросами, на которых разница видна. Но насколько эти редкие ситуации важны — непонятно, поэтому общий анализатор не говорит ничего об абсолютных значениях. Он только показывает разницу, а в каком масштабе — неясно (он же ещё и меряет от самого плохих показателей поиска к самым хорошим). Асессорский же интгеральный показатель, наоборот, абсолютный. Есть набор запросов, он оценивается людьми, потом эти оценки как-то аггрегируются. И по нему видно, что разница между всеми поисковиками мала — 0.01, при том что у лидера 0,79. Ну вот и всё ухудшение: у Гугла 0,78 условных попугаев, у нашего гибрида — 0,77. Но зато мы, например, компенсируем это показом подмесов, которые тоже что-то добавляют к выдаче.
По анализаторам видно, что чистый гугл лучше чем гугл+мэйл (иногда заметно хуже). Решение о том, показать свой поиск или гугловый не обязательно принимается на основании качества поиска, как его меряют анализаторы. Например, мы показываем свой поиск тогда, когда хотим показать какой-нибудь подмес, например, картинки или видео — мы не можем изменять чужую выдачу, поэтому нужно показывать свою. А подмесы анализаторами не измеряются. Ну и другие подобные причины.
Процент запросов, обслуживаемый нашим поиском, мы действительно не раскрываем. Но к росту качества это отношения практически не имеет. В отчёте АиП приведены числа по росту гибридного поиска (мы + Гугл), т.е. такого, который видит конечный пользователь. И основные составляющие этого роста, отмеченные в отчёте (например, навигация или региональность) реализованы нами в нашем движке и рост там — за счёт наших разработок. Если вы в этом сомневаетесь, то вы можете посмотреть на качество именно нашего движка, он представлен в анализаторах под названием MailBeta. Это выдача с o.go.mail.ru, там только наш движок и Гугла нет — а рост качества есть.
Обсуждение хиреет, чтобы не терять драйва, добавлю ещё. Вот это место: Началось всё с традиционного вопроса анонимного пользователя к Mail.ru: следует читать немного иначе. Это не просто анонимный пользователь, это, судя по всему, ещё один распространитель какого-то своего тулбара. Почему так? Потому что пользователь с ником NFM есть на том же forum.searchengines.ru. В 2009-м году он отчитывался за программу nicetest, раздавал деньги «партнёрам»: http://forum.searchengines.ru/showthread.php?p=5490475#post5490475 В 2010-м году он уже хозяйничает в другой программе, nicegroups: http://forum.searchengines.ru/showthread.php?p=6149319#post6149319 А сейчас пользователь nicetest распространяет собственный тулбар: http://forum.searchengines.ru/showthread.php?t=658686 Ситуация, по-моему, сюрреалистическая, но про поиск я писать продолжу.
Вот я никакого тарифного плана не выбирал, ничего не делал. Этот модем есть. Только что вошёл в интернет через него, всё работает, по спидтесту 27мб/с на скачивание и 12 на закачивание. (у меня там, правда, немного денег есть на счету, совсем чуть-чуть)
Напишите, пожалуйста, адреса сайтов мне на почту, kalinin@corp.mail.ru — разберёмся.
Я вчера знакомому устанавливал uTorrent. Так инсталлятор uTorrent’а тоже предложил Яндекс-Бар поставить и сделать Яндекс поисковой системой по-умолчанию.
Что же им быстро-то не работать. Не пользуется ими никто. В этой статистике нет XML и JS экспорта. Но вы как-то скачете с одного на другое теперь. А вам эта конференция, организуемая Ашмановым, нужна? Чем плохо проведение отраслевой конференции? И зачем? Как обычно на всех конференциях: пообщаться.
Ваш уровень — это сегодняшний флексум, но при такой скорости работы рамблер бы свалился в пике уже в 2002 году. Вообще-то, вы сравниваете несравнимое.
Игорь, уровень ваших поисковых «технологий» легко оценить на примере флексума. По несколько десятков секунд на ответ это за пределами добра и зла. Я могу ответить про Флексум. _Все_ наши тематические поисковики работают быстро, а это, собственно и есть главный сервис, который предоставляет Флексум. Поиск поисков, действительно, притормаживает время от времени (хотя в последнее время всё-таки не десятки секунд, быстрее): чтобы его ускорить туда банально нужно поставить больше поисковых фронтендов. Или переделать логику самого поиска. Мы это сделаем, но пока что заняты крупными изменениями внутри проекта для тематических поисковиков (каталогом запросов и реферерированием поисковой выдачи). Просто у нас сейчас получили приоритеты работы для частных поисков, а не общего: его полнота из-за специфики наполнения и так оставляет желать лучшего, поэтому мы им особенно не занимаемся. Но вообще, вы, конечно, правы: после редизайна поиск поисков попал на видное место и его нужно ускорить. Ну, сделаем это, это не является какой-то серьёзной проблемой: если решена задача разделения индекса на части, то дальше нужная скорость может быть получена просто дроблением индекса на более мелкие части, чем раньше. Я же говорю, щеки бы не надували. Не надуваем.
Что касается счётчика Тор100, то это самый поразительный пример: там основной код (написанный Тутубалиным и Калининым) бинарно был ровно такой же до лета 2008 года. Всё-таки, так говорить немного некорректно. В Рамблере до 2008-го года TOP100, конечно, никто не занимался особенно, но некоторые изменения в рамках «тушения пожара» при его поломках всё-таки были сделаны: его перенесли на 64-х битную платформу, немного оптимизировали внутренние структуры данных, разнесли на три сервера (до того он работал на двух). Это немного, но, всё-таки, совсем в том же виде, что его оставили в 2001-м он, конечно же, дожить бы не смог, чуть-чуть его правили. Что не отменяет общего восхищения простотой и надёжностью архитектуры, которую придумал Тутубалин в 2000-м и которая позволила вот так проработать варезу 8 лет практически без присмотра. К весне 2008 счётчик наконец начал чихать и падать под нагрузкой, иногда лежал полночи, терял данные. Это да, тогда его пришлось немного чинить. А сейчас им в Рамблере активно занимаются, сильно переработали архитектуру и принялись наконец-то за идеологию (вовсю рекламируется nova.top100.rambler.ru, интересно что из этого получится в итоге)
Ашманов говорит про сложные решения, а вы про решения какой фильм смотреть и куда идти танцевать вечером. Да, там толпа может быть умнее индивидуума. Ну, Игорь писал вообще, про то что один человек всегда умнее толпы, я исключительно про этот тезис и написал. Но я вот тут подумал, про перекрёсток, то там ведь мнение толпы неизвестно. Никто же не интересовался её мнением, вероятно, если всех опросить (ну вот чтобы вместо починки светофора сотрудник ГАИ обошёл бы все машины и записал бы мнения водителей, а потом бы выбрал наиболее частое, а в случае очевидного клинча, когда каждый голосует сам за себя, устроил бы переголосование), то решение было бы в духе «пусть проедет первым вон тот лексус». Проблема с исполнением этого решения. Это я, понятно, теоретизирую. На практике я бы предпочёл, чтобы светофор работал. А какое бабло Яндекс платит приглашенным докладчикам? Я не из Яндекса, не знаю.
Ещё Гельвеций, кажется, писал в 18 веке, что толпа умных людей, собранных вместе, глупее каждого из из них в отдельности. Не так давно вышла популярная книжка, «Wisdom of Crowds (между прочим, она на Амазоне находится в списках «Customers Who Bought This Item Also Bought» для книг Гладуэла), в которой утверждается, что в некоторых случаях и при выполнении определённых условий толпа людей может оказаться умнее или прозорливее любого из них. Её сейчас часто цитируют авторы, занимающиеся анализом поведения большого количества людей, к примеру, в поисковой выдаче. Тот же Рикардо Баеса-Ятес, когда в Яндексе делал доклад Mining Web Queries, начал его именно с упоминания Wisdom of Crowds. Там основная идея, грубо говоря, в том, что если опросить случайных людей относительно какого-то вопроса (и не давать им особено думать над ним, воспользоваться первыми впечатлениями), то если они ничего в этом вопросе не понимают, их ответы будут случайными и, образно, усреднённый результат окажется «нулевым». Но если среди них будут попадаться люди, которые что-то в этом вопросе понимают, то они сместят результат в сторону правильного ответа. То же самое с поисковой выдачей, где для частотных запросов распределение кликов по ссылкам обычно имеет один и тот же вид и если для какого-то запроса наблюдается изменение этого распределения, то там, скорее всего, что-то не так. Но нерегулируемый перекрёсток, очевидно, не является примером мудрости толпы. Наверное, потому, что тут вопрос не столько в уме, а в централизованом управлении, иначе достаточно нескольких идиотов, чтобы создать затор. Так что с упрвлением, да, лучше чтобы был кто-то один за пультом светофора, чем демократичное голосование.
umkalive: Меня всегда учили — если чего чего не понимаешь — переспроси. А если понимаешь? Как проверить, понял верно, или нет? К примеру, преподаватели проверяют на экзамене и прочих контрольных мероприятиях, но там ведь условия: сессия и всё такое. И как их можно перепутать мне не приходит в голову. Пардон, поставил неправильный союз. Южной Корее и Колумбии. Предлагаю свести к одному. О пользе редиректа при смене почтового ящика, например. Давайте, будет чуть ближе к обсуждаемой теме.
umkalive: Аргументы я привел. Проблема в том, что Вы не умеете их прочитать. Это очень важный философско-практический вопрос: кто ответственен за понимание в диалоге? Говорящий, или слушающий? Т.е., если один сказал, а слушающий его не понял, то это слушающий должен переспросить или говорящий повторить свою мысль, переформулировать её чтобы слушающий таки понял? К примеру, я читал, будто в Южной Корее или Колумбии принято, что за понимание отвечает слушающий. А в США — говорящий. Таковы национальные различия. Соответственно американец, если увидит что его не поняли, будет добиваться своего, а кореец вздохнёт и ничего не будет делать, считая что его поняли, но не приняли во внимание. Боюсь, что мы опять здесь столкнулись лбами: лично я считаю, что всё прекрасно понял. Перечитайте пост, после которого вас стошнило, подумайте. Тошнило вас. Неудержимо рвало на Роем, почему-то с кучей опечаток и прочими признаками интоксикации организма. Если чего не понимаете, попросите — я поясню. Я считаю, что прекрасно всё понимаю, зачем мне вас о чём-то просить? Какие глубины мысли могут быть скрыты за фразой «И геморроем еще обзаведетесь»? Без двенадцати семь по Москве пипл как ветром сдуло. Да, вы правы. Пора прекращать с этим сидением на Роеме.
itman: Яховская почта выросла не на 22%, а где-то на 16%. Да, в ночи перепутал. Значит, прирост в абсолютных числах у Yahoo не в три, а всего-лишь в два раза больше, чем у GMail. А как только гугл скорефанится с каким-нибудь комкастом, то хомячки несомненно перейдут на более качественную почту. Всё может быть. Но в этой ситуации они перейдут (или не перейдут, а увеличится количество новых пользователей) не из-за качества, а из-за лучшего продвижения почты от Google. (кстати, а «хомячок» перестает быть хомячком, если он начнёт пользоваться GMail’ом?) Maxime: неудачей назвать Gmail можно только из очень черной зависти к Гуглу… При чём тут неудача? Тезис был в том, что GMail не является успехом. И что у него обычные показатели для почты одного из крупнейших порталов мира, не зависящие сильно от инновационности, качества и т.п. И это логично, судя по всему почта должна быть достаточно качественной, как говорится, «на уровне», дальше на распространение влияют другие характеристики.
Переход на личности был осусчествлен товарисчем. А-а-а, так вы обиделись. Не обижайтесь, лучше чуть подумайте. На личности я, конечно же, не переходил (да и не мог в принципе: ваша личность мне неизвестна), а указал на полное отсутствие аргументов в вашем комментарии от 17.08.2009 21:55:52. Собственно, это и есть «отвержение» по Беклемишеву, после чего обсуждать что-то становится бессмысленно, мы с вами очевидно будем говорить на разных языках. И это как раз видно по вашим дальнейшим постам. Что же касается почты, то на мой взгляд проблемы смены почтового ящика вообще не существует. «Продавщица из Пятёрочки» будет пользоваться той почтой, которую ей порекомендуют друзья, и никакой мотивации поменять почтовый ящик у неё не будет вплоть до тех пор, пока почта работает стабильно и нет больших провалов по качеству сервиса. Вот itman выше утверждал, что у Yahoo Mail такой провал есть (на его почте, его сообщениях), но приведённая выше статистика роста американских почтовых сервисов показывает, как я думаю, обратное: Yahoo Mail растёт, и растёт очень сильно, 22%-ный прирост 106-миллионной почты Yahoo раза в три больше в абсолютных числах 25%-ного прироста 37-миллионной почты GMail. Ну а если кого всё-таки останавливает смена почтового ящика, то сравнивать адрес бесплатной почты с номером телефона странно, сменить адрес почты проще. Во-первых, редирект конечно спасает (аргументов «против», напомню, вы не привели); упомянутая выше продавщица пятёрочки если ей вдруг почему-то приспичит, может это сделать бесплатно и в течение долгого времени спокойно всем своим друзьям сообщить новый адрес, указывать его везде в качестве обратного, писать почтовые сообщения только с нового ящика и т.п. Во-вторых, она может вообще не мучаться и просто забросить старый ящик (собственно, некоторые и с телефонными номерами так поступают). Раз она завела адрес на бесплатном сервисе, то, наверное, не очень его и ценила. Но, повторю, это всё надумано, потому что самое главное, на мой взгляд, в отсутствие мотивации у «простых смертных» по смене почтового ящика. Гики и прочие странные люди могут этим заниматься, бегать с одной бесплатной почты на другую, вопить в форумах о преимуществах одной почты над другой, но на основную часть пользователей они не смогут повлиять.
О, пир духа. Кроме того мне совсем непонятно нахрена нужен проект к которому себя относит товарисч. Ведь есть яндекс.хмл и иже с ним. То чем он с гордостью занимается, на мой взгляд, пустая трата спонсорских денех. И об этолм я прямо написал. Яндекс.XML — он у Яндекса. Флексум — у нас.
umkalive: Редирект не позволит вам поменять пощту. Вы, просто, обзаведетесь еще одним пощтовым ящиком. И геморроем еще обзаведетесь. Из заметок о женской логике Беклемешева: В женской логике каждое утверждение может быть не только опровергнуто, но и отвергнуто. Отвергая высказывание, вы признаете его бессмысленным и оставляете без внимания. Если вы отвергли последнее высказывание собеседницы, ваше предпоследнее утверждение остается без ответа и, таким образом, становится доказанным. Например, самые основательные соображения можно отвергнуть словами «Ну и что?» или «А больше ничего не смог придумать?».
Вася: расскажите продавщице Пятерочки про редирект У неё проблемы? Она мучается как перейти с mail.ru на gmail.com и не знает как?
umkalive: Пощту поменять также трудно как номер мобильника. А редирект?
tAKe: мы и выбираем Google Мы — это кто?
itman: У меня, кстати, никаких пока ложных срабатываний не наблюдалось. А откуда вы это знаете? С публичными почтами вообще есть серьёзная проблема в их оценке, т.к. большую часть спама они в принципе пользователям не доставляют, а отвергают сразу, следовательно оценить количество ложных срабатываний можно только снизу. О том, что есть ложные срабатывания, отвергнутые почтой, вы можете узнать только по жалобам отправителей, но не всякий отправитель будет это делать. А яховская почта — отстой, с которого пользователи будут уходить на гмейл. Наконец-то, хоть кто-то нашёл в себе смелость и сказал ПРАВДУ. А то всё ложные срабатывания, антиспам, доли какие-то, операционные системы… голова кругом идёт. А тут всё просто: Yahoo — sucks, Google — rulez. Или вы это прикалывались так?
Оркут, оркут… Это, конечно, мои личные проблемы, но в моей голове Оркут связан с этим постом бывшего сотрудника Гугла: http://ivan-ghandhi.livejournal.com/948953.html : ну это гугл, там всякий сельский идиот считает себя умнее усех, т.к. он умеет на распределённой системе вычислять медиану Уж не знаю, какава там доля личной обиды и правды.
что за бред вы несёте? Мой бред поближе к реальности будет, чем ваш, как-никак я 6 лет занимался антиспамом. Вот все эти DNSBL и прочее — это первый этап проникновения антиспама в компанию. Потом начинается этап ложных срабатываний, сисадмин долго что-то там прикручивает, постоянно этим хвастается, но через пару лет выясняется что он тратит на это слишком много времени и купить нормальное решение становится дешевле. (Честно признаться, я думал что такое чудо природы, как сисадмин устанавливающий какой-нибудь SpamAssassin на корпоративную почту и сильно горядщийся этим, уже лет пять как не существует. Ан нет, они бессмертны.) ну и какова же разница между KAS/спамобороной и этим? неужели они настолько великолепны, что нужно отдавать огромные деньжищи? объясните её. «Огромные деньжищи» — о да. За те же 300 евро можно купить годовую лицензию на 50 ящиков, а при продлении — на 150. Это для компании с 50-150 ящиками эти 300 евро в год — огоромные деньжищи? Вы действительно понимаете, о чём пишете? А так, да, про Спамооборну говорить не буду, но KAS вполне себе великолепен. Ложных срабатываний у него очень мало при достойном уровне определения спама. Представьте себе, Virus Bulletin ему VBSpam Platinum выдал по результатам тестов: http://www.virusbtn.com/news/2009/07_06.xml когда случается ложное срабатывание — отправляю на спецадрес asspnotspam@mydomain — он отправляет в ящик получателя и у себя чото там перелопачивает, больше такие письма ложно не попадают в спам. Точно больше не попадают? Как проверяете? Как вообще обнаруживаете ложные срабатывания? Вот человек жалуется: http://www.mail-archive.com/assp-user@lists.sourceforge.net/msg13136.html the first user was trying to send some .gif-created postcards. I’ve told them not to send images through e-mail, just plain text but no one listens. И ответ: You can always whitelist the domain but you’ll always be chasing your tail on other domains that fall foul of Bomb checking in my experience. I always disable DoBombRe — there are always too many false positives for me. Т.е. такой современный SpamAssassin, хоть быстрее работает и удобнее ставится — и то хлеб.
vladon: бесплатно, надёжно, у нас работает (не поверите — на виртуалке с 256 мб памяти) уже два года и отлично фильтрует даже при отключенном байесе (учить неохота было в своё время). О, да. DNSBL, SPF, грейлистинг — что ещё нужно человеку, чтобы не принимать почту? Ведь главное — не нагрузить сервер! Впрочем, ещё нужен Байес. Куда же без него? Высокоинтеллектуальный фильтр настроится на вашу почту и будет её терять в самых неожиданных случаях, совершенно непредсказуемо. Вы совсем-совсем не понимаете разницы между KAS/Спамооборной и бесплатной штукой от малоизвестных авторов? Вот что вы делаете, когда в вашем антиспаме случается ложное срабатывание? PS. И вот что интересно. Единственный оригинальный метод в этой системе, Global Penalty Box, опять-таки платный: To use the global-PB you’ll need a subscription. The global-PB service will be charged per year. At this time the price will be between 240,00 and 300,00 Euro per year and client! Until 30.09.2008 the registration and usage of the global-PB service is free! Вот он, звериный оскал капитализма.
durov: Пользователям в описании приложения предлагалась ссылка: «необходим новый флеш-плеер, скачать здесь». С него пользователи переходили на наше предупреждение о небезопасной ссылке Да вы же все ссылки предваряете этим предупреждением, невзирая на их опасность. Такое предупреждение — всё равно что его отсутствие, может вызвать только раздражение. Вот, к примеру, если бы там была ссылка на настоящий адобовский плеер, то разве предупреждение об опасности не показалось бы? А тогда какой с него толк, если оно всегда одинаковое даже для вполне легальных ссылок?
Материал нужно признать «экстремистским» по суду, внести его в список, и только после этого — привлекать по 20.29. У вас есть сомнения что в случае обращения в суд материал будет признан экстремистским? Вот в списке, который привели, есть: 265. Видеоролик под названием «Казнь таджика и дага. 2007 НСПР (операция НСПР по аресту и казни двух колонистов из Дагестана и Таджикистана 2007 год)» (решение Майкопского городского суда Республики Адыгея от 27.05.2008); Эти ролики чем-то отличаются? На мой взгляд речь не о том, что нужно снимать по суду, а о том что и до суда нечего доводить. А по закону — состава преступления в ее действиях действительно нет, по-моему, это очевидно. Мне неочевидно, поясните. Очевидно другое, что никто не будет заморачиваться с обращением в суд, признанием роликов экстремисткими и т.п.
studiomade: И попытались бы бороться за свои жизни. И что бы они предприняли? PS. Меня не то чтобы интересует ответ, но этот пассаж демонстрирует особенную глубину вашей мысли.
Andorro: Пока эти материалы выбираются по понятным и прозрачным криетриям (количество ссылок, активность комментаторов и т.п.) — это не цензура. А эти критерии не работают, потому что всегда найдутся те, кто захочет их «проспамить» и гарантированно попасть наверх простого рейтинга. И спам здесь может быть как автоматический, так и социальный. Все эти желтушные приёмы в виде ужасных видероликов — тоже приём повышения «простых и прозрачных» показателей своих записей в блогах. Автоматический спам Яндексом точно режется. А почему социальный спам вдруг стал лучше? Ну и ещё про прозрачность. Вот описание устройства рейтинга популярных записей: Сводный рейтинг популярных записей рассчитывается на основании данных за последние 24 часа о количестве ссылок и комментариев на запись, а также её посещаемости. Топ-5 списка популярных записей отображается при раскрытии сводного рейтинга на главной странице Поиска по блогам. К этим записям применяются понижающие коэффициенты за каждый час пребывания в топ-5. Это позволяет сделать сводный рейтинг динамичным и актуальным. Где здесь прозрачность и понятность? Как учитываются три разных параметра? Что такое «посещаемость»? Яндекс честно признаётся, что «Данные о посещаемости собраны из различных источников и являются приблизительными», это хорошо, но не имеет никакого отношения к прозрачности. И что такое понижающие коэффициенты и как они были подобраны? Так что цель этого рейтинга — сделать его «динамичным и актуальным», а не прозрачным и понятным. А вот если к выбору самых резонансных тем дня в блогосфере подключится ещё и неавнодушная общественность, то ценность ЯППБ как информационной площадки для меня существенно упадёт. Я думаю, что вам будет совершенно без разницы и если Яндекс что-то поменяет, вы этого не заметите. А главное, это невыгоджно самому Яндексу: такая инициатива создаст благоприятную среду для конкурентов на ниве обзора блогосферы. Да где они, эти конкуренты? Вы путаете: поиск Яндекса по блогам имеет ценность прежде всего потому что это проект Яндекса. Это Яндекс даёт траффик блогам, а не наоборот (и если будет подмешивать выдачу поиска по блогам в основной поиск, то даст ещё больше траффика). Именно поэтому авторы пытаются проникнуть в топ записей блогосферы. Так что если Яндекс будет менять правила рейтингования то авторы будут пытаться пробить их, а не удовлетворятся первым местом в каком-нибудь доморощенном рейтинге без траффика. Только я бы переформулировал: я против ограничений на распространение информации. Но да, я также против убийств, смертной казни, воровства, изнасилований и т.п. Не вижу противоречия в своей позиции: «кто предупреждён — тот вооружён», сокрытие же информации делает людей беззащитнее перед. Во многих странах действует запрет на публикацию требований террористов, киднепперов и прочих экстремистов. Как вы думаете, почему? Кроме того, существуют не очень большие группы людей, которые производят массу различных эпатажных информационных поводов и если их оценивать по простым и прозрачным критериям, то они забьют всё. С этим тоже нужно бороться при подаче информации конечным пользовтелям. И опять, есть лимит на распространение информации: нельзя вставить больше заметок в газету, а в рейтинг из 30 записей 31-я уже не влезет. Так что нужно выбирать, каким образом будет составлена газета или рейтинг и это не имеет никакого отношения к свободе распространения информации.
Andorro: Где я сказал «всё»? Я вижу тридцать заголовков постов в сводке ЯППБ, и выбираю, какие из них мне интересны, а какие нет. И уверен, что могу справиться с этим без помощи цензоров. Замечательно, т.е. вы смотрите только 30 заголовков постов, а не все. И что? При чём тут вообще тогда ваша возможность отобрать «интересное»? Вы пользуетесь тем, что для вас отобрал сервис Яндекс-Блогов, если бы он работал иначе, вы бы этого, скорее всего, и не заметили, так как «интересные» посты из такого громадного объёма можно выбирать по самым разным критериям. Более того, для вас было бы лучше, если бы он работал «чище», потому что тогда интересных постов (для вас) в его списке было бы больше. Как вообще можно говорить о цензуре при выборе 30 материалов на голову сервиса! Ведь тогда сам факт отбора туда материалов уже можно считать цензурой. По-моему, совершенно очевидно, что если есть выбор из сотен тысяч записей и есть популярный сервис ранжирования этих записей, то важным становится в каком порядке и как этот сервис будет обеспечивать доступ к материалам. Надо же, убирание дерьма с главной страницы, оказывается теперь цензура. Тогда чем не цензура ранжирование в поиске или борьба со спамом? А контекстная реклама, это же ведь вообще жуть. На козырных местах, за деньги, показывается чёрт знает что… Вы слишком много внимания уделяете голосам в своей голове, а не словам собеседника. В вашем исходном комментарии после слов «я пойду даже дальше» содержался чистый незамутнённый бред, никакого отношения к моим словам и моему мнению не имеющий. Ах, бред. Вот и хорошо. На самом деле я хотел узнать, насколько вы последовательны в своём стремлении к свободе и узнал: совершенно не последовательны. Получается, что вы считаете правильным чтобы закон защищал вас в тех случаях когда вы действительно можете оказаться в опасности, а вот в интернете, где ролик убийства других людей вам никакой непосредственной угрозы не представляет, вы закон отвергаете, считая что такому шибко умному и свободному индивидууму как вы, он тут ни к чему. То есть, такое мировосприятие, кажется будто всё изображенное на экране монитора нереально и происходит где-то очень-очень далеко и к вам отношения не имеет, тем более вы туда не полезли же смотреть, а значит тем более всё хорошо.
Неверно. Можно показывать всё, а я сам решу, что смотреть. Это сильный, мужской ответ. И что, вы действительно всё просматриваете и решаете что смотреть, а что нет? Ну вот сегодня вы просмотрели все записи в блогах, чтобы принять это мужское решение, или как? Идите-идите. Ну, то есть, по существу вам возразить нечего. Как нынче говорят, «слив засчитан».
Andorro: Я этот пост не стал смотреть… Всё что вы не смотрите можно показывать, верно? Детскую порнографию там, сцены убийств и изнасилований? Это ведь всё мелочи, а вот цензура — это да. Это такое страшное слово! Это так ужасно! Просто всё внутри переворачивается, как подумаешь, на что способна цензура! Я даже дальше пойду. Надо вообще весь УК выкинуть. Потому что здоровому человеку такое не нужно. Он сам способен решить, что смотреть, а что — нет. Здоровому человеку УК не нужен. Он сам способен решить, что ему можно делать, а что — нет. А когда на дороге повстречаются два здоровых человека, то более здоровый, очевидно, может больше менее здорового.
И вообще: наконец-то Спамтест достиг 100%-й фильтрации спама!
zotov: С год назад они уже переставали работать на очень долгий срок (с апреля по октябрь 2008), yozheck: Имеет место быть обычный сбой работы сервиса по техническим причинам (железо, увы, выходит из строя- жарко). Всё просто: Спамтест теперь зимний сервис! И действительно: зачем вам в такую жару почта?
представитель нюсмайкера беспонтновый Это не представитель, это сотрудник, как его правильно определил Синодов. И повёл он себя точно так же, как и остальные сотрудники, у которых я поинтересовался судьбой Спамтеста и показал, в частности, это тред: «ну что же это они вместо того, чтобы в техподдержку обратиться, сразу пидарасами обзываются?» А как вообще её можно найти, эту техподдержку, из текущего содержания сайта, на который редиректит spamtest.ru, непонятно.
Вы, Saxon, всё-таки действительно как-то превратно понимаете события. Да, конечно, всё крутится вокруг Seemore, но, тем не менее: Гиперновости не были связаны с Seemore никоим образом, это было скрещение идей обменной сети Новотеки с Гиперпоиском. Относитесь к этому как хотите. LinkedWords, конечно, вещь. Там есть поиск? Что там можно найти? Гиперпоиск предоставляет полнотекстовый регулярно обновляемый поисковый сервис, с учётом разделов, сортировками по дате и релевантности и т.д. В дополнение к этому можно установить автоматическую разметку страниц. При чём тут LinkedWords? PS. И что, действительно на сайте Икеи можно было зайти, сделать говорящего человечка и поставить к себе на сайт?
Саксон, Гипепоиск ( http://hypersearch.novoteka.ru ) появился в 2006-м году, как его можно было скопировать у Seemore, запущенным в 2008-м? Это поиск для СМИ, установлен на Известиях, Регнуме, Спорт-Экспрессе и т.п., позволяет, в частности, разметить страницу терминами из словаря и найти свои статьи по связанным с этими терминами запросам. Затем были выпущены Гиперновости, которые от Гиперпоиска отличались тем, что поиск производился не только по одному сайту, а по нескольким, и была приделана система учёта кликов.
Вот ты, lexa, слишком уж себя хвалишь. 8 лет, сносу нет… а я когда на top100 увидел авторизацию на куках, так чуть не прослезился!
о какой-такой тематике тут говорится? Там вообще все зависит от конкретного запроса Вот как раз тематика, порождённая запросом. Или, вернее, документами, найденными по запросу.
Можно ли с уверенностью утверждать. что у них ПР не тематический? Нет; более того, очевидно что там не одна метрика, а комбинация многих, с весами. И простой PR (вернее, какая-то «мера общей авторитетности») тоже есть, потому что если бы его не было, то вряд ли бы на странице про Русский Апач имелись бы ссылки «пилы и шиномонтажное оборудование». Они бы тогда были бы неэффективными. Ну и банить за такие ссылки тоже не имело бы большого смысла. И я вообще не про Яндекс и Google, а про HITS и PR, которые, в отличие от реальных алгоритмов Яндекса и Google, опубликованы.
Я не хотел ничего писать в этой теме, но раз тут уже дошло до сотни комментариев и PageRank’а, то, наверное, уже можно. Отличие HITS от PageRank кардинальное. PR расстанавливает авторитетность документам вне зависимости от тематики, за счёт чего, к примеру, какой-нибудь top100.rambler.ru может запросто стать ответом на все вопросы (потому что ссылок на него очень много). HITS же работает, фактически, только с однотематическими страницами. То есть, если под сутью понимать, что и там и там анализируется ссылочный граф, то да, суть не меняется. Но смысл этих алгоритмов разный, кроме того, они не являются взаимоисключающими. Вообще, если предположить гипотетическую ситуацию, что PR или его аналоги вдруг перестали бы использоваться поисковыми системами, а использовался бы только HITS, то покупка ссылок не имела бы смысла: однотематические сайты ставить ссылки на конкурентов скорее всего не стали бы, а ссылки из других тематик не работали бы. Однако как-то расставить авторитетность страницам перед выполнением запроса всё равно нужно, а здесь PR и его аналоги не особенно хуже других автоматических способов рейтингования.
Вот выше — это я был (alkalinin). А почему оно АльтерЭгой представилось, я не знаю.
Вы крайности предполагаете, да к тому же такие крайности… А вы — высокопарные банальности («24 часа думать на 24 месяца вперёд»), да ещё и внутренне противоречащие самим себе (это я про длительность планирования и изменяемость отрасли) А, ну конечно! Нужно найти в десятый раз нового человека, верить в волшебство, он придет в ту же структуру и все волшебным образом изменит своей волей. Нужно: — найти правильного, заинтересованного в результате человека. — дать ему полномочия и взвалить ответственность. А он уж сам разберётся, причём самым материальным образом.
Но не в таком динамичной отрасли. Здесь действительно 24 часа в сутки надо думать на 24 месяца вперед, и делать это должен КАЖДЫЙ, понимая, что от него зависит конкретное. Скажите, а зачем думать на 24 месяца вперёд, если отрасль — такая вся из себя динамичная? Толку же ведь никакого? И как вы будете КАЖДОГО контроллировать? Очень всё неустойчиво получается, если хотя бы один отлынивает (может и не со зла, а по болезни), то всё пропало. Так что здесь дело не совсем в людях, а в архитектуре процессов как таковых. Да. Нужно, всё-таки, кровати подвигать. Ещё не все варианты расстановки перепробовали.
А-а-ах, всё-таки с разоблачением у меня не получается… ну, что же, пойду дальше Флексум починять. Всего хорошего!