Mail.ru поздравил школьников порно-выдачей

Что-то случилось с Mail.ru 1 сентября. Теперь по количеству сайтов для взрослых в выдаче они не уступают Гуглу

http://analyzethis.ru/?analyzer=porno&location=ru&lang=ru

Добавить 23 комментария

  • Ответить

    ну как же не изменились? [URL=http://analyzethis.ru/?analyzer=entirety&location=ru&lang=ru]Тематика[/URL] [URL=http://analyzethis.ru/?analyzer=question&location=ru&lang=ru]Ответы на вопросы[/URL] [URL=http://analyzethis.ru/?analyzer=catch_phrase&location=ru&lang=ru]Крылатые слова[/URL] [URL=http://analyzethis.ru/?analyzer=synonym&location=ru&lang=ru]Синонимы[/URL] Не изменились только те параметры, которые и так были близки к гуглу.

  • Ответить

    … и точно также, как google ничего не может сделать с порно (или не хочет?), так и mail.ru постоянно в публичных комментах говорит, что способов решить вопрос не существует, потому что вроде как «все технологии ненадежны». Конечно, ненадежны, как и вообще жизнь :) Но мы как-то ненадежно живем все-таки и ненадежно понимаем, что вот это — плохо, а вот это — хорошо (ну грубо говоря, конечно). Т.е. я думаю, стоит просто нАчать что-то делать.

  • Ответить

    Я зануден, но уж больно интересно изучать статистику у Ашманова. Получилось, что у mail.ru в интервале 2−6 сентября одновременно 1) упала доля порно при включенном safesearch; и 2) резко выросла доля случайного порно в результатах поиска, причем оба показателя стали очень близки Google. Видимо, произошло следующее. Они включили все режимы Гугла и получили, с одной стороны, просто относительно неплохую работу прямолинейно фильтрующего safesearch, а с другой — ужасающе плохие результаты в сложных случаях. Что и следовало ожидать. А потом, увидев это, они все отключили (т.к. рост случайного порно был уж слишком велик) и стали думать, что же делать. Я бы им порекомендовал применить найти еще одну технологию, которая бы просто позволила работать со сложными случаями хоть на каком-то приемлемом уровне. Тогда SafeSearch вырубит тупо плохие вещи, а другая технология отрежет хотя бы половину от роста порно в случайной выдаче, а то и больше. Вот яндекс что-то к себе подключил новое и по тем же графикам чувствует себя вдвое отлично, начиная с июля 2011

  • Ответить
    Альтер Эго

    На сколько я знаю, собственный поиск частично используется. Стоит балансер, ручки на котором можно крутить. Дефолтно стоят настройки примерно: 70% гугл, 30% gogo. Зачем так — ХЗ. Отсюда, судя по «колбасне» в Анализаторе, можно сделать вывод, что балансер с какой-то целью несколько дней все запросы отдавал через гугл. Если ещё более внимательно покурить Анализатор, то можно заметить, что Гугл отдаёт мэйлу всётаки немного не совсем ту же выдачу, что показывает своим пользователям. Т.е. она то такая же, но свою версию он основательно допиливает, чего мэйл пока не осилил. Но об этом говорил давным давно Игорь Ашманов, когда мэйл провайдера поиска менял.

  • Ответить
    Альтер Эго

    Интересно, как здесь учитывается поиск по картинкам? Фильтрация осуществляется по тегам, а как известно, слова далеко не всегда соответствуют содержанию порнографических изображений

  • Ответить

    Скорее всего, никак. Потому что иначе у Ашманова должна была быть система позволяющая понять, есть ли порно на полученной по запросу картинке. А у него такой нет! :)

  • Ответить
    Альтер Эго

    Вообще, собственная поисковая технология Поиска@Mail.ru ещё в апреле победила порно и даже стала лучшей в Рунете по этому показателю: http://analyzethis.ru/?analyzer=porno&location=ru&lang=ru&interval=halfyear Видимо просто в начале сентября на несколько дней включали Гугл.

  • Ответить
    Альтер Эго

    Если Мейл включал поиск от Гугла, значит тем самым они косвенно признают, что не могут сами справиться с проблемой. Ну да, победили порно — наверно весь апрель руками разбирали:) Кстати, как показывает Анализатор, Гугл тоже не в состоянии пока защитить детей, т.к. в выдаче вырос объем случайного порно, а значит, в реальном времени ни тот, ни другой порно не фильтруют. Использование белых и черных списков на сегодня — все равно, что очистить город от мусора, используя грабли.

  • Ответить
    Альтер Эго

    Где это он получил такую награду?)) Пруфлинк? какой смысл обманывать измеритель, по которому сверяются все участники рынка? С чего вы взяли, что чистили всё руками? На Руссире девочка рассказывала о новом алгоритме фильтрации порнографии, который разработали в мэйле.

  • Ответить

    Последнему из alter ago: мда, сильно. согласен. Но я думаю, что как раз очень многое кроется в методе обнаружения порно. Только по тексту фильтровать почти невозможно и единственный метод — это как Гугол, просто отрубать все, где встречаются плохие слова. Такой подход ведет к результату в большинстве случаев, но очень часто также блокирует обычные посты в социальных медиа, где люди часто не имеют в виду ничего плохого, а так выражают свои мысли. Ну как в жизни. А вот с картинками другое дело — практически на всех сайтах, где есть ай-ай-ай, имеются соответствующие картинки, и вот по по ним можно было бы и детектировать. Тоже нет полной гарантии, это понятно, но тут контекст более прямолинеен. Т.е. не надо строить семантические анализаторы, чтобы они поняли, что же имеется в виду на этой фотке, где девушка что-то такое делает юноше :) я так понял из ряда прошедших где-то месяц назад публикаций, что Яндекс пытается это вот внедрить (название, пардон забыл). Я не в смысле за Яндекс, я вообще за технологии! Это ж прогресс все-таки. Начнут с порно, продолжат искусственным интеллектом и новым поиском, например. А то вот уже лет 10 в поиске ничего кардинально нового нет.

  • Ответить
    Альтер Эго

    Alyoooo, Яндекс подключился к сервису, который умеет находить порно на картинках без учета текста. И это показывает, что Яндексу не все равно, что именно пользователи видят в результатах поиска. Насколько я понимаю, для публичных компаний (чьи акции на бирже) это важный момент, так что Мейлу стоит поторопиться.

  • Ответить

    Так mail.ru как портал сама по себе не публичная. Публичной является группа mail.ru (она же Digital Sky Technologies) с Мильнером во главе. А туда входят и портал, и Одноклассники, и еще что-то там типа доли в vkontakte. По-хорошему, всем полностью подконтрольным активам нужно было бы иметь такую технологию, чтобы иметь лицо на бирже. Но видимо сервис уже утек к Яндексу, и Мильнер не успел его купить :)

  • Ответить
    Альтер Эго

    Aloooo, а что Мильнер собирался приобрести технологию фильтрации порно? Учитывая, что он владеет еще и долей Фейсбука, его интерес вполне вероятен. Noname Можно ссылку на информацию о разработке Мейла?

  • Ответить

    Я к Мильнеру не близок, но обычно он все скупает, особенно то, что можно использовать как глобальный актив. Если у кого-то есть технология анализа содержания изображений, то такая штука в современном мире нарциссизма в соц сетях и др. стоит кучу баксов, даже если она не понимает ничего, кроме голой задницы :)

  • Ответить
    Альтер Эго

    В современных соц. сетях не нарциссы сидят, а педофилы. Вот их и надо доставать. Пару лет назад была шумиха в инете по поводу сети Мой мир Мейла, что это чуть ли не место тусовки педофилов. Совсем недавно на Роеме и не только обсуждали реакцию Дурова на претензии к Вконтакте по поводу порно. Дискуссии можно бесконечно разводить, только почему-то владельцы соц сетей не считают необходимым как минимум предупреждать, что «вот эта фотка плохая», а как максимум анализировать, что постит конкретный пользователь. И делать это не тогда, когда общественность возмутится и ссылками закидает, а в момент, когда картинка выкладывается.