А как Mail.ru собирается рисовать сайт с помощью BigData?

Александр Горный рассказал, что без BigData (что это, кстати?) ни один пиксель не шевельнётся в Mail.ru:

...CNews: Какие новые области применения Big Data вы видите у вас в компании?

Александр Горный: В будущем каждый пиксель на нашем сайте будет формироваться с учетом Big Data, чтобы идеально соответствовать тому пользователю, который его видит. Постепенно мы идем к этому идеалу...

Персонализация или о чём речь?

Roem.ru: это не совсем Cnews, это их наполнение подсайта о BigData. Сейчас этот термин, практически лишённый смысла, форсится интеграторами, чтобы создать зуд обновления у потенциальных клиентов.

Скорее всего вопросы задавались списком, часть из них оказалась нерелевантными, но Горный не стал делать работу за журналиста и объяснять ему что и как. Поправьте, если ошибаюсь.

Лучшие комментарии

  • Контекст комментария

    ilyak

    Каждый пиксель сайта будет различаться у двух разных посетителей, а знание о том, что показывать конкретно вам, будут извлечены из гигабайтов логов про вас лично. Ваш Капитан.

Добавить 19 комментариев

  • Ответить

    Каждый пиксель сайта будет различаться у двух разных посетителей, а знание о том, что показывать конкретно вам, будут извлечены из гигабайтов логов про вас лично. Ваш Капитан.

  • Ответить

    Прочитал книжку на днях — рекомендую для понимания смысла терминов. Если книга — слишком много букафф, то можно статейку вводную. Вчера на GreenfieldProject Feedback выступал проект iBinom, работающий с анализом генов как раз по принципу Big Data. Забавно, кстати, что CTO проекта — выходец из Яндекса и его руководитель отметил, что таки есть, куда идти людям из Яндекса работать после Яндекса — в бигдату с машин лёрнингом в стартапах.

  • Ответить

    Валентин, Шерлок Холмс не дедуктивный, а индуктивный метод использовал, от частного к общему, от следа в креозоте до картины преступления. Вот оно все такое же сомнительное, с путаницей в терминах и обещанием могучего машинного обучения, которому тридцать лет на днях исполнилось. На уровне маркетингового булщита пока, к сожалению. Надо тщательно и много читать, конечно.

  • Ответить

    Майл превратят в гибрид OneMillionHomePage и черного квадрата Малевича! Все пиксели черные и шевелятся в зависимости от клиентский предпочтений!!!

  • Ответить

    Борис, я из книжки усвоил пару вещей: 1. Подход «N = всё», отказ от анализа выборок в пользу анализа всего массива данных. 2. Корреляция заруливает причинность — порой знать причины тех или иных выводов из корреляций и не нужно. Это то, что я для себя посчитал основным. Исходя из этих концепций, можно говорить о технологических решениях. И да, ещё пара моментов: 1. Сам по себе подход, включающий элементы big data появился далеко не вчера — в книге приводится пример Тихо Браге, например. Просто технологии позволили внедрить его повсеместное применение (то же к вопросу о машин лёрнинге). 2. Этот подход работает не во всех случаях — иногда нужны и выборки, и причинно-следственные связи.

  • Ответить

    Валентин, Прочитал книжку http://rutracker.org/forum/viewtopic.php?t=2602193 на днях — рекомендую для понимания смысла терминов. Конечно, далеко не вчера. Я могу ошибаться и говорить глупости, но мне кажется, что есть прекрасная дисциплина, называется «математическая статистика». Можно из нее надергать много всякого, например назвать репрезентативные выборочные совокупности чем-то вроде PreciseData и двигать маркетинг в направлении «у нас такие серьезные алгоритмы, что нам достаточно 7% данных, пока конкуренты стремятся к супердорогому и неосуществимому сбору ВООБЩЕ ВСЕГО в свои BigData NoSQL базы, которые в принципе являются ничем иным как нерелевантным, сваленным в кучу кешем вырожденных, денормализованных реляционных БД, монгодб вчерашний день.» И этому подходу тоже будет место в жизни, наверное, его тоже можно будет форсить.

  • Ответить

    И, кстати, можно будет писать популяярные статьи «Шерлок Холмс как первый евангелист PreciseData или как заставить Ваших клиентов говорить «Холмс, но как, черт возьми?…», которые будут заканчиваться словами «Долой инспектора Лейстреда в мире PreciseData! Дешь Холмса как saas!»

  • Ответить

    [quote[И этому подходу тоже будет место в жизни, наверное, его тоже можно будет форсить. Конечно, можно. Рационализация работы с выборками — это отдельная интересная тема, в коей я не силён (впрочем, как и в бигдате). Все подходы имеют смысл и я не против того, чтобы выбирать из многих лучшее, что в них есть. Понятно, что вокруг любого тренда много базза, но во всём есть и рациональное зерно. За книжку спасибо.

  • Ответить

    Я подразумевал, что маркетинговый булщит застит реальную картину мира, а выделение рацио из подобных текстов занятие, требующие самоотречения. Поэтому просто отношусь к «BigData» и «машин лёрнинг», доносящихся со страниц маркетинговых сайтов и книг «полвека спустя с того времени, как компьютеры прочно вошли в жизнь общества»(с) примерно так же, как к «Стиморол» и «Блендамед». Могу быть сто раз неправ, конечно.