Эволюция рекомендаций разорила Netflix на $1 млн долларов

Компания NetFlix рассказала в своем блоге, что алгоритм рейтингования фильмов, разработанный в рамках конкурса с призом в 1 миллион долларов, внедряться ей не будет. NetFlix с 2006 года проводит конкурс для специалистов по машинному обучению и data mining, отдавая миллион команде, которая сможет повысить точность предсказания рейтингов фильмов на 10%.

Рейтинги фильмов были нужны Netflix для построения персонализированных рекомендаций при продаже пользователям DVD-дисков с фильмами. Однако, в последние годы фокус бизнеса Netflix сместился с DVD по почте на потоковое видео. Отпала необходимость в прежнем алгоритме рекомендаций. Раньше люди выбирали диски очень тщательно, потому что посылки приходилось ждать долго, и поменять диск было трудно. Теперь они выбирают фильм для просмотра на сайте, могут смотреть сэмплы, чтобы выбрать фильм, могут посмотреть несколько фильмов за один вечер. В результате, внедрять конкурсный алгоритм рекомендаций для Netflix стало слишком дорого и к тому же бессмысленно.

В том же посте Netflix рассказывает о своем новом подходе к построению персонализированных рекомендаций. Этот подход основан на нескольких главных принципах:

  • рекомендации строятся не для человека, а для домохозяйства — с учетом того, что в семье есть мама, папа, дети, и им нужен разный контент
  • рекомендации стремятся не только к точности, но и к разнообразию
  • пользователь должен понимать, почему ему рекомендуются те или иные фильмы
  • недавно появившаяся интеграция с Facebook позволяет сервису видеть, какие фильмы рекомендуют друзья пользователя
  • для построения рекомендаций используется анализ поведения (выбор фильмов, история просмотров, поисковые запросы и другие сигналы), опросы о пользовательских предпочтениях, рейтинги фильмов, сходство между пользователями и между фильмами (содержание, метаданные, история просмотров)