В эксклюзивной статье для цикла BBC Intelligent Machines председатель совета директоров Alphabet (ранее Google) Эрик Шмидт делится своими мыслями о развитии искусственного интеллекта, причинах оживления в отрасли и её перспективах. Для Roem.ru перевод сделала Светлана Иванова, Newочём.
***
До недавнего времени искусственный интеллект считался чем-то исключительно из области научной фантастики. Сам термин «искусственный интеллект» ввели в употребление 60 лет назад: 31 августа 1955 года Джон МакКарти предложил «летний исследовательский проект» с целью создания думающих машин.
Однако лета оказалось недостаточно. Мы стоим на пороге седьмого десятилетия – и только начинаем видеть настоящий прогресс.
И вопросы не могут не появиться. Почему мы так долго к этому шли и что способствовало сегодняшнему подъему в исследованиях ИИ?
Глубокое обучение
Что ж, как обычно и бывает с технологическими «революциями», вплоть до сегодняшнего дня ей предшествовала постепенная эволюция, движимая тщательными научными исследованиями.
Например, Джеффри Хинтон, один из пионеров искусственных нейронных сетей, многие из своих ключевых идей выдвинул еще в 1980-ых. Тогда компьютеры были слишком медленными, чтобы эти идеи могли найти широкое практическое применение. Профессор продолжал работать в течение следующих 20 лет и в 2009 году вместе со своими студентами превзошел современную технологию распознавания речи.
Google вскоре внедрил их методы, а позже нанял и команду. Компании удалось на 25% сократить ошибки распознавания речи в приложениях, что равносильно примерно десяти годам исследований вместе взятым — действительно многолетний труд.
Но всё же что-то изменилось за последние несколько лет. Переломный момент, последний рывок от «Это может сработать» к «Ух-ты, это работает лучше, чем когда либо раньше!»
Действительно, настоящий прорыв в глубоком обучении наступил с повальной компьютеризацией и возможностью использовать сети из тысяч компьютеров, работающих одновременно.
Беспорядочный мир
Всем нам известно, что это собака, – многие даже смогут назвать породу – но обучить компьютер распознавать изображения гораздо сложнее. Источник: BBC
Развитие ускорилось с попытками решить существующие практические задачи: как создать систему, которая сможет распознавать речь на 58 языках? Как найти первую фотографию своего золотистого ретривера, если её никогда не подписывали? (Всё это уже не риторические вопросы: на них могут ответить Google app и Google Photos, а множество других компаний ищет похожее приложение методам машинного обучения).
Другими словами, жизнь в исследования ИИ вдохнула все та же потребность в ответах на любые вопросы и возможности общаться вне языковых барьеров, что когда-то послужила толчком к развитию Интернета и облачных хранилищ.
Подобные потребности ставят перед нами более трудные и стоящие задачи, чем «игрушечные» головоломки, которые на протяжении десятилетий считались эталонами в исследованиях ИИ (например, попытки научить программу перемещаться по лабиринту). Наш мир гораздо больше и сложнее, и он задает высокую планку для машинного обучения.
Настоящий прогресс наступает тогда, когда теория сталкивается с практикой. Именно поэтому с помощью программы Visiting Faculty мы приводим в Google десятки академиков каждый год, а наши исследователи открыто публикуют свои работы и посещают все масштабные научные конференции по ИИ.
Мы предлагаем компьютерные ресурсы, практические задачи и нашу компетенцию в построении систем; внешние исследователи привносят свой богатый опыт и идеи для инновационного подхода.
Музыка умнее
Источник: Getty Images
Мы любим обмениваться знаниями, и приглашаем экспертов машинного обучения проводить свои исследования в Google. (Кстати говоря, сокращение разрыва между теорией и практикой дает и другие преимущества: будущее искусственного интеллекта гораздо логичнее обсуждать в контексте того, что мы можем сделать и как создать наиболее полезные технологии.)
В будущем мы станем гораздо чаще находить исследованиям ИИ практическое применение. В программном обеспечении следующего поколения машинное обучение будет не просто расширением, улучшающим производительность на несколько процентов; оно заменит сложившиеся методы.
Приведем лишь один пример: десять лет назад, чтобы запустить сервис цифровой музыки, вам бы скорее всего пришлось нанять престижных критиков, чтобы те подбирали горячие новинки. Сегодня намного проще создать умную систему, которая будет извлекать знания из окружающей среды и вычислять, что должно понравиться слушателям в следующий раз и кто и когда станет новой Адель.
Демократичность такой системы является её дополнительным преимуществом. Поиск новых звезд стал доступен любому из нас и больше не является прерогативой избранных.
Современная жизнь
Источник: Thnkstock
Если мы хотим в будущем по максимуму использовать возможности ИИ на благо общества, нужно направлять исследования в русло решения задач еще более беспорядочного характера. Например, можно ли в последнюю минуту спланировать отличное путешествие для семьи с ограниченным бюджетом, двумя капризными детьми и всего несколькими днями на все про все?
Снизим ли мы зашумленность современной жизни, если выпустим умные фильтры для вашей электронной почты, социальных сетей, ваших расписаний – получится ли у нас вместо спама подарить вам больше времени?
И как мы можем помочь ученым справиться с ошеломляющим потоком данных в геномике, энергетике и климатологии?
Изящные, устремленные, содержательные инновации в искусственном интеллекте помогут решить эти и другие вопросы – вот почему нужно и дальше ставить во главу угла конкретные потребности людей и мира, в котором мы живем.
Добавить 5 комментариев
Забавно, когда об искусственном интеллекте рассуждает менеджер.
Машинное обучение — это решение задачи отделимости двух множеств — хорошего и плохого — на основе множества обучающих примеров.
Для задач с большим количеством обучающих примеров и «хорошими» множествами замечательно работал SVM.
Для задач с большим количеством примеров и изрезанной границей лучше работают нейронные сети с deep learning.
Для обработки текстов DL не дает значимого улучшения.
Существует куча задач, где нет большого количества хороших (непротиворечивых) примеров. Там все методы машинного обучения работают плохо.
В большинстве корпоративных задач машинное обучение не применяется — в смысле применяются «инженерные» методы.
Приход искусственного интеллекта вот прямо сейчас — это «приход» — голимая реклама.
> Для обработки текстов DL не дает значимого улучшения.
Только не рассказывайте про это вот этим ребятам, расстроятся еще:
http://nlp.stanford.edu/courses/NAACL2013/NAACL2013-Socher-Manning-
DeepLearning.pdf
> Забавно, когда об искусственном интеллекте рассуждает менеджер.
Это, правда, всегда забавно. Но когда инженер рассуждает о планах менеджера, это, поверьте, еще забавней :)
>Забавно, когда об искусственном интеллекте рассуждает менеджер.
>когда инженер рассуждает о планах менеджера, это, поверьте, еще забавней
кароче классика интернет-дискуссий
http://www.youtube.com/watch?v=9zySFVipKfE
Славно, удалось протроллить Роем, а то я уж думал, что мертвый.
>> Для обработки текстов DL не дает значимого улучшения.
> Только не рассказывайте про это вот этим ребятам, расстроятся еще:
http://nlp.stanford.edu/courses/NAACL2013/NAACL2013-Socher-Manning-
DeepLearning.pdf
1) спасибо за ссылку, интересно, да и Маннинг, в отличие от многих, старается разобраться в явлении
2) однако, предмет дискуссии от этого не меняется.
Сравнения нового и старого, если я правильно понимаю, приводятся на страницах 72,73,122,130,138,156,175. Это в таблицах, есть еще графики.
Что же мы видим. В достаточно экзотическом комплекте задач в 90 % случаях есть незначительное улучшение. В 10% в приведенных данных есть определенное улучшение.
Хотя часто встречается мнение, что basic line надо бы проверить — не низковат ли?
Никто ведь не спорит, что фича полезная. И вообще возврат из незаслуженного забытья нейронных сетей это неплохо.
Фича полезная, но это ведь только одна из фич, были «революционные» LM, PLSI, LDA, теперь новая реинкарнация NN.
Все нашли свои ниши, но это только ниши.
Прогресс есть, а где искусственный интеллект?
Значимый результат есть в распознавании речи и изображений (обратите внимание — огромное количество примеров). На этом можно строить бизнес, кто же против.
С текстами пока — фича, не более.