Воисковик

Компания Google провела в Москве 22-го сентября презентацию Google Voice, которая оказалась презентацией возможностей Android вообще.

Hugo Barra, директор подразделения мобильных продуктов Google, рассказывал больше всех, вещи были достаточно общие и относились к демонстрации достоинств Android-телефонов. В силу невладения русским, показывал он распознавание на английском языке (слово Pushkin иноземному сервису так и не покорилось — вечно вылезал то Bush, Push can, остальные слова во фразе определялись правильно. Показывал и навигацию по Лондону (в России навигация на Android, в целом, не работает). Наиболее впечатляющий момент был, когда Hugo попросил проложить маршрут в какой-то музей, где лежит Rosetta stone. Google послушно проложил маршрут в британский музей. Уж на что я ушлый журналист, так и то был впечатлен.

doronichev.jpg

Позже Андрей Дороничев (на фото), менеджер по мобильным продуктам Google на словах рассказал о возможных сферах применения голосового поиска, а еще позже, уже в конце мероприятия, пообещал, что платные приложения в русском Market будут работать так скоро, как это возможно. Google перед включением данной функции должен решить какие-то «нетехнические проблемы». Похоже, что поскольку Google, в отличие от Apple, ведет деятельность в России, перед запуском локализованного «Маркета» должен решить какие-то весьма серьезные юридические вопросы. В Google задачи такого плана не всегда решаются быстро.

Про технику голосового поиска рассказывал Юджин Вайнштейн (в десятилетнем возрасте переехавший в англоязычную среду), разработчик ПО. Он продемонстрировал работу русскоязычного голосового поиска на достаточно длинных словах. Позже я ему задал вопрос о том, насколько хорошо работает голосовой поиск с короткими словами (именно с ними возникают наибольшие трудности при распознавании речи), Юджин ответил, что с короткими словами тоже все хорошо, а Андрей Дороничев посоветовал отложить узкоспециализированные вопросы на потом. Также Юджин рассказал, в чем проблемы голосового поиска вообще:

Первая: никакой индивидуальной подстройки нет, записи анализируются на серверах Google.

Второе: система может распознавать около миллиона слов, в первую очередь основываются на самых популярных запросах.

Третье: объем сэмпла составляет приблизительно 100кб. На каком-нибудь плохом GPRS запрос будет идти на сервер несколько десятков секунд и обойдется запрашиваемому в несколько десятков копеек (если исходить из цены в 3 рубля за мегабайт трафика).

При этом, естественно, Google приходится учитывать вероятное сочетание слов (не расслышит, так догадается), надо разрабатывать модель произношения (што, а не что) и обрабатывать звуки с учетом окружающей акустической обстановки.

Потом я потестировал голосовой поиск и пользовался им неоднократно в течение дня. Больше всего мне это напомнило время, когда я учился водить на механике: вроде бы все действия весьма простые, но чтобы научиться вовремя выжимать сцепление, приходится вырабатывать в себе какой-то новый навык времени и ощущения работы автомобиля. Точно также и с голосовым поиском: произносить слова надо в одном темпе, но желательно равномерно, а не по слогам. При этом жаль, что куча сервисов для автомобилистов, вроде той же навигации, на данный момент недоступна в России, а качество сотовый связи увеличивает время реакции системы до крайне некомфортных значений.

В общем, презентация Hugo Barra несколько расходится с окружающей реальностью. Поэтому прекрасное далеко придется подождать еще.

Юрий Синодов, sinodov@roem.ru

Добавить 4 комментария

  • Ответить
    Альтер Эго

    Похоже, что поскольку Google, в отличие от Apple, ведет деятельность в России, перед запуском локализованного «Маркета» должен решить какие-то весьма серьезные юридические вопросы. Платного Маркета нет во многих странах. Канадцы и австралийцы, например, тоже не могут продавать программы. Дело не в юридических воопросах, а в чьей-то банальной лени. Например, Гугл Маркет не перечисляет за разработчика никаких налогов с продаж и vat. Если Эппл и другие компании (включая всякое старье типа palmgear, работавших еще 10 лет назад со всеми странами) отдают разработчику роялти (например, в америке самим порталом уже уплачен sales tax в ряде штатов, а в европе vat) и разработчику остается только заплатить свои налоги с этого дохода, то Гугл ленится. И перекладывает sales tax, vat на разработчика. В результате если у Эппл каждая проданная копия приносит разработчику одинаковый доход (с учетом курса валют), то у гугломаркета при цене программы в 10 в отчетах полный спектр цифр от 11 до 15 (в зависимости от страны и штата покупателя и продавца). Поэтому европейские продавцы в гугломаркете сами платят еще и vat, а американские sales tax как минимум своего штата. Из-за такой схемы 2/3 стран евросоюза не могут продавать.

  • Ответить
    Альтер Эго

    Google перед включением данной функции должен решить какие-то «нетехнические проблемы». Для начала надо бы решить «технические проблемы». Авторизация по кредитке не должна занимать 8 часов: платеж либо проходит сразу, либо не проходит (нет денег, неправильный номер и т. д.) и выдается сообщение в ближайшие минуты http://www.google.com/support/forum/p/Android+Market/thread?tid=768ff3029eb670cf&hl=en http://www.google.com/support/androidmarket/bin/search.py?hl=en&forum=1&query=Authorizing+credit+card+moreforum Если чел купил программу, он должен ее скачать. Если не получается, значит, глюки надо чинить. А не закрывать темы из 1000 постов с баг-репортами и не давать идиотские советы в стиле «попробуйте включить wifi, вдруг получится», «попробуйте включить google talk, с ним маркет лучше работает, иногда это помогает» http://www.google.com/support/androidmarket/bin/search.py?ctx=ensearchbox&forum=1&query=cant+download Желательно также научиться правильно считать количество проданных/используемых копий. А то постоянные «ой, у нас была ошибка, мы тут через год работы случайно обнаружили, что некоторые продажи были double counted» достали http://android-developers.blogspot.com/2010/07/market-statistics-adjustments.html http://groups.google.com/group/android-discuss/browse_thread/thread/e6d80ed13ea5ec71 Еще бы хорошо отчетность нормальную сделать. А то чтобы посмотреть все продажи по странам нужно экспортировать в csv по 500 заказов (почему 500, сразу все выгрузить очень трудно) и потом самим уже парсить и искать нужные данные. Еще неплохо бы побороться со спамом в комментариях. Забанить левые ссылки хотя бы. У того же Эппла при гораздо большем потоке с этим все нормально почему-то. Интересно, если бы финансовая или другая платежная система (не гугл чекаут) работала с такими глюками, сошло бы ей это с рук?! Продажи через интернет — дело давнее и хорошо изученное. Некрасиво в 2010 году такие глюки ляпать.

  • Ответить
    Альтер Эго

    да ни хера оно не работает мне хватило пары ошибок в ходе эксперимета, чтобы отказаться от него если я, и впрямь, ищу «пушкин», то к чему мне ждать неправильных результатов типа «push kin» или, наоборот, мне и нужен «push kin», но как это ввести. а еще козырнее выглядит ввод адресов или номеров моделей. «москва северное чертаново корпус восемьсот двадцать три»? «NRJ-23092k» Короче, уебаны ©, чо.

  • Ответить
    Альтер Эго

    И Пушкин, и «Москва северное чертаново корпус 823» отлично работают. Просто в настройках надо поставить русский язык. На андройде в Settings → Voice input & output