Дом Перспективное мышление Google делает ставку на голос и распознавание контекста

Google делает ставку на голос и распознавание контекста

Видео: LOOPTHEORY - Trapped (Original Mix) (Октября 2024)

Видео: LOOPTHEORY - Trapped (Original Mix) (Октября 2024)
Anonim

Слыша о планах Google по распространению Android везде вчера, одна вещь, которая меня действительно поразила, это то, насколько сильно компания рассчитывает на распознавание голоса и контекста, чтобы продвинуть свои продукты дальше. Обе темы обсуждались ранее Google и другими, но я был впечатлен большим количеством конкретных планов использования Google этих технологий, как сейчас, так и в ближайшем будущем. Это говорит о том, что компания добилась больших успехов в обеих областях.

Распознавание голоса существует уже много лет, и на смартфонах оно стало неотъемлемой частью опыта работы с различными личными помощниками, начиная с Siri от Apple, затем с Google Now и совсем недавно с Cortana от Microsoft.

«Мы создаем самый совершенный в мире механизм распознавания голоса», - сказал Сундар Пичаи, старший вице-президент Google по Android, Chrome и приложениям, во время своей вчерашней презентации Google I / O. И хотя другие могут не согласиться, компания продемонстрировала множество демонстраций голоса в действии в новых случаях использования.

Для Android Auto компания говорила о голосовой поддержке, такой как навигация, общение и управление музыкой. Это, безусловно, имеет смысл в мире отвлеченного вождения. Распознавание голоса в автомобилях не ново - Microsoft и Ford представили систему Ford Sync еще в 2007 году - но реализация Google выглядела довольно неплохо.

Помимо этого, распознавание голоса также является частью устройств Android Wear, таких как грядущие умные часы LG G Watch и Samsung Gear Live. Например, Google продемонстрировал воспроизведение музыки или настройку будильника с помощью голосовых команд. На Android TV Google продемонстрировал, как можно использовать голос для поиска видео или соответствующего контента. (Amazon также рекламирует аналогичную функцию в своем Fire TV.)

Однако во многих отношениях контекстное сообщение было еще более интересным.

«Мы делаем все с учетом контекста», - сказал Пикхай, сказав, что Google хочет понять, когда вы дома, в офисе или в дороге, потому что ваши информационные потребности различны в разных местах. Дома вы можете сосредоточиться на развлечениях, а в офисе вам нужна информация, связанная с работой. «Мы хотим предоставить вам правильную информацию в нужное время», - сказал он.

Например, Дэвид Синглтон, директор по разработке Android (ниже), рассказал о том, как средний пользователь смартфона проверяет свой телефон 125 раз в день, и как было бы лучше, если бы часы Android Wear могли просто показывать вещи, которые вас интересуют, в зависимости от в контексте. В частности, одна демонстрация предложила напомнить пользователю, чтобы проверить пакет, когда он вернулся домой; и затем система сделала это, понимая, когда он прибыл. В целом он много внимания уделял контекстной информации, например, показу таких вещей, как статус рейса, посадочный талон и погода для путешественника. И он сказал разработчикам, что новый Android Wear SDK позволит им создавать «понятные контекстные приложения» для таких устройств.

По словам Синглтона, лучшие носимые приложения отвечают контексту пользователя. Например, он показал на телефоне демо-версию приложения Eat 24, вспоминая, когда вы заказывали пиццу ранее, и предлагая повторить заказ в то же время неделю спустя, когда приложение знает ваш домашний адрес.

Сочетание концепций голосового управления, контекста и бесперебойной связи между телефоном и носимым устройством может создать несколько интересных сценариев. Синглтон сказал, что Google добавил несколько голосовых команд в Android Wear и будет добавлять больше в ближайшие месяцы. Например, он продемонстрировал приложение службы транспорта Lyft на устройстве Android Wear, где пользователи просто могли сказать «позвони мне автомобиль», чтобы заказать его в вашем точном месте.

Чтобы обеспечить этот контекст, Google необходимо лучше понять, где вы находитесь и что делаете. Большая часть этой информации уже есть на наших смартфонах. Сегодняшние телефоны знают, где вы находитесь, благодаря GPS, и есть вероятность, что если вы используете Google Now, Google уже знает местоположение вашего дома и офиса, поэтому он может лучше всего дать вам указания и погоду. (Это не всегда работает идеально сегодня, но движется в правильном направлении.)

Но Google хочет знать больше. Хотя это не упоминалось в вчерашнем выступлении, Nest Labs от Google (который производит умные термостаты и детекторы дыма) недавно анонсировал платформу для разработчиков, которая будет интегрировать больше информации с другими продуктами. Например, Нест говорил о том, как группа Jawbone UP24 может сказать своему термостату обогреть или охладить комнату в зависимости от того, когда вы просыпаетесь; или как ваш автомобиль Мерседес мог сказать вашему термостату, что вы едете домой. Нетрудно представить интеграцию этого с Google Now, а это означает, что Google сможет лучше отслеживать, дома ли вы, и лучше понять свое расписание. Nest также только что приобрела Dropcam, поэтому идея о том, что Google будет иметь камеры внутри вашего дома, больше не является надуманной.

Теперь, конечно, все это делается по конкретным причинам и для предоставления вам определенных услуг. И у вас есть право «отказаться» от большей части сбора информации, хотя на самом деле мало кто из нас это сделает, потому что нам нравятся эти услуги. Но нетрудно представить, что Google будет использовать эту информацию для предоставления других контекстно-зависимых услуг и в конечном итоге использовать эту информацию, чтобы попытаться продать более целенаправленную рекламу. Именно так компания и производит большую часть своей прибыли. Поэтому легко увидеть, как проблемы с конфиденциальностью будут только возрастать, поскольку компании пытаются лучше понять ваш контекст.

И Google не будет единственным, кто пытается собрать эту информацию. Microsoft долго говорила о желании лучше понять контекст; и способ, которым Xbox One может всегда слушать команды, также был спорным. Я ожидаю, что мы услышим больше об этом и от Apple.

Но лучшее понимание контекста и голоса были целями для информатики в течение долгого времени, по веским причинам, и интересно наблюдать за развитием этих технологий. В то время как нам нужно беспокоиться о проблемах конфиденциальности, эти технологии предлагают огромный потенциал для более личных и простых в использовании приложений.

Google делает ставку на голос и распознавание контекста