Дом Перспективное мышление Apple, Google, и путь к всезнайке помощника

Apple, Google, и путь к всезнайке помощника

Видео: Google Assistant vs Apple Siri: Smart Assistant Battle 2020 Edition! (Ноябрь 2024)

Видео: Google Assistant vs Apple Siri: Smart Assistant Battle 2020 Edition! (Ноябрь 2024)
Anonim

Наблюдая за основным докладом на Всемирной конференции разработчиков Apple на этой неделе и на конференции Google по вводу-выводу две недели назад, мне больше всего понравились усилия, которые обе компании, а также Microsoft, прилагают для создания интеллектуальных систем, которые знают как можно больше о вас.

Такие системы знают, кто вы, где вы находитесь, и всю информацию на вашем экране, как правило, с целью выступить в качестве «личного помощника», который предвидит ваши потребности. Это очень амбициозная цель, которую, похоже, понимает одна из этих компаний, может стать следующим большим шагом в вычислительной технике.

В случае Apple и Google, другие предложения, объявленные в их лейтмотивах, могут получить больше внимания или могут оказать более заметное краткосрочное влияние. Google Фото привлекли большое внимание; Apple Pay и Android Pay, похоже, находятся на грани становления гораздо более привычным явлением, а улучшения в Android Wear и WatchOS вполне могут предвосхитить излияние приложений для носимых устройств. Но переход к более интеллектуальным, более комплексным системам может оказать наибольшее долгосрочное влияние.

Apple, Google и Microsoft все смотрят на это с разных сторон. Но они, похоже, сходятся в системах, имеющих мобильный интерфейс, которым можно управлять, набирая текст или голосом, поддерживая набор интернет-сервисов и процессов, которые содержат огромное количество данных о вас, и делают выводы на основе эти данные и о том, что вы делаете.

За последние несколько лет путь к этой конвергенции был проложен несколькими введениями. Многие работали над личными помощниками в течение многих лет, и Siri была изначально разработана как отдельное приложение, созданное компанией SRI International. В 2011 году Apple представила Siri в качестве «виртуального помощника» для iPhone 4s, в основном выступая в качестве внешнего интерфейса для таких вещей, как поиск в Интернете, местная погода и поиск ресторанов. В 2012 году Google представил Google Now как часть Android 4.1 Jelly Bean, предоставляя информацию о серии «карточек», которые отвечали на вопросы. Со временем этот показатель вырос, чтобы предоставить больше информации и охватить больше доменов.

Сначала я думал, что оба интересны, но голосовое управление выглядело скорее как «салонный прием», чем как полезное приложение.

Но за последние несколько лет оба улучшились в быстром темпе. Частично увеличение числа пользователей дало обеим компаниям больше данных для работы. Это, в сочетании с более интеллектуальными алгоритмами и большой работой по обработке сервера, привело к тому, что системы стали гораздо более точными в понимании того, что вы спрашиваете, чем на момент запуска. Оба теперь могут отвечать на вопросы в большем количестве доменов. А Google Now может вывести информацию о том, где ваш дом и ваш офис основаны на вашем типичном местоположении.

Microsoft представила Cortana в прошлом году как часть выпуска Windows Phone 8.1, описав его как первого по-настоящему личного «цифрового помощника», потому что она понимала больше того, что вы делали в других приложениях в дополнение к веб-поиску. Он может делать такие вещи, как устанавливать напоминания и понимать, кто для вас важен, а кто нет, и хотя пользователей было не так много, похоже, что за последние несколько лет он тоже улучшился. Cortana теперь станет частью Windows 10 для настольных компьютеров и ноутбуков.

Это подводит нас к более свежим объявлениям, где все три поставщика, похоже, заимствуют функции у других и действительно пытаются улучшить свои предложения.

Google Now On Tap

В Google I / O пару недель назад старший вице-президент Google Сундар Пичаи рассказал о том, как компания продолжает фокусироваться на поиске. Но когда дело дошло до функций в последней версии Android, то, что привлекло мое внимание, был набор новых функций для личного помощника Google Now под названием «Сейчас на касании».

Пикхай рассказал об инвестициях Google в глубокое обучение и машинное обучение, сказав, что это помогло Google сократить количество ошибок в слове при распознавании речи с 23 до 8 процентов в прошлом году.

Google Now уже имеет некоторые контекстные функции - например, он знает, где вы находитесь, поэтому он может оценить время, которое потребуется вам, чтобы добраться домой, и может отображать это на различных «карточках», которые он использует для отображения информации или в уведомлениях.,

Но Апарна Ченнапрагада, директор Google Now, сказала: «Мы спросили себя, как мы можем дать вам быстрые ответы на быстрые вопросы, не выходя из контекста. Как мы можем помочь вам сделать все как можно быстрее?» Результатом, по ее словам, стала новая услуга, которая поможет вам «в данный момент», независимо от того, что вы делаете по телефону. Это Now On Tap, и она сказала, что она объединяет График Знаний Google - его понимание более 1 миллиарда объектов (таких как бейсбольные команды и автозаправочные станции) - с контекстом и связями с другими приложениями, чтобы предоставить вам информацию заблаговременно.

На демонстрации, которую она показала, она получила сообщение в приложении, предлагающее ресторан на ужин и просящее ее убрать химчистку. Нажатие и удерживание клавиши «Домой» привело к открытию карты Google Now, а функция «Сейчас на кране» вызвала основную информацию о ресторане, включая ссылки на навигационные карты, Yelp и OpenTable; это также установило напоминание о химической чистке. Нажатие на ссылку OpenTable открыло приложение, но более впечатляюще открыло его прямо на странице этого ресторана.

Идея состоит в том, что ОС теперь понимает контекст того, где вы находитесь и что вы делали на остальной части устройства. Другой пример: если вы слушаете музыку, вы можете просто удерживать нажатой клавишу «Домой» и задать вопрос о песне. Google Now узнает, какая песня играет, и сможет ответить на вопросы о ней.

«Вы можете получить информацию мгновенно», - сказал Ченнапрагада. «Во всех этих примерах - статья, которую вы читаете, музыка, которую вы слушаете, сообщение, на которое вы отвечаете, - ключ к пониманию контекста момента. Когда у вас есть это понимание, он может дать вам быстрые ответы. на быстрые вопросы, поможет вам сделать все, где вы находитесь по телефону."

Apple подчеркивает интеллект

В своем выступлении на WWDC в понедельник Apple обсудила ряд изменений, которые появятся в iOS 9, но привела концепцию «интеллекта».

Крейг Федериги, старший вице-президент Apple по разработке программного обеспечения, говорил о том, чтобы сделать Siri «проактивным помощником», который может напоминать вам о конкретной задаче или конкретной ссылке в браузере в конкретное время или когда вы попадаете в определенное место, Например, если вы получите текстовое сообщение о предстоящем событии, вы можете сказать Siri «напомнить мне об этом», и он поймет, что вы ссылаетесь на событие, и установите напоминание. Он может делать такие вещи, как автоматическое добавление приглашений в виде текстовых сообщений в ваши календари.

Он может запоминать приложения, которые вы обычно используете в определенное время суток, и представлять их вам в виде простого значка, а теперь добавляет «описательные карточки», которые дают вам больше информации о результатах поиска (который выглядел схожим по концепции). на карты в Google Now).

И, как правило, это только улучшилось. По словам Федериги, в прошлом году Apple сократила количество ошибок в слове на 40% до 5%. И умнее иметь дело с вещами в самой системе, теперь они могут отвечать на запросы на естественном языке, такие как «показать мне фотографии из Юты в августе прошлого года».

Самое интересное, что он предлагает API для поиска, чтобы найти контент в приложениях. Например, он говорил о возможности глубоко подключиться к приложению Airbnb, чтобы найти доступные варианты аренды в определенной области; или поиск информации о рецептах в другом приложении.

В демоверсии он продемонстрировал новый экран поиска, к которому вы попадаете, проведя пальцем прямо с главного экрана, и о том, как сама система предлагает советы о том, с кем вы можете связаться, основываясь на ваших самых частых контактах и ​​предстоящих событиях. Он показал, как он может затем «глубоко связать» конкретные приложения, чтобы принести вам больше информации. Подобные функции были доступны в Сири.

Apple подчеркнула одну вещь: конфиденциальность. Федериги сказал: «Мы смогли объединить интеллектуальные возможности всего, что есть в iOS 9, но мы делаем это так, чтобы не нарушить вашу конфиденциальность». В том, что, безусловно, звучало как раскопки в рекламной модели Google, он сказал, что Apple не добывает ваши фотографии, электронную почту, фотографии или информацию об облаке. Он сказал, что вся информация передается на устройство и остается на устройстве под вашим контролем, а когда система вынуждена отправлять информацию в облако для поиска или поиска трафика, она делает это анонимно без передачи информации третьим лицам. «Вы контролируете», сказал он.

Cortana Going Cross Платформа

Вы можете утверждать, что у Microsoft было преимущество в обеспечении многих функций личного помощника своим помощником Cortana для Windows Phone. Это был первый из трех крупных телефонных помощников, которые пытались действовать как настоящий помощник в плане планирования напоминаний и более глубокой интеграции с некоторыми телефонными приложениями.

Cortana является частью Windows 10 для настольных компьютеров и ноутбуков. Совсем недавно Microsoft объявила, что версия Cortana будет поставляться на телефоны iOS и Android вместе с приложением «Phone Companion», которое подключает ваш компьютер к Cortana, чтобы вы могли запускать задачи на одном устройстве и выполнять их на другом.

Как сказал Microsoft Джо Бельфиоре: «Вы можете попросить Кортану напоминать вам о необходимости забрать молоко в следующий раз, когда вы пойдете в продуктовый магазин, и тогда ваш телефон проснется и гудит вместе с напоминанием. Вы сможете отслеживать Полетайте с помощью Cortana на телефоне и ПК и получайте обновления на устройстве, на котором вы находитесь, чтобы ничего не пропустить."

Заключение

Во многих отношениях мы слышим, как все три компании движутся вместе, особенно в «инициативных» усилиях. Google и Apple заявили, что их инструменты будут более «упреждающими», используя термин для описания того, как они хотят, чтобы их личные помощники, по крайней мере, выглядели так, как будто они могут предвидеть то, что вы собираетесь искать.

Все три фокусируются на улучшении связи с другими приложениями в вашей системе, а Apple и Google объявляют о «глубоких связях». В частности, они хотят ссылаться на вещи в приложении, такие как переход на правильный экран в OpenTable, чтобы зарезервировать таблицу. В I / O вице-президент по разработке для Android Дейв Берк показал, что в Android M теперь есть лучшие способы перехода по ссылкам из электронной почты или веб-сайтов в нужное место в приложении без текущего экрана «устранения неоднозначности».

Результатом всего этого является размывание границ между операционной системой и приложениями, которые на ней работают, чтобы обеспечить более плавное взаимодействие и системы, которые действительно знают о вас намного больше.

Все это должно быть весьма полезным. Но по ряду причин все это может быть страшным. Слишком легко представить возможность неправильного использования данных, будь то чрезмерно усердный маркетинг или реальное вторжение в личную жизнь. Мне любопытно, как каждая из компаний решит эту проблему. Интересно, если одна из причин, по которой Google не называет свой сервис «личным помощником», заключается в том, что это звучит немного отталкивающе от компании, чья основная бизнес-модель ориентирована на сбор данных о людях и их использование для более точных целей.

Также легко переоценить возможности этих систем. Концепция всезнающей, всевидящей машины может быть страшной, но меня не волнует, что любая из этих систем развивает «сильный ИИ» в смысле «Терминатора Скайнет» или «Космическая одиссея 2001 года » HAL в любое время в ближайшее время. Как сказал один из участников недавней дискуссии, которую я посетил, сказал: «Подумай, Джарвис, а не HAL», говоря о полезной разведке в костюме, которую используют в фильмах «Железный человек», в отличие от убийственной машины 2001 года. вопрос не в том, являются ли эти системы слишком умными, а в том, будут ли они достаточно умными, чтобы быть действительно полезными, или мы обнаружим, что используем их просто в качестве внешнего интерфейса для веб-поиска.

Конечно, дьявол кроется в деталях, и мы не будем точно знать, насколько хорошо работает какая-либо из систем, пока не появятся новые версии. В то время как распознавание голоса улучшается, расширение его на новые домены вызывает больше проблем. И мне неясно, насколько хорошо будут работать системы, позволяя вам выбирать сервисы, которые вы хотите использовать, вместо того, чтобы по умолчанию использовать Apple или собственные сервисы Google.

Но общая концепция ясна, и полезность может быть потрясающей. При правильном развертывании такие сервисы должны сделать наши устройства более удобными в использовании, более интеллектуальными и более персонализированными. У них будут проблемы и возникнут некоторые проблемы, но я предполагаю, что они сделают больше, чтобы изменить то, как мы взаимодействуем с нашими устройствами, чем что-либо еще с сенсорного экрана.

Apple, Google, и путь к всезнайке помощника