Дом мнения Как ai, ml преобразует речь в текст, языковые переводы | Тим Баджарин

Как ai, ml преобразует речь в текст, языковые переводы | Тим Баджарин

Видео: Future of AI in Gaming Industry | Augmented Reality | Virtual Reality | AI Applications | Edureka (Октября 2024)

Видео: Future of AI in Gaming Industry | Augmented Reality | Virtual Reality | AI Applications | Edureka (Октября 2024)
Anonim

Одной из самых впечатляющих демонстраций в Google I / O был Duplex, искусственный интеллект, который звонил в места работы, в данном случае в парикмахерскую и ресторан, чтобы записывать встречи. Люди на другом конце линии, казалось бы, не были мудрее, и Дуплекс с легкостью справлялся с проблемами, как, например, когда ресторан сказал, что не принимает бронирование для небольших вечеринок.

Это конкретное объявление AI получило широкое освещение в Google I / O, но AI и машинное обучение были распространены во всех продуктах и ​​услугах, представленных на конференции разработчиков. Достаточно взглянуть на этот график, который Google показал на аналитическом событии, ориентированном на AI, за день до открытия ввода / вывода.

На этом мероприятии было показано еще две вещи, которые я считаю потенциальными игроками.

Во-первых, как ИИ применяется для перевода голоса в текст. Цель состоит в том, чтобы в течение следующих нескольких лет получить точность до 99% с помощью AI и ML. Тем не менее, демонстрации, в которых они диктовали комментарии к различным приложениям G-Suite, были уже довольно точными. Мы также увидели более детальную демонстрацию Smart Compose, где человек пишет предложение в Gmail, а Smart Compose пишет следующее предложение для вас на основе контекста первого предложения.

Различные продукты для распознавания голоса, такие как Dragon Dictate, были на рынке в течение многих лет. Но эти программы опирались на локализованное программное обеспечение и пользовались преимуществами текущей вычислительной мощности, доступной на момент каждого выпуска. Эти программы с годами становились лучше, но если вы рекламируете AI и ML, уровень точности обязательно улучшится.

Google понимает важность преобразования текста в текст, поскольку он связан с нашей повседневной жизнью. Точный голосовой интерфейс имеет решающее значение при ответе на сообщение во время вождения. Это значимый способ ответить на электронное письмо или текстовое сообщение на носимых или смартфонах. Это в конечном итоге станет ценным вкладом при использовании очков смешанной реальности, где использование голоса в качестве части процесса навигации и преобразования голоса в текст необходимо для различных типов приложений AR.

Второе - это то, как AI и ML используются в Google Translate, что будет действительно преобразующим, когда переводы происходят в режиме реального времени. Для международного путешественника, который говорит только по-английски, этот тип перевода был бы находкой. Существуют некоторые портативные устройства, которые пытаются перевести то, что вы говорите, на местный язык, но в настоящее время они имеют много ограничений.

Google следит за этим типом перевода, поэтому можно с уверенностью сказать, что в скором времени мы увидим некоторые реальные достижения в более точном языковом переводе на телефонах Android. Apple также проводит исследования в области искусственного интеллекта и ML, посвященные различным аспектам голосового и текстового перевода, поэтому вместе с потенциальными партнерами она может когда-нибудь предложить решение для перевода с мобильного языка на iOS.

ИИ и МЛ окажут существенное влияние на голосовой перевод текста, и его наиболее заметный эффект может проявляться как часть пользовательского интерфейса в AR и VR или очках смешанной реальности. Лично меня больше всего волнуют языковые переводы, так как это облегчит мои путешествия по миру.

Как ai, ml преобразует речь в текст, языковые переводы | Тим Баджарин