Дом мнения Ai (также) сила добра | Бен Диксон

Ai (также) сила добра | Бен Диксон

2024

Видео: Мультики про машинки новые серии 2017 - Кто сильнее! Лучшие мультфильмы для детей /#мультик игра (Ноябрь 2024)

Видео: Мультики про машинки новые серии 2017 - Кто сильнее! Лучшие мультфильмы для детей /#мультик игра (Ноябрь 2024)

В 2017 году Амиотрофический Боковой Склероз (ALS), разрушительное неврологическое расстройство, лишил Пата Куинна, основателя знаменитого Ice Bucket Challenge, его способности говорить.

В 2018 году искусственный интеллект помог ему вернуть его.

Благодаря достижениям в машинном обучении и глубоком обучении алгоритмы искусственного интеллекта стали очень хорошими в подражании людям. Но в то время как многие выдающиеся события в космосе были негативными, имитационная сила ИИ была силой позитивных изменений для Куинна.

«Большинство людей, живущих с БАС (также известной как болезнь двигательных нейронов), в конечном итоге парализованы и не могут общаться ни с чем, кроме искусственных« компьютерных »голосов», - говорит Оскар Вестердал, соучредитель Project Revoice, инициативы, цель которой - помочь пациентам с БАС, таким как Куинн., Чтобы воссоздать голос Куинна, Project Revoice сотрудничал с Lyrebird, одной из нескольких компаний, которые используют AI для клонирования голоса человека - группы, в которую также входят Google WaveNet и Voicery, стартап с поддержкой Y Combinator, который использует AI для создания синтезированных голосовых записей.,

Как глубокое обучение порождает человеческие голоса

За этими приложениями стоят алгоритмы глубокого обучения, популярная ветвь ИИ, которая просматривает большие наборы данных для понимания и шаблонов, которые не могут быть получены с помощью традиционного программного обеспечения на основе правил. Когда вы обучаете синтезатор голоса с глубоким обучением достаточным количеством записей голоса, он создает цифровую модель, которая представляет голос человека и может генерировать новые образцы голоса.

До появления технологии синтеза голоса на базе AI пациентам с БАС приходилось использовать общие цифровые голоса, которые не были их собственными. Другие технологии могли соединять предварительно записанные предложения с голосом пациента, но результаты были слишком искусственными и требовали десятки часов записи голоса, чтобы быть минимальными.

Приложения глубокого обучения, с другой стороны, требуют гораздо меньше данных и обеспечивают лучшие результаты. «То, чего может достичь Lyrebird всего за пару часов звука, это замечательно - он дает людям полный клон цифрового голоса, поэтому они могут говорить все, что хотят», - говорит Вестердал.

Воссоздание голоса безмолвного человека

Одним из ограничений приложений глубокого обучения является их зависимость от высококачественных образцов данных для обучения их нейронных сетей. Проблема пациентов с БАС заключается в том, что, когда они теряют свои голоса, запись голосовых образцов невозможна. К счастью, Куинн часами записывал выступления и интервью.

«Самой большой проблемой было качество. Эта технология полностью зависит от наличия последовательных высококачественных записей, которые также следуют точному сценарию, поэтому нам пришлось работать со звуковой студией, чтобы вручную« переосмыслить »и расшифровать каждую строку диалога, которую мы могли найти. Пэт ", говорит Вестердал.

«Мы немного боялись, что не сможем обеспечить отличное качество для создания голоса Пэт», - говорит Хосе Сотело, соучредитель Lyrebird. «Поскольку мы не могли получить чистые записи, окончательное качество искусственного голоса не является идеальным. Мы думаем, что можем сделать намного лучшую работу с чистыми записями».

Результаты все еще звучат немного неестественно и синтетически. Но для Куинн, который использовал общий голос для общения, разница была драматичной. «Услышав мой голос с помощью этой новой технологии, я был поражен! Чтобы пациенты знали, что они могут иметь собственный голос после того, как ALS заберет его, это изменит образ жизни людей с ALS», - говорит он.

Куинн рекомендует пациентам БАС записывать свои голоса, пока не стало слишком поздно. «После того, как я снова услышал свой собственный голос, мне нужно, чтобы пациенты с БАС знали, что запись их голоса невероятно важна», - говорит он.

Уравновешивание негативного использования синтезаторов AI

Ранее в этом году, FakeApp, ИИ с питанием лицом замены приложений, вызвало натиск поддельных порнографического видео с участием знаменитостей и политиков. Есть опасения, что такие приложения, как FakeApp и Lyrebird, откроют новую эру поддельных новостей, мошенничества и подделки.

На странице этики на веб-сайте Lyrebird ранее признавалось, что технология может «иметь потенциально опасные последствия, такие как вводящие в заблуждение дипломаты, мошенничество и, в более общем плане, любые другие проблемы, вызванные кражей личности кого-то другого».

Чтобы понять это, на сайте компании есть несколько синтезированных записей, созданных с помощью голосов Дональда Трампа и Барака Обамы.

@realDonaldTrump https://t.co/N6DRPdEGPT pic.twitter.com/G30DvmQNdk
- Lyrebird AI (@LyrebirdAi) 4 сентября 2017 г.

История Куинна могла бы помочь пролить свет на положительные стороны отрасли, которая расстроилась из-за потенциально жуткого и неэтичного использования своих приложений. «Важно, чтобы люди осознали яркую сторону этой технологии», - напоминает Сотело Лирохвоста.

Помимо медицинского применения, приложения искусственного интеллекта могут служить и другим производительным целям. Voicery предоставляет брендам индивидуализированные оцифрованные голоса, основанные на алгоритмах ИИ. Google также экспериментирует с WaveNet, чтобы предоставить пользователям своих устройств с Google Assistant более естественный опыт. Другие области, где эта технология полезна, включают автоматизацию аудиокниг или упрощение дублирования голоса в фильмах.

Этические и юридические препятствия, несомненно, возникнут, и дебаты продолжатся. Но для Куинна ИИ - это сила добра. «Я не хочу звучать как компьютер», - говорит он. «Я хочу звучать как я».