Штучний інтелект навчили точно імітувати людський голос

Еспресо.TV
Штучний інтелект навчили точно імітувати людський голос

Вчені з Китаю анонсували технологію Deep Voice, яка працює на основі машинного навчання і за допомогою коротких семплів здатна обдурити систему розпізнавання голосу

Про це повідомляє Daily Mail.

Вона тренувалася на основі звукового запису, що триває більше 800 годин і включає в себе близько 2400 різних голосів. Як розповіли розробники, для ефективної роботи нейромережі потрібно близько 100 п'ятисекундних звукових сигналів.

Deep Voice здатна імітувати тембр, інтонацію голосу і робить їх схожими на справжні. На думку творців, вона може використовуватися в ролі цифрових помічників, в записі голосу для відеоігор, музики і в синхронному перекладі.

Крім того, вона може служити тим, хто втратив можливість говорити. Вчені також зазначили, що Deep Voice вміє змінювати голос, роблячи його чоловічим замість жіночого або додаючи йому іноземний акцент.

"Це справжній прорив з технічної точки зору, - зазначив один з авторів розробки Лео Зу. - Нам вдалося вирішити складну генеративну проблему, а саме, ми змогли синтезувати живу мову з усіма її особливостями".

Це не перша інновація в цьому напрямку - канадські розробники раніше презентували голосовий сервіс під назвою Lyrebird. Він стискає всі індивідуальні мовні характеристики в дуже короткий запис, відтворюючи 1000 пропозицій всього за півсекунди.

Він також здатний копіювати будь-які побутові звуки - наприклад, працюючу бензопилу або спів конкретного виду птахів, може зображати сердитий, веселий або співчуваючий тон. Канадська розробка, також як і Deep Voice, застосовується для роботи голосових помічників, озвучування мультимедійних продуктів і синтезу мови людей з обмеженими можливостями.

Однак канадські і китайські розробники відзначають, що у технологій є загальна проблема: їм можуть скористатися шахраї для того, щоб вводити людей в оману або скористатися можливостями програм, які працюють на основі розпізнавання мови. Юристи також висловлюють побоювання, що незабаром аудіозаписи будуть менш значущим доказом у судах.

Читайте також: Всі говорять про штучний інтелект. Простими словами пояснимо, що це