OpenAI представила ШІ-інструмент, який здатен озвучити текст голосом будь-якої людини

Компанія OpenAI презентувала новий інструмент на основі штучного інтелекту Voice Engine, який здатен озвучувати тексти голосом будь-якої людини. Про це повідомляється на сайті компанії, передає Укрінформ.

Voice Engine використовує 15-секундний зразок звучання мови конкретної людини, щоб відтворити його під час озвучення тексту. Технологію розробляли з кінця 2022 року і спочатку для озвучення використовувалися попередньо встановлені зразки голосів.

Поки що публічного доступу до Voice Engine немає, оскільки розробники побоюються недоброчесного його використання.

“Ми сподіваємося розпочати діалог про відповідальне застосування синтетичних голосів і про те, як суспільство може адаптуватися до цих нових можливостей. На основі цих обговорень і результатів тестів ми ухвалимо обґрунтованіше рішення щодо того, чи варто розгортати цю технологію в масштабі і в який спосіб це робити”, – зауважили в OpenAI.

У компанії зазначили, що Voice Engine лежить в основі функції “Читання вголос” чат-бота ChatGPT.

На думку розробників, цю технологію можна буде використовувати для допомоги тим, хто не вміє читати, а також дітям; для перекладу відео та подкастів; для допомоги відновлення голосу пацієнтам з раптовими або дегенеративними станами мовленнєвого апарату. Крім того, Voice Engine може дати змогу людям з порушенням слуху спілкуватися.

Приклади застосування Voice Engine у кожному із зазначених випадків наведено в блозі.

Як повідомляв ІМІ, OpenAI презентувала 15 лютого нову систему штучного інтелекту Sora, яка може створювати реалістичні відео на основі текстових запитів користувачів.