Гибридный синтез

Гибридный синтез — синтез, который умеет менять слова в аудиозаписи в реальном времени и озвучивать переменные голосом диктора: естественно и без склеек.

Под переменные подходят любые данные, которые изменяются от абонента к абоненту: имя, дата, ФИО врача, название филиала и так далее.

Афанасий Петрович, вы записаны к дерматологу Грибковой Наталье Александровне в филиал поликлиники №2 на улице Введенской 15 октября в 17:30. Подтверждаете запись?

Если в вашем сценарии во фразе бота несколько переменных, то вариантов озвучки всей реплики могут быть сотни — предзаписью эту задачу не решить.

Чтобы робот мог произнести фразу с переменными голосом того же диктора, с его интонацией, а реплика при этом звучала естественно, без заметных склеек, нужна специальная технология. Такая технология есть у Just AI — гибридный синтез пользовательских переменных.

Вот как звучит запись диктора:

Вот запись обычного синтеза TTS:

А вот решение, которое предлагаем мы — гибридный синтез пользовательских переменных:

А вот реальный звонок пользователю:

Материалы и ссылки для изучения:

На лендинге можно проэкспериментировать со звучанием синтеза.
Публичный вебинар, который проводил продуктовый менеджер Саша Чернин. Часть про подключение синтеза начинается с 36 минуты.

Документация