Гибридный синтез

Гибридный синтез — синтез, который умеет менять слова в аудиозаписи в реальном времени и озвучивать переменные голосом диктора: естественно и без склеек.

Под переменные подходят любые данные, которые изменяются от абонента к абоненту: имя, дата, ФИО врача, название филиала и так далее.

Афанасий Петрович, вы записаны к дерматологу Грибковой Наталье Александровне в филиал поликлиники №2 на улице Введенской 15 октября в 17:30. Подтверждаете запись?

Если в вашем сценарии во фразе бота несколько переменных, то вариантов озвучки всей реплики могут быть сотни — предзаписью эту задачу не решить.

Чтобы робот мог произнести фразу с переменными голосом того же диктора, с его интонацией, а реплика при этом звучала естественно, без заметных склеек, нужна специальная технология. Такая технология есть у Just AI — гибридный синтез пользовательских переменных.

  • Вот как звучит запись диктора:
  • Вот запись обычного синтеза TTS:
  • А вот решение, которое предлагаем мы — гибридный синтез пользовательских переменных:
  • А вот реальный звонок пользователю:

Материалы и ссылки для изучения:

  1. На лендинге можно проэкспериментировать со звучанием синтеза.

  2. Публичный вебинар, который проводил продуктовый менеджер Саша Чернин. Часть про подключение синтеза начинается с 36 минуты.

  1. Документация