Aimyvoice и озвучка контента


Мы в Just AI иногда используем Aimyvoice для озвучки небольших видео и фраз для проектов. Никаких технических навыков не нужно, главное наловчиться.

Для того, чтобы наловчиться озвучивать контент в Aimyvoice, нужно разобраться:

  1. Как работает сам редактор
  2. Как выбирать голоса
  3. Как работать с разметкой пауз и интонаций

Шаг 1. Как работает редактор

Самый простой шаг в нашем гайде. В Aimyvoice нет сложных настроек, только создание проекта, строка для текста, выбор голоса и левое меню управления звучанием.



Ограничения по символам

Процесс, когда Aimyvoice озвучивает введенный вами текст, называется синтезом речи. Синтез речи — сложный многосоставной процесс, поэтому у вас не получится озвучить кусок размером с главу Войны и мира. Ограничение — 500 символов. Aimyvoice подсветит вам, если фраза не умещается в отведенное мето.

varenukha



Если вы еще не зарегистрированы в Aimyvoice или не хотите оплачивать голос, вы можете протестировать сервис на ленгдинге.

Шаг 2. Как выбирать голоса

В Aimyvoice каталог из 21 голоса, все они умеют озвучивать ваш текст на русском языке. Это синтезированные голоса реальных дикторов и настоящих людей. У каждого диктора — своя стоимость, она указана на карточке.

У каждого диктора есть свои особенности речи, интонаций и стиля, как и у любого человека. Это не роботизированные, а живые голоса. Поэтому под разные проекты подойдут разные голоса. Экспериментируйте, слушайте, как ваш текст синтезируется разными дикторами.

Шаг 3. Как работать с разметкой

Разметка (SSML-теги) — такие теги, которые вы вручную вставляете в текст фразы для того, чтобы "помочь" голосу диктора поставить ударение в нужном месте, сделать паузу или регулировать темп и манеру речи.

Никаких четких правил нет. Разметка действительно помогает сделать произношение лучше и интереснее, но эту работу можно назвать творческим экспериментом: вы сами из набора тегов создаете именно то звучание, которое вам нужно. Вот так могут выглядеть эксперименты с разметкой:

shvabrin

Почему вообще нужны теги?

Каждый диктор начитывает примерно 20 часов текста: вопросительные и повествовательные интонации, цитаты из классики или Гарри Поттера. Это живая речь. Из этого материала наши RnD коллеги создают модели, которые умеют озвучивать ваш текст, потому что обучены на большом количестве материалов. Тем не менее никакое количество часов живой речи не сможет сделать так, что ваш текст будет озвучен идеально. Это нормально. Для этого и нужны помощники SSML-теги.

Послушайте, как звучит первая строчка без тегов со скрина выше:


Как использовать теги?

Самые популярные теги: ударение, скорость речи, паузы и громкость. Давайте сначала поговорим о них.

Совет 1. Основная задача при использовании тегов: прослушивать аудиозапись N-количество раз и добавлять те паузы или ударения, которые вам нравятся.