Тонкая настройка речи в API: паузы, ударения, эмоции
Послушать статьюОзвучено Голосарь · голос «Глеб»

В Голосарь нет SSML-разметки — выразительностью управляют понятные параметры запроса /api/v1/tts и инструменты редактора.
Основные параметры
- instruct — эмоция и манера (по-английски, напр.
"calm, friendly"). - emotion — записанная эмоция студийного голоса (joyful, sad, serious…).
- speed и gain_db — темп и громкость.
- eq — тембр по полосам частот; effect — пресет звучания (podcast, audiobook…).
Паузы и ударения
Паузу и смысловой нажим расставляют в редакторе (панель «Как читать») — это сохраняется как segments и передаётся в синтез поэлементно. Ударение надёжно задаётся буквой «ё» и заглавной гласной.
Пауза в нужном месте меняет смысл фразы сильнее, чем выбор голоса.
Попробуйте сами — бесплатный стартовый пакет символов при регистрации.


