Формантный синтезатор речи. Часть 1
Полюсы и нули – иное понимание Полюс – это пара чисел (B, F), B – ширина форманты, F – частота форманты Нуль – это пара чисел (B N, F N ), B N – ширина антиформанты, F N – частота антиформанты
Формантный фильтр - число «пи» b = B/Fs, где B – ширина форманты (в Гц) Fs – частота дискретизации (в Гц) f = F/Fs, F – частота форманты А – амплитуда форманты
АЧХ формантного фильтра
Антиформанта Антиформанта – такая область спектра, в которой энергия существенно ослаблена (по сравнению с другими областями) Физически, это проявляется в том случае, если вокальный тракт разветвлен (например, назальные)
Антиформантный фильтр - число «пи» b = B N /Fs, где B N – ширина антиформанты (в Гц) Fs – частота дискретизации (в Гц) f = F N /Fs, F – частота антиформанты А N – коэффициент ослабления (амплитуда) антиформанты
АЧХ антиформантного фильтра
Антиформанта В реальности, разветвление не только «порождает» антиформанты, но и дополнительные форманты. Поэтому часто говорят, что разветвление приводит к появлению пар «полюс-нуль». В отличие от формант, антиформанты ОЧЕНЬ СЛОЖНО измерять по акустическому сигналу Можно ли синтезировать назальные без антиформант?
Каскадный синтезатор Входной сигнал на первый формантный фильтр (1-я форманта) – сигнал возбуждения Входной сигнал на 2-ю форманту – отклик первой форманты Входной сигнал на 3-ю форманту – отклик 2-й форманты И т.д.
Параллельный синтезатор
Возбуждение одновременно подается на все формантные фильтры Отклики по каждому фильтру суммируются Результат суммирования и есть речь
Синтезатор Клаттовского типа Dennis Klatt – создатель одного из лучших формантных синтезаторов для английского языка В этом синтезаторе для синтеза гласных и сонорных используется каскадное соединение, для синтеза остальных согласных – параллельное соединение
Голосовое возбуждение
Liljencrants-Fant model (LF- model)
LF: 1-й параметр
LF: 2-й параметр
LF: 3-й параметр
Типы фонации Значения параметров LF-модели напрямую связаны с типом фонации. Например, для нейтральной фонации p1 = 0.6, p2 = 0.1, p3 = 0.2 Для скрипучего голоса p1 = 0.3, p2 = 0.1, p3 = 0.2 (см. Childers, 1991)