Электронная библиотека книг Александра Фролова и Григория Фролова.
Shop2You.ru Создайте свой интернет-магазин
Библиотека
Братьев
Фроловых
[Назад] [Содержание] [Дальше]

Синтез и распознавание речи. Современные решения

© А.В. Фролов, Г.В. Фролов, 2003



Преобразование потока чисел в звук

Итак, мы рассмотрели принципы действия устройств, позволяющих преобразовать звуковые колебания воздуха в колебания электрического тока, а затем оцифровать полученный электрический сигнал, превратив его в поток чисел. Проводя аналогию между компьютером и человеком, мы изучили слуховые «органы» компьютера.

Теперь мы займемся речевыми «органами» компьютера, с помощью которых числовой поток может быть преобразован обратно в звуковые колебания воздуха.

Цифро-аналоговый преобразователь

Главный компонент системы преобразования цифрового потока данных в звук находится на плате звукового адаптера, и называется цифро-аналоговым преобразователем ЦАП (Digital to Analog Converter, DAC).

Цифро-аналоговый преобразователь имеет несколько цифровых входов и один аналоговый выход. На цифровые входы подается поток чисел, представляющий собой оцифрованный или синтезированный звук, а к аналоговому выходу через усилитель подключается звуковая колонка или головные телефоны.

Схему подключения цифро-аналогового преобразователя мы показали на рис. 2-8.

Рис. 2-8. Цифро-аналоговый преобразователь

Заметим, что на выходе цифро-аналогового преобразователя формируется последовательность импульсов, амплитуда которых соответствует значениям исходного аналогового сигнала, измеренным при оцифровке. При этом вместо плавной кривой линии, представляющей зависимость амплитуда сигнала от времени мы получим набор прямоугольных импульсов, показанных на рис. 2-9.

Рис. 2-9. Форма сигнала на выходе цифро-аналогового преобразователя

Спектр такого сигнала будет содержать много гармоник, отсутствовавших в исходном аналоговом сигнале.

К чему это может привести?

К тому, что цифровой сигнал, преобразованный в аналоговую форму, будет звучать не так, как исходный оцифрованный звук. Чтобы уменьшить искажения, вызванные цифро-аналоговым преобразованием, используются фильтры высоких частот.

Фильтрация цифрового сигнала

Для сглаживания импульсов, получающихся после цифро-аналогового преобразования, на платах звуковых адаптеров имеются специальные фильтры верхних частот (рис. 2-10). Эти фильтры отрезают все частоты, находящиеся выше диапазона звуковых частот, т.е. выше 20 000 Гц.

Рис. 2-10. Подключение фильтра высоких частот

Благодаря инерционности излучающих систем, головные телефоны и звуковые колонки тоже действуют как фильтры верхних частот. Если звуковая колонка активная и содержит внутри себя усилитель, то этот усилитель может также снабжаться фильтром верхних частот.

На рис. 2-11 мы показали результат работы фильтра верхних частот. Теперь прямоугольные импульсы превратились в кривую линию, форма которой приблизительно соответствует форме исходного сигнала до оцифровки.

Рис. 2-11. Сглаженный сигнал.

При необходимости в программе синтеза речи можно создать программный фильтр верхних частот. Однако на практике в этом нет необходимости, так как для работы вполне достаточно фильтра, предусмотренного в стандартном звуковом адаптере.

[Назад] [Содержание] [Дальше]