Кодирование и обработка звуковой информации
Звуковая информация. Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся интенсивностью и частотой. Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звука различных громкости и тона. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука (рис. 1.1).
Звуковая информация. Рис Зависимость громкости и высоты тона звука от интенсивности и частоты звуковой волны
Звуковая информация. Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до колебаний в секунду (высокий звук). Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица "децибел". Уменьшение или увеличение громкости звука на 10 дБ соответствует уменьшению или увеличению интенсивности звука в 10 раз.
Звуковая информация. Таблица 5.1. Громкость звука Звук Громкость в децибелах Нижний предел чувствительности человеческого уха 0 Шорох листьев 10 Разговор60 Гудок автомобиля 90 Реактивный двигатель 120 Болевой порог 140
Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.
Временная дискретизация звука Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек" (рис. 1.2).
Временная дискретизация звука Рис Временная дискретизация звука
Частота дискретизации Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую диалогового сигнала. Частота дискретизации звука - это количество измерений громкости звука за одну секунду. Частота дискретизации звука может лежать в диапазоне от 8000 до измерений громкости звука за одну секунду.
Глубина кодирования звука Каждой "ступеньке" присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука. Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.
Глубина кодирования звука Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле: N = 2 I N = 2 I Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно: N = 2I = 216 = В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код , а наибольшему
Качество оцифрованного звука Качество оцифрованного звука Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").
Качество оцифрованного звука Качество оцифрованного звука Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук): 16 бит × × 2 = бит = байт = 93,75 Кбайт.
Звуковые редакторы Звуковые редакторы Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши. Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.). Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV или в формате со сжатием МР3. При сохранении звука в форматах со сжатием отбрасываются "избыточные" для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью. Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном виде).
Контрольные вопросы Контрольные вопросы 1. Как частота дискретизации и глубина кодирования влияют на качество цифрового звука?
Задания Задания 1. Задание с выборочным ответом. Звуковая плата производит двоичное кодирование аналогового звукового сигнала. Какое количество информации необходимо для кодирования каждого из возможных уровней интенсивности сигнала? 1) 16 битов; 2) 256 битов; 3) 1 бит; 4) 8 битов.
Задания Задания 2. Задание с развернутым ответом. Оценить информационный объем цифровых звуковых файлов длительностью 10 секунд при глубине кодирования и частоте дискретизации звукового сигнала, обеспечивающих минимальное и максимальное качество звука: а) моно, 8 битов, 8000 измерений в секунду; б) стерео, 16 битов, измерений в секунду.
Задания Задания 3. Задание с развернутым ответом. Определить длительность звукового файла, который уместится на дискете 3,5" (учтите, что для хранения данных на такой дискете выделяется 2847 секторов объемом 512 байтов каждый): а) при низком качестве звука: моно, 8 битов, 8000 измерений в секунду; б) при высоком качестве звука: стерео, 16 битов, измерений в секунду.