Кодирование звуковой информации Информатика и ИКТ 10 класс Гимназия 1 г. Новокуйбышевска Учитель информатики: Красакова О.Н.
Что такое звук? С помощью микрофона звук преобразуется в так называемый аналоговый электрический сигнал. sound_high_low.swf sound_quiet_aloud.swf Аналоговый сигнал – это произвольное изменение некоторой величины в заданном диапазоне. Звук – это колебания среды (воздуха, воды), которые воспринимает человеческое ухо.
Оцифровка Цифровой сигнал Оцифровка – это преобразование аналогового сигнала в цифровой код.
Дискретизация 0 T 2T2T 0 T 2T2T Временная дискретизация звука – процесс, при котором, во время кодирования непрерывного звукового сигнала, звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды. Чем больше амплитуда сигнала, тем громче звук. Аналоговый сигнал Цифровой сигнал
Частота дискретизации Качество цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее «лесенка» цифрового звукового сигнала повторяет кривую аналогового сигнала. Частота дискретизации звука это количество измерений громкости звука за одну секунду. Измеряется в ГЦ.
Частота дискретизации Для кодирования звука в компьютерах чаще всего используются частоты дискретизации 8 кГц (плохое качество, но достаточно для распознавания речи), 11 кГц, 22 кГц, 44,1 кГц (звуковые компакт диски), 48 кГц (фильмы в формате DVD), 96 кГц и 192 кГц (высококачественный звук в формате DVD audio).
Глубина кодирования звука В процессе дискретизации на хранение одного отсчета в памяти отводится ограниченное место. Представим себе, что на один отсчет выделяется 3 бита. При этом код каждого отсчета – это целое число от 0 до 7. Весь диапазон возможных значений сигнала, от 0 до максимально допустимого, делится на 8 полос, каждой из которых присваивается номер (код). Все отсчеты, попавшие в одну полосу, имеют одинаковый код. Т.о. при кодировании звука выполняется дискретизация с потерей информации
Глубина кодирования звука Если известна глубина кодирования, то количество уровней громкости цифрового звука (уровень дискретизации) можно рассчитать по формуле. N = 2 I Недорогие звуковые карты имеют разрядность бит, большинство современных – 24 бита, что позволяет использовать 2 24 = различных уровней. Глубина (разрядность) кодирования звука это количество бит, которое отводится на одно измерение звука. Преобразование измеренного значения сигнала в число называется дискретизацией по уровню. Эту операцию выполняет аналого цифровой преобразователь (АЦП) звуковой карты.
Форматы графических файлов WAV (Waveform audio format), часто без сжатия (размер!) MP3 (MPEG-1 Audio Layer 3, сжатие с потерями) WMA (Windows Media Audio, потоковый звук, сжатие) OGG (Ogg Vorbis, открытый формат, сжатие с потерями) С помощью оцифровки можно закодировать любой звук, который принимает микрофон (человеческого голоса, шум прибоя и т.п.). Однако у этого метода есть и недостатки: при оцифровке звука всегда есть потеря информации (из за дискретизации); звуковые файлы имеют, как правило, большой размер, поэтому в большинстве современных форматов используется сжатие.
Инструментальное кодирование MIDI (Musical Instrument Digital Interface) - цифровой интерфейс музыкальных инструментов (файлы *.MID) Точно воспроизводит звучание инструментов, без потери качества. В формате MIDI хранятся нота (высота, длительность) музыкальный инструмент (можно использовать 128 мелодических и 47 ударных инструментов) параметры звука (громкость, тембр) многоканальный звук (полифония) Нельзя закодировать человеческий голос MIDI-клавиатура
Формула дискретизации V = M * i * t M – частота дискретизации (в Гц) i – глубина кодирования (в бит) t – время звучания (в сек) V – объем файла (режим стерео – умножить на 2, квадро – на 4)
Задача 1 Производится одноканальная (моно) звукозапись с частотой дискретизации 16 кГц и глубиной кодирования 24 бита. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах? 1) 0,2 2) 2 3) 34) 4 Решение: 16 кГц = Гц; V = M*i*t V = * 24 *60 = бит 2,7 Мбайт Наиболее близкое значение 3 Мбайта Ответ: 3)
Задача 2 Объем звукового файла 5,25 Мбайт, разрядность звуковой платы – 16. Какова длительность звучания этого файла (примерно), записанного с частотой дискретизации 22,05 кГц? V = M * i * t t = 5,25 * 8 * 1024 *1024 / ( 22,05 * 1000 * 16 ) = 125 сек V = 5,25 Мбайт М = 22,05 кГц i = 16 бит t = V / (M * i)
Задача 3 Производится одноканальная (стерео) звукозапись с частотой дискретизации 64Гц. При записи использовались 32 уровня дискретизации. Запись длится 4 минуты 16 секунд, её результаты записываются в файл, причём каждый сигнал кодируется минимально возможным и одинаковым количеством битов. Вычислить размер полученного файла, выраженному в килобайтах? Решение: 32 = 2 5 – Глубина кодирования i=5 бит 4 мин 16 с = = 256 с V = = байт = 5 2 Кбайт = 10 Кбайт Ответ: 10 Кбайт.
Источники: Использованы материалы учебника К.Ю. Полякова, А.П. Шестакова, Е.А. Еремина. Информатика и ИКТ. 10 класс (профильный уровень)