Звук, который мы слышим,- это звуковая волна с непрерывно меняющейся интенсивностью и частотой (аналоговый сигнал). Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звуков различных громкости и тона. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука
Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до колебаний в секунду (высокий звук). Для измерения громкости звука применяется специальная единица «децибел». Уменьшение или увеличение громкости звука на 10 дбл соответствует уменьшению или увеличению интенсивности звука в 10 раз.
Звук Громкость в децибелах Нижний предел чувствительности человеческого уха 0 Шорох листьев 10 Разговор 60 Гудок автомобиля 90 Реактивный двигатель 120 Болевой порог 140
Чтобы записать непрерывный звук на компьютер, нужно преобразовать его в цифровую форму, что и делает аналого-цифровой преобразователь (АЦП), размещенный на звуковой плате. Для воспроизведения используется цифро-аналоговый преобразователь
МИКРОФОН АУДИОАДАПТЕР ПАМЯТЬ ЭВМ Звуковая волна Переменный электрический ток Двоичный код
АУДИОАДАПТЕР ПАМЯТЬ ЭВМ ДИНАМИК Звуковая волна Переменный электрический ток Двоичный код
МИКРОФОН АУДИОАДАПТЕР ПАМЯТЬ ЭВМ ДИНАМИК Звуковая волна Переменный электрический ток Двоичный код
Оцифровка (перевод в цифровую форму) аналоговый сигнал цифровой сигнал
Временная дискретизация Временная дискретизация – это разбиение непрерывной звуковой волны на отдельные маленькие временные участки, причем для каждого участка устанавливается определенная величина амплитуды. t A(t)
Таким образом непрерывная зависимость амплитуды сигнала от времени А(t) заменяется на дискретную последовательность уровней громкости (чем больше амплитуда, тем громче сигнал). На графике это выглядит как замена гладкой кривой на последовательность «ступенек» A(t) После такого преобразования непрерывный сигнал представляется последовательностью чисел , которые с помощью звуковой платы преобразуются в числовой двоичный код: В данном примере цифровой сигнал может принимать лишь 6 различных уровней (качество такого преобразования невысокое). Количество различных уровней зависит от звуковой карты.
глубиной кодирования звука (или квантование звука) Разрешение звуковой карты называется еще глубиной кодирования звука (или квантование звука) Квантование звука заключается в том, что мгновенное значение звуковой амплитуды измеряется в битах и с ограниченной точностью. отсчетами Моменты измерения амплитуды называются отсчетами (от анг. sample, сэмплы). частотой дискретизации – Частоту, с которой производят измерение сигнала, называют частотой дискретизации – это количество измерений громкости звука за одну секунду.
Качество преобразования непрерывного сигнала в цифровой зависит от двух параметров: разрешения звуковой карты (I) – это количество распознаваемых сигналов; частоты дискретизации (D) – это количество отсчетов в секунду. Одно измерение в сек. соответствует частоте 1 Гц. Частота, с которой происходит выборка сигналов, может принимать значения: 5,5 КГц, 11 КГц, 22,05 КГц, 44,1 КГц и 48 КГц.
Чем выше частота дискретизации и чем больше разрядов отводится для каждого отсчета (сэмпла), тем точнее будет представлен и потом воспроизведен звук. 8 бит = 256 уровней 16 бит = уровней 32 бита = 2 32 уровней 64 бита = 2 64 уровней При записи на компакт-диск используется 16-битовое кодирование при частоте дискретизации 44,1 КГц, а при работе с речевыми сигналами достаточно 8 битового кодирования при частоте 8 КГц. При оцифровке потерю информации дает дискретизация как по времени, так и по уровню! !
Параметры качества звукового сигнала: 1. Частота дискретизации 1. Частота дискретизации – количество измерений уровня сигнала в единицу времени. 2. Глубина звука 2. Глубина звука – количество бит, используемых для кодирования различных уровней сигнала - разрешения звуковой карты (i) ; N = 2 i N N – количество различных уровней сигнала i i – количество бит для кодирования одного уровня сигнала
Формула для расчета размера цифрового моноаудиофайла: V = D * t * I V = D * t * I если рассчитывать стерео аудиофайл, то V = 2 * D * t * I V = 2 * D * t * I, где 2 – два канала
Звуковые редакторы
Cool Edit Pro 2.0 Sound Forge 6.0a
Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществить с помощью мыши. Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном порядке и др.) Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования.
Основные форматы звуковых файлов WAVWAV Универсальный формат, в котором звук сохраняется без сжатия WMAWMA (Windows Media Audio, потоковый звук, сжатие) МР3МР3 Формат,позволяющий сжимать звуковые файлы без заметной потери качества
Инструментальное кодирование MIDI*.MID MIDI (Musical Instrument Digital Interface), файлы *.MID в файле: нота (высота, длительность) музыкальный инструмент параметры звука (громкость, тембр) может быть несколько каналов нет потери информации при кодировании инструментальной музыки маленький размер файлов невозможно закодировать нестандартный звук, голос MIDI-клавиатура:
Задача Рассчитать объем стерео аудиофайла длительностью звучания 1 секунду при высоком качестве звука (16 бит – глубина звука, 48 к Гц – частота дискретизации). Дано: D = 48 к Гц I = 16 бит t = 1 сек k = 2 кол-во дорожек V - ? V = D * i * t * K V = * 16 * 1 * 2 = (бит) = (байт) = 187,5 (Кбайт)
Задача Рассчитать время звучания моноаудиофайла, если при 16-битовом кодировании и частоте дискретизации 32 КГц его объем равен 700 КБ. Дано: D = 32 к Гц I = 16 бит V = 700 Кб k = 1 кол-во дорожек t - ? V = D * i * t * K 700 Кб = бит = * 16 * t * 1 t = 11,2 сек