Кодирование звуковой информации Выполнил студент группы 16Ю1 Чернышенко Илья
Звук – волна, распространяющая в какой либо среде (воздухе) и обладающая непрерывными характеристиками частоты и интенсивности. Волна, дойдя до органов слуха, вызывает колебания, которые затем преобразуются мозгом в звуковой сигнал. На этом же принципе реализовано кодирование звуковой информации. Характеристики качества звука: "Глубина" кодирования звука - количество бит на один звуковой сигнал Современные звуковые карты обеспечивают 16-битную "глубину" кодирования звука. 2. Частота дискретизации – это количество измерений уровней сигнала за 1 секунду(Одно измерение в 1 секунду соответствует частоте 1 Гц, 1000 измерений в 1 секунду - 1 к Гц, количество измерений может лежать в диапазоне от 8000 до ). На практике значения частоты дискретизации, применяемые в звуковых системах, равны 44,1 к Гц или 48 к Гц. Чем больше частота дискретизации, тем качественнее звук.
Форматы звуковых файлов PCM(импульсно-кодовой формат, является основополагающим для всех звуковых файлов) RIFF(уникальная система хранения любых структурированных данных) MOD(файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента) MP3(качество МР3 до сих пор вызывает много споров, контур юность звука- большой недостаток этого формата) VQF(альтернатива MP3) WAV( самое простое хранилище дискретных данных) RA(потоковая передача аудиоданных, Real Audio) IFF(технология хранения данных проистекает от Amiga-систем) AIF или AIFF( сочетание MOD и WAV) MID(файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве)
Формы представления звуковой информации В мире вся звуковая информация представлена в двух формах: 1) Аналоговой – непрерывная плавная линия с различной амплитудой колебаний и частотой. 2) Дискретной – ломаный отрезок, который имеет «ступеньки» различной высоты. Аналоговая форма записи используется в старых устройствах – магнитофонах, кассетных плеерах, патефонах. Здесь волны записываются на носитель в виде дорожки, а игла или звуко преобразующее устройство, «раздражаясь» от этих дорожек, воспроизводит звук. Сейчас практически все устройства используют двоичную систему счисления для воспроизведения звуковых сигналов. Компакт диски, флеш-карты, жесткие диски – все они хранят информацию в двоичном коде. Принцип чтения и записи при этом кардинально меняется.
Дискретизация звука Чтобы электронные устройства могли воспроизводить звук, необходимо записать его в понятном для машины виде, преобразовать в определенную последовательность символов 1 и 0. Этот процесс преобразования называется дискретизацией. Сам принцип кодирования состоит в следующем: Плавная линия разбивается на многочисленные маленькие временные отрезки так, что каждому участку начинает соответствовать определенная несоизмеримо малая прямая. Каждому отрезку присваивается определенная величина амплитуды, которую можно представить в виде прямоугольного треугольника: катеты определяют колебания звука для машины, а гипотенуза представляет аналоговую форму записи. Каждому такому треугольнику присваивается определенный номер, который соответствует уровню громкости. На практике подобная информация представляется в виде гистограммы: высота каждого столбика соответствует амплитуде волны, а частота дискретизации, то есть размер временных отрезков, представлена шириной. Качество кодирование звука зависит от глубины кодирования звука (количество уровней звука) и частоты дискретизации (количество изменений уровня сигнала в единицу времени). Чтобы записать звук на диск компьютера его надо преобразовать в цифровую форму. Этим занимается аналого-цифровой преобразователь (АЦП). Для воспроизведения звука, записанного в цифровом виде, цифроаналоговый преобразователь преобразовывает его в аналоговый сигнал.
Обработка звука Обработка звука-это различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. Основные типы преобразования звука: 1)Фазовые преобразования(сдвиг фазы сигнала тем или иным способом; например, такие преобразования стерео сигнала, позволяют реализовать эффект вращения или «объёмности» звука) 2)Амплитудные преобразования(выполняются над амплитудой сигнала и приводят к ее усилению, либо ослаблению или изменению по какому-либо закону на определенных участках сигнала) 3)Частотные преобразования(сигнал представляется в виде спектра частот через определенные промежутки времени, производится обработка необходимых частотных составляющих, например, фильтрация, и обратное «сворачивание» сигнала из спектра в волну) 4)Временные преобразования(реализуются путем наложения, растягивания или сжатия сигналов; позволяют создать, например, эффекты эха или хора, а также повлиять на пространственные характеристики звука)
Обработка звука с помощью программного обеспечения Редакторы цифрового аудио-основные возможности таких программ это, как минимум, обеспечение возможности записи (оцифровки) аудио и сохранение на диск. Реставраторы аудио-такие программы позволяют восстановить утерянное качество звучания аудио материала, удалить нежелательные щелчки, шумы, треск, специфические помехи записей с аудиокассет, и провести другую корректировку аудио.
Расчет количества различных уровней сигнала Глубина кодирования- количество уровней сигнала. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле: N = 2 i = 2 16 = 65536, где i глубина звука. Таким образом, современные звуковые карты могут обеспечить кодирование уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код. Пример: Можно оценить информационный объем стерео аудио файла длительностью звучания 1 секунда при высоком качестве звука (16 битов, 48 к Гц). Для этого количество битов, приходящихся на одну выборку, необходимо умножить на количество выборок в 1 секунду и умножить на 2 (стерео): Решение: 16 бит = бит = байт = 187,5 Кбайт.
Расчет объема звукового файла Формула: A = D*T*i, D – частота дискретизации (Гц) T – время звучания или записи звука i - разрядность регистра (разрешение) Пример: Объем свободной памяти на диске 5,25 Мб, разрядность звуковой платы 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 22,05 к Гц? Решение: 5,25 Мбайт = байт байт: Гц : 2 байта = 124,8 сек
Процессы дискретизации
Спасибо за внимание!