Технологии обработки информации. Лекция 2. Оцифровка данных Антон Викторович Кудинов, доцент кафедры ВТ.

Презентация:



Advertisements
Похожие презентации
Мультимедиа технологии. Лекция 4. Составляющие мультимедиа. Видео Антон Викторович Кудинов, доцент кафедры ВТ.
Advertisements

Урок 2. Информационные процессы в обществе и природе.
Масштаб 1 : Приложение 1 к решению Совета депутатов города Новосибирска от _____________ ______.
Масштаб 1 : Приложение 1 к решению Совета депутатов города Новосибирска от
Приложение 1 к решению Совета депутатов города Новосибирска от Масштаб 1 : 5000.
Кодирование текстовой информации. Содержание Вопросы для повторения Двоичное кодирование текстовой информации в компьютере Кодовая таблица Код ASCII Принцип.
Приложение 1 к решению Совета депутатов города Новосибирска от _____________ ______ Масштаб 1 : 5000.
Д. Дуброво д. Бортниково с. Никульское д. Подлужье д. Бакунино пос. Радужный - Песчаный карьер ООО ССП «Черкизово» - Граница сельского поселения - Граница.
ЦИФРЫ ОДИН 11 ДВА 2 ТРИ 3 ЧЕТЫРЕ 4 ПЯТЬ 5 ШЕСТЬ 6.
Ул.Школьная Схема с. Вознесенка Ярославского городского поселения п.Ярославский 10 2 Ул.Флюоритовая
27 апреля группадисциплина% ДЕ 1МП-12Английский язык57 2МП-34Экономика92 3МП-39Психология и педагогика55 4МП-39Электротехника и электроника82 5П-21Информатика.
Фрагмент карты градостроительного зонирования территории города Новосибирска Масштаб 1 : 4500 к решению Совета депутатов города Новосибирска от
Применение генетических алгоритмов для генерации числовых последовательностей, описывающих движение, на примере шага вперед человекоподобного робота Ю.К.
Г. Москва, тел.: +7 (495) , Internet: Методы бизнес-анализа в системе Бизнес-инженер.
Работа учащегося 7Б класса Толгского Андрея. Каждое натуральное число, больше единицы, делится, по крайней мере, на два числа: на 1 и на само себя. Если.
Кодирование информации. На клавиатуре ПК используется 256 различных знаков. I = log = 8 бит 2 8 = 256. Т. е. каждый символ кодируется последовательностью.
Кодирование и измерение графической информации. Графическая информация Аналоговая формаДискретная форма Пространственная дискретизация сканирование.
27 апреля группадисциплина% ДЕ 1МП-12Английский язык57 2МП-34Экономика92 3МП-39Психология и педагогика55 4МП-39Электротехника и электроника82 5П-21Информатика.
Таблица умножения на 8. Разработан: Бычкуновой О.В. г.Красноярск год.
Тема урока Двоичное кодирование различных видов информации.
Транксрипт:

Технологии обработки информации. Лекция 2. Оцифровка данных Антон Викторович Кудинов, доцент кафедры ВТ

Содержание Общие понятия. Виды сигналов Дискретизация Квантование Теорема Котельникова Оцифровка звука Оцифровка изображений Оцифровка видео Оцифровка текстовой информации. Кодирование текста 2

Оцифровка сигналов Сигнал – скалярная функция от одного или нескольких аргументов 3 Примеры сигналов s(t) – звукf(x,y) – изображение

Виды сигналов Аналоговые ( непрерывные ) звук в воздухе или в проводе, идущем от микрофона изображение ( до ввода в компьютер ) запись показаний датчика Цифровые ( дискретные ) звук в компьютере ( одномерный массив чисел ) изображение в компьютере ( двумерный массив чисел ) запись показаний датчика в компьютере ( одномерный массив ) 4

Оцифровка Цифровой сигнал сигнал данных, у которого каждый из представляющих параметров описывается функцией дискретного времени и конечным множеством возможных значений Оцифровка ( англ. digitization) описание объекта, изображения или аудио - видеосигнала ( в аналоговом виде ) в виде набора дискретных цифровых замеров ( выборок ) этого сигнала / объекта, при помощи той или иной аппаратуры, т. е. перевод его в цифровой вид, пригодный для записи на электронные носители Кодирование информации процесс преобразования сигнала из формы, удобной для непосредственного использования информации, в форму, удобную для передачи, хранения или автоматической переработки 5

Оцифровка сигналов (1) 1. Преобразование в электрический сигнал 2. Аналогово - цифровое преобразование : квантование дискретизация 6

Оцифровка сигналов (2) Введем понятие спектра аналогового сигнала 7 разложение на синусоиды с различными частотами x(t) – исходный сигнал X( ν ) – спектр, т. е. коэффициенты при гармониках с частотой ν

Теорема Котельникова Пусть спектр сигнала x(t) не содержит частот выше F, т. е. X( ν )=0 за пределами отрезка [- F, F] дискретизация сигнала x(t) производится с частотой F Fs,, т. е. в моменты времени nT, здесь T= 1/ Fs Fs > 2F „ „ Тогда исходный аналоговый сигнал x(t) можно точно восстановить из его цифровых отсчетов x(nT), пользуясь интерполяционной формулой 8

Оцифровка звуковых сигналов 9

Природа звука Отличается от всех цифровых средств информации ( визуальных ) Комбинация физических и психологических факторов Сложно смоделировать Не всегда нужен : легко раздражает 10

Два специальных типа звука Музыка ( имеет культурный статус ) Речь ( имеет лингвистическое содержание ) Разработаны специальные представления речи ( особые алгоритмы сжатия ) и музыки ( команды ) 11

Природа звука Преобразование энергии в колебания воздуха или другой упругой среды Камертон – одна частота Большинство звуков – сложной природы, можно разложить на набор частотных компонентов Частотный спектр - способ описания звука через относительные амплитуды его частотных компонентов 12

Оцифровка звука 1. Преобразование звука в электрический сигнал 2. Аналогово - цифровое преобразование : квантование дискретизация 13

Дискретизация Частота Найквиста для оцифровки звука : f = 2 f max = 2 * 20 кГц = 40 кГц Для разный целей : AudioCD – 44,1 кГц передача через Internet – 22,05 кГц запись речи – 11, 025 кГц цифровые аудиоленты – 48 кГц Используется частотный фильтр, удаляющий частоты больше половины частоты дискретизации 14

Квантование Количество уровней выбирается исходя из удобного количества бит Обычно – 16 бит, уровней Шум квантования Минимальный уровень – 8 бит Высококачественный звук – 24 бит ( сложная схема АЦП ) 15

Шум квантования 16

Оцифровка изображений 17

Способы представления изображений в памяти ЭВМ растровый векторный 18

Растровая графика 19

P i x e l - picture element - «элемент изображения» Пиксель – мельчайший элемент растрового изображения. 20

1,2,8,3,128,255,255,16,16 ………... Растровая графика 21 способ представления изображений в виде совокупности отдельных точек (пикселей) различных цветов и оттенков

10 х 15 см 300 dpi 3,9 x 5,9 дюйма 1170 х 1770 точек = точек 24 бит = 3 байт х 3 = 6 Мб 22

Векторная графика 23 способ представления изображений в виде совокупности отдельных объектов ( графических примитивов ). Каждый примитив описывается математически относительно его узлов.

Способы оцифровки изображений сканирование векторизация цифровая фотография 24

Цветовой ( тоновый ) диапазон – это максимальное число цветов (N) используемых при создании изображения Глубина цвета – это число бит (n), используемых для представления цвета каждого отдельного пикселя изображения, определяемое цветовым или тоновым диапазоном 25 n = log 2 (N)

Кривые реакции глаза 26

Характеристики цвета (2) Светлота – это различимость участков, сильнее или слабее отражающих свет Насыщенность цвета показывает, насколько данный цвет отличается от монохроматического (« чистого ») излучения того же светового тона Цветовой тон позволяет различать основные цвета, такие, как красный, зеленый, синий 27

Цветовая модель– способ цифрового кодирования цветов 28

Различают полноцветные модели модели в индексированных цветах ( палитра ) 29 аппаратно - зависимые цветовые пространства ( RGB, CMYK ) аппаратно - независимые цветовые пространства ( CIE XYZ, sRGB )

RGBRGB Red Green Blue красный зеленый синий ( 0, 0, 0) ( 255, 255, 255) ( 100, 0, 100) бит 16,7 млн. 30

Цветовое пространство модели RGB 31 Голубой (0, 1, 1) Зеленый (0, 1, 0) Синий (0, 0, 1) Малиновый (1, 0, 1) Красный (1, 0, 0) Желтый (1, 1, 0) Белый (1, 1, 1) Черный (0, 0, 0)

CMY Cyan Magenta Yellow голубой розовый желтый ( 0, 0, 0) ( 255, 255, 255) ( 100, 0, 100) бит 16,7 млн. K 32

Модели HSV, HSB и HLS 33 H S Черный 0,0 Белый 1,0 Красный Желтый Зеленый Голубой Синий Малиновый V HSV (Hue, Saturation, Value) HSB (Hue, Saturation, Brightness) HLS (Hue, Lightness, Saturation)

Оцифровка видео 34

Природа видео Инертность зрительного восприятия – задержка реакции глаза на зрительный раздражитель, из - за которой возникают остаточные явления Можно демонстрировать последовательность неподвижных изображений, которые будут восприниматься непрерывно Условия : незначительное отличие соседних изображений частота не менее 40 Гц ( в кино – 24/48 кадров / с, обтюратор, NTSC 30/60 кадров / с, PAL – 25/50 кадров / с ) 35

Природа видео ( продолжение ) Два способа генерации движущихся изображений : видео – запись последовательности кадров реального движения в реальном мире анимация – создание отдельных кадров на компьютере или запись неподвижных изображений 36

Аналоговые видеостандарты NTSC (National Television System Committee) – Северная Америка, Япония, Тайвань, часть стран Латинской и Южной Америки 525 строк (480 видимых, остальные для синхронизации ) чересстрочная развертка – 60 полукадров (30 кадров ) в секунду для цветного сигнала – 59,94 полукадра в секунду 37

Аналоговые видеостандарты PAL ( от англ. phase-alternating line – поэтапно - переменная линия ) - Европа, Азия, Африки, Австралия, Южная Америка SECAM (от фр. Séquentiel couleur à mémoire – последовательный цвет с памятью ) – Франция и бывшие колонии в Африке и Южной Америке, СССР 6 25 строк (576 видимых, остальные для синхронизации ) чересстрочная развертка – 50 полукадров (25 кадров ) в секунду 38

Оцифровка видео Проблема размера памяти : 640 х 480 х 3 байта = 900 Кб х 30 кадров / с = 26 Мб / с, 1,6 Гб / мин – для несжатого видео не хватает скорости для воспроизведения с CD или DVD, нереально передавать по сети выход - сжатие при записи в реальном времени Варианты : оцифровка в камере оцифровка в компьютере ( внешняя и встроенная карта ) Оцифровка в камере : запись DV-формате передача в компьютер через интерфейс IEEE 1394 (FireWire, iLink) 39

Оцифровка видео (2) Оцифровка в компьютере : « слабая » плата требует мощного компьютера « мощная » плата может работать на слабом компьютере Оцифровка в камере предпочтительнее, т. к. меньше искажений при передаче аналогового видеосигнала, но зато сложнее контролировать параметры оцифровки Кодеки : аппаратные программные Алгоритмы сжатия, подходящие для аппаратной реализации отличаются от алгоритмов, подходящих для программной 40

Цифровые видеостандарты Нужны цифровые стандарты, соответствующие аналоговым ( в том числе, для HDTV – High-Defenition Television) Стандарт для дискретизации Rec.ITU-R BT.601 (CCIR 601) PAL – 720 х 576 пикселей, NTSC – 640 х 480 пикселей Стандарт DV (DVCAM, DVPRO) скорость 25 Мбит / с (3 Мбайт / с ) коэффициент сжатия 5:1 Профессиональные стандарты Digital-S, HDDV MPEG-1 (VideoCD), MPEG-2 (DV), MPEG-4 (потоковое видео от 10 Кбит / с до 1,8 Мбит / с ) 41

Сжатие видео Два подхода : сжимать отдельно каждый кадр ( пространственное, внутрикадровое, intra-frame сжатие ) записывать отличия соседних кадров ( временное, межкадровое, inter-frame сжатие ) можно сочетать оба подхода одновременно Для внутрикадрового сжатия эффективно только сжатие с потерей качества Вывод : монтаж надо вести на несжатом материале, а сжимать только перед распространением Ключевые, разностные кадры Симметричное, асимметричное сжатие 42

Сжатие видео Motion-JPEG – внутрикадровое сжатие ( от 5:1 до 100:1) MPEG – межкадровое сжатие ( до 200:1) 43

Форматы хранения видео AVI ( Audio Video Interleaved ) – разработка Microsoft для Windows. Несколько форматов компрессии. Quick Time Movie (. qt,. mov ) – разработка Apple для компьютеров Мас. Несколько форматов компрессии, в том числе MPEG. MPEG (. mpg,. mpeg ) – формат, основанный на алгоритме MPEG. Digital Video (. dv ) – формат, разработанный для цифровых видеокамер и видеомагнитофонов. 44

Оцифровка текстовой информации 45

Историческое значение текста В доисторические времена смысл послания передавался в виде набора рисунков Самые ранние письменные памятники появились на юге Месопотамии ( современного государства Ирак ) в конце IV тысячелетия до н. э. 46 Паек для гонца. … 5 литров пива, 3 литра хлебной похлебки, 3/60 литра лука, 3/60 литра масла, 2/60 литра мыльного корня… ©

Различают : лексическое содержимое текста внешний вид текстового фрагмента А также : абстрактный символ графическое представление символа Текст и символы 47 T T T T T T T T T T T T T О, Боже ! Космические пришельцы ! Не ешьте меня. У меня жена, дети. Съешьте их !

Символы и алфавиты Абстрактные символы группируются в алфавиты традиционные фонетические алфавиты идеографическая система записи промежуточные слоговые алфавиты ( корейский ) 48

Алфавиты и кодовые точки В математике алфавит – множество символов Символ – кодовое значение из набора кодовых точек 49 А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ь Ы Ъ Э Ю ЯА Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ь Ы Ъ Э Ю Я А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ь Ы Ъ Э Ю ЯА Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ь Ы Ъ Э Ю Я A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Стандарт ASCII American Standard Code for Information Interchange 7 бит 128 кодовых точек 95 знаков и 127 – управляющие символы пробел ! '' # $ % & ( ) * +, -. / :;? :;? PQRSTUVWXYZ[\]^_PQRSTUVWXYZ[\]^_ `abcdefghijklmno`abcdefghijklmno p q r s t u v w x y z { | } ~ Escape

ASCII и ISO 1972 г. ASCII принят как стандарт ISO 646 национальные версии стандарта (ISO 646-US) – проблемы совместимости решение – увеличение числа кодовых точек (8 бит 255 кодовых точек ) нижняя половина – ISO 646-US, верхняя половина – национальные наборы символов стандарт ISO 8859, Latin1 недостатки : мало кодовых точек для идеографических алфавитов нельзя одновременно работать с несколькими языками 51

ISO групп по 256 плоскостей по 256 строк из 256 символов 32- битные кодовые точки (g,p,r,c) (0,0,0,*) = ISO Latin1 52

Unicode 16 бит кодовых точек CJK-consolidation (Chinese, Japanese and Korean) Содержит : символы нескольких десятков алфавитов идеограммы и силлабические шрифты китайского, японского и корейского языков знаки пунктуации, технические и математические символы стрелки и декоративные символы диакритические знаки и др. сейчас распределены кодовых точек 6400 кодовых точек – Private Use Area 1991 г. – согласованы Unicode и ISO (0,0, *,*) – Basic Multilingual Plane (BMP) = Unicode 53

Кодирование преобразование кодового значения в последовательность байтов для хранения и передачи схема Quoted-Printable (QP) – представление 8- битных символов как последовательности 7- битных символов Символ é (233 (1 0 ) = Е 9 (1 6 ) в ISO Latin1) записывается как = Е 9 схема ISO UCS-4 (Universal Character Set) – 4 байта на символ схема ISO UCS-2 – отброшены 2 байта (= Unicode ) 3 схемы для Unicode - UCS Transformation Formats ( UTF ) UTF-8, UTF-7, UTF-16 54

Форматы текстовых файлов ANSI (.TXT) Microsoft Word (.DOC,.DOCX) Rich Text Format (.RTF) Hyper Text Markup Language (.HTML) Portable Document Format (.PDF) LaTeX (.TEX) Электронные книги ( FB2, EPUB, LIT, LRF, AZW ) 55

Гипертекст и гипермедиа 1945 г. – концепция организации памяти «MEMEX», Ваннивер Буш, США – ассоциативный принцип организации больших массивов информации рубеж х годов – проект Xanadu, Тед Нельсон – объединение всей мировой литературы, возникновение термина « гипертекст » 1987 г. – программа HyperCard от Apple – первое массовое внедрение технологии, язык HyperTalk 1991 г. – HTML, World Wide Web 56

Способы ввода текста компьютерный набор сканирование и распознавание ( OCR – optical character recognition ) 57

Источники Алексей Лукин « Основы цифровой обработки сигналов »

Спасибо за внимание ! 59