Язык как знаковая система A +- АБВГД = 2
Естественные языки Язык мимики Язык жестов Английский Китайский Русский ……………………………………… (Устная и письменная форма) письменная Формальные языки Язык музыки Язык шахмат Язык физики Язык химии Язык информатики (язык программирования) (язык команд) ……………………………….. ЯЗЫКИ ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ Основное отличие формальных языков от естественных состоит в наличии строгих правил грамматики и синтаксиса.
Язык как знаковая система Язык – это определённая система символов и правил представления информации. Естественные языки – это исторически сложившиеся языки национальной речи. Формальные языки – это искусственные языки для профессионального применения. Алфавит языка – множество используемых символов. Синтаксис – правила записи языковых конструкций (текст на языке). Семантика – смысловая сторона языковых конструкций.
Двоичный алфавит 0/1 истина/ ложь +/- хорошо/ плохо да/нет Двоичный алфавит
Двоичное кодирование символов Символ Порядковый номер Двоичный код Схема перевода символа произвольного алфавита в двоичный код
Универсальность двоичного кодирования С помощью двоичного кода может быть представлена любая информация. Двоичное кодирование универсально, так как с его помощью может быть представлена любая информация ax 2 + bx+ c = 0 d 2 = b 2 – 4ac d = 0 X = -b/2/a
Цепочки из двух двоичных символов четыре различных символа произвольного алфавита: Порядковый номер символа 1234 Двузначный двоичный код
Цепочки из трех двоичных символов восемь различных символов произвольного алфавита. Порядковый номер символа Трехзначный двоичный код
Если мощность исходного алфавита больше двух, то для кодировки символа этого алфавита потребуется несколько двоичных символов Схематическое представление получения двоичных кодов Двоичные символы (0, 1) берутся в заданном алфавитном порядке и размещаются слева направо. Двоичные коды читаются сверху вниз. Двоичное кодирование символов
Разрядность двоичного кода – количество символов в двоичном коде (длина двоичной цепочки). Закономерность: 2=2 1, 4=2 2, 8=2 3, 16=2 4 и т.д. В общем виде: N = 2 i, где N – количество кодовых комбинаций, i – разрядность двоичного кода Разрядность двоичного кода Количество кодовых комбинаций
N = 2 i N - количество знаков в алфавите знаковой системы (мощность алфавита) i - количество информации, которое несет каждый знак
Задача Вождь племени Мульти поручил своему министру разработать двоичный код и перевести в него всю важную информацию. Достаточно ли пятиразрядного двоичного кода, если алфавит, используемый племенем Мульти, содержит 26 символов?
Количество информации в сообщении I c = i * k I c – количество информации в сообщении i – количество информации, которое несет один знак k - количество знаков в сообщении
не связывает количество информации с содержанием сообщения
Алфавит и его мощность Мощность алфавита из заглавных русских букв и отмеченных дополнительных символов равна 54. АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЪЭЮЯ ().,!?«»:-; (пробел)
Алфавит – конечное множество символов, используемых для представления информации. -Сколько символов содержит этот текст? -Этот текст содержит 81 символ, включая пробелы и знаки препинания. Мощность алфавита из русских букв и дополнительных символов равна 54. Допустим, что появление любого символа в тексте равновероятно. Каждый символ несет i бит информации. Число i можно определить из уравнения 2 i = N 2 i = 54 где N – мощность алфавита Объем информации в тексте равен: I = 5, 755 х 81 = 486,155 бит
Количество информации в тексте При алфавитном подходе к измерению информации количество информации зависит не от содержания, а от размера текста и мощности алфавита.
Задание : Определите информационный объем страницы книги, если для записи текста использовались только заглавные буквы русского алфавита, кроме буквы Ё. Решение: 1.N = I = N 3.2 I = 32 4.I = 5 5.На странице 3000 знаков, тогда объем информации = 3000 * 5 = бит.
Ограничения на максимальную мощность алфавита не существует Достаточный алфавит мощностью 256 символов использует компьютер для внешнего представления текста и другой символьной информации. Один символ этого алфавита «весит» 8 бит 2 i = 256
Единицы измерения НазваниеУсловное обозначение Соотношение с другими единицами КилобитКбит1 Кбит = 1024 бит = 2 10 бит МегабитМбит1 Мбит = 1024 Кбит = 2 20 бит ГигабитГбит1 Гбит = 1024 Мбит = 2 30 бит КилобайтКбайт (Кб)1 Кбайт = 1024 байт = 2 10 байт МегабайтМбайт (Мб)1 Мбайт = 1024 Кбайт = 2 20 байт ГигабайтГбайт (Гб)1 Гбайт = 1024 Мбайт = 2 30 байт
Алфавитный подход является объективным способом измерения информации в отличие от субъективного, содержательного подхода. Применение алфавитного подхода удобно при использовании технических средств для работы с информацией
Источник информации Приемник информации Канал связи
Скорость передачи информации Количество информации, передаваемое за единицу времени, есть скорость передачи информации или скорость информационного потока. Очевидно, эта скорость выражается в таких единицах, как бит в секунду (бит/с), байт в секунду (байт/с), килобайт в секунду (Кбайт/с) и т.д.
Задания Расположите единицы измерения информации в порядке возрастания: – Гигабайт; Байт; Мегабайт; Килобайт. Задание1 Племя Мумбу-Юмбу использует алфавит из букв: αβγδεζηθλμξσφψ, точки и для разделения слов используется пробел. Сколько информации несет свод законов племени, если в нем 12 строк и в каждой строке по 20 символов? Задание 3 Вычислите какова мощность алфавита, с помощью которого записано сообщение, содержащее 2048 символов, если его объем составляет 1.25 Кбайта. Задание2