Тексты в компьютерной памяти
1. Работа с текстами – одна из областей применения компьютера.Работа с текстами – одна из областей применения компьютера. 2. Преимущества компьютерного Преимущества компьютерного документа по сравнению с бумажным. 3. Представление текстов в памяти Представление текстов в памяти компьютера. 4. Гипертекст.Гипертекст. 5. Повторение.Повторение 6. Решение задач.Решение задач.
Текст на внешних носителях сохраняется в виде файла.
Преимущества компьютерного документа по сравнению с бумажным. 1. Экономия бумаги. 2. Компактное размещение текста и хранение на носителях внешней памяти в виде файлов. 3. Возможность быстрого исправления ошибок. 4. Возможность быстрой копии и печати. 5. Оперативная передача текста по линиям компьютерной связи.
Недостаток компьютерного документа: Документ можно прочитать, только с помощью компьютера.
Представление текста в памяти компьютера.
Алфавит – это множество всех символов, с помощью которых записывается текст. Код - система условных знаков для представления информации. Кодирование - это перевод информации в удобную для передачи, обработки или хранения форму с помощью некоторого кода. Декодирование - это перевод закодированной информации в форму понятную человеку.
КНИГА – русский язык BOOK – английский язык BUCH – немецкий язык Кодирование одной и той же информации разными способами
Кодирование одной и той же информации разными способами КОМПЬЮТЕР русский язык COMPUTER английский язык код Морзе
15 Кодирование символов 1. Для представления текстовой информации в компьютере используется алфавит мощностью 2. Один символ алфавита несёт 8 битов информации 3. Каждому символу – уникальный десятичный код Таблица символов: 4. Коды – в двоичную систему = бит на символ …ABCD… коды
1 байт – это 8 битов.
Двоичное кодирование А Б В – это кодирование всех видов информации с помощью двух знаков (обычно 0 и 1).
Двоичное кодирование в такой форме можно закодировать все виды информации нужны только устройства с двумя состояниями практически нет ошибок при передаче компьютеру легче обрабатывать данные человеку сложно воспринимать двоичные коды кодировщик числа символы рисунки звук
Двоичный код каждого символа занимает 1 байт памяти компьютера. КОМПЬЮТЕР 9 символов - 9 байтов Символы всей книги Примерно 400 Кбайт
Таблица кодировки - это таблица, в которой устанавливается соответствие между символами и их порядковыми номерами в компьютерном алфавите. - это внутреннее представление символов в таблице.
21 Кодировка 1 байт на символ таблица ASCII (международная) кодовая страница ASCII = American Standard Code for Information Interchange (Американский стандартный код для информационного обмена) 0-31 управляющие символы: 7 – звонок, 10 – новая строка, 13 – возврат каретки 32 пробел знаки препинания:., : ; ! ? специальные знаки: + - * / () {} [] цифры заглавные латинские буквы A-Z строчные латинские буквы a-z Кодовая страница (расширенная таблица ASCII) для русского языка: CP-1251 для системы Windows (Интернет)
Стандартная часть кода ASCII
Кодовая страница СР1251
24 Кодирование символов Текстовый файл на экране (символы) в памяти – двоичные коды В файле хранятся не изображения символов, а их числовые коды в двоичной системе! !
Какое слово записано двоичным кодом? d i s k
Кодировка UNICODE Windows, MS Office, … 16 бит на символ или 2 16 символов в одной таблице можно одновременно использовать символы разных языков (Интернет) размер файла увеличивается в 2 раза
Гипертекст это текст, организованный так, что его можно просматривать в последовательности смысловых связей между его отдельными фрагментами. Такие связи называются ГИПЕРСВЯЗЯМИ (ГИПЕРССЫЛКАМИ ).
Гиперте́кст термин, введённый Тедом Нельсоном в 1950 году для обозначения текста «ветвящегося или выполняющего действия по запросу». Обычно гипертекст представляется набором текстов, содержащих узлы перехода между ними, которые позволяют избирать читаемые сведения или последовательность чтения. Общеизвестным и ярко выраженным примером гипертекста служат веб- страницы документы HTML (язык разметки гипертекста), размещённые в Сети.
Какие виды информации вы знаете? Ответ: текстовая,графическая,звуковая,числовая, видеоинформация Interface - взаимосвязь За счёт чего эта связь (человек-компьютер) осуществляется? Ответ: программного обеспечения Вывод: для обработки текста на компьютере существует специальное программное обеспечение: текстовые редакторы и процессоры
30 Пример 1. Записать слово «stop» в двоичном и десятичном кодах. Решение. Двоичный код Десятичный код
31 Решение. Слово состоит из 14 букв. Каждая буква является символом компьютерного алфавита, поэтому занимает 1 байт памяти. Слово займет 14 байт (112 бит) Пример 2. Сколько бит памяти компьютера займет слово «Микропроцессор»?
32 Решение. 0,25 х 1024 = 256 (байт); 256 : 1 (байт) = 256 символов. Пример 3. Текст занимает 0,25 Кбайт памяти компьютера. Сколько символов содержит этот текст?
33 Решение. При шифровке не обязательно пользоваться таблицей. Достаточно учесть, что разница между кодом строчных и прописных букв равна – 32 = 83; 116 – 32 = 84; 111 – 32 = 79; 112 – 32 = 80. Слову «STOP» соответствует последовательность кодов: Пример 4. С помощью десятичных кодов зашифровано слово «stop» Записать последовательность десятичных кодов для этого же слова, но записанного заглавными буквами.
34 Решение. В Юникоде 1 символ закодирован 2 байтами или 16 битами. Во фразе 38 символов (с учетом пробелов). В байтах – 38 х 2 = 76 байтов; в битах 38 х 16 = 608 бит. Пример 5. Оценить информационный объем фразы, закодированной с помощью Юникода: Без труда не вытащишь и рыбку из пруда.
35 Читать записи в тетради. Закодировать в двоичном и десятичном коде свою фамилию, имя используя таблицу на сайте purtova.ucoz.ru. Домашнее задание: