Текстовая информация и компьютер
Виды информации текстовая графическая числовая звуковая
При ручной записи или даже при использовании пишущей машинки часто неприятной проблемой становится необходимость исправлять ошибки или вносить какие - то изменения в текст. У лукоморья дуб зеленый, Злотая цепь на дубе том. И днем и ночью кот ученый Все ходет по цепи кругом а и
Имея компьютер, можно создавать тексты, не тратя на это бумаги.
СПОСОБЫ ОБРАБОТКИ И ХРАНЕНИЯ ТЕКСТОВ Тексты на бумаге Ручная запись текста на бумаге Печать на пишущей машинке Бумажная технология Компьютерная технология Печать на принтере Файлы Недостатки бумажной технологии проблемы редактирования бумажных документов (зачеркивание, стирание, заклеивание, переписывание заново) книги, документы на бумажном носителе занимают очень много места одноразовое использование, перерасход бумаги трудности копирования бумажных текстовых документов трудности передачи текстовой бумажной информации на большие расстояния Достоинства компьютерной технологии компактное хранение в файлах на носителях возможность многократного использования носителя простота копирования и размножения простота редактирования – внесения изменений быстрая передача по сетевым каналам
СВОЙСТВА КОМПЬЮТЕРНЫХ ДОКУМЕНТОВ Возможность внесения любых изменений непосредственно в файле, не расходуя при этом бумагу Компактность хранения текстовой информации Легкость копирования файлов на любые носители с помощью компьютера Возможность многократного использования внешних носителей Оперативная связь – передача текстовой информации через компьютерные сети Легкость удаления (стирания) ненужных текстовых файлов Возможность просмотра компьютерных текстов на экране дисплея
Тексты в компьютерной памяти Урок 1
ТЕКСТОВАЯ ИНФОРМАЦИЯ И КОМПЬЮТЕР Представление символов Таблица кодировки Код ASCII 256 символов 1 символ – 1 байт стандартная часть коды 0 – 127 альтернативная часть коды Представление текста в памяти компьютера Структурные единицы Структура документов слово строка абзац страница раздел Гипертекст Текстовые редакторы Текстовые процессоры Программы создания и редактирования текста Программы переводчики Программы распознавания печатного текста Интеллектуальные системы р а б о т ы с т е к с т о м ОСНОВНЫЕ РЕЖИМЫ ввод текста редактирование поиск и замена работа с файлами правописание печать документа помощь ДОПОЛНИТЕЛЬНЫЕ Ф У Н К Ц И И стили, шаблоны с п и с к и т а б л и ц ы г р а ф и к а ф о р м у л ы
Кодирование текстов А теперь заглянем в память компьютера и разберемся, как же представлена в нем текстовая информация. 1 ва 4 символы символы буквы Цифры: Знаки препинания
С точки зрения компьютера текст – это любая последовательность символов из компьютерного алфавита. Самое главное, чтобы все используемые символы входили бы в компьютерный алфавит.
Тексты в компьютерной памяти Мощность компьютерного алфавита 256 символов. Сколько информации несет один символ данного алфавита ? 2 i = N 2 i = i = 2 8 i = 8 ( бит ) двоичный код каждого символа в компьютерном тесте занимает 1 байт памяти.
ТЕКСТЫ В КОМПЬЮТЕРНОЙ ПАМЯТИ Каждый символ текста представлен в памяти компьютера двоичным кодом (1 байт) Слово – последовательность символов, отделенная разделительным знаком или пробелом Строка – это последовательность слов, отделенная от другой строки управляющими кодами перевод строки (ASCII=13) и возврат каретки (ASCII=10) Текстовый файл содержит последовательность кодов символов, разделенную по строкам. В конце расположен управляющий код конец файла (ASCII=26) символ слово Код ASCII символ Код ASCII ….. символ Код ASCII пробел Код ASCII символ слово Код ASCII символ Код ASCII ….. символ Код ASCII..... Специальные управляющие коды для разделения текста на строки ( ) Строка Специальный управляющий код 26 (конец файла) Строка Управляющие коды ( )..... Строка Последовательность кодов ASCII cтрок – текстовый файл
Какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу? Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки. ASCII международный стандарт кодировки. (американский стандартный код для информационного обмена) КОИ-8 код обмена информацией
КОДИРОВАНИЕ ТЕКСТА. ТАБЛИЦА КОДИРОВКИ Структура кодовой таблицы Символ Двоичный код 0NUL OH ……..…………… 31US ……..…………… 82R S T ……..…………… ……..…………… 195Г Д Е ……..…………… 254 ю я Кодировка в ОС Windows – код ANSI American National Standard Institute (американский институт стандартизации) Стандартная часть кода ANSI/ASCII 0 ( ). 127 ( ) Символы с кодами выполняют управляющие функции. При выводе текста они не отображаются графи- ческими знаками. Кодовая страница CP ( ). 255 ( ) Содержит русские буквы, упорядоченные в алфавитной последовательности (это правило соблюдается не во всех кодовых страницах)
Кодирование. file f i l e file
Кодирование disk
Кодовая таблица Windows (ANSI, CP-1251)
Саша набирает текст на компьютере. Куда первоначально заносится набираемый текст ? Текст заносится в оперативную память.
А для длительного хранения текста должна быть использована внешняя память магнитные диски Текст на магнитном диске сохраняется в файле
Гипертекст Самое поразительное отличие компьютерного текста от бумажного вы почувствуете, если встретитесь с текстом, информация в котором организована по принципу гипертекста. гиперсвязи, гиперссылки Смысловые связи между различными фрагментами текста – гиперсвязи, гиперссылки гиперсвязь При наведении курсора на гиперссылку курсор изменяет свой вид.
Работа с текстовой информацией Способы обработки и хранения текстов Гипертекст Текст на бумажном носителе Страница 1 Страница 2 Страница… Гипертекст – это способ организации текстовой информации, внутри которой установлены смысловые связи (гиперсвязи) между ее различными фрагментами Компьютерный гипертекст гиперссылки гиперсвязи
Домашнее задание 1. C помощью кодировочной таблицы ASCII раскодируйте заданный текст: C помощью кодировочной таблицы ASCII закодируйте заданный текст: I was born in Сколько символов содержится в тексте, использующем таблицу ASCII, если известно, что он занимает бит памяти?