Текст на внешних носителях сохраняется в виде файла. Преимущества компьютерного документа: Преимущества компьютерного документа: Компактное размещениеКомпактное размещение Легко удалитьЛегко удалить Легко размножитьЛегко размножить Можно быстро переслать на большое расстояниеМожно быстро переслать на большое расстояние Недостаток: Недостаток: Прочитать файл можно толькоПрочитать файл можно только с помощью компьютера с помощью компьютера
Любая информация кодируется в компьютере с помощью последовательностей двух цифр - 0 и 1. Он хранит и обрабатывает информацию в виде комбинации электрических сигналов: 0.4В-0.6В соответствует логическому нулю, 2.4В-2.7В - логической единице. напряжение 0.4В-0.6В соответствует логическому нулю, напряжение 2.4В-2.7В - логической единице. двоичными кодами Последовательности из 0 и 1 называются двоичными кодами, двоичными разрядами а цифры 0 и 1 - двоичными разрядами (битами). двоичным кодированием Такое кодирование информации на компьютере называется двоичным кодированием.
Обработкой текстовой информации на компьютере начали заниматься с 60 – х годов 20 века. Первоначально в ЭВМ использовался лишь латинский алфавит (26 букв). Для обозначения каждого символа хватило бы пяти разрядов (битов). Но в тексте есть знаки препинания, десятичные цифры и др. Поэтому в первых англоязычных компьютерах байт - машинный слог - включал шесть битов. Затем семь - не только для того, чтобы отличать большие буквы от малых, но и для увеличения числа кодов управления принтерами, сигнальными лампочками и прочим оборудованием.
В 1964 году появились мощные ЭВМ IBM-360, в которых окончательно байт стал равен восьми битам, так как для представления текстовой информации в компьютере начал использоваться алфавит мощностью 256 символов.
ASCII Компьютер различает символы по кодам. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange), где коды от 0 до 31 отведены операциям, код 32 – пробел, коды с 33 по 127 соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания. Международная кодировка ASCII
Коды со 128 по 255 являются национальными, т. е. в национальных кодировках одному и тому же коду соответствуют различные символы. В настоящее время существует пять различных кодовых таблиц для кодирования русских букв: KOI8-R, CP1251, Mac, ISO,Unicode KOI8-R, CP1251, Mac, ISO, Unicode KOI8-R CP1251 Примеры кодовых таблиц для кодирования русских букв:
ЭВМ Слово «ЭВМ» записано в форме десятичного кода во всех пяти кодировках на основе кодировочных таблиц: KOI8-R: CP1251: Mac: ISO: ЭВМ Если перевести коды в двоичную систему счисления, то слово «ЭВМ» будет в различных кодировках иметь вид: KOI8-R: CP1251: Mac: ISO: