Кодирование и декодирование текстовой информации
Практическая работа 2.1. Кодировки русских букв
Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называется текстовой информацией. Начиная с конца 1960-х годов, компьютеры всё больше стали использоваться для обработки текстовой информации.
Для кодирования прописных и строчных букв русского и латинского алфавитов, цифр и ряда специальных знаков (знаки арифметических операций, знаки препинания и пр.) достаточно использовать 256 различных символов.
Кодирование для компьютера заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Получается, что для кодирования одного из 256 символов достаточно 8 двоичных цифр (бит), т. е. 1 байта.
Этот же результат можно получить по формуле, связывающей количество сообщений (здесь — знаков в алфавите знаковой системы) N и количество информации i, необходимой, чтобы закодировать каждый из 256 знаков:
N = 2i = 256 = 2i = 28 = 2i = i = 8 бит = 1 байт.
Таким образом, человек различает символы по их начертанию, а компьютер — по их коду.
При вводе в компьютер текстовой информации происходит её двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определённая последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает одну байтовую ячейку.
В процессе вывода символа на экран компьютера производится обратный процесс — декодирование, т. е. преобразование кода символа в его изображение.
Следующая страница Кодировки русского алфавита