Однобайтные кодировки
В современных компьютерах память состоит из 8-битных ячеек — байтов. Поэтому к кодам ASCII можно добавить ещё один (старший) бит, таким образом, получается 8-битная кодировка. Этот дополнительный бит позволяет добавить в таблицу ещё 128 символов с кодами от 128 до 255. Такое расширение ASCII часто называют кодовой страницей. Первую половину кодовой страницы (коды от О до 127) занимает стандартная таблица ASCII, а вторую — символы национальных алфавитов (например, русские буквы):
Для русского языка существуют несколько кодовых страниц, которые были разработаны для разных операционных систем. Наиболее известны:
• Windows-1251 (СР-1251) — в системе Windows;
• KOI8-R — в Uniх-совместимых операционных системах и электронной почте;
• альтернативная кодировка СР-866;
• MacCyrillic — на компьютерах компании Apple.
Проблема состоит в том, что, если набрать русский текст в одной кодировке (например, в Windows-1251), а просматривать в другой (например, в KOI8-R), текст будет очень сложно прочитать:
Для веб-страниц в Интернете часто используют кодировки Windows-1251 и KOI8-R. Браузер после загрузки страницы пытается автоматически определить её кодировку. Если ему это не удаётся, вы увидите странный набор букв вместо понятного русского текста. В этом случае нужно сменить кодировку вручную с помощью меню Вид.
Используя дополнительные источники, найдите ответы на вопросы.
— Что такое псевдографика и зачем она использовалась?
— В каких операционных системах для русских текстов используется кодировка СР-866?
— Найдите коды русских букв «А», «В», «П», «Р», «Я» в кодировках СР-866, CP-1251, KOI-8R, MacCyrillic;
— В каких кодировках русские буквы расположены по алфавиту, а в каких — нет?
Следующая страница Кодировки UNICODE