Содержание | Данные
Данные
Различные факты и численные сведения, введенные и сохраненные в компьютере, считаются данными (data). Данными могут быть рисунки, созданные в графическом редакторе, слова, введенные в документ с помощью текстового процессора, или числа, введенные в электронную таблицу.
Слова данные и информация часто употребляются как синонимы, но правильнее считать данными то, что введено в компьютер, а информацией - результаты обработки данных компьютером.
Представление данных
Для компьютера любые данные считаются числами. Числами считаются и собственно числа, буквы и знаки пунктуации являются числами, звуки и изображения также считаются числами; даже сами компьютерные команды (инструкции - instructions) представляются числами. Это обстоятельство может показаться несколько странным, так как все мы видели на экране компьютера слова и образованные из них предложения. Когда на экране отображаются буквы алфавита, это просто один из способов компьютера представления чисел.
Вводимые в компьютер данные преобразуются в двоичные числа (binary numbers), которые только и может "понимать" компьютер. В двоичной системе счисления имеются только цифры 0 и 1.
Внутри компьютера нули и единицы представляются двумя электрическими состояниями: единицы представляются состоянием ВКЛЮЧЕНО (ON), что соответствует высокому уровню напряжения, а нули - состоянием ВЫКЛЮЧЕНО (OFF), что соответствует низкому уровню напряжения. Двоичный разряд (BInary digiT) называется битом (bit) и он может иметь только значения 0 или 1.
Восемь битов образуют байт (byte), который представляет один символ, например букву A или цифру 5.
Компьютеры представляют двоичные данные с помощью переключателей (switches).
Включенное (ON) состояние переключателя представляет собой двоичную 1, а выключенное (OFF) состояние - двоичный 0.
Электронным эквивалентом переключателя является специальная схема, называемая триггером (flip-flop).
Под воздействием электрических сигналов триггер способен очень быстро переходить (переключаться) из одного состояния в другое.
Единицей времени для современных компьютеров служит одна миллиардная секунды, называемая наносекундой (нс).
Все данные перед сохранением в запоминающем устройстве (памяти) компьютера преобразуются в двоичные числа. Например, при нажатии на клавиатуре клавиши с буквой B двоичное представление буквы B посылается в процессор. Процессор передает двоичное представление (короче - двоичный код), или байт, буквы B в монитор, который интерпретирует этот код и отображает букву B.
Когда пользователь вводит данные, обычно он хочет сохранить их для повторного использования. Имеется несколько способов хранения данных. Данные можно сохранить на жестком диске, который находится внутри системного блока, или корпуса (case), компьютера. Для хранения данных в этом накопителе применяются несменные диски (platters). Данные можно сохранить также в накопителе со сменными гибкими дисками (дискетами).
Биты и байты
В компьютере все данные должны быть представлены с помощью электронных переключателей (триггеров). Переключатель имеет только два возможных состояния - включен (ON) и выключен (OFF), поэтому он может представить только два численных значения. Этими значениями приняты 0 (OFF) и 1 (ON). В силу этого обстоятельства в компьютерах применяется система счисления с основанием 2, которая называется двоичной системой счисления (binary numbering system).
Когда компьютеру требуется представить величину, большую 1, он поступает так же, как человек, которому нужно представить величину, большую 9 в десятичной системе счисления, - компьютер использует два или больше двоичных разрядов.
Напомним, что двоичный разряд называется битом и он является наименьшей единицей данных. Для представления чего-то осмысленного, т.е. информации, в компьютерах приходится группировать биты. Следующей после бита большей единицей данных является байт, представляющий собой группу из восьми битов. С помощью одного байта компьютер может представить 256 возможных значений, так как с помощью восьми двоичных разрядов можно представить 256 различных значений - чисел от 0 (00000000) до 255 (11111111).
Байт является очень важной единицей данных, поскольку имеется достаточно 8-битовых комбинаций для представления всех символов на клавиатуре, включая все буквы (прописные и строчные), цифры, знаки пунктуации и другие знаки.
Компьютеры не могут "разговаривать" между собою на русском, английском или китайском языке. Для компьютеров разработаны специальные языки, которые лучше приспособлены для цифровой коммуникации. В этих языках биты группируются в соответствии с определенной системой кодирования (encoding system) для представления букв, цифр и специальных знаков, например *, $, + и &.
Имеется несколько систем кодирования, например КОИ-8 и DOS, но наибольший интерес сейчас представляет система, которая называется "Кириллица (Windows)" или "Windows-1251". Эта система позволяет представлять буквы русского языка и является основной для компьютеров с операционной системой Windows, а также широко применяется в Internet.
В настоящее время происходит переход к 16-битовой системе кодирования Unicode, которая обеспечивает более простое взаимодействие компьютеров и включает в себя большинство мировых языков. Двухбайтовые коды Unicode обеспечивают кодирование 65 536 (216) символов, что позволяет закодировать алфавиты большинства мировых языков, включая японский, корейский и китайский.