Количество информации как мера уменьшения неопределённости знания
Алфавитный подход к определению количества информации
Процесс познания окружающего мира приводит к накоплению информации в форме знаний (фактов, научных теорий и т. д.). Получение новой информации приводит к расширению знания или, ещё говорят, к уменьшению неопределённости знания. Если некоторое сообщение приводит к уменьшению неопределённости нашего знания, то можно говорить, что такое сообщение содержит информацию.
Чем более неопределённа первоначальная ситуация (больше количество возможных информационных сообщений), тем больше мы получим новой информации при получении информационного сообщения (в большее количество раз уменьшится неопределённость знания).
Количество информации можно рассматривать как меру уменьшения неопределённости знания при получении информационных сообщений.
Рассмотрим вопрос об определении количества информации более подробно на конкретных примерах.
Пусть у нас имеется монета, которую мы бросаем на ровную поверхность. С равной вероятностью произойдёт одно из двух возможных событий — монета окажется в одном из двух положений: «орёл» или «решка».
Можно говорить, что события равновероятны, если при возрастающем числе опытов количества выпадений «орла» и «решки» постепенно сближаются. Например, если мы бросим монету 10 раз, то «орёл» может выпасть 7 раз, а решка — 3 раза, если бросим монету 100 раз, то «орёл» может выпасть 60 раз, а «решка» — 40 раз, если бросим монету 1000 раз, то «орёл» выпадет 520 раз, а «решка» — 480 и т. д. В итоге при очень большой серии опытов количества выпаданий «орла» и «решки» практически сравняются.
Перед броском существует неопределённость нашего знания (возможны два события — и два возможных информационных сообщения об этих событиях), и как упадёт монета, предсказать невозможно. После броска наступает полная определённость, так как мы видим (получаем зрительное сообщение), что монета в данный момент находится в определённом положении (например, выпал «орёл»). Это сообщение приводит к уменьшению неопределённости нашего знания в два раза, так как из двух возможных равновероятных событий реализовалось одно (рис. 1.7).
Рис. 1.7
В окружающей действительности достаточно часто встречаются ситуации, когда может произойти некоторое количество равновероятных событий. Так, при бросании равносторонней четырёхгранной пирамиды существуют 4 равновероятных события, а при бросании шестигранного игрального кубика — 6 равновероятных событий.
Чем больше количество возможных событий (информационных сообщений), тем больше начальная неопределённость нашего знания и, соответственно, тем большее количество информации будет содержать сообщение о результатах опыта.
Рассмотренный выше подход к информации как мере уменьшения неопределённости знания позволяет количественно измерять информацию. Существует формула, которая связывает между собой количество возможных информационных сообщений N и количество информации Z, которое несёт полученное сообщение:
N = 2i. (1.1)
Для количественного выражения любой величины необходимо сначала определить единицу измерения.
За единицу количества информации принимается такое количество информации, которое содержится в информационном сообщении, уменьшающем неопределённость знания в два раза. Такая единица носит название бит.
Если вернуться к опыту с бросанием монеты, то здесь неопределённость уменьшается именно в два раза (из двух возможных событий реализуется одно) и, следовательно, количество полученной информации равно 1 биту.
Минимальной единицей измерения количества информации является бит, а следующей по величине единицей — байт, причём 1 байт = 8 бит = 23 бит.
В информатике система образования кратных единиц измерения количества информации использует коэффициент 2n. Кратные байту единицы измерения количества информации вводятся следующим образом:
1 Кбайт = 210 байт = 1024 байт;
1 Мбайт = 210 Кбайт = 1024 Кбайт;
1 Гбайт = 210 Мбайт = 1024 Мбайт.
Определение количества информации на основе уменьшения неопределённости нашего знания рассматривает информацию с точки зрения содержания: её понятности и новизны для человека. С этой точки зрения, в опыте по бросанию монеты одинаковое количество информации содержится и в зрительном образе упавшей монеты, и в коротком сообщении «Орёл», и в длинной фразе «Монета упала на поверхность земли той стороной вверх, на которой изображен орёл».
Следующая страница Алфавитный подход к определению количества информации