Формула Хартли
Вы знаете, что при выборе из двух возможных вариантов количество полученной информации равно 1 биту. Если количество вариантов N равно 2I, то количество информации при выборе одного из них равно I битов. А как вычислить количество информации, если количество вариантов не равно степени числа 2?
Ответить на этот вопрос стало возможно только после того, как вы изучили логарифмы в курсе математики. Из формулы
N = 2I
сразу следует, что I — это степень, в которую нужно возвести 2, чтобы получить N, т. е. логарифм:
I = log2 N.
Эта формула называется формулой Хартли в честь американского инженера Ральфа Хартли, который предложил её в 1928 г.
Пусть, например, на лётном поле стоят 10 самолётов (с номерами от 1 до 10) и известно, что один из них летит в Санкт-Петербург.
Сколько информации в сообщении «Самолёт № 2 летит в Санкт-Петербург»? У нас есть 10 вариантов, из которых выбирается один, поэтому по формуле Хартли количество информации равно
I = log2 10 ≈ 3,322 бита.
Обратите внимание, что для значений N, которые не равны целой степени числа 2, количество информации в битах — дробное число.
С помощью формулы Хартли можно вычислить теоретическое количество информации в сообщении. Предположим, что алфавит (полный набор допустимых символов) включает 50 символов (в этом случае говорят, что мощность алфавита равна 50). Тогда информация при получении каждого символа составляет
I = log2 50 ≈ 5,644 бита.
Если сообщение содержит 100 символов, его общий информационный объём примерно равен
5,644 • 100 = 564,4 бита.
В общем случае объём сообщения длиной L символов, использующего алфавит из N символов, равен I = L • log2 N.
Такой подход к определению количества информации называют алфавитным. Конечно, на практике невозможно использовать для кодирования символа нецелое число битов, поэтому используют первое целое число, которое больше теоретически рассчитанного значения. Например, при использовании алфавита из 50 символов каждый символ будет закодирован с помощью 6 битов (50 ≤ 26 = 64).
Сколько разных сообщений можно передать, если известен алфавит и длина сообщения? Предположим, что для кодирования сообщения используются 4 буквы, например «А», «Б», «В» и «Г», и сообщение состоит из двух символов. Поскольку каждый символ может быть выбран 4 разными способами, на каждый вариант выбора первого символа есть 4 варианта выбора второго. Поэтому общее число разных двухбуквенных сообщений вычисляется как 4 • 4 = 42 = 16. Если в сообщение добавить ещё один символ, то для каждой из 16 комбинаций первых двух символов третий можно выбрать четырьмя способами, так что число разных трёхсимвольных сообщений равно 4 • 4 • 4 = 43 = 64.
В общем случае, если используется алфавит из N символов, то количество разных возможных сообщений длиной L символов равно Q = NL.
Следующая страница Задачи