Как записать информацию?
Естественные и формальные языки
Для того чтобы хранить и передавать информацию, её необходимо как-то зафиксировать, например записать с помощью символов (знаков) на каком-то языке.
Язык — это система знаков, используемая для хранения, передачи и обработки информации.
Естественные языки (русский, английский и др.) сформировались в результате развития человеческого общества и используются для общения людей.
Сначала древние люди овладели устной речью. Поскольку человек может издавать и различать на слух не так много звуков, он стал комбинировать их, составляя слова, каждому из которых приписывался некоторый смысл.
Затем появилась необходимость записывать информацию, например, для передачи потомкам. В первое время жизненный опыт пытались зафиксировать в виде рисунков животных и предметов, затем пиктограмм (схематических изображений), иероглифов (рис. 2.1).
В большинстве современных языков используется алфавитное письмо, где каждый знак (или сочетание знаков) обозначает некоторый звук, так что с помощью небольшого набора знаков (алфавита) можно записать любые слова устной речи.
Алфавит — это набор знаков, который используется в языке.
Чаще всего подразумевается, что символы в алфавите расположены в определённом порядке.
Рис. 2.1
В алфавите русского языка 33 буквы, в английском алфавите — 26. К алфавиту языка, вообще говоря, нужно отнести пробел (пропуск между словами), цифры (знаки для записи чисел), знаки препинания,скобки.
Мощность алфавита — это количество знаков в алфавите.
Например, алфавит, состоящий из 33 русских букв, 10 цифр, пробела и 12 знаков препинания (точка, запятая, точка с запятой, вопросительный и восклицательный знаки, тире, двоеточие, многоточие, кавычки, круглые скобки) имеет мощность 56 (а если различать прописные и строчные буквы, то 89).
Слово — это последовательность символов алфавита, которая используется как самостоятельная единица и имеет определённое значение.
Из слов составляются предложения, каждое из которых выражает определённую законченную мысль (сообщение, порцию информации). В языке определяются правила построения слов (грамматика), правила построения предложений (синтаксис) и правила расстановки знаков препинания (пунктуация).
С точки зрения теории информации, сообщение — это любой набор знаков некоторого алфавита. Определим, сколько различных сообщений можно построить с помощью заданного количества знаков. Пусть, например, алфавит состоит из четырёх знаков: @ # $ %. С его помощью можно записать 4 разных сообщения из одного символа: @, #, $ и %. Теперь рассмотрим сообщения из двух знаков. Первый знак можно выбрать четырьмя способами, и для каждого из них есть 4 варианта выбора второго знака. Поэтому сообщений, состоящих из двух знаков, будет 42 = 16:
Рассуждая аналогично, получим, что трёхсимвольных сообщений будет 43 = 64, а четырёхсимвольных — 44 = 256 и т. д.
Если алфавит языка состоит из N символов (имеет мощность N), количество различных сообщений длиной L знаков вычисляется как Q = NL.
Следующая страница Естественные и формальные языки