3.1. Кодирование и обработка звуковой информации
Звуковая информация. Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну (колебания воздуха или другой среды) с непрерывно меняющейся амплитудой и частотой. Человек воспринимает звуковые волны с помощью слуха в форме звука различной громкости и тона. Чем больше амплитуда звуковой волны, тем громче звук, чем больше частота колебаний, тем выше тон звука (рис. 3.1).
Рис. 3.1 .Звуковая волна
Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20000 колебаний в секунду (высокий звук). Человек может воспринимать звук в огромном диапазоне амплитуд, в котором максимальная амплитуда больше минимальной в 1014 раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица децибел (дБ). Уменьшение или увеличение громкости звука на 10 дБ соответствует уменьшению или увеличению амплитуды звука в 10 раз (табл. 3.1).
Таблица 3.1. Громкость звука
Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенный уровень громкости.
Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек» (рис. 3.2).
Рис. 3.2. Временная дискретизация звука
Частота дискретизации. Для записи аналогового звука и его преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за одну секунду (чем больше частота дискретизации), тем точнее «лесенка» цифрового звукового сигнала повторяет кривую аналогового сигнала.
Частота дискретизации звука — это количество измерений громкости звука за одну секунду.
Частота дискретизации звука измеряется в герцах (Гц) и может лежать в диапазоне от 8000 до 48 ООО измерений громкости звука за одну секунду (от 8000 до 48000 Гц).
Глубина кодирования. Каждой «ступеньке» присваивается определенный уровень громкости звука. Уровни громкости звука можно рассматривать как набор N возможных состояний, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.
Глубина кодирования звука — это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.
Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле (1.1). Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:
N = 2I = 216 = 65 536.
В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню громкости будет соответствовать код 0000000000000000, а наибольшему — 1111111111111111.
Качество оцифрованного звука. Чем больше частота дискретизации и глубина кодирования звука, тем более качественным будет оцифрованный звук. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, будет при частоте дискретизации 8000 раз в секунду, глубине кодирования 8 битов и записи одной звуковой дорожки (режим моно). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, будет при частоте дискретизации 48 000 раз в секунду, глубине кодирования 16 битов и записи двух звуковых дорожек (режим стерео).
Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания одна секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в одну секунду и умножить на 2 (стереозвук):
16 битов • 24 000 • 2 = 768 000 битов = 96 000 байтов = 93,75 Кбайт.
1. Объясните, как частота дискретизации и глубина кодирования влияют на качество цифрового звука.
3.1. Задание с выборочным ответом. Звуковая плата производит двоичное кодирование аналогового звукового сигнала. Какое количество информации необходимо для кодирования каждого из 65 536 возможных уровней громкости сигнала?
1)65 536 битов
2) 256 битов
3)16 битов
4) 8 битов
3.2. Задание с развернутым ответом. Оцените информационный объем цифровых звуковых файлов длительностью 10 секунд при глубине кодирования и частоте дискретизации звукового сигнала, обеспечивающих минимальное и максимальное качество звука:
а) моно, 8 битов, 8000 измерений в секунду;
б) стерео, 16 битов, 48 000 измерений в секунду.