Практическое занятие (часть 1)
Практическое занятие (часть 2)
Работа с электронной почтой. Видеоурок
Практическое задание №2. Тема: Электронная почта
Архивирование и разархивирование файлов
Вы уже знаете, что с помощью глобальной сети Интернет пользователь получает доступ к огромным информационным ресурсам. В сети можно найти редкую книгу, реферат практически по любой теме, фотографии и музыку, компьютерную игру и многое другое. При передаче этих данных по сети могут возникнуть проблемы из-за их большого объема. Пропускная способность каналов связи еще достаточно ограничена, поэтому время передачи может быть слишком большим. Кроме того, для файлов большого размера может оказаться недостаточно свободного места на диске.
Решение проблемы заключается в сжатии данных, которое ведет к сокращению объема данных при сохранении закодированного в них содержания. Программы, осуществляющие такое сжатие, называются архиваторами. Первые архиваторы появились в середине 1980-х годов. Главной целью их использования была экономия места на дисках, информационный объем которых в те времена был значительно меньше объема современных дисков.
Сжатие данных (архивирование файлов) происходит по специальным алгоритмам. В этих алгоритмах чаще всего используются две принципиально различающиеся идеи.
Первая идея: использование кода переменной длины. Данные, подвергающиеся сжатию, специальным образом делят на части (цепочки символов, «слова»). Заметим, что «словом» может быть и отдельный символ (код ASCII). Для каждого «слова» находится частота встречаемости: отношение количества повторений данного «слова» к общему числу «слов» в массиве данных. Идея алгоритма сжатия информации: кодировать наиболее часто встречающиеся «слова» кодами меньшей длины, а редко встречающиеся «слова» — кодами большей длины. При этом можно существенно сократить объем файла.
Такой подход известен давно. Он используется в азбуке Морзе, где символы кодируются различными последовательностями точек и тире, причем чаще встречающиеся символы имеют более короткие коды. Например, часто используемая буква «А» кодируется так: • -. А редкая буква «Ж» — так: • • • -. В отличие от кодов постоянной длины, в этом случае возникает проблема отделения кодов букв друг от друга. В азбуке Морзе эта проблема решается с помощью «паузы» (пробела), которая, по сути, является третьим символом алфавита Морзе, т. е. алфавит Морзе не двух-, а трехсимвольный.
Информация в памяти компьютера хранится с использованием двухсимвольного алфавита. Специального символа-разделителя нет. И все же удалось придумать способ сжатия данных с переменной длиной кода «слов», не требующий символа-разделителя. Такой алгоритм называется алгоритмом Д. Хаффмана (впервые опубликован в 1952 году). Все универсальные архиваторы работают по алгоритмам, подобным алгоритму Хаффмана.
Вторая идея: использование коэффициента повторения. Смысл алгоритма, основанного на этой идее, заключается в следующем: если в сжимаемом массиве данных встречается цепочка из повторяющихся групп символов, то ее заменяют парой: число (коэффициент) повторений — группа символов. В этом случае для длинных повторяющихся цепочек выигрыш памяти при сжатии может быть очень большим. Данный метод наиболее эффективен при сжатии графической информации.
Программы-архиваторы создают архивные файлы (архивы). Архив представляет собой файл, в котором в сжатом виде хранятся один или несколько файлов. Для использования заархивированных файлов необходимо произвести их извлечение из архива — разархивирование. Все программы-архиваторы обычно предоставляют следующие возможности:
• добавление файлов в архив;
• извлечение файлов из архива;
• удаление файлов из архива;
• просмотр содержимого архива.
В настоящее время наиболее популярны архиваторы WinRAR и WinZip. WinRAR обладает более широкими возможностями по сравнению с WinZip. В частности, он дает возможность создания многотомного архива, а также возможность создания самораспаковывающегося архива (в этом случае для извлечения данных из архива не нужен сам архиватор).
Приведем пример выгоды использования архиваторов при передаче данных по сети. Размер текстового документа, содержащего параграф, который вы сейчас читаете, — 31 Кб. Если этот документ заархивировать с помощью WinRAR, то размер архивного файла составит всего 6 Кб. Как говорится, выгода налицо.
Пользоваться программами-архиваторами очень просто. Чтобы создать архив, нужно сначала выбрать файлы, которые необходимо в него включить, затем установить необходимые параметры (способ архивации, формат архива, размер тома, если архив многотомный), и, наконец, отдать команду «Создать архив». Похожим образом происходит обратное действие — извлечение файлов из архива (распаковка архива). Во-первых, нужно выбрать файлы, извлекаемые из архива, во-вторых, определить, куда должны быть помещены эти файлы, и, наконец, отдать команду «Извлечь файлы из архива». Подробнее с работой программ-архиваторов вы познакомитесь на практических занятиях.
Сжатие информации производится с помощью специальных программ-архиваторов.
Чаще всего в алгоритмах сжатия реализуются два метода: использование кода переменной длины и коэффициента повторения группы символов.
1. В чем различие кодов постоянной и переменной длины?
2. Какими возможностями обладают программы-архиваторы?
3. Какова причина широкого применения программ-архиваторов?
4. Найдите программы-архиваторы в свободном доступе (кроме перечисленных в этом параграфе) и подготовьте сообщение о них.
ЕК ЦОР: Часть 2, заключение, дополнение к главе 1, § 1. ЦОР № 1-4.