Урок 24. Организация глобальных сетей (§ 10
Интернет как глобальная информационная система (§ 11)
World Wide Web — Всемирная паутина (§ 12)
Системные основы WWW
Средства поиска информации в WWW
Практикум. Практические работы 2.1 - 2.4
Рассмотрим более подробно, что же такое World Wide Web (WWW). Обычно это словосочетание переводят как «Всемирная паутина». Каждый представляет себе паутину — это сеть, которую плетет паук. По смыслу слово «паутина» (Web) является синонимом слова «сеть».
World Wide Web (WWW) — это сеть документов, связанных между собой гиперссылками.
Таким образом, за использованием разных терминов закрепился разный смысл: сеть — это система взаимосвязанных компьютеров, т. е. техническая система, а паутина (Web) — это система взаимосвязанных документов, т. е. структура данных.
Разумеется, «паутина» документов существует на базе компьютерной сети.
Каждый отдельный документ, имеющий собственный адрес, называется web-страницей.
Каждая web-страница может иметь множество связей с другими страницами, которые хранятся как на том же самом компьютере, так и на других компьютерах сети. На рис. 2.5 схематически показано наложение паутины документов на компьютерную сеть. Сплошными линиями обозначены web-серверы и связи между ними, пунктирными — web-документы и их связи.
Web-сервер — это компьютер, на котором работает сервер-программа WWW. В его дисковой памяти хранятся web-страницы.
Web-страница (документ) может содержать самую разную информацию: текст, рисунок, звукозапись, видео. Каждая страница хранится в отдельном файле, имя которого имеет расширение htm или html.
Гиперссылка — это некоторое ключевое слово или объект в документе, с которым связан указатель для перехода на другую страницу в паутине. Обычно изображение гиперссылки на странице каким-то образом выделяется, например цветом или подчеркиванием. При подведении к гиперссылке указателя мыши он принимает вид руки с указывающим пальцем. Если при этом щелкнуть левой кнопкой мыши, то произойдет переход по указателю к связанному документу. Текст, в котором используются гиперссылки, называется гипертекстом. Гиперссылки могут быть связаны не только с текстом, но и с другими видами объектов: рисунок, фото, видео, звукозапись, телеканал и др.
В основе технологии WWW лежат следующие понятия:
• HTTP (HyperText Transfer Protocol, протокол передачи гипертекста);
• адрес URL (Universal Resource Locator, универсальный указатель ресурса);
• язык HTML (HyperText Markup Language, язык разметки гипертекста).
HTTP (HyperText Transfer Protocol) — протокол передачи гипертекста. Используется службой WWW. Браузер — клиент-программа WWW посылает запрос web-серверу, хранящему файл с необходимым документом. В ответ на запрос сервер высылает клиенту требуемый файл или сообщение об ошибке, если файл недоступен. Протокол HTTP регулирует данный вид взаимодействия между клиентом и сервером.
URL-адрес. Уже рассказывалось о системе адресации в компьютерном пространстве Сети. Это IP-адреса, доменные адреса. В пространстве информационных ресурсов Интернета используется своя система адресации. Она называется URL (Uniformed Resource Locator) — универсальный указатель ресурса. Каждая web-страница или файл имеют свой уникальный URL-адрес, который состоит из трех частей: имя используемого для доступа протокола; имя сервера, на котором хранится ресурс; полное имя файла (путь+имя) на сервере. Например, URL-адрес главной страницы web-сайта газеты «Первое сентября» выглядит так:
http://www.lseptember.ru/ru/first.htm
Здесь http:// — протокол доступа;
www.lseptember.ru — имя сервера;
/ru/first.htm — полное имя файла.
Префикс «www» образовался больше 20 лет назад и обозначал то, что на соответствующем домене работает именно web-сервер, а не какой-либо иной сервис. Но теперь, когда WWW стал доминирующим сервисом, смысл в его указании почти пропал.
Следует заметить, что имя составлено по правилам операционной системы Unix, под управлением которой работают серверы Интернета. В отличие от Windows вместо символа «\» (обратный слеш) здесь используется символ «/» (слеш). Кроме того, строчные и прописные буквы не являются взаимозаменяемыми.
Web-сайт (другое название — web-узел) — это совокупность взаимосвязанных страниц, принадлежащих какому-то одному лицу или организации. Web-сайт организуется на web-сервере провайдера сетевых услуг. Всякий сайт имеет главную страницу, являющуюся своеобразным титульным листом сайта. Как правило, главная страница представляет владельца сайта и содержит гиперссылки на разные его разделы. Пример главной страницы web-узла издательства «БИНОМ. Лаборатория знаний» приведен на рис. 2.6.
HTML — стандартный язык описания web-страниц. Теги (метки) языка HTML интерпретируются браузером, который на их основе строит в памяти компьютера объектную модель документа, а затем выводит эти объекты на экран. В результате пользователь видит отображение web-страницы в окне браузера. Язык HTML является основой любого гипертекстового документа, даже если он был создан в одном из конструкторов сайтов или визуальном редакторе.
Web-браузер — программа-клиент WWW. Слово browser можно перевести как «обозреватель». Наиболее распространенными программами этого типа являются Netscape Navigator, Internet Explorer, Opera, Google Chrome.
Следующая страница Средства поиска информации в WWW