Службы Интернета. §49. Всемирная паутина | Поиск информации в Интернете (курс pol 68 ч.) /informatika_10_68_pol/ (68 часов в уч. год)

Планирование уроков на учебный год (по учебнику К.Ю. Полякова, Е.А. Еремина, сокращенный курс, 2 часа в неделю)


Урок 35
Службы Интернета
§49. Всемирная паутина. §50. Электронная почта. §51. Другие службы Интернета. §52. Электронная коммерция. §53. Право и этика в Интернете



Содержание урока

§49. Всемирная паутина

Что такое Всемирная паутина?

Поиск информации в Интернете

Вопросы и задания

Задачи

§50. Электронная почта
§51. Другие службы Интернета
§52. Электронная коммерция
§53. Право и этика в Интернете

§49. Всемирная паутина


Поиск информации в Интернете


В Интернете сейчас содержится огромное количество данных, при этом найти нужную информацию иногда оказывается достаточно сложно.

Поисковая система — это веб-сайт, предназначенный для поиска информации в Интернете.

В начале развития Интернета, когда сайтов было немного, веб-мастера (создатели сайтов) составляли списки ссылок на интересные сайты. Когда ссылок стало много, их начали объединять в группы по темам. В результате развития этой идеи появились каталоги.

Каталог ссылок (англ, web directory) — это разбитый по темам список ссылок на сайты с их кратким описанием.

В каталогах обычно используют многоуровневую группировку ссылок (дерево): в каждой из крупных тем (Новости, Наука, Образование и др.) есть разделы, в разделах — подразделы и т. д.

Первым крупным сайтом-каталогом стал Yahoo (www.yahoo, com), созданный в 1995 г. За рубежом очень популярен также Открытый каталог (www.dmoz.org), который поддерживается международным сообществом редакторов. Самые крупные из российских каталогов — Яндекс-каталог (yaca.yandex.ru) и Ката- лог@МаИ.ги (list.mail.ru).

Каталоги заполняются вручную людьми-экспертами (редакторами каталога), каждый из которых отвечает за определённый раздел. Кроме того, веб-мастера могут предложить редакторам свои сайты для включения в каталог (бесплатно или платно).

Ссылки в каталогах, как правило, точно соответствуют разделу, в котором они размещены. Однако редакторы физически не могут посетить и проверить все новые сайты, которые ежедневно появляются в Интернете, поэтому часто случается, что нужный вам сайт не включен в каталог. Поэтому возникла естественная идея — заставить компьютерную программу искать новые сайты и автоматически анализировать информацию на их страницах. Так появились поисковые машины.

Поисковая машина — это автоматическая система, которая хранит информацию обо всех известных ей веб-страницах и выдает по запросу адреса тех из них, где встречаются введённые пользователем ключевые слова.

Робот-браузер поисковой машины (его часто называют «паук», англ, crawler) выкачивает с сайтов веб-страницы, переходя по всем встречающимся на них ссылкам1.


1 Начальный список страниц обычно задают разработчики.



Затем другая программа (индексный робот) удаляет из текста страницы всю служебную информацию (например, команды оформления) и строит индекс, похожий на книжный (рис. 7.18) — алфавитный список слов, для каждого из которых хранится адрес веб-страницы и номер (или номера) этого слова на странице.

Рис. 7.18

Рис. 7.18

Пользователь вводит в запросе ключевые слова, которые его интересуют.

Ключевые слова — это набор слов и выражений, которые отражают требуемую информацию.

Поисковый робот с помощью индекса находит те страницы, где встречаются эти слова.

Каждая поисковая машина имеет свой язык, который позволяет составлять сложные запросы, например исключать некоторые ключевые слова из поиска или искать одно слово из заданного набора слов. Во многих системах для обозначения логической операции «ИЛИ» (нужно одно из указанных слов) используется символ |, а для логической операции «И» (нужны оба слова) — символ &. Если нужно найти словосочетание, в запросе его берут в кавычки.

Обычно поисковый робот находит тысячи страниц, соответствующих запросу. Они выдаются пользователю в том порядке, который определяется разработчиками. Чаще всего учитывается цитируемость — число ссылок с других сайтов на эту страницу; чем ссылок больше, чем выше «ранг» данной страницы и тем выше она расположена в результатах поиска.

Самая крупная международная поисковая машина — Google (www.google.com). В России лидирующие позиции занимает Яндекс (www.yandex.ru). Эти системы умеют искать не только текст, но также картинки и видео (правда, при поиске изображений используется текстовая информация рядом с ними). Поисковая система TinEye (tineye.com) позволяет находить изображения, похожие на образец.

Следующая страница Вопросы и задания



Cкачать материалы урока







Наверх