Технологии поиска документальной информации в INTERNET

Файл : ref find.doc (размер : 173,568 байт)

Московский Государственный Горный Университет

Курсовая работа

на тему: «Технологии поиска документальной информации в INTERNET»

по дисциплине: «ПТК САПР»

Выполнил:

Проверил:

МОСКВА 2002 год.

СОДЕРЖАНИЕ (стр.):

1. ВВЕДЕНИЕ.

1.1. Что такое Internet (3).

1.2. Краткая история Internet (4).

2. БРАУЗЕРЫ: сравнительные характеристики Netscape Navigator и Microsoft Internet Explorer (5).

3. ПОИСКОВЫЕ СИСТЕМЫ (7).

3.1. Механизмы поиска (9).

3.2. Сравнительный обзор поисковых систем. Структура запроса (11).

3.3 Алгоритмы поиска (17).

3.3.1 Алгоритм Кнута-Мориса-Пратта (17).

3.3.2 Алгоритм Бойера-Мура (19).

3.3.3 Алгоритм Рабина (21).

4. ЗАКЛЮЧЕНИЕ (23).

5. СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ (24).

1. ВВЕДЕНИЕ.

1.1. Что такое Internet.

Internet - глобальная компьютерная сеть, охватывающая весь мир. Сегодня Internet имеет около 30 миллионов абонентов в более чем 180 странах мира. Ежемесячно размер сети увеличивается на 5-7%. Internet образует как бы ядро, обеспечивающее связь различных информационных сетей, принадлежащих различным учреждениям во всем мире, одна с другой.

Всплеск интереса к глобальной информационной сети Internet наблюдается сейчас повсеместно. В сложившихся условиях потребность в информации о сети Internet становится особенно острой. В настоящее время по Internet распространяется множество документов, касающихся как функционирования сети и работы в ней пользователей, так и связанных с различными сферами жизни: наукой, культурой, экономикой и т.д. При чём обновление информации в Internet, обширной разветвленной сети, которая включает в себя компьютерные узлы, разбросанные по всему миру, происходит, практически, в режиме реального времени.

В действительности Internet не просто сеть, - она есть структура, объединяющая обычные сети. Internet - это «Сеть сетей».

Чтобы описать сегодняшнюю Internet, полезно воспользоваться строгим определением. В своей книге "The Matrix: Computer Networks and Conferencing Systems Worldwide" Джон Квотерман описывает Internet как «метасеть, состоящую из многих сетей, которые работают согласно протоколам семейства TCP/IP, объединены через шлюзы и используют единое адресное пространство и пространство имен».

Для организации межсетевых соединений необходим соответствующий протокол.

Протокол - это набор договоренностей, который определяет обмен данными между различными программами. Протоколы задают способы передачи сообщений и обработки ошибок в сети, а также позволяют разрабатывать стандарты, не привязанные к конкретной аппаратной платформе. Все параметры - от скорости передачи данных до методов адресации при транспортировке отдельных сообщений - задаются протоколами, используемыми в данной конкретной сети.

В Internet базовым протоколом служит TCP/IP (Transmission Control Protocol/Internet Protocol). IP отвечает за адресацию сетевых узлов, а TCP обеспечивает доставку сообщений по нужному адресу. Эти мощные протоколы были предложены в 1974 г. Робертом Кэном, одним из основных разработчиков ARPANET, и ученым-компьютерщиком Винтоном Серфом, вице-президентом CNRI. Следует иметь в виду, что TCP/IP не единственный протокол, пригодный для объединения различных сетей. Internet ныне превратилась в многопротокольную сеть, интегрирующую другие стандарты. Основные среди них - стандарты взаимодействия открытых систем (OSI).

Предложенные Международной организацией по стандартизации (ISO) протоколы OSI получили широкое распространение в Европе. Системы, основанные на других протоколах, тоже подключаются к Internet через шлюзы. Например, BITNET - это сеть, которая использует для передачи данных свои собственные стандарты, однако, по крайней мере, частично, она доступна через шлюзы из Internet.

В Internet нет единого пункта подписки или регистрации; вместо этого вы контактируете с поставщиком услуг, который предоставляет вам доступ к сети через местный компьютер. Последствия такой децентрализации с точки зрения доступности сетевых ресурсов также весьма значительны. Среду передачи данных в Internet нельзя рассматривать только как паутину проводов или оптоволоконных линий. Оцифрованные данные пересылаются через маршрутизаторы, которые соединяют сети и с помощью сложных алгоритмов выбирают наилучшие маршруты для информационных потоков.