Студентам > Дипломные работы > Корпоративные сети
Корпоративные сетиСтраница: 10/12
Но все же самое интересное при
обслуживании коллективных пользователей - это взаимодействие локальной сети
пользователя и сети провайдера. В данном обзоре мы намеренно опускаем
взаимодействие пользователей и провайдеров по протоколам, отличным от семейства
TCP/IP, хотя такие формы доступа к ресурсам Internet и практикуются, например,
РоСпринт или SovamTeleport и даже закладываются в качестве одного из базовых
способов подключения в проект "Деловая сеть России" (ФАПСИ, ИНФОТЕЛ и
AORelcom). Но при IP-подклю- чении возможны различные варианты.
Самый органичный вариант, когда
локальная сеть пользователя и провайдера - это IP-сети. В этом случае
пользователь должен иметь адрес в сети провайдера для своего шлюза и свою
IP-сеть. Обычно это сеть класса C. Пример такого подключения показан на рисунке
7.3.
Рис.
7.3. Схема подключения локальной сети к провайдеру
Обычно, номер локальной сети следует
получать у своего провайдера. При смене провайдера иногда номер остается у
пользователя, но чаще возвращается провайдеру, как это делается, например, в
Demos или в GlasNet. При этом одни провайдеры выдают эти номера бесплатно
(Demos, AORelcom), а некоторые за дополнительную плату (Узел Sable в
Красноярске).
После получения номера сети и
подключения к провайдеру следует позаботится о маршрутизации. Так например, в
компании МАРК-ИТТ (Ижевск) существует понятие "доступности".
Существует доступность в пределах сети МАРК-ИТТ и подключение без ограничения
доступности. В принципе, существуют технические возможности ограничить
маршрутизацию сообщений из/в локальную сеть пользователя путем соответствующих
настроек маршрутизаторов, чем некоторые провайдеры и пользуются.
Кроме маршрутизации необходимо
позаботиться и о доменной адресации. В принципе можно переложить заботы о
назначении доменных имен на плечи провайдера, но можно получить и свою зону. В
последнем случае надо зарегистрировать у провайдера "прямую" и
"обратную" зоны для своей сети. Провайдеры предлагают также поддерживать
и вторичные серверы для зон пользователей. Какие могут быть причины, которые
реально должны подвигнуть пользователя на регистрацию и размещение вторичных
серверов DNS. Во-первых, неполадки со своим собственным сервером, а во-вторых,
время разрешения запроса на IP-адрес по доменному имени. Регистрация обратных
зон нужна хотя бы для того, чтобы нормально работать со всеми серверами FTP,
например, для установки программного обеспечения FreeBSD с сервера АО Relcom.
7.2.1. Режим электронной почты,
подписка на телеконференции, файл-серверы и удаленный терминал
Доступ по протоколу UUCP - это в
первую очередь электронная почта. Вообще говоря, UUCP - это главным образом
электронная почта, хотя есть возможность и доступа к Usenet. Однако, надо
сказать, что электронная почта - это не мало. Современная электронная почта
Internet позволяет работать не только с текстовой информацией, но и с графикой,
и со звуком, и с изображением. Через электронную почту доступны все
телеконференции Usenet (в данном случае конференции Relcom, Demos и т.п.).
Через электронную почту можно передавать двоичные файлы, например, файлы
программ или документы, подготовленные в форматах MS-Word или Postscript. По
электронной почте доступны ftp-архивы, ресурсы WorldWideWeb и многое другое.
Даже поисковые запросы к Wais можно отправлять по электронной почте. Таким
образом, пользователю, подключенному по UUCP к Internet, доступен практически
весь мир информационных ресурсов последней, но есть маленькое "но":
все эти ресурсы доступны в режиме отложенного просмотра.
Фактически, пользователь получает их
через промежутки времени равные времени заполнения его почтового ящика на
почтовом сервере провайдера, если, конечно, связь с провайдером устойчивая. А
эти промежутки равны, например, периодам просмотра очередей программой
sendmail, которые обычно устанавливаются в пределах 30-60 минут. Конечно, при
доступе к Usenet или файловым архивам это не имеет большого значения. В Usenet
сообщения хранятся обычно в течении 5 дней, а в файловых архивах практически
вечно. Но если пользователь предпринял путешествие по гипертекстовым ссылкам
WorldWideWeb, то использование электронной почты для этой цели занятие довольно
утомительное, порождающее при этом совершенно бесполезный трафик, за который
еще надо платить.
Но следует также принять во внимание
тот факт, что при качестве нашей телефонной сети многие отечественные
пользователи не могут добиться устойчивой связи с сервером провайдера. В этом
случае полный IP-сервис - это просто недоступная роскошь. Можно иметь даже
собственный IP-адрес, но что в этом толку, если каждые 15-20 минут
коммуникационная программа будет снова дозваниваться до сервера, а, например,
ftp-соединение за это время будет оборвано из-за превышения лимита на
неактивность пользователя.
При использовании протокола UUCP
соединение устанавливается только на время передачи данных, и хотя другие
способы подключения тоже дают эту возможность, например, и при IP-соединении
можно добиться автоматического восстановления связи, с точки зрения передачи
электронной почты реализовано оно в UUCP достаточно эффективно.
Очень часто можно встретить
рекомендации по ограничению размера почтового сообщения. Цифры при этом
называют разные, но все они обычно не превышают 1Мб. Здесь собственно следует
руководствоваться следующими соображениями: во-первых, надежностью соединения,
а во-вторых, ограничениями провайдера. Второй фактор важнее первого. Если
провайдер ограничил размер сообщения до 1Мб, то как не старайся, больше
передать просто не удастся. А на второе место поставили его по той причине, что
во многих случаях ограничения установленные провайдером на много превосходят
реальные возможности пользователей. За тот промежуток времени, пока держится
связь, пользователь не успевает принять или отправить длинное сообщение,
которое тем не менее не достигает установленного лимита. В свою очередь это
вызывает новую попытку соединения, и отправка почты повторяется. Так будет
происходить до тех пор пока, либо сообщение будет полностью передано, либо
удалено.
На самом деле описанная процедура, с
точки зрения бюджета, отведенного на оплату услуг электронной почты, не
безобидна. Как только начинается прием/передача сообщений, сразу включается
счетчик, как в такси. В результате платить за одну и ту же информацию придется
многократно, а это просто расточительство.
Заговорив о затратах, мы вплотную
подошли к вопросу о стоимости услуг по доступу к ресурсам Internet по
электронной почте, к ее структуре и политике различных провайдеров в этой
области.
8. Системы хранения и поиска данных
В основе всех современных
информационных приложений находятся системы хранения данных во внешней памяти и
их эффективного поиска. В зависимости от специфики приложений используются
разные технологии хранения и поиска данных. Если проводить грубую классификацию
таких технологий, то можно выделить два основных направления - системы
управления базами данных (СУБД) и информационно-поисковые системы (ИПС). Эти
направления взаимно дополняют друг друга и в совокупности обеспечивают
возможность построения приложений в разных архитектурах, с разной
функциональной ориентированностью, с разными требованиями к доступу к данным и
т.д.
Основными характеристиками среды
хранения данных, управляемой СУБД, являются:
- структурированная
природа хранимых данных, причем описание структуры является частью самой
базы данных, т.е. известна СУБД (соответствующую часть базы данных иногда
называют метабазой данных);
- существенно
частое обновление данных, эффективно поддерживаемое СУБД и производимое
многими пользователями, одновременно подключенными к базе данных;
- автоматическое
поддержание целостного состояния базы данных на основе механизма
управления транзакциями и хранимого в метабазе данных набора ограничений
целостности и/или триггеров;
- поддержка
структурированных языков доступа к базе данных, в которых условие поиска
представляет собой логическую связку разнообразных простых условий,
накладываемых на содержимое требуемых записей.
Среду хранения данных, управляемую
ИПС, характеризует в основном следующее:
- отсутствие
структуризации данных, известной ИПС; как правило, в таких системах
хранятся полнотекстовые документы, структура которых (если речь идет о
структурированных документах) известна соответствующим приложениям;
- редкое
обновление данных, уже включенных в среду хранения; в частности, во многих
ИПС обновление среды хранения данных (изменение, удаление, добавление
документов) производится только в специальном режиме, не допускающем
одновременную выборку информации;
- отсутствие
встроенного в систему механизма поддержания целостности данных;
необходимые механизмы контроля вводимой информации должны являться частью
приложения;
- наличие
развитых механизмов выборки информации, основанных на логических связках
простых условий, накладываемых на содержание искомых документов; примерами
простых условий является указание ключевых слов, характеризующих документ,
или контекста, относящегося к содержимому документа.
ИПС по естественным причинам никогда
не претендовали на роль СУБД. Однако обратное неверно, и многие производители
СУБД пытаются ввести в состав своих продуктов возможности, позволяющие
использовать их в качестве систем информационного поиска. Нужно заметить, что
особых успехов в этой деятельности не видно. Главным образом, это связано с
реляционной спецификой современных серверов баз данных, с их ориентацией на
обеспечение эффективного доступа к структурированной информации. С другой
стороны, многие возможности серверов баз данных в действительности не требуются
для поддержки полнотекстовой информации. К таким возможностям можно отнести развитые
средства управления транзакциями, организацию развитых средств динамического
обновления данных, реализацию структурированных языков запросов и т.д.
В дальнейшем в этом разделе курса мы
не будем затрагивать специфические свойства ИПС. Это связано не с тем, что мы
считаем это направление недостаточно существенным для организации
информационных систем. Все дело в том, что в настоящее время основной областью
применения ИПС являются распределенные информационные системы, базирующиеся на
Web-технологии. Естественно, имеются смежные вопросы, касающиеся, например,
возможностей доступа к традиционным базам данных в среде Internet. Тем не
менее, однако, обе эти области достаточно широки по отдельности, чтобы можно
было рассматривать их независимо.
8.1. Новые веяния в области серверов реляционных баз
данных
Начнем с того, что текущее поколение
программных продуктов, предназначенных для управления базами данных,
практически полностью базируется на классической реляционной модели данных,
которая в той или иной степени развивается и модифицируется в разных системах.
Реляционная модель данных обладает большим числом достоинств и, конечно,
многими недостатками. К числу достоинств можно отнести простую и вместе с тем
мощную математическую основу модели, базирующейся на наиболее прочных аппаратах
теории множеств и формальной логике первого порядка. Пожалуй, реляционная
модель является исключительным примером соразмерности используемых
математических средств и получаемых от этого преимуществ. Достоинством
реляционного подхода является и его интуитивная ясность. Для того, чтобы начать
грамотно использовать реляционную СУБД, совсем не требуется глубокое погружение
в формальную математику. Достаточно понять житейский смысл объектов реляционных
баз данных и научиться ими пользоваться. Проводятся интуитивные аналогии, не
нарушающие смысл понятий, между отношениями-таблицами-файлами,
атрибутами-столбцами-полями записей, кортежами-строками-записями файла и т.д.
Как всегда бывает в жизни,
отрицательные качества реляционного подхода представляют обратную сторону его
достоинств. Очень просто представлять информацию в виде регулярных плоских
таблиц, в которых каждая строка имеет одну и ту же структуру, а в столбцах
могут храниться только простые данные атомарной структуры. Но одновременно, при
использовании реляционных баз данных для хранения сложной информации возникают
сложности. Известный консультант и аналитик Эстер Дайсон сравнивает
использование реляционных баз данных для хранения сложных объектов (объектов,
для представления которых недостаточно использовать плоские таблицы) с
необычным использованием гаража, когда каждый раз, устанавливая автомобиль в
гараж, шофер полностью его разбирает, а утром выполняет полную процедуру
сборки. На самом деле, соответствующие процедуры сборки (соединения нескольких
таблиц) являются наиболее трудоемкими в реляционных СУБД. Другая проблема
состоит в том, что упрощенная структура реляционных баз данных не позволяет
сохранить в базе данных ту семантическую информацию (знания), которыми
располагал ее создатель при проектировании. Реально ситуация выглядит следующим
образом. На первой, наиболее интеллектуальной фазе проектирования базы данных
имеется существенный запас данных, почерпнутых проектировщиком в процессе
анализа предметной области. Однако по мере перехода к определению реально
хранимых структур эти знания теряются, оставаясь в лучшем случае в виде
бумажной или не привязанной к базе данных электронной информации, использование
которой необходимо в жизненном цикле базы данных и соответствующей информационной
системы, но сильно затруднено.
Перечисленные положительные и
отрицательные качества реляционных баз данных в большой степени влияли на
развитие индустрии баз данных в последние годы. Несколько лет тому назад
казалось, что перевешивают отрицательные качества. В результате появилось
несколько новых направлений архитектур баз данных, каждое из которых принесло
новые методы и алгоритмы, а также экспериментальные реализации. Мы не будем
глубоко вдаваться в обсуждение этих подходов, но все же приведем их краткую
характеристику.
В классической реляционной модели
данных содержимым столбцов могут быть только значения базовых типов данных
(целые и плавающие числа, строки символов и т.д.). Не допускается хранение в
столбце таблицы массивов, множеств, записей и т.п. Собственно, это и означает,
что таблицы классической реляционной модели являются абсолютно плоскими
(по-другому это называется представлением таблиц в первой нормальной форме).
Вся сложность структур предметной области уходит в динамику; требуется
непрерывная сборка сложных объектов из их элементарных составляющих. Один из
подходов к расширению возможностей реляционной модели данных заключается в
отказе от требования первой нормальной формы. Значением столбца таблицы может
быть любой объект, представляемый в виде строки, массива, списка и даже
таблицы. Понятно, что при использовании таким образом расширенной модели, в
качестве строки таблицы может храниться уже собранный объект с произвольно
сложной (иерархической) структурой. Причиной того, что реляционные системы с
отказом от требования первой нормальной формы не вошли в широкую практику,
является прежде всего необходимость полного пересмотра внутренней организации
СУБД (начиная со структур хранения). Кроме того, если для классических реляционных
баз данных давно и тщательно отработана технология и методология
проектирования, то проектирование ненормализованных реляционных баз данных
недостаточно хорошо изучено даже на уровне теории. Тем не менее, на рынке СУБД
имеется продукт UniVerse компании VMark, в которой в ограниченных масштабах
поддерживается хранение ненормализованными реляционными данными.
Понятно, что ограничением
ненормализованных реляционных баз данных является обязательность иерархической
организации хранимой информации. Конечно, это совсем другой уровень построения
информации, чем тот, который поддерживался в дореляционных иерархических
системах. Между элементами данных отсутствуют явно проводимые физические
ссылки. Упрощена процедура реструктуризации данных (в частности, в ненормализованной
реляционной модели предполагается наличие пары операций nest/unnest,
позволяющих сделать существующую таблицу элементом, хранимым в столбце другой
таблицы, или "вытянуть" на верхний уровень некоторую вложенную
таблицу). Тем не менее, общая структура остается иерархической. Во многих
случаях этого достаточно (в частности, для решения проблемы, упоминавшегося
выше примера Эстер Дайсон).
Однако существуют потребности,
выходящие за пределы возможностей иерархических организаций данных. Стандартным
примером является необходимость в моделировании сложных объектов, в которые
входит один и тот же подобъект. Например, объект "человек" может
являться подобъектом объекта "отдел", подобъектом объекта
"семья" и т.д. Для определения требуемых структур недостаточна чисто
иерархическая организация, требуется возможность построения сетевых структур.
Соответствующее направление получило название "базы данных сложных
объектов". Поскольку трудно сказать, насколько сложные структуры
потребуются при реальном моделировании предметных областей, должен
поддерживаться механизм произвольно сложной структуризации с поддержкой
возможности определения структурных типов данных, типов массивов, списков и
множеств, а также развитыми средствами использования указателей. Конечно, с учетом
опыта реляционных баз данных в базах данных сложных объектов никогда не
предполагалось использование адресных указателей физического уровня. Одним из
естественных требований было наличие возможности взятия из базы данных
произвольно сложного объекта с возможностью его перемещения в другую область
внешней памяти или вообще в память другого компьютера. Основной проблемой баз
сложных объектов являлось отсутствие простого и мощного интерфейса доступа к
данным, хотя бы частично сравнимого с простотой и естественностью реляционных
интерфейсов.
|