VII Международная конференция по электронным публикациям "EL-Pub2002"

23-27 сентября 2002 г., г. Новосибирск, Академгородок

Программное обеспечение Z39.50 ZooPARK как основа для построения распределенных информационных систем

Жижимов О.Л.zhizhim@uiggm.nsc.ru
Мазов Н.А. mazov@uiggm.nsc.ru
Скибин С.В.skibin@uiggm.nsc.ru
Объединенный Институт геологии, геофизики и минералогии
Сибирского Отделения РАН,
пр. Акад. Коптюга 3, 630090 Новосибирск, Россия.


Авторы настоящего доклада являются разработчиками серверного программного обеспечения Z39.50 – «ZooPARK» [1], успешно функционирующего сегодня в РИС г. Новосибирска («Региональная библиотечная система»), СО РАН («Интегрированная РИС СО РАН»), РИБС г. Москвы («Корпоративная сеть публичных библиотек Москвы»), РИС LibWeb («Распределенный каталог LibWeb») и в других. По различным данным программное обеспечение ZooPARK составляет от 60 до 70% серверного программного обеспечения Z39.50 в России и входит в десятку самых популярных серверов Z39.50 в мире.

Z39.50 [2] – это стандарт, разработанный ANSI и принятый ISO в 1998 г. (ISO-23950). Стандарт описывает процедуры сетевого доступа к базам данных. Вся идеология Z39.50 построена на абстрагировании от реализации конкретной системы. При этом каждая «физическая» база данных должна быть отображена на абстрактную модель Z39.50, элементы которой описываются в терминах уникальных идентификаторов (OID – идентификатор объекта). Например, существуют такие классы OID:

За рамками протокола остается вопрос о способах хранения данных и вопрос о вариантах реализации конкретных систем. Таким образом, для хранения информации могут использоваться различные СУБД. Исторически сложилось так, что основной сферой применения Z39.50 являются библиотечные системы, однако в последнее время протокол начинает широко применяться для доступа к любым метаданным. К концу текущего года ожидается появление новой (v.4) редакции протокола.

Сервер ZooPARK предназначен для эксплуатации в качестве базового сервера Z39.50 (iso23950) распределенной информационной системы общего назначения на различных программно-аппаратных платформах. Сервер является частью комплекта программного обеспечения информационной системы, в состав которой входят:

Установленные в узлах информационной системы однотипные серверы ZooPARK могут образовывать кластеры с перераспределением поисковых запросов. Серверы Z39.50 других производителей также могут быть включены в подобные кластеры, но с ограниченными возможностями.

Рис.1 Схема распределенной информационной системы

Сервер ZooPARK обеспечивает работу по протоколу Z39.50 v3 [Z39.30] со встроенной поддержкой стандартных схем данных Wais, GILS, Collections, Geo, CIMI, Zthes, Update-ES и локально определенных Explain, PERSONS и UIGGM. В текущей версии сервера реализованы следующие функции:

Основные параметры:

Сервер допускает работу в многосерверной распределенной информационной системе. Для Windows NT сервер ZooPARK реализует модель многопоточного приложения Win32 (один клиент – один поток), для UNIX – модель однопоточного (один клиент – один процесс).

Последняя версия ZooPARK 3.0 имеет архитектуру, представленную на рис. 2 и поставляется для следующих аппаратно-программных платформ:

Сервер ZooPARK построен по модульному принципу. Взаимодействие его с различными иточниками данных осуществляется через модули, называемые провайдерами данных, сейчас существует и функционирует несколько провайдеров. Это:

На основе полностью документированного интерфейса провайдера можно создать провайдер данных практически для любой системы хранения и обработки данных, например, для файловых систем, для серверов приложений, для различных реляционных СУБД и пр. Для реляционных СУБД существует еще один вспомогательный интерфейс, благодаря которому намного проще и надежнее организовать взаимодействие как с конкретным решением РСУБД, так и с такими технологиями, как ODBC, ADO и пр..

Каждый провайдер полностью скрывает логику взаимодействия с источниками данных, позволяя ядру сервера ZooPARK присоединять такие модули как динамически, в зависимости от типа источника данных, так и статически, используя предопределенный набор таких модулей.

Клиентами могут быть как специализированные программные продукты, так и Z-шлюзы, устанавливаемые на требуемых серверах. Существует множество возможностей построить шлюз, например, вместе с ZooPARK поставляется CGI-шлюз, существуют свободно распространяемые модули для Perl, PHP и пр.

Общаяя схема информационной системы представлена на рис. 3. Данная схема обладает следующими преимуществами:

Помимо достоинств, существует и ряд трудностей, в основном организационного характера.

Авторы ведут постоянную работу по улучшению программного обеспечения ZooPARK, повышая удобство эксплуатации, надежности, масштабируемости решений с использованием нашего программного обеспечения.

Доклад сопровождается показом вариантов рабочих систем и демонстрацией шлюза Z39.50-http.

Литература

  1. Жижимов О.Л., Мазов Н.А.,Скибин С.В. Текущее состояние программного обеспечения Z39.50 ОИГГМ СО РАН (ZooPARK). // Матер. 9 Междунар. конф. «Крым-2002»: Москва, Издательство ГПНТБ России, 2002. – Т. 2. – С. 542–544.
  2. ANSI/NISO Z39.50-1995. Information Retrieval (Z39.50): Application Service Definition and Protocol Specification. Z39.50 Maintenance Agency Official Text for Z39.50-1995, July 1995.
  3. Жижимов О.Л. Введение в Z39.50. – Новосибирск: Изд-во НГОНБ, 3-е изд., доп. и перераб., 2002.


|Электронная библиотека| |Математические публикации| |Информационные ресурсы|
Ваши комментарии
Обратная связь
[SBRAS]
[Головная страница]
[Конференции]
[СО РАН]

© 2002, Сибирское отделение Российской академии наук, Новосибирск
© 2002, Объединенный институт информатики СО РАН, Новосибирск