Электронная библиотека
Сибирского отделения РАН

Шокин Ю.И., Федотов А.М.
Институт вычислительных технологий СО РАН

Содержание

Введение


Современные информационные технологии и широкое развитие сети Интернет вызвало к жизни принципиально новые виды информационных ресурсов - электронные публикации и коллекции, обличенные в форму электронных библиотек. Важнейшей частью Информационной среды Сибирского отделения РАН является информационная поддержка научных исследований, проводимых в Отделении, а также создание и развитие собственных информационных ресурсов, управление этими ресурсами, обеспечение использования информационных ресурсов мирового научного сообщества, представляемых сетью Internet и распространение своих достижений в виде электронных коллекций, атласов и информационных систем, а также в виде электронных публикаций и электронных библиографических ресурсов.

В условиях современного динамического развития общества, информация становится таким же стратегическим ресурсом, как традиционные материальные и энергетические ресурсы. Информация является важнейшим стратегическим ресурсом и наибольший экономический и социальный успех сегодня сопутствует тем странам, которые активно используют современные средства компьютерных коммуникаций и сетей, информационных технологий и систем управления информационными ресурсами. Становление современного информационного общества немыслимо без использования информационных ресурсов в электронном виде. Перенесенные на магнитные носители и собранные в общую систему информационные ресурсы приобретают новый статус, в котором реализуется качественно иной уровень производства, хранения, организации и распространения самой разнообразной информации (текст, графика, аудио, видео и др.).

В Отделении накоплена и постоянно собирается уникальная научная информация как по различным отраслям наук, так и по природному комплексу. Но к сожалению пока отсутствует единая технология сбора информации, разобщенность ее как по месту хранения, так и по форме представления и что самое главное отсутствует информация об информации. Все это не позволяют широко использовать информационные ресурсы для интенсификации и кооперации междисциплинарных фундаментальных и прикладных исследований.

В силу не зависящих от нас причин, происходит непрерывное уменьшение внешних контактов сотрудников Отделения (особенно молодых), уменьшается число командировок, поездок на конференции, количество приходящих в библиотеки журналов и т.д., а это в свою очередь приводит к дальнейшему уменьшению количества информации об информации.

Существенной проблемой, связанной с информационными ресурсами Отделения, является факт "гибели" информации, вызванный постоянным оттоком кадров исследователей и технического персонала, ответственного за ее хранение.

Отсутствие основной информации (или отсутствие информации об этой информации), необходимой для научных сотрудников приводит к чрезмерной перегрузке внешних каналов сети Интернет ННЦ. Для решения проблемы информационной недостаточности необходимо создание собственной универсальной информационной системы Отделения, в которой бы аккумулировалась большая часть необходимой для сотрудников информации (как собственной, так и внешней), включая создание полнофункциональной системы об интеллектуальном потенциале Отделения (информационную систему об институтах и сотрудниках Отделения) и создание и поддержку "Электронной библиотеки Сибирского отделения РАН".

Например, научное сообщество Германии, на своих серверах зеркально отражает все известные информационные системы мира (в том числе, например, и русскоязычный сервер СО РАН) и большую часть файловых архивов, ведет достаточно подробную базу данных (по крайней мере в области математики) "кто есть кто в научном мире".

Направления работ


Для решения проблемы информационной недостаточности необходимо создание собственной универсальной информационной системы Отделения, включая создание и поддержку "Электронной библиотеки Сибирского отделения РАН", содержащей полнофункциональную систему об интеллектуальном потенциале Отделения (информационную систему об институтах, сотрудниках, достижения и др. аспектах, связанных с работой Отделения), систему электронной поддержки сбора и накопления информации (системы электронных коллекций, баз данных и т.п.).

В одном из основных пунктов, записанных в постановление Президиума СО РАН о "Сети Интернет Новосибирского Научного Центра" (N 81 от 22.03.99) сказано: "Считать первоочередной задачей создание и активное расширение объемов собственных информационных ресурсов сети, используя, в том числе, конкурс интеграционных проектов".

Информационная система Сибирского отделения РАН должна обеспечить:

Организационно-технологическое обеспечение процесса создания полнофункциональной информационной системы включает в себя большой спектр работ, связанных с организацией системы доступа пользователей к информационно-вычислительным ресурсам и к базам данных, сохранение, поддержку и создание информационных ресурсов Отделения, что самое главное воспитание нового пользователя, способного жить и работать в современном информационном мире. Для решения этой задачи необходимо:

В настоящий момент при создании электронной библиотеки решается целый ряд технологических задач хранения и накопления информации, с одной стороны, и задачи организации удобного доступа к информации, с другой стороны. Принципиально здесь можно выделить следующие направления работ:

Часть из этих вопросов носит чисто организационно-технологический характер, другая часть требует решения новых невозникавших ранее задач.

Проекты


В январе-июне 1998 года в Сибирском отделении РАН была сформирована целевая программа Отделения создания и развития информационных ресурсов под общим названием "Электронная библиотека Сибирского отделения РАН". В рамках данной программы разработан и уже осуществляется целый ряд проектов поддержки работ по созданию информационных ресурсов с использованием Internet/Intranet технологий и организации системы доступа к информации через WWW сервис Internet (часть которых поддержана РФФИ или другими фондами).

Основные направления программы связаны с формированием собственных электронных ресурсов по основным отраслям наук (науки о земле, химия, биология, археология и др.), созданию и поддержке электронных коллекций и электронных публикаций, организации удобных систем доступа к библиотечным и библиографическим базам данных ГПНТБ СО РАН и базам данных Институтов Отделения, организации зеркал наиболее значимых мировых информационных ресурсов, необходимых для работы сотрудников Отделения.

В настоящий момент в программу включены следующие проекты:

  1. Информационно-телекоммуникационная среда Отделения - "Сеть Интернет Новосибирского научного центра" (акад. Шокин Ю.И., проект РФФИ 97-07-90372) - интеграционный проект по созданию информационно-телекоммуникационной среды Отделения и координации работ по созданию информационных ресурсов.

  2. Создание нормативно-правовой базы использования информационных ресурсов Отделения (д.ф.н. Целищев В.В.).
    Методологические основания разработки нормативной базы, регламентирующей отношения, возникающие при формировании, передаче, использовании и защите информации в системе электронных библиотек.

  3. Информационная безопасность полнотекстовых баз данных в среде Интернет (д.ф.-м.н. Федотов А.М., проект РФФИ 98-01-00772)

  4. Создание электронной библиотеки ГПНТБ СО РАН (д.т.н. Елепов Б.С., проект РФФИ 98-07-91075)

  5. Полнотекстовые базы данных научных публикаций: Электронные журналы по математике СО РАН) (акад. Шокин Ю.И.)

  6. Электронный атлас "Биоразнообразие животного и растительного мира Сибири" (акад. Коропачинский И.Ю., проект РФФИ 99-07-90222)

  7. Интегральная электронная библиотека по пространственным структурам и функциям ДНК, РНК и белков (д.б.н. Колчанов Н.А., проект РФФИ 98-07-91078)

  8. Объединенная информационная система по наукам о Земле СО РАН (к.ф.-м.н. Жижимов О.Л.)

  9. Объединенная информационная система по химическим наукам СО РАН (акад. Пармон В.Н.)

  10. Электронные ресурсы сибирской и мировой археологии и этнографии (д.и.н. Холюшкин Ю.П.)

  11. Обеспечение унифицированного доступа к разнородным коллекциям и информационным ресурсам на основе технологии CORBA (д.ф.-м.н. Марчук А.Г., проект РФФИ 98-07-91256)

  12. Информационная система поддержки исследований в области математики (акад. Шокин Ю.И., д.ф.-м.н. Федотов А.М., INTAS IA-003)

Данная программа была одобрена на заседании Президиума СО РАН 25.06.98 (см. презентацию доклада MS PowerPoint файл - pps, объем 3.1Mb, ZIP-файл MS PowerPoint, объем 2.7Mb).

Программа открыта для включения в нее других проектов, способствующих накоплению и развитию информационных ресурсов Сибирского отделения РАН.

Информационный сервер Отделения


Создаваемая электронная библиотека базируется на информационном WWW сервере Отделения (http://www-sbras.nsc.ru/), который является интегрирующим звеном для системы поддержки информационных ресурсов Отделения.

В настоящий момент сервер содержит разнообразную информацию о деятельности Сибирского Отделения, включая: научно-исследовательские и конструкторско-технологические институты (База данных СО РАН); публичная доска объявлений; основные результаты исследований и годовые отчеты СО РАН; интеллектуальный (научный) потенциал Сибири; конференции СО РАН; электронная библиотека СО РАН; поддержка исследований в области математики; важнейшие разработки Институтов СО РАН, предлагаемые для широкого использования; Сеть Internet Новосибирского научного центра; информационные проекты СО РАН; Геоинформационные технологии в СО РАН (информационный бюллетень); Дом Ученых СО РАН; газета "Наука в Сибири"; справочные материалы по информационным ресурсам; нормативные документы РФ, касающиеся науки, информатизации и средств связи; схемы автомобильных дорог Новосибирской области; фотоальбом Сибирского Отделения РАН; история Сибирского Отделения РАН и др. На WWW сервере Сибирского отделения поддерживается Информационный сервер Сибирского информационно-консультационного центра по сотрудничеству Российской Федерации и Европейского союза в области науки и техники.

Из наиболее важных информационных систем отметим:

Библиотечно-информационное обслуживание


Среди других немаловажных ресурсов Отделения следует отметить разработку системы библиотечно-информационного обслуживания сотрудников СО РАН, включающую

Среди таких систем в Отделении наиболее развитыми являются:

Собственные информационные ресурсы


Наиболее важной работой, связанной с созданием информационных ресурсов Отделения, входящих в состав "Электронной библиотеки", является создание собственных электронных коллекций, аккумулирующих гигантский научный потенциал Отделения, особенно в области биологических и гуманитарных исследований. Среди начатых работ следует отметить как наиболее продвинутые следующие:

Используемые технологии


В основу создания Электронной библиотеки СО РАН положен принцип Internet/Intranet технологии. Использование этих технологий при создании информационных ресурсов и построении информационных систем различного назначения в ближайшее время станет доминирующим в мировом информационном пространстве по следующим причинам. Эти технологии:

Что самое главное Internet технология позволяет оперативно управлять и актуализировать информацию, хранящуюся в базах данных через просмотрщик (браузер) WWW страниц и создавать динамические системы формирования коллекций.

Основной принцип, заложенный в Intranet технологию создания информационных ресурсов и построения информационных систем, заключается в разделении вычислительных ресурсов как между многочисленными серверами, расположенными в различных концах сети, так и между серверами и клиентами (компьютер на котором работает конечный пользователь). Реализация этого принципа основана на использовании либо протокола HTTP-SQL (формирование SQL запросов к БД с WWW сервера), либо API (организация динамических приложений на стороне сервера), либо Java (JDBC - организация динамических приложений на стороне клиента) интерфейсов для формирования запросов пользователя к базам данных или к другим информационным источникам на получение и обработку информации.

Internet технология позволяет удачно сочетать возможности гипертекстового оформления информации c использованием возможностей современных СУБД. Причем со стороны клиента полностью унифицируются запросы на поиск и представление информации, а также получение аналитических справок и данных из информационных систем.

Вместе с тем, рассматриваемые технологии позволяют использовать в сетевом режиме уже имеющиеся базы данных, не затрачивая при этом средства на их унификацию и приведение к единому стандарту. Основные затраты здесь направлены только на соответствующие описания баз данных и запросов для интерфейса доступа к базам данных (напрямую через протокол HTTP-SQL или через протокол Z39.50) или для сервера обработки транзакций, при этом базы данных могут находится на различных машинах, расположенных на произвольном расстоянии друг от друга. Использование данной технологии позволяет решать весь спектр задач, присущий информационной системе, включая удаленный ввод и редактирование данных.

Динамическая система публикаций


В настоящее время представление информации в виде статических HTML-страниц для полномаштабных информационных систем, каковыми являются электронные библиотеки и коллекции, теряет актуальность, поскольку любое небольшое ее изменение или обновление зачастую влечет за собой весьма энергоемкую процедуру исправления множества файлов, а создание системы поиска упирается в организации индексных файлов, размер которых может быть сравним с размером основной информации.

В связи этим, в основу создания электронных коллекций в наших работах положена концепция динамических документов, в которой каждый тип документов, содержащих информацию о конкретных фактах, представляется в виде набора объектов со своими характеристиками и атрибутами (наподобие тому, как это принято в объектных языках программирования). При этом выделяются три основных типа объектов, характеризующих документ: 1) объект-заголовок, описывающий внешний вид документа, при выдаче его пользователю; 2) информационный-объект, содержащий фактическую информацию (текст, графика, измерения и т.п.); 3) навигационный-объект, описывающий гипертекстовые связи между отдельными документами.

Очевидно, что введение первого и третьего типов объектов, связано с WWW технологией представления информации и их описание основывается на таких принципах создания HTML документов, как стиль документа (на основе CSS - Cascading Style Sheets или XML - Extensible Markup Language).

Информационные объекты, которые как правило хранятся в базе данных, подразделяются на простые объекты (объекты, которые не имеют связей с другими коллекциями документов или с другими документами) и сложные объекты (объекты, которые такие связи имеют). Создание любой электронной коллекции основывается на информационной структуре данной коллекции документов. Поэтому каждый информационный объект должен в своем описании нести "полную характеристику" как его "использовать".

Для занесения в электронную коллекцию фактографической информации, последняя подлежит паспортизации - формальному описанию структуры объектов, составляющих документы, (см., например, унифицированный паспорт описания сообществ в информационной системе "Зеленая книга Сибири", содержащая информацию о редких и нуждающихся в охране растительных сообществ Сибири).

Разработанная технология позволяет оперативно управлять и актуализировать информацию, хранящуюся в разнородных и распределенных по сети базах данных, организовать гибкий поиск, что самое главное создать достаточно удобный интерфейс для ее наполнения.

По данной технологии в настоящий момент создаются и уже функционируют коллекции электронного атласа "Биоразнообразие животного и растительного мира Сибири", коллекции полнотекствых документов (см. электронную версию журнала "Вычислительные технологии"), публичная доска объявлений СО РАН, информационная система "Геоинформационные технологии в СО РАН", и др.

В заключении отметим, что в конце апреля 1999 года в Новосибирском академгородке состоялось Четвертое рабочее совещание по электронным публикациям, которое проводилось с использованием динамической системы публикаций и на котором было представлено большинство результатов работ Отделения, посвященных созданию электронных коллекций и библиотек (см. более подробную информацию в материалах совещания и в тезисах докладов).


Тезисы доклада на Российско-британском семинаре "Электронные библиотеки"
Москва, 16-17 июня 1999 г.
http://www.iis.ru/rbdlw99/



Ваши комментарии
Обратная связь
[SBRAS]
[СО РАН]
[ИВТ СО РАН]

© 1996-2014, Сибирское отделение Российской академии наук, Новосибирск
© 1996-2014, Институт вычислительных технологий СО РАН, Новосибирск
    Дата последней модификации: Monday, 22-Nov-1999 19:49:01 NOVT