IV рабочее совещание по электронным публикациям - EL-PUB-99

Новосибирск, Академгородок, ИВТ СО РАН, 21 - 23 апреля 1999 года.

Тезисы докладов


Электронные публикации биологических данных

Коропачинский И.Ю., Шокин Ю.И., Байков К.С., Ермаков Н.Б., Федотов А.М.

Центральный сибирский ботанический сад СО РАН (Новосибирск),
Институт вычислительных технологий СО РАН (Новосибирск)

Не секрет, что информация является стратегическим ресурсом, таким же как и традиционные материальные и энергетические ресурсы. Информационные ресурсы, переведенные в электронную форму, приобретают новое качество, обеспечивая им более широкое распространие и эффективное использование.

Современные информационные технологии позволили приступить к широкомасштабному переводу накопленной человечеством информации в электронную форму и созданию принципиально новых видов информационных ресурсов каким являются электронные библиотеки, организация доступа к которым стала одной из важнейших задач информационного обслуживания науки и образования. Создание электронных библиотек представляет собой качественно иной уровень производства, хранения, организации и распространения самой разнообразной информации (текст, графика, звук, видео и др.).

Биологи в процессе научной деятельности собирают гиганский фактический материал, характеризующий различные стороны биоразнообразия животного и растительного мира. В настоящее время этот оригинальный материал находится в виде бумажных архивов и не представляет организованную информационную среду, которая является основой для современных научных исследований. Между научными подразделениями как в России, так и за рубежом отсутствуют надежные и быстродействующие каналы обмена информацией, что является существенным препятствием на пути развития интеграционных проектов и других форм научного взаимодействия. Многие важные результаты биологических исследований публикуются в региональных и местных научных изданиях, которые малодоступны для широкого круга исследователей.

Электронная публикация данных представляет собой новую форму хранения и обмена информацией. Для нее характерны прежде всего динамичность (возможность обновления) и глобальный доступ (через компьютерные сети). На сегодняшний день электронные публикации не преобладают в общем объеме опубликованных информационных ресурсов, но их доля стремительно растет. При этом возрастает и качество таких публикаций.

Изначально электронная публикация появилась как электронный вариант бумажной публикации. В последние годы она приобрела самостоятельное значение. Более того, часть научных проектов, например, Flora of North America, в процессе их выполнения была переориентирована с бумажной формы опубликования на электронную. В электронной форме планируется публиковать и новую "Флору России" (Гельтман, 1997). Во всяком случае, электронная форма опубликования признается уже сейчас как приоритетная по сравнению с типографской. Отсюда становится очевидным приобретение электронной формой опубликования самостоятельного и первоочередного значения. Интеллектуальные и технические ресурсы в ближайшие годы будут направлены на развитие новых возможностей и повышение качества электронной публикации данных.

В последние годы, преимущественно за рубежом, были предприняты попытки издания биологических баз данных на CD-ROM дисках по разным тематикам (например, "North American Birds"). Как правило, они имеют общеобразовательный либо прикладной характер. Имеются и отечественные разработки в этой области ("Мир жуков", "Деревья Германии", "Бобовые России" и др.).

С другой стороны, все большее количество ученых-биологов используют электронные базы данных для оптимизации работы, систематизации предметной области, быстрого и качественного оформления результатов своей деятельности. Необходимо создание и внедрение системы, способной быстро публиковать научные данные в Интернет. В России разработку такой системы выполнила фирма FLORIN/DataX, возглавляемая ботаниками, сотрудниками ГБС РАН и МГУ (Серебряный М.М., Савов К.П., Майоров С. и др.). Распространению FLORIN (floristic Investigations) в России препятствует высокая цена на программные продукты, входящие в ее состав. С помощью этой системы созданы электронные публикации по типовым образцам Гербария МГУ, мхи бывшего СССР, палинология рода Centaurea и др.

Важной проблемой выступает организация разнородной информации в удобном для конечного пользователя виде, что требует новых исследований и разработок интерфейсов для корректного отражения предметной области. Другой задачей обслуживания электронных библиотек является стандартизация данных (прежде всего соблюдение требований интероперабельности), разработка технологических решений и юридических аспектов использования информации, включая вопросы интеллектуальной собственности. Отличительной чертой электронной библиотеки является возможность параллельного использования различных поисковых механизмов и средств доступа к гетерогенным банкам электронных данных. Так как в качестве ответа на запрос к электронной библиотеке пользователю может быть представлен далеко не единственный электронный документ (или его фрагмент) и совсем не обязательно в текстовой форме, необходимы такие информационные системы, которые бы обеспечивали эффективный комплексный поиск и анализ информации в коллекциях гетерогенных объектов.

Публикация биологических данных в электронном виде принципиально не отличается от электронной публикации других данных, но имеет некоторые особенности (большой объем текстовой и графической информации, географическая привязка данных и др.).

Некоторые проблемы более широкого применения электронных публикаций биологических данных зависят от ряда причин. Прежде всего, традиционно сложилась схема исследований, ориентированных на бумажные носители информации. Имеются профессиональные трудности в освоении вычислительной техники, сказывается недостаток технических средств (собственно персональных компьютеров). Существует боязнь потери данных на магнитных носителях. Негативную роль играет недостаточное знание современных информационных технологий и методов анализа инфрмации.

Для более широкого применения электронной формы публикации биологических данных необходимо:

  1. Осознание биологами новых возможностей представления данных, возникающих при их опубликовании в электронном виде (гипертекст): цветные иллюстрации, многовходовый доступ, развитая поисковая система, оформление перекрестных ссылок, географическая привязка данных с использованием геоинформационных систем, обеспечение связи с другими информационными ресурсами по данной тематике и др.
  2. Осознание биологами новых возможностей доступа к данным и обмена данными.
  3. Осознание авторами крупных проектов, таких как коллективные "Флоры" и "Фауны", принципиально новых возможностей создания коллективных монографий в режиме удаленного доступа.
  4. Представление о том, что по завершении работы готовый продукт автоматически становится валидной публикацией, которую можно включать в список опубликованных работ и делать на нее ссылки.
  5. Разработка новых, более эффективных программных средств организации и хранения разнородной биологической информации, удобного и быстрого доступа к ней (дружественный интерфейс), автоматизация поиска и анализа информации, создание экспертных систем, помогающих исправлять ошибки и генерировать новую информацию по имеющимся данным.
  6. Администрирование баз данных с оформлением прав доступа к информации по схеме пользователь (только чтение), автор (изменение и дополнение информации), администратор базы (изменение структуры данных), защита данных от несанкционированного доступа, документирование работы каждого автора.
  7. Привлечение к совместной работе широкого круга специалистов из других городов и стран.

Работа выполняется в рамках проектов "Электронная библиотека Сибирского отделения РАН" и РФФИ 99-07-90222 "Биоразнообразие животного и растительного мира Сибири"

Примечание. Тезисы докладов публикуются в авторской редакции



|Электронная библиотека| |Математические публикации| |Информационные ресурсы|
Ваши комментарии
А.М.Федотов
[SBRAS]
[Головная страница]
[Конференции]
[СО РАН]

© 1999, Сибирское отделение Российской академии наук, Новосибирск