Пленарные заседания
Электронная библиотека ГПНТБ СО РАН состоит из нескольких полнотекстовых баз данных:
Для объединения всей этой разнокалиберной информации в полнотекстовые базы данных требовалось выбрать единый формат. И таким форматом, безусловно, является PDF.
Через единую систему доступа пользователь может получить как отдельные части, так и документы в полном комплекте.
На предыдущем совещании мы подробно описали технологию создания каждой из баз данных.
Поскольку БД "Памятники пушкинской эпохи в Фонде редких книг и рукописей ГПНТБ СО РАН" является развитием работ над коллекцией ?Прижизненные издания А.С. Пушкина в Фонде редкой книги ГПНТБ СО РАН? кратко опишем технологию обработки этой коллекции, реализованную в ГПНТБ СО РАН.
Наиболее сложная часть задачи - адекватность отображения экземпляров коллекции. Единого решения, подходящего для самых различных по тематике коллекций фонда, скорее всего не существует и требуется отдельное тщательное изучение каждого отдельного собрания.
Нами было опробовано несколько десятков схем сканирования и последующей обработки изображений. В результате мы остановились на следующем варианте:
Созданная коллекция состоит из 30 изданий общим объемом около 2000 страниц.
Новая БД создавалась по такой же схеме, но с двумя существенными добавлениями.
Из каждого "эталонного" tiff образа для электронной коллекции создаются два Jpeg образа, которые отличаются в 1.5 раза (по линейным размерам) друг от друга.
В результате пользователь получает возможность просмотра страниц коллекции "с увеличением".
Кроме того, общий объем второй коллекции составит около 35000 страниц, что значительно повышает требования к сканирующему оборудованию, дисковому пространству и оперативной памяти.
Примечание. Тезисы докладов публикуются в авторской редакции
Ваши комментарии А.М.Федотов |
[Головная страница] [Конференции] [СО РАН] |
© 2000, Сибирское отделение Российской академии наук, Новосибирск