VIII Международная конференция по электронным публикациям "EL-Pub2003"

8 - 10 октября 2003 года, г. Новосибирск, Академгородок,
(номер государственной регистрации 0320301032)

Тезисы докладов


Построение виртуальных копий книжных памятников

Аникеева А.В., Казаков В.Г., Казаков В.В., Панина Н.Л.

НГУ (Новосибирск)

Книжные памятники - это древние книги, имеющие большое культурное и научное значение. Это уникальные объекты. А для археографов, историков, искусствоведов и многих других ученых работа с древними книгами является важной составляющей их научных исследований. Но в связи с тем, что такие книги отличаются большой ценностью и требуют специальных условий хранения, доступ к ним ограничен. Эта проблема отчасти решается с помощью микрофильмирования (постраничного фотографирования на микрофильм) и созданием факсимильных изданий. Микрофильмирование также является способом резервного копирования книжных памятников на случай потери оригинала (при пожаре, например). Однако микрофильмы трудны для тиражирования и также подвержены старению, а факсимильные издания очень дороги и их подготовка сложна. Неудивительно, что постоянно происходит поиск более дешевых и удобных средств копирования. Электронное (или как еще называют цифровое) копирования книжных памятников представляется наиболее удачным решением на сегодняшний день. Электронное копирование открывает много перспектив для людей, занимающихся исследованием и изучением книжных памятников. Во-первых, автоматически решается проблема доступности и резервного копирования. Во-вторых, цифровые копии легко и дешево тиражируются, удобны в обращении и обладают большим количеством других достоинств.

Целью данной работы является создание электронной копии, которая была бы максимально удобной для пользователей. То есть помимо графического представления материала, как в микрофильмах, предполагается наличие библиографического, палеографического и искусствоведческого описания. Невозможно адекватно оценить значение книжного памятника, не учитывая его исторический и культурный контекст. Исходя из этого, мы полагаем необходимым создание и публикация в Интернет не просто копии памятника, а целой информационной системы, дающей максимальное количество сведений о культурном контексте книжного памятника. Этой цели послужит обширный фактографический комментарий, рассказывающий о родственных книжных памятниках, текстах, произведениях искусства и об исторических условиях создания древней книги.

Следует выделить основные требования, предъявляемые к системе:

1.необходимо иметь изображения всех объектов книги с разрешением, достаточным для изучения деталей иллюстраций, текста, особенностей подчерка и т.д.

2.текст должен быть представлен как графическими образами, так и транслитерацией (записью текста в кодах с использованием шрифтов азбуки оригинала), а также переводами на современный язык

3.должна присутствовать справочная информация, облегчающая работу с книгой (комментарии к тексту, описание иллюстраций и т.п.) и дающая представление о культурном контексте ее создания

4.Каждый объект (лист, иллюстрация, маргиналия) должен быть библиографически и палеографически описан в соответствии со стандартами

В связи с указанными требованиями необходимо также добавить, что для более эффективного использования необходим дружественный интерфейс с удобной навигацией.

С технической стороны, виртуальные копии удобно строить на основе баз данных, поскольку здесь мы имеем дело с большими объемами однородной информации, которая изначально хорошо структурирована строгой организацией книжных объектов. Наилучшим решением, обеспечивающим доступность информации, является публикация таких баз данных в Интернет. В качестве СУБД была использована информационная система "ЛЕММА", разработанный в Мультимедиа центре НГУ, поскольку он, основываясь на реляционной платформе, поддерживает элементы объектного подхода, что позволяет разработку сложных концептуальных моделей и обеспечивает средства эффективного построения Web-интерфейсов. Кроме того, в состав системы входит конвертор баз данных в статичные HTML-файлы, что позволяет записывать разрабатываемый продукт на CD-ROM.

В соответствии со сформулированными требованиями были построены модель данных виртуальной копии русской рукописной книги и интерфейсная часть для публикации в Интернет. В процессе работы решен ряд задач, связанных со спецификой предметной области. Во-первых, модель данных должна предусматривать отсутствие любой части информации (могут быть утрачены листы, фрагменты декора и текста и т.д.). Построенная модель и интерфейс удовлетворяют данным требованиям, в том числе за счет того, что объекты связаны со страницами через атрибут "номер страницы" и их абсолютного позиционирования. Во-вторых, необходимо обеспечить отображение текстов церковнославянской письменности в Интернет. Однако нельзя предполагать наличие шрифтов церковнославянской азбуки на стороне клиента. Следовательно, шрифты необходимо хранить на стороне сервера и передавать клиенту по сети. Для передачи шрифтов по Интернет была использована технология Embedded OpenType решения компании Microsoft. В базе данных файлы шрифтов размещались в BLOB-полях специального объекта класса "интерфейсные элементы".

Для создания дружественного интерфейса, во-первых, был разработан постраничный просмотр копии книжного памятника, позволяющий узнать библиографическое и палеографическое описания страницы. Во-вторых, был применен оригинальный метод связи страницы с объектами, располагающимися на ней. То есть, просто щелкнув мышью по миниатюре, мы можем увидеть эту миниатюру в натуральную величину и ознакомиться с ее описанием. Если щелкнуть по тексту мы можем рассмотреть увеличенное изображение текста, посмотреть его запись транслитерацией и ознакомиться с переводом. Таким образом, мы можем получить информацию о любом объекте, находящемся на странице и увидеть его изображение в хорошем разрешении. Благодаря этому методу мы можем осуществлять эффективный поиск и изучение частей рукописи. При выполнении этой задачи, для каждого объекта помимо "номера страницы" указывалось местоположение данного объекта на странице. А потом с помощью запроса к базе данных выбираем все объекты, связанные с данной страницей, и размещаем на HTML странице с соответствующими гиперссылками. Если же нам надо найти какой-то определенный объект рукописи, то существует расширенный поиск по различным полям.

Разработка средств по внедрению шрифтов, применяемых для изготовления книжных памятников, проводилась рукописью XVII века С.У. Ремезова "История Сибири". Она опубликована в Интернет (http://www.mmedia.nsu.ru/vbook) и сконвертирована в статичные HTML файлы для размещения на CD-ROM. В настоящее время идет работа с виртуальной копией "Житие Александра Невского с составе Лаптевского тома Лицевого летописного свода". Построена система, поддерживающая библиографическое и палеографическое описание, создан развитый пользовательский интерфейс. То есть, на данный момент построен прототип виртуальной копии, над которым ведется отработка. У данной технологии большие перспективы. Построение системы на основе базы данных позволяет использовать данные различных аспектах. Например, возможно включить в функции системы возможность полностью автоматически строить оригинал макет печатного факсимильного издания. Это может иметь еще одно прямое применение. Методы построения оригинал макета и необходимое программное обеспечение являются задачами ближайшего будущего.

Данная работа частично поддерживается грантом РГНФ № 03-04-12042В.

Презентация доклада находится здесь.

Примечание. Тезисы докладов публикуются в авторской редакции



Ваши комментарии
Обратная связь
[ICT SBRAS]
[Головная страница]
[Конференции]

© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск