VII Международная конференция по электронным публикациям "EL-Pub2002"

23-27 сентября 2002 г., г. Новосибирск, Академгородок

Сайт SPECTRA – информационный ресурс по молекулярной спектроскопии1

Бабиков Ю.Л., Михайленко С.Н., Науменко О.В., Фазлиев А.З.
Институт оптики атмосферы СО РАН, Томск

Проблема совершенствования, создания, и верификации баз данных по поглощению наиболее значимых атмосферных и загрязняющих атмосферу газов является очень острой в настоящее время, что было отмечено, например, в докладах и дискуссиях проходивших на международной конференции ASA (Atmospheric Spectroscopy Applications) Workshop, в августе 2002 в Москве. Так, в докладе известного специалиста П. Варанази из Института Земной и планетарных атмосфер, США, указывалось, что, “Усовершенствования, осуществленные в базах данных в последние четыре десятилетия, хотя и значительные, представляют собой лишь каплю в океане атмосферной спектроскопии. Многое еще предстоит сделать для корректной оценки атмосферного пропускания коротковолнового и длинноволнового излучения. ... Место в базах данных, отведенное под параметры уширения и сдвига спектральных линий до сих пор пустует по большей части ...”

В 1997 году Партридж и Швенке осуществили высокоточный расчет центров и интенсивностей спектральных линий молекулы H2O, используя потенциальную функцию, смоделированную по ab initio точкам и оптимизированную подгонкой к экспериментальным центрам, и ab initio функцию дипольного момента. Впоследствии (2000 год) они уточнили функцию дипольного момента, используя более точное моделирование этих точек. Точность расчета центров линий составляла 0.1 см-1, интенсивности восстанавливались с точностью 5 - 50%.

Прорыв в точности теоретических расчетов центров и интенсивностей линий поглощения водяного пара - основного поглощающего компонента атмосферы - привел к созданию высокоточных и подробных баз по поглощению H2O в широком спектральном диапазоне и стимулировал многочисленные новые экспериментальные исследования спектров поглощения водяного пара.

Вместе с тем, новые базы данных по поглощению водяного пара, так же как и известные банки HITRAN и GEISA, имеют ряд существенных недостатков, которые могут привести к значительным погрешностям в оценках, например, ослабления солнечной радиации за счет поглощения в атмосфере Земли и т.п.

В частности, опубликованная в 2001 году новая база данных (ESA - WVR) по поглощению водяного пара в диапазоне 8500 -13000 см-1 [1] представляла собой, по сути, новые экспериментальные центры и интенсивности для наиболее сильных линий, соединенные с расчетом Партриджа и Швенке (1997) для средних и слабых линий. Согласно ESA-WVR интегральное поглощение водяного пара в диапазоне 8500 - 9500 см-1 на 38% процентов превосходит величину, полученную на основании данных HITRAN -2000. Новая база данных уже интенсивно используется в расчетах по атмосферной спектроскопии [2-4].

Однако, как показывают наши исследования, и как отмечено в докладах других авторов на ASA Workshop, точность новых экспериментальных интенсивностей в базе данных ESA -WVR представляется сильно завышенной. В частности, в докладе К. Смита с соавторами [4] говорится только о 10% превышении новых экспериментальных интенсивностей над данными HITRAN -2000. Расчетная часть базы данных ESA-WVR представляет собой старый (1997 г.) расчет Партриджа и Швенке тогда как имеется их новый, значительно более точный расчет 2000 - го года. К тому же в базе данных не исправлены недостатки заимствованного оригинального расчета, заключающиеся в неоднозначной колебательно-вращательной идентификации. Более того, оригинальная база данных Партриджа и Швенке ухудшена в определенной степени за счет исключения из нее линий поглощения изотопов H217O и H218O, которые уверенно наблюдаются в спектре водяного пара высокой оптической плотности.

Приведенный пример указывает на то, что вновь создаваемые базы данных должны проходить серьезную экспертизу, прежде чем быть рекомендованы к использованию в прикладных атмосферных задачах. Так, участники ASA Workshop пришли к соглашению, что необходимо создать своего экспертный совет для верификации новых баз данных, который мог бы публиковать свои рекомендации на соответствующем сайте в Интернете.

В настоящее время доступная в Интернет информация по молекулярной спектроскопии существует в нескольких формах, которые перечислены ниже в порядке возрастания степени сложности их организации и набора предоставляемых пользователю сервисов.

1. WWW – сайты, содержащие описания направлений деятельности, основных достижений, публикаций лабораторий, занимающихся данной тематикой. Такая информация есть практически у всех.

2. Архивы данных и программ, организованные в виде набора файлов, доступных в Интернет. Такие архивы существуют для банков данных HITRAN (http://www.hitran.com), JPL (http://spec.jpl.nasa.gov). Существует доступ по ftp к части данных расчета Патриджа-Швенке (наиболее полные и точные данные по основной компоненте атмосферы – водяному пару).

3. Интернет-ресурсы, содержащие средства для выполнения запроса на выбор интересующих пользователя подмножеств данных, извлечение их из архивов и баз данных и отображение на сайте. Такими возможностями обладают банк данных GEISA (http://www.ara.polytechnique.fr), каталог JPL (http://spec.jpl.nasa.gov), атомная и молекулярная база данных для астрономии (The Smithsonian Astrophysical Observatory Atomic & Molecular Database for Astronomy: http://cfa-цww.harvard.edu/amdata/ampdata/ kurucz23/sekur.html). Наиболее развитые по набору предоставляемых сервисов являются базы данных Национального института стандартов и технологии США (NIST): Wavenumber Calibration Tables From Heterodyne Frequency Measurements (Special Publication 821) Arthur G. Maki and Joseph S. Wells (http://physics.nist.gov/PhysRefData/ wavenum/html/contents.html) и Atomic Spectra Database (http://physics.nist.gov/cgi-bin/AtData/ main_asd). Они имеют средства графического отображения информации и базу библиографических ссылок с возможностью тематического поиска.

4. Информационные и информационно-вычислительные системы (ИС и ИВС), позволяющие помимо выборки информации из баз данных и архивов решать задачи, базирующиеся на этих данных, с использованием математических моделей и вычислительных алгоритмов.

Данные являются основой для практически неограниченного числа вариантов расчетов, использующих фундаментальные спектральные характеристики. Примерами таких систем могут служить системы «Спектроскопия атмосферных газов» (http://spectra.iao.ru) [5,6] и «Спектроскопия и молекулярные свойства озона» (http://ozone.iao.ru и http://ozone.univ-reims.fr) [6].

Рис.1. Интерфейс ИВС “Спектроскопия атмосферных газов”

Все существующие информационные системы, в том числе и наши, имеют ряд недостатков, часть из которых перечислена ниже.

Содержание спектроскопических БД HiTran и Geisa является неполным и неточным, в них нет явного разделения экспериментальных и расчетных материалов, которые могут сильно различаться по точности. В них не включены слабые линии поглощения, существуют значительные лакуны в спектрах поглощения H2S, SO2. Так, например, для молекулы H2S в базах данных содержится информация только для диапазона 0-3000 см-1, для молекулы SO2 спектр поглощения представлен только до 4000 см-1. Неудовлетворительна информация по спектрам поглощения водяного пара и его изотопопроизводных в ближней инфракрасной и ультрафиолетовой областях спектра: значительная часть экспериментальных линий поглощения приведена без квантовой идентификации, что существенно снижает ценность экспериментальных данных. Среди идентифицированных линий нередки ошибки отнесения. Более того, в существующих БД отсутствуют сдвиги центров спектральных линий давлением. Следует отметить слабую документированность данных (нет описаний методов расчета, данные не персонифицированы и слаба библиографическая поддержка) в HiTran’e и Geisa. Таким образом, фундаментальных спектральных данных по атмосферным молекул в Интернете много, но они плохо систематизированы. Практически отсутствуют доступные по Интернету вычислительные модели, работающие с такими данными. Наши работы по представления научной информации в Интернете соответствуют лучшим образцам, в том числе по использованию научной графики.

В докладе дано описание проекта по созданию информационного ресурса по молекулярной спектроскопии. Необходимость создания и поддержки в Интернете данного ресурса обусловлено следующими факторами.

Создание информационно-вычислительной системы по атмосферной спектроскопии, поддерживаемой спектроскопистами, позволит специалистам из смежных областей науки получить инструмент для решения рутинных задач на основе актуализируемой информации. Точная и полная информация о тонкой структуре спектров поглощения атмосферных газов (H2O, CO2, N2O, SO2, H2S и других) является принципиально важной для решения многих прикладных и фундаментальных задач атмосферной физики и оптики, например, при учете влияния вулканических выбросов на состояние озонового слоя и изменений климата. Существующие наиболее популярные среди специалистов базы данных по спектроскопической информации HiTran и GEISA являются неполными, недостаточно точными и слабо документированными. Предоставляемый этими базами данных сервис сводится к выбору интересующих пользователя подмножеств данных, извлечение их из архивов и баз данных и отображение их в табличном виде. С точки зрения систематизации предметной информации и организации в Интернете поиска с релевантным ответом чрезвычайно важным является переход от процедурного к декларативному описанию знаний. Выбор нами онтологического подхода для описания спектроскопической информации представляется своевременным и перспективным. Существующие тенденции развития программного инструментария, позволяющего более явно выделить семантику объектов в предметной области, также способствует этому выбору.

Прототипом разрабатываемой ИВС является система «Атмосферная спектроскопия» (http://spectra.iao.ru) [5], реализующая следующие функции:
· обзор и сравнение содержимого банков параметров спектральных линий Hitran [6], Geisa [7], а также оригинальных данных в разрезе молекула/изотоп/спектральная полоса;
· получение при заданных условиях различных характеристик (частотной диаграммы интенсивностей, частотного профиля коэффициента поглощения и спектров пропускания и поглощения) для выбранных молекул и изотопов, заданной газовой смеси, набора спектральных полос или диапазона частот;
· конволюция спектра поглощения высокого разрешения в спектр низкого с заданной аппаратной функцией.

Система позволяет осуществлять запуск в пакетном режиме задач на сервере с сохранением результатов (в рамках выделенной пользователю квоты дискового пространства), проводить мониторинг выполнения задач и отправлять пользователю результаты по электронной почте или загружать их через Web-интерфейс.

Развитие системы предполагается осуществить в следующих направлениях:

1. Включение в БД новых данных
1.1. Оригинальные данные по углекислому газу (в том числе высокотемпературные) и закиси азота, полученные с использованием эффективного гамильтониана, позволяющего рассчитывать весь колебательно-вращательный спектр.
1.2. Оригинальные данные по спектрам молекул водяного пара, двуокиси серы и сероводорода, включая центры, интенсивности, полуширины и сдвиги колебательно-вращательных линий поглощения.
1.3. Данные, полученные на основе ab initio расчетов (квантово-химических методов) (Partridge-Schwenke, H2O [8, 9]).
1.4. Экспериментальные спектры, зарегистрированные зарубежными партнерами и в ИОА СО РАН.
1.5. Данные о сечения поглощения для фотохимических реакций в ИК -, видимом и УФ - диапазонах.

2. Расширение класса решаемых спектроскопических задач
2.1. Сравнение спектров, полученных пользователем, как теоретических, так и экспериментальных, с информацией из БД системы.
2.2. Решение прямых спектроскопических задач [10].

2.3. Включение в систему элементов первичной обработки экспериментальных спектров для решения рутинных задач восстановления параметров линий.
2.4. Вычисление коэффициентов фотохимических реакций.

3. Совершенствование технологии построения системы
3.1. Разработка всех программных модулей ИВС в рамках объектно-ориентированного подхода.
3.2. Формализация описания структуры системы (меню и реестр приложений).
3.3. Развитие средств построения научной графики на стороне клиента.

4. Разработка компонентов, описывающих предметную область на понятийном уровне.

4.1. Построение онтологической системы по молекулярной спектроскопии по методологии METHONTOLOGY [11].

4.2. Терминологический словарь, обзор теории, электронный учебник.

Отметим только некоторые черты, присущие создаваемой системе.

Информационно-вычислительная система построена средствами Интернет-технологий и основана на экспериментальных и расчетных данных по спектрам атмосферных молекул и скорости фотохимических реакций. Объем числовых данных ИВС составляет ~20Гб. Данные аккумулируются в БД (СУБД MySQL) и работа с ними осуществляется с клиентского места через Интернет. Пользовательский и административный интерфейсы реализуются на основе объектно-ориентированного подхода средствами PHP4 и Java 2.

Архитектура системы позволяет расширять ее функциональные возможности путем добавления модулей, оформленных по заданным правилам. На серверной стороне используется веб-сервер Apache. Платформа – Linux.

Данные. Проектируемая база данных для молекул водяного пара, двуокиси серы и сероводорода содержит около 400000 колебательно-вращательных линий (для сравнения отметим, что в базе данных HITRAN содержится только 95000 линий для исследуемых молекул). Источниками информации служат, прежде всего, оригинальные экспериментальные и теоретические результаты, полученные участниками проекта. Впервые во всем объеме будут представлены результаты массовых расчетов полуширин и сдвигов высоковозбужденных колебательно-вращательных линий.

Модели. Расширяется класс задач решаемых в ИВС. Создается возможность сравнения пользователем собственных спектров с верифицированными спектрами системы, а для экспериментальных спектров возможность определения центров и интенсивностей линий и их первичной идентификация. Отдельного внимания заслуживает оригинальный алгоритм решения прямой спектроскопической задачи (расчет колебательно-вращательных уровней, частот и интенсивностей переходов).
Проводятся вычисления коэффициентов скорости фотохимических реакций для различных атмосферных условий в зависимости от высоты, температуры, спектрального диапазона и типа источника излучения.

Технологии. Более строгая формализация структуры системы и использование объектно-ориентированного подхода при разработке программного обеспечения обусловлено стремлением получить более ясное и обозримое представление программного кода, что становится все более актуальным по мере роста его объема. С другой стороны, те же самые приемы ведут к более строгому представлению семантики предметной области. Использование средств XML платформы [12] (DTD и их развитие для спецификации общих ресурсов RDF) является еще одним способом уточнения семантики предметной области (в настоящее время используется динамическая генерация HTML-документов).

Онтологии. Процедурное понимание работы со спектрами, связанное с использованием алгоритмов, позволяет нам сформировать “вычислительную” модель молекулярной спектроскопии. Такая модель является элементом онтологической системы, построение которой - одна из целей проекта.
Создание онтологической системы по молекулярной спектроскопии предполагает:

1. Спецификацию, концептуализацию и формализацию онтологий.
2. Создание глоссария терминов, деревьев классификации концептов и диаграмм бинарных отношений.
3. Оценку и интеграцию онтологий.
4. Документирование.

Литература

1
Schermaul et al., JMS, 2001
2
Albert P.G., Smith K.M., Bennartz R., Newnham D.A. Sattelite and ground observation of atmospheric water vapour absorption in the 889 to 985 nm region, Abstracts of Int. ASA Workshop, Tomsk, 2002, p. 22.
3
Fomin B.A., Udalova T.A., Zhitnitskii E.E. Spectral database evolution during the last decade and line-by-line calculations, Abstracts of Int. ASA Workshop, Tomsk, 2002, p. 19-20.
4
Smith K.M., Newnham D.A., Ptashnik I.V., Shine K.P. High spectral resolution field and laboratory measurements of water vapor absorption ion the 1 and 2 μm region, Abstracts of Int. ASA Workshop, Tomsk, 2002, p. 19-20.
5
Gordov E.P., Babikov Yu.L., Belan B.D., et al. Information-computational system: integrated model of atmospheric optics // Proc. of SPIE. 1999. Vol. 3983. P. 553-561.
6
Rothman L.S., Rinsland C.P., Goldman A., et al. The HITRAN molecular spectroscopic database and HAWKS (HITRAN Atmospheric WorKStation) // JQSRT. 1998. 60(5). P. 665-710.
7
Jacquinet-Husson, N., …, Mikhailenko, S.N., Naumenko O.V., et al. The 1997 spectroscopic GEISA databank, JQSRT, 62, 205-254, 1999.
8
D.W. Schwenke and H. Partridge. Convergence testing of the analytic representation of an ab initio dipol moment function for water: Improved fitting yields improved intensities, J.Chem.Phys., 113, No.16, 6592-6597, 2000.
9
H. Partridge and D.W. Schwenke. The determination of an accurate isotope dependent potential energy surface for water from extensive ab initio calculations, J.Chem.Phys., 106, p.4618, 1997.
10
S.A.Tashkun, Vl.G.Tyuterev. GIP: a Program for Experimental Data Reduction in Molecular Spectroscopy, in "High-Resolution Molecular Spectroscopy", SPIE Proceeding Series, Vol. 2205, pp.188-191, 1994.
11
Blazquez M., etc. Building onthologies at the knowledge level using the onthology design environment. Knowledge Acquisition Workshop, KAW98, Banff. 1998.
12
Когаловский М.Р. Стандарты платформы XML и базы данных. Электронные библиотеки и электронные коллекции. Сборник трудов 3 Всероссийской конференции RCDL’2001, Петрозаводск, с.108-117, 2001.

Примечание

1
Авторы выражают благодарность РФФИ за финансовую поддержку проекта (грант 02-07-90139).



|Электронная библиотека| |Математические публикации| |Информационные ресурсы|
Ваши комментарии
Обратная связь
[SBRAS]
[Головная страница]
[Конференции]
[СО РАН]

© 2002, Сибирское отделение Российской академии наук, Новосибирск
© 2002, Объединенный институт информатики СО РАН, Новосибирск