Бабиков Ю.Л.,
Михайленко С.Н.,
Науменко О.В.,
Фазлиев А.З.
Институт оптики атмосферы СО РАН, Томск
Проблема совершенствования, создания, и верификации баз данных по поглощению наиболее значимых атмосферных и загрязняющих атмосферу газов является очень острой в настоящее время, что было отмечено, например, в докладах и дискуссиях проходивших на международной конференции ASA (Atmospheric Spectroscopy Applications) Workshop, в августе 2002 в Москве. Так, в докладе известного специалиста П. Варанази из Института Земной и планетарных атмосфер, США, указывалось, что, “Усовершенствования, осуществленные в базах данных в последние четыре десятилетия, хотя и значительные, представляют собой лишь каплю в океане атмосферной спектроскопии. Многое еще предстоит сделать для корректной оценки атмосферного пропускания коротковолнового и длинноволнового излучения. ... Место в базах данных, отведенное под параметры уширения и сдвига спектральных линий до сих пор пустует по большей части ...”
В 1997 году Партридж и Швенке осуществили высокоточный расчет центров и интенсивностей спектральных линий молекулы H2O, используя потенциальную функцию, смоделированную по ab initio точкам и оптимизированную подгонкой к экспериментальным центрам, и ab initio функцию дипольного момента. Впоследствии (2000 год) они уточнили функцию дипольного момента, используя более точное моделирование этих точек. Точность расчета центров линий составляла 0.1 см-1, интенсивности восстанавливались с точностью 5 - 50%.
Прорыв в точности теоретических расчетов центров и интенсивностей линий поглощения водяного пара - основного поглощающего компонента атмосферы - привел к созданию высокоточных и подробных баз по поглощению H2O в широком спектральном диапазоне и стимулировал многочисленные новые экспериментальные исследования спектров поглощения водяного пара.Вместе с тем, новые базы данных по поглощению водяного пара, так же как и известные банки HITRAN и GEISA, имеют ряд существенных недостатков, которые могут привести к значительным погрешностям в оценках, например, ослабления солнечной радиации за счет поглощения в атмосфере Земли и т.п.
В частности, опубликованная в 2001 году новая база данных (ESA - WVR) по поглощению водяного пара в диапазоне 8500 -13000 см-1 [1] представляла собой, по сути, новые экспериментальные центры и интенсивности для наиболее сильных линий, соединенные с расчетом Партриджа и Швенке (1997) для средних и слабых линий. Согласно ESA-WVR интегральное поглощение водяного пара в диапазоне 8500 - 9500 см-1 на 38% процентов превосходит величину, полученную на основании данных HITRAN -2000. Новая база данных уже интенсивно используется в расчетах по атмосферной спектроскопии [2-4].
Однако, как показывают наши исследования, и как отмечено в докладах других авторов на ASA Workshop, точность новых экспериментальных интенсивностей в базе данных ESA -WVR представляется сильно завышенной. В частности, в докладе К. Смита с соавторами [4] говорится только о 10% превышении новых экспериментальных интенсивностей над данными HITRAN -2000. Расчетная часть базы данных ESA-WVR представляет собой старый (1997 г.) расчет Партриджа и Швенке тогда как имеется их новый, значительно более точный расчет 2000 - го года. К тому же в базе данных не исправлены недостатки заимствованного оригинального расчета, заключающиеся в неоднозначной колебательно-вращательной идентификации. Более того, оригинальная база данных Партриджа и Швенке ухудшена в определенной степени за счет исключения из нее линий поглощения изотопов H217O и H218O, которые уверенно наблюдаются в спектре водяного пара высокой оптической плотности.
Приведенный пример указывает на то, что вновь создаваемые базы данных должны проходить серьезную экспертизу, прежде чем быть рекомендованы к использованию в прикладных атмосферных задачах. Так, участники ASA Workshop пришли к соглашению, что необходимо создать своего экспертный совет для верификации новых баз данных, который мог бы публиковать свои рекомендации на соответствующем сайте в Интернете.
В настоящее время доступная в Интернет информация по молекулярной спектроскопии существует в нескольких формах, которые перечислены ниже в порядке возрастания степени сложности их организации и набора предоставляемых пользователю сервисов.
1. WWW – сайты, содержащие описания направлений деятельности, основных достижений, публикаций лабораторий, занимающихся данной тематикой. Такая информация есть практически у всех.
2. Архивы данных и программ, организованные в виде набора файлов, доступных в Интернет. Такие архивы существуют для банков данных HITRAN (http://www.hitran.com), JPL (http://spec.jpl.nasa.gov). Существует доступ по ftp к части данных расчета Патриджа-Швенке (наиболее полные и точные данные по основной компоненте атмосферы – водяному пару).
3. Интернет-ресурсы, содержащие средства для выполнения запроса на выбор интересующих пользователя подмножеств данных, извлечение их из архивов и баз данных и отображение на сайте. Такими возможностями обладают банк данных GEISA (http://www.ara.polytechnique.fr), каталог JPL (http://spec.jpl.nasa.gov), атомная и молекулярная база данных для астрономии (The Smithsonian Astrophysical Observatory Atomic & Molecular Database for Astronomy: http://cfa-цww.harvard.edu/amdata/ampdata/ kurucz23/sekur.html). Наиболее развитые по набору предоставляемых сервисов являются базы данных Национального института стандартов и технологии США (NIST): Wavenumber Calibration Tables From Heterodyne Frequency Measurements (Special Publication 821) Arthur G. Maki and Joseph S. Wells (http://physics.nist.gov/PhysRefData/ wavenum/html/contents.html) и Atomic Spectra Database (http://physics.nist.gov/cgi-bin/AtData/ main_asd). Они имеют средства графического отображения информации и базу библиографических ссылок с возможностью тематического поиска.
4. Информационные и информационно-вычислительные системы (ИС и ИВС), позволяющие помимо выборки информации из баз данных и архивов решать задачи, базирующиеся на этих данных, с использованием математических моделей и вычислительных алгоритмов.
Данные являются основой для практически неограниченного числа вариантов расчетов, использующих фундаментальные спектральные характеристики. Примерами таких систем могут служить системы «Спектроскопия атмосферных газов» (http://spectra.iao.ru) [5,6] и «Спектроскопия и молекулярные свойства озона» (http://ozone.iao.ru и http://ozone.univ-reims.fr) [6].
Рис.1. Интерфейс ИВС “Спектроскопия атмосферных газов”
Все существующие информационные системы, в том числе и наши, имеют ряд недостатков, часть из которых перечислена ниже.
Содержание спектроскопических БД HiTran и Geisa является неполным и неточным, в них нет явного разделения экспериментальных и расчетных материалов, которые могут сильно различаться по точности. В них не включены слабые линии поглощения, существуют значительные лакуны в спектрах поглощения H2S, SO2. Так, например, для молекулы H2S в базах данных содержится информация только для диапазона 0-3000 см-1, для молекулы SO2 спектр поглощения представлен только до 4000 см-1. Неудовлетворительна информация по спектрам поглощения водяного пара и его изотопопроизводных в ближней инфракрасной и ультрафиолетовой областях спектра: значительная часть экспериментальных линий поглощения приведена без квантовой идентификации, что существенно снижает ценность экспериментальных данных. Среди идентифицированных линий нередки ошибки отнесения. Более того, в существующих БД отсутствуют сдвиги центров спектральных линий давлением. Следует отметить слабую документированность данных (нет описаний методов расчета, данные не персонифицированы и слаба библиографическая поддержка) в HiTran’e и Geisa. Таким образом, фундаментальных спектральных данных по атмосферным молекул в Интернете много, но они плохо систематизированы. Практически отсутствуют доступные по Интернету вычислительные модели, работающие с такими данными. Наши работы по представления научной информации в Интернете соответствуют лучшим образцам, в том числе по использованию научной графики.
В докладе дано описание проекта по созданию информационного ресурса по молекулярной спектроскопии. Необходимость создания и поддержки в Интернете данного ресурса обусловлено следующими факторами.
Создание информационно-вычислительной системы по атмосферной спектроскопии, поддерживаемой спектроскопистами, позволит специалистам из смежных областей науки получить инструмент для решения рутинных задач на основе актуализируемой информации. Точная и полная информация о тонкой структуре спектров поглощения атмосферных газов (H2O, CO2, N2O, SO2, H2S и других) является принципиально важной для решения многих прикладных и фундаментальных задач атмосферной физики и оптики, например, при учете влияния вулканических выбросов на состояние озонового слоя и изменений климата. Существующие наиболее популярные среди специалистов базы данных по спектроскопической информации HiTran и GEISA являются неполными, недостаточно точными и слабо документированными. Предоставляемый этими базами данных сервис сводится к выбору интересующих пользователя подмножеств данных, извлечение их из архивов и баз данных и отображение их в табличном виде. С точки зрения систематизации предметной информации и организации в Интернете поиска с релевантным ответом чрезвычайно важным является переход от процедурного к декларативному описанию знаний. Выбор нами онтологического подхода для описания спектроскопической информации представляется своевременным и перспективным. Существующие тенденции развития программного инструментария, позволяющего более явно выделить семантику объектов в предметной области, также способствует этому выбору.
Прототипом разрабатываемой
ИВС является система «Атмосферная спектроскопия» (http://spectra.iao.ru) [5],
реализующая следующие функции:
· обзор и сравнение содержимого банков параметров спектральных линий
Hitran [6], Geisa [7], а также оригинальных данных в разрезе
молекула/изотоп/спектральная полоса;
· получение при заданных условиях различных характеристик (частотной диаграммы
интенсивностей, частотного профиля коэффициента поглощения и спектров
пропускания и поглощения) для выбранных молекул и изотопов, заданной газовой
смеси, набора спектральных полос или диапазона частот;
· конволюция спектра поглощения высокого разрешения в спектр низкого с заданной
аппаратной функцией.
Система позволяет
осуществлять запуск в пакетном режиме задач на сервере с сохранением
результатов (в рамках выделенной пользователю квоты дискового пространства),
проводить мониторинг выполнения задач и отправлять пользователю результаты по
электронной почте или загружать их через Web-интерфейс.
Развитие системы предполагается осуществить в следующих направлениях:
1. Включение в БД новых данных
1.1. Оригинальные данные по углекислому газу (в том числе высокотемпературные)
и закиси азота, полученные с использованием эффективного гамильтониана,
позволяющего рассчитывать весь колебательно-вращательный спектр.
1.2. Оригинальные данные по спектрам молекул водяного пара, двуокиси серы и
сероводорода, включая центры, интенсивности, полуширины и сдвиги
колебательно-вращательных линий поглощения.
1.3. Данные, полученные на основе ab initio расчетов
(квантово-химических методов) (Partridge-Schwenke, H2O [8, 9]).
1.4. Экспериментальные спектры, зарегистрированные зарубежными партнерами и в
ИОА СО РАН.
1.5. Данные о сечения поглощения для фотохимических реакций в ИК -, видимом и
УФ - диапазонах.
2. Расширение класса решаемых спектроскопических
задач
2.1. Сравнение спектров, полученных пользователем, как теоретических, так и
экспериментальных, с информацией из БД системы.
2.2. Решение прямых спектроскопических задач [10].
2.3. Включение в систему элементов первичной
обработки экспериментальных спектров для решения рутинных задач восстановления
параметров линий.
2.4. Вычисление коэффициентов фотохимических реакций.
3. Совершенствование технологии построения системы
3.1. Разработка всех программных модулей ИВС в рамках объектно-ориентированного подхода.
3.2. Формализация описания структуры системы (меню и реестр приложений).
3.3. Развитие средств построения научной графики на стороне клиента.
4. Разработка компонентов, описывающих предметную область на понятийном уровне.
4.1. Построение онтологической системы по молекулярной спектроскопии по методологии METHONTOLOGY [11].
4.2. Терминологический словарь, обзор теории, электронный учебник.
Отметим только некоторые черты, присущие создаваемой системе.
Информационно-вычислительная система построена средствами Интернет-технологий и основана на экспериментальных и расчетных данных по спектрам атмосферных молекул и скорости фотохимических реакций.
Объем числовых данных ИВС составляет ~20Гб. Данные аккумулируются в БД (СУБД MySQL) и работа с ними осуществляется с клиентского места через Интернет. Пользовательский и административный интерфейсы реализуются на основе объектно-ориентированного подхода средствами PHP4 и Java 2.
Архитектура системы позволяет расширять ее функциональные возможности путем добавления модулей, оформленных по заданным правилам. На серверной стороне используется веб-сервер Apache. Платформа – Linux.
Данные. Проектируемая база данных для молекул водяного пара, двуокиси серы и сероводорода содержит около 400000 колебательно-вращательных линий (для сравнения отметим, что в базе данных HITRAN содержится только 95000 линий для исследуемых молекул). Источниками информации служат, прежде всего, оригинальные экспериментальные и теоретические результаты, полученные участниками проекта. Впервые во всем объеме будут представлены результаты массовых расчетов полуширин и сдвигов высоковозбужденных колебательно-вращательных линий.
Модели. Расширяется класс задач
решаемых в ИВС. Создается возможность сравнения пользователем собственных
спектров с верифицированными спектрами системы, а для экспериментальных
спектров возможность определения центров и интенсивностей линий и их первичной
идентификация. Отдельного внимания заслуживает оригинальный алгоритм решения
прямой спектроскопической задачи (расчет колебательно-вращательных уровней,
частот и интенсивностей переходов).
Проводятся вычисления коэффициентов скорости фотохимических реакций для
различных атмосферных условий в зависимости от высоты, температуры,
спектрального диапазона и типа источника излучения.
Технологии. Более строгая формализация структуры системы и использование объектно-ориентированного подхода при разработке программного обеспечения обусловлено стремлением получить более ясное и обозримое представление программного кода, что становится все более актуальным по мере роста его объема. С другой стороны, те же самые приемы ведут к более строгому представлению семантики предметной области. Использование средств XML платформы [12] (DTD и их развитие для спецификации общих ресурсов RDF) является еще одним способом уточнения семантики предметной области (в настоящее время используется динамическая генерация HTML-документов).
Онтологии. Процедурное понимание
работы со спектрами, связанное с использованием алгоритмов, позволяет нам
сформировать “вычислительную” модель молекулярной спектроскопии. Такая модель
является элементом онтологической системы, построение которой - одна из целей
проекта.
Создание онтологической системы по молекулярной спектроскопии предполагает:
1.
Спецификацию, концептуализацию и формализацию онтологий.
2. Создание глоссария терминов, деревьев классификации концептов и диаграмм
бинарных отношений.
3. Оценку и интеграцию онтологий.
4. Документирование.
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] [СО РАН] |
© 2002, Сибирское отделение Российской академии наук, Новосибирск
© 2002, Объединенный институт информатики СО РАН, Новосибирск