Особенности организации системы управления веб-контентом сайтов информационной поддержки инновационной деятельности

 

Ю.И.Шокин, А.М.Федотов, В.Б.Барахнин

Научно-технологический парк «Новосибирск»,

 Институт вычислительных технологий СО РАН

 

 

Введение      

 

Высокий научный потенциал Новосибирской области обуславливает наличие в ней большого числа субъектов инновационной деятельности (как юридических, так и физических лиц). Одним из важных условий достижения максимальной эффективности их работы является централизованная информационная поддержка в виде интернет-сайта, который должен отражать основные аспекты инновационной деятельности, включая общие сведения  о состоянии инновационной деятельности в Новосибирской области; информацию о субъектах инновационной деятельности (как на территории региона, так и за его пределами); законодательство в области инновационной деятельности; информацию о конкурсах, программах, грантах; электронные учебники по инновационному  маркетингу и менеджменту; статьи об инновационной деятельности и т.д.

            Характерной особенностью сайта является регулярное обновление информации, включая появление новых разделов. Достаточно простое и экономичное решение этой задачи достигается посредством распределенности информационной системы, реализуемой благодаря тому, что сами документы расположены на соответствующих серверах (как организаторов системы, так и сторонних организаций), а в системе хранятся лишь аннотированные ссылки на документы, снабженные определенными поисковыми атрибутами. Информация о ресурсах системы, их атрибутах и методах обработки поддерживается сервером метаданных, содержащим метаописания системы и меатаописания отдельных коллекций документов. Принципы использования указанной  технологии для создания сервера научного сообщества изложены в [1].

            Из существующих в настоящие время  новосибирских сайтов, посвященных инновационной тематике, в наибольшей степени сформулированным выше требованиям к  информационному наполнению удовлетворяет сайт Научно-технологического парка (технопарка) «Новосибирск» [2], являющегося головной организацией региона в области инноватики. Сайт технопарка достаточно адекватно отражает состояние инновационной деятельности в Новосибирской области и оперативно информирует о новостях и событиях, представляющих интерес для субъектов инновационной деятельности, однако в нем практически отсутствуют разделы, посвященные законодательной базе, электронным учебникам, публикациям в СМИ, а также поисковый интерфейс. Во многом это объясняется тем, что сайт технопарка пока не переведен на технологию использования метаданных. 

            Среди общероссийских сайтов следует отметить информационную систему «Инновации» [3], включающую в себя ленту новостей, разделы с предложениями инвестиционных и консалтинговых фирм, а также каталог инновационных ресурсов, основным наполнением которого служат ссылки на сайты субъектов инновационной деятельности. Ограниченность тематики каталога, а также отсутствие в  информационной системе каких-либо средств поиска не позволяют считать данную систему в полной мере отвечающей сформулированным выше требованиям.

 

 

1. Портальные технологии

 

В процессе работы над структурой сайта встают задачи, связанные, в частности, с тем, что количество разделов сервера, а также ресурсов в каждом разделе постоянно растет, вследствие чего администраторы, создающие новые разделы и размещающие новые ресурсы, могут не владеть языками сетевого программирования. Поэтому важно предложить администратору сайта систему, позволяющую задавать структуру новых разделов, причем эта структура должна быть унифицированной, так как значительная часть информации хранится на удаленных серверах и организовать контекстный поиск весьма сложно. Ввиду этого разные разделы системы должны иметь более или менее единообразную структуру, позволяющую пользователю легко ориентироваться в содержании того или иного раздела.

Необходимо также выработать классификацию ресурсов, дающую возможность администратору приписывать ресурс к определенному месту на сервере, используя  некий (вообще говоря, многомерный) набор классификационных признаков.

Наконец, важно выбрать такую структуру каталога ресурсов, которая обеспечила бы хранение информации о ресурсе в объеме, достаточном не только для  каталогизации ресурсов, поиска, вывода результатов поиска и пр., но и  для установления связей между ресурсами, отслеживания истории изменения ресурса и т.п.

Для решения поставленных задач нами использованы так называемые портальные технологии, то есть технологии построения порталов произвольной тематики.

Заметим, что в литературе нет четкого определения понятия "портал". Весьма разумным представляется подход, предложенный в  [4]: на основании генезиса термина "портал" и эволюции сущностей, обозначаемых этим термином, автор декларирует, что ""портал" это понятие не техническое и не технологическое, а маркетингово-коньюнктурное. Соответственно, точного определения у него быть не может", после чего рекомендует понимать под порталом "такой сайт, где интегрировано много всякой разной информации". 

Таким образом, порталы характеризуются большим количеством информации разнообразного содержания (веб-контента). Поэтому ключевым элементом портальных технологий являются системы управления веб-контентом. Структура этих систем, их основные функции, а также  наиболее популярные реализации систем управления веб-контентом (Allaire Spectra, Documentum 4i, Microsoft Site Server, TurboPress и др.) рассмотрены в [5]. Среди более современных разработок в этой области можно отметить предлагаемый фирмой IBM программный продукт WebSphere Portal [6], а также отечественный программный комплекс TryPortal [7].

            Однако существующие программные решения задачи построения порталов обычно не предполагают многомерное структурирование информации, требующееся при создании информационных систем, описывающих различные стороны инновационной деятельности, вследствие чего перед нами стоит задача разработка собственной системы управления веб-контентом, которая удовлетворяет сформулированным выше требованиям.

 

 

2. Особенности внутреннего представления информации

 

Информация, содержащаяся в системе, хранится в виде набора коллекций (т.е. каталогов). Наличие не одной, а нескольких коллекций объясняется тем, что информация, относящаяся к принципиально различным сущностям, описывается с помощью различных наборов семантических метаданных.

     Для сайта инновационной тематики мы можем выделить следующие основные типы коллекций:

-        документы;

-        авторские публикации;

-        визитные карточки организаций (и их подразделений);

-        визитные карточки персон.

В связи с тем, что унификация доступа к различным базам данных, содержащим  информацию об инновационно-технологических проектах и коммерческих предложениях в области инноватики, является отдельной, причем достаточно сложной, проблемой, в данной статье мы не затрагиваем вопросы хранения такого рода информации.

Каталог ресурсов системы строится с использованием метаданных и схем данных, основанных на открытых международных стандартах. Основные поля каталога (название ресурса, автор и т.п.) выбраны в соответствии со стандартом DublinCore, однако специфика рассматриваемой системы, содержащей ссылки на ресурсы, которые зачастую находятся на удаленных серверах и могут быть изменены без уведомления администратора системы, приводит к необходимости дополнения множества стандартных полей набором авторских полей. К их числу относятся:

        формат записи (возможные значения поля: графический файл; текстовый файл; список ссылок, включая частный случай – пустой список, т.е. список, явно не заданный, а создаваемый с помощью программного кода);

        удаленность сервера, на котором размещен ресурс (удаленный; локальный; отсутствие сервера, если ресурс – список);

        ссылка на оригинал ресурса, скопированного с удаленного сервера;

        дата копирования или дата модификации копии ресурса, скопированного с удаленного сервера;

        ссылка на предыдущую версию ресурса, имеющего несколько версий;

        общая часть сетевого адреса для различных форматов (например, html, zip, pdf) одного и того же ресурса.

Благодаря наличию подобных полей становится возможным, в частности, автоматически отслеживать изменения удаленных ресурсов, а также отображать историю развития ресурса, предоставлять пользователю информацию в требуемом формате и т.п.

 

 

3. Жанровые типы ресурсов

 

Основной способ структурирования ресурсов – жанровая классификациия.. Исходя из инновационной тематики сайта, можно выделить следующие жанровые типы:

       нормативно-правовые документы;

       прочие документы (здесь слово "документ" употреблено в узко-юридическом смысле);

       события;

       авторские публикации;

       визитные карточки организаций (или их подразделений);

       визитные карточки персон;

       прочие ресурсы (коллекции ссылок и т.п.).

Далее для некоторых жанровых типов вводятся жанровые подтипы. Для нормативно-правовых документов используется двумерная классификация:

1)      по уровню издавшего их органа (органы федеральной и региональной государственной власти и местного самоуправления);

2)      по виду ветви власти (законодательная и исполнительная; в документах исполнительной власти федерального уровня вводится подкласс «Указы и распоряжения Президента РФ, хотя формально Президент не относится ни к одной ветви власти).

Для прочих документов также используется классификация, аналогичная приведенной выше, с добавлением третьего параметра – вид документа (отчет, доклад, протокол, письмо, соглашение, заявление и т.п.).

Классификация авторских публикаций двумерная:

1)      жанр (публицистический, научный);

2)      вид (аннотация, тезисы, статья, учебник, монография)

Заметим, что в некоторых многомерных классификациях отдельные сочетания координат могут быть практически нереализуемы (например, для авторских публикаций – публицистический жанр и аннотация).

 

 

4. Тематическая структура сайта

 

Для удобства получения пользователем нужной информации используется тематическая классификация ресурсов, в разделы которой объединяются разнообразные материалы, относящиеся к той или иной сфере инновационной деятельности. Так, при создании информационной системы поддержки инновационной деятельности региона целесообразно ввести следующие разделы тематической классификации:

        государственная политика в области инновационной деятельности;

        разработка высоких  технологий;

        трансфер технологий;

        инновационный менеджмент;

        вопросы интеллектуальной собственности;

        подготовка кадров для инновационной деятельности;

        семинары и конференции;

        конкурсы, программы, гранты;

        межрегиональное сотрудничество;

        международное сотрудничество.

Множества ресурсов, относящихся к разным разделам, практически не пересекаются, что весьма облегчает работу администратора сайта по управлению веб-контентом. Определенное исключение представляют ресурсы разделов «Семинары и конференции» и «Конкурсы, программы, гранты», которые, как правило, могут быть отнесены еще к одному из разделов (в зависимости от тематики мероприятия и уровня его проведения). Однако выделения информации о семинарах, конференциях, конкурсах, программах, грантах в отдельные разделы целесообразно ввиду особой востребованости этой информации и необходимости ее оперативного доведения до субъектов инновационной деятельности.

           

           

5. Классификатор предметной области

 

При создании сайтов инновационной тематики нужно иметь в виду, что организационные вопросы инноватики достаточно тесно связаны непосредственно с предметной областью инновационной деятельности, например, некоторые нормативно-правовые акты могут регулировать отношения лишь в сфере определенных технологий. С другой стороны, большое количество субъектов инновационной деятельности порождает необходимость уточнения предметной области, в которой работает тот или иной субъект. В этом состоит одно из главных различий организацией управления веб-контентом инновационных сайтов и сайтов научного сообщества [8, 9], для которых достаточно четко разграничены вопросы собственно научной и научно-организационной деятельности или, по крайней мере, вполне ясно, к какой именно сфере предметной области (разделу науки) относится тот или иной ресурс научно-организационной тематики. Поэтому в описание ресурса может быть включена информация об отнесении его какому-либо разделу определенной предметной области в соответствии с классификатором Российской сети трансфера технологий [10], подразделяющим сферу инновационной деятельности на следующие предметные области:

        промышленные технологии;

        информационные технологии;

        экология, охрана окружающей среды;

        медицина;

        биотехнологии;

        новые материалы,

которые, в свою очередь, включают в себя разделы. Например, область «Информационные технологии» содержит разделы:

        электроника;

        микроэлектроника;

        обработка информации;

        информационные системы;

        телекоммуникации.

 

 

6. Некоторые особенности административного и пользовательского интерфейса системы

 

Административный интерфейс системы предусматривает 2 уровня прав доступа: разработчика и администратора.

При создании сайта инновационной тематики разработчик с помощью административного интерфейса задает разделы тематической классификации, соответствующие конкретным особенностям разрабатываемого сайта. Следующий уровень классификации – жанровые типы – заданы в системе заранее, что обеспечивает унификацию структуры разных разделов сайта. При желании разработчик сайта может ввести в подразделы, определяемые жанровыми типами, структуры более низкого уровня, исходя из тематического принципа. Например, в разделе «Разработка высоких  технологий» подраздел «Организации» делится на «Институты СО РАН», «Институты СО РАМН», «Институты СО РАСХН», «Отраслевые НИИ», «Высшие учебные заведения», «Малые наукоемкие фирмы». Наконец, жанровые подтипы заданы, как и жанровые типы, заранее.

Основной отличительной особенностью интерфейса администратора системы является возможность классифицировать ресурс, размещаемый на сайте, в соответствии с изложенной выше системой классификации. Названия разделов, подразделов и т.д. являются элементами словаря-классификатора, имеющего иерархическую структуру. Выбирая из этих словарей характеристики ресурса, администратор привязывает его к нужной точке сайта, имеющего весьма сложную структуру, а также к разделу классификатора предметной области, не пользуясь непосредственно языками сетевого программирования.

Пользовательский интерфейс системы устроен следующим образом. Для первичной классификации информации использована тематическая классификация ресурсов. Далее, в каждом из разделов тематической классификации присутствуют несколько (не обязательно все) подразделов, содержащих ресурсы определенного типа. В свою очередь, эти подразделы могут быть разбиты по тематическому принципу на структуры более низкого уровня. Наконец, разбиение по жанровым подтипам применяется либо непосредственно к подразделам жанрового типа, либо к разбиениям последних по тематическому признаку (при наличии таких разбиений).

Описанная структура сайта такова, что, в зависимости от раздела, в ней используется от 2 до 4 уровней классификации. Разделы, соответствующие двум верхним уровням, располагаются на отдельных веб-страницах. Что же касается разделов двух нижних уровней (если они присутствуют), то в случае  небольшого числа ресурсов создавать для этих разделов отдельные веб-страницы нецелесообразно; достаточно соответствующим образом структурировать страницу раздела верхнего уровня (конкретный выбор одной из этих возможностей определяется автоматически в зависимости от количества ресурсов, имеющихся в данный момент в том или ином разделе системы).

Если пользователь желает ознакомиться со спецификой инновационной деятельности в конкретной предметной области или ее разделе, то он может воспользоваться предоставляемыми интерфейсом возможностью выбрать для просмотра только ресурсы, относящиеся к этой области или разделу.

Еще раз отметим, что информацию об организациях и персонах целесообразно хранить и отображать не в виде ссылок на сайты организаций или персональные страницы, а в виде стандартных визитных карточек, включающих в себя некий минимальный набор сведений (имя или название, статус, контактная информация, в том числе персональная страница или сайт). Такой подход позволяет унифицировать отображение соответствующей информации и упростить ее поиск.

Для удобства ознакомления пользователей с обновлениями сайта в каждом разделе сайта особо выделяется подраздел «Новости», отображаемый, как правило, на главной странице раздела. Кроме того, на самом верхнем уровне также существует раздел «Новости», включающий в себя соответствующую информацию из разделов тематической классификации. Ресурсы, относящиеся к жанровому типу «событие» имеют свойство быть новостью как до момента события, так и в течение месяца после него. Ресурсы остальных жанровых типов являются новостью в течение месяца после их размещения на сайте.

 

 

Заключение

 

Предлагаемые в данной статье принципы структурирования каталога информационных ресурсов  носят достаточно универсальный характер и могут быть применены как для организации больших серверов  инновационной и научно-организационной тематики, например, сервера Сибирского отделения РАН, так и (после незначительной модификации) для построения информационных систем чисто научной направленности, подобных информационной системе «Web-ресурсы математического содержания» [9].

 

 

Список литературы

 

1.      Шокин Ю.И., Федотов А.М. Интеграция информационно-телекоммуникационных ресурсов Сибирского отделения РАН // Вычислительные технологии. 2003. Т.8. Специальный выпуск.  С.161–171.

2.      Информационный сайт Научно-технологического парка «Новосибирск». [http://tpark.ict.nsc.ru/]

3.      Информационная система «Инновации» [http://www.rsci.ru/company/innov/?Language=0]

4.      Акопянц А.Х. Что такое портал? [http://akop.ru/personal/4847/article_t]

5.      Системы управления Web-контентом.

      [http://www.e-commerce.ru/biz_tech/implementation/web_tech/wcsm.html]

6.      WebSphere Portal. [http://www.ibm.com/software/websphere/portal]

7.      TryPortal. [http://www.tryportal.ru/about/index.asp]

8.      Барахнин В.Б., Федотов А.М. Принципы структурирования сайтов информационной системы научного сообщества (на примере сайта Совета научной молодежи СО РАН) // Материалы конференции «Вычислительные и информационные технологии в науке, технике и образовании» Алма-Ата, Казахстан, 6–10 октября 2004 года. [http://www.ict.nsc.ru/ws/CTMM-2004/8387/rep8387.ps.gz]

9.      Барахнин В.Б., Гуськов А.Е., Караханов А.С., Котенков М.В., Рычкова Е.В., Столяров С.В. Концепция информационной системы «Web-ресурсы математического содержания» // Материалы конференции молодых ученых, посвященной М.А.Лаврентьеву. Новосибирск, 1-3 декабря, 2003. Часть I. C.26–31.

10.  Сайт Российской сети трансфера технологий. [http://www.rttn.ru/]