Одним из важных преимуществ электронных публикаций журнальных статей перед печатные является возможность организации атрибутивного поиска. К числу основных поисковых атрибутов статей относятся коды того или иного классификатора предметной области, а также ключевые слова. Однако многие журналы не требуют от авторов, чтобы они приписывали своим статьям значения указанных атрибутов (особенно часто это бывает с кодами классификаторов). В результате при создании электронной версии журнала отсутствует тематическая классификация публикаций, а также поиск с использованием ключевых слов, что существенно обедняет поисковые возможности сайта журнала.
Трудность «апостериорной» классификации статей состоит в том, что классификационные признаки являются предметом интеллектуальной ответственности, вследствие чего проводить работу по классификации может только эксперт в данной предметной области.
Наиболее приемлемым вариантом решения этой проблемы является использование классификационных признаков, взятых из той или иной реферативной базы данных, содержащей информацию о статьях из журнала, сайт которого создается. Однако работа с печатными версиями реферативных журналов – задача весьма трудоемкая, удобнее пользоваться реферативными базами данных с доступом через Интернет (если, конечно, они существуют для публикаций из данной предметной области).
К числу таких баз, содержащих сведения о публикациях в области математики, относится база данных журнала Европейского математического общества «Zentralblatt MATH», содержащая более 2 миллионов рефератов статей, классифицированных с помощью популярного среди математиков Классификатора математических сущностей MSC 2000. Рефераты более 400 тысяч статьей по информатике содержатся в базе данных «Computer Science», поддерживаемой рядом германских университетов. Эта база данных использует свой особый классификатор CompuScience, структурно схожий с классификатором MSC 2000. Особо следует подчеркнуть бесплатный доступ к названным базам данных.
Сведения, содержащиеся в этих базах, были использованы для модификации сайта журнала «Вычислительные технологии», состоящей в наделении статей журнала кодами классификаторов MSC 2000 и CompuScience.
Регулярная структура как веб-страниц журнала «Вычислительные технологии», так и рефератов баз данных, позволяет создать программу, упрощающую рутинную работу в процессе запросов к базам данных. В результате были получены классификационные признаки более чем 600 статей журнала «Вычислительные технологии».
Примечание. Тезисы докладов публикуются в авторской редакции
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] |
© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск