Конференции ИВТ СО РАН



X Российская конференция с участием иностранных ученых "Распределенные информационно-вычислительные ресурсы”

Академгородок, г. Новосибирск, Россия, 6-8 октября 2005 г.

Тезисы докладов


Классификация статей интернет-версии научного журнала с использованием реферативных баз данных

Барахнин В.Б., Гуськов А.Е.

Институт вычислительных технологий СО РАН (Новосибирск)

Одним из важных преимуществ электронных публикаций журнальных статей перед печатные является возможность организации атрибутивного поиска. К числу основных поисковых атрибутов статей относятся коды того или иного классификатора предметной области, а также ключевые слова. Однако многие журналы не требуют от авторов, чтобы они приписывали своим статьям значения указанных атрибутов (особенно часто это бывает с кодами классификаторов). В результате при создании электронной версии журнала отсутствует тематическая классификация публикаций, а также поиск с использованием ключевых слов, что существенно обедняет поисковые возможности сайта журнала.

Трудность «апостериорной» классификации статей состоит в том, что классификационные признаки являются предметом интеллектуальной ответственности, вследствие чего проводить работу по классификации может только эксперт в данной предметной области.

Наиболее приемлемым вариантом решения этой проблемы является использование классификационных признаков, взятых из той или иной реферативной базы данных, содержащей информацию о статьях из журнала, сайт которого создается. Однако работа с печатными версиями реферативных журналов – задача весьма трудоемкая, удобнее пользоваться реферативными базами данных с доступом через Интернет (если, конечно, они существуют для публикаций из данной предметной области).

К числу таких баз, содержащих сведения о публикациях в области математики, относится база данных журнала Европейского математического общества «Zentralblatt MATH», содержащая более 2 миллионов рефератов статей, классифицированных с помощью популярного среди математиков Классификатора математических сущностей MSC 2000. Рефераты более 400 тысяч статьей по информатике содержатся в базе данных «Computer Science», поддерживаемой рядом германских университетов. Эта база данных использует свой особый классификатор CompuScience, структурно схожий с классификатором MSC 2000. Особо следует подчеркнуть бесплатный доступ к названным базам данных.

Сведения, содержащиеся в этих базах, были использованы для модификации сайта журнала «Вычислительные технологии», состоящей в наделении статей журнала кодами классификаторов MSC 2000 и CompuScience.

Регулярная структура как веб-страниц журнала «Вычислительные технологии», так и рефератов баз данных, позволяет создать программу, упрощающую рутинную работу в процессе запросов к базам данных. В результате были получены классификационные признаки более чем 600 статей журнала «Вычислительные технологии».

Примечание. Тезисы докладов публикуются в авторской редакции



Ваши комментарии
Обратная связь
[ICT SBRAS]
[Головная страница]
[Конференции]

© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск