Бурное развитие глобальной сети Internet привело к тому, что ее информационное наполнение стало не только громадно по объему, но и очень разнообразно. Разнообразие информационных ресурсов Сети соответствует широкому спектру информационных потребностей пользователей Internet. Эта ситуация делает проблемы поиска информации в Internet особенно сложными и - одновременно - актуальными.
Для повышения эффективности поиска в Internet мы предлагаем использовать стиль текстового документа в качестве дополнительного параметра поиска. Постановка задачи, описание опытного массива документов, методики исследования и первых результатов содержится в наших более ранних работах.
Данная работа знакомит со следующими этапами исследования: оптимизацией набора параметров классификации и тестированием процедуры стилистической классификации. Кроме того, излагаются результаты применения процедур канонического дискриминантного анализа к опытному массиву и обсуждаются варианты практической реализацими метода.
Дополнительные материалы: | HTML |
Ваши комментарии А.М.Федотов |
[Головная страница] [Конференции] [СО РАН] |
© 2001, Сибирское отделение Российской академии наук, Новосибирск