В связи с продолжающимся ростом спроса на услуги сетей передачи данных и расширением спектра предоставляемых ими услуг, а также успешно выполняемыми проектами по переводу в электронный вид огромного количества различных документов, следует ожидать, что объемы хранимой и передаваемой по системам связи информации будут продолжать увеличиваться. При этом данные занимают объем больший, чем это действительно требуется для их хранения и использования. Таким образом, задача хранения и передачи текстовой, графической, звуковой и другой информации в наиболее компактном виде достаточно актуальна.
В результате исследований и накопленного практического опыта для сжатия текста, в основном, используют смешанную стратегию: наиболее часто встречаемые слова хранятся в специальном словаре, а для кодирования остальных символов используется префиксное кодирование(как правило, по Хаффману). Указанный подход реализован, например, в системах Norton Guide, Tech Help, Microsoft Help и др. При этом предполагается наличие при раскодировании текста специального словаря у потребителя информации. В работе предложена модификация префиксного кода для сжатия текста с часто встречаемыми словами, если потребитель информации не располагает указанным словарем. Основная идея метода состоит в восприятии слова из словаря как нового (виртуального) символа, в соответствии с чем проводится пересчет параметров выбранного префиксного метода. Проведен анализ производительности предложенного подхода.
Примечание. Тезисы докладов публикуются в авторской редакции
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] |
© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск