Информационная система "Конференции"

Вычислительные и информационные технологии в науке, технике и образовании

Усть-Каменогорск, Казахстан, 11-14 сентября 2003 года

Тезисы докладов

Модификация префиксного кода с использованием особенностей сжимаемого текста

Шахов В.В., Крылова Л.Н.

Институт вычислительной математики и математической геофизики СО РАН (Новосибирск)

В связи с продолжающимся ростом спроса на услуги сетей передачи данных и расширением спектра предоставляемых ими услуг, а также успешно выполняемыми проектами по переводу в электронный вид огромного количества различных документов, следует ожидать, что объемы хранимой и передаваемой по системам связи информации будут продолжать увеличиваться. При этом данные занимают объем больший, чем это действительно требуется для их хранения и использования. Таким образом, задача хранения и передачи текстовой, графической, звуковой и другой информации в наиболее компактном виде достаточно актуальна.

В результате исследований и накопленного практического опыта для сжатия текста, в основном, используют смешанную стратегию: наиболее часто встречаемые слова хранятся в специальном словаре, а для кодирования остальных символов используется префиксное кодирование(как правило, по Хаффману). Указанный подход реализован, например, в системах Norton Guide, Tech Help, Microsoft Help и др. При этом предполагается наличие при раскодировании текста специального словаря у потребителя информации. В работе предложена модификация префиксного кода для сжатия текста с часто встречаемыми словами, если потребитель информации не располагает указанным словарем. Основная идея метода состоит в восприятии слова из словаря как нового (виртуального) символа, в соответствии с чем проводится пересчет параметров выбранного префиксного метода. Проведен анализ производительности предложенного подхода.

Примечание. Тезисы докладов публикуются в авторской редакции

Ваши комментарии
Обратная связь

[Головная страница]
[Конференции]