Информационная система "Конференции"



VI Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям (с участием иностранных ученых)

29-31 октября 2005 года, г. Кемерово, Россия

Тезисы докладов


вычислительная математика

Устранение эффекта блочности декодированных изображений

Ваганова Н.А.

Институт вычислительной математики и математической геофизики СО РАН (Новосибирск)

Большинство стандартов сжатия видео и неподвижных изображений, включающих JPEG (ISO,1990), MPEG (ISO, 1993), и H.264 (MPEG-4,ITU-T, 1999), используют блочное дискретное косинус-преобразование (BDCT). Преимущества этих стандартов заключаются в хорошей степени сжатия, низкой трудоемкости, и легкой реализации в микрочип. Однако, из-за грубого квантования высокочастотных DCT коэффициентов во время процесса кодирования, декодирование видео с низким битрэйтом приводит к артефактам блочности и возникновению периодических помех. Артефакты блочности появляются из-за того, что каждая площадка изображения кодируется независимо и они проявляются в виде ложных вертикальных и горизонтальных границ декодируемых площадок. Появление повторяющихся шумов связано с потерей высокочастотных деталей и на неподвижных изображениях этот артефакт проявляется как поразитные колебания в окрестности основных краев [1]. На видео этот артефакт получил название mosquito noise, поскольку он проявляется в виде движущейся ряби и перемещается вокруг контуров [2]. Данный эффект является доминирующим артефактом и для вейвлет-технологий сжатия, например JPEG 2000 (ISO, 1999), JPEG 2000 Motion. При реализации алгоритмов основанных на дискретном косинус-преобразовании также этот артефакт сосредоточен внутри 8х8 площадок.

На сегодняшний день существует много алгоритмов для устранения блочности и подавления периодических помех. Эти алгоритмы легко можно разделить на две категории. Одна из которых использует необычную схему кодирования [3, 4, 5, 6], то есть постобработка вставлена внутрь кодека, другая категория не учитывает структуру кодека и применяется как самостоятельная постобработка декодированных изображений. Поскольку применение постобработки не требует вмешательства в существующие стандарты кодеков, то реализация и разработка таких методов носит более практический характер. Zakhor [7] предложил применять проекцию на выпуклые множества (POCS). Его основная идея наити изображение, которое удовлетворяет некоторым известным свойствам исходного изображения при помощи итерационной фильтрации и проекции на заранее выделенные множества. Другие алгоритмы имеют статистически накопленные реализации и упрощения теоретических разработок. O'Rourke и Stevenson [8] предложили применять апостериорную вероятность получения желаемого на стадии декомпрессии изображения. Yang и др. [9] преобразовывали артефакты за счет внесения штрафов и использования функции стоимости. В этом случае задача постобработки состояла в минимизации этой функции. Основным недостатком этих методов является высокая трудоемкость предложенных алгоритмов. В настоящее время наиболее прикладными в области постобработки изображений и видео являются результаты, которые могут быть реализованы в режиме реального времени с низким битрэйтом обработки видео(например, беспроводная видеосвязь), желательно без применения итераций. Для сокращения трудоемкости Shen и Kuo [10]предложили использовать поисковую таблицу (LUT) в деблокинге и нелинейную фильтрацию для устранения периодических шумов. Применение этого деблокинг алгоритма с точки зрения вычислительной стоимости более целесообразно, но он сглаживает только несколько приграничных точек, что может привести к сохранению артефакта блочности в изображениях с высокой степенью компрессии или к размытию контуров. Трудоемкость алгоритмов устранения периодических шумов все еще остается высокой. Park и Lee [11] разработали двумерную адаптивную фильтрацию для устранения этого артефакта. Они классифицировали пиксели на граничные и внутренние, затем сглаживали неграничные и сохраняли разрыв нужный для визуализации контуров деталей. Характерная неприятность возникала в этом случае при неправильной классификации и тогда те артефакты, которые должны были бы быть сглаженными, оставались неизменными. Для изображений, которые сильно сжаты, несколько связных площадок имеют одинаковую серую компоненту и таким образом артефакт блочности здесь проявлеется в визуальной разрывности между двумя однородными регионами. В результате сглаживание нескольких приграничных пикселов в большинстве случаев не достаточно для сокращения визуальной блочности. Gao и др. [12] предложили адаптивный деблокинг алгоритм, который регулируется на деблокинг в зависимости от количества связных площадок в соответствии с однородностью этих площадок, величины скачка и параметра квантования DCT-коэффициентов. Поскольку деблокинг фильтры только оперируют в этих площадках в гладких местах, артефакты ложного оконтуривания все еще остаются после применения деблокинг алгоритмов.

В докладе будут предложены оригинальные методы устранения этих артефактов основанные на классификации. Мы выделим три типа площадок: площадки, которые содержат внутри себя контур объектов (то есть, "краевые площадки"), "гладкие площадки", которые имеют скачки при стыке с соседней по расположению площадкой и площадки, содержащие текстуры. В зависимости от типа будем применять сглаживающие фильтры, текстурированные площадки будем оставлять неизменными и особым образом обрабатывать пиксели в "краевых площадках".

Технические эксперименты показали, что предложенные алгоритмы уменьшают артефакты блочных методов компрессии изображении и вижео и имеют невысокую трудоемкость. Идеально они могут быть доступны для реализации на недорогих процессорах для выполнения постобработки в режиме реального времени. Например, изображениях с разрешением 352х288 обрабатываются предложенными алгоритмами за 3.17 ms, что демонстрирует постобработку в режиме реального времени (25-30 кадров в секунду).

Работа выполнена при финансовой поддержке: Фонда содействия отечественной науке, интеграционного проекта No~6~"Развитие теории приближения функций с помощью сплайнов, тригонометрических полиномов и фракталов с приложением к созданию моделей гидротурбин и сжатию телевизионных изображений.", выполняемом в СО РАН в содружестве с УрО РАН., проекта "Университеты России" No ур.03.01.195

ЛИТЕРАТУРА
1. S.H. Oguz, Y.H. Hu, and T.Q. Nguyen, Image coding ringing artifact reduction using morphological post-filtering, IEEE Workshop Multimedia Signal Process (1998), 628-633.
2. A. Jacquin, H. Okada, and P. Crouch, Content-adaptive postfiltering for very low bit rate video, Proc IEEE DCC Data Compress (1997), 111-120.
3. P. Farrelle and A. Jain, Recursive blocking-coding-A new approach to transform coding, IEEE Trans Commun (1986), 161-179.
4. W.E. Lynch, A.R. Reibman, and B. Liu, Edge compensated transform coding, Proc IEEE ICIP Image Process (1994), 105-109.
5. H.S. Malvar and D.H. Staelin, The LOT: Transform coding without blocking effects, IEEE Trans Acoust Speech Signal Process (1989), 553-559.
6. D.Pearson and M. Whybray, Transform coding of images using interleaved blocks, Proc IEE Radar Signal Process (1984), 466-472.
7. A. Zakhor, Iterative procedures for reduction of blocking effects in transform image coding, IEEE Trans Circ Syst Vid (1992), 91-95. 168 Vol. 13, 161-168 (2003).
8. T.P. O'Rourke and R.L. Stevenson, Improved image decompression for reduced transform coding artifacts, IEEE Trans Circ Syst Vid (1995), 490-499.
9. Y. Yang, N.P. Galatsanos, and A.K. Katsaggelos, Regularized reconstruction to reduce blocking artifacts of block discrete transform compressed images, IEEE Trans Circ Syst Vid (1993), 421-432.
10. M.Y. Shen and C.-C.J. Kuo, Real-time compression artifact reduction via robust nonlinear filtering, Proc IEEE ICIP Image Process (1999), 565-569.
11. H.W. Park and Y.L. Lee, A postprocessing method for reducing quantization effects in low bit-rate moving picture coding, IEEE Trans Circ Syst Vid (1999), 161-171.
12. W. Gao, C. Mermer, and Y. Kim, A de-blocking algorithm and a blockiness metric for highly compressed images, IEEE Trans Circ Syst Vid (2002), 1150-1159.

Примечание. Тезисы докладов публикуются в авторской редакции



Ваши комментарии
Обратная связь
[ICT SBRAS]
[Головная страница]
[Конференции]

© 1996-2005, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2005, Сибирское отделение Российской академии наук, Новосибирск