传统图像压缩技术的核心目标是通过减少数据冗余,实现更高效的图像存储与传输。技术流程如下图所示,一般包括变换编码、量化和熵编码等步骤,最终生成压缩码以供存储或传输;解码时则通过逆向操作还原图像。

        在压缩过程中,变换编码是关键环节之一,其目的是将图像数据从空间域转换到频率域,以更高效地压缩信息。

 常见的变换方法包括离散余弦变换、离散小波变换和离散傅里叶变换。

        DCT 通过将图像数据分解为频率分量,有效去除人眼不敏感的高频信息,是JPEG 压缩的核心技术;DWT 则提供了多分辨率分析能力,在JPEG2000 中被广泛应用,可实现高压缩比与高图像质量的平衡;离散傅里叶变换(Discrete Fourier Transform,DFT)虽然在图像压缩中的直接应用较少,但其在频率分析中的价值仍不可忽视。
        量化是图像压缩中的关键步骤,主要通过将连续值转换为离散值来减少数据的位数,从而实现有效的压缩。

在实际实现中,常见的量化方法包括均匀量化和非均匀量化。

        均匀量化将整个值域均匀划分为若干段,而非均匀量化则根据人眼的视觉特性或信号特性,保留更多重要信息。

量化级别决定了将连续值映射到离散值的数量,通常,量化级别越高,图像质量越好,压缩比越低。

        常见的设置是将每个像素值量化到256 个级别,这样可以将图像的数据表示为一个离散的整数值范围,从而减少存储空间。量化后,可能出现误差,常用非线性重构方法来减少失真。此外,在深度学习中,知觉量化算法可以通过神经网络学习更复杂的量化函数,以最小化重构误差。在JPEG 图像压缩中,量化通常在DCT 变换后进行,并通过量化矩阵根据人眼对不同频率的敏感度调整系数,最终与哈夫曼编码结合实现进一步压缩。

优化量化策略可以大大提高图像压缩的效率和质量,尤其是在低比特率条件下保持较好的视觉效果。

        熵编码作为无损压缩的核心技术,通过分析数据流的统计特性为高频数据分配较短编码,从而进一步降低数据量。

常见的熵编码方法包括哈夫曼编码、算术编码和行程编码。

        哈夫曼编码通过构建最优前缀编码树实现简单高效的压缩;算术编码基于概率模型,能够提供更高效的压缩率,尤其在小数据集上表现突出;行程编码则擅长处理重复数据,在图像位图的压缩中应用广泛。

        在解码阶段,压缩数据依次通过熵解码、反量化和逆变换处理,最终还原为原始图像或近似图像。为了进一步提升压缩性能,传统技术常采用混合编码策略,将多种编码方式有机结合以充分发挥不同方法的优点。

在图像和视频压缩领域,混合编码通过结合有损和无损编码、空间和变换域处理、熵编码与算术编码等方式,充分利用不同编码策略的优势。

        例如,JPEG 标准结合了DCT 变换与哈夫曼编码,而JPEG2000 则融合了DWT 和算术编码。此外,高效便携图形格式(Better Portable Graphics , BPG )作为一种基于高效视频编码( High Efficiency Video Coding,HEVC)的图像压缩格式,其目标是在保证图像质量的同时,尽可能地减少数据量,主要在变换编码和熵编码步骤中引入预测和上下文编码技术,它在JPEG 和JPEG2000 相同文件大小下能够提供更高的图像质量,它支持透明度,并在低比特率场景下表现尤为出色,因此广泛应用于需要高效压缩且保证图像质量的应用场景中。

        传统图像压缩技术通过变换编码、量化和熵编码的有机结合,为图像的高效存储与传输提供了多样化的技术手段,并通过不断改进与标准化实现了图像质量与压缩率的优化平衡。传统图像压缩技术在图像存储与传输中占据了重要地位,其核心思想是通过减少数据冗余来实现高效压缩。

        这些方法经过长期的发展与优化,形成了多种经典的技术流派

其中以下四种方法具有代表性:

(1)基于DCT 的图像压缩技术,作为JPEG 压缩的核心,其在压缩比与视觉质量之间达成了良好的平衡;

(2)基于DWT的图像压缩技术,其在多分辨率分析和高效压缩方面表现出色;

(3)基于矢量量化的图像压缩技术,依托简单高效的块编码方法,降低了数据复杂度;

(4)分形图像压缩技术,通过建模图像的自相似特性,在高压缩比场景中展现了独特的应用优势。

1 DCT

        DCT 是图像压缩领域的一项关键技术,其本质是一种正交变换,它将图像从空间域转换到频率域,利用图像数据在频率域内的冗余性。

DCT 的优势在于其能量压缩特性,能够将图像的大部分能量集中在低频部分,同时减少由图像分块引起的块效应,即子图像间边界的可见性。

        DCT 凭借将图像转换到频率域并集中能量的特性,在各类图像压缩场景中发挥关键作用。通过量化和熵编码步骤,实现数据高效压缩,在JPEG 等图像压缩标准中取得巨大成功。其以较高的压缩率、保留信号主要能量的能力、相对简单的实现方式以及计算效率,广泛应用于多个领域。

DCT 及其变体存在局限性。在图像质量上,会因高频细节丢失和色彩信息偏差,出现“块状”伪影和色彩还原度问题,导致质量损失。计算复杂度方面,计算量大对硬件要求高,在实时处理和资源受限设备中应用受限。并且,其对非平稳图像区域和复杂结构图像的处理效果不佳,压缩效率受影响。

        尽管DCT 存在诸多挑战,但仍然是现代图像压缩技术的基石。为平衡压缩率和图像质量,需要对量化参数进行细致调优。随着技术的不断进步,预计DCT 及其变体将继续在图像和视频压缩领域中扮演关键角色,未来也需不断改进以克服现有不足。

        DCT 在压缩编码中的应用主要体现在其将图像转换到频率域,集中能量的特性上。通过量化和熵编码步骤,实现了数据的高效压缩。这一方法在JPEG等图像压缩标准中取得了巨大成功,确立了其作为一种经典且有效的压缩技术的地位。DCT 技术以其较高的压缩率、保留信号主要能量的能力、实现的相对简单性以及计算效率而受到青睐。

        然而,DCT 在压缩过程中也可能丢失部分细节信息,这将导致压缩后的图像质量有所下降。为了解决这一问题,需要对量化参数进行细致的调优,以平衡压缩率和图像质量。尽管存在这些挑战,DCT 仍然是现代图像压缩技术的基石,并持续在新的压缩算法和应用中发挥着重要作用。随着技术的不断进步,DCT 及其变体预计将继续在图像和视频压缩领域中扮演关键角色。

未完待续。。。。。。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐