图像压缩原理-JPEG

whaosoft143 2023-12-29 原文

搬来一个基础啊给自己看~~ 非技术指正勿扰

图像的格式有很多种，比如PNG，JPEG等等，但当我们把一张图用工具变成各种其他格式时，其在计算机文件系统显示的文件大小各不一样，但是当你打开显示时，从视觉角度上看，几乎看不出差距。这其中涉及到的领域被称为图像压缩技术。常用的技术包括：颜色空间转换（RGB→YCrCb）和DCT 2D变换。

从事各行各业的大佬们，我相信，你们对图像格式是不陌生的，有很多种图像格式，比如，png，jpeg等等，但是你发现，同一张图片，当我们把他用工具变成各种其他格式时，其在计算机文件系统显示的文件大小各不一样，但是当你打开显示时，从视觉角度上看，几乎看不出差距。那为什么现实的文件大小不一样，但是带给我们的视觉感受确实几乎一样的呢，这里面就涉及到一个领域：数据压缩，具体到图像这块称之为图像压缩技术。今天，我就来给大家简单讲讲我们常用的JPEG压缩原理技术。

我们知道，常见的图像是由RGB格式组成，图像上的每个像素值分别由R(8bit)G(8bit)B(8bit)表示，如下图所示：

下面展示的是一张2592x1944(所谓的2K分辨率)图像，在没有经过任何压缩和利用JPEG技术后的文件大小：

压缩前大约15M，压缩后大约只有0.8M。

压缩技术一：颜色空间转换

研究人员通过大量实验证明，人类视觉系统对亮度的更敏感，而对颜色没那么敏感，如下图所示，A和B其实是一种颜色。

因此，我们可以将图像从RGB→YCrCb空间（Y：亮度，Cb：蓝色色度，Cr：红色色度），缩减Cr和Cb分量的采样数，而对于亮度Y，则保留0~255等级，这个技术就叫做色度下采样，更常见的称呼是色度抽样。

未对Cr和Cb进行下采样

对Cr和Cb进行下采样

我们来具体看看一个例子，下图是一副8x8的图，将其YCrCb单独分离出来：

YCrCb空间

然后我们分别对Cr和Cb进行下采样操作（2X2窗口滑动，取左上角元素）：

对Cr进行下采样，Cb也进行同样的操作

最终得到如下：

下采样的YCrCb空间

然后合并得到：

未进行下采样和进行下采样的图

上述过程进行对图像进行色彩下采样操作，再来看看对于2k的图，进行色彩下采样操作后的前后对比：

原图像（未经压缩）和被压缩后的图像

通过上述操作，我们可以看出，相对于原图，我们压缩了50%的存储空间：

图像数据在压缩了接近50%之后，对于人类视觉系统而言，也几乎没有什么差距，但是JPEG压缩技术可以做到接近95%的压缩，那还能从哪些地方进行数据压缩呢？

压缩技术二：DCT 2D变换

从信号处理角度看，数字图像其本身就是一种信号，那可不可以从这个角度剖析图像自身蕴含的信号，进一步抽取我们尽可能需要保留的信息，而去除一些无关紧要的其他信息呢？答案是肯定的。首先我们抽取图像的一行，

图像的一行所蕴含的信号图像

通过大量的视觉实验，我们知道，人类视觉对高频信息并不那么敏感：

人类视觉对高频信息并不敏感

可以利用信号处理领域的相关手段，分析出图像中高低频信息含量，并通过一定手段筛选出我们需要的信息。此时，一个重要的方法排上了用场，DCT(离散余弦变换)，在冈萨雷斯的《数字图像处理》书中，有详细的推理，这里简述一下精髓：一切信号都可以用若干不同频率的标准余弦信号通过特定的组合形式表示出来。考虑下面一个只有8个像素的单行图像：

cos(x)

从上面可以看出，对于y0~y7，这8个离散值从标准的cos(x)函数上采样获取。也就是说，对于y来说，其可以只用一个cos(x)就能完全表达，因此，通过DCT变换后，在幅频图上，对于cos(x)的那个系数X1=1，而其他X0, X2, ....., X7则为0（X0~X7分别代表从低频信号(比如cos(x))到高频信号(比如cos(7x))的系数），同理有，当y0~y7服从cos(2x)时，其经过DCT变换后，其X2=1，下图是将y值在0~255范围空间进行转换到-128~128空间。

cos(2x)

类似的有，对于y0~y7从cos(3x)进行下采样操作，对应的DCT变换后的的幅频图。

cos(3x)

因此，经过上述分析，就有：cos(kx) 与Xk一一对应的关系：

cos(kx)

枚举所有情况，如下所示：

因此，我们也可以得到：8个像素值的所有组合，均可以表示为该8个余弦函数的总和。这里我们分析一下，对于任意的8个像素值组合，其对应的下面的DCT变换如下，其Xk求解形式如下：

将其写成向量形式有：

更进一步有：

需要注意的是，DCT变化是可逆的，对应如下图所示：

我们将Inrerse DCT拆开写，更清楚的显示任意信号和对应的标准余弦信号组合关系：

接下来，我们从图像中，任意扣取一个8x8的区域进行分析，此时，一维的DCT变换也随之拓展到二维：

DCT 2D变换

由于DCT具有可逆性，也就是说，根据DCT 2D得到的变换矩阵，我们可以完整反推出对应的像素值，我们可以把64个系数从低频到高频依次加入，其图像的变换情况：

从上述变换可以看出，后面添加的一些高频信息，对图像的整体改变并没有变多少，这是发生一些非常细微上的表现，然而，我们人类视觉系统对这些改变并不敏感。

在 JPEG 算法中，图像被分为了 8*8 的像素组，每个像素组用自己的离散余弦变化进行频域编码。为什么选用 8*8 的像素组。采用比 8*8 更大的像素组，会大幅增加 DCT 的运算量，且编码质量也不会明显提升；采用比 8*8 更小的像素组会导致分组增多降低精度。所以8*8 的像素组是效率最优的结果。对每个像素组组，我们都用上述DCT进行变换。

下面演示不断添加频率个数，图像恢复情况：

当系数为0时，恢复出来一片白板；只用一个系数时，图像大体轮廓已出现；加入8个频率时，图像基本上恢复出原样；加入16个频率时，图像越来越清楚。随着后续高频不断加入，图像并没有多大改变，此时，我们就可以丢弃DCT的高频分量了。

具体怎么丢弃呢？研究人员通过大量的视觉实验，最终定义出一个量化表格（Quantization Table），如下所示：

Quantization Table

将DCT 2D变换得到表格(上面Encoding中左边)与量化表格进行逐元素触发，得到右边蓝色表格，可以发现，变成一个稀疏矩阵，同时，也注意到一个事情，如下图所示，DCT 2D得到的系数矩阵，其左上角最大，低频信息集中在左上角区域，而高频部分则集中在右下角部分(低频信息，对应的DCT系数矩阵其能量系数也大)。这个性质其实可以从DCT 2D的推理过程可以得到。在上述经过量化后的系数矩阵中，右下部分出现大量的0，也就意味着，该信号可以被舍弃。注意，舍弃高频信息的过程就是量化过程，这里会出现信息损失。

JPEG压缩技术规定了不同quality factor下的量化值，QF越大，量化表格里的数值就越小，其损失也就越小，同时，结合人眼对色彩的敏感要低于亮度，因此，对于Y和CrCb,定义了不同的量化系数。

为了进一步对数据进行压缩，我们对经过量化后的稀疏矩阵进一步分析，采用游程编码(ZigZag)和霍夫曼编码组合手段，进一步减少信息存储，如下图所示：

ZigZag游程编码+Huffman编码

最后，对压缩信息进行huffman编码处理，如下图所示：

ZigZag游程编码+Huffman编码

上述整个过程中，就是JPEG图像压缩原理，整个过程清晰明朗，一气呵成，希望能帮助到各位。 whaosoft aiot http://143ai.com

总结

JPEG图像压缩技术原理其核心技术包括以下两个方面：

RGB to YCrCb：利用人类视觉系统对色彩的不敏感特性，对Cr和Cb下采样；

DCT 2D变换：利用人类视觉系统对高频的不敏感特性，舍弃部分高频信息，采用游程编码和Huffman编码技术，进一步减少数据冗余。

有关图像压缩原理-JPEG的更多相关文章

ruby - 使用 RubyZip 生成 ZIP 文件时设置压缩级别 - 2
我有一个Ruby程序，它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重，我想提高压缩级别，因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗？是否有另一个允许指定压缩级别的Ruby库？最佳答案这是我通过查看rubyzip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d
ruby-on-rails - 添加回形针新样式不影响旧上传的图像 - 2
我有带有Logo图像的公司模型has_attached_file:logo我用他们的Logo创建了许多公司。现在，我需要添加新样式has_attached_file:logo,:styles=>{:small=>"30x15>",:medium=>"155x85>"}我是否应该重新上传所有旧数据以重新生成新样式？我不这么认为……或者有什么rake任务可以重新生成样式吗？最佳答案参见Thumbnail-Generation.如果rake任务不适合你，你应该能够在控制台中使用一个片段来调用重新处理!关于相关公司
ruby-on-rails - 在 Ruby (on Rails) 中使用 imgur API 获取图像 - 2
我正在尝试使用Ruby2.0.0和Rails4.0.0提供的API从imgur中提取图像。我已尝试按照Ruby2.0.0文档中列出的各种方式构建http请求，但均无济于事。代码如下:require'net/http'require'net/https'defimgurheaders={"Authorization"=>"Client-ID"+my_client_id}path="/3/gallery/image/#{img_id}.json"uri=URI("https://api.imgur.com"+path)request,data=Net::HTTP::Get.new(path
python ffmpeg 使用 pyav 转换一组图像到视频 - 2
2022/8/4更新支持加入水印水印必须包含透明图像，并且水印图像大小要等于原图像的大小pythonconvert_image_to_video.py-f30-mwatermark.pngim_dirout.mkv2022/6/21更新让命令行参数更加易用新的命令行使用方法pythonconvert_image_to_video.py-f30im_dirout.mkvFFMPEG命令行转换一组JPG图像到视频时，是将这组图像视为MJPG流。我需要转换一组PNG图像到视频，FFMPEG就不认了。pyav内置了ffmpeg库，不需要系统带有ffmpeg工具因此我使用ffmpeg的python包装p
ruby - Ruby 的压缩库？ - 2
是否有任何可用于Ruby的开源压缩/解压库？有没有人实现过LZW？或者，是否有任何使用压缩组件的开源库可以提取出来独立使用？编辑——感谢您的回答!我应该提到我必须压缩的是只驻留在数据库中的长字符串(我不会压缩文件)。此外，如果可以执行此操作的任何库都具有用于客户端压缩/分解的等效JavaScript实现，那将是理想的，因为这将用于Web应用程序。最佳答案您会在rubystdlib下找到所有已交付的ruby库的一个很好的列表.我会使用zlib库，它是开放的，无处不在，您会发现几乎所有语言的库!
ruby - 是否有将图像文件转换为 ASCII 艺术的命令行程序或库？ - 2
有这样的事吗？我想在Ruby程序中使用它。最佳答案试试这个http://csl.sublevel3.org/jp2a/此外，Imagemagick可能还有一些东西关于ruby-是否有将图像文件转换为ASCII艺术的命令行程序或库？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/6510445/
ruby-on-rails - 使用 Dragonfly 从 URL 分配图像 - 2
我正在使用Dragonfly在Rails3.1应用程序上处理图像。我正在努力通过url将图像分配给模型。我有一个很好的表格:{:multipart=>true}do|f|%>RemovePicture?Dragonfly的文档指出:Dragonfly提供了一个直接从url分配的访问器:@album.cover_image_url='http://some.url/file.jpg'但是当我在控制台中尝试时:=>#ruby-1.9.2-p290>picture.image_url="http://i.imgur.com/QQiMz.jpg"=>"http://i.imgur.com/QQ
Ruby-vips 图像处理库。有什么好的使用示例吗？ - 2
我对图像处理完全陌生。我对JPEG内部是什么以及它是如何工作一无所知。我想知道，是否可以在某处找到执行以下简单操作的ruby代码:打开jpeg文件。遍历每个像素并将其颜色设置为fx绿色。将结果写入另一个文件。我对如何使用ruby-vips库实现这一点特别感兴趣https://github.com/ender672/ruby-vips我的目标-学习如何使用ruby-vips执行基本的图像处理操作(Gamma校正、亮度、色调……)任何指向比“helloworld”更复杂的工作示例的链接——比如ruby-vips的github页面上的链接，我们将不胜感激!如果有ruby-
ruby-on-rails - 如何播种图像的路径？ - 2
Organization和Image具有一对一的关系。Image有一个名为filename的列，它存储文件的路径。我在Assets管道中包含这样一个文件:app/assets/other/image.jpg。播种时如何包含此文件的路径？我已经在我的种子文件中尝试过:@organization=...@organization.image.create!(filename:File.open('app/assets/other/image.jpg'))#Ialsotried:#@organization.image.create!(filename:'app/assets/other/i
ruby-on-rails - 安全地显示使用回形针 gem 上传的图像 - 2
默认情况下:回形针gem将所有附件存储在公共(public)目录中。出于安全原因，我不想将附件存储在公共(public)目录中，所以我将它们保存在应用程序根目录的uploads目录中:classPost我没有指定url选项，因为我不希望每个图像附件都有一个url。如果指定了url:那么拥有该url的任何人都可以访问该图像。这是不安全的。在user#show页面中:我想实际显示图像。如果我使用所有回形针默认设置，那么我可以这样做，因为图像将在公共(public)目录中并且图像将具有一个url:Someimage:看来，如果我将图像附件保存在公共(public)目录之外并且不指定url(同

图像压缩原理-JPEG

有关图像压缩原理-JPEG的更多相关文章

随机推荐