数字图像处理-图像基础-复习总结

风落_ 2023-07-09 原文

文章目录

数字图像处理复习总结

数字图像处理复习总结

数字图像基础

数字图像基础概念

图像是像素的二维排列
数字图像的储存方式以像素为单位
传感器阵列上每一个感光元对应数字图像中的一个像素
每一个像素值反映自然场景中相应成像点的亮度

数字图像用二维的亮度函数 f(x, y) 表示
- x 和 y 表示空间坐标
- f (x, y) 是关于坐标（x, y）的函数值，与成像于该点的光强成正比

数字化的空间位置称为像素（Pixel），数字化的亮度值称为灰度值

二维矩阵的大小M，N，M*N为空间分辨率

成像多样化

将电磁波的各个波段按照波长或频率的递增或递减顺序依次排列形成电磁波谱。
电子成像可以通过几乎任何一种电磁波辐射转换成电信号形成数字图像

成像方式分类：

反射成像是由物体表面反射的电磁波到达成像传感器而成像；
发光成像是物体本身辐射的电磁波到达成像传感器而成像
吸收成像是由于一部分透过物体的电磁波到达成像传感器而成像

尺度多样性

从图像反映的实体尺寸看，可以小到电子显微镜图像，大到航空、航天遥感图像，甚至天文望远镜图像

根据图像的数据量，将图像主要分为4类：

二值图像
- 每一个像素仅占用1位，灰度值为0或1，其中，0表示黑色，1表示白色，俗称黑白图像
灰度图像
- 黑与白之间有多级灰色深度
- 灰度图像中每个像素的灰度级通常采用8位表示，有2^8=256个灰度级，每个灰度像素占一个字节
索引图像
- 包含颜色查找表，通过查找映射方法表示彩色图像的颜色
真彩色图像
- 每一个彩色像素用一个3维向量来表示，由R、G、B颜色分量组成。
- R、G、B颜色分量各占用8 位表示相应颜色分量的亮度，每一个颜色分量各有256个灰度级，这3个字节组合可以产生 2^24=1677 万种不同的颜色。

采样和量化

自然界中场景的空间位置和辐射度都是连续量，有必要对连续数据进行空间和幅值的数字化处理，将模拟数据转换为计算机可接受的数字形式。
每一个采样单元对应一个像素。每一个采样单元在传感器阵列中行和列的两个整数坐标决定了图像中相应像素的空间坐标。
8位灰色深度的量化是将感光元捕获的连续亮度等间隔划分为256级明暗程度的灰阶，在像素所在空间坐标处的整数亮度确定了该像素的灰度值。

图像数字化的过程包括两个步骤

采样：空间坐标（x, y）的离散化
量化：亮度值 f(x, y) 的离散化

数字图像（DIDITAL IMAGE）

空间坐标和亮度上都离散化的图像。

采样

图像在空间上的离散化，空间上连续的图像转换成离散点（像素，PIXEL）
正方形点阵结构对水平方向和垂直方向的空间位置进行光栅化；

假定一幅图像取M×N个采样点

M、N一般为2的整数次幂；
M、N可以相等，也可以不等；
对于M、N数值大小的确定：M*N满足采样定理，重建图像就不会产生失真。

正六边形采样网格更符合人眼的视觉特性。
视网膜上分布的视神经细胞的排列方式为正六边形结构，且这些细胞在水平方向和垂直方向上相比在对角方向上对高频信号有更高的光敏感度。

采样决定空间分辨率，反映图像数字化的像素密度，以及图像的有效像素。

空间分辨率越低，可辨细节越差。

图像插值放大仅能增加图像的像素数，不能提高图像的空间分辨率。

量化

量化是图像函数值（灰度值）的离散化（取值的数字化，模拟信号->数字信号）
常见的像素的灰度级数 2^8=256，灰度级越大，要接近白色，灰度级为0时，为黑色

若将样本量化为Q级，Q如何取值：

Q总是取2的整数次幂，Q=2^k
灰度级位数越大，量化误差越小。

量化决定灰度级分辨率，指可分辨的最小灰阶变化。

非均匀采样与量化

非均匀采样

在变化大细节多的区域——较精（密）采样
平坦变化缓慢区域——较粗（稀）采样

非均匀量化

在边界附近（灰度剧烈变化区）——量化级少
灰度级变化比较平滑的区域——量化级多，避免或减少由于量化的太粗糙，在灰度级变化比较平滑的区域出现假轮廓的现象

一幅好的数字图像，需要多少采样分辨率和灰度级？
实验方法

选取一组细节多少不同、不同N、M、Q的图像让观察者根据主观质量感觉给这些图像排序

实验结论

随着采样分辨率和灰度级的提高，主观质量也提高
具有大量细节的图像，其质量对灰度级的需求相应降低

细节相对丰富的图像

空间分辨率（采样）对图像质量影响大，灰度级分辨率（量化）对图像质量影响小。

灰度相对平坦的图像

灰度级分辨率对图像质量影响大，而空间分辨率对图像质量影响小。

数字图像常见失真类型

混叠效应
当采样间隔过大时，由于采样频率小于奈奎斯特频率，而引起频谱的高频成分发生相互交叠，频谱重叠导致失真。

模糊效应

长时间曝光过程中成像设备与成像场景的相对运动而造成运动模糊；
光学镜头散焦、大气湍流、短时间曝光而造成散焦模糊。

块效应

在相邻块之间引入的非连续性，视觉上看似马赛克的效果
块效应产生的原因
- 对图像分块处理而引起的块状失真
- 在图像压缩编码中，分块离散余弦变换编码和分块运动补偿是造成块效应的两个主要原因

噪声

感光器件接收光信号并输出的过程中产生的异常像素。
根据噪声的分布和统计特征，成像系统的噪声源可以分为光电散粒噪声、读出噪声和脉冲噪声等。

数字图像处理基础

数字图像处理基本概念

根据语义从低级到高级，广义图像处理分为三个层次：图像处理、图像分析和图像理解。

数字图像处理分为广义图像处理和狭义图像处理，实际应用中的图像处理概念通常指的是广义图像处理。

数字图像处理研究内容

图像处理（狭义图像处理）

图像的低级处理阶段
强调改善图像的质量
- 人眼观看图像时注重图像的视觉效果；
- 机器观看图像（机器视觉）时注重物体的可辨识性。

图像分析

图像的中级处理阶段
处理对象：目标区域
主要任务：对图像中目标区域进行检测、表示和描述。将以像素表示的图像变成用符号、数据对目标区域的描述。

图像理解

在图像分析的基础上更高一级的处理阶段
研究图像中目标分类、姿态识别、行为分析以及目标相互之间的联系，从而得出对图像语义的解释。

数字图像处理关键阶段

图像获取->图像增强->图像恢复->形态学处理->图像分割->表示与描述->目标识别->图像压缩->彩色图像处理

数字图像处理应用

图像增强、哈勃图像复原、遥感图像处理、环境与资源监测、医学图像处理、网络通信、工业检测、军事公安、人机接口、文化艺术、影视创作等

图像质量评测

由人来评价的主观评测方法
由算法评价的客观评测方法

主观评测

在一定测试条件下由多个观察者对待测图像的质量进行评分，对大量的评分数据进行统计处理
主观方法需多次重复实验，耗时费力，易受观察者个人因素的影响。

客观评测

用数学公式计算给出指标数值，使算法评价自动、公开。
传统的客观方法主要有**峰值信噪比(PSNR)和均方误差(MSE)**等。
- 优点：计算简单、物理意义明确、数学上便于优化
- 缺点：没有考虑到像素间的相关性和人类视觉系统的感知特性，在很多情况下不符合人的主观感受。
- Structural Similarity (SSIM)：luminance, contrast and structure

像素的空间关系

领域

4领域

对角领域

8领域

邻接性

像素 p 和 q 邻接的两个必要条件：
- 两个像素的位置在某种情况下是否相邻
- 两个像素的值是否满足某种相似性
4邻接
- 两个像素 p 和 q 的灰度值在集合V中，且 q 在 p 的4邻域内，则它们为4邻接；
8邻接
- 两个像素 p 和 q 的灰度值在集合V中，且 q 在 p 的8邻域内，则它们为8邻接。

连通性

若从像素 q 到像素 p 之间存在一条一序列像素组成的折线，且该折线上的像素灰度值均满足上述特定相似性准则，则称这一序列像素组成了一条从像素 q 到像素 p 的通路。
设 q 和 p 是某一图像子集 S 中的两个像素，若存在一条完全由 S 中的像素组成的从 q 到 p 的通路，则称像素 q 和 p 是连通的。

根据邻接性定义不同，可定义不同的连通性

在4邻接下定义的通路称为4连通
在8邻接下定义的通路称为8连通

对于 S 中任意像素 p，S 中与该像素相连通的全部像素组成的集合称为 S 的连通分量。
若 S 中仅有一个连通分量，则称集合 S 为连通集。

区域和边界

设 p 为某一图像子集 S 中的一个像素，若像素 p 的某一邻域包含于 S 中则称像素 p 为 S 的内点，若 S 中的像素都是内点，则 S 称为开集，连通的开集称为开区域，简称为区域。
若像素 p 的任意邻域内有属于 S 的像素也有不属于 S 的像素，则像素 p 称为 S 的边界像素。S 的边界像素的全体称为 S 的边界。

图像中每一个连通集构成一个区域，图像可认为是由多个区域组成。区域的边界也称为区域的轮廓，它将区域与其他区域分开。

区域的内部和边界必须采用不同的连通性来定义，否则会出现歧义性。

距离度量

复习图像 xff strong li 计算机视觉图像处理人工智能

有关数字图像处理-图像基础-复习总结的更多相关文章

ruby - 如何指定 Rack 处理程序 - 2
Rackup通过Rack的默认处理程序成功运行任何Rack应用程序。例如:classRackAppdefcall(environment)['200',{'Content-Type'=>'text/html'},["Helloworld"]]endendrunRackApp.new但是当最后一行更改为使用Rack的内置CGI处理程序时，rackup给出“NoMethodErrorat/undefinedmethod`call'fornil:NilClass”:Rack::Handler::CGI.runRackApp.newRack的其他内置处理程序也提出了同样的反对意见。例如Rack
ruby - 查找字符串中的内容类型(数字、日期、时间、字符串等) - 2
我正在尝试解析一个CSV文件并使用SQL命令自动为其创建一个表。CSV中的第一行给出了列标题。但我需要推断每个列的类型。Ruby中是否有任何函数可以找到每个字段中内容的类型。例如，CSV行:"12012","Test","1233.22","12:21:22","10/10/2009"应该产生像这样的类型['integer','string','float','time','date']谢谢! 最佳答案 require'time'defto_something(str)if(num=Integer(str)rescueFloat(s
ruby-on-rails - 添加回形针新样式不影响旧上传的图像 - 2
我有带有Logo图像的公司模型has_attached_file:logo我用他们的Logo创建了许多公司。现在，我需要添加新样式has_attached_file:logo,:styles=>{:small=>"30x15>",:medium=>"155x85>"}我是否应该重新上传所有旧数据以重新生成新样式？我不这么认为……或者有什么rake任务可以重新生成样式吗？最佳答案参见Thumbnail-Generation.如果rake任务不适合你，你应该能够在控制台中使用一个片段来调用重新处理!关于相关公司
Matlab imread（）读到了什么（浅显当复习文档了） - 2
matlab打开matlab，用最简单的imread方法读取一个图像clcclearimg_h=imread('hua.jpg');返回一个数组（矩阵），往往是a*b*cunit8类型解释一下这个三维数组的意思，行数、数和层数，unit8：指数据类型，无符号八位整形，可理解为0~2^8的数三个层数分别代表RGB三个通道图像rgb最常用的是24-位实现方法，即RGB每个通道有256色阶（2^8）。基于这样的24-位RGB模型的色彩空间可以表现256×256×256≈1670万色当imshow传入了一个二维数组，它将以灰度方式绘制；可以把图像拆分为rgb三层，可以以灰度的方式观察它figure(1
区块链之加解密算法&数字证书 - 2
目录一.加解密算法数字签名对称加密DES(DataEncryptionStandard)3DES(TripleDES)AES(AdvancedEncryptionStandard)RSA加密法DSA(DigitalSignatureAlgorithm)ECC(EllipticCurvesCryptography)非对称加密签名与加密过程非对称加密的应用对称加密与非对称加密的结合二.数字证书图解一.加解密算法加密简单而言就是通过一种算法将明文信息转换成密文信息，信息的的接收方能够通过密钥对密文信息进行解密获得明文信息的过程。根据加解密的密钥是否相同，算法可以分为对称加密、非对称加密、对称加密和非
postman接口测试工具-基础使用教程 - 2
1.postman介绍Postman一款非常流行的API调试工具。其实，开发人员用的更多。因为测试人员做接口测试会有更多选择，例如Jmeter、soapUI等。不过，对于开发过程中去调试接口，Postman确实足够的简单方便，而且功能强大。2.下载安装官网地址:https://www.postman.com/下载完成后双击安装吧，安装过程极其简单，无需任何操作3.使用教程这里以百度为例,工具使用简单，填写URL地址即可发送请求，在下方查看响应结果和响应状态码常用方法都有支持请求方法:getpostputdeleteGet、Post、Put与Delete的作用get：请求方法一般是用于数据查询，
软件测试基础 - 2
Ⅰ软件测试基础一、软件测试基础理论1、软件测试的必要性所有的产品或者服务上线都需要测试2、测试的发展过程3、什么是软件测试找bug，发现缺陷4、测试的定义使用人工或自动的手段来运行或者测试某个系统的过程。目的在于检测它是否满足规定的需求。弄清预期结果和实际结果的差别。5、测试的目的以最小的人力、物力和时间找出软件中潜在的错误和缺陷6、测试的原则28原则：20%的主要功能要重点测（eg：支付宝的支付功能，其他功能都是次要的）80%的错误存在于20%的代码中7、测试标准8、测试的基本要求功能测试性能测试安全性测试兼容性测试易用性测试外观界面测试可靠性测试二、质量模型衡量一个优秀软件的维度①功能性功
SPI接收数据异常问题总结 - 2
SPI接收数据左移一位问题目录SPI接收数据左移一位问题一、问题描述二、问题分析三、探究原理四、经验总结最近在工作在学习调试SPI的过程中遇到一个问题——接收数据整体向左移了一位（1bit）。SPI数据收发是数据交换，因此接收数据时从第二个字节开始才是有效数据，也就是数据整体向右移一个字节（1byte）。请教前辈之后也没有得到解决，通过在网上查阅前人经验终于解决问题，所以写一个避坑经验总结。实际背景：MCU与一款芯片使用spi通信，MCU作为主机，芯片作为从机。这款芯片采用的是它规定的六线SPI，多了两根线：RDY和INT，这样从机就可以主动请求主机给主机发送数据了。一、问题描述根据从机芯片手
ruby-on-rails - 在 Ruby (on Rails) 中使用 imgur API 获取图像 - 2
我正在尝试使用Ruby2.0.0和Rails4.0.0提供的API从imgur中提取图像。我已尝试按照Ruby2.0.0文档中列出的各种方式构建http请求，但均无济于事。代码如下:require'net/http'require'net/https'defimgurheaders={"Authorization"=>"Client-ID"+my_client_id}path="/3/gallery/image/#{img_id}.json"uri=URI("https://api.imgur.com"+path)request,data=Net::HTTP::Get.new(path
python ffmpeg 使用 pyav 转换一组图像到视频 - 2
2022/8/4更新支持加入水印水印必须包含透明图像，并且水印图像大小要等于原图像的大小pythonconvert_image_to_video.py-f30-mwatermark.pngim_dirout.mkv2022/6/21更新让命令行参数更加易用新的命令行使用方法pythonconvert_image_to_video.py-f30im_dirout.mkvFFMPEG命令行转换一组JPG图像到视频时，是将这组图像视为MJPG流。我需要转换一组PNG图像到视频，FFMPEG就不认了。pyav内置了ffmpeg库，不需要系统带有ffmpeg工具因此我使用ffmpeg的python包装p