opencv-python3 | cv2.findContours()检测图像中物体轮廓

一颗磐石 2023-08-06 原文

cv2.findContours检测物体轮廓

什么是物体轮廓

轮廓可以简单地理解为连接所有连续点（沿物体边界）的曲线，这些点通常具有相同的颜色或强度。轮廓在图像分析中具有重要意义，是物体形状分析和对象检测和识别的有用工具，是理解图像语义信息的重要依据。

cv2.findContours

通常，为了提高物体轮廓检测的准确率，首先要将彩色图像或者灰度图像处理成二值图像（黑白图像）或者使用Canny边缘检测算法对原图像进行一次滤波处理，这样可以在不丢失轮廓信息的前提下降低图像语义信息的复杂度，更有助于我们准确地分析物体轮廓。因此，在opencv里边，寻找轮廓的过程更像是在黑色背景中寻找白色物体。
下边是一段使用opencv-python里的cv2.findConttours()检测物体轮廓的代码。

import numpy as np
import cv2


im = cv2.imread('test.jpg')
imgray = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(imgray, 127, 255, 0)
contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

从上边的代码中，我们可以看到cv2.findContours()有三个参数：thresh、cv2.RETR_TREE、cv2.CHAIN_APPROX_SIMPLE。

参数说明：

thresh：图像数据（二值图像或经过Canny算法处理之后的图像）
cv2.RETR_TREE：轮廓检索方式，还有cv2.RETR_LIST、cv2.RETR_EXTERNAL、cv2.RETR_CCOMP
cv2.CHAIN_APPROX_SIMPLE：轮廓的估计方法，除此之外还有 cv2.CHAIN_APPROX_NONE

第二个参数指定的不同轮廓检索方法有什么区别呢？

轮廓检索方法	作用
cv2.RETR_LIST	这是最简单的一种寻找方式，它不建立轮廓间的子属关系，也就是所有轮廓都属于同一层级
cv2.RETR_TREE	完整建立轮廓的层级从属关系
cv2.RETR_EXTERNAL	只寻找最高层级的轮廓
cv2.RETR_CCOMP	把所有的轮廓只分为2个层级，不是外层的就是里层的

详情请参考 cv2.findContours()的轮廓层级关系.

前边说了物体轮廓是具有相同灰度值的形状的边界。它是以形状边界上的点的坐标（x,y）储存的，但是cnts里边是储存了边界上所有点的坐标吗？还是只储存了个别点的坐标？这是由第三个参数轮廓的估计方法指定的。如果传递 cv2.CHAIN_APPROX_NONE，则存储所有边界点。但实际上我们需要所有的点吗？例如，您找到了一条直线的轮廓。你需要线上的所有点来代表那条线吗？不，我们只需要那条线的两个端点。这就是 cv.CHAIN_APPROX_SIMPLE 所做的。它去除所有冗余点并压缩轮廓，从而节省内存。如图1所示。

　　　　　　图1. 不同轮廓估计方法的效果图

cv2.findContours()返回了两个变量：contours, hierarchy。

输出变量说明：

contours：一个包含了图像中所有轮廓的list对象。其中每一个独立的轮廓信息以边界点坐标（x,y）的形式储存在numpy数组中。
hierarchy：一个包含4个值的数组：[Next, Previous, First Child, Parent]。
Next：与当前轮廓处于同一层级的下一条轮廓
Previous：与当前轮廓处于同一层级的上一条轮廓
First Child：当前轮廓的第一条子轮廓
Parent：当前轮廓的父轮廓
因为一般不使用hierarchy，所以这里不讨论轮廓的层级关系，想深入研究的朋友请移步：cv2.findContours()的轮廓层级关系.

cv2.drawContours

计算得到图像中物体轮廓之后，我们需要将轮廓在图像中绘制出来才能更直观地体验到。这时候需要用到cv2.drawContours()方法。它的第一个参数是图像，第二个参数是储存轮廓信息的python 列表，第三个参数是轮廓的索引（在绘制单个轮廓时很有用。要绘制所有轮廓，传递 -1），其余参数是颜色、厚度等等。

绘制检索到的所有轮廓

cv.drawContours(img, contours, -1, (0,255,0), 3)

绘制检索到的所有轮廓中的第四个

cv.drawContours(img, contours, 3, (0,255,0), 3)

但是更多时候我们使用下边这种方法绘制单独的某一个轮廓。

第二种方法绘制检索到的所有轮廓中的第四个

cnt = contours[4]
cv.drawContours(img, [cnt], 0, (0,255,0), 3)

代码示例

import cv2
import imutils
import numpy as np

# 读取图片
img_dir = r'C:\Users\Lei\Desktop\8.jpg'
img = cv2.imread(img_dir)
# 图像预处理
img = imutils.resize(img, height=500)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray = cv2.GaussianBlur(gray, (5, 5), 0)
binary = cv2.Canny(gray, 30, 120)
# 轮廓检索
contours, hierarchy = cv2.findContours(binary,
                                       cv2.RETR_EXTERNAL,
                                       cv2.CHAIN_APPROX_SIMPLE)

cv2.imshow('origin', img)
if cv2.waitKey(0) & 0xFF == ord('q'):
    cv2.destroyWindow('origin')

cv2.imshow('binary', binary)
if cv2.waitKey(0) & 0xFF == ord('q'):
    cv2.destroyWindow('binary')

# 轮廓过滤以及绘制
draw_img = img.copy()
for i in range(len(contours)):
    # 筛掉面积过小的轮廓
    area = cv2.contourArea(contours[i])
    if area < 800:
        continue
    # 找到包含轮廓的最小矩形框
    rect = cv2.minAreaRect(contours[i])
    # 计算矩形框的四个顶点坐标
    box = cv2.boxPoints(rect)
    box = np.int0(box)
    # 绘制轮廓
    cv2.drawContours(draw_img, [box], 0, (0, 0, 255), 5)


cv2.imshow('origin with contours', draw_img)
if cv2.waitKey(0) & 0xFF == ord('q'):
    cv2.destroyWindow('origin with contours')

代码中首先对读取的RGB图像（图2）转灰度图，然后进行高斯滤波去噪，再使用Canny算子进行边缘检测得到黑白图像（图3）。对黑白图像进行轮廓检索，检索到的轮廓再根据cv2.contourArea()计算得到的面积大小进行一次筛选，去掉因噪声引起的检测。根据检测到的轮廓信息，使用cv2.minAreaRect()得到包含轮廓信息的最小矩形框rect，再使用cv2.boxPoints()计算出rect的四个顶点。最后，使用cv2.drawContours()绘制出rect（图4）。

　　　　　　　　　图2. RGB原图像

　　　　　　　图3. Canny算子得到的黑白图像

　　　　　　图4. 使用矩形框显示轮廓检测结果

中物 opencv-python span class token opencv python 物体检测 findContours drawContours

有关opencv-python3 | cv2.findContours()检测图像中物体轮廓的更多相关文章

python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声？ - 2
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题？更新问题，以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点？我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等)，但我确实想创建一个输出文件。
ruby - RuntimeError(自动加载常量 Apps 多线程时检测到循环依赖 - 2
我收到这个错误:RuntimeError(自动加载常量Apps时检测到循环依赖当我使用多线程时。下面是我的代码。为什么会这样？我尝试多线程的原因是因为我正在编写一个HTML抓取应用程序。对Nokogiri::HTML(open())的调用是一个同步阻塞调用，需要1秒才能返回，我有100,000多个页面要访问，所以我试图运行多个线程来解决这个问题。有更好的方法吗？classToolsController0)app.website=array.join(',')putsapp.websiteelseapp.website="NONE"endapp.saveapps=Apps.order("
Python 相当于 Perl/Ruby ||= - 2
这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:Pythonconditionalassignmentoperator对于这样一个简单的问题表示歉意，但是谷歌搜索||=并不是很有帮助；)Python中是否有与Ruby和Perl中的||=语句等效的语句？例如:foo="hey"foo||="what"#assignfooifit'sundefined#fooisstill"hey"bar||="yeah"#baris"yeah"另外，类似这样的东西的通用术语是什么？条件分配是我的第一个猜测，但Wikipediapage跟我想的不太一样。
java - 什么相当于 ruby 的 rack 或 python 的 Java wsgi？ - 2
什么是ruby的rack或python的Java的wsgi？还有一个路由库。最佳答案来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht
华为OD机试用Python实现 -【明明的随机数】 2023Q1A - 2
华为OD机试题本篇题目：明明的随机数题目输入描述输出描述：示例1输入输出说明代码编写思路最近更新的博客华为od2023|什么是华为od，od薪资待遇，od机试题清单华为OD机试真题大全，用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为o
Vscode+Cmake配置并运行opencv环境(Windows和Ubuntu大同小异) - 2
之前在培训新生的时候，windows环境下配置opencv环境一直教的都是网上主流的vsstudio配置属性表，但是这个似乎对新生来说难度略高(虽然个人觉得完全是他们自己的问题)，加之暑假之后对cmake实在是爱不释手，且这样配置确实十分简单(其实都不需要配置)，故斗胆妄言vscode下配置CV之法。其实极为简单，图比较多所以很长。如果你看此文还配不好，你应该思考一下是不是自己的问题。闲话少说，直接开始。0.CMkae简介有的人到大二了都不知道cmake是什么，我不说是谁。CMake是一个开源免费并且跨平台的构建工具，可以用简单的语句来描述所有平台的编译过程。它能够根据当前所在平台输出对应的m
python - 如何读取 MIDI 文件、更改其乐器并将其写回？ - 2
我想解析一个已经存在的.mid文件，改变它的乐器，例如从“acousticgrandpiano”到“violin”，然后将它保存回去或作为另一个.mid文件。根据我在文档中看到的内容，该乐器通过program_change或patch_change指令进行了更改，但我找不到任何在已经存在的MIDI文件中执行此操作的库.他们似乎都只支持从头开始创建的MIDI文件。最佳答案 MIDIpackage会为您完成此操作，但具体方法取决于midi文件的原始内容。一个MIDI文件由一个或多个音轨组成，每个音轨是十六个channel中任何一个上的
「Python｜Selenium｜场景案例」如何定位iframe中的元素？ - 2
本文主要介绍在使用Selenium进行自动化测试或者任务时，对于使用了iframe的页面，如何定位iframe中的元素文章目录场景描述解决方案具体代码场景描述当我们在使用Selenium进行自动化测试的时候，可能会遇到一些界面或者窗体是使用HTML的iframe标签进行承载的。对于iframe中的标签，如果直接查找是无法找到的，会抛出没有找到元素的异常。比如近在咫尺的例子就是，CSDN的登录窗体就是使用的iframe，大家可以尝试通过F12开发者模式查看到的tag_name,class_name,id或者xpath来定位中的页面元素，会抛出NoSuchElementException异常。解决
python ffmpeg 使用 pyav 转换一组图像到视频 - 2
2022/8/4更新支持加入水印水印必须包含透明图像，并且水印图像大小要等于原图像的大小pythonconvert_image_to_video.py-f30-mwatermark.pngim_dirout.mkv2022/6/21更新让命令行参数更加易用新的命令行使用方法pythonconvert_image_to_video.py-f30im_dirout.mkvFFMPEG命令行转换一组JPG图像到视频时，是将这组图像视为MJPG流。我需要转换一组PNG图像到视频，FFMPEG就不认了。pyav内置了ffmpeg库，不需要系统带有ffmpeg工具因此我使用ffmpeg的python包装p
Python 刷Leetcode题库，顺带学英语单词（31） - 2
ValidPalindromeGivenastring,determineifitisapalindrome,consideringonlyalphanumericcharactersandignoringcases. [#125]Example:"Aman,aplan,acanal:Panama"isapalindrome."raceacar"isnotapalindrome.Haveyouconsiderthatthestringmightbeempty?Thisisagoodquestiontoaskduringaninterview.Forthepurposeofthisproblem