YOLOv5训练结果分析

DongDong_0921 2023-04-15 原文

本文的目的是帮助理解每次训练后，在runs/train文件夹下出现的一系列文件，并探索如何评估准确率以及模型的好坏。

一.混淆矩阵—confusion_matrix.png

毕设跑的train有混淆矩阵，但是有点扯，需要跑一下鸟类的验证一下(待验证)

1.概念

混淆矩阵是对分类问题预测结果的总结。使用计数值汇总正确和不正确预测的数量，并按每个类进行细分，显示了分类模型进行预测时会对哪一部分产生混淆。

混淆矩阵不仅可以让我们直观的了解分类模型所犯的错误，更重要的是可以了解哪些错误类型正在发生，正是这种对结果的分解克服了仅使用分类准确率带来的局限性。

2.图文理解

		实际
		类1	类2	类3
预测	类1	43	5	2
	类2	2	45	3
	类3	0	1	49

(1)横轴时预测类别，纵轴是真实类别；

(2)表格里的数目总数为150，表示共有150个测试样本；

(3)每一行之和为50，表示每类各有50个样本，每一行代表了真实的目标被预测为其他类的数量，比如第一行：43代表真实的类一中有43个被预测为类一，5个被错预测为类2,2个被错预测为类3；

二.TP/TN/FP/FN

1.逻辑关系

T(True)：最终预测结果正确。

F(False)：最后预测结果错误。

P(Positive)：模型预测其是正例(目标本身是个鱼，模型也预测它是个鱼)。

N(Negative)：模型预测其是负例(目标本身是个鱼，但模型预测它是个猫)。

TP：样本的真实类别是正例，并且模型预测的结果也是正例，预测正确(目标本身是个鱼，模型也预测它是鱼，预测正确；还有一种理解方式，模型预测它是正例，最终预测结果是正确的，所以目标是个正例))。

TN：样本的真实类别是负例，并且模型将其预测成为负例，预测正确(目标本身不是鱼，模型预测它不是了鱼，是个其他的东西，预测正确；还有一种理解方式，模型预测它是负例，最终预测结果是正确的，所以目标是个负例))。

FP：样本的真实类别是负例，但是模型将其预测成为正例，预测错误(目标本身不是鱼，模型预测它是鱼，预测错误；还有一种理解方式，模型预测它是正例，最终预测结果是错误的，所以目标是个负例)。

FN：样本的真实类别是正例，但是模型将其预测成为负例，预测错误(目标本身是鱼，模型预测它不是鱼，是个其他的东西，预测错误；还有一种理解方式，模型预测它是负例，最终预测结果是错误的，所以目标是个正例)。

2.几个指标

(1)正确率/准确率(accuracy)= $\frac{}{}$ $\frac{TP+TN}{TP+TN+FP+FN}$ ;

注：通常来说正确率越高，模型越好。

(2)错误率= $\frac{FP+FN}{TP+TN+FP+FN}$ ;

(3)灵敏度(sensitive)= $\frac{TP}{TP+FN}$ ；

注：表示的是所有正例中被分对的比例，衡量了分类器对正例的识别能力；

(4)特征度/特异度(specificity)= $\frac{TN}{TN+FP}$

注：表示的是所有负例中被分对的比例，衡量了分类器对负例的识别能力；

(5)精确率(precision)= $\frac{TP}{TP+FP}$

注：表示被分为正例的示例中实际为正例的比例；

(6)召回率(recall)= $\frac{TP}{TP+FN}$

注：度量有多个正例被分为正例；

3.label.jpg

第一张图：classes(每个类别的数据量)

第二个图：labels(框的尺寸和数量)

第三个图：center (框的中心点坐标)

第四个图：labels width and height(框的长和宽)

4.P_curve(精确率和置信度的关系图)

精确率(查准率)：表示被分为正例的示例中实际为正例的比例

解释：设置置信度为某一数值的时候，各个类别识别的精确率。

可以看到，当置信度越大的时候，类别检测的越准确。这也很好理解，只有置信度很大，才被判断是某一类别。但这样的话，会漏检一些置信度低的类别。

比如运行程序时，即便某个目标是鱼，模型预测它也是鱼，但是给它的置信度只有70%，当置信度设置在80%时才认为是鱼时，这个目标就会被忽略了。

5.R_curve(召回率和置信度的关系图)

召回率(查全率)：度量有多个正例被分为正例

解释：设置置信度为某一数值的时候，各个类别查全的概率。可以看到，当置信度越小的时候，类别检测的越全面。

6.先验知识 $\rightarrow$ 综合recall和precision

Precision和Recall通常是一对矛盾的性能度量指标。一般来说，Precision越高时，Recall往往越低。

原因是：如果我们希望提高Precision，即二分类器预测的正例尽可能是真实正例，那么就要提高二分类器预测正例的门槛。例如，之前预测正例只要置信度 $\geq$ 0.5的样例我们就标注为正例，那么现在要提高到置信度 $\geq$ 0.7我们才标注为正例，这样才能保证二分类器挑选出来的正例更有可能是真实正例；而这个目标恰恰与提高Recall相反，如果我们希望提高Recall，即二分类器尽可能地将真实正例挑选出来，那么势必要降低二分类器预测正例的门槛，例如之前预测正例只要置信度 $\geq$ 0.5的样例我们就标注为真实正例，那么现在要降低到 $\geq$ 0.3我们就将其标注为正例，这样才能保证二分类器挑选出尽可能多的真实正例。

注：算法会为每个目标分配一个置信度

对于二分类器，我的理解是：即便是有多个目标，因为在P_curve和R_curve中，每一类都有一条自己对应的曲线，所以在计算每一类的时候(比如鱼)，鱼就是正例，其余的不管有多少类通通归为负例。

7.PR_curve(精确率和召回率的关系图)

mAP (Mean Average Precision)，即均值平均精度。

mAP是所有类别AP的均值，AP由精确率和召回率确定；而IoU 阈值、confidence(置信度) 阈值影响精确率和召回率的计算。计算精确率和召回率时需要判断TP、FP、TN、FN

@后面的数表示判定iou为正负例的阈值

可以看到：精度越高，召回率越低。

我们希望我们的网络，在准确率很高的前提下，尽可能的检测到全部的类别。所以希望我们的曲线接近（1，1）点，即希望mAP曲线的面积尽可能接近1。

第一个衡量指标：mAP曲线的面积大小。

8.F1_curve

F1分数（F1-score）是分类问题的一个衡量指标。是精确率和召回率的调和平均数，1是最好，0是最差。

$F_{1}Score=\frac{2*Precision*Recall}{Precision+Recall}$

9.可视化训练结果解析

横坐标代表的是训练轮数(epoch)

obj(Objectness)：推测为目标检测loss均值，越小目标检测越准。

cls(Classification)：推测为分类loss均值，越小分类越准。

第二个衡量指标：宏观上一般训练结果主要观察精度和召回率波动情况，波动不是很大则训练效果较好；如果训练比较好的话图上呈现的是稳步上升。

10.小感悟

Q1：在学习YOLOv5训练结果分析的过程中突然有了一个疑问：train.py不就是训练训练图片，怎么会涉及到精确率的问题？

解释：在训练过程中，有一步会生成训练集(train.txt)、验证集(val.txt)、测试集(test.txt)，其中存放图片的名字(无后缀.jpg)。

训练集：用于训练模型以及确定参数。相当于老师教学生知识的过程。

验证集：用于确定网络结构以及调整模型的超参数。相当于月考等小测验，用于学生对学习的查漏补缺。

测试集：用于检验模型的泛化能力。相当于大考，上战场一样，真正的去检验学生的学习效果。

所以我感觉正是测试测试集的过程中，才出来的精确率、召回率等参数。

关于毕设训练结果文档中P_curve、R_curve都只有黑鲷的原因是：测试集里只有黑鲷的图片。

这里设计到训练集、验证集、测试集的比例划分(未解决)

半成品：仅仅是为了自己理解YOLOv5的具体原理，如有侵权，麻烦告知，立删

训练 YOLOv5 xff xff0c xff0 python 深度学习人工智能

有关YOLOv5训练结果分析的更多相关文章

报告回顾丨模型进化狂飙，DetectGPT能否识别最新模型生成结果？ - 2
导读语言模型给我们的生产生活带来了极大便利，但同时不少人也利用他们从事作弊工作。如何规避这些难辨真伪的文字所产生的负面影响也成为一大难题。在3月9日智源Live第33期活动「DetectGPT：判断文本是否为机器生成的工具」中，主讲人Eric为我们讲解了DetectGPT工作背后的思路——一种基于概率曲率检测的用于检测模型生成文本的工具，它可以帮助我们更好地分辨文章的来源和可信度，对保护信息真实、防止欺诈等方面具有重要意义。本次报告主要围绕其功能，实现和效果等展开。（文末点击“阅读原文”，查看活动回放。）Ericmitchell斯坦福大学计算机系四年级博士生，由ChelseaFinn和Chri
建模分析 | 平面2R机器人(二连杆)运动学与动力学建模(附Matlab仿真) - 2
目录0专栏介绍1平面2R机器人概述2运动学建模2.1正运动学模型2.2逆运动学模型2.3机器人运动学仿真3动力学建模3.1计算动能3.2势能计算与动力学方程3.3动力学仿真0专栏介绍?附C++/Python/Matlab全套代码?课程设计、毕业设计、创新竞赛必备！详细介绍全局规划(图搜索、采样法、智能算法等)；局部规划(DWA、APF等)；曲线优化(贝塞尔曲线、B样条曲线等)。?详情：图解自动驾驶中的运动规划(MotionPlanning)，附几十种规划算法1平面2R机器人概述如图1所示为本文的研究本体——平面2R机器人。对参数进行如下定义：机器人广义坐标
网站日志分析软件--让网站日志分析工作变得更简单 - 2
网站的日志分析，是seo优化不可忽视的一门功课，但网站越大，每天产生的日志就越大，大站一天都可以产生几个G的网站日志，如果光靠肉眼去分析，那可能看到猴年马月都看不完，因此借助网站日志分析工具去分析网站日志，那将会使网站日志分析工作变得更简单。下面推荐两款网站日志分析软件。第一款：逆火网站日志分析器逆火网站日志分析器是一款功能全面的网站服务器日志分析软件。通过分析网站的日志文件，不仅能够精准的知道网站的访问量、网站的访问来源，网站的广告点击，访客的地区统计，搜索引擎关键字查询等，还能够一次性分析多个网站的日志文件，让你轻松管理网站。逆火网站日志分析器下载地址：https://pan.baidu.
ABB-IRB-1200运动学分析MATLAB RVC工具分析+Simulink-Adams联合仿真 - 2
一、机器人介绍此处是基于MATLABRVC工具箱，对ABB-IRB-1200型号的微型机械臂进行正逆向运动学分析，并利Simulink工具实现对机械臂进行具有动力学参数的末端轨迹规划仿真，最后根据机械模型设计Simulink-Adams联合仿真。图1.ABBIRB 1200尺寸参数示意图ABBIRB 1200提供的两种型号广泛适用于各作业，且两者间零部件通用，两种型号的工作范围分别为700 mm 和 900 mm，大有效负载分别为 7 kg 和5 kg。 IRB 1200 能够在狭小空间内能发挥其工作范围与性能优势，具有全新的设计、小型化的体积、高效的性能、易于集成、便捷的接
关于Qt程序打包后运行库依赖的常见问题分析及解决方法 - 2
目录一.大致如下常见问题：（1）找不到程序所依赖的Qt库version`Qt_5'notfound(requiredby（2）CouldnotLoadtheQtplatformplugin"xcb"in""eventhoughitwasfound（3）打包到在不同的linux系统下，或者打包到高版本的相同系统下，运行程序时，直接提示段错误即segmentationfault，或者Illegalinstruction(coredumped)非法指令（4）ldd应用程序或者库，查看运行所依赖的库时，直接报段错误二.问题逐个分析，得出解决方法：（1）找不到程序所依赖的Qt库version`Qt_5'
ruby - gem 推送结果为 "package metadata is missing" - 2
我正在尝试将我更新的gem推送到rubygems.com并得到以下结果。~/dev/V2/V2GPTI(master)$gembuildv2gpti.gemspecSuccessfullybuiltRubyGemName:v2gptiVersion:0.2File:v2gpti-0.2-universal-darwin-13.gem~/dev/V2/V2GPTI(master)$gempushv2gpti.gemspecERROR:Whileexecutinggem...(Gem::Package::FormatError)packagemetadataismissinginv2g
ruby-on-rails - 如何使用 ruby-prof 和 JMeter 分析 Rails - 2
我想使用ruby-prof和JMeter分析Rails应用程序。我对分析特定Controller/操作/或模型方法的建议方法不感兴趣，我想分析完整堆栈，从上到下。所以我运行这样的东西:RAILS_ENV=productionruby-prof-fprof.outscript/server>/dev/null然后我在上面运行我的JMeter测试计划。然而，问题是使用CTRL+C或SIGKILL中断它也会在ruby-prof可以写入任何输出之前杀死它。如何在不中断ruby-prof的情况下停止mongrel服务器？最佳答案
ruby - 在 Ruby 中训练神经网络 - 2
在神经网络方面，我完全是个初学者。我整天都在与ruby-fann和ai4r搏斗，不幸的是我没有任何东西可以展示，所以我想我会来到StackOverflow并询问这里的知识渊博的人。我有一组样本——每天都有一个数据点，但它们不符合我能够找出的任何明确模式(我尝试了几次回归)。不过，我认为看看是否有任何方法可以仅从日期预测future的数据会很好，而且我认为神经网络将是生成希望表达这种关系的函数的好方法.日期是DateTime对象，数据点是十进制数，例如7.68。我一直在将DateTime对象转换为float，然后除以10,000,000,000得到一个介于0和1之间的数字，我一直在将
ruby - 猴子修补 float 中缀运算符产生意想不到的结果 - 2
重新定义Float#/似乎没有效果:classFloatdef/(other)"magic!"endendputs10.0/2.0#=>5.0但是当另一个中缀运算符Float#*被重新定义时，Float#/突然采用了新的定义:classFloatdef/(other)"magic!"enddef*(other)"spooky"endendputs10.0/2.0#=>"magic!"我很想知道是否有人可以解释这种行为的来源，以及其他人是否得到相同的结果。ruby:ruby2.0.0p353(2013-11-22)[x64-mingw32]要快速确认错误，请运行thisscript.
ruby-on-rails - 尝试编辑时，Rails form_for 结果为 POST 而不是 PUT - 2
我正在使用Rails4并遇到以下错误。RoutingErrorNoroutematches[POST]"/logs/1/meals/13/edit我正在使用:meal传递模型对象的form_for，并且编辑页面正确呈现。但是，Rails似乎并没有检查膳食对象是否已经保存，因此它一直尝试将表单发送到#create操作并尝试发出POST请求，而不是将表单发送到更新操作并进行当我点击提交时一个PUT请求。我如何让form_for识别我正在尝试更新现有对象并且需要PUT而不是POST？其他一切正常，我已经运行了所有迁移。我是Rails的新手，几乎一整天都在尝试自己解决这个问题。请帮忙!请注意，