博文目录文章目录效果展示工程源码环境准备第一阶段使用自带模型实现实时目标检测屏幕截图封装详见toolkit.py中Capture类目标检测封装详见toolkit.py中Detector类实时目标检测详见detect.realtime.py第二阶段训练模型与简单尝试labelimgclasses.txt与标记文件说明简单尝试编写数据集配置文件编写训练文件参数运行训练文件运行结果测试训练结果如何取得最好的训练效果第三阶段训练射击场假人专用检测模型训练规划训练假人截图详见grab.for.apex.dummy.py标记参数训练测试粗浅的优化方案模型层面的优化部署TensorRT推理加速第四阶段主功能
博文目录文章目录效果展示工程源码环境准备第一阶段使用自带模型实现实时目标检测屏幕截图封装详见toolkit.py中Capture类目标检测封装详见toolkit.py中Detector类实时目标检测详见detect.realtime.py第二阶段训练模型与简单尝试labelimgclasses.txt与标记文件说明简单尝试编写数据集配置文件编写训练文件参数运行训练文件运行结果测试训练结果如何取得最好的训练效果第三阶段训练射击场假人专用检测模型训练规划训练假人截图详见grab.for.apex.dummy.py标记参数训练测试粗浅的优化方案模型层面的优化部署TensorRT推理加速第四阶段主功能
本文实现了俩种环境的设置,一种是windows的CPU版本,还有服务器上的GPU版本。CPU版本仅用来实现检测,而GPU版本用来训练自己的数据集!(选择其中一个环境运行后,训练自己的数据集)1.环境1:windows11,anaconda虚拟环境(python3.9),pycharmultralytics/ultralytics:YOLOv8🚀inPyTorch>ONNX>CoreML>TFLite(github.com)下载文件到本地后解压缩pipinstall-rrequirements.txt根据自己的路径位置,下载所需要的包(或者pipinstallultralytics都一样)配置环
本文实现了俩种环境的设置,一种是windows的CPU版本,还有服务器上的GPU版本。CPU版本仅用来实现检测,而GPU版本用来训练自己的数据集!(选择其中一个环境运行后,训练自己的数据集)1.环境1:windows11,anaconda虚拟环境(python3.9),pycharmultralytics/ultralytics:YOLOv8🚀inPyTorch>ONNX>CoreML>TFLite(github.com)下载文件到本地后解压缩pipinstall-rrequirements.txt根据自己的路径位置,下载所需要的包(或者pipinstallultralytics都一样)配置环
文章目录一:YOLO_v4的出现二:yolov4的创新点三:输入端【数据增强Mosaic】【SAT自对抗训练】【cmBN】[LabelSmoothing]四:BackBone【CSPDarknet53】【Mish激活函数】【Dropblock】五:Neck【SPP】【PAN】【SAM】六:Head【loss创新】【NMS创新】【SOFT-NMS】七:总结一:YOLO_v4的出现其实YOLO系列的原作者,推出YOLO_v3后就退隐江湖了,主要由于老美利用该技术来进行军事打击,十分令作者寒心。但奈何,还是有后继者提出了YOLO_v4系列,别说,一出现,又一次横扫世间。作者AlexeyAB大神!YO
文章目录一:YOLO_v4的出现二:yolov4的创新点三:输入端【数据增强Mosaic】【SAT自对抗训练】【cmBN】[LabelSmoothing]四:BackBone【CSPDarknet53】【Mish激活函数】【Dropblock】五:Neck【SPP】【PAN】【SAM】六:Head【loss创新】【NMS创新】【SOFT-NMS】七:总结一:YOLO_v4的出现其实YOLO系列的原作者,推出YOLO_v3后就退隐江湖了,主要由于老美利用该技术来进行军事打击,十分令作者寒心。但奈何,还是有后继者提出了YOLO_v4系列,别说,一出现,又一次横扫世间。作者AlexeyAB大神!YO
YOLOV1YOLOV1最后生成7×7的网格(gridcell),每个gridcell会产生两个预测框(boundingbox),每个gridcell产生的两个预测框只能预测同一种类物体,也就是说YOLOV1最多只能预测49种物体,两个预测框中哪一个与标注框的IOU大就选哪一个(此即正样本),另外一个会被舍弃(负样本);特殊情况(如果有两个相同种类的物体中心点都落在同一个gridcell中,此时这个gridcell的两个预测框有可能都与真实框有最大的IOU,也即两个预测框都为正样本,这也就是说YOLOV1最多能预测49×2个目标)。如果标注框的中心点落在哪一个gridcell中就由这个grid
YOLOV1YOLOV1最后生成7×7的网格(gridcell),每个gridcell会产生两个预测框(boundingbox),每个gridcell产生的两个预测框只能预测同一种类物体,也就是说YOLOV1最多只能预测49种物体,两个预测框中哪一个与标注框的IOU大就选哪一个(此即正样本),另外一个会被舍弃(负样本);特殊情况(如果有两个相同种类的物体中心点都落在同一个gridcell中,此时这个gridcell的两个预测框有可能都与真实框有最大的IOU,也即两个预测框都为正样本,这也就是说YOLOV1最多能预测49×2个目标)。如果标注框的中心点落在哪一个gridcell中就由这个grid
在深度学习中,第一步要做的往往就是处理数据集,尤其是学习百度飞桨PaddlePaddle的小伙伴,数据集经常要用Voc格式的,比如性能突出的ppyolo等模型。所以学会数据集转化的本领是十分必要的。这篇博客就带你一起进行Yolo与Voc格式的相互转化,附详细代码!文章目录YOLO数据集介绍VOC数据集介绍Yolo转VOCVOC转Yolofromlxmlimportetreeclasses=["ball"]YOLO数据集介绍Yolo数据集主要是txt文件,一般包括train文件夹和val文件夹,每一个文件夹下有与图片同名的txt文件,基本结构如下:|–image||–train||–val|–l
在深度学习中,第一步要做的往往就是处理数据集,尤其是学习百度飞桨PaddlePaddle的小伙伴,数据集经常要用Voc格式的,比如性能突出的ppyolo等模型。所以学会数据集转化的本领是十分必要的。这篇博客就带你一起进行Yolo与Voc格式的相互转化,附详细代码!文章目录YOLO数据集介绍VOC数据集介绍Yolo转VOCVOC转Yolofromlxmlimportetreeclasses=["ball"]YOLO数据集介绍Yolo数据集主要是txt文件,一般包括train文件夹和val文件夹,每一个文件夹下有与图片同名的txt文件,基本结构如下:|–image||–train||–val|–l