TPH-yolov_草庐IT

YOLOv8改进：全网原创首发 | 多尺度空洞注意力（MSDA） | 中科院一区顶刊 DilateFormer 2023.9

💡💡💡本文全网首发独家改进：多尺度空洞注意力（MSDA）采用多头的设计，在不同的头部使用不同的空洞率执行滑动窗口膨胀注意力（SWDA），全网独家首发，创新力度十足，适合科研 1）与C2f结合；2）作为注意力MSDA使用；推荐指数：五星多尺度空洞注意力（MSDA） | 亲测在多个数据集能够实现涨点，这样可以在被关注的感受野内的各个尺度上聚合语义信息，并有效地减少自注意力机制的冗余💡💡💡Yolov8魔术师，独家首发创新（原创），适用于Yolov5、Yolov7、Yolov8等各个Yolo系列，专栏文章提供每一步步骤和源码，轻松带你上手魔改网络💡💡💡重点：通过本专栏的阅读，后续你也可以自己魔改网络，

Yolov7：最新最快的实时检测框架，最详细分析解释（附源代码）

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq学习群｜扫码在主页获取加入方式论文地址：https://arxiv.org/pdf/2207.02696.pdf代码地址：https://github.com/WongKinYiu/yolov7计算机视觉研究院专栏作者：Edison_GYOLOv7相同体量下比YOLOv5精度更高，速度快120%(FPS)，比YOLOX快180%(FPS)，比Dual-Swin-T快1200%(FPS)，比ConvNext快550%(FPS)，比SWIN-L快500%(FPS)。01概述前段时间才给大家分享了美团出品的Yolov6

yolov5 的 mAP 和召回率很低，但是精准率 AP还可以

可能的原因：标注问题，检查图片没有txt，导致有正样本的图片，被认为是背景，召回率降低。是否是中文路径,opencv这个cv2.imread不能读取中文图像。改成这样就行。下面im=np.array(im)[::-1]是错误的，本来目的是将RGB转为BGR，但是实际上通道是HWC，转的是H，因此会在高上反转，标签不对应，导致错误。查看标签,一个是查看label.txt中的xywh,没问题后。再查看runs/train/VOC_640_/train_batch0.jpg这样的图片，如果图片不正常，就去掉上图中的使用numpy读取图像，直接读取原图就好。

YOLOv5/YOLOv7改进：全网原创首发 | 多尺度空洞注意力（MSDA） | 中科院一区顶刊 DilateFormer 2023.9

💡💡💡本文全网首发独家改进：多尺度空洞注意力（MSDA）采用多头的设计，在不同的头部使用不同的空洞率执行滑动窗口膨胀注意力（SWDA），全网独家首发，创新力度十足，适合科研 1）与C3结合；2）作为注意力MSDA使用；推荐指数：五星多尺度空洞注意力（MSDA） | 亲测在多个数据集能够实现涨点，这样可以在被关注的感受野内的各个尺度上聚合语义信息，并有效地减少自注意力机制的冗余💡💡💡Yolov5/Yolov7魔术师，独家首发创新（原创），适用于Yolov5、Yolov7、Yolov8等各个Yolo系列，专栏文章提供每一步步骤和源码，轻松带你上手魔改网络💡💡💡重点：通过本专栏的阅读，后续你也可

Yolov5 中添加Network Slimming剪枝--稀疏训练部分

前言：NetworkSlimming剪枝过程让如下1.稀疏化2.剪枝3.反复迭代这个过程一、稀疏化：通过NetworkSlimming的核心思想是:添加L1正则来约束BN层系数，从而剪掉那些贡献比较小的通道channel原理如下：BN层的计算是这样的：上边介绍了，NetworkSlimming的核心思想是剪掉那些贡献比较小的通道channel，它的做法是从BN层下手。BN层的计算公式如下：通过BN层的计算公式可以看出每个channe的Zout的大小和系数γ正相关，因此我们可以拿掉哪些γ-->0的channel，但是由于正则化，我们训练一个网络后，bn层的系数是正态分布的。这样的话，0附近的值

YOLOv5剪枝✂️| 模型剪枝实战篇

本篇博文所用代码为开源项目修改得到，且不适合基础太差的同学。本篇文章主要讲解代码的使用方式，手把手带你实现YOLOv5模型剪枝操作。文章目录0.环境准备1.使用YOLOv5训练自己的模型2.对训练好的模型进行稀疏训练3.对稀疏训练后的模型进行剪枝4.对剪枝后的网络模型微调5.测试微调后的模型6.总结7.源码8.参考代码0.环境准备终端键入：pipinstall-rrequirements.txt-ihttps

YOLOv5算法改进（5）— 如何去添加CBAM注意力机制（包括代码+添加步骤+网络结构图）

前言：Hello大家好，我是小哥谈。注意力机制是近年来深度学习领域内的研究热点，可以帮助模型更好地关注重要的特征，从而提高模型的性能。CBAM（ConvolutionalBlockAttentionModule）是一种用于前馈卷积神经网络的简单而有效的注意力模块，它是一种结合了通道（channel）和空间（spatial）的注意力机制模块，相比于SE-Net只关注通道注意力机制可以取得更好的结果。本文就给大家讲解如何在YOLOv5算法中添加CBAM注意力机制，希望大家学习之后能够有所收获！🌈 前期回顾：

yolov5+bytetrack算法在华为NPU上进行端到端开发

自从毕业后开始进入了华为曻腾生态圈，现在越来越多的公司开始走国产化路线了，现在国内做AI芯片的厂商比如：寒武纪、地平线等，虽然我了解的不多，但是相对于瑞芯微这样的AI开发板来说，华为曻腾的生态比瑞芯微好太多了，参考文档非常多，学习资料也有很多，也容易上手开发。华为曻腾官网：昇腾AI应用案例-昇腾社区(hiascend.com) 直接步入正题，现在的目标检测已经很成熟了，所以越来越多的公司会用到基于检测的跟踪算法，这样不仅起到了单一检测功能，还有跟踪目标或者计数的功能；现在应用较广泛的目标检测算法从最开始的yolov5一直到现在的yolov8，虽然只是简单的看了一下算法的原

全网首发YOLOv5/YOLOv7暴力涨点：Dual-ViT：一种多尺度双视觉Transformer ，Dualattention助力检测| 顶刊TPAMI 2023

💡💡💡本文独家改进：DualViT：一种新的多尺度视觉Transformer主干，它在两种交互路径中对自注意力学习进行建模，即学习更精细像素级细节的像素路径和提取整体全局语义信息的语义路径，性能表现出色，Dualattention引入到YOLOv5/YOLOv7实现创新涨点！！！Dualattention| 亲测在多个数据集能够实现大幅涨点💡💡💡Yolov5/Yolov7魔术师，独家首发创新（原创），适用于Yolov5、Yolov7、Yolov8等各个Yolo系列，专栏文章提供每一步步骤和源码，轻松带你上手魔改网络💡💡💡重点：通过本专栏的阅读，后续你也可以自己魔改网络，在网络不同位置（Bac

主干网络篇 | YOLOv8 更换主干网络之 VanillaNet |《华为方舟实验室最新成果》

论文地址：https://arxiv.org/pdf/2305.12972.pdf代码地址：https://github.com/huawei-noah/VanillaNet在基础模型的核心是“多样性即不同”，这一哲学在计算机视觉和自然语言处理方面取得了惊人的成功。然而，优化和Transformer模型固有的复杂性带来了挑战，需要转向简洁性的范式。在这项研究中，我们介绍了VanillaNet，这是一种拥抱设计优雅的神经网络架构。通过避免高深度、快捷方式和像自注意力这样的复杂操作，VanillaNet既简洁又强大。每一层都经过精心设计，紧凑而直观，训练后修剪非线性激活函数以恢复原始架构。Vani