目标检测算法——YOLOv5/YOLOv7改进之结合PP-LCNet（轻量级CPU网络）

加勒比海带66 2023-12-19 原文

>>>深度学习Tricks，第一时间送达<<<

PP-LCNet——轻量级且超强悍的CPU级骨干网络！！

（一）前沿介绍

1.PP-LCNet主要模块

2.相关实验结果

（二）YOLOv5/YOLOv7改进之结合PP-LCNet

1.配置common.py文件

2.配置yolo.py文件

3.配置yolov5/yolov7_PP-LC.yaml文件

关于YOLO算法改进及论文投稿可关注并留言博主的CSDN/QQ

>>>一起交流！互相学习！共同进步！<<<

PP-LCNet——轻量级且超强悍的CPU级骨干网络！！

（一）前沿介绍

论文题目：PP-LCNet: A Lightweight CPU Convolutional Neural Network

论文地址：https://arxiv.org/abs/2109.15099

代码地址：https://github.com/ngnquan/PP-LCNet

🐱‍🏍先看一下小海带将YOLOv5与PP-LCNet结合后的实验训练情况：还不错吧！

🚀 发现问题：随着模型特征提取能力的增加以及模型参数和FLOPs数量的增加，在基于移动设备的ARM架构的基础上或基于CPU设备的架构上实现快速推理速度变得困难。在这种情况下，已经提出了许多优秀的移动网络，但由于MKLDNN的限制，这些网络的速度在启用了MKLDNN的IntelCPU上并不理想。

💡 解决方法：针对此问题，作者提出了一个基于MKLDNN加速策略的轻量级CPU网络，命名为PP-LCNet，它提高了轻量级模型在多任务上的性能。论文还列出了可以在延迟几乎不变的情况下提高网络准确性的技术。通过这些改进，PP-LCNet在相同的分类推理时间下，它优于最先进的模型，准确率可以大大超过以前的网络结构。并且对于计算机视觉的下游任务，也表现非常出色，比如物体检测、语义分割等等。

PP-LCNet 在同样精度的情况下，速度远超当前所有的骨架网络！它应用在比如目标检测、语义分割等任务算法上，也可以使原本的网络有大幅度的性能提升。由下图可看出，PP-LCNet 不仅精度提升相当明显，而且比MobileNetV3快几乎3倍！！

PP-LCNet的主要贡献有以下4点：

1.更好的激活函数。

由ReLU换成了H-Swish，性能有了很大的提升，而推理时间几乎没有变化。

2.合适的位置添加SE模块

实验发现当SE模块放到最后的时候比较好，因此将SE模块放在网络最后部分，在SE层中使用的激活函数为relu和h-sigmoid。

3.更大的卷积核

作者实验发现发现在模型的最后将3x3卷积核换成5x5的效果比较好。

4.GAP后更高维度的1x1卷积层

GAP后面的维度很小，直接在他后面添加分类层会损失很多特征信息，为了增强模型的鲁棒性，在最终的GAP层之后附加了一个1280维大小的1 × 1 conv(相当于FC层)，在几乎不增加推理时间的情况下存储更多的模型。

1.PP-LCNet主要模块

2.相关实验结果

（二）YOLOv5/YOLOv7改进之结合PP-LCNet

改进方法和其他模块一样，分三步走：

1.配置common.py文件

class SELayer(nn.Module):
    def __init__(self, inp, oup, reduction=4):
        super(SELayer, self).__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.fc = nn.Sequential(
                nn.Conv2d(oup, _make_divisible(inp // reduction), 1, 1, 0,),
                nn.ReLU(),
                nn.Conv2d(_make_divisible(inp // reduction), oup, 1, 1, 0),
                HardSigmoid()
        )

    def forward(self, x):
        b, c, _, _ = x.size()
        y = self.avg_pool(x)
        y = self.fc(y).view(b, c, 1, 1)
        return x * y


class DepSepConv(nn.Module):
    def __init__(self, inp, oup, kernel_size, stride, use_se):
        super(DepSepConv, self).__init__()

        assert stride in [1, 2]

        padding = (kernel_size - 1) // 2

        if use_se:
            self.conv = nn.Sequential(
                # dw
                nn.Conv2d(inp, inp, kernel_size, stride, padding, groups=inp, bias=False),
                nn.BatchNorm2d(inp),
                HardSwish(),
                
                # SE
                SELayer(inp, inp),

                # pw-linear
                nn.Conv2d(inp, oup, 1, 1, 0, bias=False),
                nn.BatchNorm2d(oup),
                HardSwish(),
                
            )
        else:
            self.conv = nn.Sequential(
                # dw
                nn.Conv2d(inp, inp, kernel_size, stride, padding, groups=inp, bias=False),
                nn.BatchNorm2d(inp),
                HardSwish(),

                # pw-linear
                nn.Conv2d(inp, oup, 1, 1, 0, bias=False),
                nn.BatchNorm2d(oup),
                HardSwish()
            )

    def forward(self, x):
        return self.conv(x)

2.配置yolo.py文件

加入DepthSepConv模块。

3.配置yolov5/yolov7_PP-LC.yaml文件

具体配置和之前一样。

🚀🏆🍀【算法创新&算法训练&论文投稿】相关链接👇👇👇

————————————🌴【重磅干货来袭】🎄————————————

🌴 持续更新中……

🚀四、检测头部改进（持续更新中）🎄🎈

1.魔改YOLOv5/v7高阶版（魔法搭配+创新组合）——改进之结合解耦头Decoupled_Detect

2.目标检测算法——YOLOv5/YOLOv7改进结合涨点Trick之ASFF（自适应空间特征融合）

🌴 持续更新中……

🚀五、空间金字塔池化（持续更新中）🎄🎈

1.目标检测算法——YOLOv5/YOLOv7改进之结合ASPP（空洞空间卷积池化金字塔）

2.目标检测算法——YOLOv5/YOLOv7改进之结合特征提取网络RFBNet（涨点明显）

🌴 持续更新中……

关于YOLO算法改进及论文投稿可关注并留言博主的CSDN/QQ

>>>一起交流！互相学习！共同进步！<<<

有关目标检测算法——YOLOv5/YOLOv7改进之结合PP-LCNet（轻量级CPU网络）的更多相关文章

ruby-on-rails - 我可以用鸭子类型(duck typing)改进这种方法吗？ - 2
希望我没有误解“ducktyping”的含义，但从我读到的内容来看，这意味着我应该根据对象如何响应方法而不是它是什么类型/类来编写代码。代码如下:defconvert_hash(hash)ifhash.keys.all?{|k|k.is_a?(Integer)}returnhashelsifhash.keys.all?{|k|k.is_a?(Property)}new_hash={}hash.each_pair{|k,v|new_hash[k.id]=v}returnnew_hashelseraise"CustomattributekeysshouldbeID'sorPropertyo
ruby-on-rails - 负载测试期间 Unicorn CPU 使用率激增，优化方法 - 2
我对为我的RubyonRails3.1.3应用优化我的Unicorn设置的方法很感兴趣。我目前正在高CPU超大实例上生成14个工作进程，因为我的应用程序在负载测试期间似乎受CPU限制。在模拟负载测试中，每秒大约20个请求重放请求，我的实例上的所有8个内核都达到峰值，盒子负载飙升至7-8个。每个unicorn实例使用大约56-60%的CPU。我很好奇可以通过哪些方式对其进行优化？我希望能够每秒将更多请求汇集到这种大小的实例上。内存和所有其他I/O一样完全正常。在我的测试过程中，CPU越来越低。最佳答案如果您受CPU限制，您希望使用
关于yolov5训练时参数workers和batch-size的理解 - 2
关于yolov5训练时参数workers和batch-size的理解yolov5训练命令workers和batch-size参数的理解两个参数的调优总结yolov5训练命令python.\train.py--datamy.yaml--workers8--batch-size32--epochs100yolov5的训练很简单，下载好仓库，装好依赖后，只需自定义一下data目录中的yaml文件就可以了。这里我使用自定义的my.yaml文件，里面就是定义数据集位置和训练种类数和名字。workers和batch-size参数的理解一般训练主要需要调整的参数是这两个：workers指数据装载时cpu所使
ruby - 需要帮助改进 Ruby DSL 以控制 Arduino 控制的饮料分配器(bar monkey) - 2
我正在用Ruby编写DSL来控制我正在处理的Arduino项目；巴尔迪诺。这是一只酒吧猴子，将由软件控制来提供饮料。Arduino通过串行端口接收命令，告诉Arduino要打开什么泵以及打开多长时间。它目前正在读取一个食谱(见下文)并将其打印出来。串行通信的代码以及我在下面提到的其他一些想法仍然需要改进。这是我的第一个DSL，我正在处理之前的示例，所以它的边缘非常粗糙。任何批评、代码改进(是否有任何关于RubyDSL最佳实践或习语的良好引用？)或任何一般性评论。我目前有DSL的粗略草稿，因此饮料配方如下所示(Githublink):desc"Simpleglassofwater"rec
ruby - Ruby 进程如何限制其 CPU 使用率？ - 2
假设我希望Ruby进程使用的CPU不超过15%。是否可以？怎么办？最佳答案您可以尝试使用Process.setrlimit来自标准核心:Setstheresourcelimitoftheprocess.这看起来只是setrlimit的包装器来自C库，因此它可能仅在Unix-ish平台上可用。setrlimit不支持CPU百分比限制，但它支持以秒为单位限制CPU时间。如果您只是想让您的Ruby进程不占用整个CPU，那么您可以尝试使用Process.setpriority来调整它的优先级。这只是libc的setpriority的包装
ruby-on-rails - Ruby 改进和钩子(Hook) - 2
我正在尝试使用ruby改进来应用Rails钩子(Hook)。我想避免猴子补丁。当猴子修补时它会这样工作ActiveRecord::Base.class_evaldoafter_finddo#dosomethingwithmy_methodenddefmy_method#somethingusefulendend我已经能够通过做这样的事情来拥有类方法:moduleActiveRecordRefinementsrefineActiveRecord::Base.singleton_classdodefmy_method#somethingcoolendendend但我无法运行钩子(Hoo
ruby - Unicorn Rails - 在生产模式下启动时占用 100% CPU - 2
我们正在使用Unicorn_Rails+nginx。它在我的系统(4GBRam，Intel(R)Core(TM)2DuoCPUP8600@2.40GHz)的开发模式和生产模式下运行良好我能够在本地系统中启动10个worker，但在任何情况下都无法在生产中启动超过2个有时它可以工作，但需要等待15-20米启动unicorn_rails时一直占用99.6%的CPU英特尔(R)至强(R)CPUE5507@2.27GHz但它卡在亚马逊(m1.small实例)1.73GB内存我发现没有人在任何地方谈论使用unicorn_rails启动缓慢...... 最佳答案
ruby-on-rails - Rails、Minitest 和 Guard - 为什么 rb-fsevent 占用了超过 100% 的 CPU？ - 2
我在我的Rails应用程序中运行守卫，测试套件(最小的)最近停止正常工作。如果幸运的话，它会运行所有测试一次，也许两次。在那之后，即使是一个小的测试文件被更改也需要很长时间才能响应，以至于使用gem变得徒劳无功。在测试运行时跟随top，我可以看到有一个ruby进程持续占用了超过100%的CPU。即使所有测试都已运行并且我没有对文件进行任何更改。ruby进程是:/Users/Bodacious/.rvm/gems/ruby-2.0.0-p247@MyApp/gems/rb-fsevent-0.9.3/bin/fsevent_watch--latency0.1/Users/Bodaio
ruby - Sidekiq 可以利用多个 CPU 内核吗？ - 2
我是Sidekiq的新手，将它与AmazonEC2实例上的Ruby结合使用，以使用ImageMagick处理图像来完成一些工作。在运行它时，我意识到每个工作人员都在同一个核心上运行。我使用EC2c3.2xlarge机器，它们有8个内核。它显示CPU使用率为15%，但一个内核使用了100%，而其他内核使用了0%。Sidekiq可以为不同的worker使用不同的CPU内核吗？如果可以，这种低效率是由ImageMagic造成的吗？我怎样才能让它使用其他内核？最佳答案如果您想使用MRI使用多个内核，则需要启动多个Sidekiq进程；为您
ruby-on-rails - 了解为什么 ruby 进程在 100% CPU 时阻塞的方法 - 2
我们有一个大型Rails应用程序，几天后，我们的ruby进程似乎陷入循环并占用100%的CPU，直到乘客服务器死机并引发502错误。您知道找出原因的最佳方法吗？我已经尝试过NewRelic，但它只是性能方面的东西，而且我们的错误太多了，无法猜测问题出在哪里。(我们每天有很多请求和很多UTF-8BSON错误，因为我们使用的是UTF-8url)使用:Rails3.2.6和Ruby1.9.2p290乘客3.0.13MongoDB2.0.1和Mongoid2.4.11NginxFreeBSD8.2 最佳答案找出ruby卡住位置的简便方

目标检测算法——YOLOv5/YOLOv7改进之结合​PP-LCNet（轻量级CPU网络）

>>>深度学习Tricks，第一时间送达<<<

目录

​PP-LCNet——轻量级且超强悍的CPU级骨干网络！！

​PP-LCNet——轻量级且超强悍的CPU级骨干网络！！

（一）前沿介绍

🐱‍🏍先看一下小海带将YOLOv5​与PP-LCNet结合后的实验训练情况：还不错吧！

1.PP-LCNet主要模块

2.相关实验结果

（二）YOLOv5/YOLOv7改进之结合​PP-LCNet

1.配置common.py文件

2.配置yolo.py文件

3.配置yolov5/yolov7_​​PP-LC.yaml文件

🚀🏆🍀【算法创新&算法训练&论文投稿】相关链接👇👇👇

✨【YOLO创新算法尝新系列】✨

🏂 美团出品 | YOLOv6 v3.0 is Coming（超越YOLOv7、v8）

🏂 官方正品 | Ultralytics YOLOv8算法来啦（尖端SOTA模型）

🏂 改进YOLOv5/YOLOv7——魔改YOLOv5/YOLOv7提升检测精度（涨点必备）

————————————🌴【重磅干货来袭】🎄————————————

🚀一、主干网络改进（持续更新中）🎄🎈

1.目标检测算法——YOLOv5/YOLOv7改进之结合ConvNeXt结构（纯卷积|超越Swin）

2.目标检测算法——YOLOv5/YOLOv7改进之结合MobileOne结构（高性能骨干|仅需1ms）

3.目标检测算法——YOLOv5/YOLOv7改进之结合Swin Transformer V2（涨点神器）

4.目标检测算法——YOLOv5/YOLOv7改进结合BotNet（Transformer）

5.目标检测算法——YOLOv5/YOLOv7改进之GSConv+Slim Neck（优化成本）

6.目标检测算法——YOLOv5/YOLOv7改进结合新神经网络算子Involution（CVPR 2021）

7.目标检测算法——YOLOv7改进|增加小目标检测层

8.目标检测算法——YOLOv5改进|增加小目标检测层

🌴 持续更新中……

🚀二、轻量化网络（持续更新中）🎄🎈

1.目标检测算法——YOLOv5/YOLOv7改进之结合​RepVGG（速度飙升）

2.目标检测算法——YOLOv5/YOLOv7改进之结合​PP-LCNet（轻量级CPU网络）

3.目标检测算法——YOLOv5/YOLOv7改进之结合轻量化网络MobileNetV3（降参提速）

4.目标检测算法——YOLOv5/YOLOv7改进|结合轻量型网络ShuffleNetV2

5.目标检测算法——YOLOv5/YOLOv7改进结合轻量型Ghost模块

🌴 持续更新中……

🚀三、注意力机制（持续更新中）🎄🎈

1.目标检测算法——YOLOv5改进之结合CBAM注意力机制

2.目标检测算法——YOLOv7改进之结合CBAM注意力机制

3.目标检测算法——YOLOv5/YOLOv7之结合CA注意力机制

4.目标检测算法——YOLOv5/YOLOv7改进之结合ECA注意力机制

5.目标检测算法——YOLOv5/YOLOv7改进之结合NAMAttention（提升涨点）

6.目标检测算法——YOLOv5/YOLOv7改进之结合GAMAttention

7.目标检测算法——YOLOv5/YOLOv7改进之结合无参注意力SimAM（涨点神器）

8.目标检测算法——YOLOv5/YOLOv7改进之结合Criss-Cross Attention

9.​目标检测算法——YOLOv5/YOLOv7改进之结合​SOCA（单幅图像超分辨率）

🌴 持续更新中……

🚀四、检测头部改进（持续更新中）🎄🎈

1.魔改YOLOv5/v7高阶版（魔法搭配+创新组合）——改进之结合解耦头Decoupled_Detect

2.目标检测算法——YOLOv5/YOLOv7改进结合涨点Trick之ASFF（自适应空间特征融合）

🌴 持续更新中……

🚀五、空间金字塔池化（持续更新中）🎄🎈

1.目标检测算法——YOLOv5/YOLOv7改进之结合​ASPP（空洞空间卷积池化金字塔）

2.目标检测算法——YOLOv5/YOLOv7改进之结合特征提取网络RFBNet（涨点明显）

🌴 持续更新中……

🚀六、损失函数及NMS改进（持续更新中）🎄🎈

1.目标检测算法——YOLOv5/YOLOv7改进|将IOU Loss替换为EIOU Loss

2.目标检测算法——助力涨点 | YOLOv5改进结合Alpha-IoU

3.目标检测算法——YOLOv5/YOLOv7改进之结合SIoU

4.目标检测算法——YOLOv5将NMS替换为DIoU-NMS

🌴 持续更新中……

🚀七、其他创新改进项目（持续更新中）🎄🎈

1.手把手教你搭建属于自己的PyQt5-YOLOv5目标检测平台（保姆级教程）

2.YOLO算法改进之结合GradCAM可视化热力图（附详细教程）

3.目标检测算法——YOLOv5/YOLOv7改进之结合SPD-Conv（低分辨率图像和小目标涨点明显）

4.目标检测算法——YOLOv5/YOLOv7改进之更换FReLU激活函数

5.目标检测算法——YOLOv5/YOLOv7改进之结合BiFPN

🌴 持续更新中……

🚀八、算法训练相关项目（持续更新中）🎄🎈

1.目标检测算法——YOLOv7训练自己的数据集（保姆级教程）

2.人工智能前沿——玩转OpenAI语音机器人ChatGPT（中文版）

3.深度学习之语义分割算法（入门学习）

4.知识经验分享——YOLOv5-6.0训练出错及解决方法（RuntimeError）

5.目标检测算法——将xml格式转换为YOLOv5格式txt

6.目标检测算法——YOLOv5/YOLOv7如何改变bbox检测框的粗细大小

7.人工智能前沿——6款AI绘画生成工具

8.YOLOv5结合人体姿态估计

9.超越YOLOv5，0.7M超轻量，又好又快（PP-YOLOE&PP-PicoDet）

10.目标检测算法——收藏|小目标检测的定义（一）

11.目标检测算法——收藏|小目标检测难点分析（二）

目标检测算法——YOLOv5/YOLOv7改进之结合PP-LCNet（轻量级CPU网络）

PP-LCNet——轻量级且超强悍的CPU级骨干网络！！

PP-LCNet——轻量级且超强悍的CPU级骨干网络！！

🐱‍🏍先看一下小海带将YOLOv5与PP-LCNet结合后的实验训练情况：还不错吧！

（二）YOLOv5/YOLOv7改进之结合PP-LCNet

3.配置yolov5/yolov7_PP-LC.yaml文件

1.目标检测算法——YOLOv5/YOLOv7改进之结合RepVGG（速度飙升）

2.目标检测算法——YOLOv5/YOLOv7改进之结合PP-LCNet（轻量级CPU网络）

9.目标检测算法——YOLOv5/YOLOv7改进之结合SOCA（单幅图像超分辨率）

1.目标检测算法——YOLOv5/YOLOv7改进之结合ASPP（空洞空间卷积池化金字塔）