草庐IT

CNN-Transformer

全部标签

【Keras计算机视觉】Faster R-CNN神经网络实现目标检测实战(附源码和数据集 超详细)

需要源码请点赞关注收藏后评论区留言私信~~~一、目标检测的概念目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域,通过计算机视觉减少对人力资本的消耗,具有重要的现实意义。因此,目标检测也就成为了近年来理论和应用的研究热点,它是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分,同时目标检测也是泛身份识别领域的一个基础性的算法,对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。目标检测的任务是找出图像中所有感兴趣的目标,并确定它们的位置和类别,由于各类物体有不同的形状,姿态,加上成像时受光照,遮挡等

毕业设计-基于深度学习的车辆实时检测与跟踪系统 YOLO 卷积神经网络 人工智能 CNN

目录前言课题背景和意义实现技术思路一、YOLOv5算法1.1YOLOv5算法特点1.2YOLOv5s的损失函数1.3注意力机制二、数据集建立和模型训练2.1模型训练2.2目标跟踪三、实验效果最后前言    📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。     🚀对毕设有任何疑问都可以问学长哦!     选题指导:    最新最

计算机竞赛 深度学习疫情社交安全距离检测算法 - python opencv cnn

文章目录0前言1课题背景2实现效果3相关技术3.1YOLOV43.2基于DeepSort算法的行人跟踪4最后0前言🔥优质竞赛项目系列,今天要分享的是🚩**基于深度学习疫情社交安全距离检测算法**该项目较为新颖,适合作为竞赛课题方向,学长非常推荐!🥇学长这里给一个题目综合评分(每项满分5分)难度系数:3分工作量:3分创新点:5分🧿更多资料,项目分享:https://gitee.com/dancheng-senior/postgraduate1课题背景安全的社交距离是公共预防传染病毒的途径之一。所以,在人群密集的区域进行社交距离的安全评估是十分重要的。社交距离的测量旨在保持个体之间的物理距离和减少

目标检测算法(R-CNN,fast R-CNN,faster R-CNN,yolo,SSD,yoloV2,yoloV3,yoloV4,yoloV5,yoloV6,yoloV7)

目标检测算法(R-CNN,fastR-CNN,fasterR-CNN,yolo,SSD,yoloV2,yoloV3,yoloV4,yoloV5,yoloV6,yoloV7)1.引言深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理。目标检测可以理解为是物体识别和物体定位的综合,不仅仅要识别出物体属于哪个分类,更重要的是得到物体在图片中的具体位置。为了完成这两个任务,目标检测模型分为两类。一类是two-stage,将物体识别和物体定位分为两个步骤,分别完成,这一类的典型代表是R-CNN,fastR-CNN,faster-RCNN家族。他们识别错误率低,漏识别

PROSTATEx-2 上前列腺癌的 3D CNN 分类

内容本文介绍了在多参数MRI序列上使用3DCNN对前列腺癌进行显着性或不显着性分类。内容如下:数据集描述Dicom到Nifti文件格式的转换不同MRI序列的联合配准

解决git clone或者pip install git+https://github.com/ruotianluo/meshed-memory-transformer.git出现的一系列问题

出现的错误:问题1.fatal:unabletoaccess'https://github.com/ruotianluo/meshed-memory-transformer.git/':Failedtoconnecttogithub.comport443after21020ms:Timedout error:unabletoreadsha1fileofm2transformer/data/example.py(d46c07fc2bb636146922425a46fbcbb2443407cf)问题2.Collectinggit+https://github.com/ruotianluo/mesh

Swin Transformer之Mask和相对位置编码代码详解

SwinTransformer的详细原理我已经在上一篇文章写过了,这回我来细细的写一篇它的代码原理。有朋友跟我反应Vit代码直接全贴上去光靠注释也不容易看懂,这会我用分总的方法介绍。注:此代码支持多尺度训练。文章仅供学习先从最难的下手。SW-MSA之maskdefcreate_mask(self,x,H,W):#第一部分:初始化Hp=int(np.ceil(H/self.window_size))*self.window_sizeWp=int(np.ceil(W/self.window_size))*self.window_sizeimg_mask=torch.zeros((1,Hp,Wp,1

【Transformer】iTransformer: INVERTED TRANSFORMERS ARE EFFECTIVE FOR TIME SERIES FORECASTING

#论文题目:ITRANSFORMER:INVERTEDTRANSFORMERSAREEFFECTIVEFORTIMESERIESFORECASTING#论文地址:https://arxiv.org/abs/2310.06625#论文源码开源地址:https://github.com/thuml/Time-Series-Library#论文所属会议:MachineLearning(cs.LG)#论文所属单位:清华大学、蚂蚁集团一、导读最近,来自清华大学和蚂蚁集团的研究人员重新审视Transformer结构在时序分析中的应用,提出一个全新的反转视角——无需修改任何模块,即可实现Transforme

【深度学习 | Transformer】释放注意力的力量:探索深度学习中的 变形金刚,一文带你读通各个模块 —— Multi-head Self-attention模块(二)

🤵‍♂️个人主页:@AI_magician📡主页地址:作者简介:CSDN内容合伙人,全栈领域优质创作者。👨‍💻景愿:旨在于能和更多的热爱计算机的伙伴一起成长!!🐱‍🏍🙋‍♂️声明:本人目前大学就读于大二,研究兴趣方向人工智能&硬件(虽然硬件还没开始玩,但一直很感兴趣!希望大佬带带)作者:计算机魔术师版本:1.0(2023.10.15)摘要:本系列旨在普及那些深度学习路上必经的核心概念,文章内容都是博主用心学习收集所写,欢迎大家三联支持!本系列会一直更新,核心概念系列会一直更新!欢迎大家订阅该文章收录专栏[✨—《深入解析机器学习:从原理到应用的全面指南》—✨]自注意力机制(Self-Attent

手搓卷积神经网络(CNN)进行手写数字识别(python)

前言:本文属于学习笔记性质。为了让自己更深入地理解卷积神经网络,我只用numpy、pandas等几个库手搓了一个识别MNIST数字的CNN。500张图单次训练,准确率70-80%。注意:1.代码并非原创,主要参考了下面的文章,我按自己的思路进行了一些改动。(29条消息)python神经网络案例——CNN卷积神经网络实现mnist手写体识别_pythoncnn_腾讯数据架构师的博客-CSDN博客2.可能有一些错误,欢迎批评指正。3.有些地方非常话痨,还请见谅。本网络的架构:输入28*28分辨率的图像,卷积层1包含8个5*5的卷积核,输出8张24*24的图像,池化层1进行2*2最大池化,输出8张1