草庐IT

CV-Pytorch

全部标签

【CV】稳定扩散模型(Stable Diffusion)

  🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃🎁欢迎各位→点赞👍+收藏⭐️+留言📝​📣系列专栏-机器学习【ML】 自然语言处理【NLP】 深度学习【DL】​​ 🖍foreword✔说明⇢本人讲解主要包括Python、机器学习(ML)、深度学习(DL)、自然语言处理(NLP)等内容。如果你对这个系列感兴趣的话,可以关注订阅哟👋文章目录添加控制:条件扩散模型准备数据训练模型采样提高效率:潜在扩散稳定扩散:深度组件文本编码器Classifier-freeguidanceVAETheUNet将它们放

基于深度学习的高精度80类动物目标检测系统(PyTorch+Pyside6+YOLOv5模型)

摘要:基于深度学习的高精度80类动物目标检测识别系统可用于日常生活中或野外来检测与定位80类动物目标,利用深度学习算法可实现图片、视频、摄像头等方式的80类动物目标检测识别,另外支持结果可视化与图片或视频检测结果的导出。本系统采用YOLOv5目标检测模型训练数据集,使用Pysdie6库来搭建页面展示系统,同时支持ONNX、PT等模型作为权重模型的输出。本系统支持的功能包括动物目标训练模型的导入、初始化;置信分与IOU阈值的调节、图像上传、检测、可视化结果展示、结果导出与结束检测;视频的上传、检测、可视化结果展示、结果导出与结束检测;摄像头的上传、检测、可视化结果展示与结束检测;已检测目标列表、

pytorch中的矩阵乘法操作:torch.mm(), torch.bmm(), torch.mul()和*, torch.dot(), torch.mv(), @, torch.matmul()

😄无聊整理下torch里的张量的各种乘法相关操作。文章目录0、简单提一下广播法则的定义:1、torch.mm()2、torch.bmm()3、torch.mul()和*4、torch.dot()5、torch.mv()6、@7、torch.matmul()0、简单提一下广播法则的定义:1、让所有输入张量都向其中shape最长的矩阵看齐,shape不足的部分在前面加1补齐。2、两个张量的维度要么在某一个维度一致,若不一致其中一个维度为1也可广播。否则不能广播。【如两个维度:(4,1,4)和(2,1)可以广播,因为他们不相等的维度其中一个为1就可以广播了。】1、torch.mm()-只适合于二维张

opencv(15) 图像平滑处理之二:cv2.GaussianBlur()高斯滤波

1高斯滤波原理高斯滤波是一种线性平滑滤波,适用于消除高斯噪声,广泛应用于图像处理的减噪过程。高斯模板是通过对二维高斯函数进行采样(高斯模糊的卷积核里的数值满足高斯分布)、量化并归一化得到的,它考虑了邻域像素位置的影响,距离当前被平滑像素越近的点,加权系数越大,将加权平均值作为中心像素的输出结果。加权的目的在于减轻平滑过程中造成的图像模糊高斯模糊对于从图像中去除高斯噪声非常有效高斯滤波常用的一个3×3模板2函数说明函数原型:dst=GaussianBlur(src,ksize,sigmaX[,dst[,sigmaY[,borderType]]])参数:src:输入图像;图像可以具有任意数量的通道

ios - 将 UIImage 转换为 OpenCV 中的 cv::Mat 问题

我正在尝试将UIImage转换为cv::Mat,以便我可以在其上使用LineIteratorOpenCV类。我在这里使用opencv文档提供的代码,特别是该页面上的cvMatGrayFromUIImage。我在我编写的函数中使用了这段代码,然后在我的swift文件中调用了它。但是,当我尝试打印cv::Mat图像时,数组中的数字不能准确反射(reflect)输入图像的灰度。我把数组放到Matlab中,调用imagesc函数,看看是不是真的是灰度图。这是我在OpenCVWrapper.mm中使用的代码-(void)getPixelIntensity:(UIImage*)image{//Tr

LeetCode 周赛 336,多少人直接 CV?

大家好,我是小彭。今天早上是LeetCode第336场周赛,你参加了吗?这场周赛整体质量比较高,但是最后一题是老题,CV能过。但是输入数据范围被降低了,这操作也是没谁了。2587.统计范围内的元音字符串数(Easy)题目地址https://leetcode.cn/problems/count-the-number-of-vowel-strings-in-range/题目描述给你一个下标从0开始的字符串数组words和两个整数:left和right。如果字符串以元音字母开头并以元音字母结尾,那么该字符串就是一个元音字符串,其中元音字母是'a'、'e'、'i'、'o'、'u'。返回words[i]

安装GPU版本Pytorch(全网最详细过程)

目录一、前言二、安装CUDA三、安装cuDNN  四、安装Anacanda五、安装pytorch六、总结一、前言  最近因为需要安装GPU版本的Pytorch,所以自己在安装过程中也是想着写一篇博客,把整个过程记录下来,在整个过程中也遇到了不少的问题,查看了以往别人的一些解决方案,希望能够给遇到同样问题的提供一些参考。  如果大家在安装pytorch的时候,并不需要安装gpu版本的,即使用cpu进行训练的pytorch,那么直接在AanacondaPrompt当中输入以下命令即可:pipinstallpytorch  如果是想要安装gpu版本的pytorch,则需要参考以下几个步骤。二、安装C

opencv error: (-215:Assertion failed) size.width>0 && size.height>0 in function ‘cv::imshow‘

(opencverror:(-215:Assertionfailed)size.width>0&&size.height>0infunction‘cv::imshow’)问题:因为读入图片的宽和高至少有一个不大于0。可以说就是没有读入图片原因分析:路径出错或没有图片1.路径里面有中文,opencv-python不支持直接读取中文路径,把图片路径改成英文或把图片换一个路径就行。如果需要改成中文路径的话可以参考【opencv】实现中文路径的读取2.路径格式错误importcv2#读入图像img=cv2.imread('D:\Python\opencv-python\Lib\Lena.jpg',1)

Grad-CAM的详细介绍和Pytorch代码实现

Grad-CAM(Gradient-weightedClassActivationMapping)是一种可视化深度神经网络中哪些部分对于预测结果贡献最大的技术。它能够定位到特定的图像区域,从而使得神经网络的决策过程更加可解释和可视化。Grad-CAM的基本思想是,在神经网络中,最后一个卷积层的输出特征图对于分类结果的影响最大,因此我们可以通过对最后一个卷积层的梯度进行全局平均池化来计算每个通道的权重。这些权重可以用来加权特征图,生成一个ClassActivationMap(CAM),其中每个像素都代表了该像素区域对于分类结果的重要性。相比于传统的CAM方法,Grad-CAM能够处理任意种类的神

ios - 使用 Core Image 在 Swift 中复制 cv::warpAffine

我正在尝试使用CoreImage完全在Swift中复制面部对齐算法。但是,我已经无法尝试在Swift中从opencv复制一个简单的warpAffinePython代码:print(M)#Misamatrixcalculatedusingsomefacedetectioncodeprint("lettransform=CGAffineTransform(a:{0[0][0]},b:{0[1][0]},c:{0[0][1]},d:{0[1][1]},tx:{0[0][2]},ty:{0[1][2]})".format(M))warped=cv2.warpAffine(img,M,(imag