草庐IT

TensorFlow-CUDA-cuDNN-GPU

全部标签

Jetson系列开发板/Linux安装OpenCV,编译CUDA模块,流程详解

一、前言本文主要介绍JetsonOringNano,JetsonNano,JetsonTX2这三块开发板上OpenCV的卸载安装及编译(支持CUDA模块);解决了一些出现的问题。二、卸载OpenCV如何查看本机安装的OpenCV是否支持CUDA?如果已安装jtop,可以直接使用jtop查看,命令如下。sudojtop按数字6查看INFO页面(某些开发板是7INFO),可以看到:*OpenCV: 4.1.1 compiledCUDA: NO从官网拉下来的OpenCV(已编译)是不支持CUDA加速的,无法充分利用GPU。如果未安装jtop,可以使用以下命令查看opencv库:pkg-config-

tensorflow.js 练习语音识别控制轮播图(十二)

示例const$=require('jquery');consttf=require('@tensorflow/tfjs');consttfvis=require('@tensorflow/tfjs-vis');constspeechCommands=require('@tensorflow-models/speech-commands');constMODEL_PATH='http://127.0.0.1:8080';lettransferRecognizer;letcurIndex=0;$(async()=>{//创建语音识别器constrecognizer=speechCommands.

用TensorFlow.js实现AI换脸 !所以你知道某些网站视频的明星是怎么来的了吗?

 前言相信很多小伙伴对TensorFlow.js早已有所耳闻,它是一个基于JavaScript的深度学习库,可以在Web浏览器中运行深度学习模型。AI换脸是一种基于深度学习的图像处理技术,将一张人脸照片的表情、头发、嘴唇等特征转移到另一张人脸照片上,从而实现换脸效果。本文将介绍如何使用TensorFlow.js实现AI换脸步骤1:准备工作在开始之前,需要确保已经安装了Node.js和npm。在终端中输入以下命令来验证:node-vnpm-v复制代码如果输出了相应的版本号,说明已经安装成功。接着,需要安装一些必要的依赖包。在终端中进入项目目录,输入以下命令来安装:npminstall@tenso

学习记录:Windows系统cuda11.6,安装pytorch1.12.0、python3.9

1、查看显卡相关信息:nvidia-smi。显卡版本531.18,最大可以安装cuda12.1版本,安装步骤上一篇博客讲解过。2、查看cuda版本:nvcc-V3、查看anaconda是否安装:conda-V4、查询cuda11.6对应的pytorch版本:https://pytorch.org/get-started/previous-versions/显示对应的pytorch1.12.0、1.12.1,接着查询适合的python版本3.7、3.8、3.9、3.105、创建环境,安装pytorch1.12.0、python3.9condacreate-nlearnpython==3.9con

【Stable Diffusion/NovelAI Diffusion的AMD GPU加速推理探索】

测试机子配置:1:AMDRX6600(显存8g)+i512600KF16g内存(台式机)2:RTX3070laptop(显存8g)+i710870H32g内存(HP暗夜精灵笔记本)两台电脑平均性能差不多,当然N卡肯定更好一点这边我们还是MS大发好,用MS的DirectML推理框架推理,虽然据小道消息反馈DML推理效率远不如Cuda,但是要知道DirectML的兼容性好啊,除了Vulkan之外就只有DML能用了,但是Vulkan没有独立的ML推理模块,目前只有一个ncnn比较亲民,最近看上MNN好像也不错这边推理主要依赖DirectMLprovider的onnx推理已经可以了,目前用fp16精度

swift - Metal 内核在新款 MacBook Pro(2016 年末)GPU 上无法正常运行

我正在研究使用Swift和Metal在GPU上进行图像处理的macOS项目。上周,我收到了我的新15英寸MacBookPro(2016年末)并注意到我的代码有些奇怪:应该写入纹理的内核似乎没有这样做......经过大量挖掘,我发现问题与Metal(AMDRadeonPro455或Intel(R)HDGraphics530)使用哪个GPU进行计算有关。使用MTLCopyAllDevices()初始化MTLDevice返回代表Radeon和IntelGPU的设备数组(而MTLCreateSystemDefaultDevice()返回默认设备是Radeon)。在任何情况下,代码在IntelG

RuntimeError: CUDA out of memory 已解决

先说下我的电脑环境:win103060titorch10python3.8cuda11.3RuntimeError:CUDAoutofmemory.Triedtoallocate128.00MiB(GPU0;23.70GiBtotalcapacity;7.44GiBalreadyallocated;87.88MiBfree;7.71GiBreservedintotalbyPyTorch)Ifreservedmemoryis>>allocatedmemorytrysettingmax_split_size_mbtoavoidfragmentation.SeedocumentationforMem

ios - 我可以使用 Metal 在 GPU 上运行算法吗?

我使用最小编辑距离算法来确定两个字符串的相关程度。我已经将它实现为在CPU上运行,并且当您有数百个字符串时它工作得很好,但是当您多次比较数千个字符串时它会降低速度。所以我认为将负载卸载到GPU上可能会有用,因为它可以一次执行多个比较。这可能吗?我遇到的Metal资源主要用于没有帮助的图形。或者他们可能是? 最佳答案 您想要做的事情是可能的,至少对于某些问题规模而言是这样,但这并不是特别简单。您需要做的是以一种可以在GPU和iOS上运行的方式表达算法,这可能意味着使用Metal。具体来说,您需要使用实现最小编辑距离算法的Metal着色

cuda、cudnn、英伟达驱动版本对应关系

根据显卡型号、cuda版本确定英伟达驱动版本能够支持某一型号的GPU的英伟达驱动是一定的,我们想使用的tensorflow版本也是已知的,该tensorflow版本依赖的cuda版本也是一定的。所以根据显卡型号和cuda版本可以确定显卡驱动。参考链接:https://www.jianshu.com/p/7f6ae178121chttps://blog.csdn.net/weixin_42545878/article/details/94735192英伟达驱动、cuda、cudnn之间版本的对应关系:https://docs.nvidia.com/cuda/cuda-toolkit-releas

每秒40亿亿次!俄罗斯最强AI超算上线:中国GPU?

俄罗斯虽然遭到了前所未有的封锁和限制,但从未放弃。莫斯科国立大学(MSU)就上线了最新的超级计算机“MSU-270”,AI计算性能高达400PFlops(40亿亿次浮点计算每秒)。关于这台超算的配置,MSU披露的很少,只说配备了大约100块“最新的图形加速器”,并在供电、散热、通信方面采用了全新的设计。俄罗斯并没有自己的高端计算GPU,大概率来自外部供应,但是NVIDIA、AMD、Intel都不能向俄罗斯出口此类产品,外媒就想到了中国厂商,比如一度号称比肩NVIDIA的壁仞科技。在此之前,MSU使用的GPU加速器都来自NVIDIA。MSU-27040亿亿次计算的性能单指AI方向,也就是FP16