草庐IT

Tensorflow-gpu

全部标签

【Ubuntu】Ubuntu20.04安装GPU显卡驱动

一、安装显卡驱动方式一:图形界面安装等待安装即可方式二:命令行安装sudoapt-getinstallnvidia-driver-515有些显卡只支持455安装完成记得重启一下,然后验证一下:nvidia-smi若显示下图则说明安装成功~   二、安装CUDA下载地址:CUDAToolkit11.7Downloads|NVIDIADeveloper选择Linux->x86_64->Ubuntu->20.04->runfile(local)wgethttps://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/

iphone - 在 iPhone GPU 上解码视频帧

我正在寻找在iPhone上解码本地mpeg-4视频帧的最快方法。我只对每10帧中像素的亮度值感兴趣。我不需要在任何地方渲染视频。我尝试过ffmpeg、AVAssetReader、ImageAssetGenerator、OpenCV和MPMoviePlayer,但它们都太慢了。我可以获得的最快速度是~2x(一分钟扫描2分钟的视频)。我想要接近10倍的倍率。假设我上面的尝试没有使用GPU,是否有任何方法可以通过在GPU上运行的东西来实现我的目标?OpenGL似乎主要用于渲染输出,但我已经看到它用作传入视频的过滤器。也许这是一个选择?提前致谢! 最佳答案

ios - 在 iPhone 的 GPU( Metal )和 CPU(OpenCV)上处理摄像头馈送数据

我在iOS上以120fps的速度进行实时视频处理,我想先在GPU上预处理图像(在CPU上速度不够快的下采样、转换颜色等),然后使用OpenCV在CPU上对帧进行后处理。使用Metal在GPU和CPU之间共享摄像头信号的最快方法是什么?换句话说,管道看起来像:CMSampleBufferRef->MTLTextureorMTLBuffer->OpenCVMat我正在按以下方式转换CMSampleBufferRef->MTLTextureCVPixelBufferRefpixelBuffer=CMSampleBufferGetImageBuffer(sampleBuffer);//text

Tensorflow1 搭建Cuda11

前言Tensorflow1中默认支持cuda10及以下的,最高的版本Tensorflow1.15默认使用cuda10;但是一些高性能的显卡,比如A100、3090等,它们只支持Cuda11的,这就不太友善了,毕竟不少项目依赖Tensorflow1搭建的。本文整理2种方法,一种是基于Conda搭建的,一种是基于docker搭建的,都测试过可用的。目录一、基于Conda搭建Tensorflow1  Cuda111.1环境搭建1.2查看环境的库1.3验证环境二、基于docker搭建Tensorflow1  Cuda112.1环境搭建2.1  查看环境的库 1.3验证环境一、基于Conda搭建Tens

swift - 计算 GPU 上的彩色像素 - 理论

我有一张128x128像素的图片。它被分解成一个8x8的网格。每个网格block包含16x16像素。要求我想计算我的图像包含多少个黑色像素。直接的方式:我可以通过逐行、逐列、遍历整个图像并检查像素是否为黑色来做到这一点。GPU方式...但我想知道如果使用GPU,我可以将图像分解成block/block并计算每个block中的所有像素,然后对结果求和。例如:如果你看图片的左上角:第一个block“A1”(A行,第1列)包含一个16x16像素的网格,通过手动计算我知道有16个黑色像素。第二个block:'A2',(A行,第2列)包含一个16x16像素的网格,我通过手动计算知道有62个黑色像

ios - 内存写入性能 - GPU CPU 共享内存

我正在分配输入和输出MTLBuffer使用posix_memalign根据sharedGPU/CPUdocumentation由memkite提供。旁白:只使用最新的API比使用posix_memalign更容易letmetalBuffer=self.metalDevice.newBufferWithLength(byteCount,options:.StorageModeShared)我的内核函数对大约1600万个复值结构进行运算,并将相同数量的复值结构写入内存。我进行了一些实验,我的Metal内核“复杂数学部分”在0.003秒内执行(是!),但将结果写入缓冲区需要>0.05(否!)

已解决(不降低tensorflow版本解决导包报错)ModuleNotFoundError: No module named ‘tensorflow.contrib‘

已解决Wtensorflow/stream_executor/platform/default/dso_loader.cc:64]Couldnotloaddynamiclibrary‘cudart64_110.dll’;dlerror:cudart64_110.dllnotfoundItensorflow/stream_executor/cuda/cudart_stub.cc:29]IgnoreabovecudartdlerrorifyoudonothaveaGPUsetuponyourmachine.importtensorflow.contrib.layersaslayersModuleN

【windows10卸载并重新安装CUDA、cuDNN】,【TensorFlow-CUDA-cuDNN-GPU版本对应】,【cuDNN系统环境变量设置】

目录1、卸载之前的旧的或者不匹配的CUDA、cuDNN​​2、提前查电脑显卡支持的CUDA版本,便于后续下载对应的CUDA版本​​3、下载CUDA、cuDNN4、tensorflow和CUDA、cuDNN版本型号要匹配5、配置9条环境路径(默认安装可复制以下代码):6、检查安装的CUDA版本7、查询显卡算力1、卸载之前的旧的或者不匹配的CUDA、cuDNN图片来源:windows7下cuda9.0卸载、cuda8.0安装_shuiyuejihua的博客-CSDN博客2、提前查电脑显卡支持的CUDA版本,便于后续下载对应的CUDA版本来源:CUDA、CUDNN在windows下的安装及配置_m0

TensorFlow 2.9的零零碎碎(二)-读取MNIST数据集

目录MNIST是什么?tf.keras.datasets.mnisttf.keras.datasets.mnist.load_data()读取的是什么?load_data()函数的大体原理将读取的mnist数据集中的数据转为浮点数并归一化TensorFlow2.9的零零碎碎(二)-TensorFlow2.9的零零碎碎(六)都是围绕使用TensorFlow2.9在MNIST数据集上训练和评价模型来展开。Python环境3.8。代码调试都用的PyCharm。MNIST是什么?MNIST是手写数字数据集,由6万张训练图片和1万张测试图片构成的,每张图片都是28*28大小(如下图),这些图片是采集的不

图像风格快速迁移tensorflow实战

引言需要解决的问题是:利用tensorflow的快速风格迁移功能,把一张qq的logo图片转换成《星空》油画的风格,并打印输出。如图所示,最右边图像是输入结果,左边两图是输入: 一、操作步骤通过两天的学习,修了许多bug,踩了不少坑,终于把实验做成了。现在试着阐述相关的原理和具体操作步骤。这里我把整个实验过程分为4大部分,每个部分都会给出详细的操作步骤。A.软件的安装和配置B.风格迁移代码的理解和操作C.导入相关的库D.开始运行A.软件的安装和配置本次实验我们通过python语言来实现,所以首先需要安装python编程环境。为节省以后额外下载安装各种集成包和调用各种库的时间,建议直接安装Ana