草庐IT

Tensorflow-gpu

全部标签

docker - 如何在与主机内核和 GPU 驱动程序版本不同的 docker 镜像中运行 GPGPU

我有几台GPU的机器。我的想法是将它们附加到不同的docker实例,以便在CUDA(或OpenCL)计算中使用这些实例。我的目标是使用相当旧的Ubuntu和相当旧的AMD视频驱动程序(13.04)设置docker镜像。原因很简单:升级到较新版本的驱动程序会破坏我的OpenCL程序(由于错误的AMDlinux驱动程序)。所以问题来了。是否可以在带有新内核4.2和更新的AMD(fglrx)存储库中的驱动程序?附:我试过thisanswer(使用Nvidia卡),不幸的是,docker镜像中的deviceQuery没有看到任何CUDA设备(因为它发生在一些原始答案的评论者身上)......附

cuda - 使用 docker 容器中的 GPU?

我正在寻找一种在docker容器内使用GPU的方法。容器会执行任意代码,所以我不想使用特权模式。有什么建议吗?从之前的研究中,我了解到run-v和/或LXCcgroup是可行的方法,但我不确定如何完全实现这一点 最佳答案 Regan的回答很好,但它有点过时了,因为正确的方法是避免lxc执行上下文,因为Docker有droppedLXC作为docker0.9的默认执行上下文。相反,最好通过--device标志告诉docker有关nvidia设备的信息,并且只使用native执行上下文而不是lxc。环境这些说明在以下环境中进行了测试:U

python - 如何将数据读入 TensorFlow?

我正在尝试将数据从CSV文件读取到tensorflow,https://www.tensorflow.org/versions/r0.7/how_tos/reading_data/index.html#filenames-shuffling-and-epoch-limits官方文档中的示例代码是这样的:col1,col2,col3,col4,col5=tf.decode_csv(value,record_defaults=record_defaults)要读取文件,需要事先知道文件有多少列和多少行,如果有1000列,我需要定义1000个变量,如col1,col2,col3,col4,c

python - TensorFlow 用户应该更喜欢 SavedModel 而不是 Checkpoint 或 GraphDef?

来自SavedModelDocs,SavedModel,theuniversalserializationformatforTensorFlowmodels.和SavedModelwrapsaTensorFlowSaver.TheSaverisprimarilyusedtogeneratethevariablecheckpoints.据我了解,如果有人想使用TensorFlowServing,SavedModel是必须的。但是,我可以在没有SavedModel的情况下将Tensorflow模型部署到服务服务器:卡住图形并将其导出为GraphDef,然后使用ReadBinaryProto

c++ - 使用 C++ 进行高级 GPU 编程

关闭。这个问题不满足StackOverflowguidelines.它目前不接受答案。想改善这个问题吗?更新问题,使其成为on-topic对于堆栈溢出。5年前关闭。Improvethisquestion我一直在研究C++的库/扩展,这些库/扩展将允许在高层次上进行基于GPU的处理。我不是GPU编程方面的专家,也不想深入挖掘。我有一个由具有虚函数的类组成的神经网络。我需要一个基本上为我进行GPU分配的库-在高层次上。有一个人在名为GPU++的系统上写了一篇论文,该系统为您完成了大部分GPU工作。我在任何地方都找不到代码,只有他的论文。有没有人知道类似的库,或者有没有人有GPU++的代码?

解决from tensorflow.contrib import layers报错,No module named ‘tensorflow.contrib‘的问题

这个问题出现的时候,首先要检查自己安装的tensorflow包的版本,因为一般tensorflow大于2.0的版本已经不再支持contrib的应用。首先打开电脑命令行模式,输入pythonimporttensorflowastftf.__version__查看电脑tensorflow版本,如果版本大于2.0,这时候就衍生出两种解决方法 1:手动降低tensorflow的版本。首先在在AnacondaPrompt中输入:pipuninstalltensorflow卸载原有版本 tensorflow。然后输入pipinstalltensorflow==1.13.1解决问题。2:新版本tensorf

c++ - 我可以/应该在 GPU 上运行此统计应用程序的代码吗?

我正在开发一个在数组中包含大约10到3000万个浮点值的统计应用程序。几种方法在嵌套循环中对数组执行不同但独立的计算,例如:DictionarynoOfNumbers=newDictionary();for(floatx=0f;x当前应用程序是用C#编写的,在IntelCPU上运行,需要几个小时才能完成。我不了解GPU编程概念和API,所以我的问题是:是否有可能(并且有意义)利用GPU来加速此类计算?如果是:有谁知道任何教程或有任何示例代码(编程语言无关紧要)? 最佳答案 更新GPU版本__global__voidhash(floa

50.现有移动端开源框架及其特点—FeatherCNN与TensorFlow Lite

50.1FeatherCNNFeatherCNN是由腾讯AI平台部研发的基于ARM架构的高效CNN推理库,该项目支持Caffe模型,且具有高性能、易部署、轻量级三大特性。该项目具体特性如下:高性能:无论是在移动设备(iOS/Android),嵌入式设备(Linux)还是基于ARM的服务器(Linux)上,FeatherCNN均能发挥最先进的推理计算性能;易部署:FeatherCNN的所有内容都包含在一个代码库中,以消除第三方依赖关系。因此,它便于在移动平台上部署。FeatherCNN自身的模型格式与Caffe模型完全兼容。轻量级:编译后的FeatherCNN库的体积仅为数百KB。50.2Ten

python - 在 Tensorflow 中将张量转换为 numpy 数组?

在使用带有Python绑定(bind)的Tensorflow时如何将张量转换为numpy数组? 最佳答案 TensorFlow2.xEagerExecution默认启用,所以只需调用.numpy()在张量对象上。importtensorflowastfa=tf.constant([[1,2],[3,4]])b=tf.add(a,1)a.numpy()#array([[1,2],#[3,4]],dtype=int32)b.numpy()#array([[2,3],#[4,5]],dtype=int32)tf.multiply(a,b)

python - 在 TensorFlow 中,Session.run() 和 Tensor.eval() 有什么区别?

TensorFlow有两种方法来评估图的一部分:Session.run对变量列表和Tensor.eval。这两者有区别吗? 最佳答案 如果你有一个Tensort,调用t.eval()相当于调用tf.get_default_session().run(t)。您可以将session设置为默认值,如下所示:t=tf.constant(42.0)sess=tf.Session()withsess.as_default():#or`withsess:`tocloseonexitassertsessistf.get_default_sessio