GPU

python - 带有 Tensorflow 后端的 Keras 是否可以随意强制使用 CPU 或 GPU？

我安装了带有Tensorflow后端和CUDA的Keras。我有时想按需强制Keras使用CPU。不用说在虚拟环境中安装单独的仅CPU的Tensorflow就可以做到这一点吗？如果有怎么办？如果后端是Theano，则可以设置标志，但我还没有听说过可以通过Keras访问的Tensorflow标志。最佳答案如果你想强制Keras使用CPU方式1importosos.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID"#seeissue#152os.environ["CUDA_VISIBLE_DEVICE

Tensorflow 端的 section keras python machine-learning

python - 如何在 tensorflow 中获取当前可用的 GPU？

我有一个使用分布式TensorFlow的计划，我看到TensorFlow可以使用GPU进行训练和测试。在集群环境中，每台机器可能有0个或1个或更多GPU，我想在尽可能多的机器上将我的TensorFlow图运行到GPU中。我发现在运行tf.Session()时，TensorFlow会在日志消息中提供有关GPU的信息，如下所示:Itensorflow/core/common_runtime/gpu/gpu_init.cc:126]DMA:0Itensorflow/core/common_runtime/gpu/gpu_init.cc:136]0:YItensorflow/core/comm

何在 tensorflow code device python gpu

Java GPU 编程

关闭。这个问题需要更多focused.它目前不接受答案。想要改进这个问题吗？更新问题，使其只关注一个问题editingthispost.关闭4年前。Improvethisquestion是否可以在Java中进行GPU编程？我的意思是不使用native库。当我们切换到gpu时，可以期待多少性能提升？编辑:我不是在看游戏编程，我想做的是硬核数字运算。最佳答案支持。Java3D、LWJGL和JOGL支持GLSL(OpenGL着色语言)。编辑:如果您想在GPU上进行平台中立的通用计算，您可以使用OpenCL。尽管功能集和执行环境千差万别

Java GPU section stackoverflow noreferrer performance

docker - 带有 TensorFlow 后端的 Keras 不使用 GPU

我构建了docker镜像的gpu版本https://github.com/floydhub/dl-docker使用keras版本2.0.0和tensorflow版本0.12.1。然后我运行了mnist教程https://github.com/fchollet/keras/blob/master/examples/mnist_cnn.py但意识到keras没有使用GPU。以下是我的输出root@b79b8a57fb1f:~/sharedfolder#pythontest.pyUsingTensorFlowbackend.Downloadingdatafromhttps://s3.amaz

TensorFlow 端的 code docker keras

docker - 如何在与主机内核和 GPU 驱动程序版本不同的 docker 镜像中运行 GPGPU

我有几台GPU的机器。我的想法是将它们附加到不同的docker实例，以便在CUDA(或OpenCL)计算中使用这些实例。我的目标是使用相当旧的Ubuntu和相当旧的AMD视频驱动程序(13.04)设置docker镜像。原因很简单:升级到较新版本的驱动程序会破坏我的OpenCL程序(由于错误的AMDlinux驱动程序)。所以问题来了。是否可以在带有新内核4.2和更新的AMD(fglrx)存储库中的驱动程序？附:我试过thisanswer(使用Nvidia卡)，不幸的是，docker镜像中的deviceQuery没有看到任何CUDA设备(因为它发生在一些原始答案的评论者身上)......附

中运 docker section 驱动 gpu gpgpu

cuda - 使用 docker 容器中的 GPU？

我正在寻找一种在docker容器内使用GPU的方法。容器会执行任意代码，所以我不想使用特权模式。有什么建议吗？从之前的研究中，我了解到run-v和/或LXCcgroup是可行的方法，但我不确定如何完全实现这一点最佳答案 Regan的回答很好，但它有点过时了，因为正确的方法是避免lxc执行上下文，因为Docker有droppedLXC作为docker0.9的默认执行上下文。相反，最好通过--device标志告诉docker有关nvidia设备的信息，并且只使用native执行上下文而不是lxc。环境这些说明在以下环境中进行了测试:U

容器 docker nvidia code cuda

c++ - 使用 C++ 进行高级 GPU 编程

关闭。这个问题不满足StackOverflowguidelines.它目前不接受答案。想改善这个问题吗？更新问题，使其成为on-topic对于堆栈溢出。5年前关闭。Improvethisquestion我一直在研究C++的库/扩展，这些库/扩展将允许在高层次上进行基于GPU的处理。我不是GPU编程方面的专家，也不想深入挖掘。我有一个由具有虚函数的类组成的神经网络。我需要一个基本上为我进行GPU分配的库-在高层次上。有一个人在名为GPU++的系统上写了一篇论文，该系统为您完成了大部分GPU工作。我在任何地方都找不到代码，只有他的论文。有没有人知道类似的库，或者有没有人有GPU++的代码？

amp 43 br section noreferrer c++cuda gpu

c++ - 我可以/应该在 GPU 上运行此统计应用程序的代码吗？

我正在开发一个在数组中包含大约10到3000万个浮点值的统计应用程序。几种方法在嵌套循环中对数组执行不同但独立的计算，例如:DictionarynoOfNumbers=newDictionary();for(floatx=0f;x当前应用程序是用C#编写的，在IntelCPU上运行，需要几个小时才能完成。我不了解GPU编程概念和API，所以我的问题是:是否有可能(并且有意义)利用GPU来加速此类计算？如果是:有谁知道任何教程或有任何示例代码(编程语言无关紧要)？最佳答案更新GPU版本__global__voidhash(floa

amp 43 code float int c++c cuda parallel-processing gpu

c++ - CUDA global 函数中的 printf

我目前正在GPU上编写矩阵乘法并想调试我的代码，但由于我不能在设备函数中使用printf，所以我可以做些什么来查看该函数内部发生了什么。这是我当前的功能:__global__voidMatrixMulKernel(MatrixAd,MatrixBd,MatrixXd){inttx=threadIdx.x;intty=threadIdx.y;intbx=blockIdx.x;intby=blockIdx.y;floatsum=0;for(intk=0;k我很想知道Ad和Bd是不是我想的那样，看看是否真的调用了那个函数。最佳答案 CU

amp global section width elements c++c cuda gpu

c++ - CUDA global 函数中的 printf

amp global section width elements c++c cuda gpu

97 98 99100101 102 103