草庐IT

Tensorflow-gpu

全部标签

android - 如何提高 iOS 上 Tensorflow 相机演示的准确性以进行再训练图

我有一个基于TensorflowAndroid演示建模的Android应用,用于对图像进行分类,https://github.com/tensorflow/tensorflow/tree/master/tensorflow/examples/android原始应用程序使用tensorflow图(.pb)文件对来自Inceptionv3的一组通用图像进行分类(我认为)然后我按照TensorflowforPoets博客中的说明为自己的图像训练了自己的图表,https://petewarden.com/2016/02/28/tensorflow-for-poets/在更改设置后,这在Andr

Android:为什么快照和gpu是互斥的?

我尝试对模拟器使用快照和gpu支持。但是模拟器拒绝启动:emulator:ERROR:Snapshotsandgpuaremutuallyexclusiveatthispoint.Pleaseturnoneofthemoff,andrestarttheemulator.我想知道这些限制的原因是什么?在我看来,这不是合乎逻辑的冲突。 最佳答案 Android模拟器基于QEMU,它必须模拟各种硬件设备,就像在真手机上运行的Android一样。具体来说,它模拟了一个名为“金鱼”的神话电话。保存快照时,设备RAM必须保存在快照中。但是,这不

android - 运行 Android 应用程序时出错 - 无法初始化 OpenglES 仿真,请使用 '-gpu off' 禁用它

我是安卓编程新手。我指的是谷歌开发者网站来学习安卓。在运行应用程序UI时,我遇到了这些错误。H:\SDK\tools\emulator.exe-avdNexus_5_API_21_x86-netspeedfull-netdelaynoneemulator:ERROR:CouldnotinitializeOpenglESemulation,use'-gpuoff'todisableit.couldnotgetwglGetExtensionsStringARBcouldnotgetwglGetExtensionsStringARBcouldnotgetwglGetExtensionsStr

Android Studio,运行模拟器时突然出现 GPU 驱动程序问题

我有一台笔记本电脑,主要用于androidstudio上的android开发,今天我运行模拟器时突然收到此错误消息(或它的过时版本)YourGPUdriverinformation:GPU#1Make:8086Model:Intel(R)HDGraphicsFamilyDeviceID:0a16Driverversion:10.18.10.3945GPU#2Make:10deModel:NVIDIAGeForce820MDeviceID:1140Driverversion:22.21.13.8476Someusershaveexperiencedemulatorstabilityiss

memory - 在 TensorFlow 中的 GPU 之间平均分配 RNN 内存消耗

我正在尝试找出最具战略意义的方法,以在两个GPU之间平均分配seq2seq网络的内存负载。使用卷积网络,任务要容易得多。但是,我试图弄清楚如何最大化2TitanX的内存使用率。目标是构建24GB内存组合所允许的最大网络。一个想法是将每个RNN层放置在单独的GPU中。GPU1-->RNNLayer1&BackwardPassGPU2-->RNNLayer2,3,4但是,反向传播计算需要大量内存。因此,另一个想法是在一个GPU上进行整个正向传递,在单独的GPU上进行反向传递。GPU1-->ForwardPassGPU2-->BackwardPass(不过,GPU2仍然占据了大部分内存负载)

python - tensorflow : Ran out of memory trying to allocate

我正在运行TensorFlow版本0.7.1,支持64位GPU,使用pip安装,并且在装有Ubuntu14.04的PC上运行。我的问题是在构建网络时TensorFlow内存不足,即使根据我的计算,我的GPU上应该有足够的空间。下面是我的代码的最小示例,它基于TensorFlowMNIST教程。该网络是一个两层全连接网络,隐藏层的节点数由变量n定义。训练小批量的大小为1。这是我的代码:n=23000mnist=read_data_sets('MINST_Data',one_hot=True)session=tf.InteractiveSession()x=tf.placeholder(t

memory - GPU PoolAllocator 爆 CPU 内存

我用相对常见的操作(除了几个tf.where和索引处理)创建了一个tensorflow模型,但是用非常不同的不同输入形状调用它(模型中有许多未定义的张量形状)。在CPU上一切正常。但是当您使用GPU时,RAM使用量(不是GPU内存,CPU内存)稳步增加,以填满机器的256GB并自行终止。在此过程中,我收到了通常的消息:2017-03-1716:42:22.366601:Itensorflow/core/common_runtime/gpu/pool_allocator.cc:247]PoolAllocator:After18347getrequests,put_count=18345e

python - TensorFlow 的内存泄漏

我在使用TensorFlow时出现内存泄漏。我引用了Tensorflow:MemoryleakevenwhileclosingSession?为了解决我的问题,我遵循了答案的建议,这似乎已经解决了问题。但是,它在这里不起作用。为了重现内存泄漏,我创建了一个简单的示例。首先,我使用这个函数(我在这里得到:HowtogetcurrentCPUandRAMusageinPython?)来检查python进程的内存使用:defmemory():importosimportpsutilpid=os.getpid()py=psutil.Process(pid)memoryUse=py.memory

optimization - 减少 CPU 到 GPU 数据传输延迟的技术

我一直在寻找减少CPU和GPU来回传输数据所导致的延迟的方法。当我第一次开始使用CUDA时,我确实注意到CPU和GPU之间的数据传输确实需要几秒钟,但我并不在意,因为这对于我正在编写的小程序来说并不是真正的问题。事实上,对于绝大多数使用GPU的程序(包括视频游戏)来说,延迟可能不是什么大问题,因为它们仍然比在CPU上运行要快得多。但是,我是一个HPC爱好者,当我看到Tianhe-I的理论峰值FLOPS与实际LINPACK测量的性能之间存在巨大差异时,我开始关注我的研究方向。这引起了我对自己是否走在正确的职业道路上的担忧。通过使用cudaHostAlloc()函数使用固定内存(页面锁定)

memory - Keras 在调用 train_on_batch、fit 等时使用过多的 GPU 内存

我一直在搞Keras,到目前为止我喜欢它。在处理相当深的网络时,我遇到了一个大问题:在调用model.train_on_batch或model.fit等时,Keras分配的GPU内存明显多于模型本身所需的内存。这不是因为尝试在一些非常大的图像上训练造成的,而是网络模型本身似乎需要大量GPU内存。我创建了这个玩具示例来说明我的意思。这基本上是发生了什么:我首先创建了一个相当深的网络,并使用model.summary()获取网络所需的参数总数(在本例中为206538153,相当于大约826MB)。然后我使用nvidia-smi来查看Keras分配了多少GPU内存,我可以看到它非常有意义(8