草庐IT

Tensorflow-gpu

全部标签

python - 如何使用 sparse_softmax_cross_entropy_with_logits 在 tensorflow 中实现加权交叉熵损失

我开始使用tensorflow(来自Caffe),我正在使用损失sparse_softmax_cross_entropy_with_logits。该函数接受像0,1,...C-1这样的标签,而不是onehot编码。现在,我想根据类标签使用权重;我知道,如果我使用softmax_cross_entropy_with_logits(一个热编码),这可能可以通过矩阵乘法来完成,有没有办法用sparse_softmax_cross_entropy_with_logits做同样的事情? 最佳答案 importtensorflowastfimp

python - 将大型训练和测试文件流式传输到 Tensorflow 的 DNNClassifier

我有一个巨大的训练CSV文件(709M)和一个大型测试CSV文件(125M),我想在使用高级TensorflowAPI的上下文中将它们发送到DNNClassifier。似乎fit和evaluate接受的input_fn参数必须在内存中保存所有特征和标签数据,但我目前想要在我的本地机器上运行它,因此如果我将这些文件读入内存然后处理它们,预计它会很快耗尽内存。我浏览了streamed-readingofdata上的文档,但用于读取CSV的示例代码似乎是针对低级TensorflowAPI的。而且-如果您能原谅我的提示-对于将准备充分的训练和测试数据文件发送到Estimator的微不足道的用例

python - 为什么要使用 tensorflow gfile? (对于文件 I/O)

Tensorflow代码使用与Python内置方法不同的文件I/O方法。根据sourcecode,它的用途是"FileI/Owrapperswithoutthreadlocking"我不确定它在什么场合有用,什么时候不应该使用。有什么想法吗?谢谢 最佳答案 这条评论:FileI/Owrapperswithoutthreadlocking...对于TensorFlow的tf.gfile是一个特别没有帮助的描述模块!tf.gfile模块的主要作用是:提供接近Python的APIfile对象,和提供基于TensorFlow的实现C++Fi

python - Tensorflow Assign 要求两个张量的形状匹配。 lhs 形状= [20] rhs 形状= [48]

我是TensorFlow菜鸟。我已经从deeppose的开源实现中训练了一个TensorFlow模型,现在必须针对一组新图像运行该模型。该模型是在大小为100*100的图像上训练的,因此我已将新图像集的大小调整为相同大小。我有149个新图像来运行模型。当我运行模型时,出现以下错误。InvalidArgumentError(seeabovefortraceback):Assignrequiresshapesofbothtensorstomatch.lhsshape=[20]rhsshape=[48]在线saver=tf.train.Saver(tf.all_variables())我怀疑

python - 从 Python 导出 Tensorflow 图以在 C++ 中使用

究竟应该如何导出python模型以供在c++中使用?我正在尝试做与本教程类似的事情:https://www.tensorflow.org/versions/r0.8/tutorials/image_recognition/index.html我正在尝试在C++API中导入我自己的TF模型,而不是导入初始模型。我调整了输入大小和路径,但奇怪的错误不断出现。我花了一整天阅读stackoverflow和其他论坛,但无济于事。我尝试了两种导出图表的方法。方法一:元图。...loadinginputs,settingupthemodel,etc....sess=tf.InteractiveSes

python - 在 TensorFlow 中使用 LSTM-CGAN 生成 MNIST 数字

灵感来自thisarticle,我正在尝试构建一个条件GAN,它将使用LSTM生成MNIST数字。我希望我使用的架构与下图相同(鉴别器中的双向RNN除外,取自thispaper):当我运行这个模型时,我得到了非常奇怪的结果。这张图片显示了我的模型在每个纪元之后生成数字3。它应该看起来更像this.真的很糟糕。我的鉴别器网络的损失非常快地减少到接近于零。但是,我的生成器网络的损失围绕某个固定点振荡(可能发散缓慢)。我真的不知道发生了什么。这是我的代码中最重要的部分(完整代码here):timesteps=28X_dim=28Z_dim=100y_dim=10X=tf.placeholde

python - 为什么 TensorFlow 总是使用 GPU 0?

我在多GPU设置上运行TensorFlow推理时遇到了问题。环境:Python3.6.4;tensorflow1.8.0;中心7.3;2英伟达特斯拉P4这是系统空闲时nvidia-smi的输出:TueAug2810:47:422018+-----------------------------------------------------------------------------+|NVIDIA-SMI384.81DriverVersion:384.81||-------------------------------+----------------------+------

python - Tensorflow:如何将上一个时间步的输出作为输入传递到下一个时间步

这是这个问题HowcanIfeedlastoutputy(t-1)asinputforgeneratingy(t)intensorflowRNN?的副本我想将RNN在时间步T的输出作为时间步T+1的输入传递。input_RNN(T+1)=output_RNN(T)根据文档,tf.nn.rnn和tf.nn.dynamic_rnn函数明确地将完整输入带到所有时间步长。我检查了https://github.com/tensorflow/tensorflow/blob/master/tensorflow/python/ops/seq2seq.py上的seq2seq示例它使用循环并调用cell(

python - TensorFlow:从 RNN 获取所有状态

在TensorFlow中如何从tf.nn.rnn()或tf.nn.dynamic_rnn()获取所有隐藏状态?API仅提供最终状态。第一个替代方案是在构建直接在RNNCell上运行的模型时编写一个循环。但是,时间步数对我来说不是固定的,取决于传入的批处理。一些选项是使用GRU或编写我自己的RNNCell,将状态连接到输出。前者的选择不够通用,后者听起来太老套了。另一种选择是做类似theanswersinthisquestion的事情,从RNN获取所有变量。但是,我不确定如何在这里以标准方式将隐藏状态与其他变量分开。有没有一种很好的方法可以从RNN获取所有隐藏状态,同时仍然使用库提供的R

android - 为 TensorFlow 导出的 .pb 文件添加权重

我的项目使用Python在TensorFlow上训练MLP,然后我以这种方式导出图表和权重:tf.train.write_graph(sess.graph_def,"./","inp.txt",True)saver.save(sess,'variables/model.ckpt',global_step=1)现在,虽然可以使用这两个文件将其导入回Python,但似乎无法将其用于Android或C++,因为它无法导入检查点.ckpt。现在,我正在使用google提供的脚本freeze_graph.py通过执行以下操作将两个文件合二为一:bazel-bin/tensorflow/pytho