tf卡

python - 不同长度的 tf-idf 文档

我在网上搜索了关于在文档长度非常不同的情况下标准化tf等级的信息(例如，文档长度从500字到2500字不等)我发现的唯一规范化是关于在文档的长度中划分词频，因此导致文档的长度没有任何意义。虽然这种方法对于规范化tf.如果有的话，它会导致每个文档的tf等级有很大的偏差(除非所有文档都是从几乎相同的字典构建的，使用tf-idf时情况并非如此)例如，让我们拿2个文档-一个包含100个不同的词，另一个包含1000个不同的词。doc1中的每个单词的tf为0.01，而doc2中的每个单词的tf为0.001这会导致tf-idf等级在与doc1匹配的单词比与doc2匹配时自动变大有人对更合适的归一化公

python tf-idf strong 的 tfidf normalization textblob

python - 使用 tensorflow tf-transform 进行数据规范化

我正在使用Tensorflow对我自己的数据集进行神经网络预测。我做的第一个是在我的计算机中使用一个小数据集的模型。在此之后，我稍微更改了代码，以便使用具有更大数据集的GoogleCloudML-Engine在ML-Engine中实现训练和预测。我正在对Pandas数据框中的特征进行归一化，但这会引入偏斜，我得到的预测结果很差。我真正想要的是使用库tf-transform来规范化图中的数据。为此，我想创建一个函数preprocessing_fn并使用“tft.scale_to_0_1”。https://github.com/tensorflow/transform/blob/maste

tf-transform tensorflow transform code features python google-cloud-platform google-cloud-ml tensorflow-transform

python - 该代码片段在 tensorflow 代码中表示 "tf.logging.set_verbosity(tf.logging.INFO)"是什么意思？

我在很多tensorflow项目中看到了很多对这行代码的使用。这条线在tensorflow中有什么作用？最佳答案日志记录级别documentationpage基本上告诉你:如果您将其设置为显示的级别(INFO)，则TensorFlow会告诉您所有带有标签INFO(或更重要)的消息。假设您只对WARN或ERROR感兴趣，那么您可以类似地设置tf.logging.set_verbosity(tf.logging.WARN) 关于python-该代码片段在tensorflow代码中表示"t

logging 中表 section code python tensorflow machine-learning

python - 通过导出器和 tf.train.write_graph() 保存模型之间的 tensorflow 区别？

保存模型有什么区别使用tensorflowserving中指定的导出器:例如:fromtensorflow.contrib.session_bundleimportexporter#fromtensorflow_serving.session_bundleimportexportersaver=tf.train.Saver(sharded=True)model_exporter=exporter.Exporter(saver)model_exporter.init(sess.graph.as_graph_def(),named_graph_signatures={'inputs':ex

write_graph tensorflow exporter graph python protocol-buffers

python - 如何关闭 tf.contrib.learn Estimator 中的 events.out.tfevents 文件

在tensorflow.contrib.learn中使用estimator.Estimator时，在训练和预测之后，modeldir中有这些文件:p>检查点events.out.tfevents.1487956647events.out.tfevents.1487957016图表.pbtxtmodel.ckpt-101.data-00000-of-00001model.ckpt-101.indexmodel.ckpt-101.meta当图形复杂或变量数量大时，graph.pbtxt文件和事件文件可能会非常大。这是一种不写这些文件的方法吗？由于模型重新加载只需要检查点文件，因此删除它们不

Estimator tfevents section strong li python tensorflow

python - 有没有一种简单的方法可以在 tensorflow 中将 tf.data.Dataset.from_generator 中的特性与自定义 model_fn(Estimator) 结合使用

我正在为我的训练数据使用tensorflow数据集api，为tf.data.Dataset.from_generatorapi使用input_fn和生成器defgenerator():......yield{"x":features},labeldefinput_fn():ds=tf.data.Dataset.from_generator(generator,......)......feature,label=ds.make_one_shot_iterator().get_next()returnfeature,label然后我使用如下代码为我的Estimator创建了一个自定义mo

自定 from_generator code generator python tensorflow

python - 我如何判断 tf op 是否具有梯度？

我有兴趣在tensorflow中使用SparseTensor，但是，我经常得到LookupError:Nogradientdefinedforoperation...显然，对于稀疏张量的许多操作都没有定义梯度计算。在实际编写和运行我的代码之前，是否有任何简单的方法来检查操作是否具有梯度？最佳答案在tensorflow.python.framework.ops中有一个get_gradient_function函数。它接受一个操作并返回相应的梯度操作。示例:importtensorflowastffromtensorflow.pyt

python op section gradient get_gradient_function tensorflow autodiff

python - tf.keras.layers 和 tf.layers 有什么区别？

tf.keras.layers和tf.layers有什么区别？例如。他们都有Conv2d，他们提供不同的输出吗？如果将它们混合使用(例如一个隐藏层中的tf.keras.layers.Conv2d和下一个隐藏层中的tf.layers.max_pooling2d)有什么好处吗？最佳答案从TensorFlow1.12开始，tf.layers只是tf.keras.layers的包装器。几个例子:卷积tf.layers只是继承自卷积tf.keras.layers，见源码here:@tf_export('layers.Conv2D')cla

layers python code section tensorflow keras

python - Tensorflow - 如何为 tf.Estimator() CNN 使用 GPU 而不是 CPU

我认为它应该与withtf.device("/gpu:0")一起使用，但我应该把它放在哪里？我不认为它是:withtf.device("/gpu:0"):tf.app.run()那么我应该把它放在tf.app的main()函数中，还是放在我用于估算器的模型函数中？编辑:如果这有帮助，这是我的main()函数:defmain(unused_argv):"""Codetoloadtrainingfoldsdatapickleorgenerateoneifnotpresent"""#CreatetheEstimatormnist_classifier=tf.estimator.Estimat

何为 Tensorflow code 34 section python tensorflow-estimator

python - Tensorflow:如何找到 tf.data.Dataset API 对象的大小

我理解数据集API是一种迭代器，它不会将整个数据集加载到内存中，因此它无法找到数据集的大小。我说的是存储在文本文件或tfRecord文件中的大量数据的上下文。这些文件通常使用tf.data.TextLineDataset或类似的东西读取。使用tf.data.Dataset.from_tensor_slices可以轻松找到加载的数据集的大小。我询问数据集大小的原因如下:假设我的数据集大小是1000个元素。批量大小=50个元素。然后训练步骤/批处理(假设1个纪元)=20。在这20个步骤中，我想将我的学习率从0.1呈指数衰减到0.01作为tf.train.exponential_decay(

Tensorflow Dataset code section python tensorflow-datasets

2 3 456 7 8