草庐IT

scikit-tensor

全部标签

python - 使用 scikit-learn 分类到多个类别

我正在尝试使用scikit-learn的一种监督学习方法将文本片段分类为一个或多个类别。我尝试过的所有算法的预测函数都只返回一个匹配项。比如我有一段文字:"TheatersinNewYorkcomparedtothoseinLondon"我已经训练算法为我输入的每个文本片段选择一个位置。在上面的示例中,我希望它返回NewYork和London,但它只返回NewYork。是否可以使用scikit-learn返回多个结果?或者甚至返回具有下一个最高概率的标签?感谢您的帮助。---更新我尝试使用OneVsRestClassifier,但我仍然只能获得每条文本的一个选项。下面是我正在使用的示例

python - 在 scikit-learn LinearRegression 中查找 p 值(显着性)

如何找到每个系数的p值(显着性)?lm=sklearn.linear_model.LinearRegression()lm.fit(x,y) 最佳答案 这有点矫枉过正,但让我们试一试。首先让我们使用statsmodel找出p值应该是什么importpandasaspdimportnumpyasnpfromsklearnimportdatasets,linear_modelfromsklearn.linear_modelimportLinearRegressionimportstatsmodels.apiassmfromscipyim

python - 在 TensorFlow 中,Session.run() 和 Tensor.eval() 有什么区别?

TensorFlow有两种方法来评估图的一部分:Session.run对变量列表和Tensor.eval。这两者有区别吗? 最佳答案 如果你有一个Tensort,调用t.eval()相当于调用tf.get_default_session().run(t)。您可以将session设置为默认值,如下所示:t=tf.constant(42.0)sess=tf.Session()withsess.as_default():#or`withsess:`tocloseonexitassertsessistf.get_default_sessio

python—Tensor(张量)的含义,创建

Tensor含义张量(Tensor):是一个多维数组,它是标量、向量、矩阵的高维拓展。创建非随机创建1.用数组创建将数组转化为tensornp.ones([a,b])全为1#首先导入PyTorchimporttorch#数组创建importnumpyasnpa=np.array([2,3.3])#维度为一的矩阵torch.from_numpy(a)#转化为tensor#out:tensor([2.0000,3.3000],dtype=torch.float64)a=np.ones([2,3])#2行3列全为1torch.from_numpy(a)'''outtensor([[1.,1.,1.]

python - 如何查看安装了哪个版本的nltk、scikit learn?

在shell脚本中,我正在检查是否安装了此软件包,如果未安装则安装它。所以使用shell脚本:importnltkechonltk.__version__但它会在import行停止shell脚本在linux终端尝试用这种方式查看:whichnltk这并没有让人觉得它已经安装了。有没有其他方法可以在shell脚本中验证这个包安装,如果没有安装,也安装它。 最佳答案 importnltk是Python语法,因此在shell脚本中不起作用。要测试nltk和scikit_learn的版本,您可以编写一个Python脚本并运行它。这样的脚本可

python - 如何查看安装了哪个版本的nltk、scikit learn?

在shell脚本中,我正在检查是否安装了此软件包,如果未安装则安装它。所以使用shell脚本:importnltkechonltk.__version__但它会在import行停止shell脚本在linux终端尝试用这种方式查看:whichnltk这并没有让人觉得它已经安装了。有没有其他方法可以在shell脚本中验证这个包安装,如果没有安装,也安装它。 最佳答案 importnltk是Python语法,因此在shell脚本中不起作用。要测试nltk和scikit_learn的版本,您可以编写一个Python脚本并运行它。这样的脚本可

python - 在 scikit-learn 中将分类器保存到磁盘

如何将经过训练的朴素贝叶斯分类器保存到磁盘并用它来预测数据?我有以下来自scikit-learn网站的示例程序:fromsklearnimportdatasetsiris=datasets.load_iris()fromsklearn.naive_bayesimportGaussianNBgnb=GaussianNB()y_pred=gnb.fit(iris.data,iris.target).predict(iris.data)print"Numberofmislabeledpoints:%d"%(iris.target!=y_pred).sum() 最佳

python - 在 scikit-learn 中将分类器保存到磁盘

如何将经过训练的朴素贝叶斯分类器保存到磁盘并用它来预测数据?我有以下来自scikit-learn网站的示例程序:fromsklearnimportdatasetsiris=datasets.load_iris()fromsklearn.naive_bayesimportGaussianNBgnb=GaussianNB()y_pred=gnb.fit(iris.data,iris.target).predict(iris.data)print"Numberofmislabeledpoints:%d"%(iris.target!=y_pred).sum() 最佳

python - scikit-learn 中跨多个列的标签编码

我正在尝试使用scikit-learn的LabelEncoder对字符串标签的pandasDataFrame进行编码。由于数据框有很多(50+)列,我想避免为每一列创建一个LabelEncoder对象;我宁愿只拥有一个大的LabelEncoder对象,它可以在我的所有数据列中工作。将整个DataFrame放入LabelEncoder会产生以下错误。请记住,我在这里使用的是虚拟数据;实际上,我正在处理大约50列字符串标记的数据,因此需要一个不按名称引用任何列的解决方案。importpandasfromsklearnimportpreprocessingdf=pandas.DataFram

python - scikit-learn 中跨多个列的标签编码

我正在尝试使用scikit-learn的LabelEncoder对字符串标签的pandasDataFrame进行编码。由于数据框有很多(50+)列,我想避免为每一列创建一个LabelEncoder对象;我宁愿只拥有一个大的LabelEncoder对象,它可以在我的所有数据列中工作。将整个DataFrame放入LabelEncoder会产生以下错误。请记住,我在这里使用的是虚拟数据;实际上,我正在处理大约50列字符串标记的数据,因此需要一个不按名称引用任何列的解决方案。importpandasfromsklearnimportpreprocessingdf=pandas.DataFram