草庐IT

python - 使用 scikit-learn python 的线性 SVM 时出现 ValueError

我目前正在研究ODP文档的大规模分层文本分类。提供给我的数据集是libSVM格式的。我正在尝试运行python的scikit-learn的线性核SVM来开发模型。以下是来自训练样本的样本数据:299454:111742:118884:1426840:135147:152782:172083:173244:178945:179913:179986:186710:3117286:1139820:1142458:1146315:1151005:2161454:3172237:11091130:11113562:11133451:11139046:11157534:11180618:21182

python - SVM 损失函数的梯度

我正在研究this卷积神经网络类。我一直在尝试为svm实现损失函数的梯度,并且(我有解决方案的副本)我无法理解为什么解决方案是正确的。关于thispage它定义损失函数的梯度如下:在我的代码中,当在代码中实现时,我的分析梯度与数字梯度匹配,如下所示:dW=np.zeros(W.shape)#initializethegradientaszero#computethelossandthegradientnum_classes=W.shape[1]num_train=X.shape[0]loss=0.0foriinxrange(num_train):scores=X[i].dot(W)co

python : How to find Accuracy Result in SVM Text Classifier Algorithm for Multilabel Class

我使用了以下代码集:我需要检查X_train和X_test的准确性以下代码适用于我的多标签类分类问题importnumpyasnpfromsklearn.pipelineimportPipelinefromsklearn.feature_extraction.textimportCountVectorizerfromsklearn.svmimportLinearSVCfromsklearn.feature_extraction.textimportTfidfTransformerfromsklearn.multiclassimportOneVsRestClassifierX_train

Python OpenCV SVM 实现

所以我有一个矩阵,其中包含通过PCA/LDA运行的样本图像(全部转换为向量),以及一个表示每个图像所属类别的向量。现在我想使用OpenCVSVM类来训练我的SVM(我使用的是Python,OpenCV2.3.1)。但是我在定义参数时遇到了问题:test=cv2.SVM()test.train(trainData,responses,????)我被困在如何定义SVM的类型(线性等)和其他东西上。在C++中,您可以通过声明来定义它,例如:svm_type=CvSVM::C_SVC...Python没有。C++还有一个特殊的类来存储这些参数->CvSVMParams。有人可以用Python给

python - 使用 Scikit Learn SVM 为文本分类准备数据

我正在尝试应用Scikit中的SVM学习对我收集的推文进行分类。因此,将有两个类别,将它们命名为A和B。现在,我将所有推文分类在两个文本文件中,“A.txt”和“B.txt”。但是,我不确定ScikitLearnSVM需要什么类型的数据输入。我有一个以标签(A和B)作为键的字典,以及一个特征字典(unigrams)及其频率作为值。抱歉,我是机器学习的新手,不确定我应该怎么做才能让SVM正常工作。我发现SVM使用numpy.ndarray作为其数据输入的类型。我需要根据自己的数据创建一个吗?应该是这样的吗?LabelsfeaturesfrequencyA'book'54B'movies'

python - 训练SVM分类器需要多少时间?

我编写了以下代码并在小数据上对其进行了测试:classif=OneVsRestClassifier(svm.SVC(kernel='rbf'))classif.fit(X,y)其中X,y(X-30000x784矩阵,y-30000x1)是numpy数组。在小数据算法上效果很好,给我正确的结果。但我在大约10小时前运行了我的程序......它仍在进行中。我想知道需要多长时间,或者它以某种方式卡住了?(笔记本电脑规范4GB内存,Corei5-480M) 最佳答案 SVM训练可以任意长,这取决于几十个参数:C参数-错误分类惩罚越大,过程越

python - 使用 Tensorflow 构建 SVM

我目前有两个numpy数组:X-(157,128)-157组128个特征Y-(157)-特征集的分类这是我为尝试构建这些特征的线性分类模型而编写的代码。首先,我将数组改编为Tensorflow数据集:train_input_fn=tf.estimator.inputs.numpy_input_fn(x={"x":X},y=Y,num_epochs=None,shuffle=True)然后我尝试拟合SVM模型:svm=tf.contrib.learn.SVM(example_id_column='example_id',#notsurewhythisisnecessaryfeature_

python - scikit 学习 SVM,如何保存/加载支持向量?

使用pythonscikitsvm,在运行clf.fit(X,Y)后,您将获得支持向量。我可以在实例化svm.SVC对象时直接加载这些支持向量(将它们作为参数传递)吗?这意味着我不需要每次都运行fit()方法来进行预测 最佳答案 来自scikit手册:http://scikit-learn.org/stable/modules/model_persistence.html1.2.4模型持久化可以使用Python内置的持久化模型,即pickle,将模型保存在scikit中。>>>fromsklearnimportsvm>>>froms

python - 计算 SVM 损失函数的梯度

我正在尝试实现SVM损失函数及其梯度。我找到了一些实现这两个的示例项目,但我无法弄清楚它们在计算梯度时如何使用损失函数。这里是损失函数的公式:我无法理解的是,如何在计算梯度时使用损失函数的结果?示例项目按如下方式计算梯度:foriinxrange(num_train):scores=X[i].dot(W)correct_class_score=scores[y[i]]forjinxrange(num_classes):ifj==y[i]:continuemargin=scores[j]-correct_class_score+1#notedelta=1ifmargin>0:loss+=

python - 可在 Python 中使用的最快 SVM 实现

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题,以便用事实和引用来回答它。关闭2年前。Improvethisquestion我正在用Python构建一些预测模型,并且一直在使用scikitslearn的SVM实现。它真的很棒,易于使用,而且速度相对较快。不幸的是,我开始受到运行时的限制。我在大约4-5000个具有650个特征的完整数据集上运行rbfSVM。每次运行大约需要一分钟。但是使用5折交叉验证+网格搜索(使用从粗到细的搜索),这对我手头的任务来说有点不可行。所以一般来说,