草庐IT

Scikit-Learn-Keras

全部标签

python - SGDClassifier 与 LogisticRegression 与 scikit-learn 库中的 sgd 求解器

scikit-learn库具有以下看起来相似的分类器:逻辑回归分类器有不同的求解器,其中之一是'sgd'http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression它还有一个不同的分类器“SGDClassifier”和损失对于逻辑回归,参数可以称为“log”。http://scikit-learn.org/stable/modules/generated/sklearn.linear

python - keras中的加权mse自定义损失函数

我正在处理时间序列数据,输出future60天的预测。我目前使用均方误差作为我的损失函数,结果很糟糕我想实现加权均方误差,以便早期输出比后期输出重要得多。加权均方根公式:所以我需要一些方法来迭代张量的元素,使用索引(因为我需要同时迭代预测值和真实值,然后将结果写入只有一个元素的张量。它们都是(?,60)但实际上是(1,60)列表。而且我所做的一切都没有奏效。这是损坏版本的代码defweighted_mse(y_true,y_pred):wmse=K.cast(0.0,'float')size=K.shape(y_true)[0]foriinrange(0,K.eval(size)):w

python - 用于降维的 Scikit-learn 主成分分析 (PCA)

我想进行降维和数据集成的主成分分析。我有3个特征(变量)和5个样本,如下所示。我想通过转换它们(计算第一台PC)将它们集成到一维(1个特征)输出中。我想使用转换后的数据进行进一步的统计分析,因为我相信它显示了3个输入特征的“主要”特征。我首先使用scikit-learn使用python编写了一个测试代码,如下所示。这是简单的情况,即3个特征的值都相等。换句话说,我对三个相同的向量[0,1,2,1,0]应用了PCA。代码importnumpyasnpfromsklearn.decompositionimportPCApca=PCA(n_components=1)samples=np.ar

python - 与 tensorflow-gpu 1.4 一起使用的 keras 版本

我正在使用ubuntu16、python3、tf-GPU和keras。由于cuda错误,我降级到tf1.4,如解释的那样here但是现在我得到了这个错误TypeError:softmax()gotanunexpectedkeywordargument'axis'似乎这是一个APIchange在tensorflow和新的keras中不适合旧的tf.我找不到与tf1.4gpu一起使用的正确keras版本。什么是正确的? 最佳答案 Keras-Tensorflow版本兼容性是我自己遇到过很多次的常见问题。我将这个compatibility

Python/Keras - 如何访问每个时期的预测?

我正在使用Keras来预测时间序列。作为标准,我使用20个纪元。我想通过对20个时期中的每一个时期进行预测来检查我的模型是否学习良好。通过使用model.predict()我在所有时期中只得到一个预测(不确定Keras如何选择它)。我想要所有预测,或者至少是10个最好的预测。有人知道如何帮助我吗? 最佳答案 我觉得这里有点困惑。epoch仅在训练神经网络时使用,因此当训练停止时(在本例中,在第20个epoch之后),权​​重对应于在最后一个epoch上计算的权重。Keras在每个时期后的训练期间在验证集上打印当前损失值。如果每个时期

python - scikit-learn 中的 10*10 折交叉验证?

是classsklearn.cross_validation.ShuffleSplit(n,n_iterations=10,test_fraction=0.10000000000000001,indices=True,random_state=None)scikit-learn中10*10foldCV的正确方法?(通过将random_state更改为10个不同的数字)因为我没有在StratifiedK-Fold或K-Fold中找到任何random_state参数并且与K分开-折叠对于相同的数据总是相同的。如果ShuffleSplit是正确的,一个问题是它被提及了Note:contrar

python - 将 scikit-learn TfIdf 与 gensim LDA 结合使用

我在scikit中使用了各种版本的TFIDF来学习建模一些文本数据。vectorizer=TfidfVectorizer(min_df=1,stop_words='english')结果数据X的格式如下:'withxyzstoredelementsinCompressedSparseRowformat>我想尝试使用LDA来降低稀疏矩阵的维数。有没有一种简单的方法可以将NumPy稀疏矩阵X馈送到gensimLDA模型中?lda=models.ldamodel.LdaModel(corpus=corpus,id2word=dictionary,num_topics=100)我可以忽略sci

python - 为什么二进制 Keras CNN 总是预测 1?

我想使用KerasCNN构建二元分类器。我有大约6000行输入数据,如下所示:>>print(X_train[0])[[[-1.06405307-1.06685851-1.05989663-1.06273152][-1.06295958-1.06655996-1.05969803-1.06382503][-1.06415248-1.06735609-1.05999593-1.06302975][-1.06295958-1.06755513-1.05949944-1.06362621][-1.06355603-1.06636092-1.05959873-1.06173742][-1.06

python - 使用 Keras VGG 模型的预期输入范围是多少?

我正在尝试使用来自keras的预训练VGG16。但我真的不确定输入范围应该是多少。快速回答,这些颜色顺序中的哪些?RGBBGR哪个范围?0到255?从大约-125平衡到大约+130?0比1?-1比1?我注意到thefilewherethemodelisdefined导入输入预处理器:from.imagenet_utilsimportpreprocess_input但此预处理器从未在文件的其余部分中使用。此外,当我检查codeforthispreprocessor,它有两种模式:caffe和tf(tensorflow)。每种模式的工作方式不同。最后,我无法在Internet上找到一致的文

python - 如何使用 XGBoost 获取 Predictions 和使用 Scikit-Learn Wrapper 的 XGBoost 进行匹配?

我是Python中XGBoost的新手,所以如果这里的答案很明显,我深表歉意,但我正在尝试使用panda数据框并在Python中获取XGBoost来给我使用Scikit-Learn包装器时得到的相同预测对于同一个练习。到目前为止,我一直无法这样做。举个例子,这里我使用波士顿数据集,转换为Pandas数据框,训练数据集的前500个观察值,然后预测最后6个。我先用XGBoost做,然后用Scikit-Learn包装器和即使我将模型的参数设置为相同,我也会得到不同的预测。具体来说,数组预测看起来与数组预测2非常不同(请参见下面的代码)。任何帮助将不胜感激!fromsklearnimportd