Scikit-Learn-Keras

python - SGDClassifier 与 LogisticRegression 与 scikit-learn 库中的 sgd 求解器

scikit-learn库具有以下看起来相似的分类器:逻辑回归分类器有不同的求解器，其中之一是'sgd'http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression它还有一个不同的分类器“SGDClassifier”和损失对于逻辑回归，参数可以称为“log”。http://scikit-learn.org/stable/modules/generated/sklearn.linear

求解 LogisticRegression SGDClassifier scikit-learn linear_model python machine-learning

python - keras中的加权mse自定义损失函数

我正在处理时间序列数据，输出future60天的预测。我目前使用均方误差作为我的损失函数，结果很糟糕我想实现加权均方误差，以便早期输出比后期输出重要得多。加权均方根公式:所以我需要一些方法来迭代张量的元素，使用索引(因为我需要同时迭代预测值和真实值，然后将结果写入只有一个元素的张量。它们都是(?,60)但实际上是(1,60)列表。而且我所做的一切都没有奏效。这是损坏版本的代码defweighted_mse(y_true,y_pred):wmse=K.cast(0.0,'float')size=K.shape(y_true)[0]foriinrange(0,K.eval(size)):w

自定 python code section strong tensorflow keras loss-function

python - 用于降维的 Scikit-learn 主成分分析 (PCA)

我想进行降维和数据集成的主成分分析。我有3个特征(变量)和5个样本，如下所示。我想通过转换它们(计算第一台PC)将它们集成到一维(1个特征)输出中。我想使用转换后的数据进行进一步的统计分析，因为我相信它显示了3个输入特征的“主要”特征。我首先使用scikit-learn使用python编写了一个测试代码，如下所示。这是简单的情况，即3个特征的值都相等。换句话说，我对三个相同的向量[0,1,2,1,0]应用了PCA。代码importnumpyasnpfromsklearn.decompositionimportPCApca=PCA(n_components=1)samples=np.ar

Scikit-learn python section power speed pca feature-extraction

python - 与 tensorflow-gpu 1.4 一起使用的 keras 版本

我正在使用ubuntu16、python3、tf-GPU和keras。由于cuda错误，我降级到tf1.4，如解释的那样here但是现在我得到了这个错误TypeError:softmax()gotanunexpectedkeywordargument'axis'似乎这是一个APIchange在tensorflow和新的keras中不适合旧的tf.我找不到与tf1.4gpu一起使用的正确keras版本。什么是正确的？最佳答案 Keras-Tensorflow版本兼容性是我自己遇到过很多次的常见问题。我将这个compatibility

tensorflow-gpu tensorflow section keras python gpu version

Python/Keras - 如何访问每个时期的预测？

我正在使用Keras来预测时间序列。作为标准，我使用20个纪元。我想通过对20个时期中的每一个时期进行预测来检查我的模型是否学习良好。通过使用model.predict()我在所有时期中只得到一个预测(不确定Keras如何选择它)。我想要所有预测，或者至少是10个最好的预测。有人知道如何帮助我吗？最佳答案我觉得这里有点困惑。epoch仅在训练神经网络时使用，因此当训练停止时(在本例中，在第20个epoch之后)，权重对应于在最后一个epoch上计算的权重。Keras在每个时期后的训练期间在验证集上打印当前损失值。如果每个时期

时期 Python section 训练 machine-learning keras deep-learning

python - scikit-learn 中的 10*10 折交叉验证？

是classsklearn.cross_validation.ShuffleSplit(n,n_iterations=10,test_fraction=0.10000000000000001,indices=True,random_state=None)scikit-learn中10*10foldCV的正确方法？(通过将random_state更改为10个不同的数字)因为我没有在StratifiedK-Fold或K-Fold中找到任何random_state参数并且与K分开-折叠对于相同的数据总是相同的。如果ShuffleSplit是正确的，一个问题是它被提及了Note:contrar

scikit-learn python code section random_state machine-learning scikits

python - 将 scikit-learn TfIdf 与 gensim LDA 结合使用

我在scikit中使用了各种版本的TFIDF来学习建模一些文本数据。vectorizer=TfidfVectorizer(min_df=1,stop_words='english')结果数据X的格式如下:'withxyzstoredelementsinCompressedSparseRowformat>我想尝试使用LDA来降低稀疏矩阵的维数。有没有一种简单的方法可以将NumPy稀疏矩阵X馈送到gensimLDA模型中？lda=models.ldamodel.LdaModel(corpus=corpus,id2word=dictionary,num_topics=100)我可以忽略sci

scikit-learn python section gensim code text-mining lda

python - 为什么二进制 Keras CNN 总是预测 1？

我想使用KerasCNN构建二元分类器。我有大约6000行输入数据，如下所示:>>print(X_train[0])[[[-1.06405307-1.06685851-1.05989663-1.06273152][-1.06295958-1.06655996-1.05969803-1.06382503][-1.06415248-1.06735609-1.05999593-1.06302975][-1.06295958-1.06755513-1.05949944-1.06362621][-1.06355603-1.06636092-1.05959873-1.06173742][-1.06

python Keras model section add machine-learning tensorflow keras-layer

python - 使用 Keras VGG 模型的预期输入范围是多少？

我正在尝试使用来自keras的预训练VGG16。但我真的不确定输入范围应该是多少。快速回答，这些颜色顺序中的哪些？RGBBGR哪个范围？0到255？从大约-125平衡到大约+130？0比1？-1比1？我注意到thefilewherethemodelisdefined导入输入预处理器:from.imagenet_utilsimportpreprocess_input但此预处理器从未在文件的其余部分中使用。此外，当我检查codeforthispreprocessor，它有两种模式:caffe和tf(tensorflow)。每种模式的工作方式不同。最后，我无法在Internet上找到一致的文

python Keras code preprocess_input preprocess tensorflow image-processing vgg-net

python - 如何使用 XGBoost 获取 Predictions 和使用 Scikit-Learn Wrapper 的 XGBoost 进行匹配？

我是Python中XGBoost的新手，所以如果这里的答案很明显，我深表歉意，但我正在尝试使用panda数据框并在Python中获取XGBoost来给我使用Scikit-Learn包装器时得到的相同预测对于同一个练习。到目前为止，我一直无法这样做。举个例子，这里我使用波士顿数据集，转换为Pandas数据框，训练数据集的前500个观察值，然后预测最后6个。我先用XGBoost做，然后用Scikit-Learn包装器和即使我将模型的参数设置为相同，我也会得到不同的预测。具体来说，数组预测看起来与数组预测2非常不同(请参见下面的代码)。任何帮助将不胜感激!fromsklearnimportd

XGBoost Scikit-Learn 39 train code python

18 19 202122 23 24