Scikit-Learn-Keras

python - 使用 scikit-learn 对连续变量和分类变量(整数类型)进行特征预处理

主要目标如下:将StandardScaler应用于连续变量将LabelEncoder和OnehotEncoder应用于分类变量连续变量需要缩放，但同时有几个分类变量也是整数类型。应用StandardScaler会导致不良影响。另一方面，StandardScaler会缩放基于整数的分类变量，这也不是我们想要的。由于连续变量和分类变量混合在单个PandasDataFrame中，建议的工作流程是什么来处理此类问题？说明我的观点的最好例子是KaggleBikeSharingDemand数据集，其中season和weather是整数分类变量最佳答案

python - 无法导入 Scikit-Learn

我尝试在我的LinuxMint12上安装scikit-learn但失败了。我从http://pypi.python.org/pypi/scikit-learn/下载了这个包并安装sudopython2.7setup.pyinstall然后我将目录更改为home并启动了python2.7shell。在导入sklearn时，我得到了:>>>importsklearn/usr/lib/python2.7/dist-packages/scipy/spatial/__init__.py:7:RuntimeWarning:numpy.dtypesizechanged,mayindicatebina

Scikit-Learn python dist-packages python2 importerror

python - 使用 Keras 递归神经网络进行预测 - 准确度始终为 1.0

TLDR:如何使用KerasRNN预测序列中的下一个值？我有一个顺序值列表。我想将它们输入RNN以预测序列中的下一个值。[0.435897440.442307690.49358974...,0.711538460.708333330.69230769]我正在使用Keras来执行此操作，并且可以获得一个损失减少但准确度始终为1.0的网络。这是错误的。y_tests!=model.predict(x_tests)。Epoch01517/1517[==============================]-0s-loss:0.0726-acc:1.0000-val_loss:0.0636

神经 python code section model neural-network

python - 我们应该如何使用 pad_sequences 在 keras 中填充文本序列？

我编码了一个sequencetosequence我自己使用从网络教程中获得的知识和我自己的直觉在keras中学习LSTM。我将示例文本转换为序列，然后使用keras中的pad_sequence函数进行填充。fromkeras.preprocessing.textimportTokenizer,base_filterfromkeras.preprocessing.sequenceimportpad_sequencesdefshift(seq,n):n=n%len(seq)returnseq[n:]+seq[:n]txt="abcdefghijklmn"*100tk=Tokenizer(n

pad_sequences sequences code section pre python neural-network keras lstm sequence-to-sequence

python - Keras VGG16 微调

在kerasblog上有一个VGG16微调的例子，但我无法重现它。更准确地说，这里是用于在没有顶层的情况下初始化VGG16并卡住除最顶层以外的所有block的代码:WEIGHTS_PATH_NO_TOP='https://github.com/fchollet/deep-learning-models/releases/download/v0.1/vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5'weights_path=get_file('vgg16_weights.h5',WEIGHTS_PATH_NO_TOP)model=Sequ

微调 python model 39 code neural-network keras deep-learning vgg-net

python - keras - 无法导入名称 Conv2D

我最近从https://github.com/floydhub/dl-docker得到了深度学习docker运行并尝试教程时，在导入keras层模块时收到错误。from__future__importprint_functionimportkerasfromkeras.datasetsimportcifar10fromkeras.preprocessing.imageimportImageDataGeneratorfromkeras.modelsimportSequentialfromkeras.layersimportDense,Dropout,Activation,Flattenf

python Conv2D keras import section tensorflow neural-network theano

python - 在 Keras 中，验证准确率始终高于训练准确率

我正在尝试使用mnist数据集训练一个简单的神经网络。出于某种原因，当我获得历史记录(从model.fit返回的参数)时，验证精度高于训练精度，这真的很奇怪，但是如果我在评估模型时检查分数，我会得到更高的训练准确率高于测试准确率。无论模型的参数如何，这种情况每次都会发生。另外，如果我使用自定义回调并访问参数'acc'和'val_acc'，我会发现同样的问题(数字与历史中返回的数字相同)。请帮帮我!我究竟做错了什么？为什么验证准确率比训练准确率高(你看我看loss的时候也有同样的问题)。这是我的代码:#!/usr/bin/envpython3.5fromkeras.layersimpor

准确率训练 train history x_train python keras keras-2

python - 带有用于可变长度输入的屏蔽层的 Keras lstm

我知道这是一个有很多问题的主题，但我找不到解决问题的方法。我正在使用掩蔽层在可变长度输入上训练LSTM网络，但它似乎没有任何效果。输入形状(100,362,24)，其中362是最大序列长度，24是特征数量，100是样本数量(分为75个训练/25个有效)。输出形状(100,362,1)稍后转换为(100,362-N,1)。这是我的网络的代码:fromkerasimportSequentialfromkeras.layersimportEmbedding,Masking,LSTM,Lambdaimportkeras.backendasK#OOO#exampleforN:3|||#OOOOO

可变 python code mask model keras lstm masking

python - 使用多个分类器时 - 如何衡量集成的性能？ [SciKit学习]

我有一个分类问题(预测一个序列是否属于一个类)，为此我决定使用多种分类方法，以帮助过滤掉误报。(问题在于生物信息学-将蛋白质序列分类为神经肽前体序列。Here'stheoriginalarticle如果有人感兴趣，andthecodeusedtogeneratefeaturesandtotrainasinglepredictor)。现在，分类器具有大致相似的性能指标(10倍CV的训练集上的准确度/精度等为83-94%)，因此我的“天真”方法是简单地使用多个分类器(随机森林，ExtraTrees,SVM(Linearkernel),SVM(RBFkernel)andGRB)，并使用简单多

python SciKit section noreferrer noopener machine-learning scikit-learn bioinformatics random-forest

python - 如何在 scikit-learn 的 LogisticRegressionCV 调用中将参数传递给评分函数

问题我正在尝试使用scikit-learn的LogisticRegressionCV与roc_auc_score作为评分指标。fromsklearn.linear_modelimportLogisticRegressionfromsklearn.metricsimportroc_auc_scoreclf=LogisticRegressionCV(scoring=roc_auc_score)但是当我尝试拟合模型时(clf.fit(X,y))，它会抛出一个错误。ValueError:averagehastobeoneof(None,'micro','macro','weighted','s

LogisticRegressionCV 何在 code roc_auc_score python function arguments scikit-learn scoring

22 23 242526 27 28