Scikit-Learn-Keras

python - 由于尺寸不同，无法在 scikit-learn 中使用 FeatureUnion

我正在尝试使用FeatureUnion从数据结构中提取不同的特征，但由于维度不同而失败:ValueError:blocks[0,:]hasincompatiblerowdimensions实现我的FeatureUnion是按以下方式构建的:features=FeatureUnion([('f1',Pipeline([('get',GetItemTransformer('f1')),('transform',vectorizer_f1)])),('f2',Pipeline([('get',GetItemTransformer('f2')),('transform',vectorizer_

FeatureUnion scikit-learn 39 code section python classification text-classification

python - 如何在 keras fit_generator() 中定义 max_queue_size、workers 和 use_multiprocessing？

我正在使用GPU版本的keras在预训练网络上应用迁移学习。我不明白如何定义参数max_queue_size、workers和use_multiprocessing。如果我更改这些参数(主要是为了加快学习速度)，我不确定每个时期是否仍然可以看到所有数据。max_queue_size:用于“预缓存”来自生成器的样本的内部训练队列的最大大小问题:这是指在CPU上准备了多少批处理？它与workers有什么关系？如何最佳定义？worker:并行生成批处理的线程数。批处理在CPU上并行计算，并即时传递到GPU以进行神经网络计算问题:如何确定我的CPU可以/应该并行生成多少批处理？use_mult

use_multiprocessing multiprocessing code generator strong python tensorflow machine-learning keras gpu

python - 在 scikit 中绘制 ROC 曲线仅产生 3 分

TLDR:scikit的roc_curve函数仅为特定数据集返回3个点。为什么会这样，我们如何控制返回多少积分？我正在尝试绘制ROC曲线，但始终得到“ROC三角形”。lr=LogisticRegression(multi_class='multinomial',solver='newton-cg')y=data['target'].valuesX=data[['feature']].valuesmodel=lr.fit(X,y)#getprobabilitiesforclfprobas_=model.predict_log_proba(X)只是为了确保长度没问题:printlen(y)

python scikit section code strong validation machine-learning scikit-learn roc

python - scikit-learn 内核 PCA 解释方差

我一直在使用scikit-learn中的普通PCA，并毫无问题地获得每个主成分的方差比。pca=sklearn.decomposition.PCA(n_components=3)pca_transform=pca.fit_transform(feature_vec)var_values=pca.explained_variance_ratio_我想使用内核PCA探索不同的内核，还想要解释的方差比，但我现在看到它没有这个属性。有谁知道如何获得这些值？kpca=sklearn.decomposition.KernelPCA(kernel=kernel,n_components=3)kpca

scikit-learn python explained variance explained_variance_ratio

machine-learning - Keras LSTM 时间序列

我有一个问题，此时我完全不知道如何解决它。我正在使用带有LSTM层的Keras来投影时间序列。我正在尝试使用前10个数据点来预测第11个。代码如下:fromkeras.modelsimportSequentialfromkeras.layers.coreimportDense,Activation,Dropoutfromkeras.layers.recurrentimportLSTMdef_load_data(data):"""datashouldbepd.DataFrame()"""n_prev=10docX,docY=[],[]foriinrange(len(data)-n_pre

machine-learning learning strong noreferrer noopener python

python - Keras 加载彩色图像

python Keras code section li deep-learning

python - 在 Keras 中训练多类图像分类器

我正在学习使用Keras训练分类器的教程https://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html具体来说，来自secondscript作者给出的，我想将脚本转换成一个可以训练多类分类器的脚本(是猫和狗的二进制文件)。我的火车文件夹中有5个类(class)，所以我做了以下更改:在train_top_model()的函数中:我变了model=Sequential()model.add(Flatten(input_shape=train_data.shape[

训练 python model 39 add machine-learning deep-learning keras one-hot-encoding

使用 Scikit-learn 进行拟合时出现 Python MemoryError

我在具有24GB内存的Windows864位系统上运行Python2.7(64位)。在对通常的Sklearn.linear_models.Ridge进行拟合时，代码运行良好。问题:但是，当使用Sklearn.linear_models.RidgeCV(alphas=alphas)进行拟合时，我遇到了显示的MemoryError错误在执行拟合过程的rr.fit(X_train,y_train)行下方。我怎样才能避免这个错误？代码片段deffit(X_train,y_train):alphas=[1e-3,1e-2,1e-1,1e0,1e1]rr=RidgeCV(alphas=alphas

时出 Scikit-learn code 稀疏 self python python-2.7 numpy scipy

python - 在 scikit learn 中组合随机森林模型

我有两个RandomForestClassifier模型，我想将它们组合成一个元模型。他们都使用相似但不同的数据进行训练。我该怎么做？rf1#thisismyfirstfittedRandomForestClassifierobject,with250treesrf2#thisismysecondfittedRandomForestClassifierobject,alsowith250trees我想创建big_rf并将所有树组合成一个500棵树模型最佳答案我相信这可以通过修改RandomForestClassifier对象的e

python scikit estimators code RandomForestClassifier python-2.7 scikit-learn classification random-forest

python - 在 Scikit 特征选择后保留特征名称

在对一组数据运行Scikit-Learn的方差阈值后，它删除了几个特征。我觉得我在做一些简单而愚蠢的事情，但我想保留其余功能的名称。以下代码:defVarianceThreshold_selector(data):selector=VarianceThreshold(.5)selector.fit(data)selector=(pd.DataFrame(selector.transform(data)))returnselectorx=VarianceThreshold_selector(data)print(x)更改以下数据(这只是行的一小部分):SurvivedPclassSexA

python Scikit selector code section pandas scikit-learn output feature-selection

30 31 323334 35 36