草庐IT

learning_topic

全部标签

python - 由于尺寸不同,无法在 scikit-learn 中使用 FeatureUnion

我正在尝试使用FeatureUnion从数据结构中提取不同的特征,但由于维度不同而失败:ValueError:blocks[0,:]hasincompatiblerowdimensions实现我的FeatureUnion是按以下方式构建的:features=FeatureUnion([('f1',Pipeline([('get',GetItemTransformer('f1')),('transform',vectorizer_f1)])),('f2',Pipeline([('get',GetItemTransformer('f2')),('transform',vectorizer_

python - scikit-learn 内核 PCA 解释方差

我一直在使用scikit-learn中的普通PCA,并毫无问题地获得每个主成分的方差比。pca=sklearn.decomposition.PCA(n_components=3)pca_transform=pca.fit_transform(feature_vec)var_values=pca.explained_variance_ratio_我想使用内核PCA探索不同的内核,还想要解释的方差比,但我现在看到它没有这个属性。有谁知道如何获得这些值?kpca=sklearn.decomposition.KernelPCA(kernel=kernel,n_components=3)kpca

machine-learning - Keras LSTM 时间序列

我有一个问题,此时我完全不知道如何解决它。我正在使用带有LSTM层的Keras来投影时间序列。我正在尝试使用前10个数据点来预测第11个。代码如下:fromkeras.modelsimportSequentialfromkeras.layers.coreimportDense,Activation,Dropoutfromkeras.layers.recurrentimportLSTMdef_load_data(data):"""datashouldbepd.DataFrame()"""n_prev=10docX,docY=[],[]foriinrange(len(data)-n_pre

使用 Scikit-learn 进行拟合时出现 Python MemoryError

我在具有24GB内存的Windows864位系统上运行Python2.7(64位)。在对通常的Sklearn.linear_models.Ridge进行拟合时,代码运行良好。问题:但是,当使用Sklearn.linear_models.RidgeCV(alphas=alphas)进行拟合时,我遇到了显示的MemoryError错误在执行拟合过程的rr.fit(X_train,y_train)行下方。我怎样才能避免这个错误?代码片段deffit(X_train,y_train):alphas=[1e-3,1e-2,1e-1,1e0,1e1]rr=RidgeCV(alphas=alphas

python - 在 scikit learn 中组合随机森林模型

我有两个RandomForestClassifier模型,我想将它们组合成一个元模型。他们都使用相似但不同的数据进行训练。我该怎么做?rf1#thisismyfirstfittedRandomForestClassifierobject,with250treesrf2#thisismysecondfittedRandomForestClassifierobject,alsowith250trees我想创建big_rf并将所有树组合成一个500棵树模型 最佳答案 我相信这可以通过修改RandomForestClassifier对象的e

python - 如何在 scikit-learn 中使用管道调整自定义内核函数的参数

目前我已经使用def函数成功定义了一个自定义内核函数(预计算内核矩阵),现在我正在使用GridSearchCV函数来获取最佳参数。因此,在自定义内核函数中,总共有2个参数需要调整(即下例中的gamm和sea_gamma),而且对于SVR模型,costc参数也必须调整。但直到现在,我只能使用GridSearchCV调整costc参数->请参阅下面的第一部分:示例。我已经搜索了一些类似的解决方案,例如:Isitpossibletotuneparameterswithgridsearchforcustomkernelsinscikit-learn?它说“一种方法是使用Pipeline、SVC

machine-learning - 首先做什么 : Feature Selection or Model Parameters Setting?

这更像是一个理论问题。我正在使用scikit-learn包来执行一些NLP任务。Sklearn提供了许多方法来执行特征选择和模型参数设置。我想知道我应该先做什么。如果我使用univariatefeatureselection,很明显我应该先进行特征选择,然后使用所选特征调整估计器的参数。但是如果我想使用recursivefeatureelimination怎么办??我应该先用gridsearch设置参数吗?使用所有原始特征然后执行特征选择?或者我应该先选择特征(使用估算器的默认参数),然后使用所选特征设置参数?编辑我遇到了与here几乎相同的问题.到那时,还没有解决办法。有谁知道现在是

基于时态差分法的强化学习:Sarsa和Q-learning

时态差分法(TemporalDifference, TD)是一类在强化学习中广泛应用的算法,用于学习价值函数或策略。Sarsa和Q-learning都是基于时态差分法的重要算法,用于解决马尔可夫决策过程(MarkovDecisionProcess,MDP)中的强化学习问题。下面是最简单的TD方法更新:它只使用当前行动之后的奖励值和下一个状态的值作为目标。Sarsa(State-Action-Reward-State-Action)和Q-learning是都是基于时态差分法的强化学习方法。Sarsa和Q-learning的区别Sarsa代表State-Action-Reward-State-Ac

python - 高斯混合模型 : Difference between Spark MLlib and scikit-learn

我正在尝试对数据集样本使用高斯混合模型。我同时使用了MLlib(与pyspark)和scikit-learn,得到了截然不同的结果,scikit-learn一个看起来更逼真。frompyspark.mllib.clusteringimportGaussianMixtureasSparkGaussianMixturefromsklearn.mixtureimportGaussianMixturefrompyspark.mllib.linalgimportVectorsScikit-learn:local=pd.DataFrame([x.asDict()forxindf.sample(0.

python - Wide & Deep learning for large data 错误 : GraphDef cannot be larger than 2GB

将1MM+行插入wideanddeeplearningmodel抛出ValueError:GraphDef不能大于2GB:Traceback(mostrecentcalllast):File"search_click.py",line207,intf.app.run()File"/usr/lib/python2.7/site-packages/tensorflow/python/platform/app.py",line30,inrunsys.exit(main(sys.argv))File"search_click.py",line204,inmaintrain_and_eval()