草庐IT

learning-locker

全部标签

python - scikit-learns LDA 函数中的错误 - 绘图显示非零相关

我使用scikit-learn的LDA函数做了一些LDA,我注意到在我的结果图中,LD之间存在非零相关性。fromsklearn.ldaimportLDAsklearn_lda=LDA(n_components=2)transf_lda=sklearn_lda.fit_transform(X,y)这很令人担忧,所以我回去使用Iris数据集作为引用。我还在scikit文档中找到了相同的非零相关LDA图,我可以重现它。无论如何,给你一个大概的样子左上图:这里显然有问题左下角的图:这是基于原始数据的,不是正确的方法,而是一种复制scikit结果的尝试右上角和右下角的绘图:这就是它的实际外观。

python - 将 Tensorflow 输入管道与 skflow/tf learn 结合使用

我关注了TensorflowReadingData指南以TFRecord的形式获取我的应用程序数据,并在我的输入管道中使用TFRecordReader来读取此数据。我现在正在阅读有关使用skflow/tf.learn的指南构建一个简单的回归器,但我看不到如何通过这些工具使用我的输入数据。在以下代码中,应用程序在调用regressor.fit(..)时失败,出现ValueError:settinganarrayelementwithasequence.。错误:Traceback(mostrecentcalllast):File".../tf.py",line138,inrun()File

python - 使用神经网络将旧系统更新为 Q-learning

最近,我阅读了很多关于使用神经网络进行Q学习的文章,并考虑更新发电厂锅炉中现有的旧优化系统,该系统由一个简单的前馈神经网络组成,可以近似许多感官输入的输出。然后将输出链接到基于线性模型的Controller,该Controller以某种方式再次输出最佳操作,以便整个模型可以收敛到所需的目标。识别线性模型是一项耗时的任务。我考虑过用Q函数的神经网络逼近来整修无模型Q学习。我画了一张图问你我走对不对。我的问题:如果你认为我很好地理解了这个概念,我的训练集是否应该由一侧的状态特征向量和Q_target-Q_current组成(这里我'我假设奖励越来越多)以迫使整个模型朝着目标前进,还是我遗漏

python - 回归数据的 Scikit-learn 特征选择

我正在尝试使用Python模块scikit-learn将单变量特征选择方法应用于svmlight格式的回归(即连续值响应值)数据集。我正在使用scikit-learn0.11版。我尝试了两种方法-第一种失败了,第二种对我的玩具数据集有效,但我认为对于真实数据集会产生毫无意义的结果。我希望获得有关可用于为回归数据集选择前N个特征的适当单变量特征选择方法的建议。我要么(a)弄清楚如何使f_regression函数工作,要么(b)听取其他建议。上述两种方式:我尝试使用sklearn.feature_selection.f_regression(X,Y)。失败并显示以下错误消息:“TypeEr

python - 是否可以在 Hadoop 上运行 Python 的 scikit-learn 算法?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,describetheproblem以及迄今为止为解决该问题所做的工作。关闭8年前。Improvethisquestion我知道可以在Hadoop上使用python语言。但是可以在Hadoop上使用scikit-learn的机器学习算法吗?如果答案是否定的,是否有一些用于python和Hadoop的机器学习库?感谢您的帮助。

python - 属性错误 : lower not found; using a Pipeline with a CountVectorizer in scikit-learn

我有这样一个语料库:X_train=[['thisisandummyexample']['inrealitythislineisverylong']...['hereisalasttextinthetrainingset']]和一些标签:y_train=[1,5,...,3]我想按如下方式使用Pipeline和GridSearch:pipeline=Pipeline([('vect',CountVectorizer()),('tfidf',TfidfTransformer()),('reg',SGDRegressor())])parameters={'vect__max_df':(0.

python - 无法下载和安装 scikit-learn

我是python的新手。我想使用KMean代码,我想安装scikit-learn或sklearn。我使用这段代码尝试安装这些包:pipinstall-Usklearnpipinstall-Uscikit-learn但是我得到了这个错误:Command/usr/bin/python-c"importsetuptools,tokenize;__file__='/tmp/pip_build_reihaneh/sklearn/setup.py';exec(compile(getattr(tokenize,'open',open)(__file__).read().replace('\r\n',

python - 具有非正则化截距项的 Scikit-learn Ridge 回归

scikit-learnRidge回归是否在正则化项中包含截距系数,如果是,是否有一种方法可以在不对截距进行正则化的情况下运行岭回归?假设我拟合岭回归:fromsklearnimportlinear_modelmymodel=linear_model.Ridge(alpha=0.1,fit_intercept=True).fit(X,y)printmymodel.coef_printmymodel.intercept_对于某些数据X,y,其中X不包括一列1。fit_intercept=True会自动增加一个截距列,对应的系数由mymodel.intercept_给定。我无法弄清楚的是这

python - Scikit-learn 凝聚聚类连通性矩阵

我正在尝试使用sklearn的凝聚聚类命令执行约束聚类。为了使算法受到约束,它需要一个“连接矩阵”。这被描述为:Theconnectivityconstraintsareimposedviaanconnectivitymatrix:ascipysparsematrixthathaselementsonlyattheintersectionofarowandacolumnwithindicesofthedatasetthatshouldbeconnected.Thismatrixcanbeconstructedfroma-prioriinformation:forinstance,you

python - scikit-learn分区数据中的LassoCV如何实现?

我在sklearn中使用套索方法执行线性回归。根据他们的指导以及我在其他地方看到的指导,与其简单地对所有训练数据进行交叉验证,不如将其拆分为更传统的训练集/验证集分区。套索因此在训练集上进行训练,然后根据验证集交叉验证的结果调整超参数alpha。最后,在测试集上使用接受的模型来给出一个真实的View,哦它在现实中的表现。将关注点分开是防止过度拟合的一种预防措施。实际问题LassoCV是否符合上述协议(protocol),或者它只是以某种方式在相同数据和/或相同轮次CV中训练模型参数和超参数?谢谢。 最佳答案 如果您将sklearn.