草庐IT

python - TensorFlow - 为什么这个 sofmax 回归没有学到任何东西?

我的目标是使用TensorFlow做大事,但我想从小事做起。我有小的灰度方block(有一点噪音),我想根据它们的颜色对它们进行分类(例如3类:黑色、灰色、白色)。我编写了一个小的Python类来生成正方形和1-hot向量,并修改了他们的基本MNIST示例以将它们输入。但它不会学到任何东西-例如对于3个类别,它总是猜对≈33%。importtensorflowastfimportgenerate_data.generate_greyscaledata_generator=generate_data.generate_greyscale.GenerateGreyScale(28,28,3

python - 如何计算 Python 中线性回归模型的 AIC?

我想计算线性模型的AIC以比较它们的复杂性。我是这样做的:regr=linear_model.LinearRegression()regr.fit(X,y)aic_intercept_slope=aic(y,regr.coef_[0]*X.as_matrix()+regr.intercept_,k=1)defaic(y,y_pred,k):resid=y-y_pred.ravel()sse=sum(resid**2)AIC=2*k-2*np.log(sse)returnAIC但是我收到一个在日志中被零除错误。 最佳答案 sklear

python - 如何在逻辑回归中获得权重向量?

我有一个X特征矩阵和一个y标签矩阵,我正在使用二元逻辑回归如何在给定矩阵X特征和Y标签矩阵的情况下获得权重向量w。我对如何在sklean中实现这一点感到有点困惑。我该如何解决这个问题? 最佳答案 如果我没理解错的话,您正在寻找thecoef_attribute:lr=LogisticRegression(C=1e5)lr.fit(X,Y)print(lr.coef_)#returnsamatrixofweights(coefficients)coef_属性的形状应该是:(#ofclasses,#offeatures)如果您还需要截距

使用具有特定数据的 OLS 代码的 Python 多元线性回归?

我正在使用在scipyCookbook下载的ols.py代码(下载在第一段中,带有粗体OLS)但我需要理解而不是使用ols函数的随机数据来进行多元线性回归。我有一个特定的因变量y和三个解释变量。每次我尝试用我的变量代替随机变量时,它都会给我错误:TypeError:thisconstructortakesnoarguments.有人可以帮忙吗?这可能吗?这是我尝试使用的ols代码的副本以及我尝试输入的变量from__future__importdivisionfromscipyimportc_,ones,dot,stats,difffromscipy.linalgimportinv,s

python - 在 scikit 学习的多类逻辑回归中,哪些系数属于哪个类?

我正在使用scikitlearn的逻辑回归来解决多类问题。logit=LogisticRegression(penalty='l1')logit=logit.fit(X,y)我对哪些功能插入了这一决定很感兴趣。logit.coef_上面给了我一个漂亮的(n_classes,n_features)格式的数据框,但是所有的类和特征名称都不见了。对于功能,这没关系,因为假设它们的索引方式与我传递它们的方式相同似乎是安全的......但是对于类,这是一个问题,因为我从来没有以任何顺序显式地传入类。那么系数集(数据框中的行)0、1、2和3属于哪个类? 最佳答案

python - Pandas 统计模型中的多元线性回归 : ValueError

数据:https://courses.edx.org/c4x/MITx/15.071x_2/asset/NBA_train.csv我知道如何使用statsmodels.formula.api将这些数据拟合到多元线性回归模型中:importpandasaspdNBA=pd.read_csv("NBA_train.csv")importstatsmodels.formula.apiassmfmodel=smf.ols(formula="W~PTS+oppPTS",data=NBA).fit()model.summary()但是,我发现这种类似R的公式表示法很笨拙,我想使用通常的pandas

python - 随机森林回归中的样本大小

如果理解正确,在计算随机森林估计量时通常会应用自举,这意味着树(i)仅使用来自样本(i)的数据构建,并通过替换选择。我想知道sklearnRandomForestRegressor的样本大小是多少用途。我唯一看到的是接近:bootstrap:boolean,optional(default=True)Whetherbootstrapsamplesareusedwhenbuildingtrees.但是没有办法指定样本量的大小或比例,也没有告诉我默认样本量。我觉得至少应该有办法知道默认样本大小是多少,我错过了什么? 最佳答案 呃,我同意

python - 逻辑回归统计模型概率预测的置信区间

我正在尝试重新创建统计学习简介中的图,但我无法弄清楚如何计算概率预测的置信区间。具体来说,我正在尝试重新创建此图(figure7.1)的右侧面板,该面板根据年龄的4次多项式和相关的95%置信区间预测工资>250的概率。工资数据为here如果有人关心的话。我可以使用以下代码预测并绘制预测概率importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportstatsmodels.apiassmfromsklearn.preprocessingimportPolynomialFeatureswage=pd.read_csv('

python - 如何创建用于回归的神经网络?

我正在尝试使用Keras制作神经网络。我使用的数据是https://archive.ics.uci.edu/ml/datasets/Yacht+Hydrodynamics.我的代码如下:importnumpyasnpfromkeras.layersimportDense,Activationfromkeras.modelsimportSequentialfromsklearn.model_selectionimporttrain_test_splitdata=np.genfromtxt(r"""filelocation""",delimiter=',')model=Sequential

python - Tensorflow seq2seq 多维回归

编辑:我编辑了我的代码来制作seq2seq教程/练习,它们在这里:https://github.com/guillaume-chevalier/seq2seq-signal-prediction我尝试使用多维输入和输出进行序列到序列(seq2seq)回归。我尝试了一些随着时间的推移会产生以下损失的方法:即使我尝试非常小的学习率,该模型也完全无法学习预测在每个输入和输出维度上克隆的正弦曲线。为RNN构建的Tensorflow损失函数似乎解决了我们直接想要训练标签或词嵌入的情况,所以我尝试自己计算损失。关于这一点,我不知道我们应该如何处理dec_inp(解码器输入)变量,我尝试做的事情似乎