草庐IT

多元回归

全部标签

python - 沿 numpy 数组中的维度进行回归

我有一个4维numpy数组(x,y,z,time)并且想在每个x,y,z处通过时间维度做一个numpy.polyfit协调。例如:importnumpyasnpn=10#sizeofmyx,y,zdimensionsdegree=2#degreeofmypolyfittime_len=5#numberoftimesamples#MakesomedataA=np.random.rand(n*n*n*time_len).reshape(n,n,n,time_len)#AnxvectortoregressthroughevenlyspacedsamplesX=np.arange(time_l

python - 使用 scipy、python、numpy 进行非线性 e^(-x) 回归

下面的代码为我提供了最佳拟合线的平线,而不是沿着适合数据的e^(-x)模型的漂亮曲线。谁能告诉我如何修复下面的代码以使其适合我的数据?importnumpyasnpimportmatplotlib.pyplotaspltimportscipy.optimizedef_eNegX_(p,x):x0,y0,c,k=py=(c*np.exp(-k*(x-x0)))+y0returnydef_eNegX_residuals(p,x,y):returny-_eNegX_(p,x)defGet_eNegX_Coefficients(x,y):print'xis:',xprint'yis:',y#C

python - 如何在 Python 中绘制多元函数?

使用matplotlib在Python中绘制单个变量函数非常简单。但我正在尝试向散点图添加第三个轴,以便可视化我的多变量模型。这是一个示例片段,有30个输出:importnumpyasnpnp.random.seed(2)##generatearandomdatasetx=np.random.randn(30,2)x[:,1]=x[:,1]*100y=11*x[:,0]+3.4*x[:,1]-4+np.random.randn(30)##themodel如果这只是一个单变量模型,我可能会使用类似这样的东西来生成最适合的图和线:%pylabinlineimportmatplotlib.p

python - 使用 Python numpy 进行线性回归

我正在尝试做一个简单的线性回归函数,但继续遇到numpy.linalg.linalg.LinAlgError:Singularmatrixerror现有函数(带有调试打印):defmakeLLS(inputData,targetData):print"InmakeLLS:"print"ShapeinputData:",inputData.shapeprint"ShapetargetData:",targetData.shapeterm1=np.dot(inputData.T,inputData)term2=np.dot(inputData.T,targetData)print"Shap

python - tensorflow 学习中的多元回归输出节点

我对tensorflow比较陌生,想使用tf.contrib.learn中的DNNRegressor执行回归任务。但是我想要多个输出节点而不是一个输出节点(例如十个)。如何配置我的回归器来调整许多输出节点以满足我的需要?我的问题与以下已经在SO上提出的问题有关,但似乎没有有效的答案(我使用的是TensorFlow版本0.11)skflowregressionpredictmultiplevaluesMultipletargetcolumnswithSkFlowTensorFlowDNNRegressor 最佳答案 似乎使用tflea

python - 多输出回归模型始终为 Tensorflow 中的批处理返回相同的值

我有一个多层感知器用于预测14个连续值的多输出回归问题。以下是相同的代码片段:#Parameterslearning_rate=0.001training_epochs=1000batch_size=500#NetworkParametersn_hidden_1=32n_hidden_2=200n_hidden_3=200n_hidden_4=256n_input=14n_classes=14#tfGraphinputx=tf.placeholder("float",[None,n_input],name="x")y=tf.placeholder("float",[None,n_cla

python - 使用交叉验证评估逻辑回归

我想使用交叉验证来测试/训练我的数据集,并评估逻辑回归模型在整个数据集上的性能,而不仅仅是在测试集(例如25%)上的性能。这些概念对我来说是全新的,我不确定我是否做对了。如果有人能就我出错的地方采取正确的步骤向我提出建议,我将不胜感激。我的部分代码如下所示。此外,如何在与当前图表相同的图表上绘制“y2”和“y3”的ROC?谢谢importpandasaspdData=pd.read_csv('C:\\Dataset.csv',index_col='SNo')feature_cols=['A','B','C','D','E']X=Data[feature_cols]Y=Data['Sta

python - 使用 scikit learn 训练逻辑回归以进行多类分类

根据scikitmulticlassclassification逻辑回归可以通过设置用于多类分类multi_class=multinomial在构造函数中。但是这样做会出错:代码:text_clf=Pipeline([('vect',TfidfVectorizer()),('clf',LogisticRegression(multi_class='multinomial')),])text_clf=text_clf.fit(X_train,Y_train)错误:ValueError:求解器liblinear不支持多项式后端。你能告诉我这里出了什么问题吗?注意:将multi_class保

python - 如何对包含 NaN 的大型多维数组中的每个像素应用线性回归?

我有一个独立变量值的一维数组(x_array),它与具有多个时间步长的3Dnumpy空间数据数组(y_array)中的时间步长相匹配。我的实际数据要大得多:300多个时间步长和高达3000*3000像素:importnumpyasnpfromscipy.statsimportlinregress#Independentvariable:fourtime-stepsof1-dimensionaldatax_array=np.array([0.5,0.2,0.4,0.4])#Dependentvariable:fourtime-stepsof3x3spatialdatay_array=np

python - Spark 中的分组线性回归

我在PySpark工作,我想找到一种对数据组执行线性回归的方法。特别给出这个数据框importpandasaspdpdf=pd.DataFrame({'group_id':[1,1,1,2,2,2,3,3,3,3],'x':[0,1,2,0,1,5,2,3,4,5],'y':[2,1,0,0,0.5,2.5,3,4,5,6]})df=sqlContext.createDataFrame(pdf)df.show()#+--------+-+---+#|group_id|x|y|#+--------+-+---+#|1|0|2.0|#|1|1|1.0|#|1|2|0.0|#|2|0|0.0