r

python - 在 Python (3.3) 中生成相关数据

在R中有一个函数(cm.rnorm.cor，来自包CreditMetrics)，它获取样本量、变量量和相关性矩阵以创建相关数据。Python中是否有等效项？最佳答案方法multivariate_normalnumpy.random中的Generator类就是您想要的函数。例子:importnumpyasnpimportmatplotlib.pyplotaspltnum_samples=400#Thedesiredmeanvaluesofthesample.mu=np.array([5.0,0.0,10.0])#Thedesire

中生 python plt 39 code r numpy scipy correlation

python - 在 Python 中的 Pandas 中实现 R scale 函数？

R的scale函数在pandas中的有效等价物是什么？例如newdf用Pandas写的？有没有使用transform的优雅方式？最佳答案缩放在机器学习任务中很常见，因此在scikit-learn的preprocessing模块中实现。您可以将pandasDataFrame传递给它的scale方法。唯一的“问题”是返回的对象不再是DataFrame，而是一个numpy数组；如果您想将其传递给机器学习模型(例如SVM或逻辑回归)，这通常不是真正的问题。如果您想保留DataFrame，则需要一些解决方法:fromsklearn.pre

python code section DataFrame numpy pandas

python - 在 R 中使用 python 虚拟环境

我正在使用“rPython”包在R中调用python，但我无法让R引用我的python虚拟环境。在R中，我尝试使用system('./home/username/Documents/myenv/env/bin/activate')但是在运行上面的代码后我的python库路径没有改变(我通过python.exec(printsys.path)检查)。当我运行时python.exec('importnltk')我被抛出错误:Errorinpython.exec("importnltk"):Nomodulenamednltk尽管它在我的虚拟环境中。我在Ubuntu13.04上使用R3.0.2

python 在 section code r virtualenv

python - 从 python 实现 R 包 TSdist

我正在尝试实现R包TSdist来自pythonjupyter笔记本。importrpy2.robjects.numpy2rifromrpy2.robjects.packagesimportimportrrpy2.robjects.numpy2ri.activate()R=rpy2.robjects.r##loadinpackageTSdist=importr('TSdist')##t,caretwoseriesdist=TSdist.ERPDistance(t.values,c.values,g=0,sigma=30)##distisaRBooleanvectorwithonevalu

python TSdist robjects code r time-series jupyter-notebook rpy2

python - 将 python pandas DataFrame 转换为 R dataframe 以与 rpy2 一起使用的问题

我无法将Python中的pandasDataFrame转换为R对象，以便将来使用rpy2在R中使用。新的pandas版本0.8.0(几周前发布)具有将pandasDataFrames转换为RDataFrames的功能。问题在于转换我的pandasDataFrame的第一列，它由pythondatetime对象组成(在时间序列中连续)。转换为R数据帧会返回日期和时间的StrVector，而不是我认为称为“POSIXct”对象的R日期时间类型对象的向量。我知道使用命令“as.POSIXct('yyyy-mm-ddhh:mm:ss')”将返回类型的字符串转换为POSIXct的命令。不幸的是，

python DataFrame code pandas r rpy2

Python - scipy.optimize curve_fit 可获得 R 平方和绝对平方和？

我正在使用curve_fit拟合曲线。有没有办法读出决定系数和绝对平方和？谢谢，啄木鸟最佳答案 Accordingtodoc,用curve_fit优化给你Optimalvaluesfortheparameterssothatthesumofthesquarederroroff(xdata,*popt)-ydataisminimized然后，使用optimize.leastsqimportscipy.optimizep,cov,infodict,mesg,ier=optimize.leastsq(residuals,a_guess,

curve_fit optimize code section python scipy curve-fitting

python - 如何将这一行令人困惑的 Python 代码转换为 R

我是Python的新手，我想知道下面这行代码在做什么以及如何用R编写它:df['sticky']=df[['humidity','workingday']].apply(lambdax:(0,1)[x['workingday']==1andx['humidity']>=60],axis=1)例如，lambdax:(0,1)是什么意思？附言df是一个pandas数据框最佳答案让我们从lambda开始。完整的表达式是:lambdax:(0,1)[x['workingday']==1andx['humidity']>=60]它是一个匿

困惑令人 code workingday humidity python r pandas

python - Python 中的 Fama Macbeth 回归(Pandas 或 Statsmodels)

计量经济学背景FamaMacbeth回归是指对面板数据运行回归的过程(其中有N个不同的个体，每个个体对应多个时期T，例如日、月、年)。所以总共有NxTobs。请注意，如果面板数据不平衡也没关系。FamaMacbeth回归首先对每个时期进行跨部门回归，即在给定时期t将N个个体集中在一起。并为t=1,...T执行此操作。所以总共运行了T个回归。然后我们有每个自变量的系数时间序列。然后我们可以使用系数的时间序列进行假设检验。通常我们取平均值作为每个自变量的最终系数。我们使用t-stats来检验显着性。我的问题我的问题是在pandas中实现它。从pandas的源代码中，我注意到有一个名为fam

Statsmodels Macbeth code 39 pre python r pandas

python - 您将如何在 Matplotlib 或 Mayavi 中表示以下 3D 数据？

我有一大组数据，我试图以3D形式表示这些数据，希望能发现一种模式。我花了很多时间阅读、研究和编码，但后来我意识到我的主要问题不是编程，而是选择一种可视化数据的方法。Matplotlib的mplot3d提供了很多选项(线框、轮廓、填充轮廓等)，MayaVi也是如此。但是有太多的选择(每个都有自己的学习曲线)，我几乎迷路了，不知道从哪里开始!所以我的问题本质上是，如果您必须处理这些数据，您会使用哪种绘图方法？我的数据是基于日期的。对于每个时间点，我绘制一个值(列表“实际”)。但是对于每个时间点，我还有一个上限、一个下限和一个中档点。这些限制和中点基于不同平面中的种子。我想在我的“实际”阅读

中表何在 1125 1187 dates python r matplotlib mayavi mplot3d

python - 使用 Rpy2 将 Pandas DataFrame 转换为 R dataframe

我有一个pandas数据帧，我使用pandas.rpy.common中的convert_to_r_dataframe方法将其转换为R数据帧。我是这样设置的:self.event=pd.read_csv('C://'+self.event_var.get()+'.csv')final_products=pd.DataFrame({'Product':self.event.Product,'Size':self.event.Size,'Order':self.event.Order})r.assign('final_products',com.convert_to_r_dataframe(

DataFrame section self 39 python r rpy2

142 143 144145146 147 148