草庐IT

Python pandas 等效于替换

在R中,有一个相当有用的replace函数。本质上,它在数据框的给定列中进行有条件的重新分配。它可以这样使用:replace(df$column,df$column==1,'Type1');在pandas中实现相同目标的好方法是什么?我应该将lambda与apply一起使用吗?(如果是这样,我如何获得对给定列的引用,而不是整行)。我应该在data_frame.values上使用np.where吗?似乎我在这里遗漏了一个非常明显的东西。欢迎提出任何建议。 最佳答案 pandas也有一个replace方法:In[25]:df=DataF

Python pandas 等效于替换

在R中,有一个相当有用的replace函数。本质上,它在数据框的给定列中进行有条件的重新分配。它可以这样使用:replace(df$column,df$column==1,'Type1');在pandas中实现相同目标的好方法是什么?我应该将lambda与apply一起使用吗?(如果是这样,我如何获得对给定列的引用,而不是整行)。我应该在data_frame.values上使用np.where吗?似乎我在这里遗漏了一个非常明显的东西。欢迎提出任何建议。 最佳答案 pandas也有一个replace方法:In[25]:df=DataF

python pandas groupby() 结果

我有以下pythonpandas数据框:df=pd.DataFrame({'A':[1,1,1,1,2,2,2,3,3,4,4,4],'B':[5,5,6,7,5,6,6,7,7,6,7,7],'C':[1,1,1,1,1,1,1,1,1,1,1,1]});dfABC01511151216131714251526162617371837194611047111471我想要另一列存储固定(两者)A和B的C值的总和值。也就是说,类似于:ABCD01512115122161131711425115261262612737128371294611104712114712我已经尝试过使用pand

python pandas groupby() 结果

我有以下pythonpandas数据框:df=pd.DataFrame({'A':[1,1,1,1,2,2,2,3,3,4,4,4],'B':[5,5,6,7,5,6,6,7,7,6,7,7],'C':[1,1,1,1,1,1,1,1,1,1,1,1]});dfABC01511151216131714251526162617371837194611047111471我想要另一列存储固定(两者)A和B的C值的总和值。也就是说,类似于:ABCD01512115122161131711425115261262612737128371294611104712114712我已经尝试过使用pand

python - pandas:将日期时间转换为月末

我已经编写了一个函数来将pandas日期时间日期转换为月末:importpandasimportnumpyimportdatetimefrompandas.tseries.offsetsimportDay,MonthEnddefget_month_end(d):month_end=d-Day()+MonthEnd()ifmonth_end.month==d.month:returnmonth_end#31/March+MonthEnd()returns30/Aprilelse:print"SomethingwentwrongwhileconvertingdatestoEOM:"+d+"

python - pandas:将日期时间转换为月末

我已经编写了一个函数来将pandas日期时间日期转换为月末:importpandasimportnumpyimportdatetimefrompandas.tseries.offsetsimportDay,MonthEnddefget_month_end(d):month_end=d-Day()+MonthEnd()ifmonth_end.month==d.month:returnmonth_end#31/March+MonthEnd()returns30/Aprilelse:print"SomethingwentwrongwhileconvertingdatestoEOM:"+d+"

python - Pandas 中数据帧子集的随机样本

假设我有一个包含100,000个条目的数据框,并希望将其分成100个部分,每部分1000个条目。我如何从100个部分中的一个部分中抽取一个大小为50的随机样本。数据集已经排序,前1000个结果是第一部分,下一部分是下一部分,依此类推。非常感谢 最佳答案 您可以使用sample方法*:In[11]:df=pd.DataFrame([[1,2],[3,4],[5,6],[7,8]],columns=["A","B"])In[12]:df.sample(2)Out[12]:AB012256In[13]:df.sample(2)Out[13

python - Pandas 中数据帧子集的随机样本

假设我有一个包含100,000个条目的数据框,并希望将其分成100个部分,每部分1000个条目。我如何从100个部分中的一个部分中抽取一个大小为50的随机样本。数据集已经排序,前1000个结果是第一部分,下一部分是下一部分,依此类推。非常感谢 最佳答案 您可以使用sample方法*:In[11]:df=pd.DataFrame([[1,2],[3,4],[5,6],[7,8]],columns=["A","B"])In[12]:df.sample(2)Out[12]:AB012256In[13]:df.sample(2)Out[13

python - 创建单行 python pandas 数据框

我想创建一个单行的pythonpandasDataFrame,以使用更多的pandas功能,例如转储到*.csv。我见过下面这样的代码,但我只得到了列结构,但数据是空的importpandasaspddf=pd.DataFrame()df['A']=1df['B']=1.23df['C']="Hello"df.columns=[['A','B','C']]printdfEmptyDataFrameColumns:[A,B,C]Index:[]虽然我知道还有其他方法可以做到这一点(例如从字典中),但我想了解为什么这段代码对我不起作用!?这是版本问题吗?(使用Pandas==0.19.2)

python - 创建单行 python pandas 数据框

我想创建一个单行的pythonpandasDataFrame,以使用更多的pandas功能,例如转储到*.csv。我见过下面这样的代码,但我只得到了列结构,但数据是空的importpandasaspddf=pd.DataFrame()df['A']=1df['B']=1.23df['C']="Hello"df.columns=[['A','B','C']]printdfEmptyDataFrameColumns:[A,B,C]Index:[]虽然我知道还有其他方法可以做到这一点(例如从字典中),但我想了解为什么这段代码对我不起作用!?这是版本问题吗?(使用Pandas==0.19.2)