pyhton_Pandas_草庐IT

python - pandas 日期字段的 cut/qcut 等价于什么？

更新:从版本0.20.0开始，pandascut/qcut确实可以处理日期字段。参见What'sNew了解更多。pd.cutandpd.qcutnowsupportdatetime64andtimedelta64dtypes(GH14714,GH14798)原始问题:Pandascut和qcut函数非常适合“分桶”连续数据以用于数据透视表等，但我看不到在混合。令人沮丧，因为pandas在所有与时间相关的事情上都非常出色!这是一个简单的例子:defrandomDates(size,start=134e7,end=137e7):returnnp.array(np.random.randin

python - Python 列表中的 Pandas bool 运算

我知道pandasdataframe类型具有测试其值(value)逻辑的能力。代码如下:importpandasaspddata=pd.DataFrame(columns=['a','b','c'])data=data.append({'a':'Ihavedata','b':'nomorecomplexe','c':024204},ignore_index=True)data=data.append({'a':'audoausd','b':'2048rafaf','c':29313},ignore_index=True)data=data.append({'a':'koplakente

python code pre 39 python-2.7 pandas

python - 使用 Rpy2 将 Pandas DataFrame 转换为 R dataframe

我有一个pandas数据帧，我使用pandas.rpy.common中的convert_to_r_dataframe方法将其转换为R数据帧。我是这样设置的:self.event=pd.read_csv('C://'+self.event_var.get()+'.csv')final_products=pd.DataFrame({'Product':self.event.Product,'Size':self.event.Size,'Order':self.event.Order})r.assign('final_products',com.convert_to_r_dataframe(

DataFrame section self 39 python r rpy2

python - 使用整数映射 Pandas Dataframe 中的字符串值

在PandasDataFrame中如何将一列中的字符串映射到整数。我在DataFrame中有大约500个字符串，需要用以“1”开头的整数替换它们。示例DataFrame。Requestcount547GET/online/WebResource.axd37506424GET/online/2/2/22001.aspx13315699POST/online/2/6/1/261001.aspx13236546GET/online/ScriptResource.axd12255492GET/online/2/6/Home.aspx10462660POST/online/2/2/22001.a

Dataframe python code section Request pandas

python - Pandas :用另一个字符串替换字符串

我有以下数据框prod_type0responsive1responsive2respon3r4respon5r6responsive我想用responsive替换respon和r，所以最终的数据框是prod_type0responsive1responsive2responsive3responsive4responsive5responsive6responsive我尝试了以下方法，但没有用:df['prod_type']=df['prod_type'].replace({'respon':'responsvie'},regex=True)df['prod_type']=df['p

python Pandas responsive code 39 string python-2.7 replace

python - Pandas 如何按间隔按列拆分数据帧

我有一个巨大的数据框，其中包含一个名为dt的日期时间类型列，该数据框已经根据dt进行了排序。我想根据dt将数据帧拆分为多个数据帧，每个数据帧包含1hr范围内的行。拆分dttext02016081111:05a12016081111:35b22016081112:03c32016081112:36d42016081112:52e52016081114:32f进入dttext02016081111:05a12016081111:35b22016081112:03cdttext02016081112:36d12016081112:52edttext02016081114:32f

python Pandas 20160811 code text python-2.7 numpy scipy

python - Pandas 数据框中几列的总和

假设我有下表:In[2]:df=pd.DataFrame({'a':[1,2,3],'b':[2,4,6],'c':[1,1,1]})In[3]:dfOut[3]:abc012112412361我可以这样求和a和b:In[4]:sum(df['a'])+sum(df['b'])Out[4]:18然而，这对于较大的数据框来说不是很方便，因为您必须将多个列加在一起。是否有更简洁的方法来对列求和(类似于下面的方法)？如果我想在不指定列的情况下对整个DataFrame求和怎么办？In[4]:sum(df[['a','b']])#thatwillnotwork!Out[4]:18In[4]:su

python Pandas code 39 sum dataframe

python - Pandas :聚合给定列的行并计算数量

我有以下数据框my_df:teammember--------------------AMaryBJohnCAmyADanBDaveDPaulBAlexAMaryDMary我希望新的输出新数据框new_df为:teammembersnumber--------------------------------------A[Mary,Dan]2B[John,Dave,Alex]3C[Amy]1D[Paul,Mary]2我想知道是否有任何现有的pandas函数可以执行上述任务？谢谢! 最佳答案使用groupbypd.concatg=d

给定 python code section strong python-3.x pandas

python - 在 pandas 数据框中查找包含 inf 的单元格的行位置和列名

如何在多列Pandas数据帧df中检索包含inf的所有单元格的列名和行数？我试过了inds=np.where(np.isinf(df)==True)但我没有得到预期的结果最佳答案行位置:df.index[np.isinf(df).any(1)]列名:df.columns.to_series()[np.isinf(df).any()]演示:In[163]:dfOut[163]:minorAAPLGSAdjCloseVolumeAdjCloseVolumeDate2017-03-01139.7899933.627240e+07252

列名 python 2017 section code pandas dataframe

python - Pandas 数据框 : how to count the number of 1 rows in a binary column?

我有以下Pandas数据框:importpandasaspdimportnumpyasnpdf=pd.DataFrame({"first_column":[0,0,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,0,0]})>>>dffirst_column00102031415160708191100110120130141151161171181190200first_column是0和1的二进制列。有连续的“集群”，它们总是成对出现，至少有两个。我的目标是创建一个“计算”每组行数的列:>>>dffirst_columncounts000100200313413

python Pandas code first_column column dataframe group-by pandas-groupby