草庐IT

dataframe

全部标签

python - 使用 Rpy2 将 Pandas DataFrame 转换为 R dataframe

我有一个pandas数据帧,我使用pandas.rpy.common中的convert_to_r_dataframe方法将其转换为R数据帧。我是这样设置的:self.event=pd.read_csv('C://'+self.event_var.get()+'.csv')final_products=pd.DataFrame({'Product':self.event.Product,'Size':self.event.Size,'Order':self.event.Order})r.assign('final_products',com.convert_to_r_dataframe(

python - 使用整数映射 Pandas Dataframe 中的字符串值

在PandasDataFrame中如何将一列中的字符串映射到整数。我在DataFrame中有大约500个字符串,需要用以“1”开头的整数替换它们。示例DataFrame。Requestcount547GET/online/WebResource.axd37506424GET/online/2/2/22001.aspx13315699POST/online/2/6/1/261001.aspx13236546GET/online/ScriptResource.axd12255492GET/online/2/6/Home.aspx10462660POST/online/2/2/22001.a

python - 如何在单行上打印 DataFrame

与:importpandasaspddf=pd.read_csv('pima-data.csv')printdf.head(2)打印自动跨多行格式化:num_pregglucose_concdiastolic_bpthicknessinsulinbmidiab_pred\061487235033.60.62711856629026.60.351ageskindiabetes0501.3790True1311.1426False我想知道是否有办法避免多行格式。我宁愿像这样将它打印在一行中:num_pregglucose_concdiastolic_bpthicknessinsulinbm

python - Pandas 数据框中几列的总和

假设我有下表:In[2]:df=pd.DataFrame({'a':[1,2,3],'b':[2,4,6],'c':[1,1,1]})In[3]:dfOut[3]:abc012112412361我可以这样求和a和b:In[4]:sum(df['a'])+sum(df['b'])Out[4]:18然而,这对于较大的数据框来说不是很方便,因为您必须将多个列加在一起。是否有更简洁的方法来对列求和(类似于下面的方法)?如果我想在不指定列的情况下对整个DataFrame求和怎么办?In[4]:sum(df[['a','b']])#thatwillnotwork!Out[4]:18In[4]:su

python - 在 pandas 数据框中查找包含 inf 的单元格的行位置和列名

如何在多列Pandas数据帧df中检索包含inf的所有单元格的列名和行数?我试过了inds=np.where(np.isinf(df)==True)但我没有得到预期的结果 最佳答案 行位置:df.index[np.isinf(df).any(1)]列名:df.columns.to_series()[np.isinf(df).any()]演示:In[163]:dfOut[163]:minorAAPLGSAdjCloseVolumeAdjCloseVolumeDate2017-03-01139.7899933.627240e+07252

python - Pandas 数据框 : how to count the number of 1 rows in a binary column?

我有以下Pandas数据框:importpandasaspdimportnumpyasnpdf=pd.DataFrame({"first_column":[0,0,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,0,0]})>>>dffirst_column00102031415160708191100110120130141151161171181190200first_column是0和1的二进制列。有连续的“集群”,它们总是成对出现,至少有两个。我的目标是创建一个“计算”每组行数的列:>>>dffirst_columncounts000100200313413

python - 如何在 Pandas 数据框中删除唯一行?

我遇到了一个看似简单的问题:在pandas数据框中删除唯一行。基本上,与drop_duplicates()相反.假设这是我的数据:ABC0foo0A1foo1A2foo1B3bar1A我想删除A和B唯一的行,即我想只保留第1行和第2行。我尝试了以下方法:#LoadDataframedf=pd.DataFrame({"A":["foo","foo","foo","bar"],"B":[0,1,1,1],"C":["A","A","B","A"]})uniques=df[['A','B']].drop_duplicates()duplicates=df[~df.index.isin(uni

python - 使用 Pandas、Python 将数据附加到 HDF5 文件

我有包含财务数据的大型pandasDataFrames。我可以毫无问题地将额外的列和DataFrame附加和连接到我的.h5文件。财务数据每分钟更新一次,我需要每分钟向.h5文件中的所有现有表追加一行数据。这是我到目前为止尝试过的方法,但无论我做什么,它都会覆盖.h5文件,而不仅仅是附加数据。HDF存储方式:#weopenthehdf5filesave_hdf=HDFStore('test.h5')ohlcv_candle.to_hdf('test.h5')#wegivethedataframeakeyvalue#format=tablesowecanappenddatasave_hd

python - 使用映射器时,pandas DataFrame.rename 意外关键字参数 "axis"

在pandasdocs之后我尝试了以下(文档中的逐字记录):df=pd.DataFrame({"A":[1,2,3],"B":[4,5,6]})df.rename(str.lower,axis='columns')还是报错TypeError:rename()gotanunexpectedkeywordargument"axis"我也试过df.rename(mapper=str.lower,axis='columns')然后我得到:TypeError:rename()gotanunexpectedkeywordargument"mapper"我看的是旧版本的文档吗?

python - 如何合并两个数据框并对列的值求和

我有两个数据框df1NameclassvalueSri15Ram28viv34df2NameclassvalueSri15viv44我想要的输出是,df,NameclassvalueSri210Ram28viv78请帮忙,提前致谢! 最佳答案 我认为需要set_index对于两个DataFrame,add最后reset_index:df=df1.set_index('Name').add(df2.set_index('Name'),fill_value=0).reset_index()print(df)Nameclassvalue0