dataframe_草庐IT

python - PANDAS 从 df 删除一系列行

我想从数据框的底部删除m行。它是整数索引(有孔)。如何才能做到这一点？Pandas==0.10.1python==2.7.3 最佳答案使用切片选择你想要的部分:df[:-m]如果你想删除一些中间行，你可以使用drop:df.drop(df.index[3:5]) 关于python-PANDAS从df删除一系列行，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/15703283/

python - 从数据库中的表中获取数据

我想从postgresql数据库中提取数据并在脚本中使用该数据(以数据帧格式)。这是我的初步尝试:frompandasimportDataFrameimportpsycopg2conn=psycopg2.connect(host=host_address,database=name_of_database,user=user_name,password=user_password)cur=conn.cursor()cur.execute("SELECT*FROM%s;"%name_of_table)the_data=cur.fetchall()colnames=[desc[0]ford

python 中 code import section postgresql pandas dataframe psycopg2

python - 使用 openpyxl 将 pandas 数据框复制到 excel

我在模板文件中保存了一些复杂的格式，我需要将pandas数据帧中的数据保存到其中。问题是当我使用pd.to_excel保存到此工作表时，pandas会覆盖格式。有没有办法以某种方式将df中的值“粘贴”到工作表中？我正在使用Pandas0.17importopenpyxlimportpandasaspdwb=openpyxl.load_workbook('H:/template.xlsx')sheet=wb.get_sheet_by_name('spam')sheet.title='dfdata'wb.save('H:/df_out.xlsx')xlr=pd.ExcelWriter('d

openpyxl python section pandas dataframe clipboard

python - 从数据框中删除反向重复项

我有一个包含两列的数据框，A和B。A和B的顺序在此上下文中并不重要；例如，我认为(0,50)和(50,0)是重复的。在pandas中，什么是从数据框中删除这些重复项的有效方法？importpandasaspd#Initialdataframe.data=pd.DataFrame({'A':[0,10,11,21,22,35,5,50],'B':[50,22,35,5,10,11,21,0]})dataAB005011022211353215422105351165217500#Desiredoutputwith"duplicates"removed.data2=pd.DataFrame

反向 python code section duplicates pandas dataframe

python - Pandas :累积返回函数

我有一个如下所示的数据框:IndexReturn2008-11-210.1534192008-11-240.0374212008-11-250.077500计算最后一行所有列的累积返回的最佳方法是什么？以下是预期结果:IndexReturn2008-11-210.1534192008-11-240.0374212008-11-250.077500Cumulative0.289316累计yield计算如下:cumulative=(1+return1)*(1+return2)*(1+return3)-1在pandas中执行此操作的最佳方法是什么？最佳答案

python Pandas code section pre dataframe finance

python - 推断 Pandas DataFrame 中的值

在PandasDataFrame中插入NaN单元非常容易:In[98]:dfOut[98]:negneuposavg2500.5084750.5270270.6412920.558931500NaNNaNNaNNaN10000.6500000.5714290.6539830.6251372000NaNNaNNaNNaN30000.6197180.6631580.6654680.6494484000NaNNaNNaNNaN6000NaNNaNNaNNaN8000NaNNaNNaNNaN10000NaNNaNNaNNaN20000NaNNaNNaNNaN30000NaNNaNNaNNaN5

推断 DataFrame NaN code em python pandas extrapolation

python - 从 Pandas Groupby Dataframe 创建等高线图

我有以下Pandas数据框:In[66]:hdf.size()Out[66]:ab00.0210040.11199030.21865790.34173490.42027230.51009060.6563860.760800.835960.923911.019631.117301.216631.316141.41309...1860.2150.390.4210.541870.230.3100.4220.5101880.0110.1190.2200.3130.470.550.61Length:4572,dtype:int64你看，a从0...188和b在每个组中从某个值到某个值。并且作为指

等高 Dataframe code section pre python matplotlib pandas group-by contour

python - DataFrame 按组计算每只股票的对数返回

例如，我创建了一个如下所示的数据框:datepricetickervolume02018-01-011.323AI200012018-01-021.525AI150022018-01-031.045AI50032018-01-012.110BOC320142018-01-022.150BOC520052018-01-032.810BOC198062018-01-015.199CAT200072018-01-024.980CAT45082018-01-034.990CAT3000所以有3只股票，跨越三天。我想计算2018-01-01和2018-01-03之间每只股票的每日对数yield。

DataFrame python 2018 01 code python-3.x pandas

python - 按一定顺序排序(情况: pandas DataFrame Groupby)

我想更改以下代码显示的订单日期。我想要的是顺序为(周一、周二、周三、周四、周五、周六、周日)的结果-我应该说，按特定预定义的顺序按键排序吗？这是我的代码，需要一些调整:f8=df_toy_indoor2.groupby(['device_id','day'])['dwell_time'].sum()print(f8)当前结果:device_iddaydevice_112Thu436518Wed636451Fri770307Tue792066Mon826862Sat953503Sun1019298device_223Mon2534895Thu2857429Tue3303173Fri354

DataFrame Groupby code 39 device python sorting pandas

python - 在 IPython Notebook 中显示所有 pandas 数据帧

我如何识别在当前笔记本session中创建的所有PandasDataFrames？像在SAS中看到工作库中的所有成员的东西是理想的。谢谢。最佳答案解决方案%whoDataFrame说明所有对象...seeingallthemembersintheWorklibrarywouldbeideal.In[1]:a=10b='abs'c=[1,2,3]%who显示所有使用过的名字:In[2]:%whoabc方便地作为列表:In[3]:%who_lsOut[3]:['a','b','c']或者作为具有数据类型的表:In[4]:%whosV

Notebook IPython code DataFrame section python pandas jupyter-notebook