Pandas-Datareader

python - Pandas - Python，删除基于日期列的行

我正在尝试根据一个日期列删除数据框的行；[交货日期]我需要删除超过6个月但不等于年份“1970”的行。我创建了2个变量:fromdatetimeimportdate,timedeltasixmonthago=date.today()-timedelta(188)importtimenineteen_seventy=time.strptime('01-01-70','%d-%m-%y')但我不知道如何使用[DeliveryDate]列删除基于这两个变量的行。谁能提供正确的解决方案？最佳答案你可以过滤掉它们:df[(df['Deli

python - 用于推断标题行的 `header=True` 的旧 pre-0.17 pandas.read_csv 行为？

旧的0.17之前版本的pandasread_csv()如何解释传递bool值header=True/False以推断标题行？我有带标题的CSV数据:col1;col2;col31.0;10.0;100.02.0;20.0;200.03.0;30.0;300.0如果用header=True读取即df=pandas.read_csv('test.csv',sep=';',header=True),给出以下数据框:1.010.0100.002202001330300这意味着pandas使用第二行(“第1行”)作为列名(推断的名称为“1.0”、“10.0”和“100.0”)。而如果使用head

推断 read_csv code pandas header python csv

python - Pandas ，将多列的多个功能应用于groupby对象

我想将多列的多个函数应用到一个groupby对象，从而产生一个新的pandas.DataFrame。我知道如何分步完成:by_user=lasts.groupby('user')elapsed_days=by_user.apply(lambdax:(x.elapsed_time*x.num_cores).sum()/86400)running_days=by_user.apply(lambdax:(x.running_time*x.num_cores).sum()/86400)user_df=elapsed_days.to_frame('elapsed_days').join(runn

多列 groupby code section elapsed python pandas dataframe group-by

python - 使用时间戳列表选择由 DatetimeIndex 索引的 Pandas DataFrame 的子集

我有一只PandasDataFrameDatetimeIndex:3425100entries,2011-12-0100:00:00to2011-12-3123:59:59Datacolumns:sig_qual3425100non-nullvaluesheave3425100non-nullvaluesnorth3425099non-nullvalueswest3425097non-nullvaluesdtypes:float64(4)我选择了DataFrame的一个子集使用.ix[start_datetime:end_datetime]然后我将其传递给peakdetectfunct

DatetimeIndex DataFrame code 2011 python time-series pandas

python - 如何在 Rpy2 中使用 pandas 数据帧和 numpy 数组？

我想将pandas与numpy一起用于我的所有分析，但使用Rpy2来绘制我的数据。我想使用pandas数据帧进行所有分析，然后通过rpy2使用R的完整绘图来绘制这些。py2，并且正在使用ipython进行绘图。执行此操作的正确方法是什么？我尝试的几乎所有命令都失败了。例如:我正在尝试绘制pandasDataFramedf两列之间的散点图。我希望在x/y轴中使用df的标签，就像它是R数据帧时一样。有没有办法做到这一点？当我尝试使用r.plot执行此操作时，我得到了这个乱码图:In:r.plot(df.a,df.b)#df是pandasDataFrame产量:输出:rpy2.rinterf

何在 python code rpy2 robjects numpy pandas ipython

Python Pandas，将 DataFrame 写入固定宽度文件(to_fwf？)

我看到Pandas有read_fwf，但它有类似DataFrame.to_fwf的东西吗？我正在寻找对字段宽度、数值精度和字符串对齐的支持。DataFrame.to_csv似乎没有这样做。numpy.savetxt可以，但我不想这样做:numpy.savetxt('myfile.txt',mydataframe.to_records(),fmt='someformat')这似乎是错误的。非常感谢您的想法。最佳答案直到有人implements这在Pandas中，你可以使用tabulate包裹:importpandasaspdfro

DataFrame Python code section tabulate pandas fixed-width

python - 没有为 pandas boxplot (groupby) 设置标题

当绘制按另一列分组的pandas箱线图时，pandas会自动为绘图添加标题，显示“箱线图按...分组”。有没有办法删除它？我尝试使用suptitle('')根据Pandas:boxplotofonecolumnbasedonanothercolumn但这似乎行不通。我正在使用最新的pandas(0.13.1)版本。最佳答案确保你调用的suptitle('')在右图中。In[23]:axes=df.boxplot(by='g')In[24]:fig=axes[0][0].get_figure()In[25]:fig.suptitl

有为 boxplot section pandas code python title

python - 如何更改 Pandas 数据框中的特定行标签？

我有一个数据框，例如:012345041.022.09.04.02.01.016.01.02.01.01.01.024.02.04.01.00.01.031.02.01.01.01.01.045.01.00.01.00.01.0511.45.63.21.60.81.0最后一行包含平均值。我想将最后一行标签重命名为"A"以便数据框看起来像这样:012345041.022.09.04.02.01.016.01.02.01.01.01.024.02.04.01.00.01.031.02.01.01.01.01.045.01.00.01.00.01.0A11.45.63.21.60.81.0我

python Pandas 1.0 code section python-3.x dataframe label

python - 使用 pandas 将索引列添加到 DataFrame

我是pandas的初学者，在研究了文档之后，我仍然找不到一种直接的方法来执行以下操作。我有一个带有pandas.DateRange索引的DataFrame，我想添加一个包含相同DateRange的部分值的列。假设我有dfAB2010-01-0100:00:000.3407170.7024322010-01-0101:00:000.6499700.4117992010-01-0102:00:000.9323670.1080472010-01-0103:00:000.0519420.5263182010-01-0104:00:000.5183010.0578092010-01-0105:0

DataFrame python 01 00 2010 pandas

python - 对 pandas DataFrame 中的空值使用 None 而不是 np.nan

我有一个包含混合数据类型的pandasDataFrame。我想用None替换所有空值(而不是默认的np.nan)。出于某种原因，这似乎几乎是不可能的。实际上我的DataFrame是从csv中读入的，但这里有一个简单的DataFrame混合数据类型来说明我的问题。df=pd.DataFrame(index=[0],columns=range(5))df.iloc[0]=[1,'two',np.nan,3,4]我做不到:>>>df.fillna(None)ValueError:mustspecifyafillmethodorvalue也不是:>>>df[df.isnull()]=NoneT

DataFrame python code section pandas

103 104 105106107 108 109