Pandas-Datareader

python - 如何在 pandas 中拆栈(或旋转？)

我有一个如下所示的数据框:importpandasaspddatelisttemp=pd.date_range('1/1/2014',periods=3,freq='D')s=list(datelisttemp)*3s.sort()df=pd.DataFrame({'BORDER':['GERMANY','FRANCE','ITALY','GERMANY','FRANCE','ITALY','GERMANY','FRANCE','ITALY'],'HOUR1':[2,2,2,4,4,4,6,6,6],'HOUR2':[3,3,3,5,5,5,7,7,7],'HOUR3':[8,8,8,

何在 python HOUR 39 2014 pandas stack pivot

python - 如何使用 Python、Pandas 创建 Decile 和 Quintile 列以根据大小对另一个变量进行排名？

我有一个数据框，其中有一列包含Investment，代表交易者的投资金额。我想在数据框中创建2个新列；一个根据Investment大小给出十分位数排名，另一个给出五分位数排名。我想要1代表投资最大的十分位数，10代表最小的。简单地说，我希望1代表投资最多的五分位数，5代表最小的。我是Pandas的新手，有什么方法可以轻松做到这一点吗？谢谢! 最佳答案您正在寻找的功能在pandas.qcuthttp://pandas.pydata.org/pandas-docs/stable/generated/pandas.qcut.html中I

Quintile 排名 investment investment_df section python pandas ranking

python - 按一定顺序排序(情况: pandas DataFrame Groupby)

我想更改以下代码显示的订单日期。我想要的是顺序为(周一、周二、周三、周四、周五、周六、周日)的结果-我应该说，按特定预定义的顺序按键排序吗？这是我的代码，需要一些调整:f8=df_toy_indoor2.groupby(['device_id','day'])['dwell_time'].sum()print(f8)当前结果:device_iddaydevice_112Thu436518Wed636451Fri770307Tue792066Mon826862Sat953503Sun1019298device_223Mon2534895Thu2857429Tue3303173Fri354

DataFrame Groupby code 39 device python sorting pandas

python - Pandas 数据框绘图

我有这个PandasDataFrame这给了我这个:我该怎么办制作一个新人物，在图中添加标题“TitleHere”以某种方式创建一个映射，以便标签不是29,30等，而是说“第29周”、“第30周”等。将更大版本的图表保存到我的电脑(比如10x10英寸)我已经为此困惑了一个小时了! 最佳答案 importmatplotlib.pyplotasplt#1,4f=plt.figure(figsize=(10,10))#Changethesizeasnecessary#2dataframe.plot(ax=f.gca())#figure.g

python Pandas section image li matplotlib plot

python - 在 Pandas 中将列附加到 HDF 文件的框架

我正在处理CSV格式的大型数据集。我正在尝试逐列处理数据，然后将数据附加到HDF文件中的帧。所有这些都是使用Pandas完成的。我的动机是，虽然整个数据集比我的物理内存大得多，但列大小是可管理的。在稍后阶段，我将通过将列一一加载回内存并对其进行操作来执行特征逻辑回归。我可以制作一个新的HDF文件并用第一列制作一个新的框架:hdf_file=pandas.HDFStore('train_data.hdf')feature_column=pandas.read_csv('data.csv',usecols=[0])hdf_file.append('features',feature_col

python Pandas code section csv hdf5

python - 在 IPython Notebook 中显示所有 pandas 数据帧

我如何识别在当前笔记本session中创建的所有PandasDataFrames？像在SAS中看到工作库中的所有成员的东西是理想的。谢谢。最佳答案解决方案%whoDataFrame说明所有对象...seeingallthemembersintheWorklibrarywouldbeideal.In[1]:a=10b='abs'c=[1,2,3]%who显示所有使用过的名字:In[2]:%whoabc方便地作为列表:In[3]:%who_lsOut[3]:['a','b','c']或者作为具有数据类型的表:In[4]:%whosV

Notebook IPython code DataFrame section python pandas jupyter-notebook

python - 从 pandas 列中删除非 ASCII 字符

一段时间以来，我一直在努力解决这个问题。我试图从DB_user列中删除非ASCII字符，并尝试用空格替换它们。但我不断收到一些错误。这是我的数据框的样子:+-----------------------------------------------------------|DB_usersourcecount|+-----------------------------------------------------------|???/"Ò|Z?)?]??C%??JA10||?D$ZGU;@D??_???T(?)B3||?Q`H??M'?Y??KTK$?Ù‹???Ð©JL4??*?

python pandas section 39 string character-encoding

python - 删除 Pandas 中的重复项，不包括一列

这看起来很简单，但我在互联网上找不到任何相关信息。我有一个如下所示的数据框:CityStateZipDateDescriptionEarlhamIA50072-10362014-10-10PostmarketAssurance:DevicesEarlhamIA50072-10362014-10-10Compliance:DevicesMadridIA50156-17482014-09-10DrugQualityAssurance如何消除与5列中的4列匹配的重复项？与Description不匹配的列。结果是CityStateZipDateDescriptionEarlhamIA50072

python Pandas code section Description

python - Pandas groupby 最大总和

我正在尝试在Pandas中一起使用groupby、nlargest和sum函数，但无法使其正常工作。StateCountyPopulationAlabamaa100Alabamab50Alabamac40Alabamad5Alabamae1...Wyominga.51180Wyomingb.51150Wyomingc.5156Wyomingd.515我想使用groupby按州选择，然后按人口获得前2个县。然后仅使用前2个县的人口数字来计算该州的总和。最后，我会得到一个包含州和人口(前2个县)的列表。我可以让groupby和nlargest正常工作，但是获取nlargest(2)的总和是

groupby python code nlargest pandas group-by sum

python - Pandas Dataframe 多索引合并

我想问一个关于在pandas中合并多索引数据框的问题，这是一个假设的场景:arrays=[['bar','bar','baz','baz','foo','foo','qux','qux'],['one','two','one','two','one','two','one','two']]tuples=list(zip(*arrays))index1=pd.MultiIndex.from_tuples(tuples,names=['first','second'])index2=pd.MultiIndex.from_tuples(tuples,names=['third','fourt

多索 Dataframe 39 code index python pandas merge multi-index

85 86 878889 90 91