草庐IT

Pandas-Datareader

全部标签

python - pandas,matplotlib,使用数据帧索引作为轴刻度标签

我正在使用matplotlib的imshow()函数来显示pandas.DataFrame。我想从DataFrame.index和DataFrame.columns列表中绘制x轴和y轴的标签和刻度,但我不知道该怎么做。假设data是一个pandas.DataFrame:>>>printdataIndex:201entries,1901to2101Datacolumns:jan201non-nullvaluesfeb201non-nullvaluesmar201non-nullvaluesapr201non-nullvaluesmay201non-nullvaluesjun201non-

python - Pandas 根据条件交换列

我有一个如下所示的Pandas数据框:Col1Col2Col30A7NaN1B16NaN1B1615我想要做的是将Col2与Col3交换,其中Col3的值为NaN。根据SO上的其他帖子和答案,到目前为止我有这段代码:df[['Col2','Col3']]=df[['Col3','Col2']].where(df[['Col3']].isnull())但这似乎无法正常工作并给了我以下信息:Col1Col2Col30ANaNNaN1BNaNNaN1BNaNNaN这里有什么我可能遗漏的吗?更新:我想要的输出如下:Col1Col2Col30ANaN71BNaN161B1615谢谢

python - 在 Pandas 数据框中随机插入 NA 的值

如何在DataFrame中随机插入np.nan?假设我想在我的DataFrame中包含10%的空值。我的数据是这样的:df=pd.DataFrame(np.random.randn(5,3),index=['a','b','c','d','e'],columns=['one','two','three'])onetwothreea0.6951321.044791-1.059536b-1.0751050.8257761.899795c-0.6789800.051959-0.691405d-0.1829281.455268-1.032353e0.2050940.714192-0.93824

python - 在 Pandas 数据框中的列子集中查找具有非零值的行

我有一个包含4列字符串和其他整数的数据框。现在我需要找出那些数据行,其中至少一列是非零值(或>0)。manwra,sahAyaH,T7,0,0,0,0,Tmanwra,akriti,T5,0,0,1,0,Kawma,prabrtih,B6,0,1,1,0,S我的输出应该是manwra,akriti,T5,0,0,1,0,Kawma,prabrtih,B6,0,1,1,0,S我尝试了以下方法来获得答案。字符串值位于第0、1、2和-1列(最后一列)。KT[KT.ix[:,3:-2]!=0]我收到的输出是NaN,NaNNaN,NaN,NaN,NaN,NaN,NaNNaN,NaN,NaN,Na

python - 展平 Pandas 数据透视表

这是我的question的跟进.除了数据透视表,是否可以将表展平为如下所示:data={'year':['2016','2016','2015','2014','2013'],'country':['uk','usa','fr','fr','uk'],'sales':[10,21,20,10,12],'rep':['john','john','claire','kyle','kyle']}pd.DataFrame(data).pivot_table(index='country',columns='year',values=['rep','sales'])repsalesyear201

python - Pandas :将数据框附加到另一个 df

我在附加数据框时遇到问题。我尝试执行这段代码df_all=pd.read_csv('data.csv',error_bad_lines=False,chunksize=1000000)urls=pd.read_excel('url_june.xlsx')substr=urls.url.values.tolist()df_res=pd.DataFrame()fordfindf_all:foriinsubstr:res=df[df['url'].str.contains(i)]df_res.append(res)当我尝试保存df_res时,我得到空数据框。df_all看起来像ID,"url

python - Pandas TimeGrouper 和 Pivot?

这是我的数据框的样子:TimestampCAT02016-12-0223:35:2820012016-12-0223:37:4320022016-12-0223:40:4930032016-12-0223:58:5340042016-12-0223:59:02300...这就是我在Pandas中尝试做的事情(注意时间戳是分组的):TimestampBINS2003004005002016-12-0223:3020002016-12-0223:4001002016-12-0223:500110...我正在尝试创建10分钟时间间隔的bin,以便制作条形图。并将列作为CAT值,这样我就可以计

Python 使用 pandas 将 xlsx 转换为 csv 文件。如何删除索引列?

我正在使用以下代码将.xlsx文件转换为.csv文件。importpandasaspddata_xls=pd.read_excel('excelfile.xlsx','Sheet2',index_col=None)data_xls.to_csv('csvfile.csv',encoding='utf-8')代码正在运行,但是我得到了一个索引列,其中包含我不想要的单元格编号。无论如何不包括或删除该索引列?文件输出UnnamedData00.9931961310.9931961320.9931961330.9931961340.9931961350.99319613

python - Pandas :添加其他列的长度作为值的列

我想向现有数据框添加一个附加列,该数据框的值是“seller_name”列的长度。输出应该是这样的:seller_namename_length-------------|-------------Rick|4Hannah|6但是,我很难获得正确的代码。df['name_length']=len(df['seller_name'])只是给我整列的长度(6845)和df['nl']=df[len('seller_name')]抛出一个KeyError。有人知道实现我的目标的正确命令吗?非常感谢! 最佳答案 使用.str字符串访问器对D

python - Pandas :按多个条件过滤组?

我有一个如下所示的数据框:df=pd.DataFrame([{'id':123,'date':'2016-01-01','is_local':True},{'id':123,'date':'2017-01-01','is_local':False},{'id':124,'date':'2016-01-01','is_local':True},{'id':124,'date':'2017-01-01','is_local':True}])df.date=df.date.astype('datetime64[ns]')我想获取所有ID的列表,其中is_local在2016年初为True,但