草庐IT

Dataframe

全部标签

python - 从 ElasticSearch 结果创建 DataFrame

我正在尝试在pandas中构建一个DataFrame,使用对Elasticsearch进行非常基本的查询的结果。我得到了我需要的数据,但它需要对结果进行切片以构建正确的数据框。我真的只关心获取每个结果的时间戳和路径。我尝试了几种不同的es.search模式。代码:fromdatetimeimportdatetimefromelasticsearchimportElasticsearchfrompandasimportDataFrame,Seriesimportpandasaspdimportmatplotlib.pyplotaspltes=Elasticsearch(host="192

python - 从 ElasticSearch 结果创建 DataFrame

我正在尝试在pandas中构建一个DataFrame,使用对Elasticsearch进行非常基本的查询的结果。我得到了我需要的数据,但它需要对结果进行切片以构建正确的数据框。我真的只关心获取每个结果的时间戳和路径。我尝试了几种不同的es.search模式。代码:fromdatetimeimportdatetimefromelasticsearchimportElasticsearchfrompandasimportDataFrame,Seriesimportpandasaspdimportmatplotlib.pyplotaspltes=Elasticsearch(host="192

python - 在两个 Numpy 数组之间创建 Pandas Dataframe,然后绘制散点图

我对numpy和pandas比较陌生(我是一名实验物理学家,所以多年来我一直在使用ROOT……)。ROOT中的一个常见图是2D散点图,其中给定x和y值列表,生成一个变量与另一个变量的“热图”类型散点图。如何用numpy和Pandas最好地完成这项工作?我正在尝试使用Dataframe.plot()函数,但我什至难以创建Dataframe。importnumpyasnpimportpandasaspdx=np.random.randn(1,5)y=np.sin(x)df=pd.DataFrame(d)首先,这个数据框的形状为(1,2),但我希望它的形状为(5,2)。如果我能得到正确的数据

python - 在两个 Numpy 数组之间创建 Pandas Dataframe,然后绘制散点图

我对numpy和pandas比较陌生(我是一名实验物理学家,所以多年来我一直在使用ROOT……)。ROOT中的一个常见图是2D散点图,其中给定x和y值列表,生成一个变量与另一个变量的“热图”类型散点图。如何用numpy和Pandas最好地完成这项工作?我正在尝试使用Dataframe.plot()函数,但我什至难以创建Dataframe。importnumpyasnpimportpandasaspdx=np.random.randn(1,5)y=np.sin(x)df=pd.DataFrame(d)首先,这个数据框的形状为(1,2),但我希望它的形状为(5,2)。如果我能得到正确的数据

python - 如何根据多个标准对 Pandas DataFrame 进行排序?

我有以下DataFrame,其中包含歌曲名称、他们的最高排行榜位置以及他们在第1位花费的周数:SongPeakWeeks76PaperbackWriter116117LadyMadonna19118HeyJude12722Can'tBuyMeLove11729AHardDay'sNight11448TicketToRide11456Help!117109AllYouNeedIsLove116173TheBalladOfJohnAndYoko11385EleanorRigby11487YellowSubmarine11420IWantToHoldYourHand12445IFeelFin

python - 如何根据多个标准对 Pandas DataFrame 进行排序?

我有以下DataFrame,其中包含歌曲名称、他们的最高排行榜位置以及他们在第1位花费的周数:SongPeakWeeks76PaperbackWriter116117LadyMadonna19118HeyJude12722Can'tBuyMeLove11729AHardDay'sNight11448TicketToRide11456Help!117109AllYouNeedIsLove116173TheBalladOfJohnAndYoko11385EleanorRigby11487YellowSubmarine11420IWantToHoldYourHand12445IFeelFin

python - 重置列的 MultiIndex 级别

除了转置两次之外,是否有更短的方法来删除列MultiIndex级别(在我的情况下为basic_amt)?In[704]:testOut[704]:basic_amtFacultyNSWQLDVICAllAll1124FullTime0101PartTime1023In[705]:test.reset_index(level=0,drop=True)Out[705]:basic_amtFacultyNSWQLDVICAll011241010121023In[711]:test.transpose().reset_index(level=0,drop=True).transpose()Ou

python - 重置列的 MultiIndex 级别

除了转置两次之外,是否有更短的方法来删除列MultiIndex级别(在我的情况下为basic_amt)?In[704]:testOut[704]:basic_amtFacultyNSWQLDVICAllAll1124FullTime0101PartTime1023In[705]:test.reset_index(level=0,drop=True)Out[705]:basic_amtFacultyNSWQLDVICAll011241010121023In[711]:test.transpose().reset_index(level=0,drop=True).transpose()Ou

python - 在 Pandas `TimeStamp` 中将 `DataFrame` 列截断为小时精度

我有一个名为df的pandas.DataFrame,它有一个自动生成的索引,其中有一列dt:df['dt'].dtype,df['dt'][0]#(dtype('我想做的是创建一个截断为小时精度的新列。我目前正在使用:df['dt2']=df['dt'].apply(lambdaL:datetime(L.year,L.month,L.day,L.hour))这行得通,所以没关系。但是,我有一种使用pandas.tseries.offsets或创建DatetimeIndex或类似方法的好方法。如果可能的话,是否有一些pandas魔法可以做到这一点? 最佳答案

python - 在 Pandas `TimeStamp` 中将 `DataFrame` 列截断为小时精度

我有一个名为df的pandas.DataFrame,它有一个自动生成的索引,其中有一列dt:df['dt'].dtype,df['dt'][0]#(dtype('我想做的是创建一个截断为小时精度的新列。我目前正在使用:df['dt2']=df['dt'].apply(lambdaL:datetime(L.year,L.month,L.day,L.hour))这行得通,所以没关系。但是,我有一种使用pandas.tseries.offsets或创建DatetimeIndex或类似方法的好方法。如果可能的话,是否有一些pandas魔法可以做到这一点? 最佳答案