Dataframe_草庐IT

python - 从 ElasticSearch 结果创建 DataFrame

我正在尝试在pandas中构建一个DataFrame，使用对Elasticsearch进行非常基本的查询的结果。我得到了我需要的数据，但它需要对结果进行切片以构建正确的数据框。我真的只关心获取每个结果的时间戳和路径。我尝试了几种不同的es.search模式。代码:fromdatetimeimportdatetimefromelasticsearchimportElasticsearchfrompandasimportDataFrame,Seriesimportpandasaspdimportmatplotlib.pyplotaspltes=Elasticsearch(host="192

ElasticSearch DataFrame 39 section code python pandas

python - 从 ElasticSearch 结果创建 DataFrame

我正在尝试在pandas中构建一个DataFrame，使用对Elasticsearch进行非常基本的查询的结果。我得到了我需要的数据，但它需要对结果进行切片以构建正确的数据框。我真的只关心获取每个结果的时间戳和路径。我尝试了几种不同的es.search模式。代码:fromdatetimeimportdatetimefromelasticsearchimportElasticsearchfrompandasimportDataFrame,Seriesimportpandasaspdimportmatplotlib.pyplotaspltes=Elasticsearch(host="192

ElasticSearch DataFrame 39 section code python pandas

python - 在两个 Numpy 数组之间创建 Pandas Dataframe，然后绘制散点图

我对numpy和pandas比较陌生(我是一名实验物理学家，所以多年来我一直在使用ROOT……)。ROOT中的一个常见图是2D散点图，其中给定x和y值列表，生成一个变量与另一个变量的“热图”类型散点图。如何用numpy和Pandas最好地完成这项工作？我正在尝试使用Dataframe.plot()函数，但我什至难以创建Dataframe。importnumpyasnpimportpandasaspdx=np.random.randn(1,5)y=np.sin(x)df=pd.DataFrame(d)首先，这个数据框的形状为(1,2)，但我希望它的形状为(5,2)。如果我能得到正确的数据

Dataframe python section code numpy pandas scatter

python - 在两个 Numpy 数组之间创建 Pandas Dataframe，然后绘制散点图

我对numpy和pandas比较陌生(我是一名实验物理学家，所以多年来我一直在使用ROOT……)。ROOT中的一个常见图是2D散点图，其中给定x和y值列表，生成一个变量与另一个变量的“热图”类型散点图。如何用numpy和Pandas最好地完成这项工作？我正在尝试使用Dataframe.plot()函数，但我什至难以创建Dataframe。importnumpyasnpimportpandasaspdx=np.random.randn(1,5)y=np.sin(x)df=pd.DataFrame(d)首先，这个数据框的形状为(1,2)，但我希望它的形状为(5,2)。如果我能得到正确的数据

Dataframe python section code numpy pandas scatter

python - 如何根据多个标准对 Pandas DataFrame 进行排序？

我有以下DataFrame，其中包含歌曲名称、他们的最高排行榜位置以及他们在第1位花费的周数:SongPeakWeeks76PaperbackWriter116117LadyMadonna19118HeyJude12722Can'tBuyMeLove11729AHardDay'sNight11448TicketToRide11456Help!117109AllYouNeedIsLove116173TheBalladOfJohnAndYoko11385EleanorRigby11487YellowSubmarine11420IWantToHoldYourHand12445IFeelFin

DataFrame python section sort_values code pandas

python - 如何根据多个标准对 Pandas DataFrame 进行排序？

我有以下DataFrame，其中包含歌曲名称、他们的最高排行榜位置以及他们在第1位花费的周数:SongPeakWeeks76PaperbackWriter116117LadyMadonna19118HeyJude12722Can'tBuyMeLove11729AHardDay'sNight11448TicketToRide11456Help!117109AllYouNeedIsLove116173TheBalladOfJohnAndYoko11385EleanorRigby11487YellowSubmarine11420IWantToHoldYourHand12445IFeelFin

DataFrame python section sort_values code pandas

python - 重置列的 MultiIndex 级别

除了转置两次之外，是否有更短的方法来删除列MultiIndex级别(在我的情况下为basic_amt)？In[704]:testOut[704]:basic_amtFacultyNSWQLDVICAllAll1124FullTime0101PartTime1023In[705]:test.reset_index(level=0,drop=True)Out[705]:basic_amtFacultyNSWQLDVICAll011241010121023In[711]:test.transpose().reset_index(level=0,drop=True).transpose()Ou

MultiIndex 级别 39 code basic python pandas dataframe

python - 重置列的 MultiIndex 级别

除了转置两次之外，是否有更短的方法来删除列MultiIndex级别(在我的情况下为basic_amt)？In[704]:testOut[704]:basic_amtFacultyNSWQLDVICAllAll1124FullTime0101PartTime1023In[705]:test.reset_index(level=0,drop=True)Out[705]:basic_amtFacultyNSWQLDVICAll011241010121023In[711]:test.transpose().reset_index(level=0,drop=True).transpose()Ou

MultiIndex 级别 39 code basic python pandas dataframe

python - 在 Pandas `TimeStamp` 中将 `DataFrame` 列截断为小时精度

我有一个名为df的pandas.DataFrame，它有一个自动生成的索引，其中有一列dt:df['dt'].dtype,df['dt'][0]#(dtype('我想做的是创建一个截断为小时精度的新列。我目前正在使用:df['dt2']=df['dt'].apply(lambdaL:datetime(L.year,L.month,L.day,L.hour))这行得通，所以没关系。但是，我有一种使用pandas.tseries.offsets或创建DatetimeIndex或类似方法的好方法。如果可能的话，是否有一些pandas魔法可以做到这一点？最佳答案

DataFrame TimeStamp code 39 pandas python datetime

python - 在 Pandas `TimeStamp` 中将 `DataFrame` 列截断为小时精度

我有一个名为df的pandas.DataFrame，它有一个自动生成的索引，其中有一列dt:df['dt'].dtype,df['dt'][0]#(dtype('我想做的是创建一个截断为小时精度的新列。我目前正在使用:df['dt2']=df['dt'].apply(lambdaL:datetime(L.year,L.month,L.day,L.hour))这行得通，所以没关系。但是，我有一种使用pandas.tseries.offsets或创建DatetimeIndex或类似方法的好方法。如果可能的话，是否有一些pandas魔法可以做到这一点？最佳答案

DataFrame TimeStamp code 39 pandas python datetime