pandas

python - 过滤过去 x 天的 pandas 数据框

我有一个数据框，其中包含我每天更新的日期列。我想用过去30天的数据创建它的副本。我根据我在R中的了解尝试了以下语法:df[df[date]>dt.date.today()-30]日期列不是索引，但如果有帮助，我不反对这样做!谢谢! 最佳答案试试这个:importdatetimeimportpandasaspddf[df.the_date_column>datetime.datetime.now()-pd.to_timedelta("30day")]更新:根据Josh的建议进行编辑。关

python - 在 Pandas 中合并多索引数据框

我有2个类似的数据框，结构如下:ind=pd.MultiIndex.from_product([['Day1','Day2'],['D1','D2'],['Mean','StDev','StErr']],names=['interval','device','stats'])df=pd.DataFrame({'col1':[1,2,3,4,5,6,7,8,9,10,11,12]},index=ind)print(df)col1intervaldevicestatsDay1D1Mean1StDev2StErr3D2Mean4StDev5StErr6Day2D1Mean7StDev8StE

多索 python code 39 StDev python-3.x pandas

python - Pandas - 在 groupby 中聚合、排序和最大

我有以下数据框:some_id2016-12-2611:03:100012016-12-2611:03:130012016-12-2612:03:130012016-12-2612:03:130082016-12-2711:03:100092016-12-2711:03:130092016-12-2712:03:130032016-12-2712:03:13011我需要做一些类似transform('size')的事情，并得到N个最大值。要得到这样的东西(N=2):some_idsize2016-12-26001300812016-12-2700920031在pandas0.19.x中

groupby python code section 2016 pandas

python - 如何为所选列选择一行中的最大值和最小值

假设我们有下表我想找到一组特定列的每一行的最大值和最小值(假设CENSUS2010POP、ESTIMATESBASE1010、POPESTIMATE2010)。如何用Pandas做到这一点？最佳答案我想你需要min和max:df_subset=df.set_index('CTYNAME')[['CENSUS2010POP','ESTIMATESBASE1010','POPESTIMATE2010']]df1=df_subset.min(axis=1)print(df1)df2=df_subset.max(axis=1)print

何为 python 39 County section pandas

python - Pandas SQL 中 EXCEPT 子句的类似物是什么？

我有一个样本pandas数据框df:col1col2col3col40a1.02.031bNaNNaN62cNaN8.093dNaN11.0124e13.014.0155f17.018.0196g21.022.023还有第二个df1:col1col2col3col40a1.02.034e13.014.0155f17.018.0196g21.022.023我想得到df中不与df1重叠的子集。实际上，我正在寻找SQL中EXCEPT操作数的等价物。我使用了subtract()函数——但这显然是错误的，因为subtract执行逐元素数值减法。所以我收到一条错误消息:TypeError:unsu

python Pandas True col False sql except

python - Pandas 在 LOC 函数中使用 and 运算符

我想在loc中有两个条件功能但&&或and运算符似乎不起作用。:df:business_idratingsreview_textxyz2'verybad'xyz1'passable'xyz3'okay'abc2'soso'我的代码:我正在尝试收集所有review_text其收视率是并且有id=xyz进入列表id='xyz'mylist=df.loc[df['ratings']我应该得到:['verybad','passable']此代码不起作用，我收到错误:ValueError:ThetruthvalueofaSeriesisambiguous.Usea.empty,a.bool(),

运算符 python code 39 section pandas operator-keyword

python - Pandas :找到匹配值的前一行

我正在尝试使用一列中的值创建一列，但基于另一列与先前值的匹配。这是我当前的代码:d={'a':[1,2,3,1,2,3,2,1],'b':[10,20,30,40,50,60,70,80]}df=pd.DataFrame(d)df['c']=df['b'][df['a']==df['a'].prev()]我想要的输出:abc0110NaN1220NaN2330NaN314010425020536030627050718040...我没有得到，因为.prev()不是真实的东西。有什么想法吗？最佳答案我们可以按a列进行分组，默认情况

python Pandas code 39 section

python - 上个月日期时间 Pandas

我有一个日期时间实例声明如下:dtDate=datetime.datetime(2016,1,1,0,0)如何从dtDate获取上个月和上一年？例如像这样的东西:dtDate.minusOneMonth()#toreturndatetime.datetime(2015,12,1,0,0) 最佳答案您可以使用:dtDate=datetime.datetime(2016,1,1,0,0)print(dtDate-pd.DateOffset(months=1))2015-12-0100:00:00print(dtDate-pd.Date

上个月 python code section dtDate pandas datetime

python - Pandas 与 Numpy 数据帧

看看这几行代码:df2=df.copy()df2[1:]=df[1:]/df[:-1].values-1df2.ix[0,:]=0我们的讲师说我们需要使用.values属性来访问底层的numpy数组，否则我们的代码将无法运行。我知道pandasDataFrame确实有一个作为numpy数组的底层表示，但我不明白为什么我们不能仅使用切片直接在pandasDataFrame上操作。你能解释一下吗？最佳答案 pandas专注于表格数据结构，在执行操作(加法、减法等)时，它会查看标签-而不是位置。考虑以下DataFrame:df=pd.D

python Pandas code section pre numpy multidimensional-array dataframe

python - "IndexError: positional indexers are out-of-bounds"当他们显然不是

这是我正在使用的一些代码的MWE。我通过切片和一些条件慢慢地削减了一个初始数据帧，直到我只有我需要的行。每个五行block实际上代表一个不同的对象，因此，当我减少内容时，如果每个五行block中的任何一行满足条件，我想保留它——这就是循环keep.index完成的。无论如何，当我完成后，我可以看到我想要的最终索引存在，但我收到一条错误消息，指出“IndexError:位置索引器超出范围。”这里发生了什么？importpandasaspdimportnumpyasnptemp=np.random.rand(100,5)df=pd.DataFrame(temp,columns=['Firs

out-of-bounds IndexError indices section new_indices_to_use python pandas dataframe conditional-statements

37 38 394041 42 43