dataframe_草庐IT

python - 使用包含空格的列名查询 Pandas DataFrame 或使用包含空格的列名的 drop 方法

我希望使用pandas根据列名(包含空格)和单元格值删除行。我已经尝试了多种方法来实现这一点(删除和查询方法)，但由于名称中的空格，我似乎失败了。有没有办法使用其中有空格的名称查询数据，或者我是否需要先清理所有空格？csv文件形式的数据Date,"price","SaleItem"2012-06-11,1600.20,item12012-06-12,1610.02,item22012-06-13,1618.07,item32012-06-14,1624.40,item42012-06-15,1626.15,item52012-06-16,1626.15,item62012-06-17,

列名 DataFrame 39 Item python pandas

python - 如何根据条件用列名替换 Pandas 数据框中的值？

我有一个看起来像这样的数据框:我想用列名替换A:D范围内的所有1，这样最终结果应该类似于:我该怎么做？你可以用这个重新创建我的数据框:dfz=pd.DataFrame({'A':[1,0,0,1,0,0],'B':[1,0,0,1,0,1],'C':[1,0,0,1,3,1],'D':[1,0,0,1,0,0],'E':[22.0,15.0,None,10.,None,557.0]}) 最佳答案一种方法是使用replace并将系列映射列标签传递给值(在本例中为相同的标签):>>>dfz.loc[:,'A':'D'].replace

列名 python section code 39 pandas dataframe

python - Pandas - 如何对多个变量进行分组和拆分？

我目前有一些结构如下的数据集:data={'participant':[100,101,102,103,104,105,106,107,108,109],'step_name':['first','first','second','third','second','first','first','first','second','third'],'title':['acceptable','acceptable','notacceptable','acceptable','notacceptable','acceptable','notacceptable','acceptable',

python Pandas 39 acceptable code dataframe

python - Pandas :更改具有多级列的数据框中的特定列名

我想找到在多级数据框中更改特定列名称的方法。有了这些数据:data={('A','1','I'):[1,2,3,4,5],('B','2','II'):[1,2,3,4,5],('C','3','I'):[1,2,3,4,5],('D','4','II'):[1,2,3,4,5],('E','5','III'):[1,2,3,4,5],}dataDF=pd.DataFrame(data)此代码无效:dataDF.rename(columns={('A','1','I'):('Z','100','Z')},inplace=True)结果:ABCDE12345IIIIIIIII011111

列名 python 39 code pre pandas dataframe multi-level

python - Pandas DataFrame 排序忽略大小写

我有一个用Python编写的Pandas数据框。dataframe的内容来自here.我稍微修改了“单个”列中第一个字母的大小写。这是我所拥有的:importpandasaspddf=pd.read_csv('test.csv')printdfPositionArtistSingleYearWeeks1FrankieLaineIBelieve195318weeks2BryanAdamsIDoItforYou199116weeks3WetWetWetloveIsAllAround199415weeks4Drake(feat.Wizkid&Kyla)OneDance201615weeks5

DataFrame python weeks section strong sorting pandas

python - 如何选择包含大于阈值的值的所有行？

请求很简单:我想选择包含大于阈值的值的所有行。如果我这样做:df[(df>threshold)]我得到这些行，但低于该阈值的值只是NaN。如何避免选择这些行？最佳答案绝对不需要双重换位——你可以简单地调用any沿着bool矩阵上的列索引(提供1或'columns')。df[(df>threshold).any(1)]示例>>>df=pd.DataFrame(np.random.randint(0,100,50).reshape(5,10))>>>df0123456789045538963629629564261074419745

python 的 code section gt pandas dataframe

python - 通过 Pandas 数据框中的多索引选择(子集)

我想知道是否有一种干净的方法可以基于多索引选择或子集Pandas数据框。我的数据看起来像这样(id和date是索引):valuesiddate101132010-07-2124.70002010-07-2225.26002010-07-2325.28002010-07-2625.37002010-07-2725.2900102232011-07-2124.70002011-07-2225.26002011-07-2325.28002011-07-2625.37002011-07-2725.2900我想要这样的东西:df.xs[10223).xs('2011-07-21':'2011-0

多索 python 2011 code 07 pandas subset dataframe

python - 在不添加新日期的情况下重新采样日内 pandas DataFrame

我想在不添加新日期的情况下对一些日内数据进行下采样df.resample('30Min')会增加周末等，这是不受欢迎的。有什么办法吗？最佳答案组合的groupby/resample可能有效:In[22]:dates=pd.date_range('01-Jan-2014','11-Jan-2014',freq='T')[0:-1]...:dates=dates[dates.dayofweek 关于python-在不添加新日期的情况下重新采样日内pandasDataFrame，我们在St

DataFrame python 2014 01 00 pandas time-series

python - 使用 pandas 从日志文件分析生成 session

我正在分析一个Apache日志文件，并将其导入到一个pandas数据框中。'65.55.52.118--[30/May/2013:06:58:52-0600]"GET/detailedAddVen.php?refId=7954&uId=2802HTTP/1.1"2004514"-""Mozilla/5.0(compatible;bingbot/2.0;+http://www.bing.com/bingbot.htm)"'我的数据框:我想根据IP、代理和时差将其分组到session中(如果持续时间大于30分钟，则应该是一个新session)。通过IP和Agent对数据帧进行分组很容易，但

session python code pandas section timedelta dataframe

python - 如何反向执行 date_range？

我正在处理如何反向创建日期范围的问题。我正在尝试这个:importpandasaspddates=pd.date_range(end='2/08/2014',periods=104,freq='W-Sat',closed=None)我总是从晚到早，如下所示:[2012-02-18,...,2014-02-08]Length:104,Freq:W-SAT,Timezone:None我想从“2014-02-08”开始。谢谢解决方法:感谢您指出内置的反向功能，您需要返回并创建DatetimeIndex以在时间序列中使用它，如下所示:dTmp=pd.date_range(end='2/08/2

反向 date_range section code python pandas time-series dataframe