我正在使用以下每小时计数 (df) 的数据集: datframe 有 8784 行(2016 年,每小时)。
我想看看是否有每日趋势(例如,早上时间是否有所增加。为此,我想创建一个具有一天中的小时(从 0 到 24)的图x 轴和 y 轴上的骑车人数量(类似于下图中来自 http://ofdataandscience.blogspot.co.uk/2013/03/capital-bikeshare-time-series-clustering.html 的图片)。
我尝试了 pivot、resample 和 set_index 的不同方法,并使用 matplotlib 绘制它,但没有成功。换句话说,我找不到一种方法来总结特定时间的每个观察结果,然后为每个工作日绘制这些观察结果
任何想法如何做到这一点?提前致谢!
最佳答案
我想你可以使用 groupby通过 hour和 weekday 并聚合 sum (或者可能是 mean),最后 reshape unstack和 DataFrame.plot :
df = df.groupby([df['Date'].dt.hour, 'weekday'])['Cyclists'].sum().unstack().plot()
解决方案 pivot_table :
df1 = df.pivot_table(index=df['Date'].dt.hour,
columns='weekday',
values='Cyclists',
aggfunc='sum').plot()
示例:
N = 200
np.random.seed(100)
rng = pd.date_range('2016-01-01', periods=N, freq='H')
df = pd.DataFrame({'Date': rng, 'Cyclists': np.random.randint(100, size=N)})
df['weekday'] = df['Date'].dt.weekday_name
print (df.head())
Cyclists Date weekday
0 8 2016-01-01 00:00:00 Friday
1 24 2016-01-01 01:00:00 Friday
2 67 2016-01-01 02:00:00 Friday
3 87 2016-01-01 03:00:00 Friday
4 79 2016-01-01 04:00:00 Friday
print (df.groupby([df['Date'].dt.hour, 'weekday'])['Cyclists'].sum().unstack())
weekday Friday Monday Saturday Sunday Thursday Tuesday Wednesday
Date
0 102 91 120 53 95 86 21
1 102 83 100 27 20 94 25
2 121 53 105 56 10 98 54
3 164 78 54 30 8 42 6
4 163 0 43 48 89 84 37
5 49 13 150 47 72 95 58
6 24 57 32 39 30 76 39
7 127 76 128 38 12 33 94
8 72 3 59 44 18 58 51
9 138 70 67 18 93 42 30
10 77 3 7 64 92 22 66
11 159 84 49 56 44 0 24
12 156 79 47 34 57 55 55
13 42 10 65 53 0 98 17
14 116 87 61 74 73 19 45
15 106 60 14 17 54 53 89
16 22 3 55 72 92 68 45
17 154 48 71 13 66 62 35
18 60 52 80 30 16 50 16
19 79 43 2 17 5 68 12
20 11 36 94 53 51 35 86
21 180 5 19 68 90 23 82
22 103 71 98 50 34 9 67
23 92 38 63 91 67 48 92
df.groupby([df['Date'].dt.hour, 'weekday'])['Cyclists'].sum().unstack().plot()
编辑:
您还可以将 wekkday 转换为 categorical按星期名称正确排序列:
names = [ 'Monday', 'Tuesday', 'Wednesday', 'Thursday','Friday', 'Saturday', 'Sunday']
df['weekday'] = df['weekday'].astype('category', categories=names, ordered=True)
df.groupby([df['Date'].dt.hour, 'weekday'])['Cyclists'].sum().unstack().plot()
关于python pandas 按一天中的小时求和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43585988/
项目介绍随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱小学生兴趣延时班预约小程序的设计与开发被用户普遍使用,为方便用户能够可以随时进行小学生兴趣延时班预约小程序的设计与开发的数据信息管理,特开发了小程序的设计与开发的管理系统。小学生兴趣延时班预约小程序的设计与开发的开发利用现有的成熟技术参考,以源代码为模板,分析功能调整与小学生兴趣延时班预约小程序的设计与开发的实际需求相结合,讨论了小学生兴趣延时班预约小程序的设计与开发的使用。开发环境开发说明:前端使用微信微信小程序开发工具:后端使用ssm:VU
我似乎无法理解这个可能很简单的问题..假设我有日期..Fri,14Sep201218:37:50+0200我如何找出这个月的这个日期是星期几?是第一个,第二个..?第三个?谢谢! 最佳答案 为什么要使用图书馆?Ruby默认有它:Weeknumber:Theweek1ofYYYYstartswithaSundayorMonday(accordingto%Uor%W).Thedaysintheyearbeforethefirstweekareinweek0.%U-Weeknumberoftheyear.Theweekstartswith
为什么下面的代码会报错?['hello','stack','overflow'].inject{|memo,s|memo+s.length}TypeError:can'tconvertFixnumintoStringfrom(irb):2:in`+'from(irb):2:in`blockinirb_binding'from(irb):2:in`each'from(irb):2:in`inject'from(irb):2如果传递了初始值,它就可以正常工作:['hello','stack','overflow'].inject(0){|memo,s|memo+s.length}=>18
我正在尝试从ruby散列中求和值,但使用inject或reduce都没有返回正确答案。似乎这些方法正在覆盖存储的当前值而不是对它们求和。我的哈希看起来像这样:@test=[{"total"=>18,"type"=>"buy","date"=>Thu,21Nov2013,"instrument_code"=>"food"},{"total"=>92,"type"=>"buy","date"=>Thu,14Nov2013,"instrument_code"=>"food"},{"total"=>12,"type"=>"buy","date"=>Wed,20Nov2013,"instru
起初:那不是错误区域的问题。在irb和数据库中,一切都很好。当我想在我的View中显示日期(created_at、updated_at和所有由我自己在每个模型中定义的日期)时,就会出现问题。我试图在application.rb中设置时区并从初始化程序中删除时间格式,但这并没有解决我的问题。Annotategem生成的架构信息:#created_at:datetime#updated_at:datetime#publish_at:datetime来自irb:1.9.2-p290:004>Time.zone=>(GMT+00:00)UTC1.9.2-p290:005>Time.zone.n
我正在使用Resque与Redis处理后台作业。我想每小时调用一次方法Resque.enqueue(MyModel)来执行后台任务。例如:假设我有一个拥有10,000名用户的网站。我只想每天调用此方法24次;不是10,000*24。示例方法如下:Resque.enqueue(MyModel)提前感谢您的帮助。我还应该提一下,我更喜欢坚持使用Resque,而不是转向DelayedJob。谢谢。 最佳答案 您应该为此类任务使用cron作业。我建议您使用Whenevergem。在这里查看railscast:http://railscast
我正在尝试将Ruby中的float格式化为四位数字,包括小数点。例如:1=>01.002.4=>02.401.4455=>01.45现在,我正在尝试按如下方式格式化float:str_result="%.2f"%result这成功地将小数位数限制为两位。我还知道:str_result="%2d"%result它成功地将1转换为01,但丢失了小数位。我试着像这样组合这些:str_result="%2.2f"%result没有明显效果。它与%.2f具有相同的结果。有没有办法强制Ruby将字符串格式化为这种四位数格式? 最佳答案 您可以使
假设我想要明天和现在之间的差异(以小时为单位)。我尝试过的:t=(DateTime.tomorrow-DateTime.now)(t/3600).to_i=>0为什么会给出0?我做错了什么? 最佳答案 这是因为DateTime.tomorrow没有任何时间值。这里:DateTime.tomorrow#=>Wed,22Apr2015如果你通过officialdocumentforDateTime你可以看到没有方法tomorrow。它基本上是Date#tomorrow.您可以使用.to_time获取默认本地时间00:00:00DateT
我找到了这个方法here.start=DateTime.nowsleep15stop=DateTime.now#minutesputs((stop-start)*24*60).to_ihours,minutes,seconds,frac=Date.day_fraction_to_time(stop-start)我有以下错误:`':privatemethod`day_fraction_to_time'calledforDate:Class(NoMethodError)我检查了/usr/lib/ruby/1.9.1/date.rb并找到了它:defday_fraction_to_time(
这是数组版本:Sum2hashesattributeswiththesamekey我有2个数组,例如:a=[[1,10],[2,20],[3,30]]b=[[1,50],[3,70]]我怎样才能对第一个值(如果存在)求和得到:c=[[1,60],[2,20],[3,100]] 最佳答案 你可以这样做:(a+b).group_by(&:first).map{|k,v|[k,v.map(&:last).inject(:+)]}首先,您使用+将数组放在一起,因为您不关心a和b,您只关心它们的元素。然后group_by按第一个元素对组合数组