将多年和月付款数据转换为每月r

程序员大本营 2024-07-09 原文

在R：我有两个我加入的文件。两者都包含佣金数据，我有两个文件，因为工作代码的薪酬结构期限不同。例如，所有文件中的所有工作代码均为每月支付佣金，并且文件二中的所有工作代码均为每两个月付款。为了准确，公平地分析我需要汇总（sum）付款到一个新字段（我们将其称为“每月lylypay”）的数据（当前是一个因素），我的问题是我似乎成功地汇总了每位员工的月薪，但目前忽略了不同的年份。我不反对在6/2017 2017年以1-24的薪水从6/2015-6/2017散布或虚拟编码，但我想知道是否有一次可以一次完成这件事？

当前的：

Check_DT   EMPLID   DEPTID JOBCODE PAY_FREQUENCY MAX._TTL.GROSS2015-12-18 99999999 23231606  100880             W           12032015-12-24 99999999 23231606  100880             W            5972015-12-31 99999999 23231606  100880             W            6252016-01-08 99999999 23231606  100880             W            2452016-01-13 99999999 23231606  100880             W            4802016-01-15 99999999 23231606  100880             W            7582016-01-22 99999999 23231606  100880             W            5992016-01-29 99999999 23231606  100880             W            5512016-02-05 99999999 23231606  100880             W            7672016-02-12 99999999 23231606  100880             W            8802016-02-19 99999999 23231606  100880             W            5572016-02-26 99999999 20441606  100880             W            9092016-03-04 99999999 20441606  100880             W            9892016-03-11 99999999 20441606  100880             W            7512016-03-18 99999999 20441606  100880             W            7762016-03-25 99999999 20441606  100880             W            7702016-04-01 99999999 20441606  100880             W            7122016-04-08 99999999 20441606  100880             W            6022016-04-15 99999999 20441606  100880             W            7982016-04-22 99999999 20441606  100880             W            527

我想要的（实际上，我将要运行集群分析）：

>Check_DT   EMPLID   DEPTID JOBCODE PAY_FREQUENCY MAX._TTL.GROSS Year Month Pay>2015-12-18 99999999 23231606  100880             W           1203 2015 12 2425>2015-12-24 99999999 23231606  100880             W            597 >2015-12-31 99999999 23231606  100880             W            625>2016-01-08 99999999 23231606  100880             W            245 2016 01 2633>2016-01-13 99999999 23231606  100880             W            480>2016-01-15 99999999 23231606  100880             W            758>2016-01-22 99999999 23231606  100880             W            599>2016-01-29 99999999 23231606  100880             W            551>2016-02-05 99999999 23231606  100880             W            767>2016-02-12 99999999 23231606  100880             W            880>2016-02-19 99999999 23231606  100880             W            557>2016-02-26 99999999 20441606  100880             W            909>2016-03-04 99999999 20441606  100880             W            989>2016-03-11 99999999 20441606  100880             W            751>2016-03-18 99999999 20441606  100880             W            776>2016-03-25 99999999 20441606  100880             W            770>2016-04-01 99999999 20441606  100880             W            712>2016-04-08 99999999 20441606  100880             W            602>2016-04-15 99999999 20441606  100880             W            798>2016-04-22 99999999 20441606  100880             W            527

等等...我什至不反对重复每年和月份组合的年度和日期，我可以摆脱重复项。提醒您文件中的某些人每周支付一次，而另一些人则是每两月付费。

这是我所做的：

#Convert weekly/bimonthly pay to monthly sum of pay  paydat_all$monthlypay <- month(paydat_all$Check_DT)  aggregate(MAX._TTL.GROSS~monthlypay+EMPLID, FUN = sum, data = paydat_all)

看答案

这应该为您带来所需的结果

library(lubridate)library(dplyr) data = 'Check_DT   EMPLID   DEPTID JOBCODE PAY_FREQUENCY MAX._TTL.GROSS"2015-12-18" 99999999 23231606  100880             W           1203"2015-12-24" 99999999 23231606  100880             W            597"2015-12-31" 99999999 23231606  100880             W            625"2016-01-08" 99999999 23231606  100880             W            245"2016-01-13" 99999999 23231606  100880             W            480"2016-01-15" 99999999 23231606  100880             W            758"2016-01-22" 99999999 23231606  100880             W            599"2016-01-29" 99999999 23231606  100880             W            551"2016-02-05" 99999999 23231606  100880             W            767"2016-02-12" 99999999 23231606  100880             W            880"2016-02-19" 99999999 23231606  100880             W            557"2016-02-26" 99999999 20441606  100880             W            909"2016-03-04" 99999999 20441606  100880             W            989"2016-03-11" 99999999 20441606  100880             W            751"2016-03-18" 99999999 20441606  100880             W            776"2016-03-25" 99999999 20441606  100880             W            770"2016-04-01" 99999999 20441606  100880             W            712"2016-04-08" 99999999 20441606  100880             W            602"2016-04-15" 99999999 20441606  100880             W            798"2016-04-22" 99999999 20441606  100880             W            527'paydat_all <- read.table(text=data, header=TRUE,                          colClasses=c("Date", "character", "character",                                       "character", "factor", "integer"))paydat_all <- paydat_all %>%              mutate(Year = year(Check_DT),                     Month = month(Check_DT)) %>%              group_by(EMPLID, DEPTID, JOBCODE, Year, Month) %>%              summarise(sum(MAX._TTL.GROSS))

每月多年 99999999 100880 23231606

有关将多年和月付款数据转换为每月r的更多相关文章

ruby-on-rails - 在 Rails 中将文件大小字符串转换为等效千字节 - 2
我的目标是转换表单输入，例如“100兆字节”或“1GB”，并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前，我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效，但前提是输入是倍数(“gigabytes”，而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以，功能正常，
ruby - 使用 ruby 将 HTML 转换为纯文本并维护结构/格式 - 2
我想将html转换为纯文本。不过，我不想只删除标签，我想智能地保留尽可能多的格式。为插入换行符标签，检测段落并格式化它们等。输入非常简单，通常是格式良好的html(不是整个文档，只是一堆内容，通常没有anchor或图像)。我可以将几个正则表达式放在一起，让我达到80%，但我认为可能有一些现有的解决方案更智能。最佳答案首先，不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案，它会随着HTML的变化而崩溃，或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
ruby - 解析 RDFa、微数据等的最佳方式是什么，使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2
我主要使用Ruby来执行此操作，但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式，例如使用这个yaml文件，它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
ruby - 将数组的内容转换为 int - 2
我需要读入一个包含数字列表的文件。此代码读取文件并将其放入二维数组中。现在我需要获取数组中所有数字的平均值，但我需要将数组的内容更改为int。有什么想法可以将to_i方法放在哪里吗？ClassTerraindefinitializefile_name@input=IO.readlines(file_name)#readinfile@size=@input[0].to_i@land=[@size]x=1whilex 最佳答案只需将数组映射为整数:@land边注如果你想得到一条线的平均值，你可以这样做:values=@input[x]
ruby - 将散列转换为嵌套散列 - 2
这道题是thisquestion的逆题.给定一个散列，每个键都有一个数组，例如{[:a,:b,:c]=>1,[:a,:b,:d]=>2,[:a,:e]=>3,[:f]=>4,}将其转换为嵌套哈希的最佳方法是什么{:a=>{:b=>{:c=>1,:d=>2},:e=>3,},:f=>4,} 最佳答案这是一个迭代的解决方案，递归的解决方案留给读者作为练习:defconvert(h={})ret={}h.eachdo|k,v|node=retk[0..-2].each{|x|node[x]||={};node=node[x]}node[
ruby - 如何每月在 Heroku 运行一次 Scheduler 插件？ - 2
在选择我想要运行操作的频率时，唯一的选项是“每天”、“每小时”和“每10分钟”。谢谢!我想为我的Rails3.1应用程序运行调度程序。最佳答案这不是一个优雅的解决方案，但您可以安排它每天运行，并在实际开始工作之前检查日期是否为当月的第一天。关于ruby-如何每月在Heroku运行一次Scheduler插件？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/8692687/
ruby - Ruby 有 `Pair` 数据类型吗？ - 2
有时我需要处理键/值数据。我不喜欢使用数组，因为它们在大小上没有限制(很容易不小心添加超过2个项目，而且您最终需要稍后验证大小)。此外，0和1的索引变成了魔数(MagicNumber)，并且在传达含义方面做得很差(“当我说0时，我的意思是head...”)。散列也不合适，因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题，但我很想知道:Ruby标准库是否已经带有这样一个类？最佳
ruby-on-rails - Ruby url 到 html 链接转换 - 2
我正在使用Rails构建一个简单的聊天应用程序。当用户输入url时，我希望将其输出为html链接(即“url”)。我想知道在Ruby中是否有任何库或众所周知的方法可以做到这一点。如果没有，我有一些不错的正则表达式示例代码可以使用... 最佳答案查看auto_linkRails提供的辅助方法。这会将所有URL和电子邮件地址变成可点击的链接(htmlanchor标记)。这是文档中的代码示例。auto_link("Gotohttp://www.rubyonrails.organdsayhellotodavid@loudthinking.
ruby-on-rails - 使用 ruby 将多个实例变量转换为散列的更好方法？ - 2
我收到格式为的回复#我需要将其转换为哈希值(针对活跃商家)。目前我正在遍历变量并执行此操作:response.instance_variables.eachdo|r|my_hash.merge!(r.to_s.delete("@").intern=>response.instance_eval(r.to_s.delete("@")))end这有效，它将生成{:first="charlie",:last=>"kelly"},但它似乎有点hacky和不稳定。有更好的方法吗？编辑:我刚刚意识到我可以使用instance_variable_get作为该等式的第二部分，但这仍然是主要问题。
ruby - 我如何添加二进制数据来遏制 POST - 2
我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_

将多年和月付款数据转换为每月r

看答案

有关将多年和月付款数据转换为每月r的更多相关文章

随机推荐