草庐IT

关于 r:基于另一个值的重复序列

Repeatingsequencebasedonanothervalue我正在处理这样设置的数据结构:数据12345678910structure(list(ID=c(1147L,1147L,1147L,1147L,1147L,1147L,1147L,1147L,1147L,1147L,1147L,1147L,4085L,4085L,4085L,4085L,4085L,4085L,4085L),year=c(1L,1L,1L,2L,2L,2L,3L,3L,3L,4L,4L,4L,1L,1L,1L,2L,2L,2L,3L),term=c(1L,3L,5L,1L,3L,5L,1L,3L,5L,1L

关于 r:如何将指标列转换为连接列(列名)

Howtoconvertindicatorcolumnstoaconcatenatedcolumn(ofcolumnnames)我有3列由指标(0/1)组成1234icolsstructure(list(delivery_group=c(0,1,1,0,0),culturally_tailored=c(0,0,1,0,1),integrated_intervention=c(1,0,0,0,0)),class=c("tbl_df","tbl","data.frame"),row.names=c(NA,-5L))我想返回单个字符列\\'qualifiers\\',这样带有指示符==1的列名连接在

关于 data.table:R – 在巨大的 data.frame 中改变条件

R-mutateconditioninhugedata.frame所以我有非常大的数据集(>1000obs.of>15000variables),我不想用1替换所有值>1并保持其余部分不变。示例数据:12345678910111213data  a bc1 1 -1a2 2 -2b3 3 -3c4 4 -4d5 5 -5e6 6 -6f7 7 -7g8 8 -8h9 9 -9i1010-10j这是我的dplyr方法:1234567data%>%mutate_if(is.numeric,                  funs(                   case_when(   

关于 data.table:R – 在巨大的 data.frame 中改变条件

R-mutateconditioninhugedata.frame所以我有非常大的数据集(>1000obs.of>15000variables),我不想用1替换所有值>1并保持其余部分不变。示例数据:12345678910111213data  a bc1 1 -1a2 2 -2b3 3 -3c4 4 -4d5 5 -5e6 6 -6f7 7 -7g8 8 -8h9 9 -9i1010-10j这是我的dplyr方法:1234567data%>%mutate_if(is.numeric,                  funs(                   case_when(   

关于 dplyr 包中的 r:summarise 与 summarise_each 函数

summarisevs.summarise_eachfunctionindplyrpackage我正在尝试使用dplyr包将数据与group_by拆分后总结一个变量的值,以下代码工作正常,输出如下所示,但我不能用summriase替换summarise_each甚至只有一个列需要计算,不知道为什么?12  iris%>%group_by(Species)%>%select(one_of('Sepal.Length'))%>%            summarise_each(funs(mean(.)))或者我会得到类似"S3:lazy"的输出。你的预期输出是什么?使用您的代码,我将Speci

关于 dplyr 包中的 r:summarise 与 summarise_each 函数

summarisevs.summarise_eachfunctionindplyrpackage我正在尝试使用dplyr包将数据与group_by拆分后总结一个变量的值,以下代码工作正常,输出如下所示,但我不能用summriase替换summarise_each甚至只有一个列需要计算,不知道为什么?12  iris%>%group_by(Species)%>%select(one_of('Sepal.Length'))%>%            summarise_each(funs(mean(.)))或者我会得到类似"S3:lazy"的输出。你的预期输出是什么?使用您的代码,我将Speci

关于 dplyr:Sum 通过在 R 中聚合复杂的配对名称

SumbyaggregatingcomplexpairednamesinR在R中,我尝试根据唯一ID聚合数据帧,但我需要为ID使用某种通配符值。这意味着我有这样的配对名称:123lion_tigerelephant_liontiger_lion我需要将lion_tiger和tiger_lionID相加,因为这对中的顺序无关紧要。以这个数据框为例:12df       value=c("12","10","19","2","34","29","13","3","14"))因此,对ID、"1_2"和"2_1"的值需要在一个新表中求和。然后该新行将显示为:11_236有什么建议吗?虽然我的示例将数字

关于 dplyr:Sum 通过在 R 中聚合复杂的配对名称

SumbyaggregatingcomplexpairednamesinR在R中,我尝试根据唯一ID聚合数据帧,但我需要为ID使用某种通配符值。这意味着我有这样的配对名称:123lion_tigerelephant_liontiger_lion我需要将lion_tiger和tiger_lionID相加,因为这对中的顺序无关紧要。以这个数据框为例:12df       value=c("12","10","19","2","34","29","13","3","14"))因此,对ID、"1_2"和"2_1"的值需要在一个新表中求和。然后该新行将显示为:11_236有什么建议吗?虽然我的示例将数字

关于 r:删除整个数据框中的句点/点

Removeperiods/dotsinentiredataframe我有一个包含来自世界各地的参与者的大型数据集。其中一些参与者使用点/句点/逗号输入数据来表示千位分隔符,但R将它们读取为逗号,这完全扭曲了我的数据......例如1234变成1,234。我想删除所有的点/句点/逗号。我的数据完全由完整的数字组成,因此任何地方都不应该有任何小数。我尝试使用stringr,但不太明白。这是一个(我希望)可重复的示例,其中包含我的一小部分数据:1234567891011121314structure( list(  chnb=c(10L,35L,55L),  B1_1_77=c(117.586, 

关于 r:删除整个数据框中的句点/点

Removeperiods/dotsinentiredataframe我有一个包含来自世界各地的参与者的大型数据集。其中一些参与者使用点/句点/逗号输入数据来表示千位分隔符,但R将它们读取为逗号,这完全扭曲了我的数据......例如1234变成1,234。我想删除所有的点/句点/逗号。我的数据完全由完整的数字组成,因此任何地方都不应该有任何小数。我尝试使用stringr,但不太明白。这是一个(我希望)可重复的示例,其中包含我的一小部分数据:1234567891011121314structure( list(  chnb=c(10L,35L,55L),  B1_1_77=c(117.586,