草庐IT

关于 r:字段的单独内容

codeneng 2023-03-28 原文

Separate contents of field

我确定这很简单,我认为这是使用分离和聚集的情况。

我在数据框中有一个字段,作者列表,已编辑的 pubmed 搜索导出。它包含出版物的作者。显然,它可以包含单个作者或作者的合作。

例如,这只是可用选项的选择:

1
2
Author
Drijgers RL, Verhey FR, Leentjens AF, Kahler S, Aalten P.

我想做的是创建一个所有作者的单一列表,这样我就会有类似

的东西

1
2
3
4
5
6
Author
Drijgers RL
Verhey FR
Leentjens AF
Kahler S
Aalten P

我该怎么做?
我以为它会像

1
authSpread<-authorlist%>%separate(Author,sep =",",extra ="drop")

但它不起作用。
如果我输入 = "NA"
我只在一个专栏中列出了第一作者。
我想做的是将文本复制到 excel 中的列功能,您可以在其中指定要拆分的字符,并将单元格的内容投射/传播到新单元格。然后将它们重新收集到一列中。
我不知道作者的最大数量,因此不知道以编程方式分割的列数(或如何标记它们)。

编辑:澄清
我不知道我是否想制作一个长宽的数据框然后收集 - 因为我不知道会生成多少个字段。这是明智之举吗?
我想我可以将单独的输出写入 "," 到一个列表中,然后将该列表的内容写入单个数据框。
这听起来更有效率吗?


你正在寻找 separate_rows.

输入:

1
2
3
4
df <- data.frame(authors = c("Drijgers RL, Verhey FR, Leentjens AF, K????hler S, Aalten P."))

                                                     authors
1 Drijgers RL, Verhey FR, Leentjens AF, K????hler S, Aalten P.

功能:

1
2
3
library(tidyverse)

df %>% separate_rows(authors, sep =",")

输出:

1
2
3
4
5
6
       authors
1  Drijgers RL
2    Verhey FR
3 Leentjens AF
4    K????hler S
5    Aalten P.

您可以将它们保存在这样的列表中:

1
authors_list <- df %>% separate_rows(authors, sep =",") %>% pull(authors)

输出:

1
[1]"Drijgers RL" "Verhey FR"   "Leentjens AF""K????hler S"   "Aalten P."

如果您的列表中有多篇文章的作者,并且您只想要唯一的出现,只需在末尾添加 unique()

1
authors_list <- df %>% separate_rows(authors, sep =",") %>% pull(authors) %>% unique()

  • 感谢您提供出色的解决方案。我可以在 excel 中简单地做到这一点:分出第一作者,分出最后一个作者。然后计算作者作为第一作者或最后作者出现的次数。如何在 R 中复制它?我可以从上面的单独行答案中计算作者发表出版物的总次数。 (很抱歉挤了一个额外的问题)
  • 最后的附加问题(我希望)。我将如何将第一作者和最后作者分开以分隔列。将来知道这可能很有用。在这个答案 stackoverflow.com/questions/46717210/... 中,列数是已知的。怎么说"以逗号分割这个字符串,并根据作者列表中的姓名数量将它们放入未知数量的列中"?
  • @damo,不客气,如果有帮助,请考虑接受答案。我认为最好将第二个问题变成 SO 上的另一个问题,因为内容不同。
  • 行。会做。再次感谢。

有关关于 r:字段的单独内容的更多相关文章

  1. ruby - 将数组的内容转换为 int - 2

    我需要读入一个包含数字列表的文件。此代码读取文件并将其放入二维数组中。现在我需要获取数组中所有数字的平均值,但我需要将数组的内容更改为int。有什么想法可以将to_i方法放在哪里吗?ClassTerraindefinitializefile_name@input=IO.readlines(file_name)#readinfile@size=@input[0].to_i@land=[@size]x=1whilex 最佳答案 只需将数组映射为整数:@land边注如果你想得到一条线的平均值,你可以这样做:values=@input[x]

  2. ruby-on-rails - 如何验证非模型(甚至非对象)字段 - 2

    我有一个表单,其中有很多字段取自数组(而不是模型或对象)。我如何验证这些字段的存在?solve_problem_pathdo|f|%>... 最佳答案 创建一个简单的类来包装请求参数并使用ActiveModel::Validations。#definedsomewhere,atthesimplest:require'ostruct'classSolvetrue#youcouldevencheckthesolutionwithavalidatorvalidatedoerrors.add(:base,"WRONG!!!")unlesss

  3. ruby-on-rails - form_for 中不在模型中的自定义字段 - 2

    我想向我的Controller传递一个参数,它是一个简单的复选框,但我不知道如何在模型的form_for中引入它,这是我的观点:{:id=>'go_finance'}do|f|%>Transferirde:para:Entrada:"input",:placeholder=>"Quantofoiganho?"%>Saída:"output",:placeholder=>"Quantofoigasto?"%>Nota:我想做一个额外的复选框,但我该怎么做,模型中没有一个对象,而是一个要检查的对象,以便在Controller中创建一个ifelse,如果没有检查,请帮助我,非常感谢,谢谢

  4. ruby-on-rails - 如何在我的 Rails 应用程序 View 中打印 ruby​​ 变量的内容? - 2

    我是一个Rails初学者,但我想从我的RailsView(html.haml文件)中查看Ruby变量的内容。我试图在ruby​​中打印出变量(认为它会在终端中出现),但没有得到任何结果。有什么建议吗?我知道Rails调试器,但更喜欢使用inspect来打印我的变量。 最佳答案 您可以在View中使用puts方法将信息输出到服务器控制台。您应该能够在View中的任何位置使用Haml执行以下操作:-puts@my_variable.inspect 关于ruby-on-rails-如何在我的R

  5. ruby-on-rails - 在 Rails 和 ActiveRecord 中查询时忽略某些字段 - 2

    我知道我可以指定某些字段来使用pluck查询数据库。ids=Item.where('due_at但是我想知道,是否有一种方法可以指定我想避免从数据库查询的某些字段。某种反拔?posts=Post.where(published:true).do_not_lookup(:enormous_field) 最佳答案 Model#attribute_names应该返回列/属性数组。您可以排除其中一些并传递给pluck或select方法。像这样:posts=Post.where(published:true).select(Post.attr

  6. ruby - 查找字符串中的内容类型(数字、日期、时间、字符串等) - 2

    我正在尝试解析一个CSV文件并使用SQL命令自动为其创建一个表。CSV中的第一行给出了列标题。但我需要推断每个列的类型。Ruby中是否有任何函数可以找到每个字段中内容的类型。例如,CSV行:"12012","Test","1233.22","12:21:22","10/10/2009"应该产生像这样的类型['integer','string','float','time','date']谢谢! 最佳答案 require'time'defto_something(str)if(num=Integer(str)rescueFloat(s

  7. ruby - 如何使用 Selenium Webdriver 根据 div 的内容执行操作? - 2

    我有一个使用SeleniumWebdriver和Nokogiri的Ruby应用程序。我想选择一个类,然后对于那个类对应的每个div,我想根据div的内容执行一个Action。例如,我正在解析以下页面:https://www.google.com/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=puppies这是一个搜索结果页面,我正在寻找描述中包含“Adoption”一词的第一个结果。因此机器人应该寻找带有className:"result"的div,对于每个检查它的.descriptiondiv是否包含单词“adoption

  8. ruby-on-rails - 使用包含多个关联和单独的条件 - 2

    我的Gallery模型中有以下查询:media_items.includes(:photo,:video).rank(:position_in_gallery)我的图库模型有_许多媒体项,每个都有一个照片或视频关联。到目前为止,一切正常。它返回所有media_items包括它们的photo或video关联,由media_item的position_in_gallery属性排序。但是我现在需要将此查询返回的照片限制为仅具有is_processing属性的照片,即nil。是否可以进行相同的查询,但条件是返回的照片等同于:.where(photo:'photo.is_processingIS

  9. ruby-on-rails - Sphinx - 何时对字段使用 'has' 和 'indexes' - 2

    我几天前在我的ruby​​onrails2.3.2上安装了Sphinx和Thinking-Sphinx,基本搜索效果很好。这意味着,没有任何条件。现在,我想用一些条件过滤搜索。我有公告模型,索引如下所示:define_indexdoindexestitle,:as=>:title,:sortable=>trueindexesdescription,:as=>:description,:sortable=>trueend也许我错了,但我注意到只有当我将:sortable=>true语法添加到这些属性时,我才能将它们用作搜索条件。否则它找不到任何东西。现在,我还在使用acts_as_tag

  10. Ruby - 如何处理子类意外覆盖父类(super class)私有(private)字段的问题? - 2

    假设您编写了一个类Sup,我决定将其扩展为SubSup。我不仅需要了解你发布的接口(interface),还需要了解你的私有(private)字段。见证这次失败:classSupdefinitialize@privateField="fromsup"enddefgetXreturn@privateFieldendendclassSub问题是,解决这个问题的正确方法是什么?看起来子类应该能够使用它想要的任何字段而不会弄乱父类(superclass)。编辑:equivalentexampleinJava返回"fromSup",这也是它应该产生的答案。 最佳答案

随机推荐