草庐IT

文字提取

全部标签

ruby - 如何从 ruby​​ 中的字符串中提取 float ?

很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visitthehelpcenter.关闭10年前。我有一个包含不同货币数量的字符串,例如,"454,54$","Rs566.33","discount88,0$"etc.模式不一致,我只想从字符串和货币中提取float。我如何在Ruby中实现这一点?

Ruby:如何解析字符串以提取内容并将其分配给变量

我有一个看起来像这样的字符串:"mynameis:andrew"我想解析字符串,从字符串中提取名称,并将其分配给一个变量。我如何使用Ruby做到这一点?更新:我用作示例的字符串只是一个示例。我将使用的字符串可以更改格式,因此您不能依赖实际示例中的冒号。以下是我正在使用的一些示例:"/nickandrew"#command:nick,value:"andrew""/joindevelopers"#command:join,value:"developers""/leave"#command:leave,value:nil我想使用某种正则表达式来解决这个问题(因为字符串可以更改格式),而不

ruby - 在 Ruby 中提取字符串中的所有 url

我有一些文本内容,其中包含一个URL列表。我正在尝试抓取所有URL并将它们放入一个数组中。我有这个代码content="HereisthelistofURLs:http://www.google.comhttp://www.google.com/index.html"urls=content.scan(/^(http|https):\/\/[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}(([0-9]{1,5})?\/.*)?$/ix)我试图让最终结果是:['http://www.google.com','http://www.google.com/

ruby - 如何从 capybara 元素中提取 Selenium 元素?

与Ruby、Capybara和SitePrism相比,我对Java和Selenium更熟悉,如果这个问题比较粗,我深表歉意。Selenium有一个非常有用的类来管理Select标签,Selenium::WebDriver::Support::Select,可以通过将代表选择的Selenium元素(Selenium::WebDriver::Element)传递给它来创建。我想要一个Select对象,以便我可以使用它的便捷方法。然而,使用SitePrism和Capybara,定义元素的标准方法让我可以访问由Capybara的元素类建模的选择,Capybara::Node::Element,

ruby - 如何使用正则表达式从字符串中提取子字符串?

我是Ruby中正则表达式的新手。该字符串看起来像http://www.site.com/media/pool/product_color_purple.jpg我正试图从中提取其中有颜色的部分。这可以是可变长度,因为一些颜色类似于prince_purple.jpg。所以我有:colour=c.attr('src').match(/(.*)color_(.*).jpg/)puts"Colouris#{colour}"颜色返回的是字符串,而不是提取的位,即颜色。这里出了什么问题? 最佳答案 str="http://www.site.com

ruby-on-rails - 我将如何从 Ruby on Rails 中的哈希数组中分解和提取数组?

例如:[(id=>1,email=>'tim@tim.com',name=>'tim'),(id=>2,email=>'joe@joe.com',name=>'joe'),(id=>3,email=>'dan@dan.com',name=>'dan')]如何提取电子邮件列并将其放入自己的数组中? 最佳答案 让我们称您的数组为users。你可以这样做:users.map{|u|u[:email]}这会一个一个地查看散列,将它们称为u,提取:email键,并在新的用户电子邮件数组中返回结果。

ruby - 邮件 gem 。将收件人显示名称和地址提取为单独的值

使用邮件gem(即Rails+ActionMailer),是否有一种干净的方法来获取收件人的显示名称?我可以通过以下方式获取地址:mail.to.first我可以通过以下方式获取格式化的显示名称+地址:mail.header_fields.select{|f|f.name=="To"}.first.to_s但是我怎样才能得到显示名称部分(即在和>之前)。我知道有人会建议使用正则表达式,但这不是我想要的,因为我随后必须解析任何编码,而这正是Mailgem可能已经做的事情。我是一个流行的PHPMailer库的作者,我知道在之前假设位的缺陷。和>是人类可读的,在标题中,当8位字符开始发挥作用

ruby - ruby 中的字符串文字如何绕过 new/initialize,有没有办法对此进行检测?

今天下午我在玩一个主意,偶然发现了一些我不太明白的东西。基本上我在这个实验中试图实现的是在每次创建字符串时以某种方式知道(供以后使用,例如在某种DSL中)。以下内容适用于通过String.new创建的任何字符串:class::Stringclass例如irb>String.new("foo")initializing'foo'newing'foo'=>"foo"我想不通的是当您使用文字时如何创建String对象。例如,为什么这不经过相同的初始化和设置:irb>"literalstring"=>"literalstring"我意识到当字符串是文字时,编译器会做一些不同的事情,但它不需要初

Ruby:如何从日期时间字符串中提取一个小时(或一天)

我正在从一个大型CSV文件中提取日期时间字符串,如下所示:"11/19/200821:56"我只想提取小时,这样我就可以构建所有小时的直方图以找到最频繁的小时。同样,我想从日期中提取星期几(名称)并构建最频繁日期的直方图。我是Ruby的新手,查了资料,初学者尝试了以下各种形式,但没有运气:require'date'putsDateTime.strptime("11/19/200821:56",'%I')您能否建议一种简单(清晰)的方法来完成上述任务?此外,任何关于如何表示结果的建议都会很棒。我在想一个小时的哈希数组(24个条目)和一个天的哈希数组(7个条目)?当我遍历日期时间字符串时加

ruby - 从 ruby​​ 中的 PDF 中提取文本(我有 PDF 的链接)

我有一个链接http://www.downloads.com/help.pdf我想下载这个,然后解析它来获取文本内容。我该怎么做?我还计划标记化(如果有这样的词)提取的文本 最佳答案 您可以使用pdf-readergem(example/text.rb示例很简单并且对我有用):https://github.com/yob/pdf-reader或命令行实用程序pdftotext。 关于ruby-从ruby​​中的PDF中提取文本(我有PDF的链接),我们在StackOverflow上找到一