草庐IT

ruby - 使用 Nokogiri 拆分 BR 标签上的内容

我有一段代码试图用nokogiri解析,看起来像这样:Link1(info1),Blah1,Link2(info1),Blah1,Link3(info2),Blah1Foo2,我可以使用如下方式访问td.j的源代码:data_items=doc.css("td.j")我的目标是将每一行拆分成一个哈希数组。我能看到的唯一合乎逻辑的拆分点是拆分BR,然后在字符串上使用一些正则表达式。我想知道是否有更好的方法来做到这一点,也许只使用nokogiri?即使我可以使用nokogiri来提取3个行项目,它也会使我的事情变得更容易,因为我可以对.content结果进行一些正则表达式解析。但不确定如何

ruby-on-rails - XPath 或 CSS 解析速度更快(对于 HTML 文件上的 Nokogiri)?

我想知道NokogiriXPath或CSS解析是否可以更快地处理HTML文件。速度有何不同? 最佳答案 Nokogiri没有XPath或CSS解析。它将XML/HTML解析为单个DOM,然后您可以使用CSS或XPath语法进行查询。CSS选择器在要求libxml2执行查询之前在内部转换为XPath。因此(对于完全相同的选择器)XPath版本会快一点点,因为CSS不需要先转换成XPath。但是,您的问题没有通用答案;这取决于您选择的是什么,以及您的XPath是什么样的。很有可能,您不会编写与Nokogiri创建的相同的XPath。例如

ruby-on-rails - Nokogiri 和 XPath 中未定义的命名空间前缀

我正在尝试解析YoutubeGdata以查看是否存在具有给定ID的视频。但是没有普通的标签,而是带有命名空间。在链接上http://gdata.youtube.com/feeds/api/videos?q=KgfdlZuVz7I有标签:1有命名空间openSearch:xmlns:openSearch='http://a9.com/-/spec/opensearchrss/1.0/'但我不知道如何在Nokogiri和Ruby中处理它。部分代码如下:xmlfeed=Nokogiri::HTML(open("http://gdata.youtube.com/feeds/api/videos

ruby - 检查元素是否有两个类

我有2个可能的div。和有没有办法检查div元素是否有2个类a和b?我使用Ruby、Capybara和XPath来选择元素,但如果可以解决问题,css也可以。 最佳答案 这个css选择器应该在capybara中工作:page.has_css?('div.a.b')哪个会匹配但不是 关于ruby-检查元素是否有两个类,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/11745409/

ruby - 如何使用 XPath 和 Nokogiri 获取 XML 节点的内容

我有这样的代码:@doc=Nokogiri::HTML(open(url)@doc.xpath(query).eachdo|html|putshtml#howgetcontentofanodeend我如何获取节点的内容而不是像这样: 最佳答案 这是READMEfile中的概要示例为Nokogiri展示了一种使用CSS、XPath或混合的方法:require'nokogiri'require'open-uri'#GetaNokogiri::HTML:Documentforthepagewe’reinterestedin...doc=N

ruby - 如何通过 CSS 而不是 XPath 选择带有文本内容的元素?

“Nokogiri:Howtoselectnodesbymatchingtext?”可以通过XPath执行此操作,但是,我正在寻找一种使用与元素文本匹配的CSS选择的方法。PyQuery和PHPQuery可以做到这一点。没有用于Ruby的jQueryAPI库吗? 最佳答案 Nokogiri(现在)实现了jQuery选择器,使得搜索节点文本成为可能:例如:require'nokogiri'html='foobar'doc=Nokogiri::HTML(html)doc.at('p:contains("bar")').text.stri

ruby - 通过类属性的部分匹配获取所有元素

我正在尝试使用Nokogiri显示来自URL的结果。(本质上是抓取一个URL)。我有一些HTML类似于:MattyMatthewSuzie所以我需要找到所有以单词“matt”开头的元素。我需要做的是保存元素的值和元素名称,以便下次我可以引用它..所以我需要捕获"Matty"and"""Matthew"and""我还没有想出如何捕获元素HTML,但这是我目前拥有的元素(它不起作用!)doc=Nokogiri::HTML(open(url))tmp=""doc.xpath("[class*=matt").eachdo|item|tmp+=item.textend@testy2=tmp

ruby - capybara - 使用 xPath 查找正在离开范围内

我正在尝试使用默认的Rails日期、时间和日期时间字段通过Capybara构建一个日期选择器。我正在使用within方法来查找该字段的选择框,但是当我使用xPath查找正确的框时,它会离开within范围并在元素的页面。这是我使用的代码。我正在测试的页面有2个日期时间字段,但由于这个错误,我只能让它更改第一个。目前我有一个div容器,其id包含日期时间字段,但我确实计划切换代码以通过标签查找。moduleMarketronmoduleDateTimedefselect_date(field,options={})date_parse=Date.parse(options[:with])

ruby yaml ypath 像 xpath?

你好,我有一个像这样的yaml文件---data:-date:"2004-06-11"description:Firstdescription-date:"2008-01-12"description:Anotherdescripion我如何为xml执行类似于xpath的“ypath”查询?类似于“获取日期为2004-06-11的描述”YAML.parse_file('myfile.yml').select('/data/*/date==2004-06-11')你是怎么做到的,如果可能的话,我怎样才能类似地通过“ypath”编辑描述?谢谢 最佳答案

ruby - 用于类似正则表达式匹配的 xpath 表达式?

我想在具有特定模式的html文档中搜索divid。我想在正则表达式中匹配这个模式:foo_([[:digit:]]{1.8})使用xpath。上述模式的xpath等价物是什么?我坚持//div[@id="foo_然后什么?如果有人能为它继续一个合法的表达。编辑抱歉,我想我必须详细说明一下。其实不是foo_,它是post_message_顺便说一句,我使用mechanize/nokogiri(ruby​​)这是片段:html_doc=Nokogiri::HTML(open(myfile))message_div=html_doc.xpath('//div[substring(@id,13