xpath

ruby - 使用 Nokogiri 拆分 BR 标签上的内容

我有一段代码试图用nokogiri解析，看起来像这样:Link1(info1),Blah1,Link2(info1),Blah1,Link3(info2),Blah1Foo2,我可以使用如下方式访问td.j的源代码:data_items=doc.css("td.j")我的目标是将每一行拆分成一个哈希数组。我能看到的唯一合乎逻辑的拆分点是拆分BR，然后在字符串上使用一些正则表达式。我想知道是否有更好的方法来做到这一点，也许只使用nokogiri？即使我可以使用nokogiri来提取3个行项目，它也会使我的事情变得更容易，因为我可以对.content结果进行一些正则表达式解析。但不确定如何

Nokogiri ruby 34 gt title parsing xpath screen-scraping

ruby-on-rails - XPath 或 CSS 解析速度更快(对于 HTML 文件上的 Nokogiri)？

我想知道NokogiriXPath或CSS解析是否可以更快地处理HTML文件。速度有何不同？最佳答案 Nokogiri没有XPath或CSS解析。它将XML/HTML解析为单个DOM，然后您可以使用CSS或XPath语法进行查询。CSS选择器在要求libxml2执行查询之前在内部转换为XPath。因此(对于完全相同的选择器)XPath版本会快一点点，因为CSS不需要先转换成XPath。但是，您的问题没有通用答案；这取决于您选择的是什么，以及您的XPath是什么样的。很有可能，您不会编写与Nokogiri创建的相同的XPath。例如

ruby-on-rails Nokogiri XPath code ruby

ruby-on-rails - Nokogiri 和 XPath 中未定义的命名空间前缀

我正在尝试解析YoutubeGdata以查看是否存在具有给定ID的视频。但是没有普通的标签，而是带有命名空间。在链接上http://gdata.youtube.com/feeds/api/videos?q=KgfdlZuVz7I有标签:1有命名空间openSearch:xmlns:openSearch='http://a9.com/-/spec/opensearchrss/1.0/'但我不知道如何在Nokogiri和Ruby中处理它。部分代码如下:xmlfeed=Nokogiri::HTML(open("http://gdata.youtube.com/feeds/api/videos

未定 ruby-on-rails code openSearch section ruby xpath nokogiri

ruby - 检查元素是否有两个类

我有2个可能的div。和有没有办法检查div元素是否有2个类a和b？我使用Ruby、Capybara和XPath来选择元素，但如果可以解决问题，css也可以。最佳答案这个css选择器应该在capybara中工作:page.has_css?('div.a.b')哪个会匹配但不是关于ruby-检查元素是否有两个类，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/11745409/

ruby 检查 section code div xpath capybara

ruby - 如何使用 XPath 和 Nokogiri 获取 XML 节点的内容

我有这样的代码:@doc=Nokogiri::HTML(open(url)@doc.xpath(query).eachdo|html|putshtml#howgetcontentofanodeend我如何获取节点的内容而不是像这样: 最佳答案这是READMEfile中的概要示例为Nokogiri展示了一种使用CSS、XPath或混合的方法:require'nokogiri'require'open-uri'#GetaNokogiri::HTML:Documentforthepagewe’reinterestedin...doc=N

Nokogiri XPath section 39 ruby nodes

ruby - 如何通过 CSS 而不是 XPath 选择带有文本内容的元素？

“Nokogiri:Howtoselectnodesbymatchingtext?”可以通过XPath执行此操作，但是，我正在寻找一种使用与元素文本匹配的CSS选择的方法。PyQuery和PHPQuery可以做到这一点。没有用于Ruby的jQueryAPI库吗？最佳答案 Nokogiri(现在)实现了jQuery选择器，使得搜索节点文本成为可能:例如:require'nokogiri'html='foobar'doc=Nokogiri::HTML(html)doc.at('p:contains("bar")').text.stri

XPath ruby section stackoverflow questions nokogiri

ruby - 通过类属性的部分匹配获取所有元素

我正在尝试使用Nokogiri显示来自URL的结果。(本质上是抓取一个URL)。我有一些HTML类似于:MattyMatthewSuzie所以我需要找到所有以单词“matt”开头的元素。我需要做的是保存元素的值和元素名称，以便下次我可以引用它..所以我需要捕获"Matty"and"""Matthew"and""我还没有想出如何捕获元素HTML，但这是我目前拥有的元素(它不起作用!)doc=Nokogiri::HTML(open(url))tmp=""doc.xpath("[class*=matt").eachdo|item|tmp+=item.textend@testy2=tmp

ruby 通过 34 class section xpath nokogiri

ruby - capybara - 使用 xPath 查找正在离开范围内

我正在尝试使用默认的Rails日期、时间和日期时间字段通过Capybara构建一个日期选择器。我正在使用within方法来查找该字段的选择框，但是当我使用xPath查找正确的框时，它会离开within范围并在元素的页面。这是我使用的代码。我正在测试的页面有2个日期时间字段，但由于这个错误，我只能让它更改第一个。目前我有一个div容器，其id包含日期时间字段，但我确实计划切换代码以通过标签查找。moduleMarketronmoduleDateTimedefselect_date(field,options={})date_parse=Date.parse(options[:with])

capybara xPath 34 field select ruby ruby-on-rails-3 cucumber ruby-1.9.2

ruby yaml ypath 像 xpath？

你好，我有一个像这样的yaml文件---data:-date:"2004-06-11"description:Firstdescription-date:"2008-01-12"description:Anotherdescripion我如何为xml执行类似于xpath的“ypath”查询？类似于“获取日期为2004-06-11的描述”YAML.parse_file('myfile.yml').select('/data/*/date==2004-06-11')你是怎么做到的，如果可能的话，我怎样才能类似地通过“ypath”编辑描述？谢谢最佳答案

xpath ypath section description strong ruby yaml

ruby - 用于类似正则表达式匹配的 xpath 表达式？

我想在具有特定模式的html文档中搜索divid。我想在正则表达式中匹配这个模式:foo_([[:digit:]]{1.8})使用xpath。上述模式的xpath等价物是什么？我坚持//div[@id="foo_然后什么？如果有人能为它继续一个合法的表达。编辑抱歉，我想我必须详细说明一下。其实不是foo_，它是post_message_顺便说一句，我使用mechanize/nokogiri(ruby)这是片段:html_doc=Nokogiri::HTML(open(myfile))message_div=html_doc.xpath('//div[substring(@id,13

xpath ruby substring code substring-after regex

123 4 5