草庐IT

html - Nokogiri 和 Xpath : find all text between two tags

我不确定这是语法问题还是版本差异问题,但我似乎无法弄清楚。我想获取(非关闭)td中的数据来自h2标记到h3标签。这是HTML的样子。NameIWantTownPhoneNumberemailIwant@nowhere.comwebsiteIwant.comIwanttostopbeforethis!LoremIpsumYaddaYadda205">...直到页面底部才关闭,我认为这可能是我遇到问题的原因。我的Ruby代码如下所示:require'open-uri'require'nokogiri'@doc=Nokogiri::XML(open("http://www.url.co

ruby-on-rails - Xpath 2.0 - xmlXPathCompOpEval : function matches not found

我在我的Rails项目中运行Xpath2.0,并尝试使用它提供的matches()函数,如下所示:page=Mechanize.new.get('http://www.example.com').parserpage.search("//a[matches(text(),'lagerfordon','i')]").first.text抛出以下错误:RuntimeError:xmlXPathCompOpEval:functionmatchesnotfound我做错了什么? 最佳答案 Nokogiri(Mechanize构建于其上)使用

ruby - xpath:如何从第二个表列中获取所有行?

我有一个包含多行和多列的表格。如何使用xpath查找第二列中的所有行? 最佳答案 使用:ExprToTheTable/tr/td[2]|ExprToTheTable/tbody/tr/td[2]这会选择任何tr的任何td子级或table的任何tbody子级,由表达式ExprToTheTable。 关于ruby-xpath:如何从第二个表列中获取所有行?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/

css - 如何使用 Nokogiri(以及 XPATH 和 CSS)提取 HTML 链接和文本

(更新:这个答案是从Nokogiri的Angular写的,但如果您正在寻找特定查询的XPATH或CSS语法,它也很有用。)我喜欢Nokogiri——它是从XML和HTML文档中提取元素的绝佳工具。网上的例子虽然不错,但大多是展示如何操作XML文档。如何使用Nokogiri从HTML中提取链接和链接文本? 最佳答案 这是一个最初为响应Gettingattribute'svalueinNokogiritoextractlinkURLs而编写的小示例,以社区Wiki样式在此处提取,以便于引用。以下是您在解析HTTP链接时可能会执行的一些常

ruby - 我可以使用什么 XPath 来获取第一段节点之后(包括第一段节点)的所有文本节点?

我是Nokogiri和Ruby的新手。我想获取文档中所有节点的文本,从第一个段落节点开始并包含在内。我用XPath尝试了以下操作,但一无所获:putspage.search("//p[0]/text()[next-sibling::node()]")这行不通。我需要更改什么? 最佳答案 你必须找到节点并返回所有text()节点,内部和后续。根据Nokogiri具有的XPath功能,使用以下查询之一://p[1]/(descendant::text()|following::text())如果它不起作用,请改用它,它需要查找第一段两次

ruby - 在 Nokogiri 中使用 XPath 按属性值选择元素

所以如果我有这段代码Example我知道我想获取一个属性为“class”且值为“red”的元素,但我不知道它位于何处。如果我使用XPath,这段代码对吗?dir="http://www.domain.com"doc=Nokogiri::HTML(open(url))doc.xpath('.//*[class="red"]')刚开始学习,不知道有没有错。我不能让它工作。谢谢。编辑:现在可以使用=)doc.xpath('//*[@class="red"]') 最佳答案 将类更改为@class。删除开头的点。然后它将起作用。

ruby - Selenium > 网络驱动器 : how to find a nested element by xpath (ruby)

我有一个嵌套的:linka1linka2linka3linkb1linkb2如何获取'international-map'下的所有链接?我尝试了两种方法都失败了:(div=@driver.find_element(:id=>'international-map')e=@driver.find_elements(:xpath=>"//div[@id='international-map']//div[@tag_name='a']")谢谢(即使是C#和Java代码也有帮助) 最佳答案 好的!您还可以使用#css或#xpath,如下所示:

python - 如何在 Python 中使用 XPath?

支持XPath的库有哪些?有完整的实现吗?图书馆是如何使用的?它的网站在哪里? 最佳答案 libxml2有很多优点:遵守spec积极发展和社区参与速度。这实际上是一个围绕C实现的python包装器。无处不在。libxml2库无处不在,因此经过了很好的测试。缺点包括:遵守spec.很严格。其他库中的默认命名空间处理等操作更容易。使用native代码。这可能会很痛苦,具体取决于您的应用程序是如何分布/部署的。RPM可以减轻这种痛苦。手动资源处理。请注意下面的示例中对freeDoc()和xpathFreeContext()的调用。这不是很

python - 如何在 Python 中使用 XPath?

支持XPath的库有哪些?有完整的实现吗?图书馆是如何使用的?它的网站在哪里? 最佳答案 libxml2有很多优点:遵守spec积极发展和社区参与速度。这实际上是一个围绕C实现的python包装器。无处不在。libxml2库无处不在,因此经过了很好的测试。缺点包括:遵守spec.很严格。其他库中的默认命名空间处理等操作更容易。使用native代码。这可能会很痛苦,具体取决于您的应用程序是如何分布/部署的。RPM可以减轻这种痛苦。手动资源处理。请注意下面的示例中对freeDoc()和xpathFreeContext()的调用。这不是很

php - 使用 xpath 选择 css 类

我只想选择一个名为.date的类由于某种原因,我无法让它工作。如果有人知道我的代码有什么问题,将不胜感激。@$doc=newDOMDocument();@$doc->loadHTML($html);$xml=simplexml_import_dom($doc);//justtomakexpathmoresimple$images=$xml->xpath('//[@class="date"]');foreach($imagesas$img){echo$img."";} 最佳答案 我想写这个问题的规范答案,因为上面的答案有问题。我们的问