草庐IT

Nokogiri

全部标签

ruby - 使用 Nokogiri 的例子有哪些?

我想了解Nokogiri。有没有人有指向Nokogiri解析/抓取显示结果树的基本示例的链接。认为这真的有助于我的理解。 最佳答案 使用IRB和Ruby1.9.2:加载Nokogiri:>require'nokogiri'#=>true解析文档:>doc=Nokogiri::HTML('foobar')#=>#Nokogiri喜欢结构良好的文档。请注意,它添加了DOCTYPE因为我将其解析为文档。也可以将其解析为文档片段,但那是非常专业的。>doc.to_html#=>"\nfoobar\n"搜索文档找到第一个使用CSS节点并获取其

ruby - 使用 Nokogiri 获取节点的兄弟节点

有没有办法在一个节点中找到一个特定的值,然后返回它所有的兄弟值?例如,我想查找包含ID5678的id节点,然后获取与ID5678关联的电子邮件地址和所有图像。Nokogiri::XML.parse(File.open('info.xml'))这是一个示例XML文件。1234sdfsdf@sdasd.comimages/1.jpgimages/2.jpgimages/3.jpg5678zzzz@zzz.comimages/4.jpgimages/5.jpg9011aaaa@aaa.comimages/6.jpgimages/7.jpg 最佳答案

ruby - 在 Nokogiri 中使用 XPath 按属性值选择元素

所以如果我有这段代码Example我知道我想获取一个属性为“class”且值为“red”的元素,但我不知道它位于何处。如果我使用XPath,这段代码对吗?dir="http://www.domain.com"doc=Nokogiri::HTML(open(url))doc.xpath('.//*[class="red"]')刚开始学习,不知道有没有错。我不能让它工作。谢谢。编辑:现在可以使用=)doc.xpath('//*[@class="red"]') 最佳答案 将类更改为@class。删除开头的点。然后它将起作用。

ruby-on-rails - 如何使用 Nokogiri 导航 DOM

我正在尝试填充变量parent_element_h1和parent_element_h2.谁能帮我用Nokogiri将我需要的信息获取到这些变量中?require'rubygems'require'nokogiri'value=Nokogiri::HTML.parse(AFooBCBarDEF"HTML_ENDparent=value.css('body').first#start_hereisgiven:ANokogiri::XML::Elementofthewiththeid'X2start_here=parent.at('div.block#X2')#thisshouldbeaN

ruby - RVM 1.9.1 和 nokogiri

在rvmruby​​1.9.1下安装nokogirigem时遇到问题。geminstallnokogiri我正在……/usr/include/libxml2...nolibxml2ismissing.try'portinstalllibxml2'or'yuminstalllibxml2-devel'***extconf.rbfailed***但我检查过:sudoapt-getinstalllibxml2我得到了:Readingstateinformation...Donelibxml2isalreadythenewestversion.这可能是根的东西吗?RVM在用户空间中运行所有内容

ruby-on-rails - 防止 Nokogiri 转义字符?

我创建了一个文本节点并像这样插入到我的文档中:#">]>当我尝试用这个保存文档时:File.open('ng.html','w+'){|f|f我在实际文档中得到了这个:<%=stylesheet_link_tag'style'%>有没有办法禁用转义并在我的erb标签完好无损的情况下保存我的页面?谢谢! 最佳答案 也许您想使用"像这样插入原始XML:builder=Nokogiri::XML::Builder.newdo|b|b.htmldob.headdob 关于ruby-o

关于 ruby??:为什么我会从 Nokogiri 收到”错误的状态行”错误?

WhydoIget"wrongstatusline"errorsfromNokogiri?我的Ruby/Nokogiri脚本是:1234567891011121314151617require'rubygems'require'nokogiri'require'open-uri'f=File.new("enterret"+".txt",'w')1.upto(100)do|page| urltext="http://xxxxxxx.com/"+"page/" urltextpage.to_s+"/" doc=Nokogiri::HTML(open(urltext)) doc.css(".phot

关于 ruby??:为什么我会从 Nokogiri 收到”错误的状态行”错误?

WhydoIget"wrongstatusline"errorsfromNokogiri?我的Ruby/Nokogiri脚本是:1234567891011121314151617require'rubygems'require'nokogiri'require'open-uri'f=File.new("enterret"+".txt",'w')1.upto(100)do|page| urltext="http://xxxxxxx.com/"+"page/" urltextpage.to_s+"/" doc=Nokogiri::HTML(open(urltext)) doc.css(".phot