草庐IT

Nokogiri

全部标签

ruby - Nokogiri递归地得到所有 child

问题我正在针对各种URL运行一些统计数据。我想找到child数量最集中的顶级元素。我想遵循的方法是识别所有顶级元素,然后确定页面上所有元素的百分比属于它。目标递归地获取给定元素的所有子元素。输入:一个Nokogiri元素输出:Nokogiri元素数组或child总数设置ruby1.9.2Nokogirigem我最终得出的结果(这可行,但不如我在下面选择的答案那么漂亮)getChildCount(elem)children=elem.childrenreturn0unlesschildrenandchildren.count>0child_count=children.countchil

ruby - 我如何使用 nokogiri 验证 XHTML?

我发现一些帖子暗示您可以使用nokogirigem根据其DTD验证XHTML。虽然我已经成功地使用它来解析XHTML(寻找“a”标签等),但我正在努力验证文档。对我来说,这是:doc=Nokogiri::XML(Net::HTTP.get(URI.parse("http://www.w3.org")))putsdoc.validate结果是:[#,#,#,#,#,#所以我假设这不是正确的方法。我似乎找不到任何好的例子-谁能指出我做错了什么?我在MacOSX10.5.8上运行ruby​​1.8.6。Nokogiri告诉我:nokogiri:1.3.3warnings:[]libxml:c

ruby - 使用 Nokogiri 向元素添加类

显然是Nokogiri的add_class方法仅适用于NodeList,使此代码无效:doc.search('a').eachdo|anchor|anchor.inner_text="hello!"anchor.add_class("whatever")#WHOOPS!end我该怎么做才能使这段代码正常工作?我想应该是这样的doc.search('a').eachdo|anchor|anchor.inner_text="hello!"Nokogiri::XML::NodeSet.new(anchor).add_class("whatever")end但这也行不通。请告诉我,我不必为单个

ruby - 如何让 Ruby Mechanize 获得一个存在于字符串中的页面

通常Mechanize将从URL获取网页,get方法的结果是一个Mechanize::Page对象,您可以从中使用很多有用的方法。如果页面存在于字符串中,我如何获得相同的Mechanize::Page对象?require'mechanize'html=PageTitleThisisatestEND_OF_STRINGagent=Mechanize.new#HowcanIgetthepageresultfromthestringhtml?#page=... 最佳答案 Mechanize使用Nokogiri来解析HTML。如果您在不需要

ruby-on-rails - 安装 nokogiri Mac OS X 10.8.2 XCode 安装

尝试在MountainLion上安装nokogiri。我使用的是ruby​​1.8.7,但刚刚升级到1.9.3,但它阻止了捆绑安装的工作。顺便说一下,我可以通过卸载ruby​​1.9.3并恢复到1.8.7来解决这个问题。然而,这显然是一个次优的解决方案,因为我不想在剩下的时间里一直停留在1.8.7上......Users-MacBook-Pro:sample_appuser$lsGemfileappdocscriptGemfile.lockconfiglibspecREADME.mdconfig.rulogtmpRakefiledbpublicvendorRavins-MacBook-

ruby - 如何在 XPath 中获取序列的最后一个元素?

在Ruby中,我们可以访问带有负数的数组,如array[-1]以获取数组中的最后一个对象。我如何使用XPath执行此操作?我不能这样做:result=node.xpath('.//ROOT/TAG[-1]/KEY_NAME')我在StackOverflow上找到了一个解决方案,但那是一个仅更改上限以获取元素的查询。这可能会返回最后一项或最后一项和上一项。如果我想在Ruby中只获取前一个元素,如array[-2]怎么办? 最佳答案 您可以在谓词中使用last()访问XPath中的最后一个元素。node.xpath('.//ROOT/T

ruby-on-rails - rails 控制台要求 nokogiri 返回 false(但在 irb 中工作)

我的环境是ruby1.9.3p327和rails3.2.8onamac。我将gemnokogiri添加到我的Gemfile中。运行bundleinstall命令。命令显示Usingnokogiri(1.5.5)和gemlist命令返回nokogiri(1.5.5)。在Rails控制台中require'nokogiri'返回false但在irb中它返回true。这怎么可能? 最佳答案 根据theAPIdocumentation的前两行,require将:如果加载成功返回true如果已经加载则返回false如果找不到文件则引发LoadE

ruby - nokogiri 不会安装 - 错误 : Failed to build gem native extension

这个问题在这里已经有了答案:`require':nosuchfiletoload--mkmf(LoadError)(10个答案)关闭9年前。在ubuntu12.04上,我得到以下信息。sudoapt-getinstalllibxml2libxml2-devlibxsltlibxslt-devsudogeminstallnokogiriBuildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingnokogiri:ERROR:Failedtobuildgemnativeextension./usr/bin/ruby

ruby-on-rails - 在 ubuntu 服务器上部署 capistrano 时关于 nokogiri 的错误

虽然bundle:install阶段在deploy:finalize_update之后,但我收到有关nokogiri的错误。它表明,**[out::*******]Makesurethat`geminstallnokogiri-v'1.6.0'`succeedsbeforebundling.所以我尝试自己在服务器上安装nokogiri。但是它给出了以下错误,Buildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingnokogiri:ERROR:Failedtobuildgemnativeextension./

ruby - 是否有可能 'unload' ('un-require' ) 一个 Ruby 库?

我希望加载一些库,让它们做一些工作,然后执行与require相反的操作,以避免以后出现兼容性错误。我不想转储到文件并重新启动shell,因为创建的对象(例如data)可以由我的其他库很好地处理,只是不存在早期我要卸载的那些。有人有任何建议或知道这是否可行吗?Aconversationfrom2006除了“看起来Webrick设法以某种方式做到这一点”之外,没有得出太多结论。有问题的库是Google_driveandNokogiri(电子表格处理库Roo依赖Google_drive进行在线电子表格读/写,如该链接所述)。 最佳答案 正