Nokogiri

ruby - Nokogiri递归地得到所有 child

问题我正在针对各种URL运行一些统计数据。我想找到child数量最集中的顶级元素。我想遵循的方法是识别所有顶级元素，然后确定页面上所有元素的百分比属于它。目标递归地获取给定元素的所有子元素。输入:一个Nokogiri元素输出:Nokogiri元素数组或child总数设置ruby1.9.2Nokogirigem我最终得出的结果(这可行，但不如我在下面选择的答案那么漂亮)getChildCount(elem)children=elem.childrenreturn0unlesschildrenandchildren.count>0child_count=children.countchil

ruby - 我如何使用 nokogiri 验证 XHTML？

我发现一些帖子暗示您可以使用nokogirigem根据其DTD验证XHTML。虽然我已经成功地使用它来解析XHTML(寻找“a”标签等)，但我正在努力验证文档。对我来说，这是:doc=Nokogiri::XML(Net::HTTP.get(URI.parse("http://www.w3.org")))putsdoc.validate结果是:[#,#,#,#,#,#所以我假设这不是正确的方法。我似乎找不到任何好的例子-谁能指出我做错了什么？我在MacOSX10.5.8上运行ruby1.8.6。Nokogiri告诉我:nokogiri:1.3.3warnings:[]libxml:c

nokogiri XHTML code section ruby

ruby - 使用 Nokogiri 向元素添加类

显然是Nokogiri的add_class方法仅适用于NodeList，使此代码无效:doc.search('a').eachdo|anchor|anchor.inner_text="hello!"anchor.add_class("whatever")#WHOOPS!end我该怎么做才能使这段代码正常工作？我想应该是这样的doc.search('a').eachdo|anchor|anchor.inner_text="hello!"Nokogiri::XML::NodeSet.new(anchor).add_class("whatever")end但这也行不通。请告诉我，我不必为单个

Nokogiri ruby class code anchor

ruby - 如何让 Ruby Mechanize 获得一个存在于字符串中的页面

通常Mechanize将从URL获取网页，get方法的结果是一个Mechanize::Page对象，您可以从中使用很多有用的方法。如果页面存在于字符串中，我如何获得相同的Mechanize::Page对象？require'mechanize'html=PageTitleThisisatestEND_OF_STRINGagent=Mechanize.new#HowcanIgetthepageresultfromthestringhtml?#page=... 最佳答案 Mechanize使用Nokogiri来解析HTML。如果您在不需要

Mechanize ruby html section nokogiri mechanize-ruby

ruby-on-rails - 安装 nokogiri Mac OS X 10.8.2 XCode 安装

尝试在MountainLion上安装nokogiri。我使用的是ruby1.8.7，但刚刚升级到1.9.3，但它阻止了捆绑安装的工作。顺便说一下，我可以通过卸载ruby1.9.3并恢复到1.8.7来解决这个问题。然而，这显然是一个次优的解决方案，因为我不想在剩下的时间里一直停留在1.8.7上......Users-MacBook-Pro:sample_appuser$lsGemfileappdocscriptGemfile.lockconfiglibspecREADME.mdconfig.rulogtmpRakefiledbpublicvendorRavins-MacBook-

ruby-on-rails nokogiri ruby without with installation

ruby - 如何在 XPath 中获取序列的最后一个元素？

在Ruby中，我们可以访问带有负数的数组，如array[-1]以获取数组中的最后一个对象。我如何使用XPath执行此操作？我不能这样做:result=node.xpath('.//ROOT/TAG[-1]/KEY_NAME')我在StackOverflow上找到了一个解决方案，但那是一个仅更改上限以获取元素的查询。这可能会返回最后一项或最后一项和上一项。如果我想在Ruby中只获取前一个元素，如array[-2]怎么办？最佳答案您可以在谓词中使用last()访问XPath中的最后一个元素。node.xpath('.//ROOT/T

何在 XPath code section stackoverflow ruby nokogiri

ruby-on-rails - rails 控制台要求 nokogiri 返回 false(但在 irb 中工作)

我的环境是ruby1.9.3p327和rails3.2.8onamac。我将gemnokogiri添加到我的Gemfile中。运行bundleinstall命令。命令显示Usingnokogiri(1.5.5)和gemlist命令返回nokogiri(1.5.5)。在Rails控制台中require'nokogiri'返回false但在irb中它返回true。这怎么可能？最佳答案根据theAPIdocumentation的前两行,require将:如果加载成功返回true如果已经加载则返回false如果找不到文件则引发LoadE

中工 rails code section nokogiri ruby-on-rails ruby gem

ruby - nokogiri 不会安装 - 错误 : Failed to build gem native extension

这个问题在这里已经有了答案:`require':nosuchfiletoload--mkmf(LoadError)(10个答案)关闭9年前。在ubuntu12.04上，我得到以下信息。sudoapt-getinstalllibxml2libxml2-devlibxsltlibxslt-devsudogeminstallnokogiriBuildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingnokogiri:ERROR:Failedtobuildgemnativeextension./usr/bin/ruby

extension nokogiri section require ruby gem

ruby-on-rails - 在 ubuntu 服务器上部署 capistrano 时关于 nokogiri 的错误

虽然bundle:install阶段在deploy:finalize_update之后，但我收到有关nokogiri的错误。它表明，**[out::*******]Makesurethat`geminstallnokogiri-v'1.6.0'`succeedsbeforebundling.所以我尝试自己在服务器上安装nokogiri。但是它给出了以下错误，Buildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingnokogiri:ERROR:Failedtobuildgemnativeextension./

上部 ruby-on-rails ruby mini_portile nokogiri rvm-capistrano

ruby - 是否有可能 'unload' ('un-require' ) 一个 Ruby 库？

我希望加载一些库，让它们做一些工作，然后执行与require相反的操作，以避免以后出现兼容性错误。我不想转储到文件并重新启动shell，因为创建的对象(例如data)可以由我的其他库很好地处理，只是不存在早期我要卸载的那些。有人有任何建议或知道这是否可行吗？Aconversationfrom2006除了“看起来Webrick设法以某种方式做到这一点”之外，没有得出太多结论。有问题的库是Google_driveandNokogiri(电子表格处理库Roo依赖Google_drive进行在线电子表格读/写，如该链接所述)。最佳答案正

amp 39 34 code this_is_data ruby nokogiri google-drive-api

7 8 91011 12 13