我正在尝试:require'nokogiri'在irb中,没有成功。Nokogirigem已安装。来自:gemlist--local我得到:nokogiri(1.4.4,1.4.3.1)但是当我尝试在irb中“要求”它时,我得到:LoadError:没有要加载的文件--nokogiri来自(irb):8:在“要求”中来自(IRB):8来自:0Nokogiri“住在”:/opt/ruby-enterprise-1.8.7-2010.02/lib/ruby/gems/1.8/gems/nokogiri-1.4.4/lib在我的系统上。另外,我的GEMPATH(来自gemenv)是:/opt
给定Nokogiri中的HTML文档,我想删除所有没有实际文本的节点。这包括带有空格和/或的元素标签。执行此操作最优雅的方法是什么? 最佳答案 这是一个更简单的修复:它删除了空格和br标签。给定HTML"Foo"解决方案:document.css('p').find_all.eachdo|p|#RubyonRailsSolution:p.removeifp.content.blank?#Rubysolution,aspointedoutbyMichaelHartl:p.removeifp.content.strip.empty?en
我正在尝试使用rubyxpath和nokogiri获取写入HTML表中的“cell4”值,如下所示:Headingparagraph.Tworowsandthreecolumns:cell1cell2cell3cell4我有以下简单代码,但它带来了[]。这个问题一定很简单,但在谷歌上找不到任何合适的东西#!/usr/bin/ruby-wrequire'rubygems'require'nokogiri'page1=Nokogiri::HTML('test_simple.html')a=page1.xpath("//html/body/table/tr[2]/td[2]")paxpa
我正在使用Nokogiri抓取HTML文档,其中许多可能有未关闭的标签。我想关闭“未关闭”标签,例如。我查看了文档并查看了哪里"Nokogiricorrectsbad-markup,"但我没有找到执行此操作的好方法。也许它需要遍历每个元素并关闭任何不匹配的标签? 最佳答案 Nokogiri会自动修复它们。您可以使用inner_html来获取正确的HTML代码require'rubygems'require'nokogiri'doc=Nokogiri::HTML.parse('')doc.inner_html#=>""
我需要像下面这样从HTML中解析出图像URL:到目前为止,我正在使用Nokogiri来解析标签:require'rubygems'require'nokogiri'require'open-uri'page=Nokogiri::HTML(open("http://blog.website.com/"))headers=page.css('h2')putsheaders.text我有两个问题:如何解析图片网址?理想情况下,我会以这种格式打印到控制台:1.Header1image_url1image_url2(ifany)2.Header22image_url12image_url2(if
我非常编程新手,我正在用Ruby1.9.3编写一个小练习程序,它使用Nokogiri查询带有邮政编码的加拿大议会网站,然后打印姓名相应的国session员及其乘车前往终点站。我的代码获取页面并很好地隔离MP的名称/骑行,但在shell中将UTF-8字符显示为纯ASCII。我希望显示UTF-8字符。我知道shell可以处理UTF-8,因为:irb>riding="St-Jérôme"=>"St-Jérôme"irb>putsridingSt-Jérôme=>nil我用来获取页面的代码:page=Nokogiri::HTML(open("http://parl.gc.ca/ParlInfo
在为Nokogiri及其文档进行正确设置时遇到一些问题,开始使用起来有点粗糙。我正在尝试解析XML文件:http://www.kongregate.com/games_for_your_site.xml它返回游戏集中的多个游戏,并且每个游戏都有一个标题、描述等....160342TrickyRickhttp://cdn3.kongregate.com/game_icons/0042/7180/KONG_icon250x200_site.png?21656-op2012-12-12Puzzlehttp://external.kongregate-games.com/gamez/0016/
我有:MacOSX优胜美地10.10.3MacPorts(不是Brew)系统中的Ruby2(非RVM)我想安装Nokogiri并尝试过:portinstallnokogiri得到:Buildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingnokogiri:ERROR:Failedtobuildgemnativeextension./System/Library/Frameworks/Ruby.framework/Versions/2.0/usr/bin/ruby-r./siteconf20150323-301
我正在尝试添加属性autoplay到iframe。然而,这个属性只是一个标记,它没有值:在Nokogiri中添加一个类似的属性:iframe=Nokogiri::HTML(iframe).at_xpath('//iframe')iframe["autoplay"]=""putsiframe.to_s----------output----------""Nokogiri有这样的方法吗?还是我应该删除/=""/最后有一个正则表达式?谢谢 最佳答案 开箱即用,Nokogiri不能做你想做的事。选项1:使用您的正则表达式解决方案。选项2:
使用Hpricot,您可以这样做:>doc=Hpricot("a")=>#>doc.children.first.swap('b')=>["b"]>doc.to_s=>"b"但是如果你用Nokogiri尝试同样的事情,你会得到一个错误:>doc=Nokogiri::HTML::DocumentFragment.parse('a')=>#]>>doc.children.first.swap('b')RuntimeError:errorparsingfragment(1)from/Library/Ruby/Gems/1.8/gems/nokogiri-1.4.4/lib/nokogiri/