草庐IT

Nokogiri

全部标签

javascript - 如何使用 Nokogiri 和 Ruby 解析 JavaScript

我需要从网站中解析出一个数组。我要解析的JavaScript部分如下所示:_arPic[0]="http://example.org/image1.jpg";_arPic[1]="http://example.org/image2.jpg";_arPic[2]="http://example.org/image3.jpg";_arPic[3]="http://example.org/image4.jpg";_arPic[4]="http://example.org/image5.jpg";_arPic[5]="http://example.org/image6.jpg";我使用类似这样

ruby - Ruby 2.0 中的 Nokogiri

当我在Ruby2.0中require'nokogiri'时,出现错误`require':cannotloadsuchfile--nokogiri/2.0/nokogiri(LoadError)nokogiri还不支持Ruby2.0吗?我可以在gemlist中看到nokogiri 最佳答案 Windows尚不支持Ruby2.0。关注here更新: 关于ruby-Ruby2.0中的Nokogiri,我们在StackOverflow上找到一个类似的问题: https

ruby - 使用 Nokogiri::HTML 和 Ruby 进行网页抓取 - 如何将输出输出到数组中?

我刚开始使用nokogiri从网站上抓取信息,但不知道如何完成以下工作。我有一些要抓取的HTML代码:CompatibleVehiclesType1AllType2AllType3AllType4AllType5All我已经设法在我的屏幕上得到了我想要的输出:i=0doc.css('div>.compatible_vehicles>ul>li').eachdo|item|label=item.at_css(".label").textdata=item.at_css(".data").textprint"#{label}-#{data}"+','endi+=1这给了我一个这样的列表:T

ruby-on-rails - Nokogiri 未能构建 gem native 扩展(RuntimeError)?

我正在尝试使用以下方法安装Nokogiri:sudogeminstallnokogiri这是安装之后的困惑:Buildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingnokogiri:ERROR:Failedtobuildgemnativeextension./Users/micahsherman/.rvm/rubies/ruby-1.9.3-p429/bin/rubyextconf.rbExtractinglibxml2-2.8.0.tar.gzintotmp/x86_64-apple-darwin13.0

ruby - 为什么我在使用 Nokogiri "search"时会得到错误的输出?

我想从CarFax报告的特定div中抓取数据。但是,当我搜索div时,我总是得到这种奇怪的垃圾输出。我试过了search(#divId),search(.divClass),甚至试图用search('div')获取所有div.每次我都得到类似的结果:div的内容被部分截断,标签全乱了。这是我加载到我的agent中的URL:https://gist.github.com/atkolkma/8024287这是代码(省略了用户和密码):require"rubygems"require"mechanize"scraper=Mechanize.newscraper.user_agent_alia

ruby - 安装 Nokogiri 时出错? mini_portile 不可用?

我的本​​地gem列表bundler(1.6.0)childprocess(0.5.1)ffi(1.9.3)headless(1.0.1)json(1.8.1)mini_portile(0.5.3,0.5.2)minitest(5.3.1)multi_json(1.9.0)rake(10.2.2)rdoc(4.1.1)rubyzip(1.1.2)selenium-webdriver(2.41.0,2.40.0)watir-webdriver(0.6.8)websocket(1.0.7,1.0.4)我还安装了libxml2和libxslt。它说无法加载mini_portilegem,但它

ruby - 如何使用 Nokogiri 将一个节点的 HTML 内容添加到另一个节点

正如标题所说,我想知道如何将一个节点的内容添加到另一个节点,例如。假设有一个节点:I'malinkI'maparagraph还有另一个节点,我想将其内容添加到上面:Link1Link2Link3Link4然后像这样将后一个节点卸载到前一个节点中:I'malinkI'maparagraphLink1Link2Link3Link4 最佳答案 我根据您的问题创建了两个HTMLDOM片段。这条线基本上结合了@doc.at_css("li")两个片段。@doc.at("li")返回DOMNodeli.附加@doc1DOM的子元素Node``p

ruby - Nokogiri 1.5.2 未安装在 Ubuntu 11.10 上

很快,我知道一个similarquestion.但是,遵循评分最高的答案是行不通的。我已经重新启动了我的系统和终端,但无济于事。出于某种原因,Nokogiri无法识别我安装了libxslt1-dev,尽管我明确安装了它,包括sudoapt-getinstalllibxslt-dev和sudoapt-getinstalllibxslt1-dev。这是输出;我还遗漏了什么吗?$geminstallnokogiri-v'1.5.2'Buildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingnokogiri:ERRO

ruby-on-rails - Mountain Lion 上 LibXML 的 Nokogiri 问题

我最近全新安装了MountainLion,在安装Nokogiri之后-启动Rails控制台时出现错误:警告:Nokogiri是针对LibXML版本2.8.0构建的,但已动态加载2.7.8所以我在SO上查看了其他问题,卸载了所有内容并再次尝试,但我注意到Nokogiri网站上的安装说明已过时:http://nokogiri.org/tutorials/installing_nokogiri.html因为“brewinstalllibxml2libxslt”,实际上安装了libxml22.8.0,并进一步阅读它引用2.7.8的说明:geminstallnokogiri----with-xm

Ruby Nokogiri 解析 HTML 表格

我正在使用mechanize/nokogiri,需要解析以下HTML字符串。任何人都可以帮助我使用xpath语法来执行此操作或任何其他可行的方法吗?4242YPSubjectofMeeting01:00PMNov112009America/New_York30example@email.com39243368...我想要这个作为输出"4242YP","SubjectofMeeting","01:00PMNov112009America/New_York","30","example@email.com","39243368"... 最佳答案