Nokogiri

ruby-on-rails - 如何使用 Nokogiri 和 at_css 获取 img src

我正在尝试获取一段HTML的src值。我特别尝试使用at_css而不是使用XPath来实现这一点。到目前为止，我得到的只是nil或空字符串。这是HTML:我的代码是:item=page.doc.at_css("#productMainImageimg").text.stripunlesspage.doc.at_css("#productMainImageimg").nil?putsitem#printsblankitem=item["src"]putsitem#printsblankpage.doc是NokogiriHTML元素。最佳答案

ruby-on-rails Nokogiri code 34 section ruby ruby-on-rails-4

ruby - 从 inner_html 中删除评论

我有一些使用Nokogiri的代码，我试图获取inner_html而没有得到评论。html=Nokogiri::HTML(open(@sql_scripts_url[1]))#usingfirstvalueofthearrayhtml.css('td[class="ms-formbody"]').eachdo|node|putsnode.inner_html#printscommentsend 最佳答案由于您没有提供任何示例HTML或所需的输出，这里有一个通用的解决方案:您可以使用comment()在XPath中选择SGML注释节

inner_html inner code gt html ruby nokogiri

css - 是否可以使用 Nokogiri 解析样式表？

我已经用谷歌搜索了两个小时，但找不到任何好的答案，所以让我们看看人类是否能打败谷歌计算机。我想在Ruby中解析样式表，以便我可以将这些样式应用到文档中的元素(使样式内联)。所以，我想采取类似的措施.mystyle{color:white;}并且能够将其提取到某种Nokogiri对象中。Nokogiri类“CSS::Parser”(http://nokogiri.rubyforge.org/nokogiri/Nokogiri/CSS/Parser.html)当然有一个很有前途的名字，但我找不到任何关于它是什么或它如何工作的文档，所以我不知道它是否能做什么我在这儿。我的最终目标是能够编写如

Nokogiri css style section ruby css-parsing

ruby - 如何使用 Nokogiri 获取元关键字？

我正在使用Nokogiri进行作业，但我正在努力解决这个问题。它伤害了我的大脑。导致解决方案的任何步骤、提示或示例都很可爱。最佳答案这是一个简单的例子:require'rubygems'require'nokogiri'doc=Nokogiri::HTML("")doc.xpath("//meta[@name='Keywords']/@content").eachdo|attr|putsattr.valueend 关于ruby-如何使用Nokogiri获取元关键字？，我们在Stack

Nokogiri 关键 section 34 ruby

ruby - 如何处理 Nokogiri 中的 404 not found 错误

我正在使用Nokogiri来抓取网页。很少有url需要被猜测，当它们不存在时返回404notfound错误。有没有办法捕获这个异常？http://yoursite/page/38475#=>pagenumber38475doesn'texist我尝试了以下方法，但没有用。url="http://yoursite/page/38475"doc=Nokogiri::HTML(open(url))dobeginrescueException=>eputs"Tryagainlater"endend 最佳答案它不起作用，因为您没有拯救在发现

何处 Nokogiri section code ruby http-status-code-404

ruby-on-rails - ruby on rails roo gem 无法加载 zip/zipfilesystem

我正在尝试使用roogem来处理由外部方上传的.xlsx电子表格。我收到以下错误:LoadError(无法加载此类文件--zip/zipfilesystem):我发现了很多与此类似的问题(例如无法加载此类文件--zip/zip)，我尝试按照他们的解决方案进行操作。到目前为止，无济于事。我最初在Controller中需要“roo”，在出现此错误后尝试要求“zip/zip”、“zip/zipfilesystem”和“zip”。这些似乎都无法解决任何问题。我也试过将:require=>'zip',:require=>'zip/zipfilesystem',:require=>'zip/zip

rails ruby spreadsheet code rubyzip ruby-on-rails ruby-on-rails-3 nokogiri

ruby - 在 Ubuntu/Debian Linux 上安装 nokogiri

我正在尝试在DebianLinux上安装nokogiri1.6.2.1。我正在运行Ruby-2.1.1。我已经安装了libxml2、libxml2-dev、libxslt和libxslt-dev。输出:Gem::Ext::BuildError:ERROR:Failedtobuildgemnativeextension./home/xxx/.rvm/rubies/ruby-2.1.1/bin/rubyextconf.rbBuildingnokogiriusingpackagedlibraries.checkingforiconv.h...***extconf.rbfailed***Cou

nokogiri Ubuntu ruby rubies from

ruby - 在 Nokogiri 的所有标签之间抓取文本？

抓取html标签之间所有文本的最有效方法是什么？hi....一堆被html标签包围的文本。最佳答案 doc=Nokogiri::HTML(your_html)doc.xpath("//text()").to_s 关于ruby-在Nokogiri的所有标签之间抓取文本？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/1512850/

Nokogiri ruby section code stackoverflow

ruby-on-rails - 如何使用 Nokogiri 解析 HTML 表格？

我正在尝试解析一个表，但我不知道如何从中保存数据。我想将每一行中的数据保存为:['Rawname1',2,094,0,017,0,098,0,113,0,452]示例表是:html=TablenameColumnname1Columnname2Columnname3Columnname4Columnname5Rawname12,0940,0170,0980,1130,452...Rawname52,0940,0170,0980,1130,452EOT我的爬虫代码是:doc=Nokogiri::HTML(open(html),nil,'UTF-8')tables=doc.css('div

ruby-on-rails Nokogiri gt lt 34 ruby html-parsing

ruby - 通过类属性的部分匹配获取所有元素

我正在尝试使用Nokogiri显示来自URL的结果。(本质上是抓取一个URL)。我有一些HTML类似于:MattyMatthewSuzie所以我需要找到所有以单词“matt”开头的元素。我需要做的是保存元素的值和元素名称，以便下次我可以引用它..所以我需要捕获"Matty"and"""Matthew"and""我还没有想出如何捕获元素HTML，但这是我目前拥有的元素(它不起作用!)doc=Nokogiri::HTML(open(url))tmp=""doc.xpath("[class*=matt").eachdo|item|tmp+=item.textend@testy2=tmp

ruby 通过 34 class section xpath nokogiri

5 6 789 10 11