我正在尝试获取一段HTML的src值。我特别尝试使用at_css而不是使用XPath来实现这一点。到目前为止,我得到的只是nil或空字符串。这是HTML:我的代码是:item=page.doc.at_css("#productMainImageimg").text.stripunlesspage.doc.at_css("#productMainImageimg").nil?putsitem#printsblankitem=item["src"]putsitem#printsblankpage.doc是NokogiriHTML元素。 最佳答案
我有一些使用Nokogiri的代码,我试图获取inner_html而没有得到评论。html=Nokogiri::HTML(open(@sql_scripts_url[1]))#usingfirstvalueofthearrayhtml.css('td[class="ms-formbody"]').eachdo|node|putsnode.inner_html#printscommentsend 最佳答案 由于您没有提供任何示例HTML或所需的输出,这里有一个通用的解决方案:您可以使用comment()在XPath中选择SGML注释节
我已经用谷歌搜索了两个小时,但找不到任何好的答案,所以让我们看看人类是否能打败谷歌计算机。我想在Ruby中解析样式表,以便我可以将这些样式应用到文档中的元素(使样式内联)。所以,我想采取类似的措施.mystyle{color:white;}并且能够将其提取到某种Nokogiri对象中。Nokogiri类“CSS::Parser”(http://nokogiri.rubyforge.org/nokogiri/Nokogiri/CSS/Parser.html)当然有一个很有前途的名字,但我找不到任何关于它是什么或它如何工作的文档,所以我不知道它是否能做什么我在这儿。我的最终目标是能够编写如
我正在使用Nokogiri进行作业,但我正在努力解决这个问题。它伤害了我的大脑。导致解决方案的任何步骤、提示或示例都很可爱。 最佳答案 这是一个简单的例子:require'rubygems'require'nokogiri'doc=Nokogiri::HTML("")doc.xpath("//meta[@name='Keywords']/@content").eachdo|attr|putsattr.valueend 关于ruby-如何使用Nokogiri获取元关键字?,我们在Stack
我正在使用Nokogiri来抓取网页。很少有url需要被猜测,当它们不存在时返回404notfound错误。有没有办法捕获这个异常?http://yoursite/page/38475#=>pagenumber38475doesn'texist我尝试了以下方法,但没有用。url="http://yoursite/page/38475"doc=Nokogiri::HTML(open(url))dobeginrescueException=>eputs"Tryagainlater"endend 最佳答案 它不起作用,因为您没有拯救在发现
我正在尝试使用roogem来处理由外部方上传的.xlsx电子表格。我收到以下错误:LoadError(无法加载此类文件--zip/zipfilesystem):我发现了很多与此类似的问题(例如无法加载此类文件--zip/zip),我尝试按照他们的解决方案进行操作。到目前为止,无济于事。我最初在Controller中需要“roo”,在出现此错误后尝试要求“zip/zip”、“zip/zipfilesystem”和“zip”。这些似乎都无法解决任何问题。我也试过将:require=>'zip',:require=>'zip/zipfilesystem',:require=>'zip/zip
我正在尝试在DebianLinux上安装nokogiri1.6.2.1。我正在运行Ruby-2.1.1。我已经安装了libxml2、libxml2-dev、libxslt和libxslt-dev。输出:Gem::Ext::BuildError:ERROR:Failedtobuildgemnativeextension./home/xxx/.rvm/rubies/ruby-2.1.1/bin/rubyextconf.rbBuildingnokogiriusingpackagedlibraries.checkingforiconv.h...***extconf.rbfailed***Cou
抓取html标签之间所有文本的最有效方法是什么?hi....一堆被html标签包围的文本。 最佳答案 doc=Nokogiri::HTML(your_html)doc.xpath("//text()").to_s 关于ruby-在Nokogiri的所有标签之间抓取文本?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/1512850/
我正在尝试解析一个表,但我不知道如何从中保存数据。我想将每一行中的数据保存为:['Rawname1',2,094,0,017,0,098,0,113,0,452]示例表是:html=TablenameColumnname1Columnname2Columnname3Columnname4Columnname5Rawname12,0940,0170,0980,1130,452...Rawname52,0940,0170,0980,1130,452EOT我的爬虫代码是:doc=Nokogiri::HTML(open(html),nil,'UTF-8')tables=doc.css('div
我正在尝试使用Nokogiri显示来自URL的结果。(本质上是抓取一个URL)。我有一些HTML类似于:MattyMatthewSuzie所以我需要找到所有以单词“matt”开头的元素。我需要做的是保存元素的值和元素名称,以便下次我可以引用它..所以我需要捕获"Matty"and"""Matthew"and""我还没有想出如何捕获元素HTML,但这是我目前拥有的元素(它不起作用!)doc=Nokogiri::HTML(open(url))tmp=""doc.xpath("[class*=matt").eachdo|item|tmp+=item.textend@testy2=tmp