草庐IT

Nokogiri

全部标签

ruby - 我如何在 Nokogiri 中使用 XPath?

我还没有找到任何文档或教程。有没有这样的东西?doc.xpath('//table/tbody[@id="threadbits_forum_251"]/tr')上面的代码将在任何地方为我提供任何表,它有一个tbody子级,其属性id等于“threadbits_forum_251”。但是为什么要以双//开头呢?为什么最后会有/tr?有关详细信息,请参阅“RubyNokogiriParsingHTMLtableII”。谁能告诉我如何提取href、id、alt、src等,使用野切?td[3]/div[1]/a/text()'如何提取其他东西? 最佳答案

ruby - 使用 Nokogiri 提取链接时如何获取绝对 URL?

我正在使用Nokogiri从页面中提取链接,但我想获得绝对路径,即使页面上的链接是相对路径。我怎样才能做到这一点? 最佳答案 Nokogiri是无关的,除了它为您提供链接anchor这一事实。使用Ruby的URI管理路径的库:absolute_uri=URI.join(page_url,href).to_s实际可见:require'uri'#TheURLofthepagewiththelinkspage_url='http://foo.com/zee/zaw/zoom.html'#Avarietyoflinkstotest.href

ruby-on-rails - 带有 Bootstrap 的带有 kaminari 的自定义 css

我尝试将分页与kaminari结合使用。我的项目使用了bootsrapcss,结果太丑了:)html由nokogiri生成«First‹Prev1234Next›Last»我想在Bootstrap页面中使用类似分页的功能,我该怎么做?请帮忙! 最佳答案 在我发布这个问题后,我找到了解决方案:kaminari:AScope&Enginebased,clean,powerful,customizableandsophisticatedpaginatorforRails3.只需转到控制台并输入:railsgeneratekaminari:

ruby - 如何在 Nokogiri 中使用正则表达式搜索匹配特定开头的文本?

给定:require'rubygems'require'nokogiri'value=Nokogiri::HTML.parse(AFooBCBarDEF"HTML_END我想做一些我可以在Hpricot中做的事情:divs=value.search('//div[@id^="para-"]')如何对XPath样式的元素进行模式搜索?我在哪里可以找到对我有帮助的文档?我没有在rdoc中看到这个。 最佳答案 使用xpath函数starts-with:value.xpath('//p[starts-with(@id,"para-")]')

ruby - Nokogiri、open-uri 和 Unicode 字符

我正在使用Nokogiri和open-uri来抓取网页上标题标签的内容,但在处理重音字符时遇到了问题。处理这些问题的最佳方法是什么?这是我正在做的:require'open-uri'require'nokogiri'doc=Nokogiri::HTML(open(link))title=doc.at_css("title")此时,标题看起来是这样的:Rag\303\271代替:Ragù我怎样才能让nokogiri返回正确的字符(例如本例中的ù)?这是一个示例网址:http://www.epicurious.com/recipes/food/views/Tagliatelle-with-

ruby-on-rails - Mountain Lion - LibXML 和 Nokogiri

我刚刚更新到OSXMountainLion,在使用rails和终端时我得到了以下信息。WARNING:NokogiriwasbuiltagainstLibXMLversion2.8.0,buthasdynamicallyloaded2.7.8我看过类似问题的其他答案,但它们似乎并没有阻止警告消息的出现。 最佳答案 我在ruby​​1.9.2上安装nokogirigem时遇到了类似的问题显然Apple升级了gcc...我用符号链接(symboliclink)修复了这个问题,然后gem安装得很好:sudoln-s/usr/bin/gcc

ruby - 如何使用 mkmf.log 提示找不到 libiconv 安装 Nokogiri Ruby gem?

我正在安装RubyNokogirigem并发现以下错误。如何诊断并解决?#geminstallnokogiriBuildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingnokogiri:ERROR:Failedtobuildgemnativeextension..../opt/ruby/1.9.3-p194/bin/rubyextconf.rbcheckingforlibxml/parser.h...***extconf.rbfailed***CouldnotcreateMakefileduetosomere

ruby-on-rails - 如何防止 Nokogiri 添加 <DOCTYPE> 标签?

我最近在使用Nokogiri时发现了一些奇怪的事情。我解析的所有HTML都已指定开始和结束和标签。\n\n如何防止Nokogiri这样做?即,当我这样做时:doc=Nokogiri::HTML("somecontent")doc.to_s或:doc.to_html我得到了原件:div>somecontent 最佳答案 出现此问题是因为您在Nokogiri中使用了错误的方法来解析您的内容。require'nokogiri'doc=Nokogiri::HTML('foobar')putsdoc.to_html#>>#>>foobar与其

ruby-on-rails - 在 Nokogiri 中获取属性值以提取链接 URL

我有一个看起来像这样的文档:link我无法让Nokogiri为我获取href属性的值。我想将地址作为字符串存储在Ruby变量中。 最佳答案 html=linkHTMLdoc=Nokogiri::HTML(html)doc.xpath('//div/a/@href')#=>[#]或者如果您想更具体地了解div:>>doc.xpath('//div[@id="block"]/a/@href')=>[#]>>doc.xpath('//div[@id="block"]/a/@href').first.value=>"http://googl

ruby-on-rails - 在 bundle install 上安装 Nokogiri 时出错但已经安装

我在bundle我的Gemfile时遇到问题。当我运行bundleinstall时,我已经安装了Nokogiri,它无法加载Nokogiri。安装Nokogiri:geminstallnokogiriBuildingnativeextensions.Thiscouldtakeawhile...Successfullyinstallednokogiri-1.6.6.2Parsingdocumentationfornokogiri-1.6.6.2Doneinstallingdocumentationfornokogiriafter2seconds1geminstalledbundle安装: