Nokogiri_草庐IT

ruby - 我如何在 Nokogiri 中使用 XPath？

我还没有找到任何文档或教程。有没有这样的东西？doc.xpath('//table/tbody[@id="threadbits_forum_251"]/tr')上面的代码将在任何地方为我提供任何表，它有一个tbody子级，其属性id等于“threadbits_forum_251”。但是为什么要以双//开头呢？为什么最后会有/tr？有关详细信息，请参阅“RubyNokogiriParsingHTMLtableII”。谁能告诉我如何提取href、id、alt、src等，使用野切？td[3]/div[1]/a/text()'如何提取其他东西？最佳答案

何在 Nokogiri code section threadbits_forum ruby xpath

ruby - 使用 Nokogiri 提取链接时如何获取绝对 URL？

我正在使用Nokogiri从页面中提取链接，但我想获得绝对路径，即使页面上的链接是相对路径。我怎样才能做到这一点？最佳答案 Nokogiri是无关的，除了它为您提供链接anchor这一事实。使用Ruby的URI管理路径的库:absolute_uri=URI.join(page_url,href).to_s实际可见:require'uri'#TheURLofthepagewiththelinkspage_url='http://foo.com/zee/zaw/zoom.html'#Avarietyoflinkstotest.href

Nokogiri 绝对 http com bar ruby

ruby-on-rails - 带有 Bootstrap 的带有 kaminari 的自定义 css

我尝试将分页与kaminari结合使用。我的项目使用了bootsrapcss，结果太丑了:)html由nokogiri生成«First‹Prev1234Next›Last»我想在Bootstrap页面中使用类似分页的功能，我该怎么做？请帮忙! 最佳答案在我发布这个问题后，我找到了解决方案:kaminari:AScope&Enginebased,clean,powerful,customizableandsophisticatedpaginatorforRails3.只需转到控制台并输入:railsgeneratekaminari:

自定 ruby-on-rails 34 borrow gt ruby twitter-bootstrap nokogiri

ruby - 如何在 Nokogiri 中使用正则表达式搜索匹配特定开头的文本？

给定:require'rubygems'require'nokogiri'value=Nokogiri::HTML.parse(AFooBCBarDEF"HTML_END我想做一些我可以在Hpricot中做的事情:divs=value.search('//div[@id^="para-"]')如何对XPath样式的元素进行模式搜索？我在哪里可以找到对我有帮助的文档？我没有在rdoc中看到这个。最佳答案使用xpath函数starts-with:value.xpath('//p[starts-with(@id,"para-")]')

何在 Nokogiri 39 lt gt ruby hpricot

ruby - Nokogiri、open-uri 和 Unicode 字符

我正在使用Nokogiri和open-uri来抓取网页上标题标签的内容，但在处理重音字符时遇到了问题。处理这些问题的最佳方法是什么？这是我正在做的:require'open-uri'require'nokogiri'doc=Nokogiri::HTML(open(link))title=doc.at_css("title")此时，标题看起来是这样的:Rag\303\271代替:Ragù我怎样才能让nokogiri返回正确的字符(例如本例中的ù)？这是一个示例网址:http://www.epicurious.com/recipes/food/views/Tagliatelle-with-

Nokogiri open-uri UTF-8 code ruby unicode screen-scraping

ruby-on-rails - Mountain Lion - LibXML 和 Nokogiri

我刚刚更新到OSXMountainLion，在使用rails和终端时我得到了以下信息。WARNING:NokogiriwasbuiltagainstLibXMLversion2.8.0,buthasdynamicallyloaded2.7.8我看过类似问题的其他答案，但它们似乎并没有阻止警告消息的出现。最佳答案我在ruby1.9.2上安装nokogirigem时遇到了类似的问题显然Apple升级了gcc...我用符号链接(symboliclink)修复了这个问题，然后gem安装得很好:sudoln-s/usr/bin/gcc

ruby-on-rails Mountain section code stackoverflow ruby libxml2 homebrew osx-mountain-lion

ruby - 如何使用 mkmf.log 提示找不到 libiconv 安装 Nokogiri Ruby gem？

我正在安装RubyNokogirigem并发现以下错误。如何诊断并解决？#geminstallnokogiriBuildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingnokogiri:ERROR:Failedtobuildgemnativeextension..../opt/ruby/1.9.3-p194/bin/rubyextconf.rbcheckingforlibxml/parser.h...***extconf.rbfailed***CouldnotcreateMakefileduetosomere

libiconv Nokogiri code pre libxml ruby gem installation

ruby-on-rails - 如何防止 Nokogiri 添加 <DOCTYPE> 标签？

我最近在使用Nokogiri时发现了一些奇怪的事情。我解析的所有HTML都已指定开始和结束和标签。\n\n如何防止Nokogiri这样做？即，当我这样做时:doc=Nokogiri::HTML("somecontent")doc.to_s或:doc.to_html我得到了原件:div>somecontent 最佳答案出现此问题是因为您在Nokogiri中使用了错误的方法来解析您的内容。require'nokogiri'doc=Nokogiri::HTML('foobar')putsdoc.to_html#>>#>>foobar与其

ruby-on-rails amp code gt lt ruby nokogiri

ruby-on-rails - 在 Nokogiri 中获取属性值以提取链接 URL

我有一个看起来像这样的文档:link我无法让Nokogiri为我获取href属性的值。我想将地址作为字符串存储在Ruby变量中。最佳答案 html=linkHTMLdoc=Nokogiri::HTML(html)doc.xpath('//div/a/@href')#=>[#]或者如果您想更具体地了解div:>>doc.xpath('//div[@id="block"]/a/@href')=>[#]>>doc.xpath('//div[@id="block"]/a/@href').first.value=>"http://googl

ruby-on-rails Nokogiri section 34 href ruby

ruby-on-rails - 在 bundle install 上安装 Nokogiri 时出错但已经安装

我在bundle我的Gemfile时遇到问题。当我运行bundleinstall时，我已经安装了Nokogiri，它无法加载Nokogiri。安装Nokogiri:geminstallnokogiriBuildingnativeextensions.Thiscouldtakeawhile...Successfullyinstallednokogiri-1.6.6.2Parsingdocumentationfornokogiri-1.6.6.2Doneinstallingdocumentationfornokogiriafter2seconds1geminstalledbundle安装:

时出 ruby-on-rails 39 gem nokogiri ruby bundler