草庐IT

Nokogiri

全部标签

ruby - 在 nokogiri 的两个元素之间抓取文本?

sometextINEEDTHISTEXTONLYsometextmoretextheresometextonemoretextheresometext如何? 最佳答案 使用:/*/div[1]/following-sibling::text()[1]这会选择文档顶部元素的第一个div子元素的第一个文本节点兄弟。 关于ruby-在nokogiri的两个元素之间抓取文本?,我们在StackOverflow上找到一个类似的问题: https://stackover

ruby - 我如何使用 Nokogiri 查找网页上的特定文本/单词?

我是nokogiri的新手,但看起来这将是我用来抓取网页的工具。我正在寻找网页上的特定单词。这些词是“有效”、“满足要求”和“不满足要求”。我正在使用watir浏览网站。我目前有:page=Nokogiri::HTML.parse(browser.html)获取html,但我不确定从这里去哪里。感谢您的帮助! 最佳答案 如果您使用Watir来驱动网站,我建议您使用Watir来检查文本。您可以使用以下方法获取页面上的所有文本:ie.text#WhereieisaWatir::IE然后您可以检查它是否包含这些词(通过与正则表达式进行比较

ruby-on-rails - 尝试安装 rubber gem,Nokogiri 把它搞砸了?

我正在尝试安装橡胶gem。几天前,我在玩Nokogiri,但无法正确安装它。我忘了它,因为它不紧迫。好吧,现在我正在尝试安装rubbergem并收到这些让我感到困惑的错误,它们似乎与Nokogiri有关,据我所知尚未安装。帮帮我,谢谢。@THRILLHO:~$geminstallrubberBuildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingrubber:ERROR:Failedtobuildgemnativeextension./home/noonan/.rvm/rubies/ruby-1.9.3-p

ruby-on-rails - Nokogiri gem 安装错误与狂欢

当我尝试捆绑安装时出现此错误Bundler::GemspecError:Couldnotreadgemat/home/theareba/.rvm/gems/ruby-2.0.0-p353/cache/nokogiri-1.6.1.gem.Itmaybecorrupted.Anerroroccurredwhileinstallingnokogiri(1.6.1),andBundlercannotcontinue.Makesurethat`geminstallnokogiri-v'1.6.1'`succeedsbeforebundling.我试过删除缓存中的nokogiri并再次捆绑安装,

ruby-on-rails - 捆绑安装时 Nokogiri 发生错误 (OSx Mavericks)

我是Rails的新手,我不明白为什么Nokogiri在我尝试捆绑安装时不想安装:barnab21:sample_appbarnab21$sudobundleinstallDon'trunBundlerasroot.Bundlercanaskforsudoifitisneeded,andinstallingyourbundleasrootwillbreakthisapplicationforallnon-rootusersonthismachine.Fetchinggemmetadatafromhttp://rubygems.org/.........Usingrake0.9.6Usin

ruby - Nokogiri vs Goliath……或者,他们能相处融洽吗?

我有一个项目需要解析数十万个HTML和XML文档。我认为这将是学习Rubyfibers和新的Goliath框架的绝佳机会。但很明显,如果您使用阻塞库,Goliath就会失败。但问题是,我不知道如何判断什么是“线程安全”(如果这甚至是Goliath的正确术语)。所以我的问题是,Nokogiri是否会导致Goliath或多线程/纤程一般出现任何问题?如果是这样,有没有比Nokogiri更安全的使用方式?谢谢 最佳答案 Goliath是一个网络框架,所以我假设您打算通过HTTP“摄取”这些文档?每个请求都映射到一个ruby​​纤程中,但实

ruby - 在 Nokogiri 中解析出 html doctype 标签

如何解析doctype标签以从html文件中获取html版本?尝试使用doctype(或DOCTYPE或!DOCTYPE)作为xpath中的参数会引发无效表达式错误。 最佳答案 doctype不是文档的一部分,而是DTD的一部分require'rubygems'require'nokogiri'html=EOFdoc=Nokogiri::HTML(html)putsdoc.internal_subset.nameputsdoc.internal_subset.external_idputsdoc.internal_subset.sy

ruby - 使用 Nokogiri xpath(带有 xml 命名空间)在 xml 中搜索节点

我发现Nokogiri在处理xml方面非常强大,但我遇到了一个特例我正在尝试像这样在xml文件中搜索节点SqlServerStaging当我做一个xml=File.new(webconfig,"r")doc=Nokogiri::XML(xml.read)nodes=doc.search("//Configuration.Store")xml.close我有空节点。我错过了什么吗?我试过了nodes=doc.search("//Configuration\.Store")仍然没有运气。更新:我附上了整个xml文件再次更新了xml:我的错误,它确实有一个namaspace

ruby-on-rails - 无法加载此类文件 - Nokogiri rails

我编写了一个使用Nokogiri的Ruby脚本。对于Rails,我在lib/目录中制作了这个模块:require"net/http"require"uri"require'nokogiri'Modulegk_CTclassCTdefgetCTuri=URI.parse("http://www.website.com")CT=Net::HTTP.get_response(uri)proc=Nokogiri::HTML(CT.body)CTQ=Array.newCTQ在我的Controller中:require'gk_CT'defshow@CT=gk_CT::CT.getCT()respo

ruby - 捆绑安装在 Nokogiri 停止

我试图在我的Rails应用程序上进行捆绑安装,但它卡在了“正在安装nokogiri”处。错误消息底部的说明说Makesurethat`geminstallnokogiri-v'1.5.5'`succeedsbeforebundling.当我看到它时,我尝试了geminstallnokogiri-v'1.5.5'它告诉我安装Nokogiri时出错。我在Mac上的Rails3.0.4应用程序中使用Ruby1.9.2。任何人都可以提出修复建议吗?Installingnokogiri(1.5.5)withnativeextensionsGem::Installer::ExtensionBuil