草庐IT

Nokogiri

全部标签

ruby-on-rails - Nokogiri 和 XPath 中未定义的命名空间前缀

我正在尝试解析YoutubeGdata以查看是否存在具有给定ID的视频。但是没有普通的标签,而是带有命名空间。在链接上http://gdata.youtube.com/feeds/api/videos?q=KgfdlZuVz7I有标签:1有命名空间openSearch:xmlns:openSearch='http://a9.com/-/spec/opensearchrss/1.0/'但我不知道如何在Nokogiri和Ruby中处理它。部分代码如下:xmlfeed=Nokogiri::HTML(open("http://gdata.youtube.com/feeds/api/videos

ruby-on-rails - 错误 - "gem install rails"- 缺少 libxml2

我一直在按照Rails安装说明(http://railsapps.github.io/installrubyonrails-mac.html)进行操作,一切正常,直到我到达新Rails应用程序下的geminstallrails部分。当我运行时,我发现libxml2丢失了。这是日志:http://codecascade.com/sIjhQ/raw我在安装nokogiri时遇到了类似的问题,我能够解决它的唯一方法是geminstallnokogiri----use-system-libraries我使用的是OSX10.10.2。如果可能相关,我还安装了RubyMine。

ruby - Nokogiri 等效于 jQuery closest() 方法,用于在树中查找第一个匹配的祖先

jQuery有一个可爱的方法,虽然名字有点错误,叫做closest()遍历DOM树寻找匹配的元素。例如,如果我有这个HTML:Yay假设element设置为,然后我可以算出src的值像这样:element.closest('table')['src']如果缺少table元素或其src属性,它将干净地返回“undefined”。在Javascriptland中已经习惯了这一点,我很想在Rubyland中找到与Nokogiri等效的东西,但我能想到的最接近的是使用ancestors()的明显不雅的hack。:ancestors=element.ancestors('table')src=a

ruby - 我无法从 Nokogiri 解析的字符串中删除空格

我无法从字符串中删除空格。我的HTML是:CenaproVás:139 Kč我的代码是:#encoding:utf-8require'rubygems'require'mechanize'agent=Mechanize.newsite=agent.get("http://www.astratex.cz/podlozky-pod-raminka/doplnky")price=site.search("//p[@class='your-price']/strong/text()")val=price.first.text=>"139 "val.strip=>"139 "val.g

ruby - 使用 Mechanize 和 Nokogiri 保存图像?

我正在使用Mechanize和Nokogiri来收集一些数据。我需要保存一张在每次请求时随机生成的图片。在我的尝试中,我被迫下载所有图片,但我真正想要的唯一一张是位于div#specific中的图片。此外,是否可以从中生成Base64数据,而无需保存或重新加载其源?require'rubygems'require'mechanize'require'nokogiri'a=Mechanize.new{|agent|agent.keep_alive=trueagent.max_history=0}urls=Array.new()urls.push('http://www.domain.co

ruby - 需要 Nokogiri?没有要加载的文件

我正在尝试开始使用Nokogiri。我运行了命令geminstallnokogiri作为Windows7(64位)的管理员。控制台显示“已成功安装”和“已安装1个gem”。当我输入时gemlist--localORgemq--local我在“本地gem”列表中看到了Nokogiri。但是,当我尝试通过require语句(在NetBeans中)使用它时,出现“没有要加载的此类文件”的错误。我做错了什么?我不是Ruby专家。这也是我安装的第一个gem。请为我简化它。 最佳答案 在Ruby1.8中,您必须先require'rubygems

ruby - 是否可以使用机器人打开浏览器,手动操作页面,然后继续使用机器人?

我正在使用Ruby、SeleniumWebDriver和Nokogiri从网页中检索数据。加载正确的HTML后,我打印某个类的内容。例如,require"selenium-webdriver"require"nokogiri"browser=Selenium::WebDriver.for:chromebrowser.get"https://jsfiddle.net"doc=Nokogiri::HTML.parse(browser.page_source)doc.css('.aiButton').map(&:text).join(',')到目前为止,我发现最困难的部分是正确加载正确的HT

ruby-on-rails - 警告 : Nokogiri was built against LibXML version 2. 8.0,但已动态加载 2.7.8

我在OSXML上的Ruby2.0.0和Rails4配置中遇到了这个问题。我的ArchLinux工作站上没有这个问题。这个警告之所以如此烦人,是因为它破坏了我的Vim插件(SweetVimRspec),因此终止了我的Vim开发工作流程,因为我无法测试。我在这里尝试了所有赞成的解决方案:MacuserandgettingWARNING:NokogiriwasbuiltagainstLibXMLversion2.7.8,buthasdynamicallyloaded2.7.3而且我无法摆脱它(实际上我在nokogiri本身中摆脱了它,但在rspec和railsconsole中根本没有)。

ruby - 如何获取 ruby​​ Nokogiri NodeSet 的 inner_html 未转义?

我想从NokogiriNodeSet中获取未转义的内部html。有谁知道如何做到这一点? 最佳答案 有什么不妥吗?nodeset.inner_html 关于ruby-如何获取ruby​​NokogiriNodeSet的inner_html未转义?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/1762687/

Ruby 模块给定参数调用一个方法?

我对Nokogiri文档中发生的事情感到困惑。据我所知,如果require'nokogiri'some_html="Mr.BelvedereFanClub"然后这三行做同样的事情:html_doc=Nokogiri::HTML::Document.parse(some_html)html_doc=Nokogiri::HTML.parse(some_html)html_doc=Nokogiri::HTML(some_html)第二个只是第一个的便捷方法。但在我的非Ruby眼中,第三个看起来像是将参数传递给模块,而不是方法。我知道Ruby有构造函数,但我认为它们采用的是Class.new形