Nokogiri

ruby - 无法安装 Nokogiri gem，找不到 "libxml/parser.h"，但它在那里，为什么？

我尝试安装Nokogiri，但我总是遇到编译错误:checkingforlibxml/parser.h...***extconf.rbfailed***但是，我已经安装了它和所有其他依赖项。我尝试像这样给安装程序提示:%>geminstallnokogiri----with-xml2-lib=/usr/lib/--with-xml2-include=/usr/include/libxml2/...checkingforlibxml/parser.h...***extconf.rbfailed***...但它仍然没有安装:%>find/usr/include/-name"parser.h

ruby - 使用 Nokogiri 插入和删除 XML 节点和元素

我想提取XML文件的一部分，并记下我提取了该文件中的某些部分，例如“这里提取了一些东西”。我正尝试用Nokogiri来做这件事，但似乎并没有真正记录如何:删除的所有child更改inner_text那个完整的元素有什么线索吗？最佳答案 Nokogiri让这一切变得非常简单。使用thisdocument例如，以下代码将找到所有vitamins标签，删除它们的子标签(以及子标签的子标签等)，并将它们的内部文本更改为“Childrenremoved”。require'nokogiri'io=File.open('sample.xml',

Nokogiri ruby gt lt code

ruby - 如何搜索 "text"然后从找到的节点遍历 DOM？

我有一个网页，我需要从中抓取一些数据。问题是，每个页面可能有也可能没有特定数据，或者在DOM中它的上方或下方可能有额外的数据，并且没有CSSid可言。通常我可以使用CSSid或XPath来找到我正在寻找的节点。在这种情况下我没有那个选项。我要做的是搜索“标签”文本，然后在下一个中获取数据节点:Name:JoeSmith在上面的HTML中，我会搜索:doc.search("[text()*='Name:']")获取我需要的数据之前的节点，但我不确定如何从那里导航。最佳答案 next_element可能是您正在寻找的方法。requir

amp ruby code gt lt nokogiri

ruby-on-rails - rails nokogiri 没有这样的文件或目录

gem文件...gem'nokogiri'...在Controller中doc=Nokogiri::HTML(open('http://google.com'))我得到了一个错误Errno::ENOENTinSiteController#scrapNosuchfileordirectory-http://google.comapp/controllers/site_controller.rb:6:in`initialize'app/controllers/site_controller.rb:6:in`open'app/controllers/site_controller.rb:6:

rails ruby-on-rails code section pre ruby nokogiri

ruby - 如何让 Nokogiri 不转换为空间

我像这样获取一个html片段"市场价"其中包含“ ”，但是在调用NokogiriNodeSet的to_s之后，变成了"市场价"，我想保留原来的html片段，并尝试为to_s方法设置:save_withoption，但失败了。有人遇到同样的问题可以帮帮我吗？提前谢谢你。最佳答案我遇到过类似的情况，我想出来的有点hack，但似乎效果很好。nbsp=Nokogiri::HTML(" ").texttext.gsub(nbsp,"")在我的例子中，我希望nbsp是一个常规空间。我认为在您的情况下，您希望

Nokogiri ruby code nbsp section html-entities

ruby-on-rails - 无法安装 Nokogiri gem

我正在开发一个允许图像附件到每个用户帐户的Rails应用程序。我正在使用回形针和亚马逊网络服务:gem'paperclip'gem'aws-sdk'当我运行bundleinstall时，我收到这条消息:extconf失败，退出代码1Gemfileswillremaininstalledin/usr/local/rvm/gems/ruby-2.1.2/gems/nokogiri-1.6.5forinspection.Resultsloggedto/usr/local/rvm/gems/ruby-2.1.2/extensions/x86_64-darwin-13/2.1.0-static/

ruby-on-rails Nokogiri without include with ruby rvm paperclip

ruby - 如何创建 nokogiri 不区分大小写的 Xpath 选择器？

我正在使用nokogiri来选择“关键字”属性，如下所示:putspage.parser.xpath("//meta[@name='keywords']").to_html我正在使用的其中一个页面的关键字标签带有大写字母“K”，这促使我使查询不区分大小写。AND所以，我的问题是:使nokogiri选择不区分大小写的最佳方法是什么？编辑下面Tomalak的建议非常适合这个特定问题。我还想使用这个例子来帮助更好地理解nokogiri，并且有几个我想知道但没有成功搜索的问题。例如，正则表达式“伪类”是NokogiriDocs吗？适合这样的问题吗？我也很好奇nokogiri中的matches?

nokogiri Xpath code section ruby

ruby - 如何在 Nokogiri/Ruby 解析期间检查页面上是否存在元素？

在使用Nokogiri(Rubygem)解析HTML页面期间，我如何检查页面上是否存在元素(在本例中为div)？在我的测试页面上，它确实存在，因此pp会产生预期的Nokogiri输出。但是if语句不起作用，==true似乎是错误的方法。有什么改进建议吗？干杯，克里斯pppage.at('.//div[@class="errorMsg"]')ifpage.at('.//div[@class="errorMsg"]')==truethenputs"Errormessagefoundonpage"end 最佳答案与true比较不是正确的

何在 Nokogiri code section ruby parsing

ruby - 直接在 Nokogiri 的标签内获取文本

我有一些HTML看起来像:Hello(2009)我已经将所有HTML加载到名为record的变量中。我需要解析年份，即2009年(如果存在)。如何获取dt标签内的文本而不是a标签内的文本？我使用了record.search("dt").inner_text，这给了我一切。这是一个微不足道的问题，但我还没弄明白。最佳答案要获取所有带有文本的直接子项，但不包含任何其他子项，您可以像这样使用XPath:doc.xpath('//dt/text()')或者如果您想使用搜索:doc.search('dt').xpath('text()')

Nokogiri ruby code section 子项

ruby-on-rails - ERROR : While executing gem . .. (TypeError) 不兼容的编码文件格式(无法读取)

我在使用Ruby2.4.4版和macOSMojave运行bundleinstall时遇到了这个问题:Fetchingnokogiri1.8.5Installingnokogiri1.8.5withnativeextensionsGem::Ext::BuildError:ERROR:Failedtobuildgemnativeextension.ERROR:cannotdiscoverwherelibxml2islocatedonyoursystem.pleasemakesure`pkg-config`isinstalled.所以我跑了xcode-select--install但是当我运

ruby-on-rails TypeError code section pre ruby rubygems nokogiri macos-mojave

9 10 111213 14 15