草庐IT

Nokogiri

全部标签

ruby - 无法安装 Nokogiri gem,找不到 "libxml/parser.h",但它在那里,为什么?

我尝试安装Nokogiri,但我总是遇到编译错误:checkingforlibxml/parser.h...***extconf.rbfailed***但是,我已经安装了它和所有其他依赖项。我尝试像这样给安装程序提示:%>geminstallnokogiri----with-xml2-lib=/usr/lib/--with-xml2-include=/usr/include/libxml2/...checkingforlibxml/parser.h...***extconf.rbfailed***...但它仍然没有安装:%>find/usr/include/-name"parser.h

ruby - 使用 Nokogiri 插入和删除 XML 节点和元素

我想提取XML文件的一部分,并记下我提取了该文件中的某些部分,例如“这里提取了一些东西”。我正尝试用Nokogiri来做这件事,但似乎并没有真正记录如何:删除的所有child更改inner_text那个完整的元素有什么线索吗? 最佳答案 Nokogiri让这一切变得非常简单。使用thisdocument例如,以下代码将找到所有vitamins标签,删除它们的子标签(以及子标签的子标签等),并将它们的内部文本更改为“Childrenremoved”。require'nokogiri'io=File.open('sample.xml',

ruby - 如何搜索 "text"然后从找到的节点遍历 DOM?

我有一个网页,我需要从中抓取一些数据。问题是,每个页面可能有也可能没有特定数据,或者在DOM中它的上方或下方可能有额外的数据,并且没有CSSid可言。通常我可以使用CSSid或XPath来找到我正在寻找的节点。在这种情况下我没有那个选项。我要做的是搜索“标签”文本,然后在下一个中获取数据节点:Name:JoeSmith在上面的HTML中,我会搜索:doc.search("[text()*='Name:']")获取我需要的数据之前的节点,但我不确定如何从那里导航。 最佳答案 next_element可能是您正在寻找的方法。requir

ruby-on-rails - rails nokogiri 没有这样的文件或目录

gem文件...gem'nokogiri'...在Controller中doc=Nokogiri::HTML(open('http://google.com'))我得到了一个错误Errno::ENOENTinSiteController#scrapNosuchfileordirectory-http://google.comapp/controllers/site_controller.rb:6:in`initialize'app/controllers/site_controller.rb:6:in`open'app/controllers/site_controller.rb:6:

ruby - 如何让 Nokogiri 不转换为空间

我像这样获取一个html片段"市 场 价"其中包含“ ”,但是在调用NokogiriNodeSet的to_s之后,变成了"市场价",我想保留原来的html片段,并尝试为to_s方法设置:save_withoption,但失败了。有人遇到同样的问题可以帮帮我吗?提前谢谢你。 最佳答案 我遇到过类似的情况,我想出来的有点hack,但似乎效果很好。nbsp=Nokogiri::HTML(" ").texttext.gsub(nbsp,"")在我的例子中,我希望nbsp是一个常规空间。我认为在您的情况下,您希望

ruby-on-rails - 无法安装 Nokogiri gem

我正在开发一个允许图像附件到每个用户帐户的Rails应用程序。我正在使用回形针和亚马逊网络服务:gem'paperclip'gem'aws-sdk'当我运行bundleinstall时,我收到这条消息:extconf失败,退出代码1Gemfileswillremaininstalledin/usr/local/rvm/gems/ruby-2.1.2/gems/nokogiri-1.6.5forinspection.Resultsloggedto/usr/local/rvm/gems/ruby-2.1.2/extensions/x86_64-darwin-13/2.1.0-static/

ruby - 如何创建 nokogiri 不区分大小写的 Xpath 选择器?

我正在使用nokogiri来选择“关键字”属性,如下所示:putspage.parser.xpath("//meta[@name='keywords']").to_html我正在使用的其中一个页面的关键字标签带有大写字母“K”,这促使我使查询不区分大小写。AND所以,我的问题是:使nokogiri选择不区分大小写的最佳方法是什么?编辑下面Tomalak的建议非常适合这个特定问题。我还想使用这个例子来帮助更好地理解nokogiri,并且有几个我想知道但没有成功搜索的问题。例如,正则表达式“伪类”是NokogiriDocs吗?适合这样的问题吗?我也很好奇nokogiri中的matches?

ruby - 如何在 Nokogiri/Ruby 解析期间检查页面上是否存在元素?

在使用Nokogiri(Rubygem)解析HTML页面期间,我如何检查页面上是否存在元素(在本例中为div)?在我的测试页面上,它确实存在,因此pp会产生预期的Nokogiri输出。但是if语句不起作用,==true似乎是错误的方法。有什么改进建议吗?干杯,克里斯pppage.at('.//div[@class="errorMsg"]')ifpage.at('.//div[@class="errorMsg"]')==truethenputs"Errormessagefoundonpage"end 最佳答案 与true比较不是正确的

ruby - 直接在 Nokogiri 的标签内获取文本

我有一些HTML看起来像:Hello(2009)我已经将所有HTML加载到名为record的变量中。我需要解析年份,即2009年(如果存在)。如何获取dt标签内的文本而不是a标签内的文本?我使用了record.search("dt").inner_text,这给了我一切。这是一个微不足道的问题,但我还没弄明白。 最佳答案 要获取所有带有文本的直接子项,但不包含任何其他子项,您可以像这样使用XPath:doc.xpath('//dt/text()')或者如果您想使用搜索:doc.search('dt').xpath('text()')

ruby-on-rails - ERROR : While executing gem . .. (TypeError) 不兼容的编码文件格式(无法读取)

我在使用Ruby2.4.4版和macOSMojave运行bundleinstall时遇到了这个问题:Fetchingnokogiri1.8.5Installingnokogiri1.8.5withnativeextensionsGem::Ext::BuildError:ERROR:Failedtobuildgemnativeextension.ERROR:cannotdiscoverwherelibxml2islocatedonyoursystem.pleasemakesure`pkg-config`isinstalled.所以我跑了xcode-select--install但是当我运