草庐IT

Nokogiri

全部标签

ruby - Nokogiri 不在 ruby​​ 中解析 XML - xmlns 问题?

给定以下ruby代码:require'nokogiri'xml="1456540MatalanAbitoftexthttp://www.matalan.co.ukhttp://www.matalan.co.uk/2009-11-02T00:00:00111787Club18-30http://www.club18-30.com/http://www.club18-30.com2013-05-16T00:00:001"doc=Nokogiri::XML(xml)pdoc.xpath("//Programs")给出:=>[]不是预期的。如果我删除xmlns='http://publishe

ruby - 在 nokogiri 中解析没 Root过的多个标签

我想做这样的事情:fragment=parse("")another_node.add_child(fragment)但到目前为止,我还没有找到任何可以完成这项工作的东西——一切都需要一个根节点和多个子节点。关于如何实现这一目标的任何想法?看起来这个请求并没有那么奇怪,我觉得我一定错过了什么。 最佳答案 这个有效:fragment=Nokogiri::HTML.fragment("")another_node=Nokogiri::HTML.fragment("")another_node.add_child(fragment)

ruby - 如何使用 Ruby 和 Nokogiri 将 XML 节点解析为 CSV

我有一个XML文件:?xmlversion="1.0"encoding="iso-8859-1"?>...lotsmorenodesBoldmidsolestripeforasportylook.Odor-resistant,easytoclean,andquicktodry.Ventilationportsforenhancedbreathability.Lightweight,non-markingsoles.Water-friendlyandbuoyant;weighsonlyounces.FullymoldedCroslite™materialforlightwei

xml - Nokogiri 从 xml 中提取数据

我尝试使用Nokogirigem从Rails应用程序中的xml中提取数据,xml:text,blabla...]]>实际上我做了这样的事情来从xml中提取数据:deftest_content@return=Array.newsite='http://www.les-encens.com/modules/feeder/rss.php?id_category=0'@doc=Nokogiri::XML(open(site,"UserAgent"=>"Ruby-OpenURI"))@doc.xpath("//item").eachdo|n|@return你能告诉我如何从img标签中提取src属

ruby-on-rails - 选择名称以特定字符串开头的所有 XML 元素?

我有两个元素,item和date:item有_很多日期date属于项目我有一个像这样的XML树的文件:我使用Nokogiri来解析来自item的数据和date.我写了一半的脚本,它创建了元素:doc.xpath("//content/*").eachdo|item|Item.create!(title:item.xpath("title").text,description:item.xpath("description").text)end现在我需要查找并构建项目的所有日期(元素date),但无法理解如何解析像这样的标签,,ETC。我在尝试什么tour.xpath("//*/data

xml - 将 XML 集合(Pivotal Tracker 故事)转换为 Ruby 哈希/对象

我有一个XML格式的故事集。我想解析该文件并将每个故事作为哈希或Ruby对象返回,以便我可以在Ruby脚本中进一步操作数据。是否Nokogiri支持这个,还是有更好的工具/库可以使用?XML文档具有以下结构,通过PivotalTracker'swebAPI返回:16376featurehttp://www.pivotaltracker.com/story/show/163762acceptedAdescriptionReceivableindexlistingwillallowselectionviewingTonySupermanTonySuperman2009/11/0415:49

ruby-on-rails - 带有命名空间和前缀的 assert_select XML

有如下所示的XML,我如何assert_select标记atom:link?Titlehttp://example.comDescriptionassert_select'title'工作正常。assert_select'atom:link'输出预期至少有1个元素匹配“atom:link”,找到0..。我正在使用Rails4.2.0 最佳答案 你试过了吗,根据NokogiriCSSselector,将:替换为|。我没有测试,但它会是assert_select'atom|link'。 关于

xml - 如何让 nokogiri 选择节点属性并将它们添加到其他节点?

是否可以像这样获取后一个元素的属性并在前一个元素中使用它们?SectionXStuffSectionYStuff进入:1.SectionXStuff2.SectionYStuff我有这样的事情,但得到节点集或字符串错误:frag=Nokogiri::XML(File.open("test.xml"))frag.css('title').each{|text|text.set_attribute('id',"ID"+frag.css("title>paragraph['number']"))} 最佳答案 next_sibling应该完

ruby - 如何保留 XML 数组到哈希转换中的顺序?

我正在尝试使用内部使用Nokogiri的Nori在Ruby中解析XML。XML有一些重复的标签,库将重复的标签解析为数组,将不重复的标签解析为普通元素(哈希)abcde被解析为{nodes:{foo:[{name:"a"},{name:"d"}],bar:[{name:"b"},{name:"e"}],baz:{name:"c"}}}如何像下面的输出那样保留结果散列中元素的顺序?{nodes:[{foo:{name:"a"}},{bar:{name:"b"}},{baz:{name:"c"}},{foo:{name:"d"}},{bar:{name:"e"}},]}(这可能是一个库特定

ruby - 如何在恢复模式下运行 ruby​​ SAX 解析器?

我有一个相当大的XML文档,我想从中提取一些信息。它太大而无法保存在内存中,所以我认为SAX解析器比较合适。不幸的是,制作XML文档的人没有仔细阅读规范,因此它包含一些非法的XML实体(如)。不过,除此之外,据我所知,它还不错。对于任何依赖libxml的库,errorslikethesewilldisablefutureSAXprocessingunlesstheyareruninrecoverymode/**[WFC:LegalCharacter]*Charactersreferredtousingcharacterreferencesmustmatchthe*product