草庐IT

Nokogiri

全部标签

ruby - 只处理 HTML 片段并返回它

当我对Nokogiri执行以下操作时:some_html='test'f=Nokogiri::HTML(some_html)#dosomeprocessingputsf它将打印整个XHTML文档结构,其中包含上层代码。我怎样才能打印/返回/获取some_html变量中的html部分?没有。f将返回:"\n\ntest\n\n"我只想要内部/片段部分:test 最佳答案 不要使用Nokogiri::HTML(...)进行解析,而是使用Nokogiri::HTML::fragment(...):asdf=Nokogiri::HTML::

ruby-on-rails - Nokogiri 不允许我在 Rails 中进行捆绑安装

我已经看到有人问过这个问题,并尝试了我所看到的所有建议。我有一台新的macbook,想设置一个现有的应用程序。当我克隆应用程序时,它不会捆绑安装并且就像Rails没有安装一样,即使它在其他目录中工作。我尝试从gemfile中删除版本号并删除gemfile.lock。我试过捆绑更新。我在osx10.9.4、rails4.1.5和ruby​​2.1.1上。我得到的错误:Anerroroccurredwhileinstallingnokogiri(1.6.3.1),andBundlercannotcontinue.Makesurethat`geminstallnokogiri-v'1.6.3

ruby - 安装 ruby​​ gem nokogiri 时缺少 libxslt

我知道这是一个重复的问题,但是我发现与此问题相关的所有其他答案似乎都没有帮助我...我正在安装GitLab并在它满足NokoGirigem要求时运行gem依赖项并失败并显示以下信息:ERROR:Errorinstallingnokogiri:ERROR:Failedtobuildgemnativeextension./usr/local/bin/rubyextconf.rbextconf.rb:10:in`':UseRbConfiginsteadofobsoleteanddeprecatedConfig.extconf.rb:10:in`':UseRbConfiginsteadofob

ruby - 尝试使用 nokogiri 获取 xml 文件中 cdata 标签内的内容

我已经看到了几件事,但到目前为止似乎没有任何效果。我正在使用nokogirionrails3ruby​​1.9.2通过url解析xml。xml的片段如下所示:我正在尝试解析它以获取与NewsLineText关联的文本r=node.at_xpath('.//newslinetext')ifnode.at_xpath('.//newslinetext')s=node.at_xpath('.//newslinetext').textifnode.at_xpath('.//newslinetext')t=node.at_xpath('.//newslinetext').contentifnod

ruby-on-rails - 使用 Ruby 1.9.3 的 Windows 8 x64 上的 nokogiri gem 缺少 libxml2

我在搜索类似问题时发现Nokogiri还没有Ruby2.0的x64支持。然而,虽然我在Windowsx64机器上,但我的Ruby版本是ruby1.9.3p392(2013-02-22)[i386-mingw32]来自railsinstaller.org(使用Rails3.2.13)。这也意味着DevKit已经安装。geminstallnokogiri--pre出现此错误:TemporarilyenhancingPATHtoincludeDevKit...Buildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallin

ruby - 使用 Nokogiri HTML Builder 创建具有多个根节点的片段

我有一个关于Nokogiri的简单问题。我想让Nokogiri::HTML::Builder制作以下形式的HTML片段:#Somestuffinhere#Someotherstuffinhere尝试做的时候:@builder=Nokogiri::HTML::Builder.new(:encoding=>'UTF-8')do|doc|doc.div{doc.p"firsttest"}doc.div{doc.p"secondtest"}end@builder.to_html我得到一个错误:Documenthasalreadyarootnode,我部分理解了。我知道我没有将整个内容包装到标签

ruby - 在 nokogiri rails 中找到一级 child

我遇到了如何从当前元素中找到一级子元素的问题?例如我有html:abcdefsecond我正在为rails使用Nokogiri:table=page.css('table')table.css('tr')它返回表中的所有tr。但我只需要2个表的第一层。 最佳答案 当你这样说时:table=page.css('table')您正在获取两个表而不仅仅是顶级表。因此,您可以返回到文档根目录并使用只匹配第一个表中的行的选择器,如mosch所说,或者您可以将table修复为仅外部表,如下所示:table=page.css('table').f

ruby - XPath 轴,获取所有后续节点直到

我有以下HTML示例:FoobarloremipsumetcBarbazdumdumdumpoopfiddles我希望提取“Foobar”标题后的所有段落,直到到达“Barbaz”标题(“Barbaz”标题的文本未知,所以很遗憾我无法使用答案由bougyman提供)。现在我当然可以使用//h2[text()='Foobar']/following::p之类的东西,但这当然会抓取此后的所有段落header。因此,我可以选择遍历节点集并将段落插入数组,直到文本与下一个header的文本相匹配,但老实说,这远不如在XPath中完成这件事那么酷。有没有办法做到这一点我想念的?

ruby - Nokogiri 中的 .at_css 和 .css 有什么区别?

我找不到明确、直接的答案,但是Nokogiri中的.at_css和.css有什么区别? 最佳答案 Nokogiri具有搜索和查找所有内容以及查找第一个方法的同义词。search,/,xpath和cssall搜索每次出现的访问器并返回NodeSet.at,%,at_xpath和at_css搜索第一次出现并返回Node.这就是为什么文档说它们等同于说search('//some/path').first或css('somepath').first. 关于ruby-Nokogiri中的.at_

ruby - Nokogiri 保持 HTML 实体不变

我希望Nokogiri保持HTML实体不变,但它似乎正在将实体转换为实际符号。例如:Nokogiri::HTML.fragment('®').to_s结果:"®"似乎没有任何东西可以将原始HTML返回给我。.inner_html、.text、.content方法都返回'®'而不是'®'有没有办法让Nokogiri保持这些HTML实体不变?我已经搜索过stackoverflow并找到了类似的问题,但没有一个与这个问题完全相同。 最佳答案 这不是一个理想的答案,但您可以通过设置允许的编码来强制它生成实体(如果不是好听的名