我在 stackoverflow 上搜索过这个问题,确实找到了一些主题,但我觉得在这方面对我来说并没有一个可靠的答案。
我有一个用户提交的表单,该字段的值存储在一个 XML 文件中。 XML 设置为使用 UTF-8 编码。
用户不时会从某处复制/粘贴文本,这时我会收到“实体未定义错误”。
我意识到 XML 只支持少数几个实体,除此之外的任何实体都无法识别 - 因此出现解析器错误。
据我所知,我看到了几个选项:
并将它们替换为 或实际空间。我对 XML 文件所做的是,用户可以将内容输入到表单中,然后将其存储在 XML 文件中,然后该内容在网页上显示为 XHTML(使用 SimpleXML 解析)。
在三个选项中,或者我不知道的任何其他选项中,处理这些实体的最佳方式是什么?
谢谢, 瑞恩
更新
我要感谢大家的精彩反馈。我实际上确定了导致我的实体错误的原因。所有的建议让我更深入地研究它!
一些文本框是普通的旧文本框,但我的文本区域使用 TinyMCE 进行了增强。事实证明,在仔细观察时,PHP 警告总是引用来自 TinyMCE 增强文本区域的数据。后来我注意到在 PC 上所有字符都被取出(因为它无法读取它们),但在 MAC 上你可以看到引用该字符的 unicode 编号的小方框。它首先在 MAC 上显示为正方形的原因是,我使用 utf8_encode 对非 UTF 格式的数据进行编码,以防止其他解析错误(这在某种程度上也与 TinyMCE 有关)。
解决这一切的方法很简单:
我在 tinyMCE.init 中添加了这一行 entity_encoding : "utf-8"。现在,所有角色都以他们应该的方式出现了。
我想我唯一不明白的是为什么字符放在文本框中时仍然显示,因为没有任何东西可以将它们转换为 UTF,但是对于 TinyMCE,这是一个问题。
最佳答案
我同意这纯粹是一个编码问题。在 PHP 中,我是这样解决这个问题的:
在将 html 片段传递给 SimpleXMLElement 构造函数之前,我使用 html_entity_decode 对其进行了解码。
然后使用utf8_encode()进一步编码。
$headerDoc = '<temp>' . utf8_encode(html_entity_decode($headerFragment)) . '</temp>';
$xmlHeader = new SimpleXMLElement($headerDoc);
现在上面的代码不会抛出任何undefined entity错误。
关于php - XML 解析器错误 : entity not defined,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3805050/
我有一个字符串input="maybe(thisis|thatwas)some((nice|ugly)(day|night)|(strange(weather|time)))"Ruby中解析该字符串的最佳方法是什么?我的意思是脚本应该能够像这样构建句子:maybethisissomeuglynightmaybethatwassomenicenightmaybethiswassomestrangetime等等,你明白了......我应该一个字符一个字符地读取字符串并构建一个带有堆栈的状态机来存储括号值以供以后计算,还是有更好的方法?也许为此目的准备了一个开箱即用的库?
大约一年前,我决定确保每个包含非唯一文本的Flash通知都将从模块中的方法中获取文本。我这样做的最初原因是为了避免一遍又一遍地输入相同的字符串。如果我想更改措辞,我可以在一个地方轻松完成,而且一遍又一遍地重复同一件事而出现拼写错误的可能性也会降低。我最终得到的是这样的:moduleMessagesdefformat_error_messages(errors)errors.map{|attribute,message|"Error:#{attribute.to_s.titleize}#{message}."}enddeferror_message_could_not_find(obje
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
我正在使用ruby1.9解析以下带有MacRoman字符的csv文件#encoding:ISO-8859-1#csv_parse.csvName,main-dialogue"Marceu","Giveittohimóhe,hiswife."我做了以下解析。require'csv'input_string=File.read("../csv_parse.rb").force_encoding("ISO-8859-1").encode("UTF-8")#=>"Name,main-dialogue\r\n\"Marceu\",\"Giveittohim\x97he,hiswife.\"\
我有一个对象has_many应呈现为xml的子对象。这不是问题。我的问题是我创建了一个Hash包含此数据,就像解析器需要它一样。但是rails自动将整个文件包含在.........我需要摆脱type="array"和我该如何处理?我没有在文档中找到任何内容。 最佳答案 我遇到了同样的问题;这是我的XML:我在用这个:entries.to_xml将散列数据转换为XML,但这会将条目的数据包装到中所以我修改了:entries.to_xml(root:"Contacts")但这仍然将转换后的XML包装在“联系人”中,将我的XML代码修改为
我遵循MichaelHartl的“RubyonRails教程:学习Web开发”,并创建了检查用户名和电子邮件长度有效性的测试(名称最多50个字符,电子邮件最多255个字符)。test/helpers/application_helper_test.rb的内容是:require'test_helper'classApplicationHelperTest在运行bundleexecraketest时,所有测试都通过了,但我看到以下消息在最后被标记为错误:ERROR["test_full_title_helper",ApplicationHelperTest,1.820016791]test
我是rails的新手,想在form字段上应用验证。myviewsnew.html.erb.....模拟.rbclassSimulation{:in=>1..25,:message=>'Therowmustbebetween1and25'}end模拟Controller.rbclassSimulationsController我想检查模型类中row字段的整数范围,如果不在范围内则返回错误信息。我可以检查上面代码的范围,但无法返回错误消息提前致谢 最佳答案 关键是您使用的是模型表单,一种显示ActiveRecord模型实例属性的表单。c
我正在尝试编写一个将文件上传到AWS并公开该文件的Ruby脚本。我做了以下事情:s3=Aws::S3::Resource.new(credentials:Aws::Credentials.new(KEY,SECRET),region:'us-west-2')obj=s3.bucket('stg-db').object('key')obj.upload_file(filename)这似乎工作正常,除了该文件不是公开可用的,而且我无法获得它的公共(public)URL。但是当我登录到S3时,我可以正常查看我的文件。为了使其公开可用,我将最后一行更改为obj.upload_file(file
我克隆了一个rails仓库,我现在正尝试捆绑安装背景:OSXElCapitanruby2.2.3p173(2015-08-18修订版51636)[x86_64-darwin15]rails-v在您的Gemfile中列出的或native可用的任何gem源中找不到gem'pg(>=0)ruby'。运行bundleinstall以安装缺少的gem。bundleinstallFetchinggemmetadatafromhttps://rubygems.org/............Fetchingversionmetadatafromhttps://rubygems.org/...Fe
在Cooper的书BeginningRuby中,第166页有一个我无法重现的示例。classSongincludeComparableattr_accessor:lengthdef(other)@lengthother.lengthenddefinitialize(song_name,length)@song_name=song_name@length=lengthendenda=Song.new('Rockaroundtheclock',143)b=Song.new('BohemianRhapsody',544)c=Song.new('MinuteWaltz',60)a.betwee