输出 HTML 时,有几个不同的地方可以将文本解释为控制字符而不是文本文字。例如,在“常规”文本中(即在任何元素标记之外):
<div>This is regular text</div>
<input value="this is value text">
<!-- This text here might be programmatically generated
and could, in theory, contain the double-hyphen character
sequence, which is verboten inside comments -->
<a href="http://example.com/file.php?x=1&y=2">foo</a>
最佳答案
<div>This is regular text</div>
& 必须被转义。 < 必须被转义。]]> 不得出现在文本内容中,因此在这种特定情况下,必须对该序列中的一个字符进行转义,传统上为 > 。为了一致性,Canonical XML 规范选择每次在文本内容中转义 >,这对于转义函数来说不是一个糟糕的策略,尽管您当然可以跳过它进行手工创作。<input value="this is value text">
& 必须被转义。必须对属性值分隔符 " 或 ' 进行转义。如果没有使用属性值分隔符(不要这样做),则不可能进行转义。" 作为分隔符,因此对其进行转义。 > 字符不需要在属性值中转义,Canonical XML 不需要。 HTML4 规范建议无论如何编码 > 以实现向后兼容性,但这只会影响一些现在没人记得的真正古老而可怕的浏览器;你可以忽略它。< 必须被转义。虽然您可以在 HTML4 中不转义它,但这不是一个好主意。[\x01-\x08\x0B\x0C\x0E-\x1F\x7F-\x84\x86-\x9F] 。即使在 XML 1.1 中转义,也可能根本不包含空字符。在 XML 1.1 之外,您根本不能使用这些字符中的任何一个,也没有充分的理由想要使用。<!-- This text here might be programmatically generated
and could, in theory, contain the double-hyphen character
sequence, which is verboten inside comments -->
<!-- < --> ,它的字面意思是包含“&字母 l 字母 t 分号”的注释,并将在 DOM 或其他信息集中反射(reflect)。包含 -- 的注释根本无法序列化。<![CDATA[ 节和 <?pi s 也不能使用转义。序列化包含 ]]> 序列的 CDATA 部分的传统解决方案是将该序列拆分为两个 CDATA 部分,这样它就不会一起出现。您无法在单个 CDATA 部分中序列化它,也无法序列化数据中带有 ?> 的 PI。<script> 和 <style> 等 CDATA 元素可能不包含 </ (ETAGO) 序列,因为这会提前结束元素,如果后面没有结束标记名称,则会出错。由于在 CDATA 元素中不可能进行转义,因此必须避免并解决此序列(例如,通过将 document.write('</p>') 转换为 document.write('<\/p>'); 。(您会看到许多更复杂的愚蠢策略来解决这个问题,例如在 JS-上调用 unescape) % 编码的字符串;甚至经常是 '</scr'+'ipt>',这仍然是非常无效的。)% 字符具有特殊权力,需要转义才能成为字面上使用。但是,作为 HTML 文档作者,您几乎不可能需要接近那一团乱麻。The following text will throw errors as HTML 4.01 Strict:
<a href="http://example.com/file.php?x=1&y=2">foo</a>
If you put a space after the &, however, it validates just fine.
[A-Za-z] 和 # 之外的任何内容都不会作为引用开始解析。不过,依赖于此并不是一个好主意。 (当然,它在 XHTML 中的格式不是很好。)
关于html - 什么是所有 HTML 转义上下文?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1911022/
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
我有一个模型:classItem项目有一个属性“商店”基于存储的值,我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式?如果方法中没有大的if-else语句,这是如何干净利落地完成的? 最佳答案 通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co
我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
我试图获取一个长度在1到10之间的字符串,并输出将字符串分解为大小为1、2或3的连续子字符串的所有可能方式。例如:输入:123456将整数分割成单个字符,然后继续查找组合。该代码将返回以下所有数组。[1,2,3,4,5,6][12,3,4,5,6][1,23,4,5,6][1,2,34,5,6][1,2,3,45,6][1,2,3,4,56][12,34,5,6][12,3,45,6][12,3,4,56][1,23,45,6][1,2,34,56][1,23,4,56][12,34,56][123,4,5,6][1,234,5,6][1,2,345,6][1,2,3,456][123
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案 他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
为什么4.1%2返回0.0999999999999996?但是4.2%2==0.2。 最佳答案 参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意,这不是与Ruby相关的问题,而是与所有编程语言相关的问题,因为它来自计算机表示实数的方式。 关于ruby-为什么4.1%2使用Ruby返
如何匹配未被反斜杠转义的平衡定界符对(其本身未被反斜杠转义)(无需考虑嵌套)?例如对于反引号,我试过了,但是转义的反引号没有像转义那样工作。regex=/(?!$1:"how\\"#expected"how\\`are"上面的正则表达式不考虑由反斜杠转义并位于反引号前面的反斜杠,但我愿意考虑。StackOverflow如何做到这一点?这样做的目的并不复杂。我有文档文本,其中包括内联代码的反引号,就像StackOverflow一样,我想在HTML文件中显示它,内联代码用一些spanMaterial装饰。不会有嵌套,但转义反引号或转义反斜杠可能出现在任何地方。
在我的Controller中,我通过以下方式在我的index方法中支持HTML和JSON:respond_todo|format|format.htmlformat.json{renderjson:@user}end在浏览器中拉起它时,它会自然地以HTML呈现。但是,当我对/user资源进行内容类型为application/json的curl调用时(因为它是索引方法),我仍然将HTML作为响应。如何获取JSON作为响应?我还需要说明什么? 最佳答案 您应该将.json附加到请求的url,提供的格式在routes.rb的路径中定义。这
它不等于主线程的binding,这个toplevel作用域是什么?此作用域与主线程中的binding有何不同?>ruby-e'putsTOPLEVEL_BINDING===binding'false 最佳答案 事实是,TOPLEVEL_BINDING始终引用Binding的预定义全局实例,而Kernel#binding创建的新实例>Binding每次封装当前执行上下文。在顶层,它们都包含相同的绑定(bind),但它们不是同一个对象,您无法使用==或===测试它们的绑定(bind)相等性。putsTOPLEVEL_BINDINGput