UTF-8 和 HTML 实体之间有什么区别?
最佳答案
您在屏幕上看到的“A”实际上并没有在计算机中存储为“A”,而是一系列 1 和 0。 字符集 或编码 指定了一种以这种方式对字符进行编码的方式。 ASCII character set只包含少数它可以编码的字符,几乎完全限于英语字符。但由于历史原因和当时的技术限制,它曾经是互联网的字符集(很早)。
UTF-8 和 HTML 实体都可用于编码不属于 ASCII 的字符。 HTML 实体通过赋予特殊字符序列特殊含义来实现这一点。使用它,您可以仅使用 ASCII 字符对 ASCII 未涵盖的字符进行编码。 UTF-8 (Unicode) 通过简单地扩展字符集以包含更多字符来实现相同的目的。 HTML 实体仅在您费心对其进行解码的环境中才“有效”,通常是浏览器。 UTF-8 字符在任何支持该字符集的应用程序中都是通用的。
仅包含 ASCII 覆盖字符的文本:
Price: $20(UTF-8)
Price: $20(ASCII with HTML entities)
包含 ASCII 未涵盖的欧洲字符的文本:
Beträge: 20€(UTF-8)
Beträge: 20€(ASCII with HTML entities)
包含亚洲字符的文本,大多数肯定不包含在 ASCII 中:
値段:二千円(UTF-8)
値段:二千円(ASCII with HTML entities)
UTF-8 的问题是客户端需要理解 UTF-8。在过去十年左右的时间里,这已经无关紧要,因为所有现代计算机和浏览器都可以理解 UTF-8。 UTF-8 (Unicode) 几乎可以对当今地球上使用的所有字符进行编码(除了少数异常(exception))。使用它,您可以“按原样”处理文本。它绝对应该是保存文本的首选编码。
HTML 实体的问题在于普通字符具有特殊含义。写的时候ä ,它具有“ä”的特殊含义。如果你真的打算写“ä”,你需要将序列双重编码为ä .
HTML 实体也是出了名的不可读。您不想使用它们对普通文本中的“特殊”字符进行编码。在这种能力下,他们是一个用 bolt 固定在不合适的字符集上的杂物。请改用 Unicode。
独立于所用字符集的 HTML 实体的重要用途是将 HTML 标记与文本分开。 HTML 也赋予特殊字符序列特殊的含义。 <b>text</b>是一个正常的字符序列,但它对 HTML 解析器有特殊含义。如果您打算只写“text”,则需要将其编码为 <b>text</b> ,因此 HTML 解析器不会将其误认为是 HTML 标记。
关于php - UTF-8 和 HTML 实体有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2860108/
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
我有一个模型:classItem项目有一个属性“商店”基于存储的值,我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式?如果方法中没有大的if-else语句,这是如何干净利落地完成的? 最佳答案 通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co
我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案 他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
为什么4.1%2返回0.0999999999999996?但是4.2%2==0.2。 最佳答案 参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意,这不是与Ruby相关的问题,而是与所有编程语言相关的问题,因为它来自计算机表示实数的方式。 关于ruby-为什么4.1%2使用Ruby返
在我的Controller中,我通过以下方式在我的index方法中支持HTML和JSON:respond_todo|format|format.htmlformat.json{renderjson:@user}end在浏览器中拉起它时,它会自然地以HTML呈现。但是,当我对/user资源进行内容类型为application/json的curl调用时(因为它是索引方法),我仍然将HTML作为响应。如何获取JSON作为响应?我还需要说明什么? 最佳答案 您应该将.json附加到请求的url,提供的格式在routes.rb的路径中定义。这
它不等于主线程的binding,这个toplevel作用域是什么?此作用域与主线程中的binding有何不同?>ruby-e'putsTOPLEVEL_BINDING===binding'false 最佳答案 事实是,TOPLEVEL_BINDING始终引用Binding的预定义全局实例,而Kernel#binding创建的新实例>Binding每次封装当前执行上下文。在顶层,它们都包含相同的绑定(bind),但它们不是同一个对象,您无法使用==或===测试它们的绑定(bind)相等性。putsTOPLEVEL_BINDINGput
我可以得到Infinity和NaNn=9.0/0#=>Infinityn.class#=>Floatm=0/0.0#=>NaNm.class#=>Float但是当我想直接访问Infinity或NaN时:Infinity#=>uninitializedconstantInfinity(NameError)NaN#=>uninitializedconstantNaN(NameError)什么是Infinity和NaN?它们是对象、关键字还是其他东西? 最佳答案 您看到打印为Infinity和NaN的只是Float类的两个特殊实例的字符串
如果您尝试在Ruby中的nil对象上调用方法,则会出现NoMethodError异常并显示消息:"undefinedmethod‘...’fornil:NilClass"然而,有一个tryRails中的方法,如果它被发送到一个nil对象,它只返回nil:require'rubygems'require'active_support/all'nil.try(:nonexisting_method)#noNoMethodErrorexceptionanymore那么try如何在内部工作以防止该异常? 最佳答案 像Ruby中的所有其他对象