php - UTF-8 和 HTML 实体有什么区别？

coder 2024-01-01 原文

UTF-8 和 HTML 实体之间有什么区别？

最佳答案

您在屏幕上看到的“A”实际上并没有在计算机中存储为“A”，而是一系列 1 和 0。 字符集 或编码指定了一种以这种方式对字符进行编码的方式。 ASCII character set只包含少数它可以编码的字符，几乎完全限于英语字符。但由于历史原因和当时的技术限制，它曾经是互联网的字符集(很早)。

UTF-8 和 HTML 实体都可用于编码不属于 ASCII 的字符。 HTML 实体通过赋予特殊字符序列特殊含义来实现这一点。使用它，您可以仅使用 ASCII 字符对 ASCII 未涵盖的字符进行编码。 UTF-8 (Unicode) 通过简单地扩展字符集以包含更多字符来实现相同的目的。 HTML 实体仅在您费心对其进行解码的环境中才“有效”，通常是浏览器。 UTF-8 字符在任何支持该字符集的应用程序中都是通用的。

仅包含 ASCII 覆盖字符的文本:

Price: $20 (UTF-8)
Price: $20 (ASCII with HTML entities)

包含 ASCII 未涵盖的欧洲字符的文本:

Beträge: 20€ (UTF-8)
Beträge: 20€ (ASCII with HTML entities)

包含亚洲字符的文本，大多数肯定不包含在 ASCII 中:

値段：二千円 (UTF-8)
値段：二千円 (ASCII with HTML entities)

UTF-8 的问题是客户端需要理解 UTF-8。在过去十年左右的时间里，这已经无关紧要，因为所有现代计算机和浏览器都可以理解 UTF-8。 UTF-8 (Unicode) 几乎可以对当今地球上使用的所有字符进行编码(除了少数异常(exception))。使用它，您可以“按原样”处理文本。它绝对应该是保存文本的首选编码。

HTML 实体的问题在于普通字符具有特殊含义。写的时候ä ，它具有“ä”的特殊含义。如果你真的打算写“ä”，你需要将序列双重编码为&auml; .
HTML 实体也是出了名的不可读。您不想使用它们对普通文本中的“特殊”字符进行编码。在这种能力下，他们是一个用 bolt 固定在不合适的字符集上的杂物。请改用 Unicode。

独立于所用字符集的 HTML 实体的重要用途是将 HTML 标记与文本分开。 HTML 也赋予特殊字符序列特殊的含义。 <b>text</b>是一个正常的字符序列，但它对 HTML 解析器有特殊含义。如果您打算只写“text”，则需要将其编码为 <b>text</b> ，因此 HTML 解析器不会将其误认为是 HTML 标记。

关于php - UTF-8 和 HTML 实体有什么区别？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2860108/

有关php - UTF-8 和 HTML 实体有什么区别？的更多相关文章

ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法？ - 2
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
ruby-on-rails - Rails - 子类化模型的设计模式是什么？ - 2
我有一个模型:classItem项目有一个属性“商店”基于存储的值，我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式？如果方法中没有大的if-else语句，这是如何干净利落地完成的？最佳答案通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.co
ruby - 使用 ruby 将 HTML 转换为纯文本并维护结构/格式 - 2
我想将html转换为纯文本。不过，我不想只删除标签，我想智能地保留尽可能多的格式。为插入换行符标签，检测段落并格式化它们等。输入非常简单，通常是格式良好的html(不是整个文档，只是一堆内容，通常没有anchor或图像)。我可以将几个正则表达式放在一起，让我达到80%，但我认为可能有一些现有的解决方案更智能。最佳答案首先，不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案，它会随着HTML的变化而崩溃，或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby 中生成它们？ - 2
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
ruby - 解析 RDFa、微数据等的最佳方式是什么，使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2
我主要使用Ruby来执行此操作，但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式，例如使用这个yaml文件，它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
ruby - 为什么 4.1%2 使用 Ruby 返回 0.0999999999999996？但是 4.2%2==0.2 - 2
为什么4.1%2返回0.0999999999999996？但是4.2%2==0.2。最佳答案参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意，这不是与Ruby相关的问题，而是与所有编程语言相关的问题，因为它来自计算机表示实数的方式。关于ruby-为什么4.1%2使用Ruby返
ruby-on-rails - Rails HTML 请求渲染 JSON - 2
在我的Controller中，我通过以下方式在我的index方法中支持HTML和JSON:respond_todo|format|format.htmlformat.json{renderjson:@user}end在浏览器中拉起它时，它会自然地以HTML呈现。但是，当我对/user资源进行内容类型为application/json的curl调用时(因为它是索引方法)，我仍然将HTML作为响应。如何获取JSON作为响应？我还需要说明什么？最佳答案您应该将.json附加到请求的url，提供的格式在routes.rb的路径中定义。这
ruby - ruby 中的 TOPLEVEL_BINDING 是什么？ - 2
它不等于主线程的binding，这个toplevel作用域是什么？此作用域与主线程中的binding有何不同？>ruby-e'putsTOPLEVEL_BINDING===binding'false 最佳答案事实是，TOPLEVEL_BINDING始终引用Binding的预定义全局实例，而Kernel#binding创建的新实例>Binding每次封装当前执行上下文。在顶层，它们都包含相同的绑定(bind)，但它们不是同一个对象，您无法使用==或===测试它们的绑定(bind)相等性。putsTOPLEVEL_BINDINGput
ruby - Infinity 和 NaN 的类型是什么？ - 2
我可以得到Infinity和NaNn=9.0/0#=>Infinityn.class#=>Floatm=0/0.0#=>NaNm.class#=>Float但是当我想直接访问Infinity或NaN时:Infinity#=>uninitializedconstantInfinity(NameError)NaN#=>uninitializedconstantNaN(NameError)什么是Infinity和NaN？它们是对象、关键字还是其他东西？最佳答案您看到打印为Infinity和NaN的只是Float类的两个特殊实例的字符串
ruby-on-rails - 如果 Object::try 被发送到一个 nil 对象，为什么它会起作用？ - 2
如果您尝试在Ruby中的nil对象上调用方法，则会出现NoMethodError异常并显示消息:"undefinedmethod‘...’fornil:NilClass"然而，有一个tryRails中的方法，如果它被发送到一个nil对象，它只返回nil:require'rubygems'require'active_support/all'nil.try(:nonexisting_method)#noNoMethodErrorexceptionanymore那么try如何在内部工作以防止该异常？最佳答案像Ruby中的所有其他对象

php - UTF-8 和 HTML 实体有什么区别？

有关php - UTF-8 和 HTML 实体有什么区别？的更多相关文章

随机推荐