US_ASCII_草庐IT

php - mb_detect_encoding 将 ASCII 检测为 UTF-8？

我正在尝试自动将导入的IPTC元数据从图像转换为UTF-8，以便基于PHPmb_函数存储在数据库中。目前看起来是这样的:$val=mb_convert_encoding($val,'UTF-8',mb_detect_encoding($val));但是，当mb_detect_encoding()被提供一个ASCII字符串(Latin1字段中192-255的特殊字符)时，它会将其检测为UTF-8，因此在下面的尝试中将所有内容都转换为为了正确使用UTF-8，所有特殊字符都被删除。我尝试通过查找Latin1值来编写自己的方法，如果没有出现，我将继续让mb_detect_encoding决定它

php - 我如何告诉 poedit 忽略非 ASCII 文本错误？

我正在尝试让poedit在我的PHP项目上创建一个目录。它在我的一些文件中遇到非ASCII字符时崩溃。由于项目很大，我想知道是否可以运行poedit并忽略这些错误，而不是忽略它们出现的每个文件。我在Windows上使用poeditGUI。我正在尝试将法语内容本地化为英语，反之亦然。最佳答案在poEdit中，转到目录和设置并检查源代码字符集中的属性。尝试使用UTF-8。(提示对我有用，来自http://www.netvivs.com/error-xgettext-non-ascii-string-in-poedit/)

poedit ASCII section error-xgettext-non-ascii-string-i php

php - 我可以使用 iconv 将多字节智能引号转换为扩展的 ASCII 智能引号吗？

我有一些包含多字节智能引号字符的UTF-8内容。我发现这段代码可以轻松地将这些字符转换为ASCII直引号(ASCII代码34):$content=iconv("UTF-8","ASCII//TRANSLIT",$content);或$content=iconv("UTF-8","ISO-8859-1//TRANSLIT",$content);但是，我宁愿将它们转换为扩展的ASCII智能引号(Latin1编码中的ASCII代码147和148)。有谁知道如何做到这一点？最佳答案您正在寻找CP-1252其中包含0x91-0x94(14

引号多字 section content php character-encoding iconv extended-ascii

php - 字符串函数在 PHP 中是 ASCII 安全的吗？

一些PHPstringfunctions(如strtoupper等)依赖于语言环境。但是当我确实知道特定字符串仅由ASCII(0-127)字符组成时，仍然不清楚语言环境是否重要。我可以保证strtoupper('abc..xyz')将始终独立于区域设置返回ABC..XYZ吗？做PHPstringfunctions在独立于区域设置的ASCII范围内工作相同？虽然关于strtoupper的答案对我来说很重要，但这个问题对于所有字符串函数库来说更为笼统。我想确保用户选择的语言环境(在多语言网站上)不会破坏我的与国际化无关的核心功能。最佳答案

ASCII php code section noreferrer string internationalization locale

php - PHP 中的字符串文字是否只能以 ASCII 的兼容超集(例如 UTF-8 或 ISO-8859-1)的编码进行编码？

我从DetailsoftheStringType中看到以下文字PHP手册中的页面:GiventhatPHPdoesnotdictateaspecificencodingforstrings,onemightwonderhowstringliteralsareencoded.Stringwillbeencodedinwhateverfashionitisencodedinthescriptfile.Thus,ifthescriptiswritteninISO-8859-1,thestringwillbeencodedinISO-8859-1andsoon.However,thisdoes

UTF-8 例如 strong ASCII code php encoding non-ascii-characters

php - 将特殊字符(即元音变音)转换为最可能的 ascii 表示形式

这个问题在这里已经有了答案:PHP:Replaceumlautswithclosest7-bitASCIIequivalentinanUTF-8string(7个答案)关闭9年前。我正在寻找一种方法或者可能是一个转换表，它知道如何将变音符号和特殊字符转换为最可能的ascii表示形式。例子:Ärger=aergerBôhme=bohmeSøren=soerenpjérà=pjera有人知道吗？更新:除了公认的答案外，我还找到了PECLNormalizer非常有趣，虽然我不能使用它，因为服务器没有它并且没有为我更改。也请查看thisQuestion如果此处的答案对您的帮助不够。

元音 ascii section notice noreferrer php special-characters diacritics non-ascii-characters

php - 从字符串中修剪空白 ASCII 字符 "194"

最近遇到了一个非常奇怪的问题，我的数据库包含的字符串看起来是正常的空白字符，但实际上是其他东西。例如，将trim()应用于字符串:"TEST"让我:"TEST"结果。所以我复制并粘贴字符串中的最后一个字符，然后:echoord('');194194？根据ASCII表，应该是┬。所以我现在很困惑。为什么这个字符看起来是空格？当trim()失败时，我如何trim()这样的字符？最佳答案它更有可能是一个两字节的194160序列，这是一个NO-BREAKSPACE代码点的UTF-8编码(相当于 HTML中的实体)。它真的不是一个空间，尽

amp ASCII code section pre php character-encoding whitespace

php - 包括特殊字符在内的任何英文 ASCII 字符的正则表达式

我想在php中编写一个正则表达式来匹配任何英文字符、空格、数字和所有特殊字符。从这个问题Regexanyasciicharacter我试过了preg_match("/[\x00-\x7F]+/",$str);但它会发出警告Noendingdelimiter'/'found那么，如何在php中编写这个正则表达式。替代方案是[a-z\d\s]之类的，并且一个一个地考虑所有特殊字符，但是没有办法更简单吗？谢谢最佳答案有许多复杂的解决方案，但我建议使用这个非常简单的正则表达式:^[-~]+$它允许ASCIItable中的所有可打印字符.

在内 ASCII code section strong php regex preg-match

android - 使用 Erlang 解析 ASCII 字符

对需要进行哪些解析以及在客户端/服务器端进行哪些解析感到困惑。WhenisendanUmlaut'Ö'tomyejabberd,itisreceivedbyejabberdas>在此之后，我将其作为推送通知发送给我的客户(静默地通过GCM/APNS)。从那里开始，客户端通过UTF-8解码一个一个地对每个数字进行构建(这是错误的)。i.e.195isfirstdecodedtogibberishcharacter�andsoon.如果要接受两个字节或三个或更多字节，则此重建需要标识。这因字母的语言而异(例如德语)。客户端如何确定要重构的语言(一次性解码的字节数)？要添加更多，lists:

android Erlang code li 34 xmpp apple-push-notifications ejabberd

java - 机器人:摆脱 "warning: unmappable character for encoding ascii"

我正在使用android工具不使用eclipse进行编译。我从命令行编译启动“antdebug”。我在网上找到了很多关于如何删除烦人警告的说明，但我无法使它们中的任何一个起作用。我试过-D选项，我试过随机调整build.*文件，我试过导出环境变量……什么都没有。我想这些方法中的一些根本行不通，而另一些方法可能行得通，但我一直在错误地使用它们。一切皆有可能，我再也受不了了:关于如何去做有什么建议吗？最佳答案我遇到了同样的问题。我就是这样解决的:当我启动antrelease时，输出中有这一行:[setup]Importingrule

unmappable amp section code ant java android encoding internationalization