Unicode_草庐IT

php - 我怎样才能知道标点字符在 UTF 8 中的形式？

我有一组字符，比如.,!,?,;,(空格)和一个字符串，可以是也可以不是UTF8(任何语言)。有没有一种简单的方法可以找出字符串是否具有上述字符集之一？例如:这是一个在中国的字串。转化为这是一个中文字符串第一个字符串中的点字符看起来不同。那是一个完全不同的字符，还是utf8中的点对应者？或者也许某处有一个包含Unicode标点字符代码的列表？最佳答案在Unicode中有characterpropertiesPHPDocs，例如符号、字母等。您可以使用preg_matchDocs搜索特定类别的任何字符串和u修饰符。echopreg

php - 仅允许(英语和阿拉伯语)使用 UTF-8 代码

我正在寻找一个正则表达式来将所有非英语和/或阿拉伯语更改为下划线“_”目前我有以下有效的代码，但我认为我的unicode有误范围，因为它允许我在脚本中不需要的中文和其他语言。$title=~tr/[a-z0-9_\x7f-\xff]/_/cd;任何帮助将不胜感激最佳答案如果您看到\x7f和\xff之间的字节，您的应用程序可能正在使用UTF-8字节，而不是Unicode字符。阅读perldocperlunicode,然后decode()在尝试在此级别上使用它们之前你的字符串。完成后，您应该可以使用以下内容搜索英语和阿拉伯语字符:/

阿拉伯语 UTF-8 code section php perl unicode

PHP:将 Unicode 字符串转换为 ANSI 字符串

PHP是否有任何标准函数来将Unicode字符串转换为普通的、良好的老式ANSI字符串(或PHP的htmlentities理解的任何格式？是否有任何函数可以将UTF-8字符串转换为最流行的浏览器可以理解的HTML？最佳答案这不能正常工作。用Unicode存储的字符比用ANSI存储的字符多得多。因此，如果您“转换”为ANSI，就会丢失很多字符。http://php.net/manual/en/function.htmlentities.php您可以将Unicode(UTF-8)字符集与htmlentities一起使用:string

Unicode ANSI section htmlentities UTF-8 php string

PHP UTF-8 问题 - 如果我在 PHP 中创建一个字符串...它是 UTF-8 格式的吗？

在PHP中，如果我创建这样的字符串:$str="blablahereismystring";然后我可以使用mbstring函数将该字符串作为UTF8进行操作吗？//Willthiswork?$str=mb_strlen($str);此外，如果我有另一个字符串，我知道是UTF-8(假设它是一个POSTed表单值，或者来自数据库的UTF-8字符串)，我可以将它们连接起来吗二、有没有问题？//Whataboutthis,willthiswork?$str=$str.$utf8_string_from_database; 最佳答案第一个问

UTF-8 建一 section mbstring php unicode

php - 无法将 detect_unicode 设置/找到为关闭

我想开始使用phpDocumentor，但手动安装一直抛出错误，提示我没有在终端的php.ini中设置detect_unicode=Off。当我将它添加到我的php.ini时，它没有用，我在运行安装时遇到了同样的问题。似乎没有人遇到过这个问题，而且我这辈子都弄不明白。https://github.com/phpDocumentor/phpDocumentor2/blob/develop/README.md#installation我错过了什么？(我确实在php.ini编辑后重启了MAMP服务器)终端错误的屏幕截图... 最佳答案如

detect_unicode unicode section php phpDocumentor mamp phpdoc composer-php

php - 如何生成带有 Unicode Bangla 字符的 PDF？

我在使用PHP生成PDF格式的报告时遇到了问题。我尝试过FPDF、TCPDF和HTML2PDF库，但它们不支持所有Unicode字符集。TCPDF支持捷克语(cz)、丹麦语(da)、德语(de)、西类牙语(es)等。但我需要同时输出英语和孟加拉语文本。但是孟加拉字符正在被替换为?。是否有支持所有Unicode字符集的PHP库？如何使用FPDF、TCPDF或HTML2PDF输出Bangla字符集？最佳答案 FPDF有支持。请查看:http://www.fpdf.org/phorum/read.php?f=1&i=5142&t=514

Unicode Bangla section 孟加拉孟加拉语 php pdf fpdf

php - unicode 和简单 xml 错误

我尝试使用简单XML将字符串添加到XML对象。示例(http://ideone.com/L4ztum):$str="САМОЛЕТОМТКАдамант,г.Домодедово,мкр-нВостряково,Центральныйпросп.д.12";$movies=newSimpleXMLElement($str);但是它给出了一个警告:PHPWarning:SimpleXMLElement::__construct():Entity:line1:parsererror:PCDATAinvalidCharvalue2in/home/nmo2E7/prog.phponline5最

unicode php code section 34 xml

php - 如何在 PHP 中创建 JavaScript 转义序列？

我正在寻找一种在PHP中创建有效的UTF-16JavaScript转义序列字符(包括代理项对)的方法。我正在使用下面的代码获取UTF-32代码点(来自UTF-8编码字符)。这用作JavaScript转义字符(例如'\u00E1'代表'á')-直到您进入获得代理项对的较高范围(例如'?'出现为'\u1D715'但应该是'\uD835\uDF15')...functiontoOrdinal($chr){if(ord($chr{0})>=0&&ord($chr{0})=192&&ord($chr{0})=224&&ord($chr{0})=240&&ord($chr{0})=248&&ord

中创何在 ord chr 128 php unicode

PHP 正确的正则表达式在带有 unicode 的 PHP 5.3.3-7 中不起作用

我正在尝试让这个正则表达式起作用，它旨在在一个句子中同时找到两个词。echo(int)preg_match('/\bHello\W+(?:\w+\W+){0,6}?World\b/ui','Hello,world!',$matches).PHP_EOL;print_r($matches);而且效果很好:1Array([0]=>Hello,world)...但仅限于拉丁词。如果我切换到unicode，它找不到任何东西。也不需要查看语法，因为它来自abook(第8章“找到彼此靠近的两个词”)。问题是它只适用于拉丁词，但不适用于像这样的unicode字符串:'Привіт,світу!'(乌

PHP unicode code pre section regex utf-8 pcre

php - 抓取时的字体或 Unicode 问题

这个问题在这里已经有了答案:PHPDOMDocumentfailingtohandleutf-8characters(☆)(3个答案)关闭7年前。我正在尝试从网站上抓取信息。网站有这样的127EastZhongshanNo2Rd;中山东二路127号但是当我尝试废弃它并回显它时它会显示127EastZhongshanNo2Rd;ä¸å±±ä¸äºè·¯127å·我也试试UTF-8这是我的php代码现在请帮我解决这个问题。functionGrabPage($site){$ch=curl_init();curl_setopt($ch,CURLOPT_RETURNTRANSFER,TRUE)

Unicode php section curl_setopt curl html xpath web-scraping domdocument