草庐IT

utf-16le

全部标签

php - 如何使用正则表达式从 PHP 中的 UTF8 字符串中正确删除重复的空白字符?

我正在尝试使用正则表达式从PHP中的UTF8字符串中删除重复的空白字符。这个正则表达式$txt=preg_replace('/\s+/i','',$txt);通常可以正常使用,但有些字符串带有西里尔字母“Р”,更换后会被拧紧。经过小小的研究,我意识到该字母被编码为\x{D0A0},并且由于\xA0是ASCII中的不间断空格,正则表达式将其替换为\x20,该字符不再有效。关于如何使用正则表达式在PHP中正确执行此操作的任何想法? 最佳答案 试试u修饰符:$txt="UTF字符串with空格符號";var_dump(preg_repla

php - PHP 中的 UTF8 文件名和不同的 Unicode 编码

我在运行Linux的服务器上有一个包含Unicode字符的文件。如果我通过SSH进入服务器并使用制表符完成导航到包含unicode字符的文件/文件夹,我可以毫无问题地访问该文件/文件夹。当我尝试通过PHP访问文件时出现问题(我访问文件系统的函数是stat)。如果我将PHP脚本生成的路径输出到浏览器并将其粘贴到终端中,该文件似乎也存在(即使查看终端文件路径完全相同)。我通过php_ini将PHP设置为使用UTF8作为其默认编码,并设置了mb_internal_encoding。我检查了PHP文件路径字符串编码,结果显示为UTF8,这是应该的。仔细研究了一下,我决定hexdump终端制表符

『python爬虫』16. 多线程与多进程(保姆级图文)

目录多线程1.什么是多线程?2.串行模式3.多线程3.1多线程方法写法3.2多线程方法带参数3.3多线程类写法多进程1.什么是多进程欢迎关注『python爬虫』专栏,持续更新中欢迎关注『python爬虫』专栏,持续更新中多线程1.什么是多线程?不增加CPU数量的情况下同时执行多个线程的任务。相比较于多进程没有多个CPU之间交换信息的损耗。2.串行模式请注意!计算机中没有真正意义上的同时,只是因为执行多个任务时来回切换执行2个任务,让你觉得是同时。下面的程序是先执行完func()的内容,然后执行main的循环,这是典型的串行工作。deffunc():foriinrange(1000):print

PHP preg_split utf8 字符

preg拆分和utf有问题。这是代码:$original['words']=preg_split("/[\s]+/",$original['text']);print_r($original);这是答案:Array([text]=>Šiosbaterijoskaista[words]=>Array([0]=>�[1]=>ios[2]=>baterijos[3]=>kaista此代码在CakePHP框架中运行。请注意[text]在单词之前正确显示并且在拆分过程中困惑。顺便说一句,我试过使用这些:mb_internal_encoding('UTF-8');mb_regex_encoding

php mysql SET NAMES 'utf8' COLLATE 'utf8_unicode_ci' 不适用于 mysqli

我正在将我的站点从phpmysql_*方法迁移到phpmysqli。我有以下代码来完成这项工作:mysql_query("SETNAMES'utf8'COLLATE'utf8_unicode_ci'");如果没有这个查询,我的字符串字符(格鲁吉亚语)会写有问号。比如写成??????????而不是გამარჯობა既然它完成了它的工作,我很高兴,但现在我不能用mysqli做同样的事情。$mysqli=newmysqli("localhost","root","","test");$mysqli->query("SETNAMES'utf8'COLLATE'utf8_unicode_ci'"

php - 为什么像 sha1 这样的散列函数最多只使用 16 个不同的字符(十六进制)?

抱歉我有这种好奇心。sha1使用[a-f0-9]字符作为它的散列函数。我可以知道为什么它不使用所有可能的字符[a-z0-9]通过使用所有可用的字符它可以大大增加可能的不同哈希的数量,从而降低可能发生冲突的可能性.如果您认为这不是一个真正的问题,请发表评论,我会立即删除此问题。===如答案中所述,sha1NOT仅使用16个字符。正确的事实是:sha1是160位的二进制数据(引文)。我添加这个是为了防止混淆。 最佳答案 您将表示与内容混淆了。sha1是160位的二进制数据。您可以用以下方式轻松地表示它:hex:0xf1d2d2f924e

php - 我如何使用 php 检测字符串中的 iso8859-8 和 utf8 希伯来字符

我希望能够检测(使用正则表达式)字符串是否包含php编程语言中的utf8和iso8859-8希伯来字符。谢谢! 最佳答案 这是mapoftheiso8859-8characterset.E0-FA范围似乎是为希伯来语保留的。您可以检查字符类中的那些字符:[\xE0-\xFA]对于UTF-8,rangereservedforHebrew似乎是0591到05F4。所以你可以检测到:[\u0591-\u05F4]这是PHP中的正则表达式匹配示例:echopreg_match("/[\u0591-\u05F4]/",$string);

php - 如何清理包含有效 UTF8 字符的 XML 属性的表单字段?

我已经为此苦苦挣扎了一段时间。我有一个多语言网络应用程序,它会在某个时候输出XML。此XML可以包含任何语言,因此我的清理方法是禁止插入破坏XML的某些字符。那并尽可能多地包装在CDATA中,但我在属性中有大量内容。我不想禁止使用特殊字符,因为括号、句点、破折号、刻度和撇号等完全有效的字符一直在使用并且它们有效。去除所有会破坏XML属性但保持语言完好无损的字符的最佳方法是什么?更新:我发现:http://en.wikipedia.org/wiki/CDATA#CDATA-type_attribute_value,这向我表明我可以使用DTD将属性描述为CDATA部分;然而,这似乎不是真的

PHP UTF8 邮件在 iPhone 邮件应用程序上出现乱码

我用的是php内部邮件函数发邮件,我把它包在一个UTF8进程的函数里,我在网上找的。它有效,我将代码中的电子邮件发送到我的GMAIL和我的EXCHANGE服务器,无论是在GMAIL还是我的PC上的Outlook客户端中,我都能正确地收到消息。我的iPhone也连接到exchange和GMAIL帐户,所以我在iPhone上收到了这两条消息。iPhone正确接收GMAIL消息,但EXCHANGE帐户显示的消息带有乱码,其中没有拉丁字符。下面的示例在主题和正文中发送希伯来语字符。在我的iPhone上,主题以希伯来语正确接收,但消息正文中的希伯来语部分出现乱码。有人可以对此发表评论吗?也许在您

php://input 在 PHP 5.6.16 中只能读取一次

PHPmanual说明使用php://input打开的流支持查找操作,并且从PHP5.6开始可以多次读取,但我无法使其工作。以下示例清楚地表明它不起作用:';if(fseek($input,0)!=0)exit('Seekfailed');echo'Secondattempt:'.fread($input,1024).'';}?>输出:Firstattempt:test_name=test_valueSecondattempt:php://输入流是成功阅读成功倒带(fseek成功)阅读失败我做错了什么吗? 最佳答案 由于使用php: