utf8mb

用BS4解析1 MB XML文件

我有两个SVG地图，下载了这里。我的目标是对Python中的这些地图进行一些编辑，并通过BeautifulSoup4与它们合作。这与低分辨率文件（132.5kb）完美搭配。但是，当我尝试将其与高分辨率文件（1.2MB）一起使用时，BS4解析器（使用LXML）完全失败。代码就是这样：importlxmlfrombs4importBeautifulSoupasSoupwithopen('worldHigh.svg','r')asf:handler=f.read()soup=Soup(handler,'xml')print(soup.prettify())当我用worldhigh.svgfifle运

解析文件 section code

php - mb_convert_encoding 错误 : Call to undefined function mb_convert_encoding()

我目前正在编写一个PHP函数，但是在执行完整的脚本时出现错误:错误:Calltoundefinedfunctionmb_convert_encoding()我的功能:functioncleanData(&$str){if($str=='t')$str='TRUE';if($str=='f')$str='FALSE';if(preg_match("/^0/",$str)||preg_match("/^\+?\d{8,}$/",$str)||preg_match("/^\d{4}.\d{1,2}.\d{1,2}/",$str)){$str="'$str";}if(strstr($str,'

mb_convert_encoding encoding str 39 section php

php - Javascript 字符串长度不同于 PHP mb_strlen(在 textarea 行，换行符)

我正在使用JavaScript和PHP来计算字符串长度。一切正常，除了当我计算来自Chrome或Firefox与InternetExplorer的文本区域字符串长度时。新的文本区域行/换行符在InternetExplorer和PHP中计算为2个字符。但是Chrome和Firefox计算textarea行/换行符只是1个字符(而PHP和InternetExplorer计算为2个字符)。这是我的问题。谁知道怎么解决？所以在IE中的文本区域中的JavaScript字符计数=用PHP计算的字符串长度///Chrome/Firefox文本区域中的JavaScript字符数不等于用PHP计算的字符

换行符同于 section code php javascript string-length

php - utf8_encode 函数用途

假设我用UTF-8编码我的文件。在PHP脚本中，将比较一个字符串:$string="ぁ";$string=utf8_encode($string);//Doineedthisstep?if(preg_match('/ぁ/u',$string))//Doifmatch...没有utf8_encode()函数的string真的是UTF-8编码吗？如果您使用UTF-8对文件进行编码，则不需要此功能吗？最佳答案如果您阅读utf8_encode的手册条目，它将ISO-8859-1编码的字符串转换为UTF-8。函数名称是一个可怕的用词不当，

utf8_encode 用途 UTF-8 code section php regex character-encoding

PHP Utf8 解码问题

我有以下地址行:Praha5,StaréMěsto,在将它写入PDF文件(使用domPDF库)之前，我需要对此字符串使用utf8_decode()函数。但是，上述地址行的phputf8解码函数似乎不正确(或者更确切地说，不完整)。以下代码:产生这个:Praha5,StaréM?sto,知道为什么ě没有被解码吗？最佳答案 utf8_decode将字符串从UTF-8编码转换为ISO-8859-1，也就是“Latin-1”。Latin-1编码不能表示字母“ě”。就这么简单。“解码”完全是用词不当，它的作用与iconv('UTF-8','

Utf8 PHP section strong code utf-8 character-encoding

php - 在 PHP 中将 utf8 转换为 latin1。所有大于 255 的字符都转换为 char 引用

我需要将UTF-8格式的文本转换为ISO-8859-1编码的文本，这样任何不属于ISO-8859-1集的字符都会变成字符引用。(例如β)例子:我想把文字变成这样helloéβ水进入helloéβ水我正在用PHP完成所有这些工作。我尝试了内置函数、iconv和tidy以及它们的组合，但仍然无法获得可靠的解决方案。这是我目前的情况//convertanycharactersfountintheentitytableintoHTMLentities//donotdoubleencodeentities,donotmesswithquotes//useUTF-8asch

latin1 latin code section UTF-8 php character-encoding

php - 在 PHP 中处理文件和 utf8

假设我有一个以utf8编码的名为foo.txt的文件:aoeuqjkxñpyf我想得到一个数组，其中包含该文件中具有字母aoeuñpyf的所有行(每个索引一行)，并且仅包含具有这些字母的行。我写了下面的代码(也编码为utf8):$allowed_letters=array("a","o","e","u","ñ","p","y","f");$lines=array();$f=fopen("foo.txt","r");while(!feof($f)){$line=fgets($f);foreach(preg_split("//",$line,-1,PREG_SPLIT_NO_EMPTY)a

utf8 php 34 code line file-io unicode utf-8

php - mb_str_replace()... 很慢。有什么选择吗？

我想确保我正在运行的一些字符串替换是多字节安全的。我在网上找到了一些mb_str_replace函数，但它们很慢。我说的是在通过它传递500-900字节后增加20%。有什么建议吗？我正在考虑使用preg_replace，因为它是native的并已编译，所以它可能会更快。如有任何想法，我们将不胜感激。最佳答案如前所述there,str_replace在utf-8上下文中使用是安全的，只要所有参数都是utf-8有效的，因为它不会是两个多字节编码字符串之间的任何模糊匹配。如果您检查输入的有效性，则无需寻找其他函数。

mb_str_replace replace section 多字 php multibyte

php - mb_strpos vs strpos，有什么区别？

是的:我知道。当我们处理多字节字符时，我们应该使用mb_*函数。但是当我们使用strpos时？我们来看看这段代码(以utf-8保存)var_dump(strpos("Mysymbolutf-8isthe€.","\xE2\x82\xAC"));//int(23)使用mb_strpos有区别吗？这不会使这项工作成为相同的工作吗？毕竟，strpos不是在寻找字符串(多字节)吗？有理由使用strpos吗？最佳答案对于UTF-8，匹配字节序列和匹配字符序列是完全一样的。所以他们都将在完全相同的点找到针，但是mb_strpos计算完整的U

strpos mb_strpos utf-8 34 php

php - opendir 和 readdir 返回 utf8

为什么这会在一台服务器上返回utf8字符，而在另一台服务器上却不返回？一些文件名包含unicode字符，例如æø和å..在某些环境中打印utf8字符，在某些环境中打印iso字符header('content-type:text/plain');$handle=opendir("./dir");while($readdir=readdir($handle)){echo"$readdir\n";}输出Content-Type:text/plain;charset=UTF-8Retursvar2medfejlp�debiteringsniveau.xmlRetursvar2medfejlpå

opendir readdir code section 网络服务 php directory filesystems

34 35 363738 39 40