草庐IT

utf8_unicode_cs

全部标签

linux - AWS ec2 en_US.UTF-8 问题

https://aws.amazon.com/amazon-linux-ami/2012.03-release-notes/-bash:warning:setlocale:LC_CTYPE:cannotchangelocale(UTF-8)[ec2-user@ip-10-136-14-68~]$vi~/.bash_profile[ec2-user@ip-10-136-14-68~]$#.bash_profile#Getthealiasesandfunctionsif[-f~/.bashrc];then.~/.bashrcfi#Userspecificenvironmentandstar

linux - 在 Linux 上预览 unicode 字体

Linux上是否有可让我预览Unicode字体的工具。Fontforge允许我查看可用的字形和Unicode范围,但显示非常粗糙。Gnome字体查看器仅显示拉丁语范围。理想情况下,该工具会接受给定编码的字符串,然后显示该字符串的预览。问候。 最佳答案 GNOMECharacterMap(安装在大多数gnome友好的系统上,试试charmap)可以给你你需要的东西。 关于linux-在Linux上预览unicode字体,我们在StackOverflow上找到一个类似的问题:

java - ant:警告:编码 UTF8 的不可映射字符

我见过很多像我这样的问题,但他们没有回答我的问题,因为我使用的是ant而不是使用eclipse。我运行这段代码:antcleandist,它多次告诉我warning:unmappablecharacterforencodingUTF8。我在Java命令上看到有一个-encoding选项,但这对我没有帮助,因为我正在使用ant。我在Linux上,我正在尝试运行Sentrick的开发者版本;我没有对任何东西做任何修改,我只是下载它并关注他们所有的instructions这没有什么区别。我给开发人员发了电子邮件,他们告诉我这是这个问题,但我怀疑这实际上是最后导致这个错误的原因:BUILDFA

linux - 如何在 linux 中重新添加 unicode 字节顺序标记?

我有一个相当大的SQL文件,它以FFFE的字节顺序标记开头。我使用支持unicode的linux拆分工具将此文件拆分为100,000行block。但是当将它们传回窗口时,它不除了第一个部分之外的任何部分,因为只有它有FFFE字节顺序标记。如何使用echo(或任何其他bash命令)添加这两个字节的代码? 最佳答案 基于sed的solutionofAnonymous,sed-i'1s/^/\xef\xbb\xbf/'foo将BOM添加到UTF-8编码文件foo中。有用的是它还可以将ASCII文件转换为带BOM的UTF8

php - 正则表达式从 UTF8 字符串中删除非字母数字字符

如何以多字节安全的方式从字符串中删除标点符号、逗号、破折号等字符?我将处理来自多种不同语言的输入,我想知道是否有什么可以帮助我的谢谢 最佳答案 您可以使用unicode字符类:http://www.regular-expressions.info/unicode.htmlhttp://php.net/manual/en/regexp.reference.unicode.php要匹配任何非字母符号,您只需使用\PL+,即\p{L}的否定。要不删除空格,请使用[^\pL\s]+之类的字符类。或者真的只是删除标点符号\pP+好吧,显然不要

php - 一系列 unicode 点 PHP 的正则表达式

我正在尝试从字符串中去除所有字符,除了:字母数字字符美元符号($)下划线(_)代码点U+0080和U+FFFF之间的Unicode字符>通过这样做我得到了前三个条件:preg_replace('/[^a-zA-Z\d$_]+/','',$foo);如何匹配第四个条件?Ilookedatusing\X但必须有比列出65000多个字符更好的方法。 最佳答案 您可以使用:$foo=preg_replace('/[^\w$\x{0080}-\x{FFFF}]+/u','',$foo);\w-等同于[a-zA-Z0-9_]\x{0080}-\

php - UTF8 中的特殊字符 mailto : subject= link and Outlook

我正处于重新编码网站的最后阶段,该网站正式使用iso-8859-1字符编码,但现在完全是UTF-8。问题是当使用特殊字符时,mailtohref链接的主题部分不适用于Outlook。我得到了常见的乱码字符表示形式,这表明单击链接时存在明显的字符编码问题,并且outlook中会弹出新邮件窗口。我已经尝试使用rawurlencode()来解决这个问题,但这似乎不适用于Outlook...">sendemail于是转念一想,outlook一定是坚持不同的编码方式,先试了utf-8解码主题串...">sendemail宾果游戏!效果很好的Outlook。但现在其他一切都失败了:(我找不到适用于

php - 如何在 PHP 中截断 UTF8 字符串?

我的PHP代码中有一些字符串,如果它们太长则需要截断。例如,如果文本是这样的:Hi,Iwouldliketotellyouhowwonderfulthisis.它将替换为:Hi,Iwouldliketo...为此我做了一个简单的substr。问题是在UTF8中一些字符实际上是两个字符长。而且我遇到了一些字符在中间被截断的问题:例如,当我尝试将修改后的字符串插入数据库时​​,它崩溃了。这是我当前的功能:staticfunctionshort($string,$max=255){if(strlen($string)>=$max){$string=substr($string,0,$max-

php - 在 PCRE/PHP 中匹配 Unicode 字母字符

我正在尝试为PHP中的名称编写一个相当宽松的验证器,我的第一次尝试包括以下模式://unicodeletters,apostrophe,hyphen,space$namePattern="/^([\\p{L}'\\-])+$/";这最终会传递给对preg_match()的调用。据我所知,这适用于您的原始ASCII字母表,但似乎会遇到Ă或张等更刺激的字符。模式本身有问题吗?也许我期望\p{L}比我想象的做更多的工作?或者它是否与输入的传递方式有关?我不确定它是否相关,但我确实确保在表单页面上指定了UTF8编码。 最佳答案 我认为问题比

php - Atom-beautify 不加载 php-cs-fixer 自定义配置

我安装了带有PHP-CS-Fixer插件的Atom。我正在尝试使用一些自定义规则来应用同行大括号样式。我曾尝试使用in-Atom配置选项,但无法正常工作。我尝试设置position_after_functions_and_oop_constructs并将其放入Atom的PHP-CS-FIXERRules中,但没有成功。因此,我为我的配置设置了自定义路径,即C:\xampp\htdocs\myproject\atom.php_cs配置是:exclude('somedir')//->notPath('src/Symfony/Component/Translation/Tests/fixtu