草庐IT

utf8mb_unicode_ci

全部标签

python - Python如何检查文件名是否为UTF8?

我有一个PHP脚本可以在目录中创建文件列表,但是,PHP只能看到英文文件名,而完全忽略其他语言的文件名,例如俄语或亚洲语言。经过大量努力,我找到了唯一适合我的解决方案-使用python脚本将文件重命名为UTF8,以便PHP脚本可以在之后处理它们。(PHP处理完文件后,我将文件重命名为英文,不保留UTF8)。我使用了以下python脚本,效果很好:importsysimportosimportglobimportntpathfromrandomimportrandintforinfileinglob.glob(os.path.join('C:\\MyFiles',u'*')):ifos.

windows - Windows 中使用的默认 unicode 字符编码是什么?

Windows中使用的默认unicode字符编码是什么?特别是在Windows编程(Win32和WinRT)中。当我在WinAPI中编程时,“char”映射到1字节字符存储,“wchar_t”映射到2字节字符存储。如果UTF-16以4个字节对超过65536的所有字符进行编码,那么Windows如何将这些字符映射为“wchar_t”数据类型?我知道我的问题不够清楚,但我希望你能理解我的一些担忧。非常感谢! 最佳答案 Windows使用UTF-16LE对于所有Unicode(除了MultiByteToWideChar()和WideCha

windows - 在 Windows 上的 IEx(交互式 Elixir 控制台)中启用 UTF8 字符

如何在Windows上的IEx(交互式Elixir控制台)中启用UTF8字符?无法使以下工作:#StringsareallencodedinUTF-8:"héllò"#=>"héllò" 最佳答案 正如评论中所建议的那样,这非常有效:iex--werl它根本不需要您设置任何代码页,而且您可以随时使用UTF8。我建议更新Elixir核心文档,将这个非常有用的开关--werl指出给其他初次使用的用户。 关于windows-在Windows上的IEx(交互式Elixir控制台)中启用UTF8字

windows - 批处理文件中的 Unicode 字符

我需要为这个批处理文件使用字符映射中的大量字符。这是我正在使用的批处理文件的一部分:"C:\v2.vbs""C:\file.txt"火a有没有办法让cmd识别批处理文件中的火或任何其他非键盘字符?这个命令似乎只有在我不使用特殊字符时才有效。我还能使用什么来运行批处理文件并完成此操作? 最佳答案 如果这样"C:\v2.vbs""C:\file.txt"a表示“使用3个参数启动v2.vbs”,然后您可以将第二个参数编码为“&Habcd”(需要引号)并使用sC=ChrW(WScript.Arguments(1))v2.vbs.

windows - Emacs 在重新加载时不显示 Unicode

当我在文本文件中插入一个—(破折号)时,Emacs最初显示它很好。当我重新加载Emacs时,—的所有实例都显示为\342\200\224。如何让Emacs像最初那样显示字符?我正在使用Windows7和Emacs24.3.1。主要模式是“文本”,次要模式是“填充”。 最佳答案 尝试将其插入到您的初始文件中。它应该确保emacs将文件保存为Unicode(并在之后正确读取它们)。;;;;;;;;;;;;;;;;;;;;;;;setupunicode(prefer-coding-system'utf-8)(set-default-cod

windows - Pango/开罗/Fontconfig : Making unicode font fallback/linking work properly in Windows

最近,一位Windows用户告诉我们,我们的应用程序中的日文(和其他Unicode)字符在Windows下无法正确显示。他只是得到带有数字的盒子。我们正在使用Pango、Fontconfig/freetype和Cairo渲染。在Unix(即Linux和macOS)中它工作得很好。但是,在Windows下我们似乎无法让它工作。我想这与字体回退/链接在Windows下的工作方式有关,但我什至不知道从哪里开始研究使它正常工作。 最佳答案 原来这个问题比预期的要简单,但在任何地方都没有很好的记录。Fontconfig需要它的配置文件(fon

python - Unicode解码错误: 'charmap' codec can't decode byte 0x9d in position X: character maps to <undefined>

当我尝试安装StringGenerator时使用pip,系统提示我出现此错误:C:\Users\Administrator>pipinstallStringGeneratorCollectingStringGeneratorUsingcachedStringGenerator-0.3.0.tar.gzCompleteoutputfromcommandpythonsetup.pyegg_info:Traceback(mostrecentcalllast):File"",line1,inFile"C:\Users\ADMINI~1\AppData\Local\Temp\2\pip-buil

windows - 你如何让 getLine 接受 unicode 字符?

运行以下代码时doline或者,getLine>>=putStrLn并且,之后getLine>>=putStrLn进入µ遇到这个输出:⠀现在,我已经预先尝试了chcp65001,这不起作用,stdin的编码是utf8。没有putStrLn的检查显示:getLineµ'\NIL'我的环境:Windows10版本10.0.17134内部版本17134联想ideapad510-15IKBBIOS版本联想3JCN30WWGHCiv8.2.2如何解决?编辑:具体而言,以下操作序列会导致此问题:打开cmd输入chcp65001输入ghci输入getLine>>=putStrLn输入µ但是,以下内容

windows - 在 perl 脚本中或与 perl 脚本一起使用 utf8

我在德语Windows7下运行最新的perl,我想在我的perl程序中的任何地方使用utf8(用于脚本、文件内容、文件名、邮件文本等)。一切正常,但在尝试处理文件名中包含特殊字符的文件时遇到问题。甚至system调用也无法正常工作。那么(如何)我可以告诉perl使用utf8everywhere?我用encode和decode尝试了一段时间,但很不清楚为什么它能正常工作...我还需要encode('cp850',TEXT)以便在命令提示符窗口中正确显示。例子:当我需要复制一个文件时,只有当我使用File::copy(encode("iso-8859-1",$filename),...)并

windows - 通过 Windows 套接字发送大于 1 MB 的大数据,即使用 Send 函数

我希望通过Windows套接字发送API发送大于1MB的大消息。有没有一种有效的方法可以做到这一点,我不想循环然后分块发送数据。我在某处读到您可以增加套接字缓冲区大小,这可能会有所帮助。谁能详细说明一下。感谢任何帮助 最佳答案 你应该,事实上必须循环以分块发送数据。如Beej的网络指南中所述:"send()returnsthenumberofbytesactuallysentout—thismightbelessthanthenumberyoutoldittosend!See,sometimesyoutellittosendawho