草庐IT

utf8Lines

全部标签

python - Python如何检查文件名是否为UTF8?

我有一个PHP脚本可以在目录中创建文件列表,但是,PHP只能看到英文文件名,而完全忽略其他语言的文件名,例如俄语或亚洲语言。经过大量努力,我找到了唯一适合我的解决方案-使用python脚本将文件重命名为UTF8,以便PHP脚本可以在之后处理它们。(PHP处理完文件后,我将文件重命名为英文,不保留UTF8)。我使用了以下python脚本,效果很好:importsysimportosimportglobimportntpathfromrandomimportrandintforinfileinglob.glob(os.path.join('C:\\MyFiles',u'*')):ifos.

windows - 在 Windows 上的 IEx(交互式 Elixir 控制台)中启用 UTF8 字符

如何在Windows上的IEx(交互式Elixir控制台)中启用UTF8字符?无法使以下工作:#StringsareallencodedinUTF-8:"héllò"#=>"héllò" 最佳答案 正如评论中所建议的那样,这非常有效:iex--werl它根本不需要您设置任何代码页,而且您可以随时使用UTF8。我建议更新Elixir核心文档,将这个非常有用的开关--werl指出给其他初次使用的用户。 关于windows-在Windows上的IEx(交互式Elixir控制台)中启用UTF8字

Windows 批处理文件 : Convert Structures into Single Lines Strings

这个艰巨的任务我需要作为一个批处理文件来完成,它不是最难用C做的,但在DOS中是一个hell(至少对我来说!)我需要将一个结构转换为单个var(字符串)能够在我的程序中再次将它们转换为该结构。不要担心卷土重来,它已经完成了。该结构的大小会有所不同,并且在[0]内有一个索引,它需要成为我的var中的第一项。这里是这些结构的一个例子(只有3个):level.waypoints[0]=spawnstruct();level.waypoints[0].origin=(1774.5,834.7,67.6);level.waypoints[0].type="stand";level.waypoin

windows - 在 perl 脚本中或与 perl 脚本一起使用 utf8

我在德语Windows7下运行最新的perl,我想在我的perl程序中的任何地方使用utf8(用于脚本、文件内容、文件名、邮件文本等)。一切正常,但在尝试处理文件名中包含特殊字符的文件时遇到问题。甚至system调用也无法正常工作。那么(如何)我可以告诉perl使用utf8everywhere?我用encode和decode尝试了一段时间,但很不清楚为什么它能正常工作...我还需要encode('cp850',TEXT)以便在命令提示符窗口中正确显示。例子:当我需要复制一个文件时,只有当我使用File::copy(encode("iso-8859-1",$filename),...)并

C#:将 byte[] 转换为 UTF8 编码的字符串

我正在使用一个名为EXIFextractor的库从图像中提取元数据信息。该库部分使用System.Drawing.Imaging.PropertyItem来完成所有艰苦的工作。根据Microsoft文档,PropertyItem中的某些数据(例如图像详细信息等)是作为存储在byte[]中的ASCII字符串获取的。我的问题是国际字符(å、ä、ö等)被删除并替换为问号。当我调试代码时,很明显byte[]是UTF-8的表示。我想将byte[]解析为UTF8字符串,如何在不丢失任何信息的情况下执行此操作?提前致谢!更新:我被要求提供我的代码片段:第一个片段来self使用的类,即由AsimGoh

c# - Visual Studio /ReSharper : How to wrap long lines with commas before params?

我一直在使用ReSharper自定义我的格式设置以进行代码清理。到目前为止,我已经能够使清理规则与我的编码风格相匹配:ReSharper->选项->语言->C#->格式样式有一件事我还没有弄清楚如何做,那就是如何让参数/字段/列表项用前导逗号而不是尾随逗号包裹。我想要的例子:varlist=newList{"apple","banana","orange"};我目前得到的例子:varlist=newList{"apple","banana","orange"}; 最佳答案 (不是答案,但这不适合发表评论。)有些人喜欢前导逗号而不是尾

c# - 从 C# 中的 DBMS_OUTPUT.GET_LINES 获取输出缓冲区

我试图通过C#在我的匿名PL/SQLblock中获取DBMS_OUTPUT.PUT_LINE()方法的输出。我在这里查看了其他几个相关问题,但仍然遇到问题。执行匿名block的返回码是返回-1,根据docs应该是正确的.我将DBMS_OUTPUT.ENABLE()设置为NULL以便不设置特定的缓冲区大小,然后使用DBMS_OUTPUT.GET_LINES()方法以便从该缓冲区中获取行。它在缓冲区中不返回任何内容(一个空的OracleString[])并返回0行。我的匿名PL/SQLblock很简单,但应该适用于任何地方。DECLARElvsNameVARCHAR2(6):='Oracl

c# - Encoding.UTF8.GetString 和 Encoding.UTF8.GetBytes 不是彼此相反的原因是什么?

可能我遗漏了什么,但我不明白为什么Encoding.UTF8.GetString和Encoding.UTF8.GetBytes不能作为彼此的逆变换工作?在下面的示例中,myOriginalBytes和asBytes不相等,甚至它们的长度也不同。谁能解释我错过了什么?byte[]myOriginalBytes=GetRandomByteArray();varasString=Encoding.UTF8.GetString(myOriginalBytes);varasBytes=Encoding.UTF8.GetBytes(asString); 最佳答案

c# - C# .NET 中的 UTF-16 安全子字符串

我想得到一个给定长度的子字符串,比如150。但是,我想确保我不会切断unicode字符之间的字符串。例如看下面的代码:varstr="Hello?world!";varsubstr=str.Substring(0,6);此处substr是无效字符串,因为笑脸字符被切成两半。相反,我想要一个执行以下操作的函数:varstr="Hello?world!";varsubstr=str.UnicodeSafeSubstring(0,6);其中substr包含“Hello?”作为引用,以下是我在Objective-C中使用rangeOfComposedCharacterSequencesForR

c# - StreamReader 无法正确读取扩展字符集 (UTF8)

我遇到了无法读取包含外来字符的文件的问题。有人告诉我,该文件以UTF-8格式编码。这是我的代码的核心:using(FileStreamfileStream=fileInfo.OpenRead()){using(StreamReaderreader=newStreamReader(fileStream,System.Text.Encoding.UTF8)){stringline;while(!string.IsNullOrEmpty(line=reader.ReadLine())){hashSet.Add(line);}}}该文件包含“achôcre”一词,但在调试过程中检查它时,它会将