Utf-8

python - 基于 expat 的 xml 解析脚本在 Linux 上不工作，在 Windows 上工作

我正在用python编写一组工具，以从交通模拟软件生成的一些xml文件中提取数据。由于生成的文件可能非常大，我使用xml.parsers.expat来解析它们。问题是，当我在工作时在WindowsXP机器上运行我的脚本时，它运行良好，但在家里，在Ubuntu10.10上，在同一个文件上，我收到以下错误:ExpatError:格式不正确(无效标记):第1行，第0列该文件最初是用utf-8编码的，标签中声明的编码是ascii，因此尝试将其更改为utf-8(或UTF8或utf8)但没有成功。由于没有BOM，我尝试编写它，但仍然没有成功。我还尝试用Unix换行符(CR)替换Windows换行符

上工 Windows code section UTF-8 python xml linux expat-parser

c++ - Windows 使用带有 UTF-16 的 char * 函数

我将一个应用程序从Linux移植到Windows。在Linux上我使用libmagic在Windows上我不乐意从中删除的库。问题是我需要将以UTF-16编码保存的文件名传递给这样的函数:intmagic_load(magic_tcookie,constchar*filename);不幸的是，它只接受constchar*filename。我的第一个想法是将UTF-16字符串转换为本地编码，但存在一些问题-比如字符串可以包含例如中文符号和本地编码可能是俄语。结果我们将在输出中得到垃圾，程序将无法达到其目标。转换为UTF-8也无济于事，因为这是Windows，Windows以UTF-16格

amp Windows section noreferrer c++encoding

c++ - 检查UTF-8是wchar_t还是char？

我正在调用zlibAPIzipOpen，它从我的C++项目创建一个新的zip文件。函数签名是externzipFileZEXPORTzipOpen(constchar*pathname,intappend)。此调用最终调用fopen以创建文件。但是，此函数不支持宽字符，我想通过发送UTF-8格式(由char*和fit函数签名表示)并在调用fopen之前检查是否字符串包含非ascii字符，如果没有，像以前一样调用fopen。如果是，转换为宽字符串(wchar_t)并调用_wfopen。所以问题是是否有一个C/C++API可以检查UTF-8格式的字符串是否包含非ascii字符？基本上我正在

UTF-8 amp code section c++windows unicode zlib

c# - OpenFileDialog 文件名为 UTF8

C#问题在这里..我有一个UTF-8字符串，由C++中的非Unicode程序解释。该文本显示不正确，但据我所知，它是完整的，然后被用作输出文件名。.无论如何，在C#项目中，我正在尝试使用System.Windows.Forms.OpenFileDialog对象打开此文件。我从这个对象的.FileNames[]获得的文件名是Unicode(UCS-2)。然而，这个字符串被误解了。例如，如果原始字符串是0xe30x810x82，则FileName[].ToCharArray()显示它现在是0x00e30x00810x201a......OpenFileDialog对象似乎只是填充了它，但它

c#OpenFileDialog UTF-8 C++windows unicode

php - 在 PHP 5.3 和 Windows Vista 中使用日文文件名？

我目前正在尝试编写一个简单的脚本来查看文件夹，并返回RSS提要中所有文件名的列表。但是我遇到了一个大问题......每当我尝试读取其中包含日文字符的文件名时，它都会将它们显示为？。我已经尝试过这里提到的解决方案:phpreaddirproblemwithjapaneselanguagefilename-但是由于某些原因它们不工作，即使是:header('Content-Type:text/html;charset=UTF-8');setlocale(LC_ALL,'en_US.UTF8');mb_internal_encoding("UTF-8");在顶部(导出为纯文本，直到我能解决这

日文 Windows section 39 dir_str php unicode utf-8

c# - 将文本文件的编码从 ANSI 更改为 UTF8，而不影响 C# 中文件的任何字符!

谁能帮帮我？我尝试了很多不同的方法，但我没有运气得到想要的结果。我只想将现有文本[.txt]文件的编码从ANSI更改为UTF8，其中包含ö、ü等字符。当我通过在编辑模式下打开该文本文件然后FILE=>SAVEAS手动执行此操作时，它在编码列表中显示ANSI。使用它，我能够将其编码从ANSI更改为UTF8，并且在这种情况下它不会更改任何内容/字符。但是当使用CODE执行时，它不起作用。==>第一种方法我曾经通过下面的代码来实现:if(!System.IO.Directory.Exists(System.Windows.Forms.Application.StartupPath+"\\Te

c#Encoding section code windows

c++ - 如何使用 C++ 在 Windows 上写入和读取 UTF 16 文件

SO上有很多关于此的问题，但大多数都没有提到将wstring写回文件。例如，我发现这个是为了阅读://openasabytestreamstd::wifstreamfin("/testutf16.txt",std::ios::binary);//applyBOM-sensitiveUTF-16facetfin.imbue(std::locale(fin.getloc(),newstd::codecvt_utf16));//readstd::wstringws;for(wchar_tc;fin.get(c);){std::cout我尝试过类似的写作方式:std::wofstreamwof

amp 43 code std section c++windows utf wofstream wifstream

c++ - 在 C++ 中将 UTF8 字符串转换为 UTF16 字符串

我正在使用VC6.0。我的项目是用Unicode编译的。我正在使用zlib1.1.3来扩充包含我的UTF-8字符串的文件。我以ASCII格式获取它，但我保证它全部是英文的，因此我可以将其作为UTF8字符串关联(可以吗？)。我已经使用了Codeproject中建议的函数如下:WCHAR*SMUUTF8toUTF16(LPCSTRutf8,int*pLen){WCHAR*ptr=NULL;*pLen=MultiByteToWideChar(CP_UTF8,0,utf8,-1,NULL,0);if(*pLen>1){ptr=(WCHAR*)malloc(*pLen);if(ptr){Mult

amp 43 section code MultiByteToWideChar c++windows visual-c++zlib

C++ Windows 十进制到 UTF-8 字符转换

我一直在使用下面的函数将unicode字符的十进制表示形式转换为C++中的UTF8字符本身。我目前拥有的功能在Linux/Unix系统上运行良好，但它在Windows上不断返回错误字符。voidGetUnicodeChar(unsignedintcode,charchars[5]){if(code>6);chars[0]=0xC0|(code&0x1F);chars[2]='\0';}elseif(code>6);chars[1]=0x80|(code&0x3F);code=(code>>6);chars[0]=0xE0|(code&0xF);chars[3]='\0';}elseif

十进 UTF-8 code chars c++windows winapi unicode

python - Windows : "can' t decode byte 0x8f"上的 closurebuilder.py 错误

我试图在Windows上运行closurebuilder.py，无论我传递什么文件，我都会从Python得到同样的错误:pythongoog\closure\bin\build\closurebuilder.py--root=goog/closure/goog/--root=closurebuilder-example/--namespace="myproject.start"goog\closure\bin\build\closurebuilder.py:Scanningpaths...Traceback(mostrecentcalllast):File"goog\closure\b

amp closurebuilder closure goog python windows utf-8 google-closure-compiler

30 31 323334 35 36