Unicode_草庐IT

c# - 生成 PDF 时无法获取捷克语字符

在生成PDF时添加诸如“Č”或“Ć”之类的字符时遇到问题。我主要使用段落将一些静态文本插入到我的PDF报告中。这是我使用的一些示例代码:vardocument=newDocument();document.Open();Paragraphp1=newParagraph("TestingoflettersČ,Ć,Š,Ž,Đ",newFont(Font.FontFamily.HELVETICA,10));document.Add(p1);生成PDF文件时得到的输出如下所示:“字母,,Š,Ž,Đ的测试”出于某种原因，iTextSharp似乎无法识别这些字母，例如“Č”和“Ć”。

捷克语捷克 br strong code c#asp.net pdf unicode itextsharp

c# - 如何在 C# 中将特殊字符替换为其等效字符(例如 "á "为 "a")？

我需要从Excel文件中获取葡萄牙语文本内容并创建一个xml，该xml将由不支持字符(例如“ç”、“á”、“é”和其他。而且我不能只删除字符，而是用它们的等效字符替换它们(例如，“c”、“a”、“e”)。我认为有比单独检查每个字符并将其替换为对应字符更好的方法。有什么建议吗？最佳答案你可以尝试类似的东西vardecomposed="áéö".Normalize(NormalizationForm.FormD);varfiltered=decomposed.Where(c=>char.GetUnicodeCategory(c)!=

amp c#section 等效例如 string unicode encoding character

C#/.NET 词法分析器生成器

我正在为C#/.NET寻找一个体面的词法扫描器生成器——它支持Unicode字符类别，并生成一些可读性和高效的代码。有人知道吗？编辑:我需要支持Unicode类别，而不仅仅是Unicode字符。目前仅Lu(Letter,Uppercase)类别就有1421个字符，我需要非常具体地匹配许多不同的类别，而不是手写它所需要的字符集。此外，实际代码是必须——这排除了生成二进制文件然后与驱动程序(即GOLD)一起使用的东西编辑:ANTLR还不支持Unicode类别。有一个openissue不过，它可能会在某一天满足我的需求。最佳答案 GPL

分析器生成器 section strong Unicode c#.net parsing generator lexical-analysis

c# - C# .NET 中的 UTF-16 安全子字符串

我想得到一个给定长度的子字符串，比如150。但是，我想确保我不会切断unicode字符之间的字符串。例如看下面的代码:varstr="Hello?world!";varsubstr=str.Substring(0,6);此处substr是无效字符串，因为笑脸字符被切成两半。相反，我想要一个执行以下操作的函数:varstr="Hello?world!";varsubstr=str.UnicodeSafeSubstring(0,6);其中substr包含“Hello?”作为引用，以下是我在Objective-C中使用rangeOfComposedCharacterSequencesForR

c#code section substr .net string unicode xamarin.ios

c# - StreamReader 无法正确读取扩展字符集 (UTF8)

我遇到了无法读取包含外来字符的文件的问题。有人告诉我，该文件以UTF-8格式编码。这是我的代码的核心:using(FileStreamfileStream=fileInfo.OpenRead()){using(StreamReaderreader=newStreamReader(fileStream,System.Text.Encoding.UTF8)){stringline;while(!string.IsNullOrEmpty(line=reader.ReadLine())){hashSet.Add(line);}}}该文件包含“achôcre”一词，但在调试过程中检查它时，它会将

c#StreamReader section UTF-8 unicode

c# - 使用 StreamWriter 在文件中写入 Unicode 字符串不起作用

我有这个代码:strings="آ";StreamWriterwriter=newStreamWriter("a.txt",false,Encoding.UTF8);writer.WriteLine(s);但是当我运行它时，我在a.txt中看不到任何“â”!!a.txt中没有任何字符串!它是空的!什么问题!？!谁能帮我？？？最佳答案您永远不会Close()StreamWriter。如果您在完成写入后调用writer.Close()，您将看到该字符。但是，由于它实现了IDisposable，您应该将StreamWriter的创建包

c#StreamWriter code section .net stream

c# - UTF-8 或 UTF-16 或 UTF-32 或 UCS-2

我正在设计一个新的CMS，但想要设计它来满足我future的所有需求，比如多语言内容，所以我认为Unicode(UTF-8)是最好的解决方案但是通过一些搜索我得到了这篇文章http://msdn.microsoft.com/en-us/library/bb330962%28SQL.90%29.aspx#intlftrql2005_topic2所以我现在很困惑现在使用什么UTF-8/UTF-16/UTF-32/UCS-2这对多语言内容和性能等更好。PS:我正在使用Asp.net和c#以及SqlServer2005提前致谢最佳答案这

c#UTF-8 br section asp.net unicode

c# - 如何将 char 转换为其完整的 Unicode 名称？

这个问题在这里已经有了答案:FindingoutUnicodecharacternamein.Net(6个答案)关闭9年前。我需要在字符(例如'α')和它的完整Unicode名称(例如"GREEKSMALLLETTERALPHA")之间进行双向转换的函数。我想出的解决方案是在在线提供的官方Unicode标准中执行查找:http://www.unicode.org/Public/6.2.0/ucd/UnicodeData.txt，或者更确切地说，在其缓存的本地副本中，可能事先转换为合适的集合以提高查找性能)。是否有更简单的方法来进行这些转换？我更喜欢C#中的解决方案，但也欢迎可以适应C#

c#Unicode section notice .net string

c# - 读取包含 unicode 字符的文件

我有一个asp.netc#页面，我正在尝试读取一个具有以下字符的文件，并将其转换为'.(从斜撇号到撇号)。FileInfofileinfo=newFileInfo(FileLocation);stringcontent=File.ReadAllText(fileinfo.FullName);//stripoutbadcharacterscontent=content.Replace("’","'");这不起作用，它会将倾斜的撇号更改为?标记。最佳答案我怀疑问题不在于替换，而在于读取文件本身。当我尝试这种nieve方式(使用Wor

c#unicode code content section asp.net

c# - 在 .Net 中使用大于 2 个字节的 unicode 字符

我正在使用此代码生成U+10FFFCvars=Encoding.UTF8.GetString(newbyte[]{0xF4,0x8F,0xBF,0xBC});我知道它是供私有(private)使用之类的，但它确实显示了一个字符，正如我在显示它时所期望的那样。操作此unicode字符时会出现问题。如果我以后这样做:foreach(varchins){Console.WriteLine(ch);}它不是只打印单个字符，而是打印两个字符(即字符串显然由两个字符组成)。如果我改变我的循环以将这些字符添加回空字符串，如下所示:stringtmp="";foreach(varchins){Cons

c#unicode code char pre .net utf-16