UTF8Encoding

c# - 如何防止 System.Xml.XmlException : Invalid character in the given encoding

我有一个用C#编写的Windows桌面应用程序，它循环访问存储在磁盘上并由第3方程序创建的一堆XML文件。大多数文件都已通过以下语句后的LINQ代码成功加载和处理:XDocumentxmlDoc=XDocument.Load(inFileName);ListdocList=(fromdinxmlDoc.Descendants("DOCUMENT")selectnewDocMetaData{File=d.Element("FILE").SafeGetAttributeValue("filename"),Folder=d.Element("FOLDER").SafeGetAttribute

c#XmlException 34 code System xml linq-to-xml

c# - 如何检测 .NET StreamReader 是否在基础流上找到 UTF8 BOM？

我得到一个FileStream(filename,FileMode.Open,FileAccess.Read,FileShare.ReadWrite)，然后是一个StreamReader(stream,true)。有没有一种方法可以检查流是否以UTF8BOM开头？我注意到没有BOM的文件被StreamReader读取为UTF8。如何区分它们？最佳答案与其对字节进行硬编码，不如使用API更漂亮publicstringConvertFromUtf8(byte[]bytes){varenc=newUTF8Encoding(true);

流上 c#section code StreamReader utf-8 filestream byte-order-mark

javascript - 将 Javascript UTF-8 转换为 ASCII(如 PHP 中的 Iconv ('UTF-8'、 'ASCII//TRANSLIT'、$string)

我想知道如何使用Javascript将UTF-8中的字符“翻译”为最接近的ASCII等效字符，就像PHP中的Iconvdost一样。例子:ü变成你ó变成o我宁愿不使用替换，因为a)它需要一整套字符，这需要大量工作b)我很难获得一整套字符，我会永远不确定我是否遗漏了一两个。最佳答案我找到的最简单的方法:varstr="üó";varcombining=/[\u0300-\u036F]/g;console.log(str.normalize('NFKD').replace(combining,''));https://develop

amp UTF-8 section normalize javascript ascii iconv

javascript - AngularJS 资源 : how to disable url entity encoding

在我当前的项目中，我有一个drupal后端，它为我的前端公开了休息服务。对我的后端的一些调用并不真正喜欢对url实体进行编码。所以我的问题是:如何禁用某些参数的URL编码？例子:我需要在不同的搜索词之间用“+”号调用我的后端。像这样:http://backend.com/someservice/search/?terms=search+terms+here但是Angular，像这样设置:varresource=$resource(backendUrl+'/views/:view',{},{'search':{params:{view:'searchposts'},isArray:tru

javascript AngularJS code function section rest

javascript - 在 JavaScript 中表达 UTF-16 unicode 字符

例如，要在JavaScript中表示字符U+10400，我使用"\uD801\uDC00"或String.fromCharCode(0xD801)+String.fromCharCode(0xDC00)。我如何计算出给定的unicode字符？我想要以下内容:varchar=getUnicodeCharacter(0x10400);如何从0x10400中找到0xD801和0xDC00？最佳答案基于wikipediaarticle由HenningMakholm给出，以下函数将返回代码点的正确字符:functiongetUnicode

中表 javascript code section fromCharCode unicode

带有 utf-16 代理项对的 javascript 和字符串操作

我正在开发一个Twitter应用程序，并且偶然发现了utf-8(16)的世界。似乎大多数javascript字符串函数都像我一样对代理对视而不见。我必须重新编码一些内容以使其具有广泛的字符意识。我有这个函数可以在保留代理项对的同时将字符串解析为数组。然后我将重新编写几个函数来处理数组而不是字符串。functionsortSurrogates(str){varcp=[];//arraytoholdcodepointswhile(str.length){//looptillwe'vedonethewholestringif(/[\uD800-\uDFFF]/.test(str.substr

javascript utf section code string unicode twitter utf-16

php - utf8 中的 'messed up characters' 列表

我的一个客户有一个网站，由于托管公司在整个数据库上强行使用字符集，该网站已经完全搞砸了。我们之前在角色设置方面遇到过麻烦，但现在这只是一部戏剧!到目前为止，我已经将charset=utf-8添加到页面内容类型并将mysql连接的字符集设置为utf8。现在是时候替换所有字符了。到目前为止，我发现的是:Ã¶=öÃ«=ëÃ©=é数据库中的数据是这样更新的:UPDATEtableSET`fieldname`=REPLACE(`fieldname`,'Ã¶','ö');现在我只需要找到一个完整的乱七八糟的字符列表。我尝试了一个MySQL查询来搜索fieldLIKE'%Ã%'但这会返回数据库中的所

characters amp code section UTF-8 php character-encoding special-characters

php - 在使用 Php、Mysql 和 UTF8 时遇到问题

问题，简单而烦人。我只是想打印从我的mysql数据库中收集的姓名列表。PHP文件以utf8格式保存，数据库和表设置为使用utf8。例如，仍然是'å,ä,ö'，输出为�。不敢相信我仍然遇到这个问题。当然，Latin1解决了这个问题。问题是我必须使用utf8，因为我正在执行一些json_encode以将数据发送到ajax脚本。知道到底哪里出了问题吗？我应该在返回数据之前将数据转换为utf8格式吗？看起来很奇怪，我应该…… 最佳答案将utf8_general_ci转换为utf8_unicode_ci...尝试在连接到数据库后运行SETN

Mysql UTF8 section code charset php encoding utf-8 character-encoding

php - PDO utf8_encoding 我的文本字符串在 INSERT 中两次？

相关代码:$status=$db->run("INSERTINTOuser_wall(accountID,fromID,text,datetime)VALUES(:toID,:fromID,:text,'".time()."')",array(":toID"=>$toID,":fromID"=>%accountID,":text"=>$text));我从javascript获取输入文本，将其放入AJAX调用中进行处理，该调用调用包含这些代码行的函数。有问题的文本字符串是:“TürkçeTürkçeTürkçe!”在调查数据库后，保存了以下值“TÃƒÂ¼rkÃƒÂ§eTÃƒÂ¼rkÃƒÂ

utf8_encoding encoding code section utf-8 php unicode pdo

php - UTF8 到 latin1_swedish_ci

有很多关于latin1_swedisch_ci到utf8转换的主题。但反过来呢？我已经处理这个问题很长时间了，到目前为止我还没有找到解决方案。因为我不知道还有什么正在访问这个数据库，所以我不想更改表的字符编码。我在表中有一列，其格式为latin1_swedisch_ci。现在我必须在php中编写查询。该数据库包含德语和法语名称，这意味着我有ö、ä、ô等字符。我怎样才能做到这一点？例如，如果我想查询名称“Bürki”，那么我必须写类似$name='Bürki'的内容。是否有适当的方法将其转换为latin1_swedisch_ci而无需对这些特殊字符使用字符串替换？

latin1_swedish_ci swedish code section latin1 php character-encoding

15 16 171819 20 21