草庐IT

charset-utf

全部标签

java - 在java中将UTF-16 unicode字符转换为UTF-8

当我得到JSON时,有\u003c和\u003e而不是。我想在java中将它们转换回utf-8。任何帮助将不胜感激。谢谢。 最佳答案 try{//ConvertfromUnicodetoUTF-8Stringstring="\u003c";byte[]utf8=string.getBytes("UTF-8");//ConvertfromUTF-8toUnicodestring=newString(utf8,"UTF-8");}catch(UnsupportedEncodingExceptione){}引用http://www.exa

java.nio.charset.MalformedInputException : Input length = 1

我有这个(去除了代码示例的HTML标签)函数,可以从CSV构建HTML表格,但每次我尝试运行它时都会遇到运行时错误,我不知道为什么。Google说编码可能有问题,但我不知道如何更改它。我的CSV是用ANSI编码的,包含ä、Ä、Ü、Ö等字符,但我无法控制编码,也无法控制它是否会在未来发生变化。错误发生在这里:Causedby:java.io.UncheckedIOException:java.nio.charset.MalformedInputException:Inputlength=1atjava.io.BufferedReader$1.hasNext(UnknownSource)a

java - 在windows中更改Tomcat的Charset.defaultCharset

我在Windows7中使用tomcat6.0.32。在一个非常简单的servlet中,在init方法中,我正在打印:System.out.println(Charset.defaultCharset());输出是:windows-1253据我所知,这是tomcat在JVM中的启动方式,因为我在独立的java类中打印相同的内容,并且得到“UTF8”作为响应。那么,如何将其更改为UTF-8?谢谢 最佳答案 只需在TOMCAT/bin目录中创建一个setenv.bat文件,内容如下:set"JAVA_OPTS=%JAVA_OPTS%-Df

java utf8编码-char、string类型

publicclassUTF8{publicstaticvoidmain(String[]args){Strings="ヨ";//0xFF6ESystem.out.println(s.getBytes().length);//lengthofthestringSystem.out.println(s.charAt(0));//firstcharacterinthestring}}输出:3ヨ请帮助我理解这一点。试图了解utf8编码在java中的工作原理。根据char的javadoc定义char:char数据类型是单个16位Unicode字符。是不是说java中的char类型只能支持那些可

python - Unicode解码错误: 'utf-8' codec can't decode byte 0x96 in position 35: invalid start byte

我是Python新手,我正在尝试使用以下脚本读取csv文件。Past=pd.read_csv("C:/Users/Admin/Desktop/Python/Past.csv",encoding='utf-8')但是,出现错误“UnicodeDecodeError:'utf-8'编解码器无法解码位置35中的字节0x96:无效的起始字节”,请帮助我了解这里的问题,我在脚本中使用编码认为它会解决错误。 最佳答案 发生这种情况是因为您选择了错误的编码。由于您在Windows机器上工作,只需更换Past=pd.read_csv("C:/Use

Python-文件已加载在错误的编码UTF -8中

我是编程的新手,我不明白我收到的错误消息,filewasloadedinthewrongencodingutf-8或者,这不是代码中真正的错误消息,但我将其在我的新.txt文件中获取,然后将所有找到的关键字写入。.txt文件将UPP升至4000+行,其中包含我在另一个程序中排序的信息,然后将其发送到访问。信息的含义是什么意思,这是一种修复它的方法吗?谢谢我正在使用pycharm与anaconda36importglobdefLogFile(filename,tester):data=[]withopen(filename)asfilesearch:#opensearchfilefilesear

Python popen() - 通信(str.encode(编码 ="utf-8",错误 ="ignore"))崩溃

在Windows上使用Python3.4.3。我的脚本在控制台中运行一个小的java程序,应该得到输出:importsubprocessp1=subprocess.Popen([...],stdout=subprocess.PIPE,stderr=subprocess.PIPE,universal_newlines=True)out,err=p1.communicate(str.encode("utf-8"))这导致一个正常的'UnicodeDecodeError:'charmap'codeccan'tdecodebyte0x9dinposition135:charactermapst

Python - 读取奇怪的 utf-16 格式的文本文件

我正在尝试将文本文件读入python,但它似乎使用了一些非常奇怪的编码。我像往常一样尝试:file=open('data.txt','r')lines=file.readlines()forlineinlines[0:1]:printline,printline.split()输出:0.02001971.97691e-005['0\x00.\x000\x002\x000\x000\x001\x009\x007\x00','\x001\x00.\x009\x007\x006\x009\x001\x00e\x00-\x000\x000\x005\x00']打印线条效果很好,但在我尝试拆分线

python - PyODBC 输出不正确的 UTF-16

我正在尝试从MySQL数据库中提取表名列表。相关部分代码如下:conn=pyodbc.connect('...')cursor=conn.cursor()fortableincursor.tables():printtable.table_name对于每个表格,它都会打印一堆乱码(方框和菱形问号)。使用repr(table.table_name)它打印:u'\U00500041\U004c0050\U00430049\U00540041\U004f0049'对于名为“APPLICATION”的表。如果将每个32位字符视为两个16位字符,您将得到字符串“PALPCITAOI”。交换字符对

带有utf8问题的python正则表达式

我得到一个包含多行纯utf-8文本的文件。比如下面,顺便说一句,是中文的。PROCESS:类型:关爱积分[NOTIFY]交易号:2012022900000109订单号:W12022910079166交易金额:0.01元交易状态:true2012-2-2910:13:08文件本身以utf-8格式保存。文件名为xx.txt这里是我的python代码,env是python2.7#coding:utf-8importrepattern=re.compile(r'交易金额:(\d+)元')forlineinopen('xx.txt'):match=pattern.match(line.decod