草庐IT

utf8Bytes

全部标签

python - 类型错误 : a bytes-like object is required, 不是 'str'

以下是尝试使用套接字修改用户提供的输入的代码:fromsocketimport*serverName='127.0.0.1'serverPort=12000clientSocket=socket(AF_INET,SOCK_DGRAM)message=input('Inputlowercasesentence:')clientSocket.sendto(message,(serverName,serverPort))modifiedMessage,serverAddress=clientSocket.recvfrom(2048)print(modifiedMessage)clientSo

python : Get size of string in bytes

我有一个要通过网络发送的字符串。我需要检查它所代表的总字节数。sys.getsizeof(string_name)返回额外的字节。例如sys.getsizeof("a")返回22,而一个字符在python中仅表示为1个字节。有没有其他方法可以找到这个? 最佳答案 如果你想要字符串中的字节数,这个函数应该可以很好地为你做。defutf8len(s):returnlen(s.encode('utf-8'))你得到奇怪数字的原因是因为字符串是python中的实际对象,所以封装在字符串中的是一堆其他信息。这很有趣,因为如果您查看我将字符串编

Python 3 TypeError : must be str, not bytes with sys.stdout.write()

我正在寻找一种从python脚本运行外部进程并在执行期间打印其标准输出消息的方法。下面的代码有效,但在运行时不打印标准输出。当它退出时,我收到以下错误:sys.stdout.write(nextline)TypeError:mustbestr,notbytesp=subprocess.Popen(["demo.exe"],stdout=subprocess.PIPE,stderr=subprocess.PIPE)#PollprocessfornewoutputuntilfinishedwhileTrue:nextline=p.stdout.readline()ifnextline=='

python - 类型错误 : can't use a string pattern on a bytes-like object in re. findall()

我正在尝试学习如何从页面中自动获取网址。在以下代码中,我试图获取网页的标题:importurllib.requestimportreurl="http://www.google.com"regex=r'(,+?)'pattern=re.compile(regex)withurllib.request.urlopen(url)asresponse:html=response.read()title=re.findall(pattern,html)print(title)我收到了这个意外错误:Traceback(mostrecentcalllast):File"path\to\file\C

python - 使用 Python 读取 UTF8 CSV 文件

我正在尝试使用Python读取带有重音字符的CSV文件(仅限法语和/或西类牙语字符)。基于csvreader(http://docs.python.org/library/csv.html)的Python2.5文档,我想出了以下代码来读取CSV文件,因为csvreader仅支持ASCII。defunicode_csv_reader(unicode_csv_data,dialect=csv.excel,**kwargs):#csv.pydoesn'tdoUnicode;encodetemporarilyasUTF-8:csv_reader=csv.reader(utf_8_encoder

java - Java 如何在其 16 位 char 类型中存储 UTF-16 字符?

根据JavaSE7Specification,Java使用UnicodeUTF-16标准来表示字符。将String想象为一个由16位变量组成的简单数组,每个变量都包含一个字符,生活很简单。不幸的是,有些代码点16位根本不够用(我相信它是所有Unicode字符的16/17)。因此,在String中,这不会造成直接问题,因为当想要使用额外的两个字节存储这些~1.048.576个字符之一时,只需其中两个数组位置String将被使用。这对于Strings没有任何直接问题,因为总是可以有额外的两个字节。虽然当涉及到单个变量时,与UTF-16编码相比,它具有16位的固定长度,但如何存储这些字符,特

java - 如何编译编码为 "UTF-8"的 java 源文件?

我保存了我的Java源文件,指定它的编码类型为UTF-8(使用记事本,默认情况下记事本的编码类型是ANSI),然后我尝试使用以下代码编译它:javac-encoding"UTF-8"One.java但它给出了错误消息“One.java:1:illegalcharacter:\65279?publicclassOne{^1error有没有其他方法,我可以编译这个?这里是来源:publicclassOne{publicstaticvoidmain(String[]args){System.out.println("HI");}} 最佳答案

java : convert List of Bytes to array of bytes

试图解决应该是一个简单的问题。得到一个字节列表,想在函数末尾将其转换为字节数组。finalListpdu=newArrayList();....returnpdu.toArray(newbyte[pdu.size()]);;编译器不喜欢我的toArray上的语法。如何解决这个问题? 最佳答案 编译器不喜欢它,因为byte[]不是Byte[]。您可以使用commons-lang的ArrayUtils.toPrimitive(wrapperCollection):Byte[]bytes=pdu.toArray(newByte[pdu.s

Java + Mysql UTF8 问题

正如标题所说,我在java和mysql之间有问题mysql数据库、表和列是utf8_unicode_ci。我有一个应用程序从xml中获取一些输入,然后编写查询...publicString[]saveField(Stringxmltag,Stringlang){NodeListnodo=this.doc.getElementsByTagName(xmltag);String[]pos=newString[nodo.getLength()];for(inti=0;i此方法返回一个字符串数组,其中包含一个或多个SQL插入查询...那么Class.forName("com.mysql.jdb

java - "Unmappable character for encoding UTF-8"错误

我在以下方法中遇到编译错误。publicstaticbooleanisValidPasswd(Stringpasswd){Stringreg="^(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z])(?=.*[~#;:?/@&!\"'%*=¬.,-])(?=[^\\s]+$).{8,24}$";returnPattern.matches(reg,passwd);}atUtility.java:[76,74]unmappablecharacterforenodingUTF-8.74thcharacteris'"'我该如何解决这个问题?谢谢。 最佳