草庐IT

go - golang中的utf8第二字节下界

最近在刷utf8解码的go源码。显然在解码utf8字节时,第一个字节的值为224(0xE0)它映射到接受范围[0xA0;0xBF]。https://github.com/golang/go/blob/master/src/unicode/utf8/utf8.go#L81https://github.com/golang/go/blob/master/src/unicode/utf8/utf8.go#L94如果我正确理解utf8规范(https://www.rfc-editor.org/rfc/rfc3629),每个连续字节的最小值为0x80或10000000。为什么0xE0的起始字节的

go - golang中的utf8第二字节下界

最近在刷utf8解码的go源码。显然在解码utf8字节时,第一个字节的值为224(0xE0)它映射到接受范围[0xA0;0xBF]。https://github.com/golang/go/blob/master/src/unicode/utf8/utf8.go#L81https://github.com/golang/go/blob/master/src/unicode/utf8/utf8.go#L94如果我正确理解utf8规范(https://www.rfc-editor.org/rfc/rfc3629),每个连续字节的最小值为0x80或10000000。为什么0xE0的起始字节的