编解码
2021-01-26 21:38:22 0 举报
编解码
作者其他创作
大纲/内容
ISO8859-1编码
AA BB CC
现在有个txt文件里面保存了' 你好' 这样两个字
ISO8859-1解码
a b c(举例对应的是这个字符)
使用UTF-8进行解码读取到代码中
先要知道,你好这两个字虽然我们能看懂,但是这是因为计算机进行解码过后的结果。实际上保存在计算机中的数据是以二进制也就是byte保存的。
计算机UTF-8:AA BB CC(你)
你
如果本机是UTF-8,但是使用8859-1进行解码然后编码重新输入到新的文件会出现乱码吗?答案是不会的,第一个解码出来肯定是乱码的,但是所谓的乱码只是因为字节在不同的码表对应的字符不一样。还是在相同码集编码之后,并不会改变原来的字节,所以输出到新的文件后,字节码并没有改变,通过UTF-8还是能够解析出来
UTF-8解码
AA BB CC(你)
Charset.forname(utf-8).decode
ASCII:7位表示英文ISO8859-1:8位表示欧美的字符gb2312:中国国标,2个字节表示一个汉字GBK与GB18030:都是汉字标准,不过把汉字扩容了UTF-8:这是一种存储格式,上面那些是编码格式。UTF-8使用了变长形式存储字符,英文是一个字节,中文是3个字节。
这时候由于8859-1是一个字节表示一个字符,所以由三个字节组成的汉字就会被解析成3个字符,出现俗称的乱码现象
使用ISO8859-1编码
获得charBuffer(你)
0 条评论
下一页