UTF-8算法演示
2021-10-26 14:44:01 0 举报
UTF-8算法的算法演示
作者其他创作
大纲/内容
0xE6B4A5
0
中文字符处理流程
0x6D25
1
1)对于单字节的字符,字节的第一位设为0,后面7位为这个字符的 Unicode 码。因此对于英语字母,UTF-8 编码和 ASCII 码是相同的。2)对于n字节的符号(n > 1),第一个字节的前n位都设为1,第n + 1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的 Unicode 码。具体的算法实现可参照 sun.nio.cs.UTF_8.javaUnicode是字符集,而UTF-8是字符算法
参考资料:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.htmlhttp://www.chi2ko.com/tool/CJK.htm
津
Unicode
0x41
把原来的unicode码按位从右到左填充
UTF-8编码完后
A
英文字符处理流程
0 条评论
回复 删除
下一页