Loading... 过去咱们对于中文字符集中的几个编码方式的区别分的不是很清楚,过去我也一直以为 GB2312 就是 GBK 呢。原来啊,他们还是有区别的,最大的区别就是包含的汉字数量不一样。当然在常用字方面,你可以认为用 GB2312 就足够了。 来让我们来看看正确的资料: **中文字符集:** * GB2312:包含 6763 个汉字。 * GBK:包含 21003 个汉字。GBK 兼容 GB2312,也就是说用 GB2312 编码的汉字可以用 GBK 来解码。 * GB18030:收录了 70000 个汉字,这么多是因为包含了少数民族文字。同样兼容 GBK 和 GB2312。 * Unicode:Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。具有多种编码方式,如 UTF-7、 UTF-8、UTF-16、UTF-32 等。 感谢大家的收看,我们下期再见! 最后修改:2021 年 08 月 15 日 © 允许规范转载 赞 赠人玫瑰,手留余香