字符编码

7-04 258 views

1、GB2312、GBK、GB18030、UTF-8的主要区别?

1.1 GB 2312 或 GB 2312-80 是中国国家标准简体中文字符集,对于人名、古汉语等方面出现的罕用字,GB 2312 不能处理,这导致了后来 GBK 及 GB 18030 汉字字符集的出现。

1.2 GBK 即汉字内码扩展规范,GBK 向下与 GB 2312 完全兼容,向上支持 ISO 10646 国际标准,在前者向后者过渡过程中起到的承上启下的作用。

1.3 GB 18030,全称:国家标准 GB 18030-2005《信息技术中文编码字符集》,是中华人民共和国现时最新的内码字集,GB 18030 与 GB 2312-1980 和 GBK 兼容,共收录汉字70244个。

1.4 UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码Unicode字符。用在网页上可以统一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。

 

2、使用:最好使用UTF-8或者GB18030编码,支持的范围比较广,GB2312会导致无法识别繁体字

欢迎留言