<mark>GB2312和UTF-8区别与用法</mark>

gb2312和utf-8就都是一种字符编码。在之前的文章【gbk和gb2312的区别有哪些?】中,已经为大家总结了gbk与gb2312的区别,并且也具体介绍了什么是字符编码?需要的朋友可以前去参考了解。

GB2312是一个简体中文字符集,由6763个常用汉字和682个全角的非汉字字符组成。gb2312 是国标,是中国的字库,里面仅涵盖了汉字和一些常用外文,比如日文片假名,和常见的符号。

UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码,由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码Unicode字符。

UTF-8里面存储一个汉字3个字节。而gb2312中存储一个汉字2个字节。

dfb767162825cba89cab769da3b96a6.png

gb2312和utf-8的主要区别:

关于字库规模: UTF-8 > gb2312(utf8字全而gb2312只有汉字)

关于保存大小: UTF-8> gb2312 (utf8更臃肿、加载更慢,gb2312更小巧,加载更快)

关于适用范围:gb2312主要在中国大陆地区使用,是一个本地化的字符集,UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。

那么如何选择在项目开发时的编码?

这就需要大家根据自身的需求结合不同编码的优势来进行选择。

比如,网站内容数据很多,并且只针对国内用户,推荐使用gb2312编码。

如果网站英文内容较多或者内容少的企业站,推荐使用utf-8编码。

这个主要是根据gb2312和utf8编码的数据库存储空间不同来选择的。