编码有哪些

编码有哪些

常用的编码有以下方式:
1、ASCII码 。
ASCII码 , 总共有128个,用一个字节的低7位表示,0到31是控制字符如换行回车删除等 。32到126是打印字符,可以通过键盘输入并且能够显示出来 。
2、ISO-8859-1 。
【编码有哪些】128个字符显然是不够用的,于是ISO组织在ASCII码基础上又制定了一些列标准用来扩展ASCII编码,它们是ISO-8859-1到ISO-8859-15,其中ISO-8859-1涵盖了大多数西欧语言字符,所有应用的最广泛 。ISO-8859-1仍然是单字节编码,它总共能表示256个字符 。

3、GB2312 。
它的全称是《信息交换用汉字编码字符集基本集》 , 它是双字节编码,总的编码范围是A1到F7 , 其中从A到A9是符号区,总共包含682个符号,从B0到F7是汉字区,包含6763个汉字 。

4、GBK 。
全称叫《汉字内码扩展规范》,是国家技术监督局为windows95所制定的新的汉字内码规范,它的出现是为了扩展GB2312,加入更多的汉字 , 它的编码范围是8140到FEFE(去掉XX7F)总共有23940个码位,它能表示21003个汉字 , 它的编码是和GB2312兼容的,也就是说用GB2312编码的汉字可以用GBK来解码 , 并且不会有乱码 。

5、GB18030 。
全称是《信息交换用汉字编码字符集》 , 是我国的强制标准,它可能是单字节、双字节或者四字节编码,它的编码与GB2312编码兼容,这个虽然是国家标准,但是实际应用系统中使用的并不广泛 。
6、UTF-16 。
UTF-16具体定义了Unicode字符在计算机中存取方法 。UTF-16用两个字节来表示Unicode转化格式 , 这个是定长的表示方法,不论什么字符都可以用两个字节表示,两个字节是16个bit,所以叫UTF-16 。UTF-16表示字符非常方便,每两个字节表示一个字符,这个在字符串操作时就大大简化了操作 , 这也是Java以UTF-16作为内存的字符存储格式的一个很重要的原因 。
7、UTF-8 。

经验总结扩展阅读