python常见的字符编码有哪些?
刚开始学习Python的时候,一定要对基础知识有一定的了解,比如字符编码。你知道Python中常见的字符编码有哪些吗?让我们来看看Python字符编码的常见类型。
第一种:ASCII码。它是一种基于拉丁字母的计算机编码系统。它主要用于显示现代英语和其他西欧语言。它是最常见的单字节编码系统,相当于国际标准IS/IEC646。由于计算机是美国人发明的,计算机中最早编码的字母只有127个,即大小写英文字母、数字和一些符号。这个编码表称为ASCII编码。例如大写字母A的编码是65,小写字母a的编码是97,最后的128称为扩展ASCII码。
第二种:GBK和GB2312。能够在计算机中显示汉字是非常重要的,但是ASCII表中没有偏旁部首,所以我们需要一张中文和数字的对应表。一个字节最多只能表示256个字符,可以用来处理中文。显然一个字节是不够的,所以我们需要用两个字节来表示它,所以中国开发了GB2312代码来写中文。
第三种:Unicode。因为每个国家都有自己的一套代码,冲突不可避免,于是Unicode诞生了。它可以将所有语言统一成一组编码,这样就不会出现乱码问题。现代操作系统和大多数编程语言都直接支持Unicode。
第四种:UFT-8。基于经济性原则,出现了将Unicode编码转换为变长编码的UTF-8编码。UTF-8编码根据不同的数字大小将Unicode字符编码为1-6个字节。常用的英文字母编码为1个字节,汉字通常为3个字节。只有非常稀有的字符才会被编码成4-6个字节,如果要传输的文本包含大量英文字符,使用UTF-8编码可以节省空间。
相关推荐HOT
更多>>python流式读取大文件的两种方法
python流式读取大文件的两种方法1、使用read方法分块读取使用更底层的file.read()方法,与直接循环迭代文件对象不同,每次调用file.read(chunk_...详情>>
2023-11-14 16:48:08pythongreenlet如何交替运行
pythongreenlet如何交替运行1、greenlet说明greenlet是一个基于Greenlet实现的网络库,它使用greenlet来实现协同程序。其基本思想是,当greenle...详情>>
2023-11-14 14:52:57python收集参数的调用顺序
python收集参数的调用顺序本文教程操作环境:windows7系统、Python3.9.1,DELLG3电脑。1、说明收集参数,关键字参数,普通参数可以混合使用使用...详情>>
2023-11-14 13:23:09python实例属性的优先级分析
python实例属性的优先级分析1、说明当在实例上给类属性赋值时,实际上是给这个实例绑定了同名的属性而已,并不会影响类属性和其他实例。使用实...详情>>
2023-11-14 10:17:33