python2和python3关于Unicode的区别
注明:python3版本设计未考虑向下兼容问题,过渡版本2.6/2.7,代码演版本:2.7.16
python2的字符串类型有str和unicode两种(不是 byte 类型)
python3中有了unicode类型。以及一个字节类:byte 和 bytearrays。
Python3源码文件默认使用utf-8编码
Python 2需要查看代码第一行定义,无定义则使用默认字符集。
例子:代码如下:
>>> #coding:utf-8或#-*-coding:utf-8-*-
演示代码:
7、查看当前python中表示unicode字符时占用的空间:
# 如果值是 65535,则表示使用uns2标准,即:2个字节表示
# 如果值是 1114111,则表示使用uns4标准,即:4个字节表示
8、查看Python默认的编码格式。
sys.getdefaultencoding()
9、图例(来源于网络)