如何理解Python中的编码解码(相对于传统的编码解码)

学过编码解码的同学应该都知道,是二进制到我们认识的字母数字的过程叫做编码,但在python里,为什么是我们认识的字母数字到二进制叫编码呢?

我看了网上现有的讲解,都没能从本质讲清这个区别,其实要想理解这个区别,需要先理解解码和编码的本质是什么。

简单来说,编码是种一对多的关系,将一种表现形式,通过各种规则,变成多种表现形式。而解码是种多对一的关系,是编码的逆过程,将多种表现形式,通过确定的规则,变为一种表现形式。

如何理解Python中的编码解码(相对于传统的编码解码)如何理解Python中的编码解码(相对于传统的编码解码)

在传统的编码与解码中,编码和解码的这个基本的一都是二进制数据,而在Python中,编码与解码的这个基本的一则是Unicode码(自从python3以后,字符串str统一由unicode码表示),所以python中的编码解码,不是对于二进制来说的,而是相对于Unicode码来说的,搞清楚了这一点,对于python的编码解码就能够理解了。

如何理解Python中的编码解码(相对于传统的编码解码)

当从外部接收到数据时,我们接收的时bytes字节流,而这个字节流可能是utf-8编码,也可能是gbk编码,而当我们把字节流转换成字符串时,都是统一转换成unicode码,即上面所提到的多对一过程——解码,而当处理完成,需要输出时,需要从字符串重新转换成字节流,而变为字节流也有多种规则,即上面提到的一对多过程——编码。

如何理解Python中的编码解码(相对于传统的编码解码)