python中bytes、bytearray
python3中引入两个新类型
- bytes:不可变字节序列
- byterarray:字节数组,可变
字符串与bytes
- 字符串是字符组成的有序序列,字符可以使用编 码来理解
- bytes是字节组成的有序的不可变序列
- bytearray是字节组成的有序的可变的序列
编码与解码
- 字符串按照不同的字符集来编码encode返回字节序列
encode(encoding=encoding=‘utf8’,errors=“strict”)->bytes
-字节序列按照不同的字符集解码decode返回字符串
bytes.decode(encoding=“utf-8”,errors=“strict”)->str
bytearray.decode(encoding=“utf-8”,errors=“strict”) ->st
大多数操作是str类型转换成bytes类型
ASCII
ASCII是基于拉丁字母的一套单字节编码系统
需要熟记
\t(9)、\r([13][DHex])、\n(【10】【A】)
0~9 :【0~9】
A~Z:【】
a~z【】
bytes定义
- bytes()空bytes
- bytes(int)指定字节的bytes,被0填充
- bytes(iterable_or_ints)-> bytes
- bytes(string,encoding,[errors]) ->bytes等价于string.encode()
- bytes(bytes_or_buffer)->从一个字节序列或者buffer复制出一个新的不可变的bytes对象
- 使用b前缀定义
只允许基本ASCII使用字符形式b’abc9’
使用16进制表示“\x41\x61 ”
bytes操作
- 和str类型类似,都是不可变类型,很多方法都一样,bytes的方法输入是bytes,输出也是bytes
-类方法
string必须是2个字符的16进制的形式,‘133 6a 6b’ 空格将被忽略
- hex()
返回16进制表示的字符串
-索引
b’abcdef’[2]返回该字节对应的数,int类型
bytearray定义
定义
- bytearray()空bytearray
- bytearray(int)指定字节的bytearray,被0填充
- bytearray(interable_of_ints)-> bytearray 近似string。encode(),不过返回可变对象
- bytearray(bytes-or-buffer)从一个字节序列或者buffer复制出一个新的可变的bytearray对象
- b前缀定义的类型是bytes类型
bytearray操作
- 和bytes类型的方法相同
append(int)尾部追加一个元素
insert(index,int)在指定索引位置插入元素
extend(iterable_or_ints)将一个可迭代的整数集合追加到当前bytearray
pop(index=-1)从指定索引上一处元素,默认从尾部移除
remove(value)找到第一个value移除,找不到抛ValueError异常
clear()清空bytearray,将引用数清零
reverse()翻转byte array,就地修改
字节序
大端模式,big-endian;小端模式,little-endian
Inter X86 CPU使用小端模式
网络传输更多使用大端模式
Windows、Linux使用小端模式
Mac OS使用大端模式
Java虚拟机使用大端模式
- 小端模式:尾巴放在低地址段
- 大端模式:尾巴放在高地址段
有一个十六进制的数0x12345678(高位为0x12,低位为0x78).地址范围为0x100·0x103的字节顺序依赖于机器的类型: