Python内置数据结构——bytes,bytearray

bytes,bytearray

字符串与bytes

  • 字符串是字符组成的有序序列,字符可以使用编码来理解

  • bytes是字节组成的有序的不可变序列

  • bytesarray是字节组成的有序的可变序列

编码与解码

  • 字符串按照不同的字符集编码encode返回字序列bytes

            bytes.encode(encoding = 'utf - 8',errors = 'stirct') -> bytes

  • 字节序列按照不同的字符集解码decode 返回字符串

            bytes.decode(encoding = "utf - 8",errors = "strict") -> str

            bytearray.decode(encoding ="utf - 8",errors = "strict" ) -> str

ASCII

            ASCII(American Standard Code for information Interchange,美国信息交换标准代码)是基于拉丁字母的一套单字节编码系统

bytes定义

  • bytes() 空bytes

  • bytes(int) 指定字节bytes,被0填充

  • bytes(iterable_of_ints) -> bytes[0~255] 的int组成的可迭代对象

  • bytes(string,encodeing[,errors]) -> bytes  等价于string.encode()

  • bytes(bytes_or_buffer) -> immutable copy of bytes_or_buffer从一个字节序列或者buffer复制出一个新的额不可变的bytes对象

  • 使用b 前缀定义

            只允许基本ASCII使用字符形式 b'abc9'

            使用16进制表示b'\x41\x61'

bytes操作

  • 和str类型类似,都是不可变类型,所以犯法很多都一样,只不过bytes的方法,输入是bytes,输出是bytes

    • b'abcdef'.replace(b'f',b'k')

    • b'abc'.find(b'b')

  • 类方法 bytes.fromhex(string)

    • string必须是2 个字符的16进制的形式,"6162 6a 6b", 空格将被忽略

    • bytes.fromhex("6162 09 6a 6b00")

  • hex()

    • 返回16 进制表示的字符串

    • "abc".encode().hex()

  • 索引

    • b.'abcdef'[2] 返回该字节对应的数,int类型

bytearray定义

定义:

  • bytearray()空bytearray

  • bytearray(int) 指定字节的bytearray, 被0 填充

  • bytearray(iterable_of_ints) -> bytearray  [0,255]的int组成的可迭代对象

  • bytearray(string,encoding[,errors]) -> bytearry 近似string.encode() ,不过返回可变对象

  • bytearray(bytes_or_buffer)从一个字节序列或者buffer复制出一个新的可变的bytearray对象

注意:b前缀定义的类型是bytes类型

bytearray操作

  • 和bytes类型的方法相同

    • bytearray(b'abcdef').replace(b'f',b'k')

    • bytearray(b'abc').find(b'b')

  • 类方法 bytearray.fromhex(string)

    • string必须是2 个字符的16进制的形式,‘6162 6a 6b’,空格将被忽略

    • bytearray.fromhex('6162 09 6a 6b00')

  • hex()

    • 返回16 进制表示的字符串

    • bytearray('abc'.encode()).hex()

  • 索引

    • bytearray(b'abcdef')[2] 返回该字节对应的数,in类型


  • .append(int)尾部追加一个元素

  • .insert(index,int)在指定索引位置插入元素

  • .extend(iterable_of_ints) 讲一个可迭代的整数集合追加到当前bytearray

  • .pop(index = -1)从指定索引上移除元素,默认从尾部移除

  • .remove(value)找到第一个value移除,找不到抛value error

注意: 上述方法若需要使用int类型,值在[0,255]

  • .clear() 清空bytearray

  • .reverse()翻转bytearray ,就地修改

int 和 bytes 之间转换

  • int.from_bytes(bytes,byteorder)

    • 将以个字节数组表示成整数

  • int.to_bytes(length, byteorder)

    • byteorder 指字节序(大端big)

    • 将一个整数表达成一个指定长度的字节数组

i = int.form_bytes(b.'abc', 'big')
print( i , hex()) # 6382179  0x616263
printn(i.to_bytes(3 , 'big')) # b'abc'


所有数据在内存中全部都是2进制的形式,人要理解一个内存中的数据必须先要指定它的类型,否则这个数据是没有意义的

一个字节 = 8位

一个字节0~255

两个字节0~65535

0~255

0~127


大小端的意思是在内存中数据是如何存放的 (大小端代表着高低字节)例如:如果给两个字节ab 是a放高地址呢还是b放高地址呢

低字节放在高地址上,大端模式big

低字节放在小地址上,小端模式little

高低字节的排放顺序~~~

网络上采用大端模式

windows内部采用小端模式

mac用大端模式



猜你喜欢

转载自blog.51cto.com/13886191/2161400
今日推荐