字节序问题的简单理解

什么是字节序？

　　什么是字节序我就不再啰嗦了，这样的文章在网上一搜一大片，而且很多写的颇有水平。我主要参考了以下3篇文章：

　　字节序详解：https://blog.csdn.net/ce123_zhouwei/article/details/6971544

　　理解字节序：http://www.ruanyifeng.com/blog/2016/11/byte-order.html

　　一篇英文博客：https://blog.erratasec.com/2016/11/how-to-teach-endian.html#.XAID0JMzZsM

什么情况下需要使用到字节序相关的知识？

　　在常见的高级语言中，一定有和int相关的基础类型。以32位环境下的C语言为例，如果一个数字大于255就必须要使用2个以上的字节去存储，比如short(2字节)和int(4字节)。对于short 0x1234来说，人们为了描述方便，0x12被叫做高字节，0x34被叫做低字节。假设从左到右是内存增长的方向，那么小端环境下这个short的存储方式是“0x34 0x12”，低地址存放低字节，高地址存放高字节。在大端环境下，这个short的存放方式是“0x12 0x34”，低地址存放高字节，高地址存放低字节。

　　现在假设一个场景。比如机器A是小端环境，机器B是大端环境，A通过socket TCP协议想把0x1234(10进制为4660)这个short发给B。使用socket发送数据的原理就是指定一块数据的起始地址和这块数据的长度，然后socket从起始地址开始，把bit一位一位写入TCP流中。对于short 0x1234来说，在A的内存中就是“0x34 0x12”, 转换为二进制就为“0011 0100 0001 0010”。当TCP数据流到达B后，B会把这串bit从低地址开始存放。也就是说，这串bit到了B之后，在内存中也是“0011 0100 0001 0010”。按照大端的解析内存方式，低地址存放的是高字节，高地址存放的是低字节，这串bit在B将会被解析为0x3412(十进制为13330)。看到了吧，B把A想要传递的信息给解析错了。这就是大端小端之间传递数据由于架构不同而导致的问题。其实不光是socket，A和B通过文件交互也是一个道理，因为文件也是从内存的低地址开始，按顺序写入一定个数的bit。