文章目录

golang常用库之- encoding/binary包 | 字节转换成整形、整形转换成字节、“大字端” 和 “小字端”

golang常用库之- encoding/binary包 | 字节转换成整形、整形转换成字节、“大字端” 和 “小字端”

背景和使用场景

Go编程的三十六个套路: int与[]byte互转用于数据传输
参考URL: https://blog.frognew.com/2016/03/go-guide-encoding-binary.html

在用Go进行数据传输的场景下，例如文件传输或文件存储时，需要将Go的数据例如int转换为[]byte。得到的[]byte可以进一步在网络上传输或写入到文件中。这个场景需要借助go标准库中的encoding/binary包来实现。

变长值是使用一到多个字节编码整数的方法，绝对值较小的数字会占用较少的字节数。这个在ProtocolBuffer的编码文档中有详细说明。

encoding/binary包相对于效率更注重简单。如果需要高效的序列化，特别是数据结构较复杂的，可以选择更高级的解决方案，例如encoding/gob包(Go语言自带的数据编码解码工具包)，或者采用ProtocolBuffer(跨语言)。

使用encoding/binary包可以实现序列化和反序列化功能：

binary.Write这个函数可以将数据序列化成字节流
binary.Read这个函数可以将字节流反序列化为数据结构

使用encoding/binary包的优缺点：

优点: 简单、高效
缺点: 如果编码的结构中有不确定长度的类型，会报错

如果是go语言之间的序列化和反序列化推荐使用encoding/gob包，跨语言的序列化和反序列化可以使用protobuf，使用protobuf的化我们就不用考虑socket接受大小端的事情，protobuf数据里面就做了这种事情。

go语言socket通信中大小端转换问题

一般来说网络传输的字节序，可能是大端序或者小端序，取决于软件开始时通讯双方的协议规定。TCP/IP协议RFC1700规定使用“大端”字节序为网络字节序，开发的时候需要遵守这一规则。默认golang是使用大端序。详情见golang中包encoding/binary已提供了大、小端序的使用。

在内存中这些字节是按照从大到小的地址空间存储还是从小到大。发送接收双方事先约定好，否则就会不同的顺寻着对接收数据的解析顺序不同出错。发送端和解析端必须一致！

encoding/binary包

官方：https://pkg.go.dev/encoding/binary

golang的binary包简单实现了数字（number）到字节序（byte sequences）的转换，以及64位整型（varint）的编码与解码。

Go语言自定义二进制文件的读写操作

Go语言自定义二进制文件的读写操作
参考URL: http://c.biancheng.net/view/4570.html

Go语言的 encoding/binary 包中的 binary.Write() 函数使得以二进制格式写数据非常简单，函数原型如下：

func Write(w io.Writer, order ByteOrder, data interface{
    
    }) error

Write 函数可以将参数 data 的 binary 编码格式写入参数 w 中，参数 data 必须是定长值、定长值的切片、定长值的指针。参数 order 指定写入数据的字节序，写入结构体时，名字中有_的字段会置为 0。

package main

import (
    "bytes"
    "encoding/binary"
    "fmt"
    "os"
)

type Website struct {
    
    
    Url int32
}

func main() {
    
    
    file, err := os.Create("output.bin")
    for i := 1; i <= 10; i++ {
    
    
        info := Website{
    
    
            int32(i),
        }
        if err != nil {
    
    
            fmt.Println("文件创建失败 ", err.Error())
            return
        }
        defer file.Close()

        var bin_buf bytes.Buffer
        binary.Write(&bin_buf, binary.LittleEndian, info)
        b := bin_buf.Bytes()
        _, err = file.Write(b)

        if err != nil {
    
    
            fmt.Println("编码失败", err.Error())
            return
        }
    }
    fmt.Println("编码成功")
}

运行上面的程序会在当前目录下生成 output.bin 文件，文件内容如下：

0100 0000 0200 0000 0300 0000 0400 0000
0500 0000 0600 0000 0700 0000 0800 0000
0900 0000 0a00 0000

字节转换成整形、整形转换成字节

使用 Go 语言中 binary 这个标准包，该包实现了数字与字节之间的转化。

下来我们将数字 0x22334455 转化为大字端字节存储。

buffer := new(bytes.Buffer) 
binary.Write(buffer, binary.BigEndian, int32(0x22334455))

binary.BigEndian 常量，表示大字端。binary.LittleEndian 常量，表示小字端。

代码demo

package main

import (
	"bytes"
	"encoding/binary"
	"fmt"
)

//字节转换成整形
func BytesToInt(b []byte) int {
    
    
	bytesBuffer := bytes.NewBuffer(b)

	var x int32
	binary.Read(bytesBuffer, binary.BigEndian, &x)  //转换有两种不同的方式，也就是大端和小端。大端就是内存中低地址对应着整数的高位。

	return int(x)
}

//整形转换成字节
func IntToBytes(n int) []byte {
    
    
	x := int32(n)

	bytesBuffer := bytes.NewBuffer([]byte{
    
    })
	binary.Write(bytesBuffer, binary.BigEndian, x)
	return bytesBuffer.Bytes()
}

func main() {
    
    

	fmt.Println(IntToBytes(2))
	fmt.Println(len(IntToBytes(2)))

}

小字端” 和 “大字端”

计算机字节序和网络字节序

字节序就是多字节数据类型 (int, float 等)在内存中的存储顺序。可分为大端序，低地址端存放高位字节；小端序与之相反，低地址端存放低位字节。

小端字节序(Little Endian): 低位字节排放在内存的低地址端，高位字节排放在内存的高地址端
大端字节序(Big Endian): 高位字节排放在内存的低地址端，低位字节排放在内存的高地址端

在这里插入图片描述
使用小端序时不移动字节就能改变 number 占内存的大小而不需内存地址起始位。比如我想把四字节的 int32 类型的整型转变为八字节的 int64 整型，只需在小端序末端加零即可。

44 33 22 11
44 33 22 11 00 00 00 00
上述扩展或缩小整型变量操作在编译器层面非常有用，但在网络协议层非也。

例如，对于一个加法器，选择的是小字端。为什么？
因为，加法是从低位到高位开始加，一旦有进位，就直接送到下一位，设计就很简单。

在进行数据传输时需要先考虑一下字节序，因为不同处理器的架构体系会使用不同的存储字节序，而对于TCP/IP网络传输的字节序则固定采用的是大端字节序。

对于网络传输，使用的就是大字端。为什么？

因为，早年设备的缓存很小，先接收高字节能快速的判断报文信息：包长度（需要准备多大缓存）、地址范围（IP地址是从前到后匹配的）。

在性能不是很好的设备上，高字节在先确实是会更快一些。

TCP/IP协议RFC1700规定使用“大端”字节序为网络字节序，开发的时候需要遵守这一规则~

在网络协议层操作二进制数字时约定使用大端序，大端序是网络字节传输采用的方式。