Go语言---bytes包

该包定义了一些操作 byte slice 的便利操作。因为字符串可以表示为 []byte,因此,bytes 包定义的函数、方法等和 strings 包很类似,所以讲解时会和 strings 包类似甚至可以直接参考。 []byte 为 字节切片,byte---uint8类型。官方网址对这个包都有详细的示例,有助于更好地理解和使用。


对于传入 []byte参数(引用类型,函数中修改会改变外部变量) 的函数,都不会修改传入的参数,返回值要么是参数的副本,要么是参数的切片。(深入函数可以看到 大多数函数内部会创建新的字节切片对象,并返回)


转换

// 将 s 中的所有字符修改为大写(小写、标题)格式返回。
func ToUpper(s []byte) []byte  
func ToLower(s []byte) []byte
func ToTitle(s []byte) []byte

// 使用指定的映射表将 s 中的所有字符修改为大写(小写、标题)格式返回。
func ToUpperSpecial(_case unicode.SpecialCase, s []byte) []byte
func ToLowerSpecial(_case unicode.SpecialCase, s []byte) []byte
func ToTitleSpecial(_case unicode.SpecialCase, s []byte) []byte

// 将 s 中的所有单词的首字符修改为 Title 格式返回。
// BUG: 不能很好的处理以 Unicode 标点符号分隔的单词。
func Title(s []byte) []byte

程序示例:

//由 main 函数作为程序入口点启动
func main(){
    var b = []byte("seafood")  //强制类型转换

    a := bytes.ToUpper(b)

    fmt.Println(a, b)     //输出结果   [83 69 65 70 79 79 68] [115 101 97 102 111 111 100]

    c := b[0:4]
    c[0] = 'A'
    fmt.Println(c, b)     //输出结果   [65 101 97 102] [65 101 97 102 111 111 100]
}

通过上述示例,可以印证函数不会修改原引用值类型。


比较

// 比较两个 []byte,nil 参数相当于空 []byte。
// a <  b 返回 -1
// a == b 返回 0
// a >  b 返回 1
func Compare(a, b []byte) int

// 判断 a、b 是否相等,nil 参数相当于空 []byte。
func Equal(a, b []byte) bool

// 判断 s、t 是否相似,忽略大写、小写、标题三种格式的区别。
// 参考 unicode.SimpleFold 函数。
func EqualFold(s, t []byte) bool

程序示例:

func main() {
    s1 := "Φφϕ kKK"
    s2 := "ϕΦφ KkK"


    // 看看 s1 里面是什么
    for _, c := range s1 {
        fmt.Printf("%-5x", c)
    }
    fmt.Println()
    // 看看 s2 里面是什么
    for _, c := range s2 {
        fmt.Printf("%-5x", c)
    }
    fmt.Println()
    // 看看 s1 和 s2 是否相似
    fmt.Println(bytes.EqualFold([]byte(s1), []byte(s2)))
}

// 输出结果:
// 3a6  3c6  3d5  20   6b   4b   212a 
// 3d5  3a6  3c6  20   212a 6b   4b   
// true                               //通过结果可以看出,主要是比较两个字节切片是否相似

清理

// 去掉 s 两边(左边、右边)包含在 cutset 中的字符(返回 s 的切片)====注意包含在
func Trim(s []byte, cutset string) []byte
func TrimLeft(s []byte, cutset string) []byte
func TrimRight(s []byte, cutset string) []byte

// 去掉 s 两边(左边、右边)符合 f函数====返回值是true还是false 要求的字符(返回 s 的切片)
func TrimFunc(s []byte, f func(r rune) bool) []byte
func TrimLeftFunc(s []byte, f func(r rune) bool) []byte
func TrimRightFunc(s []byte, f func(r rune) bool) []byte

// 去掉 s 两边的空白(unicode.IsSpace)(返回 s 的切片)
func TrimSpace(s []byte) []byte

// 去掉 s 的前缀 prefix(后缀 suffix)(返回 s 的切片)
func TrimPrefix(s, prefix []byte) []byte
func TrimSuffix(s, suffix []byte) []byte

程序示例:

func main() {
    bs := [][]byte{                        //[][]byte   类似于  []string     字节切片 二维数组
        []byte("Hello World !"),
        []byte("Hello 世界!"),
        []byte("hello golang ."),
    }
    f := func(r rune) bool {
        return bytes.ContainsRune([]byte("!!. "), r)    //判断r字符是否包含在    "!!. "  内
    }
    for _, b := range bs {          //range bs  取得下标和[]byte
        fmt.Printf("%q\n", bytes.TrimFunc(b, f))         //去掉两边满足函数的字符
    }
    // "Hello World"
    // "Hello 世界"
    // "Hello Golang"
    for _, b := range bs {
        fmt.Printf("%q\n", bytes.TrimPrefix(b, []byte("Hello "))) //去掉前缀
    }
    // "World !"
    // "世界!"
    // "hello Golang ."
}

拆合

// Split 以 sep 为分隔符将 s 切分成多个子串,结果不包含分隔符。
// 如果 sep 为空,则将 s 切分成 Unicode 字符列表。
// SplitN 可以指定切分次数 n,超出 n 的部分将不进行切分。
func Split(s, sep []byte) [][]byte
func SplitN(s, sep []byte, n int) [][]byte

// 功能同 Split,只不过结果包含分隔符(在各个子串尾部)。
func SplitAfter(s, sep []byte) [][]byte
func SplitAfterN(s, sep []byte, n int) [][]byte

// 以连续空白为分隔符将 s 切分成多个子串,结果不包含分隔符。
func Fields(s []byte) [][]byte

// 以符合 f 的字符为分隔符将 s 切分成多个子串,结果不包含分隔符。
func FieldsFunc(s []byte, f func(rune) bool) [][]byte

// 以 sep 为连接符,将子串列表 s 连接成一个字节串。
func Join(s [][]byte, sep []byte) []byte

// 将子串 b 重复 count 次后返回。
func Repeat(b []byte, count int) []bytec

程序示例:

// 示例
func main() {
    b := []byte("  Hello   World !  ")
    fmt.Printf("%q\n", bytes.Split(b, []byte{' '}))
    // ["" "" "Hello" "" "" "World" "!" "" ""]
    fmt.Printf("%q\n", bytes.Fields(b))
    // ["Hello" "World" "!"]
    f := func(r rune) bool {
        return bytes.ContainsRune([]byte(" !"), r)
    }
    fmt.Printf("%q\n", bytes.FieldsFunc(b, f))
    // ["Hello" "World"]
}

子串

// 判断 s 是否有前缀 prefix(后缀 suffix)                                 前后缀
func HasPrefix(s, prefix []byte) bool
func HasSuffix(s, suffix []byte) bool

// 判断 b 中是否包含子串 subslice(字符 r)                                包含子串或字符
func Contains(b, subslice []byte) bool
func ContainsRune(b []byte, r rune) bool

// 判断 b 中是否包含 chars 中的任何一个字符
func ContainsAny(b []byte, chars string) bool

// 查找子串 sep(字节 c、字符 r)在 s 中第一次出现的位置,找不到则返回 -1。     查找子串或字符首次出现的位置
func Index(s, sep []byte) int
func IndexByte(s []byte, c byte) int
func IndexRune(s []byte, r rune) int

// 查找 chars 中的任何一个字符在 s 中第一次出现的位置,找不到则返回 -1。
func IndexAny(s []byte, chars string) int

// 查找符合 f 的字符在 s 中第一次出现的位置,找不到则返回 -1。
func IndexFunc(s []byte, f func(r rune) bool) int

// 功能同上,只不过查找最后一次出现的位置。
func LastIndex(s, sep []byte) int
func LastIndexByte(s []byte, c byte) int
func LastIndexAny(s []byte, chars string) int
func LastIndexFunc(s []byte, f func(r rune) bool) int

// 获取 sep 在 s 中出现的次数(sep 不能重叠)。
func Count(s, sep []byte) int

替换

// 将 s 中前 n 个 old 替换为 new,n < 0 则替换全部。
func Replace(s, old, new []byte, n int) []byte

// 将 s 中的字符替换为 mapping(r) 的返回值,  mapping匿名函数
// 如果 mapping 返回负值,则丢弃该字符。
func Map(mapping func(r rune) rune, s []byte) []byte

// 将 s 转换为 []rune 类型返回
func Runes(s []byte) []rune

程序示例:

func main() {
    rot13 := func(r rune) rune {
        switch {
        case r >= 'A' && r <= 'Z':
            return 'A' + (r-'A'+13)%26
        case r >= 'a' && r <= 'z':
            return 'a' + (r-'a'+13)%26
        }
        return r
    }
    fmt.Printf("%s", bytes.Map(rot13, []byte("'Twas brillig and the slithy gopher...")))
}
输出结果:

'Gjnf oevyyvt naq gur fyvgul tbcure...

Reader

// A Reader implements the io.Reader, io.ReaderAt, io.WriterTo, io.Seeker,
// io.ByteScanner, and io.RuneScanner interfaces by reading from
// a byte slice.
// Unlike a Buffer, a Reader is read-only and supports seeking.
type Reader struct { ... }

type Reader struct {
    s        []byte
    i        int64 // current reading index
    prevRune int   // index of previous rune; or < 0
  }
// 将 b 包装成 bytes.Reader 对象。
func NewReader(b []byte) *Reader

// bytes.Reader 实现了如下接口:
// io.ReadSeeker
// io.ReaderAt
// io.WriterTo
// io.ByteScanner
// io.RuneScanner

// 返回未读取部分的数据长度
func (r *Reader) Len() int

// 返回底层数据的总长度,方便 ReadAt 使用,返回值永远不变。
func (r *Reader) Size() int64

// 将底层数据切换为 b,同时复位所有标记(读取位置等信息)。
func (r *Reader) Reset(b []byte)

程序示例:

func main() {
    b1 := []byte("Hello World!")
    b2 := []byte("Hello 世界!")
    buf := make([]byte, 6)
    rd := bytes.NewReader(b1)
    rd.Read(buf)
    fmt.Printf("%q\n", buf) // "Hello "
    rd.Read(buf)
    fmt.Printf("%q\n", buf) // "World!"

    rd.Reset(b2)
    rd.Read(buf)
    fmt.Printf("%q\n", buf) // "Hello "
    fmt.Printf("Size:%d, Len:%d\n", rd.Size(), rd.Len())
    // Size:15, Len:9
}

Buffer

缓冲区是一个可变大小的字节缓冲区,具有读和写方法。缓冲区的零值是一个可用的空缓冲区。

type Buffer struct { ... }

type Buffer struct {
    buf       []byte   // contents are the bytes buf[off : len(buf)]
    off       int      // read at &buf[off], write at &buf[len(buf)]
    bootstrap [64]byte // memory to hold first slice; helps small buffers avoid allocation.
    lastRead  readOp   // last read operation, so that Unread* can work correctly.
  
    // FIXME: it would be advisable to align Buffer to cachelines to avoid false
    // sharing.
  }

// 将 buf 包装成 bytes.Buffer 对象。
func NewBuffer(buf []byte) *Buffer  

// 将 s 转换为 []byte 后,包装成 bytes.Buffer 对象。
func NewBufferString(s string) *Buffer

// Buffer 本身就是一个缓存(内存块),没有底层数据,缓存的容量会根据需要
// 自动调整。大多数情况下,使用 new(Buffer) 就足以初始化一个 Buffer 了。

// bytes.Buffer 实现了如下接口:
// io.ReadWriter
// io.ReaderFrom
// io.WriterTo
// io.ByteWeriter
// io.ByteScanner
// io.RuneScanner

// 未读取部分的数据长度
func (b *Buffer) Len() int

// 缓存的容量
func (b *Buffer) Cap() int

// 读取前 n 字节的数据并以切片形式返回,如果数据长度小于 n,则全部读取。
// 切片只在下一次读写操作前合法。
func (b *Buffer) Next(n int) []byte

// 读取第一个 delim 及其之前的内容,返回遇到的错误(一般是 io.EOF)。
func (b *Buffer) ReadBytes(delim byte) (line []byte, err error)
func (b *Buffer) ReadString(delim byte) (line string, err error)

// 写入 r 的 UTF-8 编码,返回写入的字节数和 nil。
// 保留 err 是为了匹配 bufio.Writer 的 WriteRune 方法。
func (b *Buffer) WriteRune(r rune) (n int, err error)

// 写入 s,返回写入的字节数和 nil。
func (b *Buffer) WriteString(s string) (n int, err error)

// 引用未读取部分的数据切片(不移动读取位置)
func (b *Buffer) Bytes() []byte

// 返回未读取部分的数据字符串(不移动读取位置)
func (b *Buffer) String() string

// 自动增加缓存容量,以保证有 n 字节的剩余空间。
// 如果 n 小于 0 或无法增加容量则会 panic。
func (b *Buffer) Grow(n int)

// 将数据长度截短到 n 字节,如果 n 小于 0 或大于 Cap 则 panic。
func (b *Buffer) Truncate(n int)

// 重设缓冲区,清空所有数据(包括初始内容)。
func (b *Buffer) Reset()

程序示例:

func main() {
    rd := bytes.NewBufferString("Hello World!")
    buf := make([]byte, 6)
    // 获取数据切片
    b := rd.Bytes()
    // 读出一部分数据,看看切片有没有变化
    rd.Read(buf)
    fmt.Printf("%s\n", rd.String()) // World!
    fmt.Printf("%s\n\n", b)         // Hello World!

    // 写入一部分数据,看看切片有没有变化
    rd.Write([]byte("abcdefg"))
    fmt.Printf("%s\n", rd.String()) // World!abcdefg
    fmt.Printf("%s\n\n", b)         // Hello World!

    // 再读出一部分数据,看看切片有没有变化
    rd.Read(buf)
    fmt.Printf("%s\n", rd.String()) // abcdefg
    fmt.Printf("%s\n", b)           // Hello World!
}

猜你喜欢

转载自www.cnblogs.com/pythonPath/p/12275904.html