Go语言切片详解

1. 切片底层实现

1.1 切片简介

  Go语言中的切片是围绕动态数组的概念构建的,可以按需自动增长和缩小。切片的动态增长是通过内置函数append来实现的,还可以通过对切片再次切片来缩小一个切片的大小。因为切片在内存中是连续的,所以切片还能获得索引、迭代以及垃圾回收优化的好处。

1.2 切片底层实现

  切片的底层实现包含3个字段:指向底层数组的指针、切片访问的元素的个数(长度)、切片允许增长到的元素的个数(容量),如下图所示。切片可以理解为对底层数组进行了抽象,并提供了相关的操作方法。
      

2. 切片的基础操作

2.1 创建和初始化

  可以通过make、切片字面量来创建和初始化切片,也可以利用现有数组或切片直接创建切片(Go语言中的引用类型(slice、map、chan)不能使用new进行初始化)。

  1. 使用make时,需要传入一个参数指定切片的长度,如果只指定长度,则切片的容量和长度相等。也可以传入两个参数分别指定长度和容量。不允许创建容量小于长度的切片。
// make只传入一个参数指定长度,则容量和长度相等。以下输出:"len: 5, cap: 5"
s := make([]int, 5)
fmt.Printf("len: %d, cap: %d\n", len(s), cap(s)) // make 传入长度和容量。以下输出:"len: 5, cap: 10" s := make([]int, 5, 10) fmt.Printf("len: %d, cap: %d\n", len(s), cap(s)) // 不允许创建容量小于长度的切片。下面语句编译会报错:"len larger than cap in make([]int)" s := make([]int, 10, 5) 
  1. 通过切片字面量来声明切片。
// 通过字面量声明切片,其长度和容量都为5。以下输出:“len: 5, cap: 5”
s := []int{1, 2, 3, 4, 5} fmt.Printf("len: %d, cap: %d\n", len(s), cap(s)) // 可以在声明切片时利用索引来给出所需的长度和容量。 // 通过指定索引为99的元素,来创建一个长度和容量为100的切片 s := []int{99: 0} 
  1. 基于现有数组或切片来创建切片的方法为:s := baseStr[low:high:max],low指定开始元素下标,high指定结束元素下标,max指定切片能增长到的元素下标。这三个参数都可以省略,low省略默认从下标0开始,high省略默认为最后一个元素下标,max省略默认是底层数组或切片的容量(这里也要注意max不能小于high)。这种方式下,切片的长度和容量的计算方式为:
len = hith - low
cap = max - low
s1 := baseStr[1:3:10]
fmt.Printf("len: %d, cap: %d\n", len(s1), cap(s1)) // len: 2, cap: 9 s2 := baseStr[1:3] fmt.Printf("len: %d, cap: %d\n", len(s2), cap(s2)) // len: 2, cap: 9 s3 := baseStr[:3] fmt.Printf("len: %d, cap: %d\n", len(s3), cap(s3)) // len: 3, cap: 10 ss1 := s1[2:5] ss2 := s1[3:8] fmt.Printf("len: %d, cap: %d\n", len(ss1), cap(ss1)) // len: 3, cap: 7 fmt.Printf("len: %d, cap: %d\n", len(ss2), cap(ss2)) // len: 5, cap: 6 

  基于同一个数组或切片创建的不同切片都共享同一个底层数组。如果一个切片修改了该底层数组的共享部分,其他切片和原始数组或切片都能感知到。其底层数据结构如下面两个图所示:
  共享同一底层数组:
      

  改变互相感知:
      

baseSlice := []int{1, 2, 3, 4, 5, 6, 7, 8, 9, 10} s1 := baseSlice[1:5:10] s2 := baseSlice[2:7] // 这里 baseSlice、s1、s2 都共享同一个底层数组 /* s1 起始指针指向 baseSlice 下标为1的元素,可以访问到baseSlice下标为4的元素, 可以通过append增加容量到baseSlice最后一个元素。 s1 起始指针指向 baseSlice 下标为1的元素,可以访问到baseSlice下标为4的元素, 可以通过append增加容量到baseSlice最后一个元素。 */ // 下面的例子可以看到,不管修改 baseSlice、s1、s2 中的哪个,这几个切片能访问到的数据都会跟着改变 // 修改 baseSlice 下标为3元素 /* baseSlice: [1 2 3 999 5 6 7 8 9 10] s1: [2 3 999 5] s2: [3 999 5 6 7] */ baseSlice[3] = 999 fmt.Printf("baseSlice: %v\n", baseSlice) fmt.Printf("s1: %v\n", s1) fmt.Printf("s2: %v\n", s2) // 修改 s1 下标为1元素 /* baseSlice: [1 2 888 999 5 6 7 8 9 10] s1: [2 888 999 5] s2: [888 999 5 6 7] */ s1[1] = 888 fmt.Printf("baseSlice: %v\n", baseSlice) fmt.Printf("s1: %v\n", s1) fmt.Printf("s2: %v\n", s2) // 修改 s2 下标为2元素 /* baseSlice: [1 2 888 999 222 6 7 8 9 10] s1: [2 888 999 222] s2: [888 999 222 6 7] */ s2[2] = 222 fmt.Printf("baseSlice: %v\n", baseSlice) fmt.Printf("s1: %v\n", s1) fmt.Printf("s2: %v\n", s2) 

2.2 nil和空切片

  用var s []int声明的切片如果未经初始化,就是nil切片。空切片是用make或字面量创建的切片,s := make([]int, 0)或者s := []int{}。空切片在底层数组包含0个元素,也没有分配任何存储空间。不管是空切片还是nil切片,对其调用函数append、len和cap的效果都是一样的。nil切片和空切片底层结构如下:
      

      

2.3 切片增长

  切片的增长是通过调用append函数完成的。函数append总是会增加新切片的长度,而容量可能会改变,也可能不会改变,这取决于被操作切片的可用用量(注意:append不会修改传入的切片,而是会返回一个新的切片)。

// 创建一个整型切片
// 其长度和容量都是5个元素
slice := []int{10, 20, 30, 40, 50} // 创建一个新切片 // 其长度为2 个元素,容量为4个元素 newSlice := slice[1:3] // 使用原有的容量来分配一个新元素 // 将新元素赋值为 60 newSlice = append(newSlice, 60) fmt.Printf("slice: %v\n", slice) // slice: [10 20 30 60 50] fmt.Printf("newSlice: %v\n", newSlice) // newSlice: [20 30 60] 

  以上代码运行的底层结构如下图:
      

  因为newSlice在底层数组里还有额外的容量可用,append操作将可用的元素合并到切片的长度,并对其进行赋值。由于和原始的slice共享同一个底层数组,所以slice中索引为3的元素的值也被改动 。如果切片的底层数组没有足够的容量可用,append函数会创建一个新的底层数组,将被引用的现有的值复制到新的数组里,再追加新的值。

// 创建一个整型切片
// 其长度和容量都是4个元素
slice := []int{10, 20, 30, 40} // 向切片追加一个新元素 // 将新元素赋值为50 newSlice := append(slice, 50) // 改变newSlice中的某个值,发现原始slice的值并没有变化 newSlice[2] = 999 fmt.Printf("slice: %v\n", slice) // slice: [10 20 30 40] fmt.Printf("newSlice: %v\n", newSlice) // newSlice: [10 20 999 40 50] 

  当这个append操作完成后,newSlice拥有一个全新的底层数组,这个数组的容量是原来的两倍。
      

  函数append会智能地处理底层数组的容量增长。在切片的容量小于1000时,总是会成倍的增长容量。一旦元素个数超过1000,容量的增长因子会设为1.25,也就是每次增加25%的容量。

2.4 迭代切片

  切片可以用range迭代,但是要注意:如果只用一个值接收range,则得到的只是切片的下标,用两个值接收range,则得到的才是下标和对应的值。

slice := []int{10, 20, 30, 40} // 如果只用一个值接收range,则得到的只是切片的下标 for i := range slice { fmt.Println(i) } // 如果用两个值接收range,则得到的是下标和对应的值 for i, v := range slice { fmt.Println(i, v) } 

  需要强调的是,range创建了每个元素的副本,而不是直接返回对该元素的引用。如果使用该值变量的地址作为指向每个元素的指针,就会造成错误。

slice := []int{10, 20, 30, 40} /* 下面的打印输出如下: Value: 10, Value-Addr: C00000C168, ElemAddr: C000012560 Value: 20, Value-Addr: C00000C168, ElemAddr: C000012568 Value: 30, Value-Addr: C00000C168, ElemAddr: C000012570 Value: 40, Value-Addr: C00000C168, ElemAddr: C000012578 Value-Addr 表示的是遍历时用到的变量 v ElemAddr 表示的是原来的切片slice里每个元素的地址 可以看出 range 在遍历时,将slice的每个元素都复制到了同一个变量 v 使用闭包的时候,尤其要注意range的这种特性。 */ for i, v := range slice { fmt.Printf("Value: %d, Value-Addr: %X, ElemAddr: %X\n", v, &v, &slice[i]) } 

2.5 在函数间传递切片

  Go语言中参数的传递都是以值的方式传递的,引用类型也不例外。因为类型本身包装的是一个指针,所以传递引用类型是把指针复制一份,而不会复制其底层数据结构。
      

3. 多维切片

  和多维数组类似。
 

4. 参考文献

  《Go语言实战》
  《Go语言学习笔记》

猜你喜欢

转载自www.cnblogs.com/dzplhh/p/12908028.html