理解go中空结构体的应用和实现原理

大家好,我是「Go学堂」的渔夫子,欢迎关注Go学堂,学习更多实战应用案例。

在实际项目或开源程序中,相信大家都见过将一个空结构体作为map值的场景:

// CanSkipFuncs will skip valid if RequiredFirst is true and the struct field's value is empty
var CanSkipFuncs = map[string]struct{}{
    "Email":   {},
    "IP":      {},
    "Mobile":  {},
    "Tel":     {},
    "Phone":   {},
    "ZipCode": {},
}
复制代码

或将一个空结构体写入到通道中的使用:

w.ch <- struct{}{}
复制代码

那为什么要这样使用空结构体呢?今天就跟大家一起来学习下空结构体的应用以及底层原理

01 什么空结构体

首先来看看空结构体是什么。空结构体也是结构体类型,具有结构体的一切特性。但该结构体中没有任何字段组合。所以,该空结构体类型的变量占用的空间为0

我们通过unsafe.Sizeof函数来验证一下。unsafe.Sizeof函数的作用是返回一个数据类型所占的空间大小。我们验证一下:

var s struct{}
fmt.Println(unsafe.Sizeof(s)) // prints 0
复制代码

我们看到打印的结果是0,表明struct{}的类型占用的空间是0。

我们还可以通过reflect的类型来验证。

var s struct{}
typ := reflect.TypeOf(s)
fmt.Println(typ.Size()) // 0
复制代码

我们看到,通过映射变量s的类型,输出空类型的空间大小也是0。

02 空结构体类型变量的地址

我们知道,在编程语言中,变量的作用就是在内存中,标记和存储数据的。也就是说每个变量会对应着一块内存空间,既然是内存空间,那就应该有对应的内存地址。那空结构体类型变量的地址是什么呢?我们通过如下代码来看下:

package main
 
import (
    "fmt"
    "unsafe"
)
 
type emptyStruct struct{}
 
func main() {
    a := struct{}{}
    b := struct{}{}
 
    c := emptyStruct{}
 
    fmt.Println(a)
    fmt.Printf("%pn", &a) //0x116be80
    fmt.Printf("%pn", &b) //0x116be80
    fmt.Printf("%pn", &c) //0x116be80
 
    fmt.Println(a == b) //true
}
复制代码

我们发现,所有空结构体类型的变量地址都是一样的。 那这是为什么呢?

在底层实现中,这和一个很重要的 zerobase 变量有关(在runtime里多次使用到了这个变量),而zerobase 变量是一个 uintptr 的全局变量,占用8个字节。在go源码src/runtime/malloc.go中有如下定义:

// base address for all 0-byte allocations
var zerobase uintptr
复制代码

只要你将struct{} 赋值给一个或者多个变量,它都返回这个 zerobase 的地址,这点我们上面已经证实过这一点了。

在golang中大量的地方使用到了这个 zerobase 变量,只要分配的内存为0,就返回这个变量地址,在go源码src/runtime/malloc.go的mallocgc函数中定义如下:

func mallocgc(size uintptr, typ *_type, needzero bool) unsafe.Pointer {
    if gcphase == _GCmarktermination {
	throw("mallocgc called with gcphase == _GCmarktermination")
    }

    if size == 0 {
	return unsafe.Pointer(&zerobase)
    }
    ...
}
复制代码

03 空结构体的应用场景

一般我们用在用户不关注值内容的情况下,只是作为一个信号或一个占位符来使用。

  • 基于map实现集合功能。
  • 与channel组合使用,实现一个信号

基于map实现集合功能就是我们开头提到的。使用空结构体不占用存储空间外,还有一个语义上的原因。例如:

var CanSkipFuncs = map[string]bool{
    "Email":   true,
    "IP":      true,
    "Mobile":  true,
    "Tel":     false,
    "Phone":   false,
    "ZipCode": false,
}
复制代码

我们这里将空结构体类型更换成布尔类型。首先,声明下,CanSkipFuncs集合代表的是所有要跳过的函数。所以这里的值设置成true还是false是没有任何影响的。

那么如果另一位同学在查看或review代码的时候,很有可能带来疑惑。对于值所表达的意图就有所担心怀疑,提高了理解代码的门槛。心里会想如果值为true 的话,会执行一个逻辑,为false的话会执行另一个逻辑。而相比使用一个空结构体strcut{}来理解起来容易提高心智,别人一看空结构体struct{}就知道要表达的意思是不需要关心值是什么,只需要关心键值即可。

我们再来看下和channel组合使用的例子。在etcd项目中,就有通过往channel中写入一个空结构体作为信号的,源码位于/etcd/server/auth/simple_token.go中,如下:

func (tm *simpleTokenTTLKeeper) stop() {
    select {
    case tm.stopc <- struct{}{}:
    case <-tm.donec:
    }
    <-tm.donec
}
复制代码

还有一种是基于缓冲channel实现并发限速。如下:

var limit = make(chan struct{}, 3)

func main() {
    // …………
    for _, w := range work {
        go func() {
            limit <- struct{}{}
            w()
            <-limit
        }()
    }
    // …………
}
复制代码

04 总结

空结构体是一种不包含任何字段的结构体类型,不仅具有结构体类型的一切属性,而且该结构体类型占用的空间为0。

参考链接:

blog.haohtml.com/archives/20…

ijayer.github.io/post/tech/c…

猜你喜欢

转载自juejin.im/post/7053197227266670622