Go语言的并发编程Goroutine

进程和线程

  • 进程:进程是程序在操作系统中的一次执行过程,系统进行资源分配和调度的一个独立单位。
  • 线程:线程是进程的一个执行实体,是CPU调度和分派的基本单位,他是比进程更小的能独立执行的基本单位。
  • 两者的关系:一个进程可以创建和撤销多个线程,同一个进程中的多个线程之间可以并发执行。

Go语言中的协程

  • 协程:独立的栈空间,共享堆空间,调度由用户自己控制,类似于用户级线程。
  • 与线程的关系:一个线程可以创建多个协程,协程是轻量级的线程。

Go语言中Goroutine

在java/c++中我们要实现并发编程的时候,我们通常需要自己维护一个线程池,并且需要自己去包装一个又一个的任务,同时需要自己去调度线程执行任务并维护上下文切换,这一切通常会耗费程序员大量的心智。那么能不能有一种机制,程序员只需要定义很多个任务,让系统去帮助我们把这些任务分配到CPU上实现并发执行呢?
Go语言中的goroutine就是这样一种机制,goroutine的概念类似于线程,但 goroutine是由Go的运行时(runtime)调度和管理的。Go程序会智能地将 goroutine 中的任务合理地分配给每个CPU。Go语言之所以被称为现代化的编程语言,就是因为它在语言层面已经内置了调度和上下文切换的机制。
在Go语言编程中你不需要去自己写进程、线程、协程,你的技能包里只有一个技能–goroutine,当你需要让某个任务并发执行的时候,你只需要把这个任务包装成一个函数,开启一个goroutine去执行这个函数就可以了,就是这么简单粗暴。

Go语言中Goroutine的使用

在需要调用的函数的时候前面加上go关键字,就可以为一个函数创建一个goroutine

  • 实例代码:
import (
	"fmt"
)

func hello(){
    
    
	fmt.Println("Hello World!")
}
func main() {
    
    
	go hello()
	fmt.Println("hello main")
}

  • 运行结果:
    在这里插入图片描述
    这里只打印了main函数里面的内容,却没有打印hello()函数里面的内容。原因在于这里的main作为主函数,也是一个默认的Goroutine,main函数返回的时候就已经结束了,而在main函数中启动的其余goroutine当然没有办法执行。可以通过添加一个time.sleep来获得效果。
  • 代码实例:
import (
	"fmt"
	"time"
)

func hello(){
    
    
	fmt.Println("Hello World!")
}
func main() {
    
    
	go hello()
	fmt.Println("hello main")
	time.Sleep(time.Second)
}

  • 运行效果:
    在这里插入图片描述
    这里通过time.sleep暂停了main函数的goroutine执行,使得main的返回延迟,hello()得以执行。
  • 多个goroutine的使用
    多个goroutine的使用即可达到Go语言的并发效果。
import (
	"fmt"
	"sync"
)

var wg sync.WaitGroup

func hello2(i int)  {
    
    
	defer wg.Done()//goroutine结束就登记-1
	fmt.Println("Hello goroutine",i)
}
func main() {
    
    
for i:=0;i<10;i++	{
    
    
	wg.Add(1)//启动一个goroutine就登记+1
	go hello2(i)
}
wg.Wait()//等到所有的goroutine结束
}

在这里插入图片描述

goroutine与线程的主要区别

  1. 线程:CPU的调度和分派的基本单位,一个进程中往往会有多个线程。线程基本上不拥有资源而是共享进程的资源,但每一个线程·还是有其辅助线程执行的资源如程序计数器,一组寄存器和栈。线程间的通信主要依靠的是共享内存,上下文切换很快,资源开销比较少。
  2. 协程:协程是一种用户态的轻量级线程,协程的调度完全由用户控制。协程拥有自己的寄存器,上下文切换和栈。协程在调度切换的时,将寄存器上下文和栈保存在其他地方,在切换回来的时候,恢复先前保存的寄存器上下文和栈,直接操作栈则基本没有内核切换的开销,可以不加锁的访问全局变量,所以上下文的切换非常快。
  • 区别
  1. 一个线程可以多个协程,一个进程也可以单独拥有多个协程,这样go中则能使用多核CPU。

  2. 线程进程都是同步机制,而协程则是异步

  3. 协程能保留上一次调用时的状态,每次过程重入时,就相当于进入上一次调用的状态

  4. OS线程(操作系统线程)一般都有固定的栈内存(通常为2MB),一个goroutine的栈在其生命周期开始时只有很小的栈(典型情况下2KB),goroutine的栈不是固定的,他可以按需增大和缩小,goroutine的栈大小限制可以达到1GB,虽然极少会用到这个大。所以在Go语言中一次创建十万左右的goroutine也是可以的。

goroutine的调度

GPM是Go语言的运行层面的实现,是Go语言实现的一套协程调度系统。区别于操作系统调度OS线程。

  1. G代表一个goroutine对象,每次go调用的时候,都会创建一个G
  2. P管理着一组goroutine队列,P里面会存储当前goroutine运行的上下文环境(函数指针,堆栈地址及地址边界),P会对自己管理的goroutine队列做一些调度(比如把占用CPU时间较长的goroutine暂停,运行后续的goroutine等等)当自己的队列消费完了就去全局队列里取,如果全局队列里也消费完了会去其他P的队列里抢任务。
  3. M是go运行是对操作系统内核线程的虚拟,M与内核线程一般是一一映射的关系,一个goroutine最终是要放在M上执行的。
    在这里插入图片描述
  1. P与M一般也是一一对应的。他们关系是: P管理着一组G挂载在M上运行。当一个G长久阻塞在一个M上时,runtime会新建一个M,阻塞G所在的P会把其他的G 挂载在新建的M上。当旧的G阻塞完成或者认为其已经死掉时 回收旧的M。
  2. P的个数是通过runtime.GOMAXPROCS设定(最大256),Go1.5版本之后默认为物理线程数。 在并发量大的时候会增加一些P和M,但不会太多,切换太频繁的话得不偿失。
  3. 单从线程调度讲,Go语言相比起其他语言的优势在于OS线程是由OS内核来调度的,goroutine则是由Go运行时(runtime)自己的调度器调度的,这个调度器使用一个称为m:n调度的技术(复用/调度m个goroutine到n个OS线程)。 其一大特点是goroutine的调度是在用户态下完成的, 不涉及内核态与用户态之间的频繁切换,包括内存的分配与释放,都是在用户态维护着一块大的内存池, 不直接调用系统的malloc函数(除非内存池需要改变),成本比调度OS线程低很多。 另一方面充分利用了多核的硬件资源,近似的把若干goroutine均分在物理线程上, 再加上本身goroutine的超轻量,以上种种保证了go调度方面的性能。

猜你喜欢

转载自blog.csdn.net/H1517043456/article/details/112879368