Go语言进阶学习笔记

协程

  1. 创建时默认的 stack 的⼤⼩
  • JDK5 以后 Java Thread stack 默认为1M
  • Groutine 的 Stack 初始化⼤⼩为2K
  1. 和 KSE (Kernel Space Entity 系统线程) 的对应关系
  • Java Thread 是 1:1
  • Groutine 是 M:N

Thread 切换代价大

image

image

先说,协程的本质是用户态的线程,用户对其有控制权限,内存占用少,切换代价低。

再来解释一下MPG是什么意思。

M代表内核线程,所有的G都要放在M上才能运行。

P代表控制器,调度G到M上,其维护了一个队列,存储了所有需要它来调度的G。

G代表一个go routine单元。

补充几点常见的调度策略:

1,如果某个M陷入阻塞呢?
当一个OS线程M由于io操作而陷入阻塞,假设此时G0正跑在了M上,那么M上绑定的P就会带着余下的所有G去寻找新的M。当M恢复过来时,一般情况下,会从别的M上拿过来一个P,并把原先跑在其上的G0放到P的队列中,从而运行G0。如果,没有拿到可用的P的话,就把G0放入到全局global runqueue队列中,使G0等待被调度,然后M进入线程缓存。所有的P也会周期性的检查global runqueue并运行其中的goroutine,否则global runqueue上的goroutine永远无法执行。

2,如果有的M较忙,有的M较闲呢?
此时P所分配的任务G很快就执行完了(分配不均),这就导致了这个处理器P很忙,但是其他的P还有任务。此时,P首先会去global runqueue取G。但是,如果global runqueue没有任务G了,那么P不得不从其他的P里拿一些G来执行。一般来说,如果P从其他的P那里要拿任务的话,一般就拿run queue的一半,这就确保了每个OS线程都能充分的使用。

3,如果一个G运行时间过长,导致队列中后续G都无法运行呢?
启动的时候,会专门创建一个线程sysmon,用来监控和管理,在内部是一个循环。首先,记录所有P的G任务计数schedtick,schedtick会在每执行一个G任务后递增。如果检查到 schedtick一直没有递增,说明这个P一直在执行同一个G任务,如果超过一定的时间(10ms),就在这个G任务的栈信息里面加一个标记。然后这个G任务在执行的时候,如果遇到非内联函数调用,就会检查一次这个标记,然后中断自己,把自己加到队列末尾,执行下一个G。如果没有遇到非内联函数(有时候正常的小函数会被优化成内联函数)调用的话,那就惨了,会一直执行这个G任务,直到它自己结束;如果是个死循环,并且GOMAXPROCS=1的话,恭喜你,夯住了!亲测,的确如此。

4,一个G由于调度被中断,此后如何恢复?
中断的时候将寄存器里的栈信息,保存到自己的G对象里面。当再次轮到自己执行时,将自己保存的栈信息复制到寄存器里面,这样就接着上次之后运行了。 (≧▽≦)/

func TestGroutine(t *testing.T) {
	for i := 0; i < 10; i++ {
		go func(i int) {
			//time.Sleep(time.Second * 1)
			fmt.Println(i) //值传递,协程间没有竞争关系
		}(i)
	}
	time.Sleep(time.Millisecond * 50)
}

//每次输出顺序不一致

共享内存并发机制

  • 包package sync
    Mutex
    RWLock

  • 加锁操作

func TestCounterThreadSafe(t *testing.T) {
	var mut sync.Mutex
	counter := 0
	for i := 0; i < 5000; i++ {
		go func() {
			defer func() {
				mut.Unlock()
			}()
			mut.Lock()
			counter++
		}()
	}
	time.Sleep(1 * time.Second) //等所有协程执行完
	t.Logf("counter = %d", counter)
}
  • WaitGroup 只有我wait的所有东西完成后才能往下执行
func TestCounterWaitGroup(t *testing.T) {
	var mut sync.Mutex
	var wg sync.WaitGroup
	counter := 0
	for i := 0; i < 5000; i++ {
		wg.Add(1) //新增一个我们要等待的任务
		go func() {
			defer func() {
				mut.Unlock()
			}()
			mut.Lock()
			counter++
			wg.Done() //有一个等待的任务已经完成
		}()
	}
	wg.Wait() //所有要等待的任务都已经完成
	t.Logf("counter = %d", counter)

}

CSP并发模型

  • CSP模型是上个世纪七十年代提出的,用于描述两个独立的并发实体通过共享的通讯 channel(管道)进行通信的并发模型。 CSP中channel是第一类对象,它不关注发送消息的实体,而关注与发送消息时使用的channel。
Golang CSP
  • Golang 就是借用CSP模型的一些概念为之实现并发进行理论支持,其实从实际上出发,go语言并没有,完全实现了CSP模型的所有理论,仅仅是借用了 process和channel这两个概念。process是在go语言上的表现就是 goroutine 是实际并发执行的实体,每个实体之间是通过channel通讯来实现数据共享。
Channel
  • Golang中使用 CSP中 channel 这个概念。channel 是被单独创建并且可以在进程之间传递,它的通信模式类似于 boss-worker 模式的,一个实体通过将消息发送到channel 中,然后又监听这个 channel 的实体处理,两个实体之间是匿名的,这个就实现实体中间的解耦,其中 channel 是同步的一个消息被发送到 channel 中,最终是一定要被另外的实体消费掉的,在实现原理上其实是一个阻塞的消息队列。
// 做一个任务service(50ms)
func service() string {
	time.Sleep(time.Millisecond * 50)
	return "Done"
}

// 不相关的任务(100ms)
func otherTask() {
	fmt.Println("working on something else")
	time.Sleep(time.Millisecond * 100)
	fmt.Println("Task is done.")
}

// 这样调用两个任务是串行的
func TestService(t *testing.T) {
	fmt.Println(service())
	otherTask()
	//串行输出任务1,任务2结果
}

/*************** CSP 改进版 ********************/

// 返回结果的时候把channel返回回去,当外面需要的时候可以去channel等待
func AsyncService() chan string {
	retCh := make(chan string) //阻塞性channel
	//retCh := make(chan string, 1) // 非阻塞性
	//启用一个协程去运行
	go func() {
		ret := service()
		fmt.Println("returned result.")
		retCh <- ret //运行完把结果返回到channel,如果其他地方没有取这个消息,整个协程被阻塞,如果用buffer channel则不会被阻塞
		fmt.Println("service exited.")
	}()
	return retCh
}

//
func TestAsynService(t *testing.T) {
	retCh := AsyncService() 
	otherTask() //(结果是这行先被执行好)
	fmt.Println(<-retCh) //需要结果的时候从channel取出数据
	time.Sleep(time.Second * 1)
}

猜你喜欢

转载自www.cnblogs.com/jaychan/p/12609100.html