元のリンク:インタビュアー:Go言語での関数呼び出し規約について話しましょう
序文
みなさん、こんにちは
asong
。長い間更新していません。最近は仕事の都合で書くのに忙しいですpython
。Go
少しさびていますが、あきらめられませんGo
。まだ勉強しなければなりません。今日は言語の関数呼び出し規約についてお話しますGo
。呼び出し規約は呼び出し側です。パラメーターと戻り値を渡すための呼び出し先の規約に沿って、Go言語の呼び出し規約はバージョン1.17で最適化されています。この記事では、2つのバージョンの呼び出し規約がどのように見えるかを見てみましょう〜。
バージョン1.17より前のスタック転送
Go1.17
バージョンの前に、Go
言語関数呼び出しがスタックを通過しました。Go1.12
バージョンを使用して、次の例を記述してみましょう。
package main
func Test(a, b int) (int, int) {
return a + b, a - b
}
func main() {
Test(10, 20)
}
复制代码
実行go tool compile -S -N -l main.go
はそのアセンブリ命令を見ることができます。2つの部分で見てみましょう。main
最初に関数の部分を見てみましょう。
"".main STEXT size=68 args=0x0 locals=0x28
0x0000 00000 (main.go:7) TEXT "".main(SB), ABIInternal, $40-0
0x0000 00000 (main.go:7) MOVQ (TLS), CX
0x0009 00009 (main.go:7) CMPQ SP, 16(CX)
0x000d 00013 (main.go:7) JLS 61
0x000f 00015 (main.go:7) SUBQ $40, SP // 分配40字节栈空间
0x0013 00019 (main.go:7) MOVQ BP, 32(SP) // 基址指针存储到栈上
0x0018 00024 (main.go:7) LEAQ 32(SP), BP
0x001d 00029 (main.go:7) FUNCDATA $0, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
0x001d 00029 (main.go:7) FUNCDATA $1, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
0x001d 00029 (main.go:7) FUNCDATA $3, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
0x001d 00029 (main.go:8) PCDATA $2, $0
0x001d 00029 (main.go:8) PCDATA $0, $0
0x001d 00029 (main.go:8) MOVQ $10, (SP) // 第一个参数压栈
0x0025 00037 (main.go:8) MOVQ $20, 8(SP) // 第二个参数压栈
0x002e 00046 (main.go:8) CALL "".Test(SB) // 调用函数Test
0x0033 00051 (main.go:9) MOVQ 32(SP), BP // Test函数返回后恢复栈基址指针
0x0038 00056 (main.go:9) ADDQ $40, SP // 销毁40字节栈内存
0x003c 00060 (main.go:9) RET // 返回
0x003d 00061 (main.go:9) NOP
0x003d 00061 (main.go:7) PCDATA $0, $-1
0x003d 00061 (main.go:7) PCDATA $2, $-1
0x003d 00061 (main.go:7) CALL runtime.morestack_noctxt(SB)
0x0042 00066 (main.go:7) JMP 0
0x0000 65 48 8b 0c 25 00 00 00 00 48 3b 61 10 76 2e 48 eH..%....H;a.v.H
0x0010 83 ec 28 48 89 6c 24 20 48 8d 6c 24 20 48 c7 04 ..(H.l$ H.l$ H..
0x0020 24 0a 00 00 00 48 c7 44 24 08 14 00 00 00 e8 00 $....H.D$.......
0x0030 00 00 00 48 8b 6c 24 20 48 83 c4 28 c3 e8 00 00 ...H.l$ H..(....
0x0040 00 00 eb bc ....
rel 5+4 t=16 TLS+0
rel 47+4 t=8 "".Test+0
rel 62+4 t=8 runtime.morestack_noctxt+0
复制代码
上記の組み立て手順により、パラメーターがスタック上で右から左にプッシュされることを分析できます10
。20
したがって、最初のパラメーターはスタックの一番上にSP~SP+8
あり、2番目のパラメーターはスタックの一番上に格納されます。SP+8 ~ SP+16
パラメーターの後準備ができたら、関数を呼び出しTEST
ます。対応するアセンブリ命令:CALL "".Test(SB)
、対応するアセンブリ命令は次のとおりです。
"".Test STEXT nosplit size=49 args=0x20 locals=0x0
0x0000 00000 (main.go:3) TEXT "".Test(SB), NOSPLIT|ABIInternal, $0-32
0x0000 00000 (main.go:3) FUNCDATA $0, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
0x0000 00000 (main.go:3) FUNCDATA $1, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
0x0000 00000 (main.go:3) FUNCDATA $3, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
0x0000 00000 (main.go:3) PCDATA $2, $0
0x0000 00000 (main.go:3) PCDATA $0, $0
0x0000 00000 (main.go:3) MOVQ $0, "".~r2+24(SP)// SP+16 ~ SP+24 存储第一个返回值
0x0009 00009 (main.go:3) MOVQ $0, "".~r3+32(SP)
// SP+24 ~ SP+32 存储第二个返回值
0x0012 00018 (main.go:4) MOVQ "".a+8(SP), AX // 第一个参数放入AX寄存器 AX = 10
0x0017 00023 (main.go:4) ADDQ "".b+16(SP), AX // 第二个参数放入AX寄存器做加法 AX = AX + 20 = 30
0x001c 00028 (main.go:4) MOVQ AX, "".~r2+24(SP)
// AX寄存器中的值在存回栈中:24(SP)
0x0021 00033 (main.go:4) MOVQ "".a+8(SP), AX
// 第一个参数放入AX寄存器 AX = 10
0x0026 00038 (main.go:4) SUBQ "".b+16(SP), AX
// 第二个参数放入AX寄存器做减法 AX = AX - 20 = -10
0x002b 00043 (main.go:4) MOVQ AX, "".~r3+32(SP)
// AX寄存器中的值在存回栈中:32(SP)
0x0030 00048 (main.go:4) RET // 函数返回
复制代码
上記のアセンブリ命令から、言語はスタックを使用してパラメーターを渡し、戻り値を受け取ると結論付けることができGo
ます。また、複数の戻り値は、より多くのメモリを割り当てることによって実現されます。
スタックに基づいてパラメーターを渡し、戻り値を受け取るこの設計は、実装の複雑さを大幅に軽減しますが、関数呼び出しのパフォーマンスを犠牲にします。たとえば、C
言語はスタックとレジスターを使用してパラメーターを同時に渡します。パフォーマンスの点で言語よりも優れています。導入されたレジスタパラメータGo
を見てみましょう。Go1.17
レジスタパラメータ転送のパフォーマンスがスタックパラメータ転送よりも優れている理由
我们都知道CPU
是一台计算机的运算核心和控制核心,其主要功能是解释计算机指令以及处理计算机软件中的数据,CPU
的大致内部结构如下:
主要由运算器和控制器组成,运算器负责完成算术运算和逻辑运算,寄存器临时保存将要被运算器处理的数据和处理后的结果,回到主题上,寄存器是CPU
内部组件,而存储一般在外部,CPU
操作寄存器与读取内存的速度差距是数量级别的,当要进行数据计算时,如果数据处于内存中,CPU
需要先将数据从内存拷贝到寄存器进行计算,所以对于栈传递参数与接收返回值这种调用规约,每次计算都需要从内存拷贝到寄存器,计算完毕在拷贝回内存,如果使用寄存器传参的话,参数就已经按顺序放在特定寄存器了,这样就减少了内存和寄存器之间的数据拷贝,从而改善了性能,提供程序运行效率。
既然寄存器传参性能高于栈传递参数,为什么所有语言不都使用寄存器传递参数呢?因为不同架构上的寄存器差异不同,所以要支持寄存器传参就要在编译器上进行支持,这要就使编译器变得更加复杂且不易维护,并且寄存器的数量也是有限的,还要考虑超过寄存器数量的参数应该如何传递。
1.17基于寄存器传递
Go
语言在1.17
版本设计了一套基于寄存器传参的调用规约,目前也只支持x86
平台,我们也是通过一个简单的例子看一下:
func Test(a, b, c, d int) (int,int,int,int) {
return a, b, c, d
}
func main() {
Test(1, 2, 3 ,4)
}
复制代码
执行go tool compile -S -N -l main.go
可以看到其汇编指令,我们分两部分来看,先看main
函数部分:
"".main STEXT size=62 args=0x0 locals=0x28 funcid=0x0
0x0000 00000 (main.go:7) TEXT "".main(SB), ABIInternal, $40-0
0x0000 00000 (main.go:7) CMPQ SP, 16(R14)
0x0004 00004 (main.go:7) PCDATA $0, $-2
0x0004 00004 (main.go:7) JLS 55
0x0006 00006 (main.go:7) PCDATA $0, $-1
0x0006 00006 (main.go:7) SUBQ $40, SP// 分配40字节栈空间,基址指针存储到栈上
0x000a 00010 (main.go:7) MOVQ BP, 32(SP)// 基址指针存储到栈上
0x000f 00015 (main.go:7) LEAQ 32(SP), BP
0x0014 00020 (main.go:7) FUNCDATA $0, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
0x0014 00020 (main.go:7) FUNCDATA $1, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
0x0014 00020 (main.go:8) MOVL $1, AX // 参数1使用AX寄存器传递
0x0019 00025 (main.go:8) MOVL $2, BX // 参数2使用BX寄存器传递
0x001e 00030 (main.go:8) MOVL $3, CX // 参数3使用CX寄存器传递
0x0023 00035 (main.go:8) MOVL $4, DI // 参数4使用DI寄存器传递
0x0028 00040 (main.go:8) PCDATA $1, $0
0x0028 00040 (main.go:8) CALL "".Test(SB) // 调用Test函数
0x002d 00045 (main.go:9) MOVQ 32(SP), BP // Test函数返回后恢复栈基址指针
0x0032 00050 (main.go:9) ADDQ $40, SP // 销毁40字节栈内存
0x0036 00054 (main.go:9) RET // 返回
复制代码
通过上面的汇编指令我们可以分析出,现在参数已经不是从右向左进行压栈了,参数直接在寄存器上了,参数准备完毕后就去调用TEST
函数,对应的汇编指令:CALL "".Test(SB)
,对应的汇编指令如下:
"".Test STEXT nosplit size=133 args=0x20 locals=0x28 funcid=0x0
0x0000 00000 (main.go:3) TEXT "".Test(SB), NOSPLIT|ABIInternal, $40-32
0x0000 00000 (main.go:3) SUBQ $40, SP
0x0004 00004 (main.go:3) MOVQ BP, 32(SP)
0x0009 00009 (main.go:3) LEAQ 32(SP), BP
0x000e 00014 (main.go:3) FUNCDATA $0, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
0x000e 00014 (main.go:3) FUNCDATA $1, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
0x000e 00014 (main.go:3) FUNCDATA $5, "".Test.arginfo1(SB)
0x000e 00014 (main.go:3) MOVQ AX, "".a+48(SP) // 从寄存器AX获取参数 1 放入栈中 48(SP)
0x0013 00019 (main.go:3) MOVQ BX, "".b+56(SP) // 从寄存器BX获取参数 2 放入栈中 56(SP)
0x0018 00024 (main.go:3) MOVQ CX, "".c+64(SP) // 从寄存器CX获取参数 3 放入栈中 64(SP)
0x001d 00029 (main.go:3) MOVQ DI, "".d+72(SP) // 从寄存器DI获取参数 4 放入栈中 72(SP)
0x0022 00034 (main.go:3) MOVQ $0, "".~r4+24(SP)
0x002b 00043 (main.go:3) MOVQ $0, "".~r5+16(SP)
0x0034 00052 (main.go:3) MOVQ $0, "".~r6+8(SP)
0x003d 00061 (main.go:3) MOVQ $0, "".~r7(SP)
0x0045 00069 (main.go:4) MOVQ "".a+48(SP), DX // 以下操作是返回值放到寄存器中返回
0x004a 00074 (main.go:4) MOVQ DX, "".~r4+24(SP)
0x004f 00079 (main.go:4) MOVQ "".b+56(SP), DX
0x0054 00084 (main.go:4) MOVQ DX, "".~r5+16(SP)
0x0059 00089 (main.go:4) MOVQ "".c+64(SP), DX
0x005e 00094 (main.go:4) MOVQ DX, "".~r6+8(SP)
0x0063 00099 (main.go:4) MOVQ "".d+72(SP), DI
0x0068 00104 (main.go:4) MOVQ DI, "".~r7(SP)
0x006c 00108 (main.go:4) MOVQ "".~r4+24(SP), AX
0x0071 00113 (main.go:4) MOVQ "".~r5+16(SP), BX
0x0076 00118 (main.go:4) MOVQ "".~r6+8(SP), CX
0x007b 00123 (main.go:4) MOVQ 32(SP), BP
0x0080 00128 (main.go:4) ADDQ $40, SP
0x0084 00132 (main.go:4) RET
复制代码
传参和返回都采用了寄存器进行传递,并且返回值和输入都使用了完全相同的寄存器序列,并且使用的顺序也是一致的。
この最適化により、関数呼び出しが深くネストされているシナリオでは、メモリが減少する可能性があります。ストレステストを行う機会があれば、試してみることができます〜。
要約する
関数の呼び出し規約をマスターして理解することはGo
、言語を深く学ぶための重要な教訓です。この記事を読んだ後、関数の呼び出し規約をマスターしたことを願っています〜。
さて、この記事はここで終わります、私は同意します、次回お会いしましょう。
パブリックアカウントへようこそ:Golang Dream Factory