C语言中赋值表达式的返回值是什么?

我们或多或少都有过,或者见过将赋值表达式参与运算的情况。这通常会伴随着一些意想不到的问题。今天我就见到了一段奇怪的代码:

#include<stdio.h>
int main()
{
int a =5;
int b = (a=2)+(a=3);
printf("%d %d\n",a,b);
return 0;
}

乍一看,似乎答案很明朗,按照顺序运算之后,a的值是3,b的值是5.有经验的程序员肯定会一眼看出,这里的计算过程是一个未定义行为(Undefined behavior).在这里简单来说就是:无法确定哪一个括号里的表达式会先执行。
括号只能改变运算符的结合律,不能改变表达式的求值顺序。这个顺序是取决于编译器的。所以a的值是2还是3是不能确定的。
这段代码在gcc(Ubuntu)下得到的结果是

3 6

而在clang(Mac)下运行的结果是

3 5

为什么会这样呢? 这是怎么一回事呢?

查看它们生成的汇编代码

gcc
...
  movl  $5, -8(%rbp) // a=5
  movl  $2, -8(%rbp) // a = 2
  movl  $3, -8(%rbp)  //a = 3
  movl  -8(%rbp), %eax  // eax = a
  addl  %eax, %eax //eax = eax + eax
  movl  %eax, -4(%rbp) // b = eax
...


clang
...
movl  $5, -8(%rbp)
movl  $2, -8(%rbp)  // a = 2
movl  $3, -8(%rbp)  // a = 3
movl  $5, -12(%rbp) // b = 5
...

在gcc的理解中

a = (b=c)
//会被改写成
b=c
a=b
//所以对于
a = (b=c)+(d=e)
//会被改写成
b = c
d = e
a = b+d
//当b和d为同一个值的时候,变量空间被复用了,

在clang的理解中

a = (b=c)+(d=e)
//被改写成了
i=b=c
j=d=e
a=i+j
//所以直接得到了赋值符号右边表达式值之和

由此得出结论:赋值表达式的返回值为赋值符号右边的值。

但在某些特殊情况下,使用某些编译器可能无法得到想要的结果。所以我们应当尽量避免使用赋值表达式的值参与运算。

注意:虽然在两个例子中,a的值都是3,但这并不意味着表达式的求值顺序是从左往右的。

有关编译器求值顺序的详细内容可以参考这篇文章

猜你喜欢

转载自www.cnblogs.com/nangcr/p/return-value-of-assignment-expression.html
今日推荐