計算機システム基礎研究ノート(2)-データビット操作

C言語のビット演算演算には、論理演算演算と論理シフト演算の2種類があります。

論理演算

C言語は、ビットごとの否定、ビットごとのAND、ビットごとのOR、ビットごとのXORの4つのビットごとの論理演算子を提供します。コンパイル中に、コンパイラーはオペランドの幅に応じて異なる命令に変換します。

運営 C言語演算子 組立説明書
ビットごとの否定 notb、notw、notl
ビットごとと andb、andw、andl
ビットごとまたは l ブラインド、ORW、ENT
ビットごとのXOR ^ ドリンク、xorw、xorl

注:C言語の論理AND(&&)、論理OR(||)、および論理NOT(!)には対応する機械命令はありませんが、複数の命令を組み合わせてこれらの機能を実現し、変数の論理演算を完了します。 。

以下では、簡単なC言語プログラムtest.cを使用して、論理演算プロセスを理解します。

#include <stdio.h>

void main() 
{
	int a=5;
	unsigned int b=3;
	short c=5;
	int d=0;
	
	a = ~a;
	b = ~b;
	c = ~c;
	d = a&b;
	d = a^b;
	d = a|b;
	
	return;
}

gccコマンドを使用して、実行可能ファイルにコンパイルします。

gcc -o0 -m32 -g test.c -o test

objdumpコマンドを使用して逆アセンブルし、test.txtファイルにリダイレクトして簡単に表示できるようにします。

objdump -S test>test.txt

メイン機能に対応する組立説明書は以下の通りです。

000004ed <main>:
#include <stdio.h>

void main() 
{
 4ed:	55                   	push   %ebp
 4ee:	89 e5                	mov    %esp,%ebp
 4f0:	83 ec 10             	sub    $0x10,%esp
 4f3:	e8 48 00 00 00       	call   540 <__x86.get_pc_thunk.ax>
 4f8:	05 e4 1a 00 00       	add    $0x1ae4,%eax
	int a=5;
 4fd:	c7 45 f4 05 00 00 00 	movl   $0x5,-0xc(%ebp)
	unsigned int b=3;
 504:	c7 45 f8 03 00 00 00 	movl   $0x3,-0x8(%ebp)
	short c=5;
 50b:	66 c7 45 f2 05 00    	movw   $0x5,-0xe(%ebp)
	int d=0;
 511:	c7 45 fc 00 00 00 00 	movl   $0x0,-0x4(%ebp)
	
	a = ~a;
 518:	f7 55 f4             	notl   -0xc(%ebp)
	b = ~b;
 51b:	f7 55 f8             	notl   -0x8(%ebp)
	c = ~c;
 51e:	66 f7 55 f2          	notw   -0xe(%ebp)
	d = a&b;
 522:	8b 45 f4             	mov    -0xc(%ebp),%eax
 525:	23 45 f8             	and    -0x8(%ebp),%eax
 528:	89 45 fc             	mov    %eax,-0x4(%ebp)
	d = a^b;
 52b:	8b 45 f4             	mov    -0xc(%ebp),%eax
 52e:	33 45 f8             	xor    -0x8(%ebp),%eax
 531:	89 45 fc             	mov    %eax,-0x4(%ebp)
	d = a|b;
 534:	8b 45 f4             	mov    -0xc(%ebp),%eax
 537:	0b 45 f8             	or     -0x8(%ebp),%eax
 53a:	89 45 fc             	mov    %eax,-0x4(%ebp)
	
	return;
 53d:	90                   	nop
}
 53e:	c9                   	leave  
 53f:	c3                   	ret    

上記のコードから、a、b、cを否定する3つの操作は、それぞれ次の命令に対応していることがわかります。

	a = ~a;
 518:	f7 55 f4             	notl   -0xc(%ebp)
	b = ~b;
 51b:	f7 55 f8             	notl   -0x8(%ebp)
	c = ~c;
 51e:	66 f7 55 f2          	notw   -0xe(%ebp)

変数aと変数bの反転命令はどちらもnotlで、4バイトの変数を扱います。変数cの反転命令はnotwを実行し、2バイトの変数を実行します。これは、コンパイラーがオペランドの幅に応じて異なる命令に変換することを意味します。

次の表は、C言語の基本データと型、およびIA-32オペランド型の対応を示しています

C言語ステートメント アセンブリ命令の長さのサフィックス 保管期間
(符号なし)char b 8
(符号なし)短い w 16
(符号なし)int l 32
(符号なし)long int l 32
(符号なし)long long int - 2 $ \ times $ 32
char * l 32
浮く s 32
ダブル l 64
ロングダブル t 80/96

引き続き、次の単純なC言語プログラムを使用して、論理AND(&&)、論理OR(||)、論理NOT(!)、およびビットごとの論理演算子の違いを理解してください。

#include <stdio.h>

void main() 
{
	int a=5;
	unsigned int b=3;
	short c=5;
	int d=0;
	
	a = !a;
	b = !b;
	c = !c;
	d = a&&b;
	d = a||b;
	
	return;
}

gccコマンドでコンパイルし、objdumpコマンドを逆アセンブルした後、main関数に対応する組み立て手順は以下の通りです。

000004ed <main>:
#include <stdio.h>

void main() 
{
 4ed:	55                   	push   %ebp
 4ee:	89 e5                	mov    %esp,%ebp
 4f0:	83 ec 10             	sub    $0x10,%esp
 4f3:	e8 82 00 00 00       	call   57a <__x86.get_pc_thunk.ax>
 4f8:	05 e4 1a 00 00       	add    $0x1ae4,%eax
	int a=5;
 4fd:	c7 45 f4 05 00 00 00 	movl   $0x5,-0xc(%ebp)
	unsigned int b=3;
 504:	c7 45 f8 03 00 00 00 	movl   $0x3,-0x8(%ebp)
	short c=5;
 50b:	66 c7 45 f2 05 00    	movw   $0x5,-0xe(%ebp)
	int d=0;
 511:	c7 45 fc 00 00 00 00 	movl   $0x0,-0x4(%ebp)
	
	a = !a;
 518:	83 7d f4 00          	cmpl   $0x0,-0xc(%ebp)
 51c:	0f 94 c0             	sete   %al
 51f:	0f b6 c0             	movzbl %al,%eax
 522:	89 45 f4             	mov    %eax,-0xc(%ebp)
	b = !b;
 525:	83 7d f8 00          	cmpl   $0x0,-0x8(%ebp)
 529:	0f 94 c0             	sete   %al
 52c:	0f b6 c0             	movzbl %al,%eax
 52f:	89 45 f8             	mov    %eax,-0x8(%ebp)
	c = !c;
 532:	66 83 7d f2 00       	cmpw   $0x0,-0xe(%ebp)
 537:	0f 94 c0             	sete   %al
 53a:	0f b6 c0             	movzbl %al,%eax
 53d:	66 89 45 f2          	mov    %ax,-0xe(%ebp)
	d = a&&b;
 541:	83 7d f4 00          	cmpl   $0x0,-0xc(%ebp)
 545:	74 0d                	je     554 <main+0x67>
 547:	83 7d f8 00          	cmpl   $0x0,-0x8(%ebp)
 54b:	74 07                	je     554 <main+0x67>
 54d:	b8 01 00 00 00       	mov    $0x1,%eax
 552:	eb 05                	jmp    559 <main+0x6c>
 554:	b8 00 00 00 00       	mov    $0x0,%eax
 559:	89 45 fc             	mov    %eax,-0x4(%ebp)
	d = a||b;
 55c:	83 7d f4 00          	cmpl   $0x0,-0xc(%ebp)
 560:	75 06                	jne    568 <main+0x7b>
 562:	83 7d f8 00          	cmpl   $0x0,-0x8(%ebp)
 566:	74 07                	je     56f <main+0x82>
 568:	b8 01 00 00 00       	mov    $0x1,%eax
 56d:	eb 05                	jmp    574 <main+0x87>
 56f:	b8 00 00 00 00       	mov    $0x0,%eax
 574:	89 45 fc             	mov    %eax,-0x4(%ebp)
	
	return;

機械命令ロジックの動作の説明(!)ではなく、例として=!Aを取り上げます。

	a = !a;
 518:	83 7d f4 00          	cmpl   $0x0,-0xc(%ebp)
 51c:	0f 94 c0             	sete   %al
 51f:	0f b6 c0             	movzbl %al,%eax
 522:	89 45 f4             	mov    %eax,-0xc(%ebp)

まず、変数aと定数0を比較し、等しい場合はレジスタa1を1に設定し、そうでない場合は0に設定してから、レジスタa 0の値をeaxレジスタに展開し、レジスタeaxから送り返します。変数のアドレスの中でa。

機械語命令論理と(&&)の操作説明は、d = a && bで説明されます。

	d = a&&b;
 541:	83 7d f4 00          	cmpl   $0x0,-0xc(%ebp)
 545:	74 0d                	je     554 <main+0x67>
 547:	83 7d f8 00          	cmpl   $0x0,-0x8(%ebp)
 54b:	74 07                	je     554 <main+0x67>
 54d:	b8 01 00 00 00       	mov    $0x1,%eax
 552:	eb 05                	jmp    559 <main+0x6c>
 554:	b8 00 00 00 00       	mov    $0x0,%eax
 559:	89 45 fc             	mov    %eax,-0x4(%ebp)

まず、変数aと0を比較します。変数aが0に等しい場合は、554の位置にジャンプしmov $0x0,%eaxます。つまり、命令を実行します。つまり、レジスターeaxに0を送信し、変数dに送信します。変数aが0と等しくない場合、変数bを使用して0と比較します。bが0と等しい場合、554にジャンプして最終結果を0に設定します。変数bが0と等しくない場合、1をeaxレジスターで、最終結果を1に設定します。

機械命令論理OR(||)の操作の説明、d = a || bで説明

	d = a||b;
 55c:	83 7d f4 00          	cmpl   $0x0,-0xc(%ebp)
 560:	75 06                	jne    568 <main+0x7b>
 562:	83 7d f8 00          	cmpl   $0x0,-0x8(%ebp)
 566:	74 07                	je     56f <main+0x82>
 568:	b8 01 00 00 00       	mov    $0x1,%eax
 56d:	eb 05                	jmp    574 <main+0x87>
 56f:	b8 00 00 00 00       	mov    $0x0,%eax
 574:	89 45 fc             	mov    %eax,-0x4(%ebp)

まず、変数aと0を比較します。変数aが0と等しくない場合は、558の位置にジャンプします。つまり、命令を実行mov $0x1,%eaxし、レジスタeaxに1を送信し、無条件に574の位置に移動して、eaxの値を設定します。変数dに送信されます。変数aが0に等しい場合、変数bは0と比較され、bが0に等しい場合、56fの位置にジャンプして、最終結果を0に設定します。

論理シフト演算

C言語のシフト操作には、左論理シフト、左算術シフト、論理右シフト、算術右シフトなどがあります。

運営 C言語演算子 組立説明書
左論理シフト << shlb、shlw、shll
算術左シフト << salb、salw、sall
論理右シフト >> shrb、shrw、shrl
算術右シフト >> sarb、sarw、sarl

注:IA-32の他のシフト命令に対応するC言語操作はありません。循環シフト命令を実装する場合は、それを実現するために複数のステートメントを記述する必要があります。

論理シフトと算術シフトのC言語演算子は同じであり、コンパイラーは異なるオペランドに従って異なる命令を選択します。无符号数采用逻辑移位指令,有符号数采用算术移位指令。逻辑和算术的区别在于友移时最高位补0还是补符号位。算术右移补入符号位,逻辑右移补入0

論理シフト演算のアセンブリー命令を導入するために、今でも単純なC言語命令を使用しています。

#include <stdio.h>

void main()
{
	int a = 0x80000000;
	unsigned int b = 0x80000000;
	
	short c = 0x8000;
	unsigned short d = 0x8000;
	
	a=a>>4;
	b=b>>4;
	
	a=c;
	a=d;
	b=c;
	b=d;
	
	return;
}

gccコマンドでコンパイルし、objdumpコマンドを逆アセンブルした後、main関数に対応する組み立て手順は以下の通りです

000004ed <main>:
#include <stdio.h>

void main()
{
 4ed:	55                   	push   %ebp
 4ee:	89 e5                	mov    %esp,%ebp
 4f0:	83 ec 10             	sub    $0x10,%esp
 4f3:	e8 46 00 00 00       	call   53e <__x86.get_pc_thunk.ax>
 4f8:	05 e4 1a 00 00       	add    $0x1ae4,%eax
	int a = 0x80000000;
 4fd:	c7 45 f8 00 00 00 80 	movl   $0x80000000,-0x8(%ebp)
	unsigned int b = 0x80000000;
 504:	c7 45 fc 00 00 00 80 	movl   $0x80000000,-0x4(%ebp)
	
	short c = 0x8000;
 50b:	66 c7 45 f4 00 80    	movw   $0x8000,-0xc(%ebp)
	unsigned short d = 0x8000;
 511:	66 c7 45 f6 00 80    	movw   $0x8000,-0xa(%ebp)
	
	a=a>>4;
 517:	c1 7d f8 04          	sarl   $0x4,-0x8(%ebp)
	b=b>>4;
 51b:	c1 6d fc 04          	shrl   $0x4,-0x4(%ebp)
	
	a=c;
 51f:	0f bf 45 f4          	movswl -0xc(%ebp),%eax
 523:	89 45 f8             	mov    %eax,-0x8(%ebp)
	a=d;
 526:	0f b7 45 f6          	movzwl -0xa(%ebp),%eax
 52a:	89 45 f8             	mov    %eax,-0x8(%ebp)
	b=c;
 52d:	0f bf 45 f4          	movswl -0xc(%ebp),%eax
 531:	89 45 fc             	mov    %eax,-0x4(%ebp)
	b=d;
 534:	0f b7 45 f6          	movzwl -0xa(%ebp),%eax
 538:	89 45 fc             	mov    %eax,-0x4(%ebp)
	
	return;

sarl $0x4,-0x8(%ebp)シンボルの数があるため、4ビット操作の右シフトを実行するときに、この命令は、はっきりと見ることができ、算術右シフトは、アセンブリ対応する命令のSARL行われます。bの右シフトを実行するとき、bは符号なしの数値であるため、アセンブリー命令shrlに対応する論理右シフト命令が実行されます。

	a=c;
 51f:	0f bf 45 f4          	movswl -0xc(%ebp),%eax
 523:	89 45 f8             	mov    %eax,-0x8(%ebp)
	a=d;
 526:	0f b7 45 f6          	movzwl -0xa(%ebp),%eax
 52a:	89 45 f8             	mov    %eax,-0x8(%ebp)
	b=c;
 52d:	0f bf 45 f4          	movswl -0xc(%ebp),%eax
 531:	89 45 fc             	mov    %eax,-0x4(%ebp)
	b=d;
 534:	0f b7 45 f6          	movzwl -0xa(%ebp),%eax
 538:	89 45 fc             	mov    %eax,-0x4(%ebp)

これらの8つの命令から、a = cが実行されると符号拡張命令が実行され、z = dがゼロ拡張命令が実行される、b = cが符号拡張命令が実行される、およびb = dが実行されることがわかります。ゼロ拡張命令が実行されます。だから私たちはそれを見ることができます执行符号扩展还是零扩展是由等号右边的变量类型决定的,与等号左边的变量类型无关

ビット演算の役割

  1. 特定の機能を実行できます:特定のビットを取り、特定のビットを予約します
  2. 短周期で高速:左シフトおよび右シフトを使用して、高速整数乗算および除算を実現できます。
  3. その他の機能も実現可能:現場交換
PS:変数aと変数bの値を交換する

一般的な方法

c = a; a = b; b = c;

ビット操作交換

a = a^b; b = b^a; a = a^b;

ビット操作方法の原理:

b = b^(a^b) = b^a^b = b^b^a = a
a = (a^b)^(b^(a^b)) = a^b^b^a^b = b

上記の内容は、今回のデータのタイムビット操作でお伝えするコンピュータシステムの基礎研究のメモですが、はじめての方でもあります。私は編集者をサポートするために少し賞賛を与えるのは良いことだと思います、あなたの確信は編集者の動機です。さらに、コンピューターの専門知識とスキルについて詳しく知りたい場合は、私の個人的なブログBeiluoを提示してください。さらに、さまざまな資料が必要な子供の靴は、WeChatのパブリックアカウントBeiluoに従ってください。無料のPPTテンプレート、さまざまな資料があなたを待っています。リードしてください。
ベイル

おすすめ

転載: www.cnblogs.com/xiangjunhong/p/12748929.html