详解C语言—自定义类型(结构体、枚举、联合)

目录

结构体

1、结构体类型的声明

2、结构的自引用

3、结构体变量的定义和初始化

4、结构体内存对齐

结构体内存对齐的规则:

为什么存在内存对齐?

 修改默认对齐数 

5、结构体传参

6、结构体实现位段(位段的填充&可移植性)

位段的内存分配

位段的跨平台问题

枚举

1、枚举类型的定义

2、枚举的优点

3、枚举的使用

联合

1、联合类型的定义

2、联合的特点

3、联合大小的计算


结构体

1、结构体类型的声明

结构是一些值的集合,这些值称为成员变量,结构的每个成员可以是不同类型的变量。

例如描述一个学生,我们可以将他的各种信息放到结构体类型中。 

struct Stu
{
    char name[20];//名字
    int age;      //年龄
    char sex[2];  //性别
    char id[20];  //学号
};  //一定要有分号!!!

声明结构体的时候,可以进行不完全声明:

struct
{
    int a;
    char b;
    float c;
}x;
struct
{
    int a;
    char b;
    float c;
}*p;

 这时如果加上这段代码合法吗?

int main()
{
    p=&x;
}

结果如下:

 

虽然成员一样,但编译器会把上面两个声明当成完全不同的两个类型。

如果创建一个结构体只需要用一次可以用匿名结构体,但一般很少用匿名结构体。 

2、结构的自引用

先介绍一下数据结构:描述的是数据在内存中的组织结构线性数据结构。

  • 假设要存储 1 2 3 4 5,可以用一块连续的空间储存,这种叫顺序表。
  • 也可以将数据存在不同位置没有任何关系,然后通过链条将他们串起来,当找到1时接着找2,找到2时接着找能找到3,以此类推,找到1就能找到后续数据的方式就叫做链表。

 

链表中每一个存放数据的结构都叫做一个节点,从一个节点找到下一个节点,有人就想到了把节点定义成一个结构体。

struct N
{
    int data;
    struct Node next;
}

这样种方式对吗吗?

当然这种方式不行,第一个数据中next包含着第二个数据的data和next,第一个数据的next会嵌套包含后续所有数据。 无法计算结构体类型的大小。

其实每次存下一个数据的地址就可以解决,结构体想包含同类型结构体需要使用结构体指针形式,指向同类型数据.

struct Node
{
    int data;
    struct Node* next;
};

我们接着往下看,

我们也可以用typedef重命名匿名结构体类型 ,下面代码中好像因为我们重命名了匿名结构体类型为Node,所以在结构体内部又包含结构体指针类型。

typedef struct
{
    int data;
    Node* next;
}Node;

int main()
{
    Node n;
    return 0;
}

但这种方式忽略了先后顺序问题,我们要对这个匿名结构体类型重命名产生Node,产生条件是结构体必须是合格完整的类型,而重命名之前在匿名结构体类型中就出现Node*了,此时我们还未产生Node,未产生Node就提前使用Node这是绝对不允许的。

我们可以不用匿名结构体,这样先定义struct Node类型再使用Node*这样就可以了。                    代码如下:

struct Node
{
    int data;
    Node* next;
};

int main()
{
    Node n;
    return 0;
}

3、结构体变量的定义和初始化

结构体的定义有以下两种形式

  • 一种在结构体分号前定义,
  • 另一种在主函数中定义。 
struct SN
{
	char c;
	int i;
}sn1,sn2;
int main()
{
    struct SN s1,s2;
}

初始化使用大括号加对应数据的形式,也可以在大括号内使用类似 .i .c这种点加上结构体成员的方式初始化。初始化的位置可以在结构体处也可以在主函数处

struct SN
{
	char c;
	int i;
}sn1 = { 'q', 100 }, sn2 = {.i=200, .c='w'};

int main()
{
    struct SN s1 = { 'q', 100 } , s2 = {.i=200, .c='w'};
}

我们还可以在结构体内包含数组和结构体 ,为结构体内部赋值需要用大括号

在输出的时候结构体变量采用变量名加 .结构体成员的方式,结构体里包含结构体也一样。如果是结构体指针,则需->加上结构体成员。

struct SN
{
	char c;
	int i;
}sn1,sn2;

struct S
{
    double d;
    struct SN sn;
    int arr[10];
};

int main()
{
    struct S s = { 3.14, {'a', 99}, {1,2,3} };
    printf("%lf %c %d\n", s.d, s.sn.c, s.sn.i);
	int i = 0;
	for (i = 0; i < 10; i++)
		printf("%d ", s.arr[i]);

	return 0;
}

 输出结果:

4、结构体内存对齐

struct S1
{
    char c1;
    int i;
    char c2;
};

struct S2
{
    int i;
    char c1;
    char c2;
};

int main()
{   
    printf("%d\n", sizeof(struct S1));
    printf("%d\n", sizeof(struct S2));
    return 0;
}

输出结果: 这与我们想象的char类型占一个字节,int类型占四个字节,所以两个char类型和一个int类型的结构体S1的大小是六个字节显然不符,那这是为什么呢?

这时就引出了结构体对齐。

我们用offsetof( )可以计算结构体成员相较于结构体起始位置的偏移量,需要包含头文件<stddef.h>,通过偏移量来看看结构体成员在内存中怎么储存。

printf("%d\n", offsetof(struct S1, c1));
printf("%d\n", offsetof(struct S1, i));
printf("%d\n", offsetof(struct S1, c2));

输出结果: 

由此我们画图来看一下,按照offsetof()计算出的偏移量,好像结构体S1只占了九个个字节,但事实上在前面我们已经得知结构体S1的大小为十二个字节,这又是为什么呢?

通过上面的现象分析, 我们发现结构体成员不是按照顺序在内存中连续存放的,而是有一定的对齐规则。

结构体内存对齐的规则:

  1. 结构体的第一个成员永远放在相较于结构体变量起始位置偏移量为0的位置。
  2. 从第二个成员开始,往后的每个成员都要对齐到某个对齐数的整数倍处。                           对齐数:结构体成员自身的大小和默认对齐数的较小值                                                   VS上默认对齐数是8,gcc 没有默认对齐数,对齐数就是结构体成员的自身大小。
  3. 结构体的总大小,必须是最大对齐数的整数倍。                                                                   最大对齐数是所有成员的对齐数中最大的值。
  4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

这时我们就明白了:

  • char c1为第一个成员假设就放在偏移量0处, 第二个成员int i 的大小为4个字节,与VS的默认对齐数8相比,则 i 的对齐数为较小的4。所以 i 要偏移对齐数4的整数倍处,即为4处,储存4个字节,占用偏移量4到7。
  • c2的对齐数为1,所以偏移1到8处即可。
  • 最大对齐数是4,结构体的总大小是最大对齐数的整数倍,也就是4的整数倍,而目前结构体的大小为9,所以向后再占用3个空间凑成12,符合4的整数倍,这样结构体S1的大小最终为12个字节。

现在解释S2: 

  •  第一个成员int类型 i 放在0处,占用四个字节,char类型c1对齐数为1,放在4处.char类型c2对齐数为1,放在5处。
  • 最大对齐数为int i的对齐数为4,所以结构体的大小为4的整数倍,目前为6个字节,再向后占用两个字节,大小为八个字节则符合要求,结构体变量S2的大小为八个字节。

例一: 

struct S3
{
	double d;
	char c;
	int i;
};

 double类型占用八个字节,d占用0偏移处到7偏移处。char c对齐数为1,占用8偏移处。int i对齐数为4,偏移到4的整数倍12偏移处,占用12到15偏移处。整个结构体大小位16个字节正好是最大对齐数double的对齐数 8 的整数倍,结构体S3的大小为16个字节。

 例二:

struct S4
{
	char c1;
	struct S3 s3;
	double d;
};
  • char c1占用一个字节放在0偏移处。 
  • 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
  • 结构体S3的最大对齐数为8,所以对齐到8偏移处,占用S3的大小十六个字节到23偏移处。
  • double d的对齐数为8,偏移到8的整数倍24偏移处,占用8个字节到31偏移处。
  • 目前大小为32,正好为最大对齐数为8的整数倍,结构体的大小为32个字节。

 

为什么存在内存对齐?

1. 平台原因(移植原因)
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特
定类型的数据,否则抛出硬件异常。
2. 性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访
问。
总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占用空间小的成员尽量集中在一起

 修改默认对齐数 

#pragma pack(1)

struct S
{
	char c1;//1 1 1
	int a; // 4 1 1
	char c2;//1 1 1
};
#pragma pack()

int main()
{
	printf("%d\n", sizeof(struct S));
	return 0;
}

输出结果: 通过#pragma pack(1)修改默认对齐数,使每个成员的对齐数都为1,这时他们都不存在对齐,依次排列在内存中。大小为六个字节。

结构体使用完对齐数1之后,通过#pragma pack()取消设置的默认对齐数,还原为默认。

结构在对齐方式不合适的时候,我么可以自己更改默认对齐数。  

5、结构体传参

struct S
{
    int data[100];
    int num;
};

void print1(struct S tmp)
{
    printf("%d\n",tmp.num);
}

void print2(struct S* ps)
{
    printf("%d\n",ps->num);
}

int main()
{
    struct S s = { {1,2,3}, 100 };
    print1(s);
    print2(&s);
    return 0;
}

输出结果: 

传参首选print2函数 :

  • 函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
  • 如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。 

6、结构体实现位段(位段的填充&可移植性)

位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字,这个数字是说明存放的二进制位的大小。
struct A
{
 int _a:2;
 int _b:5;
 int _c:10;
 int _d:30;
};

位段的内存分配

1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
2. 位段的空间上是按照需要以 4 个字节( int )或者 1 个字节( char )的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

 

 我们来看看这个例题:

int main()
{
  unsigned char puc[4];
  struct tagPIM
  {
    unsigned char ucPim1;
    unsigned char ucData0 : 1;
    unsigned char ucData1 : 2;
    unsigned char ucData2 : 3;
  }*pstPimData;
  pstPimData = (struct tagPIM*)puc;
  memset(puc,0,4);
  pstPimData->ucPim1 = 2; 
  pstPimData->ucData0 = 3;
  pstPimData->ucData1 = 4;
  pstPimData->ucData2 = 5;
  printf("%02x %02x %02x %02x\n",puc[0], puc[1], puc[2], puc[3]);
  return 0;
}

首先定义名为 puc 的包含4个无符号字符的数组

定义了一个名为 tagPIM 的结构体,其中包括:

  • 一个无符号字符 ucPim1
  • 三个位字段 ucData0ucData1 和 ucData2,它们的大小分别是1位、2位和3位。

然后创建了一个名为 pstPimData 的 struct tagPIM 类型的指针。

将 puc 的地址赋给了 pstPimData。这意味着 pstPimData 现在指向 puc 的内存位置。

使用 memset 函数将 puc 的所有字节设置为0。

设置了由 pstPimData 指向的结构体的成员的值:

  • ucPim1 被设置为2。
  • ucData0 被设置为3。但由于它是一个1位字段,它只能容纳0或1的值。因此,将其设置为3相当于将其设置为1(二进制:11,但只考虑最低有效位)。
  • ucData1 被设置为4。它是一个2位字段。4的二进制表示是100,但只考虑两个最低有效位,所以它被设置为0。
  • ucData2 被设置为5。它是一个3位字段。5的二进制表示是101,这适合3位,所以它被设置为5。

现在,让我们看看 tagPIM 的内存布局是怎样的:

 ucPim1    |  ucData2  | ucData1 | ucData0
    8位        |      3位       |     2位     |    1位                                                                                       
00000010  |     101       |      00      |      1

unsigned char puc[4]分配了四个字节                                                                                            所以在内存中为00000010 00101001 00000000 00000000                                                            以十六进制形式打印结果为02 29 00 00

位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题在。

枚举

1、枚举类型的定义

枚举顾名思义就是一一列举。
把可能的取值一一列举。
比如我们现实生活中:
  • 一周的星期一到星期日是有限的7天,可以一一列举。
  • 性别有:男、女、保密,也可以一一列举。
  • 月份有12个月,也可以一一列举
enum Color
{
	RED,//0
	GREEN,//1
	BLUE//2
};

int main()
{
    enum Color c = GREEN;
	printf("%d\n", RED);
	printf("%d\n", GREEN);
	printf("%d\n", BLUE);

	return 0;
}

输出结果: 枚举类型默认值从0开始,依次递增1。

也可以在定义时赋初值:

enum Color
{
	RED = 9,
	GREEN,
	BLUE
};

enum Color
{
	RED,
	GREEN = 9,
	BLUE
};

2、枚举的优点

为什么使用枚举?
我们可以使用 #define 定义常量,为什么非要使用枚举?
    枚举的优点:
  • 增加代码的可读性和可维护性
  • 和#define定义的标识符比较枚举有类型检查,更加严谨。
  • 防止了命名污染(封装)
  • 便于调试
  • 使用方便,一次可以定义多个常量

3、枚举的使用

enum Color//颜色
{
 RED=1,
 GREEN=2,
 BLUE=4
};

enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异

联合

1、联合类型的定义

联合也是一种特殊的自定义类型
这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体)。
//联合类型的声明
union Un
{
 char c;
 int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));

2、联合的特点

联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联
合至少得有能力保存最大的那个成员)。
union Un
{
	char c;
	int i;
};

int main()
{
	printf("%d\n", sizeof(union Un));
	return 0;
}

输出结果: 

为什么是4呢?我们打印联合类型Un和内部成员的地址一探究竟。

union Un
{
	char c;
	int i;
};

int main()
{
	printf("%d\n", sizeof(union Un));
	union Un un = { 0 };

	printf("%p\n", &un);
	printf("%p\n", &(un.i));
	printf("%p\n", &(un.c));

	return 0;
}

输出结果: 

他们在内存空间应该是这样的:  

union Un
{
	char c;
	int i;
};

int main()
{
	printf("%d\n", sizeof(union Un));
	union Un un = { 0 };
	un.i = 0x11223344;
	un.c = 0x55;

	printf("%p\n", &un);
	printf("%p\n", &(un.i));
	printf("%p\n", &(un.c));

	return 0;
}

un.i 的地址: 

un.c的地址:

这证明了联合类型的成员共用同一块空间。


 联合体实现判断当前计算机的大小端存储:

int check_sys()
{
	union
	{
		int i;
		char c;
	}un = {.i = 1};
	return un.c;
}

int main()
{
	int ret = check_sys();
	

	if (ret == 1)
		printf("小端\n");
	else
		printf("大端\n");

	return 0;
}
  • check_sys 函数定义了一个匿名联合体(union)un,这个联合体包含了一个整数 i 和一个字符 c
  • 联合体的特点是所有成员共享同一块内存,因此在一个给定时间只有一个成员是有效的。
  • 在联合体 un 中初始化了一个整数 i 的值为 1
  • check_sys 函数返回了联合体 un 中字符 c 的值。
  • 在 main 函数中,调用 check_sys 函数并将返回值存储在变量 ret 中。
  • 然后,代码检查 ret 是否等于 1
  • 如果 ret 等于 1,则打印 "小端",表示系统是小端字节序。
  • 如果 ret 不等于 1,则打印 "大端",表示系统是大端字节序。

3、联合大小的计算

  • 联合的大小至少是最大成员的大小。
  • 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
union Un1
{
	char c[5];
    //5个字节 每个元素占1个字节 默认对齐数8  对齐数为1
	int i;
    //4个字节 默认对齐数8 对齐数为4
};


int main()
{
	printf("%d\n", sizeof(union Un1));
    //5不是最大对齐数的整数倍,所以5+3 = 8

	return 0;
}

猜你喜欢

转载自blog.csdn.net/m0_73800602/article/details/133045752