前言

本期介绍的是c语言中的自定义类型，在平常做题时，但我们需要表示一个数据时，只需要定义一个变量表示就可以了，但是当我需要表示多个信息呢？比如需要记录多个学生的姓名、学号、性别以及年龄，难道我们要定义多个name1、name2…等等来记录吗？这看起来是不是很麻烦呢？所以本期介绍的结构体就是为了处理这种问题应运而生的，那就让我们来看看吧。

1.结构体

1.1 结构体类型的概念

结构是一些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。

1.2 结构体的声明

struct Stu
{
    
    
 char name[20];//名字
 int age;//年龄
 char sex[5];//性别
 char id[20];//学号
}; //分号不能丢

struct是声明结构体的关键字，不可省略，就相当于声明一个变量 a 是 int 一样（int a）。Stu是用户声明的结构体的名字，中间则是用户需要记录的各种数据。
这里可以在提一下，struct无法省略，但是结构体的名字可以省略，这是就叫它为匿名结构体类型。

//匿名结构体类型
struct
{
    
    
 	int a;
	char b;
 	float c;
}x;
struct
{
    
    
 	int a;
 	char b;
 	float c;
}a[20], *p;

大家可以看上面两个匿名结构体，大家觉得一样吗？答案是不一样的，因为不写名字代表着系统并不知道它的名字，因此系统会自动认为它们是不一样的，不会因为都没名字而认为它们是一样的。

1.3 结构体的自引用

顾名思义，就是自己使用自己。大家先看这个：

struct Node
{
    
    
 	int data;
 	struct Node next;
};

这样的引用对不对呢？为什么呢？答案是不对的，如果这样写，大家可以先思考一下，struct Node next 中又包含着新的 int data 以及新的 struct Node next，会不断的重复循环，是停不下来的。

struct Node
{
    
    
 	int data;
 	struct Node* next;
};

而这个就不一样了，这个当你需要继续调用自己时，只需要在 struct Node* next 当中存放下一个结构体的地址就可以了，需要时就填下一个结构体的地址，不需要时就填NULL结束自引用。

1.4 结构体变量的定义和初始化

以学生的信息为例子：

//第一种写法
struct Stu
{
    
    
 	char name[20];//名字
 	int age;//年龄
 	char sex[5];//性别
 	char id[20];//学号
}; //分号不能丢

struct Stu s = {
    
     "张三",20,"男",1001 };

//第二种写法
struct Stu
{
    
    
 	char name[20];//名字
 	int age;//年龄
 	char sex[5];//性别
 	char id[20];//学号
} s = {
    
     "张三",20,"男",1001 };

两种方法都可以，第一种一般是写在主函数中，是局部变量，第二种写在结构体后面，主函数外面，是全局变量。

1.5 结构体内存对齐（重点）

既然我们已经知道了结构体的声明以及初始化，那么它的诸多数据在内存中是如何存储的呢？先来看结构体的对齐规则：

第一个成员在与结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
- VS中默认的值为8
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。
光看字可能不太理解，我们来计算一个：

struct S1
{
    
    
 	char c1;
 	char c2;
 	int i;
};

在这里插入图片描述
我们通过规则、代码以及图来进行理解。结构体的第一个元素放在偏移量为0的地址处，第二个元素c2放置的位置我们通过规则二来看，（对齐数 = 编译器默认的一个对齐数与该成员大小的较小值）此时c2的类型是char，大小是一个字节，比vs中默认值8要小，所以选择用1，也就是要放到1的整数倍处，那么大家来看，c1紧接着的就是偏移量为1的地址，刚好也是为1的整数倍处，所以c2就放在上图的位置处。
我们再来看 i，还是按照一样的规则，i 的类型是int，大小为4个字节，比vs中默认值8要小，所以选择用4，也就是要放到4的整数倍处，而c2后面的地址的偏移量为2，不是4的倍数，因此继续向后找，找到第一个偏移量为4的整数倍处，将 i 存放到此处。在上图也就是偏移量为4的地方。
此时所有变量都已经存放完成，那么就来看规则三，结构体的最终大小是最大对齐数的整数倍处，在 s1 中最大对齐数，char 是 1，int 是 4，所以 s1 的最大对齐数为 4，而此时所占的大小恰好是 8（从 c1 到 i 结束），刚好是4的整数倍，所以 s1 最终的大小就是8个字节。

struct S2
{
    
    
 	char s;
 	struct S1 s1;
 	double d;
};

我们再来看一个结构体嵌套的题，还是结合图来看：
在这里插入图片描述
还是第一个元素放在偏移量为0的地方，然后我们已知s1的大小为8个字节，最大对齐数为4，那么来根据规则四，（如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。）说明要把s1放到偏移量为4的整数倍处，所以如图放置即可。
再来看d，double的大小为8与vs中默认值8要相等，因此放到偏移量为8的整数倍处即可，现在已经 s1 已经占用到了偏移量为12的地方，紧接着为8的整数倍处是16，所以要将 d 放到偏移量为16的地方，放完所有元素的大小为24个字节，再来看规则三，最终结构体的大小为最大对齐数的整数倍处，变量 s 的对齐数是1，结构体 s1 的对齐数是4，d 的对齐数8，所以最终的大小要是8的整数倍，不够的就浪费空间继续向后找。此时的24恰好是8的整数倍，因此最终的大小就是24个字节。

1.5.1 为什么存在内存对齐？

1. 平台原因(移植原因)：
不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
2. 性能原因：
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。
总体来说：
结构体的内存对齐是拿空间来换取时间的做法。

1.5.2 如何进一步节省空间

让占用空间小的成员尽量集中在一起。

struct S1
{
    
    
 	char c1;
 	int i;
 	char c2;
};
struct S2
{
    
    
 	char c1;
 	char c2;
 	int i;
};

S1 的大小为12，S2 的大小为8，S1和S2类型的成员一模一样，但是S1和S2所占空间的大小有了一些区别。

1.6 修改默认对齐数（VS)

#pragma pack(8)//设置默认对齐数为8
struct S1
{
    
    
 char c1;
 int i;
 char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
    
    
 char c1;
 int i;
 char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
int main()
{
    
    
    //输出的结果是什么？
    printf("%d\n", sizeof(struct S1));
    printf("%d\n", sizeof(struct S2));
    return 0;
}

答案是一个为12，一个为6。结构在对齐方式不合适的时候，我么可以自己更改默认对齐数。

1.7 结构体传参

函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。所以在使用结构体传参的时候，要传结构体的地址。

1.8 位段

位段的声明和结构是类似的，有两个不同：

位段的成员必须是 int、unsigned int 或signed int 。
位段的成员名后边有一个冒号和一个数字。

struct A
{
    
    
 	int a:2;
 	int b:5;
 	int c:10;
 	int d:30;
};

冒号后面的数字代表着它能占的bit位，比如 int a 本来是4个字节，32个 bit 位，现在 int a : 2，意味着它只能占2个 bit 位了。

1.8.1 位段的内存分配

位段的成员可以是 int unsigned int signed int 或者是 char （属于整形家族）类型
位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。
位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。
如果所需一个字节剩余bit位不够，就重新开辟一个字节。
举个例子：

struct S
{
    
    
 char a:3;
 char b:4;
 char c:5;
 char d:4;
};
struct S s = {
    
    0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;

刚开始的样子，然后一个一个进行存放，按照小端存储的方式进行存放。
在这里插入图片描述

1.8.2 位段跨平台问题

int 位段被当成有符号数还是无符号数是不确定的。
位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。
位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。
当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。
总结：跟结构体相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在。

2.枚举

2.1 枚举的概念

枚举顾名思义就是一一列举。把可能的取值一一列举。比如我们现实生活中：一周的星期一到星期日是有限的7天，可以一一列举；性别有：男、女、保密，也可以一一列举，这里就可以使用枚举了。

2.2 枚举的定义

enum Day//星期
{
    
    
 	Mon,
 	Tues,
 	Wed,
 	Thur,
 	Fri,
 	Sat,
 	Sun
};
enum Sex//性别
{
    
    
 	MALE,
 	FEMALE,
 	SECRET
}；
enum Color//颜色
{
    
    
 	RED,
 	GREEN,
 	BLUE
};

以上定义的 enum Day ， enum Sex ， enum Color 都是枚举类型。{}中的内容是枚举类型的可能取值，也叫枚举常量。枚举常量它是无法更改的，一旦初始化完成，在主函数中是无法进行修改的，这些可能取值都是有值的，默认从0开始，一次递增1，当然在定的时候也可以赋初值。例如：

enum Color//颜色
{
    
    
 	RED=1,
 	GREEN=2,
 	BLUE=4
};

2.3 枚举的优点

为什么使用枚举？我们可以使用 #define 定义常量，为什么非要使用枚举？枚举的优点：

增加代码的可读性和可维护性
和#define定义的标识符比较枚举有类型检查，更加严谨。
防止了命名污染（封装）
便于调试
使用方便，一次可以定义多个常量

3.联合体

3.1 联合体的概念

联合也是一种特殊的自定义类型这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）。

3.2 联合体的定义

//联合类型的声明
union Un
{
    
    
 	char c;
 	int i;
};
//联合变量的定义
	union Un un;

3.3 联合体的特点

联合的成员是共用同一块内存空间的，这样一个联合变量的大小，至少是最大成员的大小（因为联合至少得有能力保存最大的那个成员）
在这里插入图片描述黑色部分 c 在使用的同时 i 也在使用。

3.3 联合体大小的计算

联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍。

union Un1
{
    
    
 char c[5];
 int i;
};
union Un2
{
    
    
 short c[7];
 int i;
};
//下面输出的结果是什么？
printf("%d\n", sizeof(union Un1));
printf("%d\n", sizeof(union Un2));

答案是一个为8，一个为16。对于第一个来说，i 与char[0]、char[1]、char[2]、char[3]公用同一块空间，再加上char[4]，一共是五个字节，再根据规则二，要对齐到最大对齐数的整数倍，所以最终的大小就是8个字节，第二个同理。

4.总结

本期关于结构体相关的知识就到此结束啦，本期的重点还是计算结构体的大小那一部分，建议大家可以多次观看进行理解，再做一些题来进行巩固，在此希望大家都能有所进步喔。
如果觉得本篇文章讲的不错，可以给一个赞来鼓励博主嗷，如果大家有什么看不懂的地方或者发现其中的错误可以在评论区留言或者私信我嗷，那么本期就到此结束，让我们下期再见。

自定义类型详解（结构体、枚举、联合体）

文章目录

前言