详解C语言—自定义类型（结构体、枚举、联合）

结构体

1、结构体类型的声明

2、结构的自引用

6、结构体实现位段（位段的填充&可移植性）

结构体

1、结构体类型的声明

结构是一些值的集合，这些值称为成员变量，结构的每个成员可以是不同类型的变量。

例如描述一个学生，我们可以将他的各种信息放到结构体类型中。

struct Stu
{
    char name[20];//名字
    int age;      //年龄
    char sex[2];  //性别
    char id[20];  //学号
};  //一定要有分号！！！

声明结构体的时候，可以进行不完全声明：

struct
{
    int a;
    char b;
    float c;
}x;
struct
{
    int a;
    char b;
    float c;
}*p;

这时如果加上这段代码合法吗？

int main()
{
    p=&x;
}

结果如下：

虽然成员一样，但编译器会把上面两个声明当成完全不同的两个类型。

如果创建一个结构体只需要用一次可以用匿名结构体，但一般很少用匿名结构体。

2、结构的自引用

先介绍一下数据结构：描述的是数据在内存中的组织结构线性数据结构。

假设要存储 1 2 3 4 5，可以用一块连续的空间储存，这种叫顺序表。
也可以将数据存在不同位置没有任何关系，然后通过链条将他们串起来，当找到1时接着找2，找到2时接着找能找到3，以此类推，找到1就能找到后续数据的方式就叫做链表。

链表中每一个存放数据的结构都叫做一个节点，从一个节点找到下一个节点，有人就想到了把节点定义成一个结构体。

struct N
{
    int data;
    struct Node next;
}

这样种方式对吗吗？

当然这种方式不行，第一个数据中next包含着第二个数据的data和next，第一个数据的next会嵌套包含后续所有数据。无法计算结构体类型的大小。

其实每次存下一个数据的地址就可以解决，结构体想包含同类型结构体需要使用结构体指针形式，指向同类型数据.

struct Node
{
    int data;
    struct Node* next;
};

我们接着往下看，

我们也可以用typedef重命名匿名结构体类型，下面代码中好像因为我们重命名了匿名结构体类型为Node，所以在结构体内部又包含结构体指针类型。

typedef struct
{
    int data;
    Node* next;
}Node;

int main()
{
    Node n;
    return 0;
}

但这种方式忽略了先后顺序问题，我们要对这个匿名结构体类型重命名产生Node，产生条件是结构体必须是合格完整的类型，而重命名之前在匿名结构体类型中就出现Node*了，此时我们还未产生Node，未产生Node就提前使用Node这是绝对不允许的。

我们可以不用匿名结构体，这样先定义struct Node类型再使用Node*这样就可以了。 代码如下：

struct Node
{
    int data;
    Node* next;
};

int main()
{
    Node n;
    return 0;
}

3、结构体变量的定义和初始化

结构体的定义有以下两种形式

一种在结构体分号前定义，
另一种在主函数中定义。

struct SN
{
	char c;
	int i;
}sn1，sn2；

int main()
{
    struct SN s1,s2;
}

初始化使用大括号加对应数据的形式，也可以在大括号内使用类似 .i .c这种点加上结构体成员的方式初始化。初始化的位置可以在结构体处也可以在主函数处。

struct SN
{
	char c;
	int i;
}sn1 = { 'q', 100 }, sn2 = {.i=200, .c='w'};

int main()
{
    struct SN s1 = { 'q', 100 } , s2 = {.i=200, .c='w'};
}

我们还可以在结构体内包含数组和结构体 ，为结构体内部赋值需要用大括号。

在输出的时候结构体变量采用变量名加 .结构体成员的方式，结构体里包含结构体也一样。如果是结构体指针，则需->加上结构体成员。

struct SN
{
	char c;
	int i;
}sn1，sn2；

struct S
{
    double d;
    struct SN sn;
    int arr[10];
};

int main()
{
    struct S s = { 3.14, {'a', 99}, {1,2,3} };
    printf("%lf %c %d\n", s.d, s.sn.c, s.sn.i);
	int i = 0;
	for (i = 0; i < 10; i++)
		printf("%d ", s.arr[i]);

	return 0;
}

输出结果：

4、结构体内存对齐

struct S1
{
    char c1;
    int i;
    char c2;
};

struct S2
{
    int i;
    char c1;
    char c2;
};

int main()
{   
    printf("%d\n", sizeof(struct S1));
    printf("%d\n", sizeof(struct S2));
    return 0;
}

输出结果： 这与我们想象的char类型占一个字节，int类型占四个字节，所以两个char类型和一个int类型的结构体S1的大小是六个字节显然不符，那这是为什么呢？

这时就引出了结构体对齐。

我们用宏offsetof( )可以计算结构体成员相较于结构体起始位置的偏移量，需要包含头文件<stddef.h>，通过偏移量来看看结构体成员在内存中怎么储存。

printf("%d\n", offsetof(struct S1, c1));
printf("%d\n", offsetof(struct S1, i));
printf("%d\n", offsetof(struct S1, c2));

输出结果：

由此我们画图来看一下，按照offsetof()计算出的偏移量，好像结构体S1只占了九个个字节，但事实上在前面我们已经得知结构体S1的大小为十二个字节，这又是为什么呢？

通过上面的现象分析，我们发现结构体成员不是按照顺序在内存中连续存放的，而是有一定的对齐规则。

结构体内存对齐的规则：

结构体的第一个成员永远放在相较于结构体变量起始位置偏移量为0的位置。

从第二个成员开始，往后的每个成员都要对齐到某个对齐数的整数倍处。对齐数：结构体成员自身的大小和默认对齐数的较小值 VS上默认对齐数是8，gcc 没有默认对齐数，对齐数就是结构体成员的自身大小。

结构体的总大小，必须是最大对齐数的整数倍。最大对齐数是所有成员的对齐数中最大的值。

如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

这时我们就明白了：

char c1为第一个成员假设就放在偏移量0处，第二个成员int i 的大小为4个字节，与VS的默认对齐数8相比，则 i 的对齐数为较小的4。所以 i 要偏移对齐数4的整数倍处，即为4处，储存4个字节，占用偏移量4到7。

c2的对齐数为1，所以偏移1到8处即可。

最大对齐数是4，结构体的总大小是最大对齐数的整数倍，也就是4的整数倍，而目前结构体的大小为9，所以向后再占用3个空间凑成12，符合4的整数倍，这样结构体S1的大小最终为12个字节。

现在解释S2：

第一个成员int类型 i 放在0处，占用四个字节，char类型c1对齐数为1，放在4处.char类型c2对齐数为1，放在5处。

最大对齐数为int i的对齐数为4，所以结构体的大小为4的整数倍，目前为6个字节，再向后占用两个字节，大小为八个字节则符合要求，结构体变量S2的大小为八个字节。

例一：

struct S3
{
	double d;
	char c;
	int i;
};

double类型占用八个字节，d占用0偏移处到7偏移处。char c对齐数为1，占用8偏移处。int i对齐数为4，偏移到4的整数倍12偏移处，占用12到15偏移处。整个结构体大小位16个字节正好是最大对齐数double的对齐数 8 的整数倍，结构体S3的大小为16个字节。

例二：

struct S4
{
	char c1;
	struct S3 s3;
	double d;
};

char c1占用一个字节放在0偏移处。
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。
结构体S3的最大对齐数为8，所以对齐到8偏移处，占用S3的大小十六个字节到23偏移处。
double d的对齐数为8，偏移到8的整数倍24偏移处，占用8个字节到31偏移处。
目前大小为32，正好为最大对齐数为8的整数倍，结构体的大小为32个字节。

为什么存在内存对齐?

1. 平台原因(移植原因)：

不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特

定类型的数据，否则抛出硬件异常。

2. 性能原因：

数据结构(尤其是栈)应该尽可能地在自然边界上对齐。

原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访

问。

总体来说：

结构体的内存对齐是拿空间来换取时间的做法。

那在设计结构体的时候，我们既要满足对齐，又要节省空间，如何做到：

让占用空间小的成员尽量集中在一起

修改默认对齐数

#pragma pack(1)

struct S
{
	char c1;//1 1 1
	int a; // 4 1 1
	char c2;//1 1 1
};
#pragma pack()

int main()
{
	printf("%d\n", sizeof(struct S));
	return 0;
}

输出结果： ，通过#pragma pack(1)修改默认对齐数，使每个成员的对齐数都为1，这时他们都不存在对齐，依次排列在内存中。大小为六个字节。

结构体使用完对齐数1之后，通过#pragma pack()取消设置的默认对齐数，还原为默认。

结构在对齐方式不合适的时候，我么可以自己更改默认对齐数。

5、结构体传参

struct S
{
    int data[100];
    int num;
};

void print1(struct S tmp)
{
    printf("%d\n",tmp.num);
}

void print2(struct S* ps)
{
    printf("%d\n",ps->num);
}

int main()
{
    struct S s = { {1,2,3}, 100 };
    print1(s);
    print2(&s);
    return 0;
}

输出结果：

传参首选print2函数：

函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。

如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。

6、结构体实现位段（位段的填充&可移植性）

位段的声明和结构是类似的，有两个不同：

1.位段的成员必须是 int、unsigned int 或signed int 。

2.位段的成员名后边有一个冒号和一个数字，这个数字是说明存放的二进制位的大小。

struct A
{
 int _a:2;
 int _b:5;
 int _c:10;
 int _d:30;
};

位段的内存分配

1. 位段的成员可以是 int unsigned int signed int 或者是 char （属于整形家族）类型

2. 位段的空间上是按照需要以 4 个字节（ int ）或者 1 个字节（ char ）的方式来开辟的。

3. 位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

我们来看看这个例题：

int main()
{
  unsigned char puc[4];
  struct tagPIM
  {
    unsigned char ucPim1;
    unsigned char ucData0 : 1;
    unsigned char ucData1 : 2;
    unsigned char ucData2 : 3;
  }*pstPimData;
  pstPimData = (struct tagPIM*)puc;
  memset(puc,0,4);
  pstPimData->ucPim1 = 2; 
  pstPimData->ucData0 = 3;
  pstPimData->ucData1 = 4;
  pstPimData->ucData2 = 5;
  printf("%02x %02x %02x %02x\n",puc[0], puc[1], puc[2], puc[3]);
  return 0;
}

首先定义名为 puc 的包含4个无符号字符的数组

定义了一个名为 tagPIM 的结构体，其中包括：

一个无符号字符 ucPim1。

三个位字段 ucData0、ucData1 和 ucData2，它们的大小分别是1位、2位和3位。

然后创建了一个名为 pstPimData 的 struct tagPIM 类型的指针。

将 puc 的地址赋给了 pstPimData。这意味着 pstPimData 现在指向 puc 的内存位置。

使用 memset 函数将 puc 的所有字节设置为0。

设置了由 pstPimData 指向的结构体的成员的值：

ucPim1 被设置为2。

ucData0 被设置为3。但由于它是一个1位字段，它只能容纳0或1的值。因此，将其设置为3相当于将其设置为1（二进制：11，但只考虑最低有效位）。

ucData1 被设置为4。它是一个2位字段。4的二进制表示是100，但只考虑两个最低有效位，所以它被设置为0。

ucData2 被设置为5。它是一个3位字段。5的二进制表示是101，这适合3位，所以它被设置为5。

现在，让我们看看 tagPIM 的内存布局是怎样的：

ucPim1 | ucData2 | ucData1 | ucData0
8位 | 3位 | 2位 | 1位 00000010 | 101 | 00 | 1

unsigned char puc[4]分配了四个字节所以在内存中为00000010 00101001 00000000 00000000 以十六进制形式打印结果为02 29 00 00

位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的。

2. 位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。

3. 位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。

4. 当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

总结：

跟结构相比,位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题在。

枚举

1、枚举类型的定义

枚举顾名思义就是一一列举。

把可能的取值一一列举。

比如我们现实生活中：

一周的星期一到星期日是有限的7天，可以一一列举。

性别有：男、女、保密，也可以一一列举。

月份有12个月，也可以一一列举

enum Color
{
	RED,//0
	GREEN,//1
	BLUE//2
};

int main()
{
    enum Color c = GREEN;
	printf("%d\n", RED);
	printf("%d\n", GREEN);
	printf("%d\n", BLUE);

	return 0;
}

输出结果： 枚举类型默认值从0开始，依次递增1。

也可以在定义时赋初值：

enum Color
{
	RED = 9,
	GREEN,
	BLUE
};

enum Color
{
	RED,
	GREEN = 9,
	BLUE
};

2、枚举的优点

为什么使用枚举？

我们可以使用 #define 定义常量，为什么非要使用枚举？

枚举的优点：

增加代码的可读性和可维护性
和#define定义的标识符比较枚举有类型检查，更加严谨。
防止了命名污染（封装）
便于调试
使用方便，一次可以定义多个常量

3、枚举的使用

enum Color//颜色
{
 RED=1,
 GREEN=2,
 BLUE=4
};

enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值，才不会出现类型的差异

联合

1、联合类型的定义

联合也是一种特殊的自定义类型

这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）。

//联合类型的声明
union Un
{
 char c;
 int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));

2、联合的特点

联合的成员是共用同一块内存空间的，这样一个联合变量的大小，至少是最大成员的大小（因为联

合至少得有能力保存最大的那个成员）。

union Un
{
	char c;
	int i;
};

int main()
{
	printf("%d\n", sizeof(union Un));
	return 0;
}

输出结果：

为什么是4呢？我们打印联合类型Un和内部成员的地址一探究竟。

union Un
{
	char c;
	int i;
};

int main()
{
	printf("%d\n", sizeof(union Un));
	union Un un = { 0 };

	printf("%p\n", &un);
	printf("%p\n", &(un.i));
	printf("%p\n", &(un.c));

	return 0;
}

输出结果：

他们在内存空间应该是这样的：

union Un
{
	char c;
	int i;
};

int main()
{
	printf("%d\n", sizeof(union Un));
	union Un un = { 0 };
	un.i = 0x11223344;
	un.c = 0x55;

	printf("%p\n", &un);
	printf("%p\n", &(un.i));
	printf("%p\n", &(un.c));

	return 0;
}

un.i 的地址：

un.c的地址：

这证明了联合类型的成员共用同一块空间。

联合体实现判断当前计算机的大小端存储：

int check_sys()
{
	union
	{
		int i;
		char c;
	}un = {.i = 1};
	return un.c;
}

int main()
{
	int ret = check_sys();
	

	if (ret == 1)
		printf("小端\n");
	else
		printf("大端\n");

	return 0;
}

check_sys 函数定义了一个匿名联合体（union）un，这个联合体包含了一个整数 i 和一个字符 c。
联合体的特点是所有成员共享同一块内存，因此在一个给定时间只有一个成员是有效的。
在联合体 un 中初始化了一个整数 i 的值为 1。
check_sys 函数返回了联合体 un 中字符 c 的值。
在 main 函数中，调用 check_sys 函数并将返回值存储在变量 ret 中。
然后，代码检查 ret 是否等于 1。
如果 ret 等于 1，则打印 "小端"，表示系统是小端字节序。
如果 ret 不等于 1，则打印 "大端"，表示系统是大端字节序。

3、联合大小的计算

联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍。

union Un1
{
	char c[5];
    //5个字节 每个元素占1个字节 默认对齐数8  对齐数为1
	int i;
    //4个字节 默认对齐数8 对齐数为4
};


int main()
{
	printf("%d\n", sizeof(union Un1));
    //5不是最大对齐数的整数倍，所以5+3 = 8

	return 0;
}