C进阶:自定义类型:结构体、枚举、联合体

自定义类型:结构体、枚举、联合体

结构体

结构的定义:

结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。

我们再回想一下数组是怎么定义的:一些相同类型值的集合。而结构体类型是可以放不同类型的变量的。

结构体的声明:

最简单的声明是这样的:

//例如描述一个学生
struct Stu 
{
    
    
	char name[20];
	int age;
	char sex[10];
}s1,s2;//注意最后分号不能省略

但是你可能还见过这样的形式:

typedef struct Stu
{
    
    
	char name[20];
	int age;
	char sex[10];
}Stu;

其实这两种写法都正确,区别在于:

image-20230113152021815

并且s1和s2是两个全局变量。

特殊的声明(匿名)

还有一种匿名结构体类型,我们只用一次以后就不需要的话,可以不给它命名,

//匿名结构体类型
struct
{
    
    
int a;
char b;
float c;
}x;
struct
{
    
    
int a;
char b;
float c;
}a[20], *p;  

但是需要注意的是如果这时候你写这样一句代码:

p=&x

这样绝对是错误的,因为这是两个完全不同的结构体类型,即使它们成员一模一样,定义一个结构体就是一个单独的类型。

匿名结构体使用还是比较少的,并不常见,了解即可。

结构体的自引用:

结构体的自引用也是一个需要注意的点,先来看错误的写法:

//代码1
struct Node
{
    
    
	int data;
	struct Node next;
};
//可行否?
//如果可以,那sizeof(struct Node)是多少?

这是我们最直观的想法,但其实这样是错误的,为什么呢?我们可以来分析一下:

image-20230113154859432

所以我们正确的结构体自引用方式是通过指针:

//代码2
struct Node
{
    
    
int data;
struct Node* next;
};  

结构体变量的定义和初始化

结构体变量的怎么进行定义和初始化呢?

#include <stdio.h>
struct Point
{
    
    
	int x;
	int y;
}s1 = {
    
    0,0};//第一种
struct Point s2 = {
    
     0,0 };//第二种
int main()
{
    
    
	struct Point s3 = {
    
     1,2 };//第三种
	return 0;
}

以上是最简单的方式,如果结构体比较复杂:

cstruct Point
{
    
    
	int x;
	int y;
};
struct S
{
    
    
	int num;
	char a;
	struct Point b;
	float c;
};
int main()
{
    
    
	struct S s4 = {
    
     1,'w',{
    
    3,4},3.14f };//按顺序初始化
	struct S s5 = {
    
     .a = 'w',.b.x = 5,.b.y = 6,.c = 3.14f,.num = 7 };//乱序
	return 0;
}

结构体内存对齐

结构体内存对齐可以说是结构体这块的重点了,也是考察最多的地方,一般用来计算结构体大小,我们先来看一个例子:

//练习1
struct S1
{
    
    
	char c1;
	int i;
	char c2;
};
//练习2
struct S2
{
    
    
	char c1;
	char c2;
	int i;
};
int main()
{
    
    
	printf("%d\n", (int)sizeof(struct S1));
	printf("%d\n", (int)sizeof(struct S2));
	return 0;
}

输出结果:image-20230113163311018

看起来结构体大小似乎并不像我们想象中的那样简单的每个成员大小之和,然后我们就来看一下到底是什么原因呢?

我们先来看一下结构体内存对齐的规则:

image-20230113164352954

这四句话是一定要加上自己的理解去记忆,我们下面来举例解释,看上述引例:

image-20230113170351767

上面就是我们画图来解释,最直观的就是画图来理解,再次阅读上面结构体内存对齐规则,理解着来进行记忆。

可以看出为了内存对齐我们还是浪费了不少空间的,那么为什么要有内存对齐呢?

为什么要有内存对齐

其实无非就两种原因:

  • 平台原因(移植原因):
    不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
  • 性能原因:
    数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

总的来说:内存对齐就是一种拿空间换时间的做法

在设计结构体的时候,我们既要满足对齐,又要节省空间, 我们最好让占用空间小的成员尽量在一起。

修改默认对齐数

有时候默认对齐数不满足我们的要求的时候我们就需要修改默认对齐数,怎么修改呢,\#pragma 这个预处理指令 就要派上用场了,

修改默认对齐数的方式是这样的:

#pragma pack(num)

num为默认对齐数。

我们也可以验证一下,例如:

#pragma pack(1)
struct S1
{
    
    
	char c1;
	int i;
	char c2;
};

int main()
{
    
    
	printf("%d\n", (int)sizeof(struct S1));
	return 0;
}c

看结果其实是成功了:image-20230113171838558

结构体传参

其实函数传参无非就传值调用和传址调用,这两种我们怎么选择呢?

//结构体传参
void print1(struct S s)
{
    
    
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
    
    
printf("%d\n", ps->num);
}
int main()
{
    
    
print1(s); //传结构体
print2(&s); //传地址
return 0;
}  

答案是:首选传址调用

原因:函数传参是需要压栈的,那么就必然会有时间和空间上的开销,如果传递结构体过大,就会造成系统性能下降。

位段

位段的定义

位段的声明和结构是类似的,有两个不同:

1.位段的成员必须是 int、unsigned int 或signed int

2.位段的成员后跟一个冒号和数字(数字代表指定占用的空间大小)

struct A
{
    
    
	int a : 2;
	int b : 5;
	int c : 10;
	int d : 30;
};
int main()
{
    
    
	printf("%d\n", (int)sizeof(struct A));
	return 0;
}

输出:image-20230113175115575

如果没有使用位段结构的话,结构体大小应该是16字节,但是使用位段结构变成了8字节。

因为我们指定了结构体成员占用多少位,有些数据用4或5位就能有效存储数据,没有必要直接占用1个整型空间。这时候使用位段就能够起到节省空间的作用。

位段的内存分配

  • 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
  • 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
  • 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

一个例子:

位段的内存分配实际上C语言没有标准规定,但是我们可以用一个例子来看一下我们当前vs环境下的内存是怎样分配的。

//一个例子
struct S
{
    
    
char a:3;
char b:4;
char c:5;
char d:4;
};
struct S s = {
    
    0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
//空间是如何开辟的?  

image-20230113182257379

这样吗就理解了位段结构的内存分配。

位段的跨平台问题

  • int 位段被当成有符号数还是无符号数是不确定的。
  • 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
  • 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
  • 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。

总结:跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。

位段的应用

image-20230113182611165

我们的网络传输用位段还是比较多的,有些部分并不需要那么多的空间即可完成封装,这时候用位段可以很好的节省空间,避免网络传输过程中的“堵塞”问题。

枚举

枚举类型的定义

enum Day//星期
{
    
    
Mon,
Tues,
Wed,
Thur,
Fri,
Sat,
Sun
};
enum Sex//性别
{
    
    
MALE,
FEMALE,
SECRET
}enum Color//颜色
{
    
    
RED,
GREEN,
BLUE
};  

像这样的enum Day,enum Sex等都是一种类型,我们可以用他们来定义变量,{}内部都是枚举常量,枚举常量也是常量,这些常量都是有值的,默认第一个值为0,向下一次递增。

我们也可以进行初始化:

enum Color//颜色
{
    
    
RED=1,
GREEN=2,
BLUE=4
};  

枚举的优点

我们可以使用 #define 定义常量,为什么非要使用枚举?
枚举的优点:

  1. 增加代码的可读性和可维护性
  2. 和#define定义的标识符比较枚举有类型检查,更加严谨。
  3. 防止了命名污染(封装)
  4. 便于调试
  5. 使用方便,一次可以定义多个常量

其实前两个优点是比较明显好理解的,其他优点我们只能以后写的多了才能明显体会到。

枚举的使用

enum Color//颜色
{
    
    
RED=1,
GREEN=2,
BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异  

注意:只能拿枚举常量给枚举变量赋值,才不会出现类型的差异 ,在C语言中检查没有太严格,但是在C++中这种类型不一致你去赋值的话会直接报错。

联合体(共用体)

联合类型的定义

联合也是一种特殊的自定义类型,这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体)。

//联合体类型声明
union UN
{
    
    
	char a;
	int i;
};
//联合体变量定义
union UN un;
//联合体变量大小计算
printf("%d\n", sizeof(un));

联合的特点

联合体的特点是成员共用一块空间,这样的话,联合体大小至少是联合体最大成员的大小。

我们来看一个示例:

union UN
{
    
    
	int i;
	char a;
};

int main()
{
    
    
	union UN un;
    printf("%d\n",sizeof(un));
	printf("%p\n", &un);
	printf("%p\n", &(un.a));
	printf("%p\n", &(un.i));
	return 0;
}

输出:image-20230113194142095

可以看到三个地址是一样的,并且un的大小为4,这样就验证了a和i确实是共用一块地址的,并且共同占用4个字节。那么实际内存中是怎么存放的呢?我们看下图。

image-20230113194543623

联合大小的计算

可能你会注意到上面联合类型的大小为什么是4呢?难道一定就是最大成员的大小吗?其实不是的,联合体也存在一定的对齐。

image-20230113195036490

举例:

union Un1
{
    
    
	char c[5];
	int i;
};
union Un2
{
    
    
	short c[7];
	int i;
};
int main()
{
    
    
	printf("%d\n", sizeof(union Un1));
	printf("%d\n", sizeof(union Un2));
	return 0;
}

输出:image-20230113195300635

根据计算规则计算即可。
以上就是自定义类型:结构体类型、枚举类型、联合体类型的全部内容介绍。

猜你喜欢

转载自blog.csdn.net/weixin_73223794/article/details/128679004