C语言自定义类型(结构体,枚举,联合)的学习总结

结构体

结构的基础知识

结构是一些值的集合,这些值称为它的成员,一个结构的各个成员可能具有不同的类型。每个结构成员都有自己的名字,它们是通过名字访问的。
结构的声明
在声明结构时,必须列出它包含的所有成员。这个列表包括每个成员的类型和名字。

struct tag
{
     member-list;
}variable-list;

tag是结构体标签;member-list是成员列表;variable-list是变量列表。
例如描述一个学生:

struct Stu
{
        char name[20];//名字
        int age;//年龄
        char sex[5];//性别
        char id[20];//学号
};//分号不能丢

Stu是标签。标签字段允许为成员列表提供一个名字,这样它就可以在后续的声明中使用。标签允许多个声明使用同一个成员列表,并且创建同一种类型的结构。上面这个声明把标签Stu和这个成员列表联系在一起。该声明并没有提供变量列表,所以它并未创建任何变量。
标签标识了一种模式,用于声明未来的变量,但无论是标签还是模式本身都不是变量。

struct Stu x;
struct Stu y[20],*z;

这些声明使用标签来创建变量。而x,y,z都是同一种类型的结构变量。

特殊的声明

在声明结构的时候,可以不完全声明。
这里有几个例子:

struct {
         int   a;
         char  b;
         float c;
       }x;

这个声明创建了一个名叫x的变量,它包含三个成员:一个整数、一个字符和一个浮点数。

struct {
         int   a;
         char  b;
         float c;
       }y[20],*z;

这个声明创建了y和z。y是一个数组,它包含了20个结构。z是一个指针,它指向这个类型的结构。
注意:
这两个声明被编译器当作两种截然不同的类型,即使它们的成员列表完全相同。因此,变量y和z的类型和x的类型不同,所以下面这条语句是非法的。

z=&x;//非法

结构的成员
结构的成员可以是标量、数组、指针,甚至是其他结构体。
例如:

struct COMPLEX
{
       float  f;
       int    a[20];
       long   *lp;
       srtuct Stu  s;
       srtuct Stu  sa[10];
       srtuct Stu  *sp;
};

结构体成员的访问

  • 结构变量的成员是通过点操作符(.)访问的。(直接访问)
    点操作符接受两个操作数,左操作数就是结构变量的名字,右操作数就是需要访问的成员的名字。这个表达式的结果就是指定的成员。看下面的这个声明:
struct COMPLEX comp;

名字为a的成员是一个数组,所以表达式comp.a就选择了这个成员。这个表达式的结果是个数组名,所以你可以把它用在任何可以使用数组名的地方。
成员s是个结构,所以表达式comp.s的结果是个结构名,它可以用于任何可以使用普通结构变量的地方。尤其是,我们可以把这个表达式用作另一个点操作符的左操作符,如(comp.s).age,选择结构comp的成员s的成员age。点操作符的结合性时从左向右,所以可以省略括号,表达式comp.s.a表示同样的意思。

  • 箭头操作符( 间接访问)
    和点操作符一样,箭头操作符接受两个操作数,但左操作符必须是一个指向结构的指针,箭头操作符对左操作数执行间接访问取得指针所指向的结构,然后和点操作符一样,根据右操作数选择一个指定的结构成员。
    例如:
struct S
{
     char name[20];
     int age;
}s;
void print(struct S* ps)
{
     printf("name = %s   age = %d\n", (*ps).name, (*ps).age); 
     printf("name = %s   age = %d\n", ps->name, ps->age); 

结构的自引用

在一个结构体内部包含一个类型为该结构本身的成员是否可以呢?看一个例子

struct Node
{
     int data;
     struct Node next;
}; 

这种类型的自引用是非法的,因为成员next是另一个完整的结构,其内部还将包含它自己的成员next。这第二个成员又是另一个完整的结构,它还将包含它自己的成员next。这样下去永无止境。但下面这个声明是合法的:

struct Node
{
     int data;
     struct Node* next;
}; 

这个声明和前面那个声明的区别在于next现在是一个指针而不是结构。编译器在结构的长度确定之前就已经知道指针的长度,所以这种自引用是合法的。
注意
警惕下面这个陷阱

typedef struct
{
    int data;
    Node* next;
}Node;    

这个声明的目的是为了这个结构创建类型名 Node 。但是,他失败了。类型名直到声明的末尾才定义,所以在结构声明的内部它尚未定义。
解决方法就是定义一个结构标签来声明next,如下:

typedef struct Node
{
    int data;
    struct Node* next;
}Node; 

不完整声明

如果每个结构都引用了其他结构的标签,哪个结构应该首先声明呢?这个问题的解决方案是使用不完整声明,它声明一个作为结构标签的标识符。然后,我们可以把这个标签用在不需要知道这个结构的长度的声明中,如声明指向这个结构的指针。接下来的声明把这个标签与成员列表联系在一起。例如:

struct A
{
     int _a;
     struct B* pb;
};
struct B
{
      int _b;
      struct A* pa;
};           

解决方案:

struct B;
struct A
{
     int _a;
     struct B* pb;
};
struct B
{
      int _b;
      struct A* pa;
};  

结构体变量的定义和初始化

有了结构体类型,那如何定义变量?其实很简单。

struct Point
{
      int x;
      int y;
}p1;//声明类型的同时定义变量p1
struct Point p2;//定义结构体变量p2

//初始化:定义变量的同时赋初值
struct Point p3 = {x,y};

struct Stu    //类型声明
{
      char name[15];//名字
      int age;//年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node
{
        int data;
        struct Point p;
        struct Node* next;
}n1 = {10,{4,5},NULL};          //结构体嵌套初始化
struct Node n2 = {20,{5,6},NULL};//结构体嵌套初始化

结构体内存对齐

先举个例子

int main()
{
    struct S1
    {
        char c1;
        int i;
        char c2;
    };
    printf("%d\n", sizeof(struct S1));
    system("pause");
    return 0;
}

这里写图片描述
这是如何算的呢?
要计算结构体大小就要知道结构体的对齐规则:
1. 第一个成员在与结构体变量偏移量为0的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。VS中默认值是8,Linux中的默认值是4.
3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
画图再对上面的例子深入理解:
这里写图片描述
图中c1在偏移量为0处,i的对齐数是4,所以要对齐到4的倍数处,即到4,c2对齐数位1,所以连着i放,放完占了9处,结构体总大小为最大对齐数的整数倍,即4的倍数,故总大小位12。
是不是很简单呢?
学会了对齐规则,那为什么会存在内存对齐呢?
大部分的参考书都是这样说的:
1.平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的,某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2.性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问,而对齐的内存访问仅需要一次访问。
总体来说
结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占空间小的成员尽量集中在一起!例如:

int main()
{
    struct S2
    {
        char c1;
        char c2;
        int i;
    };
    printf("%d\n", sizeof(struct S2));
    system("pause");
    return 0;
}

这个跟上面那段代码一样,只是调整了成员位置,看结果:
这里写图片描述

很明显的节省了空间!

修改默认对齐数

#pragma pack(8)//设置默认对齐数为8
struct S1
{
    char c1;
    int i;
    char c2;
};
#pragma pack()//取消设置的默认对齐数。还原为默认

#pragma pack(1)//设置默认对齐数为1
    struct S2
    {
        char c1;
        int i;
        char c2;
    };
#pragma pack()//取消设置的默认对齐数。还原为默认
    int main()
    {
        printf("%d\n", sizeof(struct S1));
        printf("%d\n", sizeof(struct S2));
        system("pause");
        return 0;
    }

这里写图片描述

结论
结构在对齐方式不合适的时候,我们可以自己更改默认对齐数 。

结构体传参

结构体传参可以传结构体对象,也可以传结构体地址,所以是不是随便传哪一种都可以?
先看代码:

struct S
{
    int data[1000];
    int num;
};
struct S s = { { 1, 2, 3, 4 }, 1000 };
//结构体传参
void print1(const struct S s)
{
    printf("%d\n", s.num);
}
//结构体地址传参
void print2(const struct S* ps)
{
    printf("%d\n", ps->num);
}
int main()
{
    print1(s);//传结构体
    print2(&s);//传地址
    system("pause");
    return 0;
}

这两种方式哪种更好一些?
答案首选print2函数。因为函数传参的时候。参数是需要压栈的。如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下降。
所以,结构体传参的时候,要传结构体的地址。

位段

位段的声明和结构类似,但它的成员是一个或多个位的字段。这些不同长度的字段实际上存储于一个或多个整形变量中。位段的声明和任何普通的结构成员声明相同,但有两个例外。
首先,位段成员必须声明位int,signed int,unsigned int 类型。其次,在成员名的后面是一个冒号和一个整数,这个整数指定该位段所占用的位的数目。
比如:

struct A
{
      int _a:2;
      int _b:5;
      int _c:10;
      int _d:30;
};     

A就是一个位段类型。
那位段A的大小是多少?

printf("%d\n", sizeof(struct A));

结果是8,这又是怎么算的呢?这就涉及到了位段的内存分配。
画图理解:
这里写图片描述

位段的内存分配

1.位段的成员可以是int,unsigned int,signed int或者char(属于整形家族)类型。
2.位段的空间上是按照需要以4个字节(int)或者1个字节(char)的方式来开辟的。
3.位段涉及很多不确定因素,位段是不跨平台的,注重可移植性的程序应该避免使用位段。

位段的跨平台问题

1.int位段被当成有符号数还是无符号数是不确定的。
2.位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。)
3.位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4.当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。

枚举

枚举顾名思义就是一一列举

枚举类型的定义

例如:

enum Day//星期
{
    Mon,
    Tues,
    Wed,
    Thur,
    Fri,
    Sat,
    Sun
};
enum Sex//性别
{
      MALE,
      FEMALE,
      SECRET
};

以上定义的enum Day,enum Sex都是枚举类型。
{}中的内容是枚举类型的可能取值,也叫枚举常量。这些可能取值都是有值的,默认从0开始,依次递增1,当然在定义的时候也可以赋初值。
例如:

enum Color//颜色
{
     RED = 1,
     GREEN = 2,
     BLUE = 4
};
枚举的优点
  • 为什么使用枚举?
    我们可以使用#define定义常量,为什么非要使用枚举?
    枚举的优点:
    1.增加代码的可读性和可维护性
    2.和#define定义的标识符比较枚举有类型检查,更加严谨。
    3.防止了命名污染(封装)
    4.便于调试
    5.使用方便,一次可以定义多个常量

联合(共用体)

联合类型的定义

联合也是一种特殊的自定义类型
这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体)。
比如:

int main()
{
    //联合类型的声明
    union Un
    {
        char c;
        int i;
    };
    //联合变量的定义
    union Un un;
    //计算联合变量的大小
    printf("%d\n", sizeof(un));
    system("pause");
    return 0;
}

这里写图片描述

联合的特点

联合的成员是共用同一块内存空间的,这样的一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。

int main()
{
    union Un
    {
        int i;
        char c;
    };
    union Un un;
    //下面输出的结果是一样的吗?
    printf("%d\n", &(un.i));
    printf("%d\n", &(un.c));
    //下面输出的结果是什么?
    un.i = 0x11223344;
    un.c = 0x55;
    printf("%x\n", un.i);
    system("pause");
    return 0;
}

这里写图片描述

联合大小的计算

  • 联合的大小至少是最大成员的大小。
  • 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
    比如:
int main()
{
    union Un1
    {
        char c[5];
        int i;
    };
    union Un2
    {
        short c[7];
        int i;
    };
    //下面输出的结果是什么?
    printf("%d\n", sizeof(union Un1));
    printf("%d\n", sizeof(union Un2));
    system("pause");
    return 0;
}

这里写图片描述
联合和结构体的巧妙使用:

int main()
{
    //将long类型的IP地址,转为点分十进制的表示形式
    union ip_addr
    {
        unsigned long addr;
        struct
        {
            unsigned char c1;
            unsigned char c2;
            unsigned char c3;
            unsigned char c4;
        }ip;
    };
    union ip_addr my_ip;
    my_ip.addr = 176238749;
    printf("%d.%d.%d.%d\n", my_ip.ip.c4, my_ip.ip.c3, my_ip.ip.c2, my_ip.ip.c1);
    system("pause");
    return 0;
}

这里写图片描述
不足之处,请多多指教!

猜你喜欢

转载自blog.csdn.net/dongying_/article/details/81429805