【linux C】C语言中常用的几个函数的总结【一】

1、memset函数

定义变量时一定要进行初始化，尤其是数组和结构体这种占用内存大的数据结构。在使用数组的时候经常因为没有初始化而产生“烫烫烫烫烫烫”这样的野值，俗称“乱码”。
每种类型的变量都有各自的初始化方法，memset() 函数可以说是初始化内存的“万能函数”，通常为新申请的内存进行初始化工作。它是直接操作内存空间，mem即“内存”（memory）的意思。该函数的原型为：

# include <string.h>
void *memset(void *s, int c, unsigned long n);

函数的功能是：将指针变量 s 所指向的前 n 字节的内存单元用一个“整数” c 替换，注意 c 是 int 型。s 是 void* 型的指针变量，所以它可以为任何类型的数据进行初始化。

memset() 的作用是在一段内存块中填充某个给定的值。因为它只能填充一个值，所以该函数的初始化为原始初始化，无法将变量初始化为程序中需要的数据。用memset初始化完后，后面程序中再向该内存空间中存放需要的数据。

memset 一般使用“0”初始化内存单元，而且通常是给数组或结构体进行初始化。一般的变量如 char、int、float、double 等类型的变量直接初始化即可，没有必要用 memset。如果用 memset 的话反而显得麻烦。

当然，数组也可以直接进行初始化，但 memset 是对较大的数组或结构体进行清零初始化的最快方法，因为它是直接对内存进行操作的。

这时有人会问：“字符串数组不是最好用'\0'进行初始化吗？那么可以用 memset 给字符串数组进行初始化吗？也就是说参数 c 可以赋值为'\0'吗？”

可以的。虽然参数 c 要求是一个整数，但是整型和字符型是互通的。但是赋值为 '\0' 和 0 是等价的，因为字符 '\0' 在内存中就是 0。所以在 memset 中初始化为 0 也具有结束标志符 '\0' 的作用，所以通常我们就写“0”。

memset 函数的第三个参数 n 的值一般用 sizeof() 获取，这样比较专业。注意，如果是对指针变量所指向的内存单元进行清零初始化，那么一定要先对这个指针变量进行初始化，即一定要先让它指向某个有效的地址。而且用memset给指针变量如p所指向的内存单元进行初始化时，n 千万别写成 sizeof(p)，这是新手经常会犯的错误。因为 p 是指针变量，不管 p 指向什么类型的变量，sizeof(p) 的值都是 4。

下面举例说明此处容易出现的问题：

 1 # include <stdio.h>
 2 # include <string.h>
 3 int main(void)
 4 {
 5     int i;  //循环变量
 6     char str[10];
 7     char *p = str;
 8     memset(str, 0, sizeof(str));  //只能写sizeof(str), 不能写sizeof(p)
 9     for (i=0; i<10; ++i)
10     {
11         printf("%d\x20", str[i]);
12     }
13     printf("\n");
14     return 0;
15 }

根据memset函数的不同，输出结果也不同，分为以下几种情况：
memset(p, 0, sizeof(p));  //地址的大小都是4字节
0 0 0 0 -52 -52 -52 -52 -52 -52

memset(p, 0, sizeof(*p));  //*p表示的是一个字符变量, 只有一字节
0 -52 -52 -52 -52 -52 -52 -52 -52 -52

memset(p, 0, sizeof(str));
0 0 0 0 0 0 0 0 0 0

memset(str, 0, sizeof(str));
0 0 0 0 0 0 0 0 0 0

memset(p, 0, 10);  //直接写10也行, 但不专业
0 0 0 0 0 0 0 0 0 0

2、gets函数

从键盘输入字符串是使用 scanf 和 %s。其实还有更简单的方法，即使用 gets() 函数。该函数的原型为：

# include <stdio.h>
char *gets(char *str);

这个函数很简单，只有一个参数。参数类型为 char* 型，即 str 可以是一个字符指针变量名，也可以是一个字符数组名。

gets() 函数的功能是从输入缓冲区中读取一个字符串存储到字符指针变量 str 所指向的内存空间。

下面将前面中使用 scanf 输入字符串的程序改一下：

# include <stdio.h>
int main(void)
{
    char str[20] = "\0";  //字符数组初始化\0
    printf("请输入字符串：");
    gets(str);
    printf("%s\n", str);
    return 0;
}

输出结果是：
请输入字符串：i love you
i love you

可见，gets() 函数不仅比 scanf 简洁，而且，就算输入的字符串中有空格也可以直接输入，不用像 scanf 那样要定义多个字符数组。也就是说:

gets(str);

完全可以取代:

scanf("%s", string);

不仅代码更简洁，而且可以直接输入带空格的字符串。对字符指针变量所指向的内存单元进行初始化也可以用 gets()，例如线面的程序，将 scanf 换成 gets()：

 1 # include <stdio.h>
 2 int main(void)
 3 {
 4     char str[30];
 5     char *string = str;  //一定要先将指针变量初始化
 6     printf("请输入字符串：");
 7     gets(string);  //也可以写成gets(str);
 8     printf("%s\n", string);  //输出参数是已经定义好的“指针变量名”
 9     return 0;
10 }

输出结果是：
请输入字符串：Hi i...like you
Hi i...like you

此外，关于使用 gets() 函数需要注意：使用 gets() 时，系统会将最后“敲”的换行符从缓冲区中取出来，然后丢弃，所以缓冲区中不会遗留换行符。这就意味着，如果前面使用过 gets()，而后面又要从键盘给字符变量赋值的话就不需要吸收回车清空缓冲区了，因为缓冲区的回车已经被 gets() 取出来扔掉了。下面写一个程序验证一下：

 1 # include <stdio.h>
 2 int main(void)
 3 {
 4     char str[30];
 5     char ch;
 6     printf("请输入字符串：");
 7     gets(str);
 8     printf("%s\n", str);
 9     scanf("%c", &ch);
10     printf("ch = %c\n", ch);
11     return 0;
12 }

输出结果是：
请输入字符串：i love you
i love you
Y
ch = Y

我们看到，没有清空缓冲区照样可以输入'Y'，因为 gets() 已经将缓冲区中的回车取出来丢掉了。如果前面使用的不是 gets() 而是 scanf，那么通过键盘给 ch 赋值前就必须先使用 getchar() 清空缓冲区。

这里补充一下getchar的相关知识：

C中的getchar()和EOF的行为：转自 https://www.cnblogs.com/QLinux/articles/2465329.html

大师级经典的著作，要字斟句酌的去读，去理解。以前在看K&R的The C Programming Language(Second Edition)中第1.5节的字符输入/输出，很迷惑getchar()和EOF的行为。因此,感觉很有必要总结一下，不然，很多琐碎的知识点长时间过后就会淡忘的，只有写下来才是最好的方法。

一、对getchar的两点总结：

1. getchar是以行为单位进行存取的。
当调用getchar函数读取输入时，只有当输入字符为换行符'/n'或文件结束符EOF时，getchar才会停止执行，整个程序将会往下执行。并且，如果输入行是以EOF结束的（EOF之前不是换行符），则EOF会被“吃掉”（即不会被getchar读取到）。譬如下面程序段：

1 while((c = getchar()) != EOF)
2 {
3     putchar(c);
4 }

执行程序，输入：abc，然后回车。则程序就会去执行puchar(c)，然后输出abc和一个回车。然后可以继续输入，再次遇到换行符的时候，程序又会把那一行的输入的字符输出在终端上。令人迷惑的是，getchar不是以字符为单位读取的吗？那么，既然我输入了第一个字符a，肯定满足while循环(c = getchar()) != EOF的条件，那么应该执行putchar(c)在终端输出一个字符a。但是程序就偏偏不这样执行，而是必需读到一个换行符或者文件结束符EOF才进行一次输出。

造成这种结果的一种解释是，输入终端驱动处于一次一行的模式下。也就是虽然getchar()和putchar()确实是按照每次一个字符进行的。但是终端驱动处于一次一行的模式，它的输入只有到'/n'或者EOF时才结束。在本例中，程序段调用了getchar函数，则控制权从程序段转移到getchar函数，而getchar函数要依赖于操作系统的驱动来读取输入，没遇到换行符或者EOF，驱动不会通知getchar函数，getchar函数处于“阻塞”状态。而遇到换行符或者EOF后，getchar函数解除“阻塞”，读取一个字符，控制权返回程序段，执行putchar函数，循环执行。直到遇到EOF字符或者这行输入全部处理完。

2. getchar()的返回值一般情况下是非负值，但也可能是负值，即返回EOF。这个EOF在函数库里一般定义为-1。正确的定义方法如下(K&R C中特别提到了这个问题)：

int c;
c = getchar();

二、EOF的两点总结(主要指普通终端中的EOF)
1. EOF作为文件结束符时的情况：

EOF虽然是文件结束符，但并不是在任何情况下输入Ctrl+D(Windows下Ctrl+Z)都能够实现文件结束的功能，只有在下列的条件下，才作为文件结束符。
(1)遇到getcahr函数执行时，要输入第一个字符时就直接输入Ctrl+D；
(2)在前面输入的字符为换行符时，接着输入Ctrl+D；
(3)在前面有字符输入且不为换行符时，要连着输入两次Ctrl+D，这时第二次输入的Ctrl+D起到文件结束符的功能，至于第一次的
Ctrl+D作为行结束符（如1.1所讲）。

其实，这三种情况都可以总结为只有在getchar()提示新的一次输入时，直接输入Ctrl+D才相当于文件结束符。

2. EOF作为行结束符时的情况，这时候输入Ctrl+D作为行结束的标志能结束getchar()的“阻塞”，使getchar()逐个字符读入，但是EOF会被“吃掉”，并不会被读取。

以上面的代码段为例，如果执行时输入abc，然后 Ctrl+D，程序输出结果为：
abcabc

（第一组为输入第二组为输出）

注意:第一组abc是你从终端输入的，然后输入Ctrl+D，getchar逐个字符读取并逐个输出打印出第二组abc，同时光标停在第二组字符的c后面，然后可以进行新一次的输入。这时如果再次输入Ctrl+D，就会起到了文件结束符的作用，因为EOF是一行输入的第一个字符。如果输入abc之后，然后回车，输入换行符的话，则终端显示为：
abc'/n'
abc'/n'
//第三行

其中第一行为你是终端输入的，第二行是终端输出（含换行符），光标停在了第三行处，等待新一次的终端输入。从这里也可以看出Ctrl+D和换行符分别作为行结束符时，输出的不同结果。

1 while((c = getchar()) != EOF)
2 {
3     putchar(c);
4 }

其实，这三种情况都可以总结为只有在getchar()提示新的一次输入时，直接输入Ctrl+D才相当于文件结束符。

以上面的代码段为例，如果执行时输入abc，然后 Ctrl+D，程序输出结果为：
abcabc

（第一组为输入第二组为输出）

【linux C】C语言中常用的几个函数的总结【一】

猜你喜欢