【C语言进阶剖析】30、C语言中的字符串

1 字符串的概念

  • 字符串是有序字符的集合
  • 字符串是程序的基本元素之一
  • C 语言中没有字符串的概念
    • C 语言中通过特殊的字符数组模拟字符串
    • C 语言中的字符串是以 ‘\0’ 结尾的字符数组

1.1 字符数组与字符串

在 C 语言中,双引号引用的单个或多个字符是一种特殊的字面量

  • 存储于程序的全局只读存储区
  • 本质为字符数组,编译器自动在结尾加上 ‘\0’ 字符

下一个下面哪些是字符串的定义?
在这里插入图片描述
我们现在分析一下,字符串就是一个字符数组,在末尾加上 ‘\0’。

  • 数组 ca 是一个字符数组,没有以 ‘\0’ 结尾,所以不是字符串;
  • sa 是以 ‘\0’ 结尾的字符数组,所以是字符串;
  • “Hello world!” 是一个字符数组,我们用一个字符数组去初始化 字符数组 ss,这在 C 语言中是合法的,编译器会自动在 “Hello world!” 末尾加上 ‘\0’ ,所以 ss 是字符串;
  • 用一个指针去指向字符数组,我们不是经常这么干嘛,str 是字符串。

下面我们用编译器验证一下我们的分析:

// 30-1.c
#include<stdio.h>
int main()
{
    char ca[] = {'H', 'e', 'l', 'l', 'o'};
    char sa[] = {'W', 'o', 'r', 'l', 'd', '\0'};
    char ss[] = "Hello world!";
    char* str = "Hello world!";

    printf("%s\n", ca);
    printf("%s\n", sa);
    printf("%s\n", ss);
    printf("%s\n", str);
    return 0;
}

编译运行结果如下:

$ gcc 30-1.c -o 30-1
$ ./30-1
HelloWorld
World
Hello world!
Hello world!

可以看到 ca 打印的结果是不对的,sa,ss,str 打印的结果是完全正确的,所以 ca 是一个字符数组,sa,ss,str 是字符串。

1.2 小秘密

  • 字符串字面量本质是一个数组
  • 字符串面量可以看作常量指针
  • 字符串字面量中字符不可改变(因为存储在全局只读存储区)
  • 字符串字面量至少包含一个字符(至少包含 ‘\0’)

2 字符串字面量

字符串字面量是一个字符数组,比如 “Hello World!” 就是一个无名的字符数组

请看下面的表达式合法吗?
在这里插入图片描述
上面的写法看起来都比较奇怪,对一个字符串字面量进行下标运算,和整数进行加法运算,对空字符串解引用,我们用编译器验证一下:

// 30-2.c
#include<stdio.h>
int main()
{
    char b = "abc"[0];
    char c = *("123" + 1);
    char t = *"";

    printf("%c\n", b);
    printf("%c\n", c);
    printf("%d\n", t);

    printf("%s\n", "Hello\0Hello");
    printf("%p\n", "World");
    return 0;
}
$ gcc 30-2.c -o 30-2
$ ./30-2
a
2
0
Hello
0x564cf963e7a8

对于上面的结果,“abc”[0] 等于取字符串第一个字符,*(“123” + 1); 是取字符串第 2 个字符,*"" 是对空字符串第一个字符解引用,,第一个字符是 ‘\0’,我们打印的是 %p,是打印对应的ASCII 码, ‘\0’ 对应的 ASCII 是 0。
字符串的是以 ‘\0’ 作为结束标志的, ‘\0’ 之后的内容不属于该字符串,所以 printf("%s\n", “Hello\0Hello”); 语句会打印出 Hello

3 字符串的长度

  • 字符串的长度就是字符串所包含字符的个数
  • 字符串长度指的是第一个 ‘\0’ 字符前出现的字符个数
  • 通过 ‘\0’ 结束符来确定字符串的长度
  • 函数 strlen 用于返回字符串的长度

下面看一个 strlen 使用的例子

// 30-3.c
#include<stdio.h>
#include<string.h>
int main()
{
    char s[] = "Hello\0world";
    for (int i = 0; i < sizeof(s)/ sizeof(s[0]); i++)
    {
        printf("%c\n", s[i]);
    }
    printf("%s\n", s);
    printf("%ld\n", strlen(s));
    printf("%ld\n", strlen("123"));
    return 0;
}

编译运行,结果如下:

$ gcc 30-3.c -o 30-3
$ ./30-3
H
e
l
l
o

w
o
r
l
d

Hello
5
3

可以看到打印数组 s 的元素时,所有的元素打印出来了,两个空行分别是两个 ‘\0’,一个在中间,一个是编译器自己加上的 ‘\0’,但是打印字符串 s 时,字符串的结束标志是 ‘\0’,所以只打印了 Hello。同样的,字符串长度是第一个 ‘\0’ 字符前出现的字符个数,字符串 s 的长度是 5。

4 小结

1、C 语言中通过字符数组模拟字符串
2、C 语言中的字符串使用 ‘\0’ 作为结束符
3、字符串字面量的本质为字符数组
4、字符串相关函数都依赖于结束符 ‘\0’

发布了248 篇原创文章 · 获赞 115 · 访问量 9万+

猜你喜欢

转载自blog.csdn.net/happyjacob/article/details/103358206