【C语言】字符串函数探幽

目录

1、strcpy()

a)如果src长度大于dest会发生什么?

i.执行到strcpy函数之前,查看a和b的值和内存:

ii、执行strcpy,观察内存

iii、得出结论

b)如果src长度小于dset呢?

c)手写strcpy

d)总结

2、strlen()

3、strcat()

最近学习C++时遇到了字符串的问题,结合之前的面试题深入分析下。

字符串库函数有strcpy、strlen、strstr等,可以参见C语言字符串操作总结大全

1、strcpy()

strcpy():char *strcpy(char* dest, const char *src);返回指向dset的指针

strcpy()被认为是不安全的函数,因为它的函数实现非常简单,没有考虑异常情况。下面考虑两种情况:

a)如果src长度大于dest会发生什么?

linux man page里面提到了这个BUG:

If the destination string of a strcpy() is not large enough, then anything might happen. Overflowing fixed-length string buffers is a favorite cracker technique for taking complete control of the machine. Any time a program reads or copies data into a buffer, the program first needs to check that there's enough space. This may be unnecessary if you can show that overflow is impossible, but be careful: programs can get changed over time, in ways that may make the impossible possible.

大概意思是这样做固定长度的字符串就会发生溢出。如果程序没有事先检查内存空间,就会发生难以预料的事情。

写好代码:char a[2] = "a"; char b[10] = "bbbbbbbb";  auto p=strcpy(a, b);  在VS断点调试,步骤如下:

i.执行到strcpy函数之前,查看a和b的值和内存:

发现VS编译器以16进制数c来作为未被使用的内存,a后面还有6字节的空内存。

ii、执行strcpy,观察内存

发现a虽然只有2个字节的内存,但是后面的内存都被覆盖掉了(对比上下两图可以发现值为9f的这个内存被覆盖成00了,其他的CC被62填充)

iii、得出结论

会覆盖字符串数组之外的内存(数组越界)。假设数组b无限大,那岂不是把整个堆都覆盖掉了?果然这个函数非常危险,要改用strncpy()。

b)如果src长度小于dset呢?

src从头到\0都被复制到dset中,dest多余的部分没有变化(右图)。这种情况没什么问题。

c)手写strcpy

发现网上大家的代码都没能解决数组越界的问题,我加了一行代码 if (*dst == '\0') break; 目前看来没什么问题。

char* my_strcpy(char *dst, const char *src) {
	assert(dst != NULL && src != NULL);//断言输入不为空,空则调用abort()异常终止进程
	char *ret = dst;
	while ((*dst = *src) != '\0') {
		dst++;
		src++;
		if (*dst == '\0') break;//如果此时目标数组已经结束,就不用继续复制了
	}
	return ret;
}

调试发现运行结束时不会覆盖dst后面的内存了。

d)总结

在一本面试书上看到过,说这个函数是MS考虑到普适性,故意写的很简单。不过这个问题也很老了,只是凭兴趣研究下。总结起来就是程序员要注意内存溢出的问题,特别在使用指针的时候,这种小问题很可能会导致一些重大安全问题。

2、strlen()

size_t  __cdecl strlen(const char * s){
    int i = 0;
    while( *s ) {
        i++;
        s++;
    }
    return i;
}

3、strcat()

char * __cdecl strcat(char * dst, const char * src){
    char *p = dst;
    while( *p )
        p++;
    while( *p ++ = *src ++ )
        ;
    return dst;
}

4、strcmp()

int strcmp(const char *str1, const char *str2){
   int ret=0;
   while( !(ret = *(unsigned char*)str1 - *(unsigned char*)str2 ) && *str1 )
     {
       str1++;
       str2++;
     }
     if(ret < 0)
        return -1;
     else if(ret > 0) 
        return 1;
     return 0;    
 }

猜你喜欢

转载自blog.csdn.net/Protocols7/article/details/85684702