C语言strcpy函数的使用

strcpy简单使用: 

#include <stdio.h>
#include <string.h>

struct Student {
	int sid;
	char name[20];
	int age;

} st;  //此处分号不可省略

int main(void) {

	struct Student st = {1000,"zhangsan",20};

	printf("%d  %s  %d\n", st.sid, st.name, st.age);

	st.sid = 500;
	// st.name="lisi"  //error
	strcpy(st.name,"lisi");
	st.age=20;

	while(true){}

}

头文件:#include <string.h> 和 #include <stdio.h>

功能:把从src地址开始且含有NULL结束符的字符串复制到以dest开始的地址空间

说明:src和dest所指内存区域不可以重叠且dest必须有足够的空间来容纳src的字符串。返回指向dest的指针

//C语言标准库函数strcpy的一种典型的工业级的最简实现。 
//返回值:目标串的地址。
//对于出现异常的情况ANSI-C99标准并未定义,故由实现者决定返回值,通常为NULL。
//参数:des为目标字符串,source为原字符串。
char* strcpy(char* des,const char* source) { 
 char* r=des;    
 assert((des != NULL) && (source != NULL));
while((*r++ = *source++)!='\0'); 
  return des; 
}
//while((*des++=*source++));的解释:赋值表达式返回左操作数,所以在赋值'\0'后,循环停止。

举例: 

char a[10],b[]={"COPY"};
//定义字符数组a,b
strcpy(a,b);
//将b中的COPY复制到a中

Strcpy函数中的缓冲区溢出问题和防范

C 语言和 C++语言风格轻松、灵活,语法限制宽松,因而受到各类程序员的欢迎,是比较通用的编程语言,同时也是各大院校计算机专业的基本语言课程。strcpy 函数由于不对数组边界进行检查,而非常容易造成各种缓冲区溢出的漏洞。这些漏洞很容易被利用,而造成严重的系统问题。在使用 strcpy 函数时,要小心谨慎。
以下就 Strcpy 函数中的缓冲区溢出问题和防范进行讨论。 [1] 

缓冲区溢出问题

缓冲区的溢出就是程序在动态分配的缓冲区中写入了太多的数据,使这个分配区发生了溢出。一旦一个缓冲区利用程序能将运行的指令放在有 root权限的内存中,运行这些指令,就可以利用 root 权限来控制计算机了。 [1] 

Strcpy函数的安全编码

在编程时,加入错误检查,就可及时发现错误,并且对出现的异常进行处理。在编写 strcpy 函数时,首先尽量使目的缓冲区长度足够长,另外要检测目的缓冲区和源缓冲区。如果目的缓冲区或源缓冲区是空,就要在异常处理中结束程序。如果,源字符串比目的缓冲区长度不长,也要在异常处理中结束程序,以防止出现溢出情况。任何程序都很难说是绝对安全,只能以尽可能安全的方式来处理 strcpy 函数。只要输入的字符串不以空字符结束,函数就会随时终止。这种检测容易实现。但是这样的检测也并不能确定函数一定安全。 [1] 

另外,每添加一个错误检查,就会使程序更复杂,而且可能产生很多的 bug,增加很多的工作量。最重要的是,即使设计程序时非常仔细,也有可能会忽略一些细节问题,导致不可弥补的错误。所以,在编写程序时,最安全的方法,就是尽可能不去使用 strcpy 函数。可以在程序的开头加上 #define strcpy Unsafe_strcpy。这样,就会使 strcpy 函数在编译时产生错误,从而使我们在编程时可以完全摒弃strcpy 函数。在完全丢弃 strcpy 函数的同时,也就丢掉了众多依附于 strcpy 函数的 bug。 [1]

特例说明

已知strcpy函数的原型是:

char * strcpy(char * strDest,const char * strSrc);

1.不调用库函数,实现strcpy函数。

2.解释为什么要返回char *。

不调用库函数如何实现strcpy函数

strcpy的实现代码

char * strcpy(char * strDest,const char * strSrc){
if ((NULL==strDest) || (NULL==strSrc)) 
  //[1]
  throw "Invalid argument(s)"; 
  //[2]
  char * strDestCopy = strDest; 
  //[3]
  while ((*strDest++=*strSrc++)!='\0'); 
  //[4]
  return strDestCopy;
}

错误的做法[1]:

(A)不检查指针的有效性,说明答题者不注重代码的健壮性。

(B)检查指针的有效性时使用((!strDest)||(!strSrc))或(!(strDest&&strSrc)),说明答题者对C语言中类型的隐式转换没有深刻认识。在本例中char *转换为bool即是类型隐式转换,这种功能虽然灵活,但更多的是导致出错概率增大和维护成本升高。所以C++专门增加了bool、true、false三个关键字以提供更安全的条件表达式

(C)检查指针的有效性时使用((strDest==0)||(strSrc==0)),说明答题者不知道使用常量的好处。直接使用字面常量(如本例中的0)会减少程序的可维护性。0虽然简单,但程序中可能出现很多处对指针的检查,万一出现笔误,编译器不能发现,生成的程序内含逻辑错误,很难排除。而使用NULL代替0,如果出现拼写错误,编译器就会检查出来。

错误的做法[2]:

(A)return new string("Invalid argument(s)");,说明答题者根本不知道返回值的用途,并且他对内存泄漏也没有警惕心。从函数中返回函数体内分配的内存是十分危险的做法,他把释放内存的义务抛给不知情的调用者,绝大多数情况下,调用者不会释放内存,这导致内存泄漏。

(B)return 0;,说明答题者没有掌握异常机制。调用者有可能忘记检查返回值,调用者还可能无法检查返回值(见后面的链式表达式)。妄想让返回值肩负返回正确值和异常值的双重功能,其结果往往是两种功能都失效。应该以抛出异常来代替返回值,这样可以减轻调用者的负担、使错误不会被忽略、增强程序的可维护性。

错误的做法[3]:

(A)忘记保存原始的strDest值,说明答题者逻辑思维不严密。

错误的做法[4]:

(A)循环写成while (*strDestCopy++=*strSrc++);,同[1](B)。

(B)循环写成while (*strSrc!='\0') *strDest++=*strSrc++;,说明答题者对边界条件的检查不力。循环体结束后,strDest字符串的末尾没有正确地加上'\0'。

解释为什么要返回char *

返回strDest的原始值使函数能够支持链式表达式,增加了函数的“附加值”。同样功能的函数,如果能合理地提高的可用性,自然就更加理想。

链式表达式的形式如:

int iLength=strlen(strcpy(strA,strB));

又如:

char * strA=strcpy(new char[10],strB);

返回strSrc的原始值是错误的。其一,源字符串肯定是已知的,返回它没有意义。其二,不能支持形如第二例的表达式。其三,为了保护源字符串,形参用const限定strSrc所指的内容,把const char *作为char *返回,类型不符,编译报错。

在上面的语句中,循环语句

while ((*strDestCopy++=*strSrc++)!='\0');

较难理解,可以把这句理解为以下操作。

第一种:

while( 1 ){    
  char temp;    
  *strDestCopy = *strSrc;  
  temp = *strSrc; 
  strDestCopy++;    
  strSrc++;   
  if( '\0' == temp )      
  break;
}

 第二种:

while ( *strSrc != '\0' ){
   *strDestCopy = *strSrc;
   strDestCopy++;
   strSrc++;
}
 
*strDestCopy = *strSrc;
   
也即:
 
while ( *strSrc != '\0' ){
   *strDestCopy++ = *strSrc++; 
}
 
*strDestCopy=‘\0’;

使用实例

//实例1:将一个字符串拷贝到一个足够长的字符数组中。本例中字符数组为a,长度为20。

//缺点:若数组长度不足以容纳整个字符串,则程序运行崩溃。

#include<iostream>
#include<stdlib.h> 

using namespace std; 
char * strcpy( char * strDest, const char * strSrc ){  
  char * strDestCopy = strDest;  
  if ((NULL==strDest)||(NULL==strSrc))throw "Invalid argument";
    while ( (*strDest++=*strSrc++) != '\0' );
    return strDestCopy; 
}
  
int main( int argc, char * argv[] ){   
  char a[20], c[] = "i am teacher!";  
  try{   
       strcpy(a,c);
  }catch(char* strInfo){
       cout << strInfo << endl;
     exit(-1);
  }
   
  cout << a << endl;
  return 0;
 
}

//实例2:预设两个字符指针,一个指向字符串,另一个为NULL,在程序运行过程中拷贝。

#include<iostream> 
using namespace std;
 
char *strcpy(char *strDes, const char *strSrc);
//函数声明
 
int main(){   
  const char *strSrc="helloworld";
  char *strDes=NULL;   
  strDes=strcpy(strDes,strSrc);   
  cout<<"strSrc="<<strSrc<<endl;   
  cout<<"strDes="<<strDes<<endl;   
  if(strDes!=NULL) { 
     free(strDes);
     strDes=NULL; 
  }    
  return 0; 
}
 
char *strcpy(char *strDes, const char *strSrc){   
  assert(strSrc!=NULL); 
  //若strSrc为NULL,则抛出异常。  
  strDes=(char *)malloc(strlen(strSrc)+1);
  //多一个空间用来存储字符串结束符'\0'   
  char *p=strDes;   
  while(*strSrc!='\0'){    
    *p++=*strSrc++;
  }
    
  *p='\0';  
 return strDes;
 
}
还有一种模拟算法:
 
char * strcpy(char *dest ,const char *src){
    char *p=dest;
    while (*src != '\0'){
        *dest = *src;
        dest++;src++;
    }
    *dest = '\0';
    return p;
}

与strncpy的区别

第一种情况:

char* p="how are you ?";   
char name[20]="ABCDEFGHIJKLMNOPQRS";  
    strcpy(name,p);
    //name改变为"how are you ? "====>正确!
    strncpy(name,p, sizeof(name));
    //name改变为"how are you ?" =====>正确!后续的字符将置为NULL

第二种情况:

  char* p="how are you ?";
    char name[10];
    strcpy(name,p);
    //目标串长度小于源串,错误!
    name[sizeof(name)-1]='\0';
    //和上一步组合,弥补结果,但是这种做法并不可取,因为上一步出错处理方式并不确定
    strncpy(name,p,sizeof(name));
    //源串长度大于指定拷贝的长度sizeof(name),注意在这种情况下不会自动在目标串后面加'\0'
    name[sizeof(name)-1]='\0'; 
    //和上一步组合,弥补结果
原创文章 378 获赞 119 访问量 18万+

猜你喜欢

转载自blog.csdn.net/ywl470812087/article/details/105611374