webbench源码剖析

在我们的日常工作中，压力测试是一项很重要的工作，比如在一个网站上线之前，能承受多大访问量，在大的访问量前提下性能怎么样，这些数据指标好坏将会直接影响用户体验。但是在压力测试中不存在一个共性，那就是压力测试的结果与负载的结果不会完全相同，就算压力测试做的再好，也不会100%保证与上线的指标性能相同，面对这些问题我们只能想方设法去模拟。它是Linux下使用的网站测压工具，使用fork模拟多个客户同时访问我们设定的url,测试网站在压力下的工作能力，最多可以模拟3万个并发连接去测试网站的负载能力
Webbench是知名的网站压力测试工具，它是由lionbridge公司开发的的。
Webbench能测试在相同硬件上不同服务性能，以及不同硬件上同一服务的性能，Webbench的标准测试可以向我们展示服务器的两项内容：**每秒钟相应的请求数和每秒钟传输的数量。**Webbench不但能对动态页面进行测试，也能对动态页面进行测试，还支持对含有SSL的安全网站性能进行静态或动态的性能测试。
Webbench的安装：

Wget http://www.ha97.com/code/webbench-1.5.tar.gz

工作原理：
（1）主函数进行必要的准备工作，进入bench开始测压
（2）bench函数使用fork模拟除多个客户端，调用socket并发请求，每个子进程记录自己的访问数据，并切入管道
（3）父进程从管道中读取子进程的信息
（4）使用alarm函数进行时间控制，到时间后会产生SIGALARM信号，调用信号处理函数使进程终止
（5）最后父进程将子进程的数据汇总输出到屏幕上
工作原理图：
这里写图片描述
各参数的作用：
-f:不等待服务器的数据返回
-t:指定压力测试运行的时间
-c:指定由多少个客户端发起请求
-9、-1、-2分别指HTTP0.9/1、0/1、1

Webbench的源码如下：
Webbench源码中主要包括两个源文件，一个是socket.c和webbench.c两个文件。socket.c主要是封装的一个socket模块，webbench.c是主要文件，完成网站测压的整个过程。webbench.c源码的阅读主要从mian，其整体流程为：main——>对命令行进行参数解析——>调用build_request函数构建HTTP的“Get”请求头——>调用bench测试函数（其中子进程调用benchcore函数进行压力测试），之后主进程从管道读取消息，并输出到标准输出上即可。

下面是对socket.c函数的解析：

// socket描述符，主要以host和clientPort构成一对TCP的套接字（host支持域名），创建失败返回-1，成功返回一个
int Socket(const char *host, int clientPort)
{
    int sock;
    unsigned long inaddr;
    struct sockaddr_in ad;
    struct hostent *hp;

    memset(&ad, 0, sizeof(ad));
    ad.sin_family = AF_INET;

    // 若字符串有效，则将字符串转换为32位二进制。网络字节序的IPV4地址，否则为INADDR_NONe
    inaddr = inet_addr(host);
    if (inaddr != INADDR_NONE)
        memcpy(&ad.sin_addr, &inaddr, sizeof(inaddr));
    else
    {
        // 返回对应于给定主机名的包含主机名字和地址信息的hostent结构指针
        hp = gethostbyname(host);
        if (hp == NULL)
            return -1;
        memcpy(&ad.sin_addr, hp->h_addr, hp->h_length);
    }
    // 将一个无符号短整型的主机数值转换为网络字节顺序
    ad.sin_port = htons(clientPort);

    // 创建socket套接字
    sock = socket(AF_INET, SOCK_STREAM, 0);
    if (sock < 0)
        return sock;
    // 连接到相应的主机
    if (connect(sock, (struct sockaddr *)&ad, sizeof(ad)) < 0)
        return -1;
    return sock;
}

Webbench.c源码分析

首先是main函数，mian函数首先进行参数解析，然后执行build_request函数，构建HTTP请求头，最后调用核心函数bench()执行网站测压测试。

// 主函数
int main(int argc, char *argv[])
{
 // getopt_long的返回字符
 int opt=0;
 // getopt_long的第五个参数，一般为0
 int options_index=0;
 char *tmp=NULL;

 if(argc==1)
 {
      usage();
    return 2;
 }
 // 使用getopt_long函数读取命令行参数，来设置所涉及到的全局变量的值。
 // getopt_long函数支持长选项的命令行解析，其声明如下：
 // int getopt_long(int argc, char *const argv[], const char *optstring, const struct option *long_options, int *longindex)
// 1、前两个参数，就是main函数的argc和argv，这两者直接传入即可，
// 2、optstring的格式举例说明比较方便，例如：char *optstring = "abcd:";
//上面这个optstring在传入之后，getopt函数将依次检查命令行是否指定了 -a， //-b， -c及 -d，（这需要多次调用getopt函数，直到其返回-1），当检查到///面//某一个参数被指定时，函数会返回被指定的参数名称（即该字母），最后一个参  //数d后面带有冒号，: 表示参数d是可以指定值的，如 -d 100 或 -d user。
// 3、longopts指向的是一个由option结构体组成的数组，那个数组的每个元素，指明了一个“长参数”（即形如--name的参数）名称和性质：
           struct option {
               const char *name;
               int         has_arg;
               int        *flag;
               int         val;
           };


 while((opt=getopt_long(argc,argv,"912Vfrt:p:c:h",long_options,&options_index))!=EOF )
 {
  switch(opt)
  {
   case  0 : break;
   case 'f': force=1;break;
   case 'r': force_reload=1;break;
   case '9': http10=0;break;
   case '1': http10=1;break;
   case '2': http10=2;break;
   case 'V': printf(PROGRAM_VERSION"\n");exit(0);
   // -t 后跟压力测试时间，optarg返回，使用atoi转换成整数
   case 't': benchtime=atoi(optarg);break;
   case 'p':
         /* proxy server parsing server:port */
         tmp=strrchr(optarg,':');
         proxyhost=optarg;
         if(tmp==NULL)
         {
             break;
         }
         if(tmp==optarg)
         {
           fprintf(stderr,"Error in option --proxy %s: Missing hostname.\n",optarg);
             return 2;
         }
         if(tmp==optarg+strlen(optarg)-1)
         {
             fprintf(stderr,"Error in option --proxy %s Port number is missing.\n",optarg);
             return 2;
         }
       // 获取代理地址
         *tmp='\0';
         proxyport=atoi(tmp+1);break;  // 获取代理端口
   case ':':
   case 'h':
   case '?': usage();return 2;break;
   case 'c': clients=atoi(optarg);break; // 并发数目 -c N
  }
 }

 // 扫描参数选项时，optind标识下一个选项的索引；扫描结束后，标识第一个非选项参数索引；如
 // 果optind=argc，说明非选项参数即服务器URL缺失。此变量是系统定义的。
 // optind返回第一个不包含选项的命令名参数，此处为URL值
 if(optind==argc)
 {
    fprintf(stderr,"webbench: Missing URL!\n");
    usage();
    return 2;
  }
 // 此处多做一次判断，可预防BUG，因为上文并发数目用户可能写0
 if(clients==0) clients=1;
 // 压力测试时间默认为30s，如果用户写成0，则默认为60s
 if(benchtime==0) benchtime=60;
 /* Copyright */
 fprintf(stderr,"Webbench - Simple Web Benchmark "PROGRAM_VERSION"\n"
     "Copyright (c) Radim Kolar 1997-2004, GPL Open Source Software.\n"
     );
 // 调用build_request函数构建完整的HTTP请求头，HTTP request存储在全局变量char request[REQUEST_SIZE]
 build_request(argv[optind]);   // 参数为URL值
 /* print bench info */
 // 在屏幕上打印测试的信息，如HTTP协议，请求方式，并发个数，请求时间等
 printf("\nBenchmarking: ");
 switch(method)
 {
     case METHOD_GET:
     default:
         printf("GET");break;
     case METHOD_OPTIONS:
         printf("OPTIONS");break;
     case METHOD_HEAD:
         printf("HEAD");break;
     case METHOD_TRACE:
         printf("TRACE");break;
 }
 printf(" %s",argv[optind]);
 switch(http10)
 {
     case 0: printf(" (using HTTP/0.9)");break;
     case 2: printf(" (using HTTP/1.1)");break;
 }
 printf("\n");
 if(clients==1) printf("1 client");
 else
   printf("%d clients",clients);

 printf(", running %d sec", benchtime);
 if(force) printf(", early socket close");
 if(proxyhost!=NULL) printf(", via proxy server %s:%d",proxyhost,proxyport);
 if(force_reload) printf(", forcing reload");
 printf(".\n");
 // 调用bench函数，开始压力测试，bench()为压力测试核心代码
 return bench();
}

下面是build_request函数分析

// 此函数主要目的是要把类似于http GET请求的信息全部存储到全局变量request[REQUEST_SIZE]
// 中，其中换行操作使用"\r\n"。其中应用了大量的字符串操作函数。
// 创建url请求连接，HTTP头，创建好的请求放在全局变量request中
void build_request(const char *url)
{
  char tmp[10];
  int i;

  bzero(host,MAXHOSTNAMELEN);
  bzero(request,REQUEST_SIZE);

  // 协议适配
  if(force_reload && proxyhost!=NULL && http10<1) http10=1;
  if(method==METHOD_HEAD && http10<1) http10=1;
  if(method==METHOD_OPTIONS && http10<2) http10=2;
  if(method==METHOD_TRACE && http10<2) http10=2;

  switch(method)
  {
      default:
      case METHOD_GET: strcpy(request,"GET");break;
      case METHOD_HEAD: strcpy(request,"HEAD");break;
      // 请求方法相应的不能缓存
      case METHOD_OPTIONS: strcpy(request,"OPTIONS");break;
      case METHOD_TRACE: strcpy(request,"TRACE");break;
  }

  // 追加空格
  strcat(request," ");

  if(NULL==strstr(url,"://"))  // strstr(str1, str2)用于判断str2是否是str1的子串
  {
      fprintf(stderr, "\n%s: is not a valid URL.\n",url);
      exit(2);
  }
  if(strlen(url)>1500)
  {
         fprintf(stderr,"URL is too long.\n");
     exit(2);
  }
  if(proxyhost==NULL)
     // 未使用代理服务器的情况下，只允许HTTP协议
       if (0!=strncasecmp("http://",url,7))    // 比较前7个字符串
       { fprintf(stderr,"\nOnly HTTP protocol is directly supported, set --proxy for others.\n");
             exit(2);
           }
  /* protocol/host delimiter */
  // 指向"://"后的第一个字母
  i=strstr(url,"://")-url+3;
  /* printf("%d\n",i); */
  // URL后必须的'/'
  if(strchr(url+i,'/')==NULL)   //url + i 指向http://后第一个位置
  {
      fprintf(stderr,"\nInvalid URL syntax - hostname don't ends with '/'.\n");
      exit(2);
  }
  // 如果未使用代理服务器，就表示肯定是HTTP协议
  if(proxyhost==NULL)
  {
   /* get port from hostname */
   // 如果是server:port形式，解析主机和端口
   if(index(url+i,':')!=NULL &&
      index(url+i,':')<index(url+i,'/'))             // 判断url中是否指定了端口号
   {
       strncpy(host,url+i,strchr(url+i,':')-url-i);    // 取出主机地址
       bzero(tmp,10);
       strncpy(tmp,index(url+i,':')+1,strchr(url+i,'/')-index(url+i,':')-1);
       /* printf("tmp=%s\n",tmp); */
     // 目标端口
       proxyport=atoi(tmp);    // 端口号转换为int
       if(proxyport==0) proxyport=80;
   } else
   {
     strncpy(host,url+i,strcspn(url+i,"/"));
   }
   // printf("Host=%s\n",host);
   strcat(request+strlen(request),url+i+strcspn(url+i,"/"));
  } else
  {
   // printf("ProxyHost=%s\nProxyPort=%d\n",proxyhost,proxyport);
   // 如若使用代理服务器
   strcat(request,url);
  }
  if(http10==1)
      strcat(request," HTTP/1.0");
  else if (http10==2)
      strcat(request," HTTP/1.1");
    // 完成如 GET/HTTP1.1后，添加"\r\n"
  strcat(request,"\r\n");
  if(http10>0)
      strcat(request,"User-Agent: WebBench "PROGRAM_VERSION"\r\n");
  if(proxyhost==NULL && http10>0)
  {
      strcat(request,"Host: ");
      strcat(request,host);
      strcat(request,"\r\n");
  }
  // force_reload=1和存在代理服务器，则不缓存
  if(force_reload && proxyhost!=NULL)
  {
      strcat(request,"Pragma: no-cache\r\n");
  }
  // 如果为HTTP1.1，则存在长连接，应将Connection置位close
  if(http10>1)
      strcat(request,"Connection: close\r\n");
  /* add empty line at end */
  // 最后不要忘记在请求后添加“\r\n”
  if(http10>0) strcat(request,"\r\n");
  // printf("Req=%s\n",request);
}

下面是bench函数解析，此函数开始先进行一次socket连接，确认能连接以后，才进行后续步骤；调用pipe函数初始化一个管道，用于子进程想父进程汇总测试数据。而子进程是主进程通过fork函数复制出来的；之后每隔子进程都调用benchcore函数进行测试，并将结果输出到管道，供父进程读取。父进程负责收集所有子进程的测试数据，并进行汇总输出显示即可。

static int bench(void)
{
  int i,j,k;
  pid_t pid=0;
  FILE *f;

  /* check avaibility of target server */
  // 进行socket连接，调用了Socket.c文件中的函数，主要是为了测试远程主机是否能够连通
  i=Socket(proxyhost==NULL?host:proxyhost,proxyport);
  if(i<0)
  {
     // 错误处理
     fprintf(stderr,"\nConnect to server failed. Aborting benchmark.\n");
     return 1;
  }
  close(i);
  /* create pipe */
  // 创建管道，管道用于子进程想父进程汇报数据
  if(pipe(mypipe))
  {
    // 错误处理
      perror("pipe failed.");
      return 3;
  }

  /* not needed, since we have alarm() in childrens */
  /* wait 4 next system clock tick */
  /*
  cas=time(NULL);
  while(time(NULL)==cas)
        sched_yield();
  */

  /* fork childs */
  // 根据clients大小fork出来足够的子进程进行测试
  for(i=0;i<clients;i++)
  {
       pid=fork();
       if(pid <= (pid_t) 0)   // pid=0 ->子进程.pid < 0 -> error
       {
           /* child process or error*/
           // 注意这里子进程sleep(1)
           sleep(1); /* make childs faster */
           break;   // 子进程跳出循环orfork出错父进程跳出循环
       }
  }

  if( pid< (pid_t) 0)    // fork出错
  {
      // 错误处理
      fprintf(stderr,"problems forking worker no. %d\n",i);
      perror("fork failed.");
      return 3;
  }

  // 如果是子进程，调用benchcore进行测试
  if(pid== (pid_t) 0)     // 子进程
  {
    /* I am a child */
    // 子进程执行请求，尽可能多的发送请求，直到超时返回为止
    if(proxyhost==NULL)
      benchcore(host,proxyport,request);
    else
      benchcore(proxyhost,proxyport,request);

   /* write results to pipe */
   // 子进程将测试结果输出到管道
   f=fdopen(mypipe[1],"w");
   // 错误处理
   if(f==NULL)
   {
      perror("open pipe for writing failed.");
      return 3;
    }
    /* fprintf(stderr,"Child - %d %d\n",speed,failed); */
    // 子进程将speed failed bytes写进管道
    fprintf(f,"%d %d %d\n",speed,failed,bytes);
    fclose(f);
    // 子进程完成任务，返回退出
    return 0;
  }
  else
  {
      // 父进程从管道读取子进程输出，并做汇总，然后输出显示
      f=fdopen(mypipe[0],"r");   // mypipe[0]与标准流相结合
      // 错误处理
      if(f==NULL)
      {
          perror("open pipe for reading failed.");
          return 3;
      }
      // _IONBF（无缓冲）：直接从流中读入数据或直接向流中写入数据，而没有缓冲区
      setvbuf(f,NULL,_IONBF,0);    // 设置无缓冲区
      // 虽然子进程不能污染父进程的这几个变量，但用前重置一下，在这里是个好习惯
      speed=0;
      failed=0;
      bytes=0;

      // 从管道读取数据，fscanf为阻塞式函数
      // 从管道中读取每个子进程的任务执行请求，并计数
      while(1)
      {
          // 通过f从管道读取数据，注意fscanf为阻塞式函数
          pid=fscanf(f,"%d %d %d",&i,&j,&k);
          // 错误处理
          if(pid<2)
          {
             fprintf(stderr,"Some of our childrens died.\n");
             break;
          }
          // 父进程利用管道负责统计子进程的三种数据和
          speed+=i;
          failed+=j;
          bytes+=k;
          /* fprintf(stderr,"*Knock* %d %d read=%d\n",speed,failed,pid); */
          // 用于记录已经读取了多少个子进程的数据，读完就退出
          if(--clients==0) break;
      }
      fclose(f);
      // 最后将结果打印到屏幕上
      printf("\nSpeed=%d pages/min, %d bytes/sec.\nRequests: %d susceed, %d failed.\n",
          (int)((speed+failed)/(benchtime/60.0f)),
          (int)(bytes/(float)benchtime),
          speed,
          failed);
  }
  return i;
}

由于bench函数子进程调用了benchcore函数，而benchcore函数是测试函数，它通过使用SIGALARM信息来控制时间，alarm函数设置了多少时间之后产生SIGALRM信号，一旦产生此信息，将运行alam_handler函数，是的timerexpired=1，这样之后可以通过判断timerexpired值来退出程序。此外，全局变量force表示是否发出请求后需要等待服务器的相应结果。

// benchcore函数是子进程进行压力测试的函数，被每个子进程调用。其函数中参数信息如下：
// host：地址
// port：端口
// req：http格式方法
void benchcore(const char *host,const int port,const char *req)
{
 int rlen;
 // 记录服务器相应请求所返回的数据
 char buf[1500];
 int s,i;
 struct sigaction sa;

 /* setup alarm signal handler */
 // 当程序执行到指定的秒数之后，发送SIGALRM信号，即设置alam_handler函数为信号处理函数
 sa.sa_handler=alarm_handler;
 sa.sa_flags=0;
 // sigaction成功则返回0，失败则返回-1，超时会产生信号SIGALRM，用sa指定函数处理
 if(sigaction(SIGALRM,&sa,NULL))
    exit(3);
 // 开始计时
 alarm(benchtime);

 rlen=strlen(req);
 // 无限执行请求，直到收到SIGALRM信号将timerexpired设置为1时
 nexttry:while(1)
 {
    // 一旦超时，则返回
    if(timerexpired)
    {
       if(failed>0)
       {
          /* fprintf(stderr,"Correcting failed by signal\n"); */
          failed--;
       }
       return;
    }
    // 连接远程服务器，通过调用Socket函数建立TCP连接
    s=Socket(host,port);
    // 连接失败，failed数加一
    if(s<0) { failed++;continue;}
    // 发出请求，header大小与发送的不相等，则失败
    if(rlen!=write(s,req,rlen)) {failed++;close(s);continue;}
    // 针对http0.9做的特殊处理，则关闭socket的写操作，成功返回0，错误返回-1
    if(http10==0)
        if(shutdown(s,1)) { failed++;close(s);continue;}
    // 全局变量force表示是否要等待服务器返回的数据
    // 如果等待数据返回，则读取响应数据，计算传输的字节数
    // 发出请求后需要等待服务器的响应结果 force=0表示等待从Server返回的数据
    if(force==0)
    {
      /* read all available data from socket */
        while(1)
        {
        if(timerexpired) break;   // timerexpired默认为0，在规定时间内读取当为1时表示定时结束
        // 从socket读取返回数据
          i=read(s,buf,1500);
        /* fprintf(stderr,"%d\n",i); */
          if(i<0)
        {
           failed++;
           close(s);
           goto nexttry;
        }
          else
               if(i==0) break;
               else
                   bytes+=i;
        }
    }
    // 关闭连接
    if(close(s)) {failed++;continue;}
    // 成功完成一次请求，并计数，继续下一次相同的请求，直到超时为止
    speed++;
 }
}

用webbench测试自己所写的服务器：

root@jack-desktop:~/software/webbench-1.5# webbench -c 100 http://localhost:12345/test
Webbench - Simple Web Benchmark 1.5
Copyright (c) Radim Kolar 1997-2004, GPL Open Source Software.

Benchmarking: GET http://localhost:12345/test
100 clients, running 30 sec.

Speed=495888 pages/min, 586798 bytes/sec.
Requests: 247944 susceed, 0 failed.

并发100个，运行30s，访问请求全部成功，速度495888 pages/min, 586798 bytes/sec

root@jack-desktop:~/software/webbench-1.5# webbench -c 1000 http://localhost:12345/test
Webbench - Simple Web Benchmark 1.5
Copyright (c) Radim Kolar 1997-2004, GPL Open Source Software.

Benchmarking: GET http://localhost:12345/test
1000 clients, running 30 sec.

Speed=414996 pages/min, 490915 bytes/sec.
Requests: 207430 susceed, 68 failed.

并发1000个，运行30s，访问68个失败，速度也慢下来了，414996 pages/min, 490915 bytes/sec

另外我还发现个问题，就是在并发很大时我的服务器占用资源很厉害，主要是CPU占用过多，有时达到80%以上！
影响负载的因素
a.网络带宽，因此最好进行公网测试。
另：个人认为我们可以通过webbench首先模拟最大承载量，然后查看测试结果的bytes/sec来确定所占带宽，然后再来确定申请公网带宽，最好为最大带宽的40%左右。
由于本次测试由于是内网测试，网卡为百兆网卡，因此排除带宽问题。
b.apache/nginx性能没有优化；
c.web服务器负载过大； 2核 4G内存
总结：
1、压力测试工作应该放到产品上线之前，而不是上线以后
2、测试时尽量跨公网进行，而不是内网
3、测试时并发应当由小逐渐加大，比如并发100时观察一下网站负载是多少、打开是否流程，并发200时又是多少、网站打开缓慢时并发是多少、网站打不开时并发又是多少
4、应尽量进行单元测试，如B2C网站可以着重测试购物车、推广页面等，因为这些页面占整个网站访问量比重较大

猜你喜欢