Github网址:https://gitee.com/ronanly/WordCount.git
1.思路
看到题目时,对于编写wordcount这个项目,首先想到它应该实现的功能有哪些,再来细化这些功能;
我用的C语言,然后用gcc编译器来执行,在我的代码里,有以下功能实现函数:
1.void countc(char *file) //返回文件的字符数
2.void countw(char *file)//返回文件词的数目
3.void countl(char *file) //返回文件的行数
4.void count_blankline(char *file) //返回文件的空行数
5.void count_noteline(char *file) //返回文件的注释行数
6.void count_codeline(char *file)//返回文件的代码行数
7.void searchfile() //寻找文件夹中的txt文件
8.saveFile(char *fileName,char* feature,int num)//存储到指定文件中
1.1 WordCount需求说明
WordCount的需求可以概括为:对程序设计语言源文件统计字符数、单词数、行数,统计结果以指定格式输出到默认文件中,以及其他扩展功能,并能够快速地处理多个文件。
可执行程序命名为:wc.exe,该程序处理用户需求的模式为:
wc.exe [parameter] [input_file_name]
存储统计结果的文件默认为result.txt,放在与wc.exe相同的目录下。
1.2 基本功能
wc.exe -c file.c //返回文件 file.c 的字符数
wc.exe -w file.c //返回文件 file.c 的单词总数
wc.exe -l file.c //返回文件 file.c 的总行数
wc.exe -o outputFile.txt //将结果输出到指定文件outputFile.txt
注意:
空格,水平制表符,换行符,均算字符。
由空格或逗号分割开的都视为单词,且不做单词的有效性校验,例如:thi#,that视为用逗号隔开的2个单词。
-c, -w, -l参数可以共用同一个输入文件,形如:wc.exe –w –c file.c 。
-o 必须与文件名同时使用,且输出文件必须紧跟在-o参数后面,不允许单独使用-o参数。
1.3 扩展功能
wc.exe -s //递归处理目录下符合条件的文件
wc.exe -a file.c //返回更复杂的数据(代码行 / 空行 / 注释行)
wc.exe -e stopList.txt // 停用词表,统计文件单词总数时,不统计该表中的单词
[file_name]: 文件或目录名,可以处理一般通配符。
其中,
代码行:本行包括多于一个字符的代码。
空 行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。
注释行:本行不是代码行,并且本行包括注释。一个有趣的例子是有些程序员会在单字符后面加注释:
}//注释
在这种情况下,这一行属于注释行。
2.PSP开发耗时
PSP2.1 |
Personal Software Process Stages |
预估耗时(分钟) |
实际耗时(分钟) |
Planning |
计划 |
60 |
30 |
· Estimate |
· 估计这个任务需要多少时间 |
120 |
120 |
Development |
开发 |
60 |
60 |
· Analysis |
· 需求分析 (包括学习新技术) |
30 |
30 |
· Design Spec |
· 生成设计文档 |
30 |
30 |
· Design Review |
· 设计复审 (和同事审核设计文档) |
30 |
20 |
· Coding Standard |
· 代码规范 (为目前的开发制定合适的规范) |
30 |
30 |
· Design |
· 具体设计 |
30 |
20 |
· Coding |
· 具体编码 |
100 |
120 |
· Code Review |
· 代码复审 |
30 |
40 |
· Test |
· 测试(自我测试,修改代码,提交修改) |
60 |
80 |
Reporting |
报告 |
30 |
40 |
· Test Report |
· 测试报告 |
30 |
30 |
· Size Measurement |
· 计算工作量 |
30 |
30 |
· Postmortem & Process Improvement Plan |
· 事后总结, 并提出过程改进计划 |
30 |
30 |
合计 |
700 |
710 |
2.代码部分
2.1主函数:
int main(int argc,char *argv[])
{
FILE *fp;
while(1)
{
if((fp=fopen(argv[2],"r"))==NULL)
{
printf("FileNull\n\n\n");
scanf("%s%s%s",argv[0],argv[1],argv[2]);
continue;
}
else if(!strcmp(argv[1],"-w"))
countw(argv[2]);
else if(!strcmp(argv[1],"-c"))
countc(argv[2]);
else if(!strcmp(argv[1],"-l"))
countl(argv[2]);
else if(!strcmp(argv[1],"-a"))
{
count_blankline(argv[2]);
count_noteline(argv[2]);
count_codeline(argv[2]);
}
else if(!strcmp(argv[1],"-s"))
{
searchfile();
}
else
printf("NullPoint\n");
printf("\n\n");
scanf("%s%s%s",argv[0],argv[1],argv[2]);
}
return 0;
}
输入指令分成三组,根据第二组的指令对第三组的指令文件名执行相应的操作。
2.2 基本功能:
(-c(返回文件的字符数),-s(寻找文件中的txt文件),-l( 返回文件的行数),-w(返回文件词的数目),-a(统计空行,代码行,注释行))
{
FILE *f;
f=fopen(file, "r");//打开读取文件
char a;
int cchar=0;
if(f==NULL)//文件为空或不存在
{
printf("file is NULL");
}
else
while (!feof(f))
{
a=fgetc(f);//从文件里获取字符数
if (a != ' '&&a != '\n'&&a != '\t')
cchar++;
}
fclose(f);printf("charnum:%d ",cchar);//文件关闭,返回文件的字符数
}
{
FILE *f;
f=fopen(file,"r");
char ch;
int aword;
int cword=0;
if(f==NULL)
{
printf("file is NULL");
}
else
while(!feof(f))
{
ch=fgetc(f);
if((ch >= 'a'&&ch <= 'z')||(ch>='A'&&ch<='Z')||ch=='_')
aword=1;
else if (aword)
{
cword++;
aword=0;
}
}
fclose(f);
printf("wordnum:%d ",cword);
}
{ FILE *f;
f = fopen(file, "r");
int cline = 1;
char a;
if(f==NULL)
{
printf("file is NULL");
}
else
while(!feof(f))
{
a=fgetc(f);
if(a=='\n'||a=='\t')
cline++;
}
fclose(f);printf("Linenum:%d ",cline);
}
{
FILE *f;
int b_num = 0;//空行数
int ch_num = 0;//字符个数
char ch;
f = fopen(file, "r");
if(f==NULL)
{
printf("file is NULL");
}
else
while (!feof(f))
{
ch= fgetc(f);
if (ch=='\n')
{
if (ch_num<= 1)b_num++;
ch_num = 0;
}
else if (ch!=' '&&ch!='\t'&&ch!='}')
ch_num++;
else if(ch=='}')
b_num++;
}
fclose(f);
printf("blankline:%d ",b_num);
}
void count_noteline(char *file) //返回文件的注释行数
{
FILE *f;
int ch_num = 0;
int note_num=0;
char ch;
f=fopen(file, "r");
if(f==NULL)
{
printf("file is NULL");
}
else
while (!feof(f))
{
ch= fgetc(f);
if(ch=='\n')
{
if(ch_num==2) note_num++;
ch_num=0;
}
else if(ch=='/') ch_num++;
else if(ch_num==1)
{
if(ch=='/') ch_num++;
}
}
fclose(f);
printf("noteline:%d ",note_num);
}
{
FILE *f;
int ch_num = 0;
int code_num=0;
int flag=0;
char a;
f = fopen(file, "r");
if(f==NULL)
{
printf("file is NULL");
}
else
while (!feof(f))
{
a=fgetc(f);
{
flag=0;tag++;
}
else
{
{
code_num++;
ch_num=0;
}
else if(a != ' '&&a != '\n'&&a != '\t'&&a!='/')
{
ch_num++;
}
{ flag++;}
}
}
void searchfile() //寻找文件夹中的txt文件
{
struct _finddata_t filefind;
long handle;
int t=0;
if((handle=_findfirst("E:\\wordcount\\*.txt",&filefind))== -1L ) //文件txt存放位置
{
printf( "没找到txt文件\n");
}
else
do{
t++;
printf("找到文件:%s\n", filefind.name);
}while (_findnext(handle,&filefind)==0);
}
{
f=fopen("F:\\gcc\\bin\\result.txt","a");
if(f==NULL)
{
printf("failed when wrinting the count to file\n");
}
//写入文件
fprintf(f,"%s,%s,%d\n",fileName,feature,num);
fclose(f);
}
写入到result文件里
4.单元测试
5.总结
在运行代码和测试时花费了很多时间,有不少的bug出现,要么filenull要么返回的文件词数目不对。这次作业的基本功能全部实现,扩展功能实现一小部分,由于代码环节薄弱,花了很多时间去改错。测试阶段里,利用不同的测试文件才会发现其中的一些容易疏忽的小错误,可见测试的重要和必要性。