GitHub项目地址	这里
合作同学作业地址	这里

一、PSP表格

PSP2.1	Personal Software Process Stages	预估耗时（分钟）	实际耗时（分钟）
Planning	计划	30	30
Estimate	估计这个任务需要多少时间	1510	1925
Development	开发	990	1325
Analysis	需求分析 (包括学习新技术)	90	100
Design Spec	生成设计文档	60	60
Design Review	设计复审 (和同事审核设计文档)	20	30
Coding Standard	代码规范 (为目前的开发制定合适的规范)	10	20
Design	具体设计	30	25
Coding	具体编码	900	1200
Code Review	代码复审	60	100
Test	测试（自我测试，修改代码，提交修改）	240	300
Reporting	报告	30	25
Test Report	测试报告	10	5
Size Measurement	计算工作量	30	20
Postmortem & Process Improvement Plan	事后总结, 并提出过程改进计划	30	40
	合计	1510	1925

二、计算模块接口的设计与实现过程

1.项目实现的基本思路

1）首先我们需要读取指定的文件，并且将文本文件中的内容提出出来，进行操作。这里使用C#的IO流来进行文件操作。

2）根据要求以及难易程度，我们首先解决文本的行数以及字符数的统计。这里使用正则表达式进行处理。

3）对于单词的统计我们在完成行数和字符数统计之后，决定使用集合来处理单词，但是发现单词是能够处理了，但是得不到单词出现的次数，所以我们转而使用字典集（Dictionary）来进行处理，字典集为我们提供了很多方便的功能。

先用ArrayList集合存储所有单词，包括重复的单词，都存进去，但是是按照要求存储单词，也就是说必须四个英文字母开头的单词我们才存储，这里就用到正则表达式来解决。

将存储好的单词经过遍历放进字典集，这样我们就得到了符合要求的所有单词的一个字典集，并且也得到了它们出现的次数，然后在对它们进行排序，就可以得到最终符合要求的前10个单词了。

4）基础功能实现后，又开始实现新添加的功能，命令行操作以及输出指定长度的词组。

由于使用条件判断语句不能够很好的满足命令行操作的要求，我们经过查找资料，发现了可以使用一个第三方的工具包来帮助我们。这里@命令行解析，通过这个工具包，我们实现了命令行操作。

对于指定长度的词组，实现方式和单词的存储大致相同。
整体程序流程图如下图所示

2.部分代码以及代码规范

通过正则表达式存储符合要求单词

  /*
   * 按要求存储可用单词
   */
  public ArrayList Splitwords(string text)
  {
      ArrayList al = new ArrayList();
      MatchCollection matchs = Regex.Matches(text, @"\b[a-zA-Z]{4,}\w*");
      foreach (Match match in matchs)
      {
          al.Add(match.Value);
      }
      return al;
  }
  public ArrayList Splitlenth(int lenth, string text)
  {
      string b = lenth.ToString();
      string pattern = "\\b\\w{"+b+"}\\s";
      ArrayList al = new ArrayList();
      MatchCollection matchs = Regex.Matches(text, pattern);
      foreach (Match match in matchs)
      {
          al.Add(match.Value);
      }
      return al;
  }

统计每个单词出现的次数

  /*
   * 统计每个单词出现的次数
   */
  public Dictionary<string, int> countWords(ArrayList arrayList)
  {
      Dictionary<string, int> nary = new Dictionary<string, int>();
      foreach (string word in arrayList)
      {
          if (nary.ContainsKey(word))
          {
              nary[word]++;
          }
          else
          {
              nary.Add(word, 1);
          }
      }
      return nary;
  }

按值排序

扫描二维码关注公众号，回复： 7457600 查看本文章

  /*
   * 按值排序 
   */
  public Dictionary<string, int> sort(Dictionary<string, int> nary)
  {
      var result = from pair in nary orderby pair.Value descending, pair.Key ascending select pair;
      Dictionary<string, int> bronary = new Dictionary<string, int>();
      foreach (KeyValuePair<string, int> pair in result)
      {
          bronary.Add(pair.Key, pair.Value);
      }
      return bronary;
  }

指定输出词组长度

  /*
   * 指定词组长度 
   */
  public Dictionary<string,int> msort(ArrayList al,int size)
  {
      Dictionary<string, int> nary = new Dictionary<string, int>();
      ArrayList bl = new ArrayList();
      int i = 0;
      while(i<=al.Count-size)
      {
          string str = null;
          var result = al.GetRange(i, size);
          foreach (var n in result)
          {
              str += n.ToString()+" ";
          }
          bl.Add(str);
          i++;
      }
      foreach (string word in bl)
      {
          if (nary.ContainsKey(word))
          {
              nary[word]++;
          }
          else
          {
              nary.Add(word, 1);
          }
      }
      return nary;
  }

代码规范是程序员的一种编程习惯,良好的编程习惯,不仅能自然地产生几乎没有bug的代码,而且在代码交接时,也方便继任者的阅读.这是我们的代码规范