面试题11---第一个只出现一次的字符

1.题目

在字符串中找出第一个只出现一次的字符。如输入“abaccdeff”，则输出’b’。

2.就题论题

看到这题时，我们最直观的想法是从头开始扫描这个字符串中的每个字符。当访问到某字符时，拿这个字符和后面的每个字符相比较，如果在后面没有发现重复的字符，则该字符就是只出现一次的字符。如果字符串有n个字符，则每个字符可能与后面的O(n)个字符相比较，因此这种思路的时间复杂度是O(n*n)。面试官不会满意这种思路，它会提示我们还有更快的方法。
由于题目与字符出现的次数相关，那么我们是不是可以统计每个字符在该字符串中出现的次数？要达到这个目的，我们需要一个数据容器来存放每个字符的出现次数。在这个数据容器中，可以根据字符来查找它出现的次数，也就是说这个容器的作用是把一个字符映射成一个数字。在常用的数据容器中，哈希表正式这个用途。
为了解决这个问题，我们可以定义哈希表的键值（Key）是字符，而值（Value）是该字符出现的次数。同时我们还需要从头开始扫描字符串两次。第一次扫描字符串时，每扫描到一个字符，就在哈希表的对应项中把次数加1.接下来第二次扫描是，每扫描到一个字符，就能从哈希表中得到该字符出现的次数。这样，第一个只出现一次的字符就是符合要求的输出。
哈希表是一种比较复杂的数据结构，C++标准模板库中的map和unordered_map实现了哈希表的功能，我们可以直接拿过来用。由于本题的特殊性，我们起始只需要一个非常简单的哈希表就能满足要求，因此我们可以考虑实现一个简单的哈希表。字符（char）是一个长度为8的数据类型，因此总共有256中可能。于是我们创建一个长度为256的数组，每个字母根据其ASCII码值作为数组的下标对应数组的一个数字，而数组中存储的是每个字符出现的次数。这样我们就创建了一个大小为256、以字符ASCII码作为键值的哈希表。
第一次扫描时，在哈希表中更新一个字符出现的次数的时间是O(1)。如果字符串长度为n，那么第一次扫描的时间复杂度是O(n)。第二次扫描时，同样在O(1)时间内读出一个字符出现的次数，所以事件复杂度仍然是O(n)。这样算起来，总的时间复杂度是O(n)。同时我们需要一个包含256个字符的辅助数组，它的大小是1KB。由于这个数组的大小是一个常数，因此可以认为这种算法的空间复杂度是O(1)。
当我们向面试官讲述清楚这种思路并得到面试官的首肯之后，就可以动手写代码了。下面是一段参考代码：

char FirstNotRepeatingChar(char* pString)
{
  if(pString==nullptr)
    return '\0';
    const int tableSize=256;
    unsigned int hashTable[tableSize];
    for(unsinged int i=0;i<tableSize;i++)
       hashTable[i]=0;
    char* pHashKey=pString;
    while(*(pHashKey)!='\0')
      hashTable[*(pHashKey++)]++;
    pHashKey=pString;
    while(*pHashKey!='\0')
    {
     if(hashTable[*pHashKey]==1)
       return *pHashKey;
       pHashKey++;
    }
    return '\0';
}

3.相关题目

在英语中，如果两个单词中出现的字符相同，并且每个字母出现的次数也相同，那么这两个单词互为变位词。例如，silent与listen,evil和live互为变位词。请完成一个函数，判断输入的两个字符串是不是互为变位词。我们可以创建一个用数组实现的简单哈希表，用来统计字符串中每个字符出现的次数。当扫描到第一个字符串中的每个字符时，为哈希表对应的项的值增加1.接下来扫描第二个字符串，当扫描到每个字符时，为哈希表对应的项的值减去1.如果扫描完第二个字符串后，哈希表中所有的值都是0，那么这两个字符串就互为变位词。