面试题11---第一个只出现一次的字符

1.题目

在字符串中找出第一个只出现一次的字符。如输入“abaccdeff”,则输出’b’。

2.就题论题

看到这题时,我们最直观的想法是从头开始扫描这个字符串中的每个字符。当访问到某字符时,拿这个字符和后面的每个字符相比较,如果在后面没有发现重复的字符,则该字符就是只出现一次的字符。如果字符串有n个字符,则每个字符可能与后面的O(n)个字符相比较,因此这种思路的时间复杂度是O(n*n)。面试官不会满意这种思路,它会提示我们还有更快的方法。
由于题目与字符出现的次数相关,那么我们是不是可以统计每个字符在该字符串中出现的次数?要达到这个目的,我们需要一个数据容器来存放每个字符的出现次数。在这个数据容器中,可以根据字符来查找它出现的次数,也就是说这个容器的作用是把一个字符映射成一个数字。在常用的数据容器中,哈希表正式这个用途。
为了解决这个问题,我们可以定义哈希表的键值(Key)是字符,而值(Value)是该字符出现的次数。同时我们还需要从头开始扫描字符串两次。第一次扫描字符串时,每扫描到一个字符,就在哈希表的对应项中把次数加1.接下来第二次扫描是,每扫描到一个字符,就能从哈希表中得到该字符出现的次数。这样,第一个只出现一次的字符就是符合要求的输出。
哈希表是一种比较复杂的数据结构,C++标准模板库中的map和unordered_map实现了哈希表的功能,我们可以直接拿过来用。由于本题的特殊性,我们起始只需要一个非常简单的哈希表就能满足要求,因此我们可以考虑实现一个简单的哈希表。字符(char)是一个长度为8的数据类型,因此总共有256中可能。于是我们创建一个长度为256的数组,每个字母根据其ASCII码值作为数组的下标对应数组的一个数字,而数组中存储的是每个字符出现的次数。这样我们就创建了一个大小为256、以字符ASCII码作为键值的哈希表。
第一次扫描时,在哈希表中更新一个字符出现的次数的时间是O(1)。如果字符串长度为n,那么第一次扫描的时间复杂度是O(n)。第二次扫描时,同样在O(1)时间内读出一个字符出现的次数,所以事件复杂度仍然是O(n)。这样算起来,总的时间复杂度是O(n)。同时我们需要一个包含256个字符的辅助数组,它的大小是1KB。由于这个数组的大小是一个常数,因此可以认为这种算法的空间复杂度是O(1)。
当我们向面试官讲述清楚这种思路并得到面试官的首肯之后,就可以动手写代码了。下面是一段参考代码:

char FirstNotRepeatingChar(char* pString)
{
  if(pString==nullptr)
    return '\0';
    const int tableSize=256;
    unsigned int hashTable[tableSize];
    for(unsinged int i=0;i<tableSize;i++)
       hashTable[i]=0;
    char* pHashKey=pString;
    while(*(pHashKey)!='\0')
      hashTable[*(pHashKey++)]++;
    pHashKey=pString;
    while(*pHashKey!='\0')
    {
     if(hashTable[*pHashKey]==1)
       return *pHashKey;
       pHashKey++;
    }
    return '\0';
}

3.相关题目

在英语中,如果两个单词中出现的字符相同,并且每个字母出现的次数也相同,那么这两个单词互为变位词。例如,silent与listen,evil和live互为变位词。请完成一个函数,判断输入的两个字符串是不是互为变位词。我们可以创建一个用数组实现的简单哈希表,用来统计字符串中每个字符出现的次数。当扫描到第一个字符串中的每个字符时,为哈希表对应的项的值增加1.接下来扫描第二个字符串,当扫描到每个字符时,为哈希表对应的项的值减去1.如果扫描完第二个字符串后,哈希表中所有的值都是0,那么这两个字符串就互为变位词。

猜你喜欢

转载自blog.csdn.net/Achenming1314/article/details/105698656