剑指offer--字符串/字符流中第一个只出现一次的字符(+3道类似解法题目)

题目一:在字符串中找出第一个只出现一次的字符,如输入“abaccdeff”,则输出‘b’。

我们看到这道题最开始可能的想法是从头开始扫描这个字符串中的每个字符。当访问到某个字符时,拿这个字符和后面的每个字符相比较,如果在后面没有发现重复的字符,则该字符就是只出现一次的字符。如果字符串有n个字符,则每个字符可能和后面的O(n)个字符相比较,这种方法的时间复杂度是O(n2),我们来看一下是否有更加省时的方法。

由于题目和字符出现的次数有关,那我们是否可以统计每个字符在该字符串出现的次数,要达到这个目的,我们需要一个数据容器来存放每个字符出现的次数,在这个数据容器中,可以根据字符来查找它出现的次数,也就是说这个容器的作用是把一个字符映射成一个数字,哈希表正是这个用途,但由于本题的特殊性,我们不需要用到多复杂的标准库模板,字符(char)长度为8的数据类型,一共256种可能,于是我们创造了一个长度为256的数组,每个字符根据其ASCII码作为下标对应数组内的一个数字。而数组内的数字正是该字符出现的次数。

我们一共需要扫描两次字符串,第一次每扫到一个字符,就在对应位置把数组内的数字加1,n个字符时间复杂度为O(n)。第二次每扫到一个字符,根据该字符对应的数组下标位置内的次数来判断该字符是否是我们想要的字符,时间复杂度为O(1)。因此的时间复杂度为O(n)。我们额外需要一个辅助数组,但是由于这个数组的大小是一个常数,可以认为空间复杂度为O(1)。

代码:

char firstUniqChar(char* s){
    
    
    int a[256] = {
    
    0};
	char *p = s;
    for( ;*s! = '\0';s++){
    
    
        a[*s]++;
    }
    for( ;*p! = '\0';p++){
    
    
        if(a[*p] == 1)
        return *p;
    }
    return ' ';
}

相关题目:
1)
定义一个函数,输入两个字符串,从第一个字符串中删除在第二个字符串中出现过的所有字符。例如,从第一个字符串"We are students“中删除在第二个字符串”aeiou”中出现过的字符得到的结果是W r stdnts”。为了解决这个问题,我们可以创建一个用数组卖现的简单哈希表来存储第二个字符串。这样我们从头到尾扫描第一个字符串的每个字符时,用O(1)时间就能判断出该字符是不是在第二个字符串中。如果第一个字符串的长度是n,那么总的时间复杂度是O(n)。

void fuctionB(char *str1,char *str2){
    
    
	char help[256];
	char *str0 = str1;
	char *str3 = str2;
	
	for(;*str3!='\0';str3++)
	{
    
    
		help[*str3]=*str3;
	}

	for(;*str1!='\0';str1++)
	{
    
    
		str3 = str2;
		for(;*str3 != '\0';str3++)
		{
    
    
			if(help[*str3] == *str1)
				delete_char1(str0,*str1);
		}
	}
}
			
void delete_char1(char *str,char target)//删除字符串中指定字符
{
    
    
	char *str1 = str;
	for(;*str1 != '\0';str1 ++){
    
    
		if(*str1 != target)
		{
    
    
			*str = *str1;
			str++;
		}
	}
	*str = '\0';
}

在这里插入图片描述

2)
定义一个函数,删除字符串中所有重复出现的字符。例如,输入"google",删除重复的字符之后的结果是“gole”。这道题目和上面的问题比较类似,我们可以创建一个用布尔型数组实现的简单的哈希表。数组中的元素的意义是其下标看作ASCII码后对应的字母在字符串中是否已经出现。我们先把数组中所有的元素都设为false。以"google"为例,当扫描到第一个g时,g的ASCII码是103,那么我们把数组中下标为103的元素设为true。当扫描到第二个g时,我们发现数组中下标为103的元素的值是true,就知道g在前面已经出现过。也就是说,我们用O(1)时间就能判断出每个字符是否在前面已经出现过。如果字符串的长度是n,那么总的时间复杂度是O(n)。

void fuctionC(char *str)
{
    
    
	bool help[256] = {
    
    false};

	char *slow = str;
	char *fast = str;

	for(; *fast != '\0';fast ++) {
    
    
		if( help[*fast] == false) {
    
    
			help[*fast] = true;
			*slow = *fast;
			slow ++;
		}
	}
	*slow = '\0';

}

在这里插入图片描述
3)
在英语中,如果两个单词中出现的字母相同,并且每个字母出现的次数也相同,那么这两个单词互为变位词(Anagram)。例如,silent与listen、evil与live等互为变位词。请完成一个函数,判断输入的两个字符串是不是互为变位词。我们可以创建一个用数组实现的简单哈希表,用来统计字符串中每个字符出现的次数。当扫描到第一个字符串中的每个字符时,为哈希表对应的项的值增加1。接下来扫描第二个字符串,当扫描到每个字符时,为哈希表对应的项的值减去1。如果扫描完第二个字符串后,哈希表中所有的值都是0,那么这两个字符串就互为变位词。

bool fuctionD(char *str1,char *str2){
    
    
	int help[256] = {
    
    0};
	for(;*str1 != '\0';str1++)
		help[*str1]++;
	for(;*str2 != '\0';str2++)
		help[*str2]--;

	for(int i = 0;i < 256;i++){
    
    
		if(help[i] != 0)
			return false;
	}
	return true;
}

在这里插入图片描述

题目二:
请实现一个函数,用来找出字符流中第一个只出现一次的字符,例如,当从字符流中只读出两个字符"go"时,第一个只出现一次的是’g’;当从该字符流中读出6个字符"google"时,第一个只出现一次的字符是‘l’。

分析:
字符只能一个接着一个从字符流中读出来。可以定义一个数据容器来保存字符在字符流中的位置。当一个字符第一次从字符流中读出来时,把它在字符流中的位置保存到数据容器里。当这个字符再次从字符流中读出来时,那么它就不是只出现一次的字符,也就可以被忽略了。这时把它在数据容器里保存的值更新成一个特殊的值(如负数值)。这个数据容器可以用哈希表来实现。用字符的ASCII码作为哈希表的键值,而把字符对应的位置作为哈希表的值。

class CharStatistics
{
    
    
public:
    CharStatistics() : index(0) //位置下标初始化为0
    {
    
    
        for(int i = 0; i < 256; ++i)
            occurrence[i] = -1;
    }

    void Insert(char ch)
    {
    
    
        if(occurrence[ch] == -1)
            occurrence[ch] = index;
        else if(occurrence[ch] >= 0)
            occurrence[ch] = -2;

        index++; //位置下标每经过一个字符加1
    }

    char FirstAppearingOnce()
    {
    
    
        char ch = '\0';
        int minIndex = numeric_limits<int>::max(); // 编译器所允许的int类型的最大值
        for(int i = 0; i < 256; ++i)
        {
    
    
            if(occurrence[i] >= 0 && occurrence[i] < minIndex)
            {
    
    
                ch = (char) i;
                minIndex = occurrence[i];
            }
        }

        return ch;
    }
private:
    int occurrence[256];
    int index;
};

在上述代码中,哈希表用数组occurrence 实现。数组中的元素occurence和ASCII码的值为i的字符相对应。最开始的时候,数组中的所有元素都初始化为-1。当一个ASCII码为i的字符第一次从字符流中读出时,occurrence的值更新为它在字符流中的位置。当这个字符再次从字符流中读出时(occurrence[]大于或者等于0),occurrence的值更新为-2。

当我们需要找出到目前为止从字符流里读出的所有字符中第一个不重复的字符时,只需要扫描整个数组,并从中找出最小的大于等于0的值对应的字符即可。

Guess you like

Origin blog.csdn.net/scarificed/article/details/120593802