HihoCoder-Trie树

首先关于Trie树的知识在另一篇文章中有介绍

题目描述:

小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。

这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你能不能对于每一个我给出的字符串,都在这个词典里面找到以这个字符串开头的所有单词呢?”

身经百战的小Ho答道:“怎么会不能呢!你每给我一个字符串,我就依次遍历词典里的所有单词,检查你给我的字符串是不是这个单词的前缀不就是了?”

小Hi笑道:“你啊,还是太年轻了!~假设这本词典里有10万个单词,我询问你一万次,你得要算到哪年哪月去?”

小Ho低头算了一算,看着那一堆堆的0,顿时感觉自己这辈子都要花在上面了...

小Hi看着小Ho的囧样,也是继续笑道:“让我来提高一下你的知识水平吧~你知道树这样一种数据结构么?”

小Ho想了想,说道:“知道~它是一种基础的数据结构,就像这里说的一样!”

小Hi满意的点了点头,说道:“那你知道我怎么样用一棵树来表示整个词典么?”

小Ho摇摇头表示自己不清楚。

提示一:Trie树的建立

“你看,我们现在得到了这样一棵树,那么你看,如果我给你一个字符串ap,你要怎么找到所有以ap开头的单词呢?”小Hi又开始考验小Ho。

“唔...一个个遍历所有的单词?”小Ho还是不忘自己最开始提出来的算法。

“笨!这棵树难道就白构建了!”小Hi教训完小Ho,继续道:“看好了!”

提示二:如何使用Trie树

提示三:在建立Trie树时同时进行统计!

“那么现在!赶紧去用代码实现吧!”小Hi如是说道

题目输入:

输入的第一行为一个正整数n,表示词典的大小,其后n行,每一行一个单词(不保证是英文单词,也有可能是火星文单词哦),单词由不超过10个的小写英文字母组成,可能存在相同的单词,此时应将其视作不同的单词。接下来的一行为一个正整数m,表示小Hi询问的次数,其后m行,每一行一个字符串,该字符串由不超过10个的小写英文字母组成,表示小Hi的一个询问。

  • 在20%的数据中n, m<=10,词典的字母表大小<=2.

  • 在60%的数据中n, m<=1000,词典的字母表大小<=5.

  • 在100%的数据中n, m<=100000,词典的字母表大小<=26.

本题按通过的数据量排名哦~

题目输出:

对于小Hi的每一个询问,输出一个整数Ans,表示词典中以小Hi给出的字符串为前缀的单词的个数。

样例输入

5  
babaab  
babbbaaaa  
abba  
aaaaabaa  
babaababb  
5  
babb  
baabaaa  
bab  
bb  
bbabbaab 

样例输出

1  0  3  0  0 

C++实现代码

#include<iostream>    
#include<string.h>    
using namespace std;    
    
struct TrieNode{    
    int num;    
    TrieNode *child[26];//下个字符的26个字母可能性    
    TrieNode()    
    {    
        num=0;    
        memset(child,NULL,sizeof(child));    
    }    
};    
    
TrieNode* root;    
int temp;    
    
//将字符串word添加到字典树中     
void insert(string word)    
{    
    if(word.empty()) return;    
    
    TrieNode* p=root;    
    for(int i=0;i<word.size();++i)    
    {    
        temp=word[i]-'a';    
        if(p->child[temp]==NULL)    
        {    
            p->child[temp]=new TrieNode;//若节点不存在,则建立一个新节点    
        }    
        p=p->child[temp];    
        p->num++;    
    }    
}    
    
//返回所有以字符串pre为前缀的单词数量    
int prefixNumber(string pre)    
{    
    if(pre.empty()) return 0;    
     
    TrieNode* p=root;    
    for(int i=0;i<pre.length();++i)    
    {    
        temp=pre[i]-'a';    
        if(p->child[temp]==NULL)      
            return 0;    
        p=p->child[temp];    
    }    
    return p->num;    
}    
    
int main()    
{    
    int n,m;    
    string words,pre;    
    root=new TrieNode;    
    while(cin>>n)    
    {    
        while(n--)//数据输入
        {    
            cin>>words;    
            insert(words);    
        }    
        cin>>m;//查询数据
        while(m--)    
        {    
            cin>>pre;    
            int res=prefixNumber(pre);    
            cout<<res<<endl;    
        }    
    }    
    return 0;    
}   

字典树的典型应用:

1.统计一组字符串中某前缀出现的次数(直接用上面的代码就行)。

2.判断一组字符串中是否有一个字符串是另一个字符串的前缀。

分析:我们只要在结点中添加一个nEndFlag成员变量即可。若nEndFlag == 1,说明该结点字符是某一字符串的结尾(假设为A),若在插入B字符串的过程中经过这一结点,则说明A是B的 前缀;还有一种情况,当要插入最后一个字符c时,却发现p->next[c-'a']为真,则说明该字符串是一个前缀字符串,eg:先插入abcde,再插入abc这种情况。

  1. 串排序:给定N个互不相同的仅由一个单词构成的英文名,让你将他们按字典序从小到大输出

  用字典树进行排序,采用数组的方式创建字典树,这棵树的每个结点的所有儿子很显然地按照其字母大小排序。对这棵树进行先序遍历即可。

猜你喜欢

转载自www.cnblogs.com/RioTian/p/12686808.html