トライ(接頭辞木)

 

 

辞書木は何ですか?

トライは、私は非常に便利な文字列プレフィックスを追求するためにそれを使用するため、より多くのは、プレフィックスツリーと呼ばれるべきだと思います。

 

この図以上により、我々はそれを見つけます:

図1に示すように、エッジに文字トライを表します

2、同じプレフィックスを持つ単語ノードとの共通のプレフィックスが(それは、我々は接頭辞文字列を見つける必要があり、この理由のためであることは非常に便利です)

3、ツリー全体のルートは空です。

図4に示すように、各単語の端部は、特殊文字、黒によって図形で表され次いでから根元の点任意意図黒丸手紙のすべてのエッジの後の単語を表しています。

 

基本操作:

 

まず、挿入

私たちは「中」の文字列を挿入するとします。我々は表現ルート、即ちノード0、P = 0から始まります。私たちは、Pを見て、私は子ノードに接続されたエッジを持つロゴあります。このサイドなしで、私たちは新しいノード、すなわちノード1号、1号を作成し、ノードPが0のサブノードのノードの数、およびIとして同定エッジに設定されています。最後に、私たちは第一のノードに移動し、それは、そうP = 1です。

だから我々はトライで私に「中」の文字を入れました。その後、我々は、N、Pは、最初のn側としてマークされていない番号を持つノードを検索された文字を挿入します。かどうか、そして、さらに新たなノード2ノードのP 1サブノード番号として設定され、側面がNで識別されます。そして、最終的にはP = 2に移動しました。だから我々はまた、挿入されたn個置きます。nがあるので、最後の文字「に」ので、我々はまた、P = 2に、このノードがエンドポイントとしてマークされている必要があります。

今、私たちは、文字列「旅館」を挿入します。プロセスは、iが1番ノードを見つけるために、この時間を側のロゴを探し始めP = 0から、同じです。だから我々は、Pそう= 1、つまり、新しいノードを作成し、ノード番号1に直接移動する必要はありません。次に、文字nを挿入し、ノード番号2、移動ノードに番号2、P = 2の存在です。最後に、文字がP nは時刻n側ので、N側として識別番3号2ノードの子として新しいノードとして識別されていない挿入しながら終点ノード3のシリアル番号: 

 

 

私たちは、スタートアップの最高のビューを取得することができ、繰り返します!

 

第二に、探し

 

既然插入已经知道了,那么我们现在就来看看查找吧

 

查找其实比较简单。我们只要从根节点开始,沿着标识着S[1] -> S[2] -> S[3] … -> S[S.len]的边移动,如果最后成功到达一个终结点,就说明S在Trie树中;如果最后无路可走,或者到达一个不是终结点的节点,就说明S不在Trie树中。 

 

 

 如果是查找”te”,就会从0开始经过5最后到达6。但是6不是终结点,所以te没在Trie树中。如果查找的是”too”,就会从0开始经过5和9,然后发现之后无路可走:9号节点没有标记为o的边连出去。所以too也不在Trie中。

 

代码实现:

数组方式实现
要写代码实现一个Trie首先就要确定如何存储一个Trie结构。这里用一个二维数组来存储:

 

int trie[MAX_NODE][CHARSET];
int k;
其中MAX_NODE是trie中最大能存储的节点数目,CHARSET是字符集的大小,k是当前trie中包含有多少个节点。Trie[i][j]的值是0表示trie树中i号节点,并没有一条连出去的边,满足边上的字符标识是字符集中第j个字符(从0开始);trie[i][j]的值是正整数x表示trie树中i号节点,有一条连出去的边,满足边上的字符标识是字符集中第j个字符,并且这条边的终点是x号节点。

 



具体代码:

 1 #include <stdio.h>
 2 #include <string.h>
 3 #include <string>
 4 #include <iostream>
 5 #include <stdlib.h>
 6 #include <algorithm>
 7 
 8 using namespace std;
 9 const int MAX_NODE = 300001;
10 const int CHARSET = 26;
11 
12 int trie[MAX_NODE][CHARSET]={0};
13 int color[MAX_NODE]={0};
14 int k = 1;
15 
16 void insert(char *w)
17 {
18     int len = strlen(w);
19     int p = 0;
20     for (int i=0;i<len;i++)
21     {
22         int c = w[i]-'a';
23         if (!trie[p][c])
24         {
25             trie[p][c] = k;
26             k++;
27         }
28         p = trie[p][c];
29     }
30     color[p] = 1;
31 }
32 
33 
34 int search(char *s)
35 {
36     int len = strlen(s);
37     int p = 0;
38     for (int i=0;i<len;i++)
39     {
40         int c = s[i]-'a';
41         if (!trie[p][c])
42             return 0;
43         p = trie[p][c];
44     }
45     return color[p] == 1; //是不是其中的一个
46 }
47 
48 
49 int main()
50 {
51 #ifndef ONLINE_JUDGE
52     freopen("../in.txt","r",stdin);
53 #endif
54     int t,q;
55     char s[20];
56     scanf("%d%d", &t,&q);
57     while(t--){
58         scanf("%s", s);
59         insert(s);
60     }
61     while(q--){
62         scanf("%s", s);
63         if(search(s)) printf("YES\n");
64         else printf("NO\n");
65     }
66     return 0;
67 }

 

参考博客:https://blog.csdn.net/weixin_39778570/article/details/81990417

       https://www.cnblogs.com/TheRoadToTheGold/p/6290732.html

 

おすすめ

転載: www.cnblogs.com/-Ackerman/p/11209724.html