十万人の中国の巨大シソーラスシェア

十万人の中国の巨大シソーラスシェア
+このアルゴリズムはHanLPはそう、私は徐々にアルゴリズムはすべての問題を解決できないことを長い間実現しない、シソーラスも非常に重要であり、コーパス≈NLPの世界最大の語彙シソーラスです。通常、このアルゴリズムは関係なく、粉砕されているか、残りの20%の調整の最適化、問題の80%を解決することはできません。例えば、私は確かに二、三語の名前として、「区人民保険」の例が誤っ姓となるように言葉ビューのHMMのポイントは、「地域」、HMM名認識モジュールを襲った、「人」、「セキュリティ」可能性が高い最後の時間を述べましたしかし、普通の人には、名前になりません。私は「人」を入れた場合は、単語の頻度を減らすか、単語を削除するには、「保険」、「非常に熱い」保全の「王」とこれらの名前を認識しません。もともとそこの下に、「自然言語処理」カテゴリのブログ、「コーパス」この小さなクラス...

続きを読むヤードファーム >>千万中国の巨大シソーラスシェア

オリジナルリンク http://www.hankcs.com/nlp/corpus/tens-of-millions-of-giant-chinese-word-library-share.html

ます。https://my.oschina.net/hankcs/blog/342303で再現

おすすめ

転載: blog.csdn.net/weixin_33756418/article/details/91780446