ほとんどのNLTKを理解するのは初めてのための最も最近の料理と、以下のコードを学びたいです
nltk.tokenizeインポートsent_tokenize
MYTEXT =「こんにちはミスターアダム、どのように私はすべてがうまくいっている願っています。今日は良い日です、あなたの男を参照してください?です。」
sent_tokenize(MYTEXT)
出现报错、
リソースPUNKTが見つかりません。
リソースを取得するためにNLTKのダウンローダを使用してください:
輸入NLTKの
nltk.download( 'PUNKT')
しかし、実際にはそれが存在します
密接に見て、
間違いがCドライブの下にCを検索:\ユーザーは胡/ nltk_dataを\
で検索:
- 'C:\ユーザーは\胡/ nltk_data'
- 'D:\はProgramData \ Miniconda3 \ ENVS \ tensorflow \ nltk_data'
- 'D:\はProgramData \ Miniconda3 \ ENVS \ tensorflow \共有\のnltk_data'
- 'D:\はProgramData \ Miniconda3 \ ENVS \ tensorflow \ libに\ nltk_data'
- 'C:\ Users \ユーザー胡\のAppData \ローミング\のnltk_data'
- 'C:\ nltk_data'
- 'D:\ nltk_data'
- 'E:\ nltk_data'
- 「」
ソースの表示を見ることができます
トークナイザ=負荷( 'トークナイザ/ PUNKT / {0} .pickle'.format(言語))
ロードNLTKからのデータを見ます
デフ・ロード(
resource_url、
フォーマット= 'auto'で、
キャッシュ= Trueの場合、
冗長= Falseを、
logic_parser =なし、
fstruct_reader =なし、
エンコーディング=なし、
ここからは、私の最初の反応はresource_urlだった、それはすぐ後に見つかった発見されました
resource_url = normalize_resource_url(resource_url)
resource_url = add_py3_data(resource_url)
まず、マスクされたキャプションの窓= sys.platform.startswith(「勝利」)を見た
ので、私は早く見つけ
経路+ = [
os.path.join(はsys.prefix、STR( 'nltk_data'))、
os.path.join(はsys.prefix、STR( '共有')、STR( 'nltk_data'))
はos.path .join(はsys.prefix、STR( 'libに')、STR( 'nltk_data'))、
os.path.join(os.environ.get(STR( 'APPDATA')、STR( 'C:\')) 、STR( 'nltk_data'))、
STR(R'C:nltk_data \ ')、
STR(r'D:\ nltk_data')、
STR(r'E:\ nltk_data ')、
:だから私は[ 'Users \ユーザー/胡/のAppData /ローミング/ nltk_data D'] = nltk.data.pathを変更し
、正常に実行するには、[OK]
[「こんにちはミスターアダム、どのようにあなたは?」、「私はすべてがうまくいっている願っています。」、「今日は良い日です、あなたに男を参照してください。」]
プロセス終了コード0で終了