【NLP】【报错】 - nltk.download()、Resource punkt not found

1. 错误代码

import nltk

sentence = """are you ok?"""
tokens = nltk.word_tokenize(sentence)
tokens 

2. 错误信息

在这里插入图片描述

3. 错误分析

  1. niltk.download()下载不了相应模块,可能是因为被墙了的原因。
  2. 错误内容为:在指定目录下找不到指定依赖包

4. 解决方案

  1. 科学上网下载相应的依赖包(笔者试过,不好使)
  2. 去github上下载全部的工具包,并解压到以上任意目录下(git地址:https://github.com/nltk/nltk_data

5. 解决步骤

  1. 下载相应的依赖包集合(文件大小大概有700MB)
    在这里插入图片描述
  2. 解压到指定目录下,(由于文件过大,下载不方便,且有可能在其他虚拟环境中用的到,所以笔者解压到了以下目录),并且注意吧packages名字改为nltk_data
    在这里插入图片描述
  3. 这里注意,需要解压你所需依赖包里的压缩文件,例如,我需要的是punkt,我则需要进去解压相应的文件。(为了防止报错,我建议解压nltk_data下的所有子压缩包)
    在这里插入图片描述
  4. 解压文件,并注意路径
    在这里插入图片描述
  5. 重新打开代码,重新运行
    在这里插入图片描述

6. 参考资料

  1. nltk官网地址:https://www.nltk.org/
  2. nltk_data链接:https://github.com/nltk/nltk_data
  3. 参考博客:nltk.download()下载失败

猜你喜欢

转载自blog.csdn.net/weixin_42279212/article/details/121422351