关于遇到NLTK下载路径的一个小问题。 - 代码天地

关于遇到NLTK下载路径的一个小问题。

编程语言 2019-08-24 02:03:32 阅读次数: 0

最为小菜，最近初次了解NLTK，因此想学一下代码如下

nltk.tokenize import sent_tokenize
mytext = "Hello Mr. Adam, how are you? I hope everything is going well. Today is a good day, see you dude."
sent_tokenize(mytext)

出现报错，
Resource punkt not found.
Please use the NLTK Downloader to obtain the resource:

import nltk
nltk.download('punkt')

但实际上是存在的
关于遇到NLTK下载路径的一个小问题。

仔细一看，
错误中Search在C盘下C:\Users\Hu/nltk_data

Searched in:

'C:\Users\Hu/nltk_data'

'D:\ProgramData\Miniconda3\envs\tensorflow\nltk_data'

'D:\ProgramData\Miniconda3\envs\tensorflow\share\nltk_data'

'D:\ProgramData\Miniconda3\envs\tensorflow\lib\nltk_data'

'C:\Users\Hu\AppData\Roaming\nltk_data'

'C:\nltk_data'

'D:\nltk_data'

'E:\nltk_data'

''

查看源码可以看见

tokenizer=load('tokenizers/punkt/{0}.pickle'.format(language))

在看load来自nltk下的data

def load(
resource_url,
format='auto',
cache=True,
verbose=False,
logic_parser=None,
fstruct_reader=None,
encoding=None,

从这里，我的第一反应是resource_url，因此迅速找到下文发现

resource_url = normalize_resource_url(resource_url)
resource_url = add_py3_data(resource_url)

先看到被屏蔽的说明文字windows = sys.platform.startswith('win')
于是我找到前文

path += [
os.path.join(sys.prefix, str('nltk_data')),
os.path.join(sys.prefix, str('share'), str('nltk_data')),
os.path.join(sys.prefix, str('lib'), str('nltk_data')),
os.path.join(os.environ.get(str('APPDATA'), str('C:\')), str('nltk_data')),
str(r'C:\nltk_data'),
str(r'D:\nltk_data'),
str(r'E:\nltk_data'),

所以我改了nltk.data.path = ['D:\Users/Hu/AppData/Roaming/nltk_data']
OK运行成功

['Hello Mr. Adam, how are you?', 'I hope everything is going well.', 'Today is a good day, see you dude.']

Process finished with exit code 0

猜你喜欢

转载自blog.51cto.com/8001620/2432144

关于遇到NLTK下载路径的一个小问题。

关于BroadcastReceiver遇到的一个小问题记录

关于keywindow的一个小问题

关于toString的一个小问题

关于Integer的一个小问题

遇到的一个关于base64编码的小问题

处理数据的时候遇到的一个小问题

在Ubuntu下安装Matplotlib遇到的一个小问题

EasyPusher编译时遇到的一个小问题

idea使用时遇到的一个小问题

mysql安装中遇到的一个小问题

记录sdwan使用中遇到的一个小问题

关于运用inception-V3模型识别自己的图片时遇到的一个小问题

js中遇到的一个小问题，关于Uncaught ReferenceError:XXX is not defined at HTMLAnchorElement.onclick报错

关于getchar使用的过程中遇到的一个小问题（pat L1-054福到了）

关于kafka连接的一个小问题

请教一个关于 ++ 的小问题~NElk

关于CryptAPI函数的一个小问题fKZzK

一个关于sizeof的有趣的小问题

关于git上传文件的一个小问题

关于启动hadoop的一个小小小问题

关于Scanner输入类的一个小问题

vue滚动组件关于定位的一个小问题

一个关于sql排序的小问题

关于图论dfs的一个小问题

记录一个关于SecurityUtils.getSubject();的小问题

关于Rayon库的一个小问题记录

一个小问题

第一次搭mybatis框架遇到的一个小问题

搭建一个Electron项目时遇到的一些小问题

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

SVN同步出现问题

解决 nginx 出现 413 Request Entity Too Large 的问题

第一节区块链服务BaaS的总体架构以及基本模块设计的一种方案

ITeye 2013年度盘点——社区赠书书单

IDEA / git 和github 的新手使用教程史上最简单的 IntelliJ IDEA 教程史上最简单的 GitHub 教程

测试工程方法：测试用例设计综合策略

Spark优化(三)：对多次使用的RDD进行持久化

使用STM32 ST-LINK Utility 设置读保护后不能运行

exgcd 解同余方程ax=b(%n)

Android使用脚本进行多渠道打包

每日归档

更多

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)