Rasa_NLU及Rasa_NLU_Chi本地代码调试

前言

自然语言理解(NLU)是任务型对话系统等更高级应用的基石,基本的NLU工具,包括实体识别和意图识别两个任务。
已有的NLU工具,大多是以服务的方式,通过调用远程http的restful API来对目标语句进行解析完成上述两个任务。对于对数据比较敏感的用户来讲,开源项目Rasa_NLU可以本地部署,也可以针对实际需求训练和调整模型。
Rasa_NLU只支持英语和德语两种语言,中文因为其特殊性需要加入特定的tokenizer作为整个流水线的一部分,Rasa_NLU_Chi是其支持中文的版本,首先,为Rasa_NLU_Chi的大佬点赞。
因项目需求,我选择Rasa_NLU_Chi研究,看了其文档,是一头雾水,平时项目下载下来都是在python上一步一步调试来理解代码的,这个项目(黑人问号),网上查了很多资料,流程也都跟github上的官方文档一样,只好为了自己的目标(为了方便迁移)一步一步实现在python上调试了。

我使用的是python3.6,好像该项目对python2和python3兼容

训练

1.采用> git clone https://github.com/crownpku/Rasa_NLU_Chi.git 将项目下载到本地;
2. 进入到Rasa_NLU_Chi文件中,打开终端,运行python setup.py install
3.下载训练好的MITIE模型total_word_feature_extractor_chi.dat,分享如下。
链接:http://pan.baidu.com/s/1micEF0G 密码:opli
下载后放置位置为Rasa_NLU_Chi/data/total_word_feature_extractor_chi.dat
4.在Rasa_NLU_Chi文件 mkdir mitie, 然后进入到mitie文件下,在终端输入> git clone https://github.com/mit-nlp/MITIE.git 下载MITIE
然后进入到MITIE文件下,在终端输入python setup.py install
5.打开pycharm,打开Rasa_NLU_Chi工程,打开/rasa_nlu/train.py,在Edit Configurations中输入> -c …/sample_configs/config_jieba_mitie_sklearn.yml --data …/data/examples/rasa/demo-rasa_zh.json --path models
然后就可以调试train.py了

可能会有一些路径报错,对应进行修改就好了

测试的我因时间问题,还没来得及测试,测试后再更

猜你喜欢

转载自blog.csdn.net/Suan2014/article/details/84143330