django中jieba分词的使用 - 代码天地

django中jieba分词的使用

编程语言 2018-04-19 12:14:31 阅读次数: 4

中文分词工具jieba的使用

1.进入到安装了全文检索工具包的虚拟环境中
- /home/python/.virtualenvs/py3_django/lib/python3.5/site-packages/
- 进入到haystack/backends/中
2.创建ChineseAnalyzer.py文件

 import jieba
 from whoosh.analysis import Tokenizer, Token

 class ChineseTokenizer(Tokenizer): def __call__(self, value, positions=False, chars=False, keeporiginal=False, removestops=True, start_pos=0, start_char=0, mode='', **kwargs): t = Token(positions, chars, removestops=removestops, mode=mode, **kwargs) seglist = jieba.cut(value, cut_all=True) for w in seglist: t.original = t.text = w t.boost = 1.0 if positions: t.pos = start_pos + value.find(w) if chars: t.startchar = start_char + value.find(w) t.endchar = start_char + value.find(w) + len(w) yield t def ChineseAnalyzer(): return ChineseTokenizer()

3.拷贝whoosh_backend.py为whoosh_cn_backend.py
```
cp whoosh_backend.py whoosh_cn_backend.py
```
4.更改分词的类为ChineseAnalyzer
- 打开并编辑 whoosh_cn_backend.py
- 引入from .ChineseAnalyzer import ChineseAnalyzer
- 查找
```
  analyzer=StemmingAnalyzer()
  改为
  analyzer=ChineseAnalyzer()
```
5.更改分词引擎
6.重新创建索引数据
```
python manage.py rebuild_index
```

自定义上下文
haystack 官网 http://django-haystack.readthedocs.io/en/master/views_and_forms.html

　　定义视图view,需要定义在查询的模型类视图里　

# views.py
from haystack.generic_views import SearchView class MySearchView(SearchView): """My custom search view.""" def get_context_data(self, *args, **kwargs): context = super(MySearchView, self).get_context_data(*args, **kwargs) context[''] = return context # urls.py urlpatterns = [ url(r'^/search/?$', MySearchView.as_view(), name='search_view'), ]

猜你喜欢

转载自blog.csdn.net/tiexhehongfei/article/details/80003067

django中jieba分词的使用

python中jieba分词使用基本介绍

Python使用jieba分词

jieba 分词使用入门

jieba 分词的使用

python中的jieba分词使用手册

jieba分词中的词性类型

Python jieba分词的简单使用

在 Django 中部署 jieba 分词 Python 算法

jieba分词

Python3中的 jieba分词

jieba分词中的特殊字符处理

python anaconda 中安装jieba分词模块

jieba分词工具的使用-python代码

使用jieba分词提取关键词

python使用jieba分词时报错

Python3使用jieba分词

【Python】使用jieba对文本进行分词

分词工具比较及使用(ansj、hanlp、jieba)

分词工具Jieba使用过程记录

使用Jieba分词学习PaddleNLP(学习笔记)

分词jieba和LAC的对比使用记录

基于python中jieba包的中文分词中详细使用（二）

基于python中jieba包的中文分词中详细使用（一）

分词————jieba分词（Python）

【自然语言处理】python中的jieba分词使用手册

python中读入文件jieba分词，使用字典和停用词，再将结果写入文件

Python库中，如何使用jieba模块来实现古典名著《西游记》的分词

【jieba分词】中文分词工具jieba

中文分词原理及jieba分词

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)