自然语言处理基础技术工具篇之spaCy

其他 2019-01-31 16:00:51 阅读次数: 0

版权声明：转载请注明出处，谢谢~~ https://blog.csdn.net/m0_37306360/article/details/85872718

更多实时更新的个人学习笔记分享，请关注：
知乎：https://www.zhihu.com/people/yuquanle/columns
微信订阅号：AI小白入门
ID: StudyForAI

spaCy简介

spaCy是世界上最快的工业级自然语言处理工具。支持多种自然语言处理基本功能。
官网地址：https://spacy.io/
spaCy主要功能包括分词、词性标注、词干化、命名实体识别、名词短语提取等等。

spaCy

安装：pip install spaCy

国内源安装：pip install spaCy -i https://pypi.tuna.tsinghua.edu.cn/simple

import spacy
nlp = spacy.load('en')
doc = nlp(u'This is a sentence.')

1.tokenize功能

for token in doc:
    print(token)

This
is
a
sentence
.

2.词干化（Lemmatize)

for token in doc:
    print(token, token.lemma_, token.lemma)

This this 1995909169258310477
is be 10382539506755952630
a a 11901859001352538922
sentence sentence 18108853898452662235
. . 12646065887601541794

3.词性标注(POS Tagging)

for token in doc:
    print(token, token.pos_, token.pos)

This DET 89
is VERB 99
a DET 89
sentence NOUN 91
. PUNCT 96

4.命名实体识别（NER）

for entity in doc.ents:
    print(entity, entity.label_, entity.label)

5.名词短语提取

for nounc in doc.noun_chunks:
    print(nounc)

a sentence

猜你喜欢

转载自blog.csdn.net/m0_37306360/article/details/85872718

自然语言处理基础技术工具篇之spaCy

自然语言处理基础技术工具篇之NLTK

自然语言处理基础技术工具篇之Pyltp

自然语言处理基础技术工具篇之Stanfordcorenlp

自然语言处理基础技术工具篇之SnowNLP

自然语言处理基础技术工具篇之Flair

自然语言处理基础技术工具篇之PKUSeg

自然语言处理基础技术工具篇之TextBlob

自然语言处理基础技术之组合范畴文法

自然语言处理——基础篇01

Windows下在anaconda环境中安装自然语言处理工具---Spacy

下载spacy——工业级别的自然语言处理工具包

spacy自然语言处理工具库--en_core_web_sm

自然语言处理 Spacy & NLTK实操

自然语言处理--使用 spaCy 进行词性标注

[自然语言处理] 自然语言处理库spaCy使用指北

自然语言处理1——探索自然语言处理的基础 - Python入门篇

技术03期：自然语言处理NLP【分词篇】

自然语言处理基础

自然语言处理基础技术之依存句法分析

自然语言处理基础技术之命名实体识别实战

自然语言处理基础技术之成分句法分析

自然语言处理基础技术之命名实体识别简介

自然语言处理基础技术之成分句法分析实战

自然语言处理基础技术之依存句法分析实战

自然语言处理基础技术之分词实战

自然语言处理基础技术之分词介绍

自然语言处理基础技术之词性标注

自然语言处理基础技术之词性标注实战

自然语言处理基本概念及基础工具

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)