pyhanlp 工具类HanLP基本使用

工具类HanLP调用常用接口

分词

可以用两种方法输出:

from pyhanlp import *
content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
words = HanLP.segment(content)
for term in words:
    print(term.word, term.nature)
print(words)

在这里插入图片描述

在这里插入图片描述

依存句法分析

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
words = HanLP.parseDependency(content)
print(words)

在这里插入图片描述

关键词提取

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
words = HanLP.extractKeyword(content, 10)
print(words)

在这里插入图片描述

摘要提取

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"

words = HanLP.extractSummary(content, 1)#提取短语,同时指定摘要的最大长度 
print(words)

在这里插入图片描述

感知机词法分析器

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
PerceptronLexicalAnalyzer = JClass('com.hankcs.hanlp.model.perceptron.PerceptronLexicalAnalyzer')
analyzer = PerceptronLexicalAnalyzer()
words = analyzer.analyze(content)
print(words)

在这里插入图片描述

中国人名识别

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
NER = HanLP.newSegment().enableNameRecognize(True)
words = NER.seg(content)
print(words)

在这里插入图片描述

音译名识别

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,珍妮还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
NER = HanLP.newSegment().enableTranslatedNameRecognize(True)
words = NER.seg(content)
print(words)

在这里插入图片描述

短语提取

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,珍妮还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
words = HanLP.extractPhrase(content, 3)
print(words)

在这里插入图片描述

简繁转换

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
Traditional_content = "雖然原始的食材便具有食物原始的風情,雲初還是認爲," \
                      "最美味的食物還是需要經過分割,烹調,處置,最後端上桌的食物纔是最符合大唐人腸胃的食物。"
print(HanLP.convertToTraditionalChinese(content))
print(HanLP.convertToSimplifiedChinese(Traditional_content))

在这里插入图片描述

拼音转换

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
print(HanLP.convertToPinyinList(content))

在这里插入图片描述

声母、韵母

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
words = HanLP.convertToPinyinList(content)
for i in words:
    print(i.getShengmu(), i.getYunmu())

在这里插入图片描述

pyhanlp可视化

使用命令hanlp serve
在这里插入图片描述
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_43788986/article/details/127174031
今日推荐