中问文本提取 - 代码天地

中问文本提取

其他 2020-02-18 14:29:01 阅读次数: 0

-----承接上篇中文文本提取

#coding=utf-8
from sklearn.feature_extraction.text import   TfidfVectorizer
import jieba



def cut_word(v):
    return  " ".join(list(jieba.cut(v)))

#尝试使用tf-idf算法思想进行文本特征提取
def  tf_context():
    data=["忠领他们到朱老明那里站在大柏树坟前说你看看这个地势怎么样我们的人要是从城里过来经过大渡口或是小渡口沿着千里堤"]
    data_new = []
    
    for sent in data:
        data_new.append(cut_word(sent))
    tfv = TfidfVectorizer(stop_words=["的"]);
    
    
    result =  tfv.fit_transform(data_new);
    print(result.toarray())
    print("/n")
    print(tfv.get_feature_names())
    
if  __name__=="__main__":
    tf_context()

又决定放弃

发布了35 篇原创文章 · 获赞 5 · 访问量 2424

私信关注

猜你喜欢

转载自blog.csdn.net/qq_24884193/article/details/104077618

中问文本提取

Java 提取json中的文本

HtmlParser提取网页中的纯文本信息

Java 提取Word中的文本和图片

使用Excel 提取文本中的数字

Java 提取PPT SmartArt图形中的文本

Unity提取场景中的静态文本

【每日一问】如何提取视频中的字幕？

用python提取文本中的数字, 文本复制

命名实体识别，使用pyltp提取文本中的地址

使用 lxml 中的 xpath 高效提取文本与标签属性值

python自动提取文本中的时间（包含中文日期）

基于百度OCR提取图像中的文本

Java 提取 PPT 中 SmartArt 图形的文本内容

用正则表达式提取文本中的日期

Excel批量提取文本中关键词2

POI-文本提取

文本提取调研(二)

文本提取调研(一)

文本提取及处理

文本特征提取

提取文本摘要学习

使用awk提取文本

python文本时间提取

图像中提取文本

PHP提取富文本字符串中的纯文本,并进行进行截取

PHP开发小技巧①⑥—提取富文本字符串中的文本内容

从html富文本中提取纯文本

文本表示与文本特征提取的区别

python提取pdf文本内容

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)