NLP-TF2.0-C3W1L3-Using APIs.单词向量化 - 代码天地

NLP-TF2.0-C3W1L3-Using APIs.单词向量化

其他 2019-07-05 10:52:16 阅读次数: 0

Coursera课堂笔记Natural Language Processing in TensorFlow

单词向量化是把句子中的单词用数字来编码，如：

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.preprocessing.text import Tokenizer

sentences = [
    'i love my dog',
    'I love my cat',
]

tokenizer = Tokenizer(num_words=100)
tokenizer.fit_on_texts(sentences)
word_index = tokenizer.word_index
print(word_index)

输出：

{'i': 1, 'love': 2, 'my': 3, 'dog': 4, 'cat': 5}

请注意，原句中有小写的i和大写的I，向量化后都用小写i。

现在增加一个句子： 'You love my dog'，其中love、my、dog都已经存在，实际上只新增了一个单词You

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.preprocessing.text import Tokenizer

sentences = [
    'I love my dog',
    'I love my cat',
    'You love my dog'
]

tokenizer = Tokenizer(num_words=100)
tokenizer.fit_on_texts(sentences)
word_index = tokenizer.word_index
print(word_index)

输出：

{'love': 1, 'my': 2, 'i': 3, 'dog': 4, 'cat': 5, 'you': 6}

猜你喜欢

转载自blog.csdn.net/menghaocheng/article/details/93157527

NLP-TF2.0-C3W1L3-Using APIs.单词向量化

【TF2.0-NLP】Hello world（单词向量化）

NLP-TF2.0-C3W1L6-Padding

NLP-TF2.0-C3W1L5-Text to sequence

文本向量化及词袋模型 - NLP学习（3-1）

3-6 向量化操作

NLP | 文本特征向量化方法

NLP之文档向量化算法综述

深度学习框架对比与单词向量化

NLP学习（九）文本向量化doc2vec及案例实现-Python3实现

NLP学习（八）文本向量化word2vec及案例实现-Python3实现

（1）程序解读--向量化计算

鬼吹灯文本挖掘1：jieba分词和CountVectorizer向量化鬼吹灯文本挖掘3：关键词提取和使用sklearn 计算TF-IDF矩阵

pandas数组(pandas Series)-(3)向量化运算

NLP-词和文档向量化方法

NLP基础之分词、向量化、词性标注

Mahout TF-IDF向量化源码解析

文本型数据的向量化:TF-IDF

基于TF-IDF文本向量化的垃圾短信识别

1. 文本相似度计算-文本向量化

向量化

吴恩达机器学习（二）线性回归 3/3 —— 向量化及正规方程

NLP：利用DictVectorizer对使用字典存储的数据进行特征抽取与向量化

NLP 中语言表示 (向量化) 的基本原理和历史演变综述

文本处理-分词、向量化、TF-IDF理论和实现

用深度学习实现自然语言处理：word embedding，单词向量化

skip-gram,单词向量化算法及其数学原理

Web APIs-Day3

【大模型AIGC系列课程 2-1】文本向量化

生成曼德勃罗集合(Matlab向量化版本和C++加速版本）

今日推荐

手把手教你用 LangChain 实现大模型 Agent

外星人入侵（python）

超全的免费chatGPT列表【建议收藏】

52.2k star! 自己部署gpt4free, 免费使用各种GPT

2024年（第十届）全国大学生统计建模大赛优秀论文解析——中国经济发展与碳排放库兹涅茨曲线的验证研究

【自动驾驶技术】自动驾驶汽车AI芯片汇总——NVIDIA篇

7个免费的ChatGPT网站，给大家送上

Angular v18 正式发布！

【VMware】 vCenter Converter standalone 6.6.0正式版下载

开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

周排行

慧测学习课件

Mscordacwks.dll/SOS.dll 调试归档

关于深度学习人工智能模型的探讨（二）（7）

Stop Using the text-indent:-9999px

Least Common Multiple（HDU - 1019 ）

Comparator接口的使用方法--例子

修改framework Camera的API,旋转摄像头

机器学习时代的“大数据+”：数据平台的设计与搭建

vue 项目部署到nginx

webstorm 常用插件集合

每日归档

更多

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)