深度学习中文NLP任务实战（二）：使用训练好的词向量 - 代码天地

深度学习中文NLP任务实战（二）：使用训练好的词向量

其他 2018-07-16 05:15:39 阅读次数: 0

开篇

先放上我参考的一篇博客
tensorflow 使用预训练词向量

embedding层

我们使用预训练的词向量，最主要的目的就是为了生成embedding层的w

W = tf.Variable(tf.constant(0.0, shape=[vocab_size, embedding_dim]),
                trainable=False, name="W")
embedding_placeholder = tf.placeholder(tf.float32, [vocab_size, embedding_dim])
embedding_init = W.assign(embedding_placeholder)

sess.run(embedding_init, feed_dict={embedding_placeholder: embedding})

这里的前提就是你代码里面使用的词典和你预训练好的词向量的词典是一致的，这样你的词的id才能在词向量的表里面顺利找到相应的词向量，这样，你的embedding层才能顺利构建。

而事实上，你使用的别人训练好的词向量的词典可能非常大，而你自己的词典确是比较小的，一致的情况只会在你自己训练的词向量中会出现，这时候你需要自己手动去生成w。

    for w in vocab_processor.vocabulary_._mapping:
    #tensorflow生成的词表
        arr = []
        if w in inpH.pre_emb:
            arr = inpH.pre_emb[w]
            #pre_emd,我们预训练的词向量表
            if len(arr) > 0:
                idx = vocab_processor.vocabulary_.get(w)
                initW[idx] = np.asarray(arr).astype(np.float32)
    print("Done assigning intiW. len=" + str(len(initW)))

猜你喜欢

转载自blog.csdn.net/ding_xiaofei/article/details/80957629

深度学习中文NLP任务实战（二）：使用训练好的词向量

深度学习中文NLP任务实战（一）：中文词向量的训练

PyTorch在NLP任务中使用预训练词向量

深度学习-nlp系列（4）：Word2Vec 字&词向量的训练和使用

【深度学习】120G+训练好的word2vec模型（中文词向量）

Pytorch求索(3)：使用训练好的词向量

吴裕雄--天生自然神经网络与深度学习实战Python+Keras+TensorFlow：使用训练好的单词向量实现新闻摘要分类

tensorflow试用训练好的词向量

tensorflow深度学习实战笔记（二）：把训练好的模型进行固化

转：tensorflow深度学习实战笔记（二）：把训练好的模型进行固化

训练词向量实战

深度学习NLP-词向量篇（含代码实现）

Python Word2Vec使用训练好的模型生成词向量

word2vec训练好的词向量

05[NLP训练营]词向量

使用wiki中文数据训练词向量模型

基于“预训练词向量模型“和“深度学习“的情感分类(keras) 电影评论数据的中文情感分析

NLP学习笔记（二）：创建特征及训练（词袋）

训练好的深度学习模型是怎么部署的？

tensorflow保存训练好的深度学习模型

使用gensim训练词向量

深度学习tensorflow实战笔记用预训练好的VGG-16模型提取图像特征

深度学习-自然语言处理(NLP)：迁移学习（拿已经训练好的模型来使用）【GLUE数据集、预训练模型(BERT、GPT、transformer-XL、XLNet、T5)、微调、微调脚本】

中文NLP的第三步：获得词向量/词嵌入 word embeddings，基于 PaddleHub 实现（学习心得）

NLP之分词、词向量、预训练篇

tensorflow深度学习实战笔记（三）：使用tensorflow lite把训练好的模型移植到手机端，编译成apk文件

Kaldi学习笔记（五）——使用CVTE训练好的SR模型做中文在线识别

NLP：使用 gensim 中的 word2vec 训练中文词向量

NLP︱高级词向量表达（二）——FastText（简述、学习笔记）

《深度学习——实战caffe》——python接口学习（6）：用训练好的模型（caffemodel）来分类新的图片

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)