word2vec是什么(概念)

版权声明: https://blog.csdn.net/Dorothy_Xue/article/details/84641944

word2dev是Google在2013年开源的一款用于计算词向量的工具。

  1. 首先,word2dev可以在百万数量级的词典上和上亿的数据集上进行高效的训练
  2. word2dev得到的训练结果——词向量(word embedding),可以很好地度量词与词之间的相似性

word2dev算法的背后其实是一个浅层神经网络。另外需要指出的是,word2dev是一个计算word vector的开源工具,当我们在说word2dev算法的时候,其实就是指背后用于计算word vector的CBoW模型和Skip-gram模型

word2dev是从大量文本语料中,用无监督的方式学习语义知识的一种模型,广泛用于NLP。

word2dev其实就是通过学习文本,来用词向量的方式表征词的语义信息,也就是,通过一个嵌入空间使得语义上相似的单词在该空间内距离很近。embedding其实就是一个映射,将单词从所属的空间映射到新的多维空间中,也就是把原先词所在的空间嵌入到一个新的空间中。

猜你喜欢

转载自blog.csdn.net/Dorothy_Xue/article/details/84641944
今日推荐