txNLP 262-282

 one-hot中只有一个非零向量,相对集中。而对于分布式表示,向量中有大量的非零向量,相对分散,把词的信息分布到各个向量中去了。这一点跟并行计算里的分布式并行相像。

 Global Generation of Distributed Representation

 

猜你喜欢

转载自www.cnblogs.com/wqbin/p/12718971.html
今日推荐