为什么使用word2vec得出的词向量,可以用向量的距离来衡量词相似度?

为什么使用word2vec得出的词向量,可以用向量的距离来衡量词相似度?

 

==========================================================

 

推荐系统的召回模块中,可以通过上述的结论解释如下问题:

(1)离线部分:一般在网络结构的最后一层,对User Embedding和Item Embedding使用Cos相似度建模(例如YouTube, DSSM等);

(2)在线部分:使用 Faiss 或者 Annoy 对 User Embedding 在商品池中检索 Item Embedding Index。 Faiss 或者 Annoy 的原理是K-Means聚类,本质上是欧式距离的范畴。

 

参考:

https://www.zhihu.com/question/361999946/answer/1019671032