余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一
机器学习和数据科学中常用的余弦相似度可能产生不透明且任意的结果。Netflix 和康奈尔大学的研究指出,正则化技术对线性模型的嵌入影响显著,导致余弦相似度不再可靠。研究提出避免余弦相似度使用的方法,并推荐了替代方案如欧几里得距离、点积和归一化等。
机器学习和数据科学中常用的余弦相似度可能产生不透明且任意的结果。Netflix 和康奈尔大学的研究指出,正则化技术对线性模型的嵌入影响显著,导致余弦相似度不再可靠。研究提出避免余弦相似度使用的方法,并推荐了替代方案如欧几里得距离、点积和归一化等。