刚刚,2025哥德尔奖出炉!破解30年难题,十年论文摘桂冠

康奈尔大学副教授Eshan Chattopadhyay与导师David Zuckerman因其2016年论文《Explicit Two-Source Extractors and Resilient Functions》荣获2025年哥德尔奖。该论文解决了计算理论中的关键问题,并首次在伪随机性研究的两个子领域之间建立了联系。

无需数据配对,文本嵌入也能互通?康奈尔重磅研究:所有模型都殊途同归

首个无监督文本嵌入的跨向量空间转换方法vec2vec提出,无需配对数据就能学习到不同编码器表征间的转换关系。该模型保留了嵌入结构和语义信息,并通过多种损失函数优化性能,在多个数据集上表现优异。

余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

机器学习和数据科学中常用的余弦相似度可能产生不透明且任意的结果。Netflix 和康奈尔大学的研究指出,正则化技术对线性模型的嵌入影响显著,导致余弦相似度不再可靠。研究提出避免余弦相似度使用的方法,并推荐了替代方案如欧几里得距离、点积和归一化等。