哥德尔-Prover超过DeepSeek-Prover,金驰、陈丹琦团队造出当前最强形式化推理模型
近日,普林斯顿大学团队开源了用于自动定理证明的形式化推理模型Goedel-Prover,并在数学问题的自动形式化证明生成任务上达到SOTA。该模型基于两个形式化转换器训练,其中一个基于Lean Workbook中的非形式-形式语言对训练,另一个采用Claude-sonnet-3.5标注的语言对进行训练。通过专家迭代方法提升性能,在miniF2F上的正确率比最优模型提高7.6%。
近日,普林斯顿大学团队开源了用于自动定理证明的形式化推理模型Goedel-Prover,并在数学问题的自动形式化证明生成任务上达到SOTA。该模型基于两个形式化转换器训练,其中一个基于Lean Workbook中的非形式-形式语言对训练,另一个采用Claude-sonnet-3.5标注的语言对进行训练。通过专家迭代方法提升性能,在miniF2F上的正确率比最优模型提高7.6%。
腾讯元宝接入DeepSeek-R1满血版,并支持联网搜索。它现在可以自由选择使用混元模型或DeepSeek-R1,覆盖微信公众号等腾讯生态信息源,提升了用户交互体验和知识准确性。
谷歌推出WebLI-100B数据集,包含1000亿图像-文本对,显著提升多模态模型的文化多样性和多语言能力。研究发现,虽然CLIP等模型过滤筛选数据的过程可能降低模型的多元性,但更大规模的数据有助于改善模型在文化多样性和语言处理方面的表现。