5 月 2025 - 第5页共5页

DeepSeek开源最新大模型，数学能力大突破！

上午11时 2025/05/01 作者 AIGC开放社区

DeepSeek开源了V2数学大模型，参数量分别为671B和7B，在MiniF2F测试中的通过率为88.9%，在ProverBench中包含325个问题的评估集。

CVPR 2025 CV 微调卷出天际，Mona：我小、我强、我省资源

上午11时 2025/05/01 作者机器之心

本文提出了一种名为Mona的方法，通过引入多认知视觉滤波器和优化输入分布，在调整少于5%的骨干网络参数的情况下，显著提升了视觉识别任务的效果。

被Transformer光芒掩盖的论文，Meta科学家回顾十年前创新之作

上午11时 2025/05/01 作者机器之心

这篇论文是2015年发布的《End-to-End Memory Networks》，它包含了当前大型语言模型的许多要素，如完全用注意力机制替代RNN、引入带键值投影的点积软注意力机制和堆叠多层注意力等。尽管其影响力不及后来的《Attention is all you need》

DeepSeek开源Prover-V2强推理模型，网友：奥数从没这么简单过

上午11时 2025/05/01 作者机器之心

的新消息可没停下来。
前些天到处都在流传着 DeepSeek-R2 即将发布的传言，DeepSee

19K 标星！开源局域网文件传输神器，AirDrop 跨平台替代品！

上午8时 2025/05/01 作者开源星探

Snapdrop 是一个基于浏览器的局域网文件传输工具，无需安装、注册或额外客户端。它利用 WebRTC 和 WebSocket 技术实现跨平台文件共享，安全且匿名，支持多种设备之间的即时文件传输。

这轮大模型浪潮的幕后真神！

上午8时 2025/05/01 作者 GitHubStore

阿里巴巴推出全新云计算服务，简化企业上云过程。

狂揽60.4颗星！无需联网的跨平台文件传输神器LocalSend

上午8时 2025/05/01 作者 GitHubStore

LocalSend是一款跨平台应用，支持多种设备并通过REST API和HTTPS加密技术确保数据安全。它无需互联网连接或第三方服务器，所有数据仅在本地网络中传输。

DeepSeek「五一礼包」来了！新开源模型数学推理能力大提升｜附实测细节

上午8时 2025/05/01 作者 APPSO

DeepSeek 推出 DeepSeek-Prover-V2，支持最长32K上下文输入。基于递归加强化学习的组合训练，新模型在MiniF2F测试中实现88.9%通过率，覆盖高中到本科多个数学领域。

DeepSeek再开源！大模型直觉+强化学习新方法：AI 数学证明迎来新突破

上午8时 2025/05/01 作者 AI寒武纪

今日 AI 模型 DeepSeek-Prover-V2 开源，专为 Lean 4 形式化证明开发。该模型在 MiniF2F-test 测试集上达到88.9%通过率，并成功解决PutnamBench中的49个问题。DeepSeek-Prover-V2-671B结合大语言模型直觉和强化学习，提出两步法：首先合成数据，再用强化学习提升模型能力。

五一大瓜！大模型顶级排行榜被指系统性“造假”，官方紧急回应，Karpathy也下场质疑

上午8时 2025/05/01 作者 AI寒武纪

本文分析了LM Arena排行榜存在问题，并提出了替代方案OpenRouter。LM Arena存在排名与实际用户体验不符的问题。Andrej Karpathy指出，模型可能专门针对Arena分数进行优化，而非整体上更好。他推荐使用OpenRouter作为新的评估方式。最后分享了OpenRouter的综合大模型排行，涉及多个领域和场景。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31