谷歌Gemini频繁更新,这次能逆袭吗?

谷歌 Gemini AI 最近动作频频。发布了参数量仅为 DeepSeek-V3 1/25 的 Gemma 3,以及支持生图功能的 Gemini 2.0 Flash-Exp 模型,并开放了 Gemini 的 Deep Research 使用权限,升级为自家推理模型 Gemini 2.0 Flash Thinking。新增个性化模式和 Gems 智能体平台等功能。

Light-R1-32B之R1复现认识:兼看R1蒸馏模型所用800K数据细节问题

今天是2025年3月14日,星期五,北京天气晴。Light-R1-32B复现了R1的效果,但限定于数学领域AIME24、AIME25、GPQA Diamond等数据集;同时指出R1蒸馏模型所用800K数据是否来自训练还是由R1生成尚存争议。