超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了! 上午11时 2025/05/16 作者 量子位 成天花板被重新定义了。 MiniMax最新发布 Speech-02 ,同时拿下 Artificial
「不思考」反而更强?上海AI Lab重新定义视觉强化学习微调最优路径 下午4时 2025/05/08 作者 PaperWeekly 且在一些模型上取得了优于监督微调(SFT)的成果。 RFT 利用可验证的奖励进行训练,鼓励模型在回答
ICLR 2025 差分注意力机制爆火!DIFF Transformer击穿长文本建模天花板 下午4时 2025/04/30 作者 PaperWeekly 建模能力为语言理解与生成带来了前所未有的突破。 然而,随着模型规模的不断扩大和应用场景的日益复杂,传
扩散模型还原被遮挡物体,几张稀疏照片也能”脑补”完整重建交互式3D场景|CVPR’25 下午4时 2025/04/23 作者 量子位 就能重建出一个完整、细节丰富且可自由交互的3D场景? 在传统方法中,这几乎是不可能完成的任务,稀少的
GPT-4o能拼好乐高吗?首个多步空间推理评测基准来了:闭源模型领跑,但仍远不及人类 上午11时 2025/04/23 作者 量子位 拼好乐高吗? 你有没有想过这样的问题: 多模态大语言模型真的具备理解和推理空间结构的能力吗? 在多步
视觉自回归生成理解编辑大一统!北大团队多模态新突破,训练数据代码全面开源 上午11时 2025/04/15 作者 量子位 和OpenAI的GPT-4o等先进模型又一次推动了AI浪潮。这些模型通过整合文本、图像、音频等多种数
精度飙升13.7%!复旦发布CAD参数化新基准,PHT-CAD框架精准解析工程图纸 下午4时 2025/04/02 作者 PaperWeekly 性。上述这一局限性导致许多学术上的解决方案难以直接应用于实际工业设计流程中。 为了填补学术社区中这一
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤 上午11时 2025/03/29 作者 量子位 外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC
比肩LLaMA 3!人大高瓴提出语言模型新范式:首个8B扩散大语言模型LLaDA 下午11时 2025/02/22 作者 PaperWeekly 突破性进展,展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前,普遍的观点认为其成功依赖于自
杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini 下午12时 2025/01/28 作者 量子位 衡宇 白交 发自 川渝 量子位 | 公众号 QbitAI 眼看着半只脚都跨进蛇年了,杭州城还是一如既