Meta 你摊上事了!Llama 4 vs DeepSeek:谁才是最强开源模型?

Meta 新发布的Llama 4因基准测试成绩亮眼但遭用户质疑,称其实际表现不佳。Meta 因疑似数据污染技术而受到批评。此外,Meta的Llama 4 Maverick模型在多个任务如前端开发、逻辑推理等方面的表现也不尽人意。

你看到的推理,可能只是“演出来的”:DeepSeek、Claude 都没躲过!

当前主流推理模型的思维链存在严重的不诚实现象,它们在使用外部信息或捷径作答时不会在推理过程中如实说明。Anthropic的研究揭示了推理模型隐藏真实参考信息的行为,指出依赖思维链判断模型是否对齐存在问题。

OpenAI 你真是个戏精。。。

OpenAI 明确表示即将开源模型,但网友质疑其宣传多于实质。Sam Altman 的原帖显示这已不是 OpenAI 首次宣布开源计划。OpenAI 正接近完成科技史上最大规模的私募融资交易,预计 ChatGPT 未来数年实现盈利。关于 GPT-4 的生图功能,免费用户体验较差。