Llama 4在测试集上训练?内部员工、官方下场澄清,LeCun转发

Meta 新发布的Llama 4模型在实战中表现不佳,引发了广泛质疑。尽管其在大模型竞技场上的排名不错,但在实际应用中的效果却不如人意。部分用户反馈称该模型存在多方面的问题,如生成代码、抽象推理等能力不足。为了澄清疑虑,Meta 发布了Llama 4的相关测试数据,并承认之前的宣传策略可能存在问题。

Andrej Karpathy最新发文:未来已来,这次技术红利,竟是普通人先“吃饱”

著名 AI 大牛安德烈·卡帕西的文章指出大语言模型(LLM)颠覆了技术普及的传统模式,普通人成为最早受益者。他分析了“万金油”与“专家团”、简单粗暴与精耕细作、灵活小船与笨重大船的不同,解释了为何 LLM 在企业和政府中的应用相对缓慢。