用户体验差异归档 - 每时AI

Meta Llama 4被疑考试「作弊」：在竞技场刷高分，但实战中频频翻车

2025年4月7日16时作者机器之心

Meta发布AI模型Llama 4后，用户反馈编码能力不佳。尽管在基准测试中表现优异，但在实际编程任务中的效果欠佳，引发讨论。