Grok 4 实测全纪录:数学、写作、编程全拉垮,马斯克最强 AI 翻车了? 2025年7月12日14时 作者 AI信息Gap Grok 4发布引发争议,实测表现不佳。在数学推理和写作测试中多次出现错误,编程能力也未达到预期,对比其他模型存在明显差距。