让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜 下午4时 2025/01/13 作者 新智元 谷歌发布的新基准测试FACTS Grounding用于评估AI模型在特定上下文中生成准确文本的能力,通过去除无效回复确保评分准确性。