为什么千问模型总在AI基准测试中被「忽略」?
阿里的大语言模型Qwen在多项基准测试中总是『神秘失踪』引起热议。AI研究员指出,这可能反映了AI评测体系中的『偏见』问题。正如电动车市场榜单排除中国车企一样,AI领域似乎有意遗漏某些重要玩家。Panahi认为需要建立公平、全面和客观的评测体系,打破偏见以推动行业健康发展。
阿里的大语言模型Qwen在多项基准测试中总是『神秘失踪』引起热议。AI研究员指出,这可能反映了AI评测体系中的『偏见』问题。正如电动车市场榜单排除中国车企一样,AI领域似乎有意遗漏某些重要玩家。Panahi认为需要建立公平、全面和客观的评测体系,打破偏见以推动行业健康发展。