法国国家科学研究中心 (CNRS)归档

为什么千问模型总在AI基准测试中被「忽略」？

上午8时 2024/12/15 作者 AGI Hunt

阿里的大语言模型Qwen在多项基准测试中总是『神秘失踪』引起热议。AI研究员指出，这可能反映了AI评测体系中的『偏见』问题。正如电动车市场榜单排除中国车企一样，AI领域似乎有意遗漏某些重要玩家。Panahi认为需要建立公平、全面和客观的评测体系，打破偏见以推动行业健康发展。