OpenCompass归档

首个AI翻译实战榜单出炉！GPT-4o稳坐天花板，文化方面Qwen系列一马当先丨开源

下午11时 2025/05/22 作者量子位

首个应用型AI翻译测评榜单TransBench上线，新增幻觉率、文化禁忌词等指标。TransBench评测数据集已全面开源，涵盖多种语言，针对电商和文化特性等方面进行实战考核。目前发布的首期测评结果中，GPT-4o、DeepL Translate、Qwen系列表现突出。

下午10时 2025/01/16 作者 GiantPandaCV

上海人工智能实验室对书生大模型进行了升级，推出了InternLM3.0版本，通过精炼数据框架提升了数据效率和思维密度，节约了75%以上训练成本，并实现了常规对话与深度思考能力融合。