准确性提升归档

ACL 2025 多维阅卷，智识觉醒：打开多模态大模型看图写作评估的认知之门

2025年6月11日16时作者 PaperWeekly

研究构建首个面向MLLM的细粒度AES基准EssayJudge，采用10项细粒度评分维度，涵盖词汇、句子和文章三个层级，评价作文质量。

2025年6月9日14时作者 AI信息Gap

OpenAI悄悄推出两小更新：高级语音模式更自然，引入‘先思考再搜索’机制。新版ChatGPT在处理情绪化句子和复杂问题时会暂停几秒进行思考，提升答案准确性但增加等待时间。

2025年5月27日23时作者机器之心

清华大学与墨尔本大学团队揭示了开源大模型微调过程中隐藏的安全风险，通过后门注入技术秘密窃取下游私有数据。该研究指出攻击者可从5000条微调数据中恢复接近4000条完整查询。

2025年5月15日16时作者 PaperWeekly

人已经成为日常场景中不可或缺的智能伴侣，然而，传统的聊天机器人通常依赖被动响应机制，需用户主动发起话