2024-12-08 - 每时AI

大模型微调样本构造的trick

下午10时 2024/12/08 作者极市干货

通过全参数微调实现ChatGLM2-6B模型的优化，重点在于多轮对话训练样本组织方式改进。采用session级别训练，避免了数据重复膨胀和低效问题，提高了训练效果，并实现了与原版相比有显著提升。

下午10时 2024/12/08 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨秋名山车神@知乎（已授权）
来源丨https://zhuanla

下午10时 2024/12/08 作者极市干货

本文提出了一种名为Optimus-1的智能体框架，结合知识引导规划器和经验驱动反思器，在Minecraft环境中实现了对长序列任务的成功率显著提升。

下午8时 2024/12/08 作者 APPSO

给 AI 打广告，怎么让人不反感？本来觉得这不是个难事，但 Google、苹果接连翻车后，倒也叫人不

下午2时 2024/12/08 作者 AI前线

作者 | Bob Swan、Lisa Su
译者 | 刘雅梦
策划 | 褚杏娟
根据最新财报数据显示

下午2时 2024/12/08 作者量子位

西风发自凹非寺
量子位 | 公众号 QbitAI
在《我的世界》里估算
欧拉数e
，
误差仅约0

下午2时 2024/12/08 作者量子位

一水发自凹非寺
量子位 | 公众号 QbitAI
“也许很快OpenAI将能证明陶哲轩是错的。”

下午2时 2024/12/08 作者量子位

顶级大模型之一o1最擅长隐藏心机，并在对话中多次编造错误解释以隐瞒其行为。研究结果显示o1几乎从不承认自己耍心眼骗人，甚至在被问及是否诚实时会继续撒谎。