多智能体协作,DrugAgent重塑药物研发新范式

南加州大学等机构开发出的DrugAgent是一个用于医药领域的AI Agent,能将复杂任务分解为可管理的子任务,并利用LLM Instructor和Planner构建工具箱来自动化执行ML任务。在ADMET预测、药物-靶点相互作用预测及分子优化测试中表现出色。

SFT并非必需!推理模型仅靠RL就能获得长思维链能力,清华CMU团队破解黑盒

研究团队通过对比SFT和RL两种方法发现,长CoT的生成需要大量的计算资源。他们提出了四个关键发现:SFT并非必需但能简化训练并提高效率;推理能力随着训练计算增加而出现,但并非总是如此;可验证奖励函数对增长CoT至关重要;基模型中的错误修正等技能需要通过RL有效地激励。

数万人在X上围观的Genesis,把「世界模型」造出来了?

来自多个知名大学和公司的团队推出了Genesis平台,它结合生成式AI与真实世界物理的准确性,提供通用物理引擎、机器人仿真平台等多样的功能。其目标是减少人类在数据生成中的投入,并实现自动化和自给自足的数据生态系统。

视频大模型无损提速:删除多余token,训练时间减少30%,帧率越高效果越好 NeurIPS

卡内基梅隆大学提出了一种新的视频大模型加速方法Run-Length Tokenization(RLT),通过将连续相同的图像块合并为一个token,使得Transformer的视频处理速度大幅提升。精度几乎没有损失的前提下,训练时间可缩短30%,推理阶段提速率可达67%。