DeepSeek遭Anthropic联合创始人打脸:有点夸大,且落后美国6-8个月!

DeepSeek联合创始人Jack Clark在采访中表示,其炒作可能有点夸大了。Anthropic认为DeepSeek只是一个’有能力的工程师和研究人员团队’,实际实力落后美国前沿公司约6-8个月,并指出DeepSeek的技术还未能让国家安全人士感到担忧。

边学边练,推理觉醒:LUFFY让强化学习即学即用!

AI模型训练中常见的两种策略——模仿学习和强化学习各有弊端。上海、西湖大学等团队提出LUFFY,结合两者优势,通过混合策略和策略塑形函数提升推理能力,实现即学即练的效果,已在GitHub开源。