雷军千万年薪挖角95后天才少女,AI女神逆风翻盘!

雷军以千万级薪酬挖角AI天才罗福莉领军小米AI大模型团队。95后罗福莉曾在国际顶会发表8篇论文,学术背景出色。小米计划建设万卡级GPU集群并拥有丰富应用场景,有望成AI领域的黑马。

DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

Janus团队提出了一种名为JanusFlow的新模型,该模型结合了预训练视觉编码器与MLM的方法以及基于Rectified Flow的生成框架,实现了统一的视觉理解和生成能力。通过将理解与生成任务分别配置专用编码器,并利用REPA方法加速生成训练,JanusFlow在多模态理解和生成任务上表现出色。

国产大模型黑马的首个推理模型来了,和 o1 PK后,我发现了AI深度思考的大问题

DeepSeek 推出 R1-Lite 推理模型预览版本,并展示了其完整思考过程。用户可以通过 DeepSeek 的 chat 平台体验该模型,同时讨论了思维链的利与弊及其在实际应用中的挑战。