DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

Janus团队提出了一种名为JanusFlow的新模型,该模型结合了预训练视觉编码器与MLM的方法以及基于Rectified Flow的生成框架,实现了统一的视觉理解和生成能力。通过将理解与生成任务分别配置专用编码器,并利用REPA方法加速生成训练,JanusFlow在多模态理解和生成任务上表现出色。

国产大模型黑马的首个推理模型来了,和 o1 PK后,我发现了AI深度思考的大问题

DeepSeek 推出 R1-Lite 推理模型预览版本,并展示了其完整思考过程。用户可以通过 DeepSeek 的 chat 平台体验该模型,同时讨论了思维链的利与弊及其在实际应用中的挑战。

凑个热闹,测试一波DeepSeek新上的o1推理模型

MLNLP社区介绍了国内涌现的o1模型,并分享了一些测试结果。kimi的k0-math模型在数学和代码方面表现出色,但逻辑推理能力有待提高。社区呼吁开发者积极贡献开源模型,以超越OpenAI的技术水平。

国产模型炸裂登场,国外赞不绝口!OpenAI-o1级性能,免费使用

专注AIGC领域的专业社区报道了国产大模型DeepSeek发布的全新推理模型DeepSeek-R1-Lite预览版。其最大特色是深度思维链推理,在数学和代码任务中表现出色,并在美国竞赛数据中击败OpenAI的o1预览版。