DeepSeek归档 - 第52页共52页

DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

下午8时 2024/12/15 下午2时 2024/11/22 作者量子位

Janus团队提出了一种名为JanusFlow的新模型，该模型结合了预训练视觉编码器与MLM的方法以及基于Rectified Flow的生成框架，实现了统一的视觉理解和生成能力。通过将理解与生成任务分别配置专用编码器，并利用REPA方法加速生成训练，JanusFlow在多模态理解和生成任务上表现出色。

国产大模型黑马的首个推理模型来了，和 o1 PK后，我发现了AI深度思考的大问题

下午8时 2024/12/15 下午1时 2024/11/22 作者 APPSO

DeepSeek 推出 R1-Lite 推理模型预览版本，并展示了其完整思考过程。用户可以通过 DeepSeek 的 chat 平台体验该模型，同时讨论了思维链的利与弊及其在实际应用中的挑战。

凑个热闹，测试一波DeepSeek新上的o1推理模型

下午8时 2024/12/15 上午10时 2024/11/22 作者机器学习算法与自然语言处理

MLNLP社区介绍了国内涌现的o1模型，并分享了一些测试结果。kimi的k0-math模型在数学和代码方面表现出色，但逻辑推理能力有待提高。社区呼吁开发者积极贡献开源模型，以超越OpenAI的技术水平。

国产模型炸裂登场，国外赞不绝口！OpenAI-o1级性能，免费使用

上午5时 2024/11/21 作者每时AI

专注AIGC领域的专业社区报道了国产大模型DeepSeek发布的全新推理模型DeepSeek-R1-Lite预览版。其最大特色是深度思维链推理，在数学和代码任务中表现出色，并在美国竞赛数据中击败OpenAI的o1预览版。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30