阿里巴巴
社区供稿 | 阿里国际 Ovis2 系列模型开源: 多模态大语言模型的新突破
Ovis2是阿里巴巴提出的新型多模态大模型架构,显著提升了小规模和大规模模型的能力密度,并增强了思维链推理能力、视频处理能力和多语言OCR能力。它已在OpenCompass上展示了卓越的性能,并在多个数学推理榜单中排名前列。
DeepSeekRL-Extended:从零实现DeepSeek R1的强化学习项目
从零实现DeepSeek R1的强化学习项目,探索GRPO算法的应用,仅用单个H100 GPU400步训练提升模型性能,完全自研且提供多脚本结构。
王炸组合:微信接入满血DeepSeek R1,背后的Agentic RAG技术~
微信灰度接入DeepSeek R1,支持更全面的回答。DeeSeek-R1采用Agentic RAG方式接入,可以设计通用AI Agentic框架,并结合官方Prompt和搜索接入实现。
清华大学第二弹:《DeepSeek赋能职场》来了!(附完全资料)
公众号分享Insight Daily PDF内容:侧重实践操作,包括AI应用、设计、可视化及视频生成等内容。回复 ‘deep’ 获取更多资源。