DeepSeek站在巨人肩上,这个巨人到底是什么?

春节期间,国产大模型DeepSeek引发热议并登顶全球应用商店排行榜。其训练成本远低于国际水平,甚至可能追赶世界先进水平。AI领域的大规模开源促进了快速发展,Meta等巨头加码开源策略,强化了OpenAl的竞争格局。

DeepSeek危及美国国家安全?火爆海外开源社区,衍生模型超670个

国产AI模型DeepSeek-R1在Hugging Face开源社区迅速流行,下载量超70万次,引发美国海军和政府关注。其衍生模型数量每日增长30%,热度持续攀升。谷歌前CEO称这是全球AI发展的重要转折点,并推动Meta、Hugging Face等机构模仿DeepSeek的开发策略。

Meta 或成开源竞赛中最大输家!

Meta因DeepSeek开源模型陷入被动,后者在性能、商业自由、训练成本等方面均超越Llama系列。然而Meta内部表现不佳,开发社区出现分裂,开发者们既有人转向DeepSeek,也有人坚守Llama等待反击。英伟达股价受此影响大跌,但支持者认为这将进一步扩大AI的舞台和能力边界。

DeepSeek又开源Janus-Pro,7B多模态强势登顶,OpenAI彻底慌了

DeepSeek开源新一代统一多模态模型Janus-Pro,包含两个尺寸:Janus-Pro-1B和Janus-Pro-7B。该模型在多模态理解和生成方面超越了Meta、Google等知名机构的模型,并改进了训练策略、扩展数据集和扩大模型规模。