开源模型
从明天开始,OpenAI将发布大量新产品
OpenAI联合创始人Sam Altman宣布即将发布多款产品,包括研发中的Agent编程产品A-SWE和开源新模型。API使用规则更新要求身份验证,并限制每90天每个组织的认证数量。
媲美OpenAI-o3,刚刚开源模型DeepCoder,训练方法、数据集大公开
著名模型DeepCoder-14B-Preview开源,参数虽少但表现优异。该模型在LiveCodeBench测试中得分为60.6%,高于OpenAI的o1模型,接近o3-mini水平。Together AI不仅开源模型权重和训练数据集,还优化了训练方法和技术以提升性能。
1000万上下文+2880亿参数的Llama4,却让DeepSeek们松了一口气
Meta发布的Llama4系列模型包括多模态MoE架构、超长上下文支持和优化的注意力机制。通过原生多模态预训练融合方法、轻量级后训练策略等创新技术提升了模型能力。
GPT-4o出现后,ComfyUI等工作流会被淘汰吗?
ComfyUI在中国举办了官方会议,尽管存在质疑声音,但Comfy本人表示不会放弃开源精神,并提到未来可能通过整合大模型实现类似GPT4的效果。
华尔街这是“约好了一起唱空”?巴克莱:现有AI算力似乎足以满足需求
巴克莱预测2025年AI算力足以支持15-220亿个AI Agent。行业需从无意义基准测试转向实用的Agent产品部署,开源模型可降低成本,但仍面临专用算力缺口的问题。
DeepSeek 新模型上线:6850亿参数的 DeepSeek-V3 再进化!
DeepSeek发布新模型DeepSeek-V3-0324,参数量685B,支持BF16、F8_E4M3和F32三种精度格式。主要提升性能和修复bug。