日期: 2025 年 2 月 17 日
超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分
DeepSeek-R1 在 ARC-AGI 上的表现不及 OpenAI 的 o3 系列模型,但通过 SnakeBench 对抗性基准测试,在 1v1 贪吃蛇比赛中击败了 o1-mini,并接近 o3-mini。
DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升!
DeepSeek团队通过CODEI/O项目,利用300多万个实例将代码转换为思考过程训练大模型,提升其在多种推理任务中的性能,并证明了这种训练方法对不同规模和领域模型的有效性。
任正非王传福马化腾参加民企座谈会!数看广东民企抢滩新产业
民营企业座谈会在北京召开,广东民企数量占全省96.48%,新设‘四新经济’企业超4成。广东省成立民营经济发展局,并发布多项扶持政策支持民企发展。
“智能自举”会成可能?两张图说清OpenAI 路线图及模型迭代思路
Sam Altman 更新了 OpenAI 的未来路线图,计划首先发布 GPT-4.5(Orion),随后实现核心目标,包括统一 o 系列和 GPT 系列模型并推出更高智能水平的 GPT-5。
文远知行股价暴涨后又回落,英伟达“突然买入”是误读?
文远知行被英伟达重金投资引发股价飙升,但其实际已是8年前的投资转换为股票。英伟达押注Robotaxi赛道,与文远知行合作开发自动驾驶技术,并在新加坡试运营Robobus。尽管如此,文远知行仍面临持续亏损等问题。
DeepSeek与OmniParser V2.0 重构人机协作新范式了
DeepSeek与OmniParser V2.0结合,使得大模型能直接操控计算机系统完成复杂任务,引发人机交互范式迁移和智能体进化。