o1圈卷起来,百川智能开源Baichuan-M1-14B~
国内首个全场景深度思考模型Baichuan-M1-preview发布,并开源了行业首个开源医疗增强大模型Baichuan-14B-M1,该模型在通用和医疗领域表现出色,具备语言、视觉和搜索能力。
国内首个全场景深度思考模型Baichuan-M1-preview发布,并开源了行业首个开源医疗增强大模型Baichuan-14B-M1,该模型在通用和医疗领域表现出色,具备语言、视觉和搜索能力。
中国双子星DeepSeek和Kimi发布全新推理模型R1和k1.5,性能接近OpenAI o1,引发业界关注。Long2Short训练方案成为亮点,提升了短推理路径模型的性能。
Kimi 团队发布了最新的多模态推理大模型 Kimi k1.5,其性能与正式版 o1 最为接近。通过 Long2Short 技术,该模型能够在有限的 token 预算下实现高性能推理,提升用户体验和资源利用效率。
Kimi发布新一代多模态思考模型k1.5,其在数学、代码、视觉和通用能力测试中达到或超越了GPT-4等领先水平。训练过程包括预训练、监督微调以及强化学习三个阶段,重点展示了数据构建、长上下文扩展及策略优化技术。
国产大语言模型军备竞赛正式启动!DeepSeek发布DeepSeek-R1及Kimi发布k1.5,对标o1不输o1。DeepSeek和Kimi均采用增强学习技术训练,并开源其模型。
Kimi视觉思考模型k1能从图片中推理出答案。它在数理化方面超越了OpenAI等模型。还能提取信息、推测MBTI性格类型,计算卡路里等实用功能,成为学习和生活助手。
2024年生成式AI技术迭代创新,MoE混合专家架构、强化学习等新型技术路径涌现;大模型多模态融合能力提升,应用从文本扩展至多元场景如AI Agent、终端设备集成;市场竞争激烈,三大阵营分化重组;投融资热度不减,向AI应用领域、硬件和数据基础设施延伸。2025年看点包括新应用场景探索及产业链整合。