kimi
月之暗面Kimi暂缓“烧钱”投放,知情人称现在App用户是自然增长|
月之暗面Kimi因DeepSeek热潮暂缓‘烧钱’投放。近期大模型六小虎中有五家公司减少或暂停广告投放。月之暗面对推广动作进行相应调整,并推出新模型Kimi Latest,聚焦长文本输入与上下文长度控制。
从ReFT, Kimi K1.5到DeepSeek R1,聊聊Reasoning Model的精巧实现
理模型)异常火爆,Kimi 和 DeepSeek 陆续推出自家的产品 K1.5 和 R1,效果追评甚
从吉祥话到网络热梗,AI写春联难道没有创作瓶颈?
蛇年除夕,HyperAI超神经测评了Kimi、豆包、文心一言、DeepSeek和ChatGPT等大模型写春联的能力。测试涵盖主题春联、藏头春联及整活春联三类。结果显示,各模型对生肖“蛇”的表达不一,内容多以传统为主,部分模型在融入网络热梗方面有所欠缺。
o1圈卷起来,百川智能开源Baichuan-M1-14B~
国内首个全场景深度思考模型Baichuan-M1-preview发布,并开源了行业首个开源医疗增强大模型Baichuan-14B-M1,该模型在通用和医疗领域表现出色,具备语言、视觉和搜索能力。
正面硬刚OpenAI现役最强模型,国产AI一夜卷到硅谷
中国双子星DeepSeek和Kimi发布全新推理模型R1和k1.5,性能接近OpenAI o1,引发业界关注。Long2Short训练方案成为亮点,提升了短推理路径模型的性能。
国产模型如何追上多模态OpenAI o1?你需要知道的全在这
Kimi 团队发布了最新的多模态推理大模型 Kimi k1.5,其性能与正式版 o1 最为接近。通过 Long2Short 技术,该模型能够在有限的 token 预算下实现高性能推理,提升用户体验和资源利用效率。
Kimi思考模型k1.5是怎么练成的?细节曝光
Kimi发布新一代多模态思考模型k1.5,其在数学、代码、视觉和通用能力测试中达到或超越了GPT-4等领先水平。训练过程包括预训练、监督微调以及强化学习三个阶段,重点展示了数据构建、长上下文扩展及策略优化技术。