Kimi首个万亿参数模型开源!免费可用,超强Agent推理,附实测体验
国内大模型独角兽月之暗面发布并开源了其最新一代MoE架构基础模型Kimi K2,总参数量达到1万亿(1T),并在SWE Bench Verified、Tau2和AceBench三项基准测试中取得SOTA成绩。
国内大模型独角兽月之暗面发布并开源了其最新一代MoE架构基础模型Kimi K2,总参数量达到1万亿(1T),并在SWE Bench Verified、Tau2和AceBench三项基准测试中取得SOTA成绩。
OpenAI即将发布一款由AI驱动的网页浏览器,直接挑战谷歌Chrome浏览器。目标是利用人工智能从根本上改变消费者的网页浏览方式,并为OpenAI提供一个更直接的数据获取渠道。
百度正式开源文心 4.5 系列模型,包括 MoE 和稠密模型,覆盖多种参数规模。这是国内首个大规模预训练权重 + 推理代码完全开源的大模型系列,标志着百度在多模态理解和开放生态上的全面进化。
Magenta RealTime 是一个开源音乐生成模型,由 Google 开发,能够在资源有限的环境中部署。它基于 SoundStream RVQ 编解码器和 MusicCoCa 模型工作原理。
Sam Altman 在旧金山与YC CEO对话中分享了关于OpenAI的未来、AGI愿景以及下一代技术浪潮的观点。他透露即将发布一个远超预期的开源模型,并且明确指出了GPT-5及多模态超级模型的发展方向,强调不要复制ChatGPT而是创造真正缺失的东西。
Kimi-Dev-72B是首个在SWE-bench Verified编程基准测试中取得全球最高开源模型成绩的代码大模型,参数量仅为72B。通过大规模强化学习优化,Kimi-Dev-72B不仅能在错误修复和单元测试方面表现出色,还支持自我博弈机制以同时担任BugFixer和TestWriter的角色。
MiniMax举办开源周活动,正式发布最新推理模型MiniMax-M1,支持100万token输入与8万token输出,参数量达4560亿。通过大规模强化学习训练,仅耗资53.47万美元。该模型采用混合注意力架构和闪电注意力机制,显著提升推理效率,并在复杂任务中表现突出。