DeepSeek R2没来,Kimi K2来了,VLLM,SGLang首发支持
杨植麟提出开源路线,Moonshot AI发布Kimi K2大语言模型,采用混合专家架构,参数量达1万亿,表现出色并在多个基准测试中创造新SOTA记录。核心技术包括MuonClip优化器、大规模Agent数据合成和通用强化学习框架。模型提供两种版本,并通过修改版MIT协议开源。
杨植麟提出开源路线,Moonshot AI发布Kimi K2大语言模型,采用混合专家架构,参数量达1万亿,表现出色并在多个基准测试中创造新SOTA记录。核心技术包括MuonClip优化器、大规模Agent数据合成和通用强化学习框架。模型提供两种版本,并通过修改版MIT协议开源。
Kimi发布开源代码模型Kimi-Dev,在SWE-bench Verified上取得60.4%成绩,参数量只有72B。该模型采用BugFixer和TestWriter两种角色的结合进行训练,目前权重和代码均已发布。
今天推荐的AI-Media2Doc开源项目能将音视频转换为多种文档形式,支持AI问答和思维导图导出等功能。MIT协议下可自由商用。
HiDream-I1 成功登上 Hugging Face 模型趋势榜第二,获得广泛好评。它由来自合肥的 MIT 协议开源团队开发,具备高效率和高质量图像生成能力。该模型拥有 Full、Dev 和 Fast 三个版本,并支持在不同场景下的应用。
RuoYi AI 提供了一个开箱即用的开源解决方案,涵盖了前端应用、后台管理、小程序等多个方面,支持多模态功能和多种大语言模型集成。通过Java 17和Spring Boot技术栈开发,它简化了开发者搭建AI助手平台的过程。
OpenAI支持MCP协议,并宣布正式支持,同时发布OpenAI Agents SDK。MCP协议作为Anthropic开发的开源协议标准化了大型语言模型与应用和数据源的交互方式。
DeepSeek在Hugging Face发布全新Janus-Pro 7B和1.5B版本,参数优化使其具备本地部署能力,并在文生图基准测试中超越DALL-E 3和Stable Diffusion 3-Medium。
DeepSeek发布Janus-Pro模型,实现图文理解和图像生成的双面杀手。该模型通过解耦视觉编码路径实现了真正的”一心二用”,并采用统一架构设计、精心训练策略和MIT开源协议。其在理解任务得分0.8和生成质量上碾压DALL-E 3等主流模型。