小米又发新模型!MiMo-VL多模态模型开源,仅7B参数部分性能直逼R1、o3-mini
小米大模型Core团队推出多模态开源模型MiMo-VL-7B系列,该模型在视觉理解和推理任务中表现出色,并在多个数学竞赛中超越了Qwen2.5-VL-7B和DeepSeek等同级别模型。
小米大模型Core团队推出多模态开源模型MiMo-VL-7B系列,该模型在视觉理解和推理任务中表现出色,并在多个数学竞赛中超越了Qwen2.5-VL-7B和DeepSeek等同级别模型。
Meta AI 团队面临严重人才流失问题,Llama 模型核心研究成员离职率高。Meta 在开源领域与竞争对手差距明显,导致 Llama 模型在开发者社区反响平平。
Mistral发布开源编程模型Devstral,在软件工程任务上超过DeepSeek全家桶和Qwen3 235B。参数仅24B,可在单卡RTX4090甚至32G内存的Mac上运行。
Muyan-TTS 是一款专为播客场景设计的开源文本转语音(TTS)模型,具有超低延迟生成能力、支持自定义说话人及长文本连续合成等特性。主要特点包括快速生成、说话人适配和离线部署友好。
OpenAI CEO Sam Altman 对中国AI企业DeepSeek表示担忧,称其可能成为美国默认AI应用。但同时指出,目前DeepSeek并未达到这一程度。
LTXV-13B开源模型发布,速度提升近30倍、视觉效果出众、支持多种视频生成功能。参数为130亿的模型能够在4090/5090显存上运行,已上线免费商用平台。