谷歌开源单卡最强多模态模型!分数超满血版DeepSeek V3,一张GPU就能跑

谷歌发布Gemma 3系列模型,参数规模有1B、4B、12B和27B四种,支持超过35种语言。它在知名AI排行榜LMArena上的初步人类偏好评估中优于Llama-405B、DeepSeek-V3和o3-mini。开发者可以通过多种途径访问Gemma 3,并附带改进的代码库进行高效微调。谷歌还推出了Gemma 3学术计划,以加速基于Gemma 3的研究。

音乐检索进入“多模态对齐”时代:清华 CLaMP-3 的三大极限突破

清华大学朱文武教授团队推出的CLaMP 3是一款多模态、多语言的音乐信息检索框架,实现了跨模态检索和零样本分类等功能。它支持27种语言,并基于对比学习训练模型,使用XLM-R预训练模型实现强大的多语言文本嵌入。

亚马逊推出的新一代基础模型Nova,AIMedia帮助用户自动抓取热点新闻、生成新闻内容,并自动发布到各大平台

亚马逊Nova推出新一代基础模型提升AI应用智能性和成本效益;AgentLab为网页代理研究提供开放框架;ComfyUI为HunyuanVideo提供包装节点简化使用;TinyFusion优化扩散变换器结构提高训练效率和性能;AIMedia是一款全自动AI媒体软件,实现热点新闻抓取及自动发布。