刚刚,PixVerse V4正式上线,5秒出一个AI视频还自带AI音效。
PixVerse发布v4版本,模型能力大幅提升。新功能包括科幻硬核物理效果、超快速生成速度及自然音效匹配等。总体表现优于前代版本。底层模型能力是关键所在。
PixVerse发布v4版本,模型能力大幅提升。新功能包括科幻硬核物理效果、超快速生成速度及自然音效匹配等。总体表现优于前代版本。底层模型能力是关键所在。
AI研究者Kimi发布了首个大规模混合专家模型Moonlight-16B-A3B,其使用Muon优化器在5.7T tokens的训练中实现了约2倍的计算效率提升,并开源了分布式Muon实现版本和预训练模型。
DeepSeek开源了一款针对Hopper GPU的FlashMLA内核,专门优化多头潜在注意力(MLA)解码阶段,支持变长序列输入,已在Github上获得300多个Star。
DeepSeek本周开源了一款用于Hopper GPU的高效MLA解码内核FlashMLA,主要用于减少推理过程中的KV Cache成本。该项目上线45分钟后收获超过400星,并且得到了广泛好评。
系的研究人员提出了一种名为 Retrieval-Retro 的无机逆合成规划方法,
通过结合热力学关
DeepSeek通过Janus-Pro和DeepSeek-VL等多模态模型在GenEval基准测试中表现出色,并提出解决细粒度视觉识别能力缺失的解决方案。它采用了数据原子化、知识蒸馏、动态注意力机制以及可控生成引擎等技术手段,推动了多模态学习范式的系统性变革。