周志华团队新作:LLM中存在奖励模型,首次理论证明RL对LLM有效性

研究提出了一种新的方法——内源性奖励模型,它可以从大语言模型中挖掘出质量较高的奖励信号,而无需依赖人类标注数据。这项工作为机器学习领域提供了理论基础,并展示了其在常见任务中的有效性。

10×加速!DCM显著提升视频扩散模型推理效率!HunyuanVideo13B推理时间从1500秒缩短至120秒!

本文提出了一种双专家一致性模型DCM来解决视频生成中的一致性蒸馏问题,通过解耦语义合成与细节精修,显著减少采样步数的同时保持了较高的视觉质量。

90后创始人身价200亿,“影石”敲钟之余,整个AI圈也正在被90后改变

影石创新近期在科创板上市,成为智能科技消费产品走向全球化的代表。其创始人刘靖康毕业于南京大学软件学院,小学就开始自学编程,并成功打造了700亿市值的企业。公司专注于全景相机和运动相机市场,拥有多个知名投资机构的支持,并且研发投入占总营收的13.16%。

DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版

仅用不到1200行代码实现Nano-vLLM,该项目由DeepSeek研究员俞星凯创作。Nano-vLLM有三大特点:快速离线推理、可读性强的代码库以及优化套件。通过比较vLLM与Nano-vLLM在不同硬件和模型配置下的基准测试结果,Nano-vLLM表现出色。

人形机器人新品发布在即!埃斯顿酷卓官宣6月11日发布CODROID 02

埃斯顿酷卓将在6月11日发布第二代人形机器人CODROID 02,其全身关节运动能力更强,适应性更高。该企业与南京大学合作共建具身智能联合实验室,并获得莱茵TÜV的功能安全符合性证书。

重磅开源!英伟达团队推出Eagle 2.5,8B参数性能叫板GPT-4o,附带全新数据集

英伟达团队发布Eagle 2.5视觉语言模型,在长上下文多模态学习方面取得显著进展,其在Video-MME基准测试中实现了72.4%的高准确率。该模型通过信息优先采样、渐进式混合后训练和多样性驱动的数据配方等创新技术提升性能,并已在开源社区上线。