CVPR 2025 突破现有极限!清北联合提出铰链物体的通用世界模型PartRM 下午4时 2025/04/09 作者 PaperWeekly 。尽管现在基于 diffusion 的方法取得了很多进展,但是这些方法存在处理效率低,同时缺乏三维感
代码论文全开源!月之暗面发布重磅技术报告:模型训练效率翻倍 下午4时 2025/02/23 作者 AI寒武纪 月之暗面团队发布Muon优化器,显著提升大规模语言模型的训练效率,提出的新模型Moonlight在计算资源节省和性能突破方面表现出色。
Prodigy+ScheduleFree:一种新的优化器 下午12时 2025/01/06 作者 NLP工程化 Prodigy+ScheduleFree:一种结合了Prodigy和ScheduleFree优点的新优化器,旨在减少机器学习训练中的超参数设置,提高模型训练效率和稳定性。