日期: 2025 年 3 月 6 日
ET-SEED:提升机器人操作泛化能力的高效等变扩散策略
本文介绍了一种新的扩散策略ET-SEED,它结合了轨迹级SE(3)等变性扩散和高效的去噪策略,在少量示范数据下能够高效学习复杂的机器人操作技能,并且在不同物体姿态和场景下的泛化能力也得到了提升。
风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 CVPR 2025
西湖大学等团队提出StyleStudio,通过跨模态AdaIN技术、教师模型稳定布局及基于风格的无分类器引导,有效解决文本驱动风格迁移中的对齐问题、布局不稳定和模糊性等问题,提升生成图像质量和稳定性。
智源开源多模态向量模型BGE-VL:多模态检索新突破
智源研究院联合开发的BGE-VL模型在多模态检索任务中取得最佳效果,通过大规模合成数据MegaPairs训练而成。该方法具备优异的可扩展性和卓越的数据质量优势。
另一个来自中国本土”DeepSeek”时刻?全球首个通用人工智能代理发布
通用AI Agent「Manus」发布早期预览版,能自主完成从想法到执行的完整链路任务。它通过演示简历筛选、房产研究及股票分析等实际案例展示了其能力,并且已在多个平台解决真实商业问题。
360智脑开源Light-R1!1000美元数学上首次从零超越DeepSeek-R1-Distill
2B 模型,以及全部训练数据、代码。仅需 12 台 H800 上 6 小时即可训练完成,从没有长思维