深度学习
ICLR 2025 Oral|突破深度学习求解PDE的瓶颈,清华提出空间调控新范式GridMix
本文介绍了一种新的神经网络方法GridMix,用于解决偏微分方程建模中的空间调控问题。GridMix通过网格表征实现了局部细节和全局结构的有效结合,显著提升了PDE建模的性能,在动态系统建模和几何感知预测任务中尤其表现优异。
3D动画革命!北航团队破解交互难题,一键生成影视级打斗场面
Sitcom-Crafter 是一个基于剧情驱动的 3D 人类动作生成系统,由北京航空航天大学、香港中文大学(深圳)、悉尼科技大学和中山大学等高校联合开发。它能够根据用户提供的长剧情指导生成多样化且物理真实的动作,支持多种交互场景,并通过增强模块优化动作的流畅性、自然性和同步性。
agenticSeek:一个完全本地化的Manus AI替代品
agenticSeek 是一个本地化的Manus AI替代品,使用Deepseek R1驱动,无需API和每月456美元的账单。它支持多种编程语言,并且能够自主修复错误、智能分配任务,确保数据隐私安全。
数据并行训练要OUT?谷歌三大研究团队合力推出“DiLoCo缩放定律”,打开AI训练新大门!
谷歌团队提出了一种新的分布式训练方法DiLoCo,该方法旨在解决超大规模语言模型(LLMs)的训练挑战。研究表明,DiLoCo在保持模型质量的同时能够显著提高扩展性,并且具有可预测和稳健的优势。
开源顶流集结!QwQ-32B 解锁多元玩法,OpenManus 低成本构建 AI 智能体!vLLM v1 赋能高效模型推理
,再次刷新行业对开源大模型的认知。该模型在代码生成、多轮对话等任务中展现出了卓越的表现,推理能力更是