真·MoE?路由LLM最全面探索:一种笔记本也能玩的大模型Scaling Up研究

中山大学和普渡大学研究人员发现路由LLM范式下的性能随着LLM候选数量的增加而迅速提升的新现象,并通过2亿条记录构建了全面的评测框架RouterEval,该框架允许研究者使用较少计算资源参与研究。

3D动画革命!北航团队破解交互难题,一键生成影视级打斗场面

Sitcom-Crafter 是一个基于剧情驱动的 3D 人类动作生成系统,由北京航空航天大学、香港中文大学(深圳)、悉尼科技大学和中山大学等高校联合开发。它能够根据用户提供的长剧情指导生成多样化且物理真实的动作,支持多种交互场景,并通过增强模块优化动作的流畅性、自然性和同步性。

自动调整推理链长度,SCoT来了!为激发推理能力研究还提出了一个新架构

SCoT团队提出了一种新的推理范式SCoT,它能动态调整推理链长度来适应不同复杂度的问题。AtomThink框架则是一个全过程训练和评估的系统,旨在提升多模态大模型在复杂推理任务上的表现。

中山大学顶刊发布双稳态张拉整体结构的自适应、快速、稳定的T-R夹持器

中山大学研究团队提出了一种新型双稳态张拉整体结构,并开发出一种无源驱动的多功能夹持器。该夹持器能在200毫秒内完成快速形状变化,展现出卓越抓取性能和适应性。

AAAI 2025 高效桥接视觉和语言,字节、中大提出全新多模态大模型连接器

字节团队与中山大学合作提出的 ParGo 模型,通过融合全局视野和局部细节来高效连接视觉特征和语言模型(LLM),在多项基准测试中表现优异,并被选为 AAAI 2025 的入选论文。

如何高效桥接视觉和语言,字节&中大提出全新多模态大模型连接器ParGo

字节团队与中山大学合作提出的ParGo模型通过巧妙融合全局视野和局部细节,在多模态大语言模型中表现出色,成功入选AAAI2025。ParGo采用Partial-Global Perception Block和Cascaded Partial Perception Block模块,结合全局视角和局部细节处理视觉特征,有效提升了LLM的效果。

颜宁:明年我只参加已经接受了邀请的学术会议,不接受国内任何个人或者单位的邀请做学术报告

MLNLP社区是国内外知名的人工智能与自然语言处理学术社区,旨在促进学术界、产业界和爱好者之间的交流和进步。近日颜宁教授宣布将减少学术报告邀请,引发热议。颜宁教授回国后多次应邀前往高校做学术报告,受到热烈欢迎。