香港中文大学（深圳）归档

无损减少80%激活值内存，提升5倍训练序列长度，仅需两行代码

2025年6月23日16时作者机器之心

香港中文大学（深圳）和上海交通大学团队提出StreamBP算法，通过线性分解和分步计算降低大语言模型训练所需的激活值内存消耗。相比梯度检查点方法，StreamBP将内存消耗降低至20%左右，并在相同内存限制下实现更大序列长度的训练。

2025年4月25日16时作者新智元

香港中文大学（深圳）发布TASTE-Rob数据集，包含100,856个精准匹配语言指令的第一视角交互视频。该团队提出三阶段视频生成流程优化手部姿态，显著提升视频真实感和机器人操作准确度。

2025年4月13日23时作者 PaperWeekly

本文介绍了一种基于生成流网络的扩散模型奖励微调方法Nabla-GFlowNet，该方法能够在快速收敛的同时保持生成样本的多样性和先验特性。通过在Stable Diffusion上实验验证了其有效性。

2025年3月20日8时作者 NLP工程化

香港中文大学（深圳）开源的Soundwave语音理解模型仅需1万小时训练数据，即达到Qwen2-Audio同等性能，具备智能对话和复杂语音交互能力。

2025年3月18日14时作者小兵的AI视界

Sitcom-Crafter 是一个基于剧情驱动的 3D 人类动作生成系统，由北京航空航天大学、香港中文大学（深圳）、悉尼科技大学和中山大学等高校联合开发。它能够根据用户提供的长剧情指导生成多样化且物理真实的动作，支持多种交互场景，并通过增强模块优化动作的流畅性、自然性和同步性。

2025年3月16日8时作者机器之心

香港中文大学（深圳）唐晓莹课题组发布TRACE技术，通过因果事件建模提升视频理解大模型的时间定位能力。

2025年3月12日12时作者新智元

西北工业大学和香港中文大学提出新型AI音乐生成模型DiffRhythm，在10秒内生成4分45秒完整歌曲，支持本地部署，仅需8G显存。其简洁高效的全diffusion架构只需歌词和风格提示即可创作，速度和便捷性得到提升。

2025年3月9日12时作者机器之心

本周会员通讯解读Sim2Real技术及其争议，涵盖Sim2Null论点、应用策略及现实差距解决方法等内容。

2025年1月15日12时作者 AIGC开放社区

专注AIGC领域的专业社区分享了香港中文大学（深圳）和深圳市大数据研究院开源的医疗领域大模型——华佗GPT-o1。该模型采用高质量医学数据集进行训练，并通过两阶段训练模式提升推理准确性和可靠性。