又一篇CCF-A!强化学习+多目标优化,吊打传统方法!

文章摘要:顶会论文探讨了强化学习与多目标优化融合提升AI决策能力的技术。港科大和MIT团队通过不同方法在自动驾驶及机器人控制中实现安全性和能效的双重提高;阿里云技术则优化金融交易系统的风险收益平衡,这些成果重塑智能决策边界。

这AI绝对偷了格莱美奖杯!直接把LLaMA喂成乐坛顶流:开源版Suno来了!

港科大与音乐圈合作的开源项目YuE,能生成5分钟长的专业级歌曲,并同时合成人声和伴奏。其双轨版Next-Token Prediction策略能精准捕捉细腻人声,且具有模仿多歌手的能力。

人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板

本文提出VLM²-Bench评测基准,旨在系统探究视觉语言模型在人类级基础视觉线索关联能力上的表现。通过全面考察通用线索、物体线索和人物线索三个大类的基础关联能力,共涵盖9个子任务及3060个测试案例。

DeepSeek危及美国国家安全?火爆海外开源社区,衍生模型超670个

国产AI模型DeepSeek-R1在Hugging Face开源社区迅速流行,下载量超70万次,引发美国海军和政府关注。其衍生模型数量每日增长30%,热度持续攀升。谷歌前CEO称这是全球AI发展的重要转折点,并推动Meta、Hugging Face等机构模仿DeepSeek的开发策略。

一次搞定自驾场景的可控生成和长时序生成?科大和地平线提出DrivingWorld:基于视频GPT构建自动驾驶世界模型

DrivingWorld模型通过创新的空间-时间解耦机制和高效的编码解码模块,实现了自动驾驶场景的可控生成和超长时间视频生成。该研究由香港科技大学与地平线联合完成,论文、代码均开放获取。

多样任务真实数据,大模型在线购物基准Shopping MMLU开源|NeurIPS&KDD Cup 2024

基于亚马逊真实购物数据,港科大与圣母大学联合构建了大规模评测基准Shopping MMLU,评估大语言模型在线购物领域的应用潜力。该基准覆盖多项任务及能力,强调多任务学习、少样本学习和特定领域知识理解的重要性,并且已被公开用于研究和应用。