智能体的能力范围有限,在某些复杂场景下很难发挥其作用,因此最好的方式需要把人力与大模型的能力相结合——人机协同

最近发现智能体能力有限,尤其在复杂真实场景中存在边界理解、工具调用限制等问题。为弥补缺陷,建议人机协同模式:智能体负责快速自动化处理,人力负责最终决策和责任兜底。

AI 版《猫和老鼠》刷爆外网!零剪辑自动生成,60 秒神作刷新 AI 视频天花板

伯克利、斯坦福联合英伟达的研究成功生成了长达一分钟的流畅视频,且保持一致性和故事完整性。通过引入测试时训练层提升扩散Transformer模型能力,实现了复杂的多场景故事生成。研究使用《猫和老鼠》动画集进行验证,展示了AI在复杂动态场景中的学习与适应能力。

AI生成交响乐,这一天终究还是来了

NotaGen 是首个针对古典音乐交响乐的 AI 音乐生成模型,来自中央音乐学院、清华和北航的开发人员宣布其开源。模型涵盖基础版及增强版NotaGen-X,并在专业数据集上进行了微调,实现高度可控性和专业性,提升了古典音乐生成质量。

AI能看懂细节了!IDEA研究院多模态目标检测模型DINO-XSeek,自然语言精准定位目标

基于多模态大语言模型的DINO-XSeek目标检测模型实现了精准感知和理解复杂场景中的目标,能够通过自然语言描述识别出具体细节,如人物的穿着、位置等信息。该模型结合了视觉与语言理解能力,在实际应用中可应用于工业制造、安防、农业等多个领域。