谷歌新动作!Sora前负责人带队打造“现实世界模拟器”,AI领域再掀波澜
谷歌组建新团队开发模拟现实世界的人工智能模型,领头人蒂姆·布鲁克斯曾是OpenAI视频生成器Sora的联合负责人,目标是在DeepMind推进通用人工智能发展。
谷歌组建新团队开发模拟现实世界的人工智能模型,领头人蒂姆·布鲁克斯曾是OpenAI视频生成器Sora的联合负责人,目标是在DeepMind推进通用人工智能发展。
新智元报道
编辑:LRS
研究者通过对智能体在捐赠者游戏中的表现,分析了Claude 3.5、Gemini 1.5 Flash和GPT-4o等模型的合作行为差异。结果显示,Claude 3.5表现出更有效的合作和惩罚搭便车行为的能力,而GPT-4o则更自私。未来人机协同社会中需要考虑不同LLM智能体的道德和行为差异。
CMU 和 Google DeepMind 的研究提出了一种名为 ICAL 的方法,通过使用低质量数据和反馈来生成有效的提示词,改善 VLM 和 LLM 从经验中提取见解的能力,从而解决高质量数据不足的问题。
Google DeepMind的研究表明逆向思维训练大模型(LLMs)能显著提升其推理能力,通过构建包含正反向问题的数据集并利用知识蒸馏框架优化模型。
谷歌正通过与竞争对手模型Claude进行比较来改进其AI产品Gemini。内部沟通显示承包商注意到Claude在安全性和响应质量方面优于Gemini,但谷歌否认使用Anthropic的Claude训练Gemini。
Google DeepMind联合研究者发现不同模型组的智能体在游戏中表现出不同的合作倾向。Claude与Sonnet偏好合作,而GPT-4o则倾向于自私。实验通过引入惩罚机制来探索模型的合作行为影响。
Google Deepmind 推出的新视频模型 Veo 2 和 Imagen 3 提供了更高分辨率的视频生成能力,并改进了指令识别和物理现象模拟功能。Veo 2 还引入了不可见的 SynthID 水印以确保其 AI 生成属性,而 Imagen 3 在多个国家推出的同时支持多种艺术风格的图像创作。
Google DeepMind等机构提出的新视频分层模型无需假设静态背景或精确相机姿态,可分离前景对象和背景,并生成高质量分解结果。该方法利用视频扩散模型及三元掩码技术,增强了遮挡区域补全能力,提升了视频编辑效率和直观性。