谷歌邀马斯克联手做AI游戏!DeepMind版Sora是个3D游戏引擎,一张图生成无限可交互世界
谷歌发布Genie 2世界模型,支持响应键鼠操作、长期记忆及NPC交互,生成3D游戏世界。该技术可用于训练具身智能体,迈向AGI。对比前代,Genie 2在复杂环境生成上取得了进展。
谷歌发布Genie 2世界模型,支持响应键鼠操作、长期记忆及NPC交互,生成3D游戏世界。该技术可用于训练具身智能体,迈向AGI。对比前代,Genie 2在复杂环境生成上取得了进展。
NeurIPS 2024最佳论文出炉,3篇华人一作。其中,《Visual Autoregressive Modeling》提出了一种新的图像生成框架,能显著超越现有的自回归模型和扩散模型;《Stochastic Taylor Derivative Estimator》展示了高效算法优化神经网络损失函数,并提供了内存减少和速度提升;《Not All Tokens Are What You Need for Pretraining》引入了选择性语言建模方法提升了预训练性能;《Guiding a Diffusion Model with a Bad Version of Itself》提出自引导方法提高图像生成质量。
扩散模型在某些情况下不能实现最优传输映射。法国数学家 Gabriel Peyré 提出了简洁证明,表明一般情况下扩散模型无法定义最优传输映射。
本期介绍多模态大语言模型ChatRex、3D物体物理材质生成方法Material Anything、简洁高效Python库FastMCP、开源AI语音处理工具包ClearerVoice-Studio以及对抗性人工智能代理游戏Freysa。
OpenAI的Sora API深夜泄露,艺术家因不满商业化营销方式抗议并公开API接口。泄露版本效果显著,OpenAI立即关闭艺术家权限。艺术家控诉称被白嫖,并呼吁使用开源工具来摆脱大公司控制。