谷歌邀马斯克联手做AI游戏!DeepMind版Sora是个3D游戏引擎,一张图生成无限可交互世界

谷歌发布Genie 2世界模型,支持响应键鼠操作、长期记忆及NPC交互,生成3D游戏世界。该技术可用于训练具身智能体,迈向AGI。对比前代,Genie 2在复杂环境生成上取得了进展。

NeurIPS 2024最佳论文揭晓!北大字节VAR获最佳论文,清华厦大研究获提名

NeurIPS 2024最佳论文出炉,3篇华人一作。其中,《Visual Autoregressive Modeling》提出了一种新的图像生成框架,能显著超越现有的自回归模型和扩散模型;《Stochastic Taylor Derivative Estimator》展示了高效算法优化神经网络损失函数,并提供了内存减少和速度提升;《Not All Tokens Are What You Need for Pretraining》引入了选择性语言建模方法提升了预训练性能;《Guiding a Diffusion Model with a Bad Version of Itself》提出自引导方法提高图像生成质量。

ChatRex是一个多模态大语言模型,FreysaAI 智能体黑客比赛尝试说服AI释放奖金, 快速构建MCP服务器

本期介绍多模态大语言模型ChatRex、3D物体物理材质生成方法Material Anything、简洁高效Python库FastMCP、开源AI语音处理工具包ClearerVoice-Studio以及对抗性人工智能代理游戏Freysa。