扩散模型部署有新解,直接量化为4bit?韩松团队等提出SVDQuant:16GB笔记本上加速8.7 倍
↑ 点击
蓝字
关注极市平台
作者丨科技猛兽
编辑丨极市平台
极市导读
在 12B FLUX.1-d
↑ 点击
蓝字
关注极市平台
作者丨科技猛兽
编辑丨极市平台
极市导读
在 12B FLUX.1-d
DeepMind发布气象预测大模型GenCast,能够在8分钟内完成15天的天气预报,并且其准确率超过全球顶尖的中期天气预报系统。该模型基于扩散模型实现,分辨率为0.25度经度/纬度,已经开源。
谷歌发布Genie 2世界模型,支持响应键鼠操作、长期记忆及NPC交互,生成3D游戏世界。该技术可用于训练具身智能体,迈向AGI。对比前代,Genie 2在复杂环境生成上取得了进展。
NeurIPS 2024最佳论文出炉,3篇华人一作。其中,《Visual Autoregressive Modeling》提出了一种新的图像生成框架,能显著超越现有的自回归模型和扩散模型;《Stochastic Taylor Derivative Estimator》展示了高效算法优化神经网络损失函数,并提供了内存减少和速度提升;《Not All Tokens Are What You Need for Pretraining》引入了选择性语言建模方法提升了预训练性能;《Guiding a Diffusion Model with a Bad Version of Itself》提出自引导方法提高图像生成质量。
扩散模型在某些情况下不能实现最优传输映射。法国数学家 Gabriel Peyré 提出了简洁证明,表明一般情况下扩散模型无法定义最优传输映射。
本期介绍多模态大语言模型ChatRex、3D物体物理材质生成方法Material Anything、简洁高效Python库FastMCP、开源AI语音处理工具包ClearerVoice-Studio以及对抗性人工智能代理游戏Freysa。