英伟达开源福利:视频生成、机器人都能用的SOTA tokenizer

机器之心报道 tokenizer 对于图像和视频生成模型的重要性被研究者们所关注。谷歌的研究表明,好的tokenizer能够提升模型效果至最佳diffusion模型水平。英伟达开源的Cosmostokenizer采用因果结构确保只使用过去和现在的帧信息,提高学习效率并保持高质量重建。

你画 AI 猜,这个开源 AI 图像神器,在玩一种很新的 P 图

MagicQuill是一款AI图像编辑工具,无需写提示词就能理解用户画笔意图并编辑图片细节。它提供了加法、减法和颜色画笔三种功能,支持本地部署或在线使用。MagicQuill通过扩散模型和多模态大语言模型实现,让普通用户也能轻松使用AI进行图片编辑。