扩散模型
ChatRex是一个多模态大语言模型,FreysaAI 智能体黑客比赛尝试说服AI释放奖金, 快速构建MCP服务器
本期介绍多模态大语言模型ChatRex、3D物体物理材质生成方法Material Anything、简洁高效Python库FastMCP、开源AI语音处理工具包ClearerVoice-Studio以及对抗性人工智能代理游戏Freysa。
Sora半夜泄露3小时,物理效果惊人!奥特曼急拔网线,艺术家抗议被白嫖
OpenAI的Sora API深夜泄露,艺术家因不满商业化营销方式抗议并公开API接口。泄露版本效果显著,OpenAI立即关闭艺术家权限。艺术家控诉称被白嫖,并呼吁使用开源工具来摆脱大公司控制。
英伟达开源福利:视频生成、机器人都能用的SOTA tokenizer
机器之心报道 tokenizer 对于图像和视频生成模型的重要性被研究者们所关注。谷歌的研究表明,好的tokenizer能够提升模型效果至最佳diffusion模型水平。英伟达开源的Cosmostokenizer采用因果结构确保只使用过去和现在的帧信息,提高学习效率并保持高质量重建。
你画 AI 猜,这个开源 AI 图像神器,在玩一种很新的 P 图
MagicQuill是一款AI图像编辑工具,无需写提示词就能理解用户画笔意图并编辑图片细节。它提供了加法、减法和颜色画笔三种功能,支持本地部署或在线使用。MagicQuill通过扩散模型和多模态大语言模型实现,让普通用户也能轻松使用AI进行图片编辑。