qbitAI 归档 - 每时AI

字节图像生成新模型：主打多主体一致性，新基准数据集同时亮相

2025年7月2日23时作者量子位

字节发布多主体控制生成模型Xverse，可以精确控制多个主体的身份和语义属性。该模型包括T-Mod适配器、文本流调制机制、VAE编码图像特征模块及正则化技术等关键部分，并通过XVerseBench基准测试验证其效果。

2025年6月20日16时作者量子位

研究人员提出了一种‘嫁接’新思路——直接将预训练好的模型作为‘底座’，通过修改组件来研究新架构。这种方法在不增加大量计算资源的情况下提高了文生图模型的生成速度，并且保持了较好的图像质量。

2025年5月21日16时作者量子位

谷歌发布最强视频生成模型Veo 3，能从画面到对白原生直接生成，并且用户可通过自然语言描述角色、场景和指定对白与语气。

2025年5月7日16时作者量子位

00亿美元
。
错过它将是一个巨大的损失。
这是黄仁勋刚刚聊AI时作出的最新判断。
500亿美元有多

2025年3月8日12时作者量子位

研究院、UC伯克利等联合出品！
SimDINO
和
SimDINOv2
，通过编码率正则化简化DIN

2025年3月3日23时作者量子位

高通发布搭载AI处理器的5G调制解调器X85，支持400MHz下行链路带宽和3.7Gbps上行速率，其AI能力提升数据流量模式识别和终端侧应用生成式AI处理。

2025年2月6日12时作者量子位

Align-DS-V团队投稿
量子位 | 公众号 QbitAI
如果把DeepSeek-R1震撼硅谷

2025年1月27日16时作者量子位

文章介绍了百度文心一言的大模型RAG技术，通过检索增强生成方式让AI在作答时更准确、丰富且有态度。实测显示其能精准回答复杂问题，并保持客观性。文章强调了RAG技术对大模型输出结果的影响及其重要性。

2025年1月23日16时作者量子位

OpenAI的新研究展示了通过增加推理时的计算量来提升模型对抗性稳健性的潜力，这一发现可能缓解外界对Agent能力增强后面临安全风险的担忧。

2024年12月5日17时作者量子位

鱼羊发自凹非寺
量子位 | 公众号 QbitAI
如果说有一类
游戏
贯穿AI发展的始终，围绕其