字节图像生成新模型:主打多主体一致性,新基准数据集同时亮相

字节发布多主体控制生成模型Xverse,可以精确控制多个主体的身份和语义属性。该模型包括T-Mod适配器、文本流调制机制、VAE编码图像特征模块及正则化技术等关键部分,并通过XVerseBench基准测试验证其效果。

小米AI眼镜1999元起售!雷军:眼镜+相机+耳机+小爱,就是你的随身AI入口

小米发布新款AI眼镜,重量40g、续航8.6小时,售价1999元起。核心功能包括拍照录像、翻译支付等,与竞品相比具有更轻、续航更长的优势。雷军在发布会上强调了这款AI眼镜作为’随身AI入口’的作用。

亿点点新融资砸向具身智能:斯坦福华人团队,首创“自适应机器人”品类

非夕科技完成C轮亿级美元融资,聚焦自适应机器人技术,此轮融资将用于扩产和研发。公司首创‘自适应机器人’概念,提升复杂工况应对能力,并已在多个行业实现规模化应用场景。

李飞飞团队提出架构设计新思路!无需从头训练,直接“嫁接”预训练模型关键组件

研究人员提出了一种‘嫁接’新思路——直接将预训练好的模型作为‘底座’,通过修改组件来研究新架构。这种方法在不增加大量计算资源的情况下提高了文生图模型的生成速度,并且保持了较好的图像质量。