Meta推出全新AI模型Apollo了
Meta公司推出的新AI模型系列Apollo采用了独特的双组件设计和分阶段训练策略,显著提升了视频理解和追踪能力。通过数据优化和跨界合作,Apollo在广告、社交等多个领域展现出广泛应用潜力,并有望推动人工智能技术的进一步发展。
Meta公司推出的新AI模型系列Apollo采用了独特的双组件设计和分阶段训练策略,显著提升了视频理解和追踪能力。通过数据优化和跨界合作,Apollo在广告、社交等多个领域展现出广泛应用潜力,并有望推动人工智能技术的进一步发展。
斯坦福大学教授李飞飞在人工智能顶会NeurIPS上分享了她的研究,她创立的世界实验室致力于生成3D场景并具备空间智能。她认为机器视觉正朝着全面智能迈出关键一步。
最近AI在生物学领域表现突出。斯坦福大学的研究团队提出了一种基因组基础模型Evo,能在DNA、RNA和蛋白质层面实现零样本预测及高精度生成。它训练于包含数百万个噬菌体和质粒序列的大型数据集上,参数规模达70亿,最大上下文长度可达131,072个token。这一成果已上线HyperAI教程版块供快速体验。
顶尖多模态大模型在AV-Odyssey基准测试中表现不佳,无法正确分辨声音大小。研究团队提出DeafTest和AV-Odyssey评估基准,揭示音频感知仍是大模型的主要瓶颈。
国内智源研究院推出首个利用大规模无标注互联网视频学习的3D生成模型See3D,支持从文本、单视图和稀疏视图到3D的生成。
国内智源研究院推出首个利用大规模无标注互联网视频学习的3D生成模型See3D,支持从文本、单视图和稀疏视图到3D的生成,并进行3D编辑与渲染。
IC-Light 是张吕敏提出的 IC-Light 项目,能够通过文本或背景图片引导改变照片的光影效果。该论文在 ICLR 大会上获得满分评级。作者张吕敏毕业于苏州大学,并在斯坦福读博,发表了多篇 AI 绘画相关论文。
斯坦福大学教授李飞飞发布了她的第一个创业项目World Labs,用户可以通过单张图片或一句话生成3D世界。这是生成式AI进入3D完全沉浸式新时代的一个例子。