字节开源多模态理解与生成统一模型,对视觉的理解到达开源顶峰,AI图片编辑能力超强。
字节跳动开源多模态模型BAGEL,支持图像生成、修改及动态变化理解。具备聊天、生成图片、编辑图片、风格转换和导航等能力。
字节跳动开源多模态模型BAGEL,支持图像生成、修改及动态变化理解。具备聊天、生成图片、编辑图片、风格转换和导航等能力。
阶跃星辰CEO姜大昕认为多模态是实现AGI的必经之路,并坚持全线布局。公司发布22款自研基座模型,平均每月发布一款基础大模型,因此被称为‘多模态卷王’。目前其覆盖文字、语音、图像、视频、音乐等全系列,其中16款为多模态模型。姜大昕强调了多模态在应用中的重要性,并指出智能终端Agent是其发力方向。
Meta CEO扎克伯格在LlamaCon开发者大会上回应大模型挑战,称开源基准测试存在缺陷。扎克伯格表示发布未经优化的版本导致排名靠后是正常的,并提及未来推出17B参数的推理模型和80亿参数的小模型。他还讨论了AI智能爆炸的可能性及其带来的影响,包括提高开发效率及提升代码质量等。此外,Meta宣布将推出官方Llama API平台及相关工具。