视觉理解
小扎AI复仇进行时!OpenAI苏黎世办公室被端,650亿储备金狂烧不止
Meta从OpenAI苏黎世分部挖走三位顶尖研究员,引起广泛关注。这些研究员曾在谷歌工作并发表过多项重要研究成果,补足了Meta在视觉、图文理解方面研究的短板。
字节跳动发了个新模型:BAGEL-7B-MoT
这是一个混合专家多模态模型,基于Qwen2.5-7B-Instruct和siglip-so400m-14-980-flash-attn2-navit模型微调,并使用FLUX.1-schnell VAE模型,支持视觉理解、文本到图像生成及图像编辑。
从底层重构强化学习训练框架,阿里高德开源新方法:抛弃替代损失函数,仅需优化原始目标
阿里-高德团队提出组策略梯度优化GPG方法,仅需优化原始目标,解决已有方法偏差,提高训练效率。在实验中,GPG性能全面超越现有方法,有望成为下一代基础模型训练的关键方法。