字节跳动归档

字节开源多模态理解与生成统一模型，对视觉的理解到达开源顶峰，AI图片编辑能力超强。

下午11时 2025/05/30 作者开源AI项目落地

字节跳动开源多模态模型BAGEL，支持图像生成、修改及动态变化理解。具备聊天、生成图片、编辑图片、风格转换和导航等能力。

上午8时 2025/05/29 作者开源星探

字节跳动开源多模态AI模型Dolphin，通过两阶段机制精准解析复杂文档，支持页面级和元素级解析，并提供在线Demo及本地部署指南。

下午2时 2025/05/28 作者 AI信息Gap

Trae.ai 海外版推出 Pro 订阅模式，付费用户仍需排队。600次快速请求首月3美元，后续每月10美元或90美元包年。支持支付宝支付，但Pro用户仍要排队。模型池包括Claude Sonnet 4等9款高级模型。

下午2时 2025/05/26 作者老刘说NLP

文章介绍了当前AI技术发展对传统技术岗位的影响，强调了掌握AI应用技术和项目经验的重要性。文中提到了窗口期的机会以及加入相关培训课程的好处，并详细说明了如何通过学习大模型原理和应用来提升职业竞争力。

下午4时 2025/05/24 作者量子位

字节跳动最新发布BAGEL模型，融合图像理解、生成、编辑等多种功能，参数规模只有7B，但表现超越或媲美众多顶级开源和闭源模型。通过MoT架构实现统一多模态能力，并在Hugging Face上架开源。

下午2时 2025/05/24 作者小兵的AI视界

发等场景，都需要高效、准确地从文档中提取和解析信息。然而，
传统的文档解析方法往往面临着诸多挑战，例

下午11时 2025/05/23 作者开源AI项目落地

字节开源的Seed1.5-VL是视觉-语言多模态大模型，支持多种复杂任务如盲人判断红绿灯和智能导盲。其包含5.32亿参数视觉编码器和200亿激活参数混合专家大语言模型，已在多个公开基准中表现出色。

上午8时 2025/05/23 作者开源星探

字节跳动发布的BAGEL是首个支持多模态输入输出、思维链推理和MOT架构优化的跨模态超级AI模型，性能超越Qwen2.5-VL、InternVL-2.5。它能理解图像更准确，生成图像媲美Stable Diffusion 3，并在10+基准测试中表现优异。