ByteDance 归档 - 每时AI

多模态模型学会“按需搜索”，少搜30%还更准！字节&NTU新研究优化多模态模型搜索策略

2025年7月8日23时作者量子位

字节及南洋理工大学联合研究，提出一种基于强化学习的多模态模型自主搜索训练方法，在视觉问答任务中显著提升性能，减少约30%的搜索次数。

2025年5月14日8时作者 NLP工程化

Seed1.5-VL是专为通用多模态理解和推理设计的视觉-语言基础模型，仅用5.32亿视觉编码器和200亿参数的MoE LLM实现顶尖性能，在60个公共基准测试中有38项达到最佳水平。

2025年1月2日14时作者 AIGC创想者

10个Python项目排行：从推荐系统到多语言语音转换工具，涵盖多种应用场景。