比Gemini Diffusion更全能!首个多模态扩散大语言模型MMaDA发布,同时实现强推理与高可控性

论文提出MMaDA,首个系统性探索扩散架构的多模态基础模型,实现文本推理、多模态理解与图像生成的统一建模。该模型在多任务协同上表现出色,并通过混合长链思维微调和统一策略梯度优化提升性能。

获信通院“4+级”评级,文心大模型最新版有何技术创新?百度吴甜详解

在百度AI Day活动上,文心4.5 Turbo和X1 Turbo大模型展示了多项技术创新。通过混合训练技术提升跨模态学习效率和多模态融合效果,后训练采用自反馈增强技术优化生成结果质量,同时具备数据建设闭环以提供丰富多样高质量数据。百度文心大模型在推理能力评估中获得最高级评级,并成功应用到数字人主播等实际场景中。

【AI Agent深度研究报告】2025年,AI Agent应用全面爆发:它到底能干掉多少岗位?

五年前的Siri到如今的ChatGPT再到未来的AI智能体(Agent),它能听懂指令、自动执行任务,还能自主学习和灵活应变。未来五年,AI智能体会全面改变我们的工作与生活方式。