带图推理碾压同类开源模型!港中文微软等开源OpenThinkIMG框架,教AI学会使用视觉工具
港中文和微软联合团队推出OpenThinkIMG开源框架,旨在提升AI视觉工具使用和推理能力。该框架包含模块化视觉工具部署、高效的智能体训练框架及高质量数据生成技术,支持自主学习的V-ToolRL算法显著提升了AI在图表推理任务上的表现。
港中文和微软联合团队推出OpenThinkIMG开源框架,旨在提升AI视觉工具使用和推理能力。该框架包含模块化视觉工具部署、高效的智能体训练框架及高质量数据生成技术,支持自主学习的V-ToolRL算法显著提升了AI在图表推理任务上的表现。
DingJin-R1是阿里云与苏州大学联合研发的金融AI大模型,专为金融任务设计,融合前沿技术和海量数据。它分为7B和32B两个版本,其中32B在测试中表现最佳,性能超越行业顶尖模型。模型采用开源数据集和特训方式训练,并利用通义点金平台的数据合成技术提升性能。DingJin-R1已在金融任务三大核心领域及通用数据集上全面通过测试,表现出色。
本文介绍了一个名为DianJin-R1的金融大模型,它融合了先进的技术和全面的数据支持。该模型包含一个开源的推理数据集DianJin-R1-Data,并且已向公众开放了两个大型预训练模型DianJin-R1-7B和DianJin-R1-32B。通过监督微调和强化学习,这些模型在复杂金融任务中的表现卓越。
腾讯&苏州大学团队提出新框架RLVR,使用基于生成模型的软奖励提升大模型在医学、化学等多学科的能力。研究还开源了奖励模型和数据集,并指出未使用思维链推理方法仍需深入研究。
IC-Light 是张吕敏提出的 IC-Light 项目,能够通过文本或背景图片引导改变照片的光影效果。该论文在 ICLR 大会上获得满分评级。作者张吕敏毕业于苏州大学,并在斯坦福读博,发表了多篇 AI 绘画相关论文。