带图推理碾压同类开源模型!港中文微软等开源OpenThinkIMG框架,教AI学会使用视觉工具

港中文和微软联合团队推出OpenThinkIMG开源框架,旨在提升AI视觉工具使用和推理能力。该框架包含模块化视觉工具部署、高效的智能体训练框架及高质量数据生成技术,支持自主学习的V-ToolRL算法显著提升了AI在图表推理任务上的表现。

阿里联手苏州大学,发布金融推理大模型:DianJin-R1,32B模型荣膺榜首

DingJin-R1是阿里云与苏州大学联合研发的金融AI大模型,专为金融任务设计,融合前沿技术和海量数据。它分为7B和32B两个版本,其中32B在测试中表现最佳,性能超越行业顶尖模型。模型采用开源数据集和特训方式训练,并利用通义点金平台的数据合成技术提升性能。DingJin-R1已在金融任务三大核心领域及通用数据集上全面通过测试,表现出色。

阿里云通义点金发布DianJin-R1金融领域推理大模型,32B模型荣膺榜首

本文介绍了一个名为DianJin-R1的金融大模型,它融合了先进的技术和全面的数据支持。该模型包含一个开源的推理数据集DianJin-R1-Data,并且已向公众开放了两个大型预训练模型DianJin-R1-7B和DianJin-R1-32B。通过监督微调和强化学习,这些模型在复杂金融任务中的表现卓越。

大模型RL不止数学代码!7B奖励模型搞定医学法律经济全学科, 不用思维链也能做题

腾讯&苏州大学团队提出新框架RLVR,使用基于生成模型的软奖励提升大模型在医学、化学等多学科的能力。研究还开源了奖励模型和数据集,并指出未使用思维链推理方法仍需深入研究。

ICLR’25 惊现[10,10,10,10]满分论文,ControlNet 一作张吕敏新作,Github 5.8k 颗星

IC-Light 是张吕敏提出的 IC-Light 项目,能够通过文本或背景图片引导改变照片的光影效果。该论文在 ICLR 大会上获得满分评级。作者张吕敏毕业于苏州大学,并在斯坦福读博,发表了多篇 AI 绘画相关论文。