浙大&港理工等提出InfiGUI-R1:利用强化学习,让GUI智能体学会规划任务、反思错误

InfiGUI-R1 是基于 Actor2Reasoner 框架训练的一个 GUI 智能体,旨在提升其规划和反思能力。该模型通过小规模参数量实现了出色的表现,包括强大的 GUI 元素定位能力和复杂任务执行能力。

重磅开源!英伟达团队推出Eagle 2.5,8B参数性能叫板GPT-4o,附带全新数据集

英伟达团队发布Eagle 2.5视觉语言模型,在长上下文多模态学习方面取得显著进展,其在Video-MME基准测试中实现了72.4%的高准确率。该模型通过信息优先采样、渐进式混合后训练和多样性驱动的数据配方等创新技术提升性能,并已在开源社区上线。

庭院机器人企业「汉阳科技Yarbo」完成2亿融资

深圳汉阳科技完成2亿元融资,用于提升供应链和量产水平、增加研发投入。企业专注于智能服务机器人研发,目标为欧美地区家庭用户提供庭院服务机器人解决方案。公司通过1+N主机加多模块设计解决极端环境清扫问题,未来将推出更多场景应用。