20家单位参与,《面向人工智能的数据标注合规指南》征集中

阿里开源的Qwen2.5系列训练数据规模达到18万亿token,远超其他模型。然而,这带来幻象问题的风险促使RAG技术及企业专有知识数据的价值提升,强调了数据采集、标注和管理的重要性。政策层面,《关于促进数据标注产业高质量发展的实施意见》发布,进一步推动数据标注产业发展。《标准》旨在解决数据标注中的合规问题,提高行业规范化发展水平。

破解合规难题,AI高质量数据集建设正当时

阿里开源的Qwen2.5系列训练数据规模达18万亿 token,推动AI大模型发展。但大规模训练带来幻象问题,RAG技术及工业场景应用以数据为中心成为趋势。国家和行业正积极推进数据标注产业发展规范,提升数据标注行业的合规能力。

R1–Zero强化学习路线新发现及R1思路用于GUI Agent动作预测方案

2025年4月1日,北京天气晴。文章介绍了R1进展中的两个工作,一是研究多种基础模型预训练特性的影响;二是将GRPO-RL强化用于Agent的UI动作预测,数据和奖励函数设计有趣。研究发现Qwen2.5模型在不使用模板的情况下有强大的推理能力,但模板会破坏数学解题能力。此外,文章还讨论了强化学习在图形用户界面(GUI)动作预测中的应用。

阿里国际站AI布局引多家外媒关注:AI搜索Accio企业用户超百万

阿里国际站总裁张阔透露,Accio企业用户已超百万。接入Qwen2.5等先进推理模型后,让阿里国际站在AI外贸领域引发关注。海外买家在采购时信息类搜索量是商品类的10倍。目前Accio的用户规模超百万,且已有超过10万中小企业使用AI工具做外贸。张阔称AI能协助人完成外贸经营中的绝大部分环节,将提高转化率、客户互动和商品管理。