来源 | 智合标准化建设
作者 | 智合标准中心
数据是AI的“原油”。数据标注作为训练大模型至关重要的一环,直接影响机器学习模型的性能。高质量的数据标注,将有助于机器精准理解、快速学习、高效训练,显著提升大模型的准确性和泛化能力。
从政策层面看,今年年初,国家发展改革委等部门联合发布《关于促进数据标注产业高质量发展的实施意见》,同时国家数据局表示,未来将进一步畅通数据采集、标注、人工智能应用产业链,这均标志着国家在大力推进数据标注产业发展。

图1. 来源于数据驱动智能
然而,随着高质量发展的不断深化,产业长期存在的数据来源模糊、标注质量失控、隐私泄露、敏感信息不当处理等合规问题日渐突出。当技术创新与合规风险形成对冲,行业亟需一套低成本、可复制的解决方案。未来随着监管趋严,相关企业在数据标注层面的合规能力,或成其核心竞争力。
为提升数据标注行业规范化发展,由中国电子商会归口管理,智合标准中心正式启动了《面向人工智能的数据标注合规指南》团体标准的研制工作,目前初稿已经出炉。


现持续邀请人工智能厂商、数据标注企业、合规专业服务机构、技术方案提供商、以及开展人工智能研究的高校或科研院所等加入标准起草编制组,结合业务实践建言献策,共探数据标注产业高质量发展的合规路径。
【已确认参与起草的部分单位】
-
中移互联网有限公司
-
公安部第三研究所
-
中国电子信息产业发展研究院(赛迪研究院)
-
江苏钟吾大数据发展集团有限公司
-
北京云测数据科技有限公司
-
福建中锐电子科技有限公司
-
蚂蚁科技集团股份有限公司
-
北京集纳盛广网络科技有限公司(37度数据)
-
北京易华录信息技术股份有限公司
-
北京热热文化科技有限公司(热热数据)
-
杭州数据交易所有限公司
-
澳鹏Appen
-
国网江苏省电力有限公司连云港供电分公司
-
广西影迅物流有限公司
-
金华途样网络科技有限公司
-
重庆群星引力大数据科技有限公司
-
西藏云通数字科技有限公司
-
北京之合网络科技有限公司
-
上海之合网络科技有限公司
-
北京市环球律师事务所
-
广东广悦律师事务所
-
浙江浦源律师事务所
-
更多单位确认中……

《标准》结合“业务场景实操化、人员管理规范化、企业经营稳健化”3大原则,聚焦数据来源、标注内容与过程操作、标注人员管理、数据安全与隐私保护、监督和审计机制5大关键合规议题展开研制,将帮助AI企业从源头低成本解决数据标注合规难题。
欢迎人工智能企业,数据标注技术厂商,数据标注平台运营方,数据安全技术厂商、法律合规服务机构,以及开展人工智能研究的高校或科研院所等相关单位参与起草工作,与会共研、共议标准优化方向。
如您对本标准感兴趣,欢迎扫码填报信息,后续会有工作人员与您联系。

【编制计划】

END
(文:AI工程化)