AI内容标识纳入强监管,实测23款主流平台落地现状


文| 杨柳 樊文扬

图| 黄莉玲

网信办等四部门新出台的AI内容标识新规,将于今年9月1日施行,以应对AI技术滥用引发的虚假信息治理难题。3月17日至18日,南都针对23款应用软件的测试发现,主流AI平台、社交平台普遍已开始落地AI内容标识的要求。
3月14日,国家网信办、工信部、公安部和国家广播电视总局联合发布《人工智能生成合成内容标识办法》(下称《AI内容标识办法》)。该办法围绕“哪些是生成的”“谁生成的”“从哪里生成的”等问题,为AI平台、社交内容平台、应用商店和用户四类主体分别设定了AI内容的标识义务。
小红书方面告诉南都记者,落地《AI内容标识办法》的要求不存在难度,早在2024年5月,小红书已作为试点平台参与了中央网信办的AI标识试点工作。而广东财经大学法学院教授姚志伟此前向记者表示,新规对内容传播平台提出的技术要求较高,中小内容平台能否有效落地执行还需观察。
AI内容监管的第一道防线
《AI内容标识办法》对外发布当天上午,公安部网安局公布一则辟谣公告:闹得沸沸扬扬的“有顶流明星在澳门输了10亿”传闻,实则网民用AI工具生成的谣言。
类似这样的AI伪造事件,在过去一年中频繁上演:雷军、靳东、张文宏等公众人物沦为AI生成内容的受害者;西藏日喀则地震中“被压在废墟下的小男孩”图片系AI生成;三只羊“录音门”事件的音频同样由AI制作而成。
在此背景下,今年全国两会上,多位人大代表和政协委员呼吁立法规制AI技术滥用。例如,作为全国人大代表的雷军提议,加强“AI换脸拟声”违法侵权重灾区治理。全国人大代表,TCL创始人、董事长李东生则建议,要规范“AI换脸拟声”技术的不当利用,有必要要求深度合成服务提供商对AI生成的内容进行强制标识,减少恶意滥用。
域外来看,添加标识同样是监管部门提升AI内容透明度的重要抓手。比如,西班牙政府3月11日批准了《人工智能(AI)治理法案》,要求企业对AI生成内容进行适当标识,否则将被处以 750万欧元至3500万欧元,或公司全球营业额的2%至7%的罚款。
“标识是对人工智能生成内容监管的第一道防线。”姚志伟说。
国家网信办在“答记者问”中指出,《AI内容标识办法》意在通过标识提醒用户辨别虚假信息,明确相关服务主体的标识责任义务,规范内容制作、传播各环节标识行为;同时减轻AI生成合成技术滥用危害,防范利用AI技术制作传播虚假信息等风险行为。
中国科学院计算技术研究所数字内容合成与伪造检测实验室主任、研究员曹娟发文表示,标识数据还可为鉴伪模型提供丰富多样、来源广泛的高质量训练样本,实现数据层面“生成-标识-检测”的生态闭环,从而推动鉴伪技术与时俱进地迭代升级。
新规细化既有规定
为AI生成合成的内容添加标识,并非一项全新的监管要求。
内容标识要求至少可以追溯到2019年国家网信办等三部门印发的《网络音视频信息服务管理规定》。该规定要求,网络音视频信息服务提供者和网络音视频信息服务使用者利用基于深度学习、虚拟现实等的新技术新应用制作、发布、传播非真实音视频信息的,应当以显著方式予以标识。
此后,国家网信办等部门又相继出台《互联网信息服务深度合成管理规定》(下称《深度合成规定》)、《生成式人工智能服务管理暂行办法》等部门规章,均提及网络服务提供者对AI生成合成内容的标识义务。另外,2023年7月,中央网信办发布的《关于加强“自媒体”管理的通知》提到,使用技术生成的图片、视频的,需明确标注系技术生成。
此次出台的《AI内容标识办法》效力等级为行政规范性文件。该办法和配套实施的强制性国家标准《网络安全技术 人工智能生成合成内容标识方法》一起,旨在进一步细化标识的具体实施规范。
《AI内容标识办法》将AI生成合成内容标识包括显式标识和隐式标识。顾名思义,显式标识即为能被用户明显感知到的标识;隐式标识则是采取技术措施在生成合成内容文件数据中添加的,不易被用户明显感知到的标识,包含生成合成内容属性信息、服务提供者名称或者编码、内容编号等制作要素信息。
承担标识义务的有AI平台、社交内容平台、应用商店和用户四类主体。
具体而言,AI平台需在生成合成内容中添加符合要求的显式标识和隐式标识,并在用户服务协议中明确说明这些内容。此外,当AI平台在履行算法备案、安全评估等手续时,还应提供生成合成内容标识相关材料,并为打击相关违法犯罪活动提供支持。
社交内容平台主要承担对AI内容的核验义务。若识别了AI生成合成或疑似AI内容,社交平台应告知提醒公众。除了核验,社交平台也应主动提供必要的标识功能,提醒用户主动声明发布内容中是否包含生成合成内容。
应用商店则负责AI类App的审核义务,必须核验这类App服务提供者的生成合成内容标识相关材料。
用户的义务可概括为主动声明标识和不得删除、隐匿标识。
显式标识在主流平台普遍落地
尽管新规设置了近半年的过渡期,但由于给AI内容添加标识并未全新要求,主流AI平台和社交平台普遍开启了显式标识的落地工作。
南都选取的测评对象包括8款主流社交平台——小红书、微博、微信公众号和视频号、抖音、快手、B站、豆瓣、知乎;以及15款主流AI平台——DeepSeek、腾讯元宝、豆包、Kimi智能助手、纳米AI搜索、文心一言(文小言)、智谱清言、星野、即梦AI、讯飞星火、天工AI、通义、可灵AI、Minimax(海螺视频/海螺语音)、百小应。
实测发现,所有8款社交平台,均为用户上传AI生成合成内容提供了主动声明功能;其中,6家已在用户协议等规范中明确了用户的AI内容标识义务,小红书、微博、微信视频号、B站还提醒用户,若未如实标识,最严将面临封禁账号的惩罚。
8款社交平台的测评结果。“打钩”表示有相关内容或功能,“打叉”表示没有相关内容或功能。
测评的15款主流AI平台,则都在所生成的文字对话、图片、视频中添加了明显的AI标识;其中,13款AI平台在用户协议中写入用户的AI内容标识义务。值得一提的是,腾讯元宝明确在协议中提到会为生成的内容添加隐式水印标识。
15款AI平台的测评结果。“打钩”表示有相关内容或功能,“打叉”表示没有相关内容或功能。
小红书方面向记者介绍,小红书在2023年便已启动针对生成式AI内容的治理体系建设,其中一项措施是加大AI识别模型的研发投入。基于“分类器”技术的识别模型,平台对识别为疑似AI生成的内容进行显著标识,提醒用户注意甄别内容真实性。目前识别模型的准确率在95%左右。如果用户自认为平台识别有误,可以通过平台反馈机制申诉。
小红书方面还表示,平台设置了机器识别+人工识别的双重屏障,以减少AI生成低质内容的曝光,针对其中侵权、假冒、诱导等内容第一时间下架处理。对于创作者,平台要求主动对AI生成内容进行显著标识,并持续简化打标流程。
相比之下,应用商店运营方的AI标识材料核验尚未推行。经查询应用软件的审核规范文本和询问客服得知,华为、小米、OPPO、vivo和荣耀这五家第一梯队的安卓手机厂商,目前对深度合成与人工智能类App的资质审核细则中,均未纳入核验生成合成内容标识相关材料的要求。
出品:南都数字经济治理研究中心

(文:AI前哨站)

欢迎分享

发表评论