这个工具,能辨一切AI

「给岁月以文明,而不是给文明以岁月。」

——《三体3》,刘慈欣


用AI“打假”AI
今天,腾讯混元安全团队上线了一款AI检测工具。

体验链接:

https://matrix.tencent.com/ai-detect

目前支持图片和文字的检测,视频还在研发中。

比如下面这4张图和2段文字,你猜猜哪个是AI生成的?

实测50+Case
前几天,收到混元的内测邀请,测了有40+样本吧,准确率在95%左右。


朋友@guahunyo 测了Flux直出的20张图,只有4张没有测出是AI,准确率80%。


朋友@亮亮rayne dev+自配多lora出的图,没能被检测出来,AI概率在30%左右。可能叠了几层图+原生lora,逃逸出去了。


以下,是一些实测Case。
2024年国庆期间,飓风妮海伦导致超200人死亡,有张小女孩的图片被疯狂转发。
检测结果:AI生成概率96.91%,极有可能是AI生成。


2024年美国热门人物路易吉,他这张穿囚服的照片,肉眼看怎么都像是AI生成的,看看模型检测如何。
检测结果:AI生成概率21.02%,不太可能是AI生成。


这是一张经典的网络梗图,传到我这里都不知道过了多少道手,早包浆了,看看能不能检出。
检测结果:AI生成概率66.17%,极有可能是AI生成。


瓜佬@guahunyo 的美女图,是AI绘图圈一绝(真好看),发给模型测测。
检测结果:AI生成概率99.98%。看来,跟赛博美女恋爱需谨慎


这是一张真实图,我人工在右下角添加了AI水印“本图片由AI生成”,干扰下模型。
检测结果:AI生成概率22.46%,不太可能是AI生成。看来,AI水印并不能骗它。


文本这块,我也跑了很多Case。
由豆包、Kimi、智谱、通义、文心、元宝、跃问、讯飞、天工、DeepSeek、海螺等国产AI直接生成的文本,检测的AI率基本都是100%。
即使是顶尖模型,如GPT-4o、Claude 3.5 sonnet,AI率也超过了98%。
比如朋友@云中江树 用Claude 3.5 sonnet写的这篇,我觉得写得真好。但AI率有88%,极有可能是AI生成。
2016年咪蒙爆款文章,AI率1%。
2020年《读者》经典文章,AI率6%。
沃垠AI文章《我们对o系列模型大大低估了》,作者Will Bryk,中文机翻,AI率0%。
以及我写的原创文《我对2025年AI的十点思考》,AI率3%。


结合身边朋友测的情况和我自己跑的Case来看:
1)不论是国外的顶尖模型还是国内的主流模型,由AI平台直接生成的图片或文字,测试结果基本都是100%,完全准确。
2)本地模型跑图+自配lora(一种微调模型的方法),出来的AI作品会逃逸,检测不准,但也能在30%左右。30%,也是衡量一个作品是否含AI的起点线。
3)图片带不带AI水印,不影响检测结果;图片被压缩或裁剪,也不影响检测结果;真实图片加上AI水印,不会干扰模型判断。

4)AI生成的图片或文字,局部经过人工修改,有可能检不出。

写在最后
对于这个检测系统,官方介绍:检出率在95%左右
从实测来看,也是如此。准确率比其他检测工具高出不少,是我目前用过最准的AI检测系统了。

体验网址:

https://matrix.tencent.com/ai-detect

这个系统由腾讯混元安全团队的朱雀实验室研发,他们用了140万份的正负样本数据集来训练,涵盖了多个场景,比如人体、人像、风景、地标、植物、电影、游戏、新闻等。

看到这里,可能会有小学生提问:“正负样本”是什么意思呀?

学习委员(不是,实际是DeepSeek)答:正样本是你想要找的东西(比如企鹅),负样本是你不想要的东西(比如火锅),把它们放在一起教模型学会区分。


这套AI检测系统,通过大量正负样本数据(不同领域、不同模型)进行训练,来推断作品的AI生成概率。
也可以理解为,用魔法打败魔法,让AI“打假”AI。
当然,检出AI率较高≠造假使用AI并不丢人,隐瞒使用AI并用AI生成的内容去伪造、替换真实世界的内容,这才是造假。
作为AI从业者,我举双手赞成AI标记(比如C2PA元数据)、AI识伪(比如朱雀检测模型)。只有这样,才能推动行业的良性发展,而不是一次次负面舆情造成人类对AI的不信任。
AI,是人造的真实产物,它早已融入我们的世界,成为不可分割的一部分。
由AI生成的内容(AIGC),如同江河奔流,不会因人类的抗拒而停滞,不会因人类的排斥而消失。它是我们的现在,也是我们的未来。
在这条共行的路上,人类有责任,要摆正好AI的位置。
正所谓:“不要给文明以岁月,而是给岁月以文明。

(文:沃垠AI)

发表评论