
——《三体3》,刘慈欣


体验链接:
https://matrix.tencent.com/ai-detect
比如下面这4张图和2段文字,你猜猜哪个是AI生成的?

前几天,收到混元的内测邀请,测了有40+样本吧,准确率在95%左右。

朋友@guahunyo 测了Flux直出的20张图,只有4张没有测出是AI,准确率80%。

朋友@亮亮rayne 用dev+自配多lora出的图,没能被检测出来,AI概率在30%左右。可能叠了几层图+原生lora,逃逸出去了。

2024年国庆期间,飓风妮海伦导致超200人死亡,有张小女孩的图片被疯狂转发。
检测结果:AI生成概率96.91%,极有可能是AI生成。

2024年美国热门人物路易吉,他这张穿囚服的照片,肉眼看怎么都像是AI生成的,看看模型检测如何。
检测结果:AI生成概率21.02%,不太可能是AI生成。

这是一张经典的网络梗图,传到我这里都不知道过了多少道手,早包浆了,看看能不能检出。
检测结果:AI生成概率66.17%,极有可能是AI生成。

瓜佬@guahunyo 的美女图,是AI绘图圈一绝(真好看),发给模型测测。
检测结果:AI生成概率99.98%。看来,跟赛博美女恋爱需谨慎
。

这是一张真实图,我人工在右下角添加了AI水印“本图片由AI生成”,干扰下模型。
检测结果:AI生成概率22.46%,不太可能是AI生成。看来,AI水印并不能骗它。

由豆包、Kimi、智谱、通义、文心、元宝、跃问、讯飞、天工、DeepSeek、海螺等国产AI直接生成的文本,检测的AI率基本都是100%。
即使是顶尖模型,如GPT-4o、Claude 3.5 sonnet,AI率也超过了98%。
比如朋友@云中江树 用Claude 3.5 sonnet写的这篇,我觉得写得真好。但AI率有88%,极有可能是AI生成。
沃垠AI文章《我们对o系列模型大大低估了》,作者Will Bryk,中文机翻,AI率0%。
以及我写的原创文《我对2025年AI的十点思考》,AI率3%。

1)不论是国外的顶尖模型还是国内的主流模型,由AI平台直接生成的图片或文字,测试结果基本都是100%,完全准确。
2)本地模型跑图+自配lora(一种微调模型的方法),出来的AI作品会逃逸,检测不准,但也能在30%左右。30%,也是衡量一个作品是否含AI的起点线。
3)图片带不带AI水印,不影响检测结果;图片被压缩或裁剪,也不影响检测结果;真实图片加上AI水印,不会干扰模型判断。
4)AI生成的图片或文字,局部经过人工修改,有可能检不出。

从实测来看,也是如此。准确率比其他检测工具高出不少,是我目前用过最准的AI检测系统了。
体验网址:
https://matrix.tencent.com/ai-detect
这个系统由腾讯混元安全团队的朱雀实验室研发,他们用了140万份的正负样本数据集来训练,涵盖了多个场景,比如人体、人像、风景、地标、植物、电影、游戏、新闻等。
看到这里,可能会有小学生提问:“正负样本”是什么意思呀?
学习委员(不是,实际是DeepSeek
)答:正样本是你想要找的东西(比如企鹅),负样本是你不想要的东西(比如火锅),把它们放在一起教模型学会区分。

这套AI检测系统,通过大量正负样本数据(不同领域、不同模型)进行训练,来推断作品的AI生成概率。
也可以理解为,用魔法打败魔法,让AI“打假”AI。
当然,检出AI率较高≠造假。使用AI并不丢人,隐瞒使用AI并用AI生成的内容去伪造、替换真实世界的内容,这才是造假。
作为AI从业者,我举双手赞成AI标记(比如C2PA元数据)、AI识伪(比如朱雀检测模型)。只有这样,才能推动行业的良性发展,而不是一次次负面舆情造成人类对AI的不信任。
AI,是人造的真实产物,它早已融入我们的世界,成为不可分割的一部分。
由AI生成的内容(AIGC),如同江河奔流,不会因人类的抗拒而停滞,不会因人类的排斥而消失。它是我们的现在,也是我们的未来。
在这条共行的路上,人类有责任,要摆正好AI的位置。
(文:沃垠AI)