MLNLP学术Talk第三十期 鲍光胜@西湖大学:AI和人类的差异 – 从推理的因果性和生成文本的可检测性看AI和人类的异同

MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。

MLNLP学术TalkMLNLP社区举办的学术交流活动,旨在邀请一线青年学者分享最前沿的技术,期待最精彩的思想火花碰撞。

本期MLNLP学术Talk邀请了西湖大学鲍光胜在2025年4月12日10:00-11:00为我们带来AI和人类的差异 – 从推理的因果性和生成文本的可检测性看AI和人类的异同的主题报告。详细信息如下:




1

讲者简介

个人介绍:

鲍光胜,西湖大学张岳老师实验室的博士三年级学生。主要兴趣在可信赖自然语言处理技术,包括大语言模型生成内容的安全性、可控性、可解释性,以及大语言模型的因果推理能力。在人工智能国际顶级会议及期刊发表一作论文十余篇其文本检测方面的工作受到《麻省理工科技评论》的点评和《科技日报》的报道。在读博之前,鲍光胜曾在微软(中国)和阿里巴巴工作多年,曾参与微软数字助手Cortana的研发。


2

报告摘要


AI的能力越来越强,不仅能够通过推理解决实际问题,而且能够构思和写作出有深度的文章。在很多方面,AI的能力看起来和人类很接近了。但是我们的研究表明,这种相似性可能只是表面上看起来相似,其背后却与人类有本质的不同。

首先,AI生成的推理过程很多时候,只是行为的模仿,并不是真正的推理。我们在大语言模型上使用扰动实验,通过统计显著性检验变量间的因果联系,揭示大模型内部的因果图结构。通过将大模型的表层行为和底层的结构对应起来,能够解释大模型推理中的很多奇怪现象,比如说错误的推理过程得到正确的结果。

其次,AI生成的文本内容在分布上和人类写作的文本内容有显著的差异。大语言模型生成的内容已经能够很好的模仿人类,使得其生成的文本内容,即使是语言学专家也很难辨别。但是这种在人类看起来无法区分的文本内容,在统计上却有迹可循。特别是利用不断增强的大语言模型自身,我们可以辨别模型生成的内容。

本次报告将主要介绍作者COLING 2025文章How Likely Do LLMs with CoT Mimic Human Reasoning?”和ICLR 2025文章Glimpse: Enabling White-Box Methods to Use Proprietary Models for Zero-Shot LLM-Generated Text Detection”。


3

主持人介绍

王鹏,目前为中南大学访问学生,即将于9月入学澳门科技大学。研究兴趣为自然语言处理、大语言模型、大模型智能体。在ToMM、BDMA等会议、期刊上发表学术论文。


4

直播平台


视频号


B站




关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

(文:机器学习算法与自然语言处理)

发表评论