
MLNLP学术Talk是MLNLP社区举办的学术交流活动,旨在邀请一线青年学者分享最前沿的技术,期待最精彩的思想火花碰撞。
本期MLNLP学术Talk邀请了西湖大学鲍光胜在2025年4月12日10:00-11:00为我们带来“AI和人类的差异 – 从推理的因果性和生成文本的可检测性看AI和人类的异同”的主题报告。详细信息如下:

讲者简介

个人介绍:
鲍光胜,西湖大学张岳老师实验室的博士三年级学生。主要兴趣在可信赖自然语言处理技术,包括大语言模型生成内容的安全性、可控性、可解释性,以及大语言模型的因果推理能力。在人工智能国际顶级会议及期刊发表一作论文十余篇,其文本检测方面的工作受到《麻省理工科技评论》的点评和《科技日报》的报道。在读博之前,鲍光胜曾在微软(中国)和阿里巴巴工作多年,曾参与微软数字助手Cortana的研发。
报告摘要
AI的能力越来越强,不仅能够通过推理解决实际问题,而且能够构思和写作出有深度的文章。在很多方面,AI的能力看起来和人类很接近了。但是我们的研究表明,这种相似性可能只是表面上看起来相似,其背后却与人类有本质的不同。
首先,AI生成的推理过程很多时候,只是行为的模仿,并不是真正的推理。我们在大语言模型上使用扰动实验,通过统计显著性检验变量间的因果联系,揭示大模型内部的因果图结构。通过将大模型的表层行为和底层的结构对应起来,能够解释大模型推理中的很多奇怪现象,比如说错误的推理过程得到正确的结果。
其次,AI生成的文本内容在分布上和人类写作的文本内容有显著的差异。大语言模型生成的内容已经能够很好的模仿人类,使得其生成的文本内容,即使是语言学专家也很难辨别。但是这种在人类看起来无法区分的文本内容,在统计上却有迹可循。特别是利用不断增强的大语言模型自身,我们可以辨别模型生成的内容。
本次报告将主要介绍作者COLING 2025文章“How Likely Do LLMs with CoT Mimic Human Reasoning?”和ICLR 2025文章“Glimpse: Enabling White-Box Methods to Use Proprietary Models for Zero-Shot LLM-Generated Text Detection”。
主持人介绍

王鹏,目前为中南大学访问学生,即将于9月入学澳门科技大学。研究兴趣为自然语言处理、大语言模型、大模型智能体。在ToMM、BDMA等会议、期刊上发表学术论文。
直播平台
视频号
B站


关于我们

(文:机器学习算法与自然语言处理)