教师带领下使用生成式AI,学习提升效果明显。
来源|多知
作者|王上
今年1月,沃顿商学院教授Ethan Mollick在X发布,一支由世界银行教育专家、数据科学家、研究分析师等组成的权威团队,在尼日利亚,针对学生使用GPT-4辅导学习,做了一项随机对照试验。他们发现,连续6周用AI进行课后辅导,学生所获得的学习成效相当于正常上了两年学。
而且,这种方法,超过了发展中国家教育干预措施随机对照试验数据库中80%的其它教育干预措施。
无疑,生成式AI(人工智能)对教育的影响是革命性的,这可能是自印刷机发明以来教育领域最重大的变革。像许多家长和教育工作者一样,研究团队也在努力思考这些技术将如何影响下一代人的学习体验。
批评者对生成式AI对公平性、有效性以及学习本质的影响提出了合理的担忧。但AI 已经存在于生活的方方面面。
通过连续6周学生使用GPT-4的短期研究,研究团队得出三个结论:第一,全面促进了学习;第二,参与度越高,收获越大;第三,学习成果提升显著。
值得注意的是,该项目是在学校进展的,并非是学生自主使用。Ethan Mollick强调:“与‘老师将被取代’一说正好相反,今天的大模型都需要真人老师的指导才能发挥作用。某些情况下 ,独立使用AI作为导师可能会损害学习,因为它给人一种在学习的错觉。”
1
教师带领下使用生成式AI,学习提升效果明显
早在1984年,教育心理学家Benjamin Bloom就提出了“接受一对一辅导的学生在学习成效上远超仅限于传统课堂设置的学生”。尽管一对一辅导的优势已被证实,但成本高昂。
来自世界银行的教育团队认为,生成式AI能够创造新的类人内容,为教育应用开辟了更广泛的可能性。
基于这一认知,他们在尼日利亚埃多州进行了一场实验。
在2024年6月至7月期间,来自七个试点学校的800名高中一年级学生,每周需要在计算机实验室参加两次课后AI英语辅导。
具体来说,每节课以教师介绍本周主题开始,随后学生与由GPT-4驱动的Microsoft Copilot进行互动,然后完成英语语法学习和写作任务。
在这个过程中,教师在当中会指导学生如何使用AI,还会适时给出Prompt建议。此外,在每节课要结束时,教师带领学生进行反思练习。
在这个项目中,人工智能的工具叫“Uyi”。使用6周后,研究团队得出结论:
1. 该项目全面促进了学习。
在发布的随机评估结果显示,该项目对学习成果产生了极为积极的影响。在2024年6月至7月为期六周的干预结束后,学生们参加了一场纸笔测试,以评估他们在三个关键领域的表现:英语(该试点项目的主要关注点)、人工智能知识以及数字技能。
被随机分配参加该项目的学生在所有领域的表现都显著优于未参加项目的同龄人,包括作为项目主要目标的英语。
这些发现证明,在教师支持下经过精心实施的生成式AI,可以有效地充当虚拟导师。
值得注意的是,其益处超出了项目本身的范畴。参与项目的学生在年终课程考试中也表现更佳。这些考试是常规学校教学计划的一部分,涵盖的主题远多于六周干预项目所涉及的内容。这表明,学会有效运用人工智能的学生或许借助这些技能,独立探索并掌握了其他主题。
此外,该项目让所有学生都受益,并非仅惠及成绩最优异的学生。起初,女生的成绩落后于男生,但她们从这一干预举措中获得的提升似乎更大,这凸显了该项目在缩小学习方面性别差距上的潜力。
2、参与度越高,收获越大
学生参加的课程越多,收获就越大。由于雨季洪水、教师罢工以及课后工作安排等因素,许多学生难以保证出勤。研究组利用为该项目开发的一套完善的监测系统,仔细追踪学生的出勤情况。每多出勤一天,学生的学习成果就有显著提升。重要的是,随着项目推进,这种趋势并未减弱。
这表明,项目周期若能延长,学生可能会取得更大的进步。
3、学习成果提升显著
学习上的进步十分显著,约提升了0.3个标准差。换个角度看,这相当于在短短六周内实现了近两年的常规学习进度。
我们将这些结果与发展中国家通过随机对照试验研究的教育干预措施数据库进行对比,发现我们的项目成效超过了其中80%的项目,包括一些最具成本效益的策略,如结构化教学法和因材施教。
鉴于项目时长较短,评估设计很可能低估了真实影响,这一成果尤为引人注目。
这些观点引发了网友的讨论,纷纷阐述了生成式AI对教育影响的观点。
有网友说:“这正是我如此热衷于人工智能的原因——为人们打开通道和机会。更令人震惊的是,许多学生在这次试点之前从未使用过电脑。这让我对每个人都能实现的可能性感到非常兴奋。”
有网友提到:“有当我刚开始使用ChatGPT时,我亲身体验到了‘私人’导师的潜力。这是诚实的指导学习:不懂的地方就问-询问你最感兴趣的是什么-跳过对你来说显而易见的部分-高效、有目的地学习。”
还有网友说:“我有兴趣查看教师使用 AI 工具创建的作业,以支持个性化学习。我还想了解学生是否主要使用 AI 来促进自适应学习,还是将其作为辅导工具来协助完成作业。”
Ethan Mollick对部分网友的评论感到担忧,他说:“实际上,AI工具还是需要教师的指导。比如,在某些情况下,独立用AI作辅导可能会损害学习,因为它给人一种在学习的错觉。”
02
接下来如何?
评估展示了生成式AI在课堂上,特别是在发展中环境里的变革潜力。
此项研究是首次在这类环境中评估生成式AI作为虚拟导师的影响,它借鉴了其他环境和形式中的可靠证据,例如编码课程中的人工智能应用、土耳其一所学校里人工智能与学习的结合、加纳通过WhatsApp利用人工智能教授数学,以及将人工智能用作作业辅导工具等。
然而,这仅仅是个开始。
仍有几个关键问题有待解答:这种干预的长期效果如何?学生除了短期内学习成绩提升之外,还有哪些方面受益?他们与大语言模型(LLMs)的互动方式如何演变,教师在促进这些互动中扮演什么角色?这些益处是否延伸到了其他学科?是否存在任何负面的、非预期的影响?
解答这些问题对于有效扩大类似项目规模至关重要。该项目组将会继续发表相关结论。
相关阅读:
皮尤报告:Z世代正在用ChatGPT来完成学业,26%人使用过
END
(文:多知)