
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
“凡我无法创造的,我就无法真正理解。” — 费曼
智能时代呼啸而来,正深刻改变着人们生产、生活和学习的方式。过去几十年里,社会科学家和相关领域的研究者,一直致力于通过实证数据与模型揭示人类行为和智能社会运行的基本规律,试图找出隐藏在各种社会现象和治理痛点背后的因果机制,从而回答 “是什么?为什么?如何治” 等一系列问题。然而,在社会科学研究从 “解释世界” 向 “改造世界” 演进的范式转型中,研究者们始终面临着一个根本性挑战 —— 如何突破传统实证主义方法的局限,实现对人类行为模式与社会运行规律的可计算、可干预、可预测的深度理解。正如物理学家费曼所说的那句经典名言:“凡我无法创造的,我就无法真正理解。” 真正的理解,不仅是观察和解释,更在于能否通过 “生成式” 的方式,自底而上地模拟复现人类行为的复杂模式与社会系统的运行规律,从而模拟、预测和研判智能社会治理演化路径和潜在社会风险,推动基于前瞻性实验主义智能社会治理最佳路径。
正如复杂性科学先驱霍兰德所指出的:“社会系统的本质在于其构成元素间的非线性涌现。” 这一论断揭示了传统还原论方法在应对社会复杂性时的固有局限,也催生了 “生成式社会科学”(Generative Social Science)这一研究范式的迅速崛起,该范式将社会视为复杂自适应系统,从微观层面出发,通过模拟个体的行为和互动来探索复杂社会系统的内在机制,强调通过自底向上的计算实现对社会数字孪生的构建。其中,智能体建模(Agent-Based Modeling)是目前广泛应用的一种方法,它通过构建 Agent 以及多 Agents 之间的交互关系,动态再现社会的运行状态。这种方法已被广泛应用于社会科学、政治学、经济学等领域,帮助研究者更深入地理解人类行为及社会的复杂性。
尽管这一领域取得了重要进展,仍面临一个亟待解决的核心问题:这样的模拟究竟能在多大程度上真实还原现实社会的复杂性?因此,如何在保证模拟规模足够庞大以支持复杂性研究的同时,提升模拟的真实性,使其更贴近现实社会的运行逻辑,仍是亟待突破的重要方向。
近日,清华大学电子系城市科学与计算中心研究团队,联合清华大学智能社会治理研究院、公共管理学院、社会科学学院等跨学科团队深度协作,充分发挥大模型智能体、真实社会环境仿真与大规模模拟加速框架的技术优势,结合智能社会治理的前沿理论与实践探索,成功构建了基于大模型的 “大型社会模拟器 AgentSociety” 1.0 版本,可精确模拟社会舆论传播、认知观点极化、公众政策响应等。AgentSociety 从社会学第一性原理出发,以助力推动社会科学研究范式变革,推动了社会学领域从行为模拟到心智建模、从静态推演到动态共生、从实验室工具到社会基础设施的发展。具体而言,该模拟器包括:
-
大模型驱动的社会人智能体:基于社会学理论,构建具有 “类人心智” 的社会人智能体,赋予其情感、需求、动机与认知能力,并在这些心智驱动下进行复杂社会行为,如移动、就业、消费、社交互动等。
-
真实城市社会环境:精准模拟社会人赖以生存的城市空间,重现交通、基础设施和公共资源,使智能体能在真实环境约束下交互,形成逼真的社会生态。
-
大规模社会模拟引擎:采用异步模拟架构与 Ray 分布式计算框架,结合智能体分组和 MQTT 高并发通信,实现高效、可扩展的智能体交互与社会行为模拟。
-
智能社会科学研究与治理工具箱:全面支持实验、访谈、问卷调查等一系列社会学研究方法,提供多种自动化数据分析工具,从定性研究到定量分析全面助力社会科学研究的深入开展。

-
文章地址:https://arxiv.org/abs/2502.08691
-
官方文档:https://agentsociety.readthedocs.io/en/latest/
-
GitHub 链接:https://github.com/tsinghua-fib-lab/agentsociety/


图 1 AgentSociety 总览(交互案例见:https://agentsociety.fiblab.net/exp/1a4c4fa5-04c1-4973-9433-b8b696f2fda0)
大型社会模拟器通过数字化和虚拟化的方式,使研究者能够在无需进行实际实验的情况下,模拟并观察社会现象的变化过程,显著降低了研究的风险与成本。同时,模拟器能够在不同情境下进行多维度的数据采集和实验设计,克服传统研究因受限于时间、空间和资源等因素所带来的局限。团队提供可视化交互工具和智能社会治理研究工具箱,支持实时监测、主动干预和数据收集,助力社会研究和治理实验。
社会模拟器的应用不仅限于具体的社会实验,它还可以作为社会科学研究的核心方法工具,辅助开展前期研究和假设验证,辅助政策决策者和公共事务参与主体进行智能决策。研究团队可以利用其进行初步的理论构建、实验设计和政策效果评估,为后续的实证研究提供依据。这种工具的灵活性和可扩展性使得研究者能够在不同的社会情境和变量条件下,快速测试理论假设并验证其可行性,为学术研究的精准性和实用性提供有力支持。
为了展示大规模社会模拟器在社会科学研究中的价值,团队开展了一系列典型社会实验,涵盖干预实验、访谈和调查问卷等方法。实验聚焦观点极化、煽动性消息传播与治理、全民基本收入(Universal Basic Income, UBI)政策和飓风冲击下的社会动态,深入探讨个体与群体行为在不同社会机制下的演化规律。基于 AgentSociety 的实验,有效模拟了真实世界中常见的 “回音室效应”、煽动性信息具有更强的传播性和情绪引导力、UBI 政策在个体消费和改善心理健康方面的效果、以及飓风冲击下的人群流动的受限与恢复,研究结果与真实世界高度一致,证明了 AgentSociety 作为低成本实验场地验证政策的有效性。
社会人智能体是 AgentSociety 的核心。团队提出的大模型驱动的社会人智能体,旨在通过结合大模型智能体技术与心理学、经济学和行为科学理论,模拟具有复杂社会行为的智能体,并通过模拟大规模智能体间及智能体与环境的交互,探索社会现象的演变和集体行为。具体而言,团队将社会人智能体设计分为三个层面:心智、心智 – 行为耦合和行为。
图 2 社会人智能体的基本构成,分为心智、心智 – 行为耦合和行为
在心智层面,为每个智能体构建稳定的个体画像(如性格、年龄、性别)和动态的个人状态(如情感、经济状况和社会关系),以确保智能体在不同情境下展现个性化的行为模式。在此基础上,团队引入情感(Emotions)、需求(Needs)和认知(Cognition) 三大核心心理过程,共同决定智能体的决策推理、行为模式和社会适应能力。具体而言,情感反映智能体对外部刺激的即时反应,影响其短期决策和社交互动,例如在正面反馈下增强合作意愿,或在负面情境中表现出回避行为;需求是行为的内在驱动力,基于马斯洛需求层次理论,智能体在满足基本生存需求后,会逐步追求安全、社交、尊重乃至自我实现,从而塑造其长期行为轨迹和社交策略;认知决定了智能体如何理解外部世界,包括对社会事件、政策环境和群体行为的态度,这一过程不仅受其个性和过往经历影响,还会因长期社会互动不断演化。
智能体的行为并非随机或被动响应,而是由其情感、需求和认知共同驱动,并根据个人状态与外部环境的交互不断调整。团队基于马斯洛需求层次理论(Maslow’s Hierarchy of Needs)和计划行为理论(Theory of Planned Behavior, TPB),构建从心理状态到行为执行的完整路径,使智能体的行为更符合人类的动机模式。按照马斯洛需求层次理论,智能体会优先满足生存和安全需求,在此基础上逐步追求社交等更高级目标。与此同时,基于计划行为理论,智能体在形成目标后,会结合自身认知和环境因素主动规划行动,使其行为既具适应性,又能展现长期连贯性。
在行为层面,提出的社会人智能体不仅能够执行简单行为,还能够展现多层次的复杂社会行为,包括移动、社交和经济活动。简单行为主要涵盖睡眠、饮食、娱乐和休息等基础活动,这些行为虽然不涉及复杂的决策,但对智能体的整体状态和长期行为模式至关重要。例如,睡眠不足可能影响情绪和社交意愿,而良好的饮食和娱乐体验则可能提升幸福感,进一步塑造智能体的社交和工作行为。复杂社会行为方面,智能体能够在移动、社交和经济活动中展现高度的自主智能。移动行为不仅涉及简单的地点切换,还包括出行方式选择、路径规划以及对交通环境的动态调整,使智能体的移动模式更符合现实社会的出行习惯。社交行为不仅限于基本互动,还涉及社交关系的建立、维持和演变,智能体会根据自身需求、情感状态和外部环境调整社交策略,从而形成类似人类的社交网络。经济行为方面,智能体不仅理解资源交换的基本概念,还能根据自身经济状况、市场环境和个体偏好进行工作、消费等经济决策,展现出符合社会规则的经济行为模式。
为了验证智能体的自主决策能力及其行为模式的合理性,团队模拟了社会人智能体的一日生活,观察其在移动、社交和经济活动 方面的决策和适应能力(如下表所示)。通过 24 小时的仿真,智能体在需求、情感和认知 的驱动下自主规划日常任务,并动态调整行为,以符合现实社会中的时间节奏和互动逻辑。
为了让智能体的行为更加贴近现实世界,团队构建了一个高度真实、可交互的城市社会环境,支持移动、社交和经济活动等核心行为的模拟。与仅依赖大模型推理不同,团队的环境结合物理约束、社会规则和资源限制,确保智能体的行为符合现实逻辑,避免大模型生成的“幻觉”影响。
1.精准建模现实世界机制:融合物理约束、成本反馈和社会运行规则,让智能体在时间、资源、经济等多维度受到真实限制,使其行为更具合理性和连贯性。
2.数据源自现实,确保行为逻辑一致:环境数据直接来源于真实世界,或基于现实社会原则构建,保证模拟结果具有现实参考价值,避免虚拟环境脱离社会规律。
3.智能体可交互接口,支持真实决策:智能体不仅能够感知环境,还可直接与其交互,实现路径规划、社交关系演变、经济交易等动态决策,确保行为不仅是文本推理的结果,而是真实行动的模拟。
此外,团队将环境划分为城市空间、社交空间和经济空间,共同构建完整、动态的社会系统,为智能体行为的模拟提供精准支撑,使其更符合人类社会的运行模式。
为了验证真实城市社会环境在大规模社会模拟中的适应性和运行效率,团队进行了性能测试,评估其在不同规模的智能体数量和高并发查询场景下的表现。实验模拟了 1,000、10,000、100,000 和 1,000,000 个智能体在城市、社交和经济空间内的交互,并采用典型工作日出行模式,在 8:30 早高峰启动模拟。测试过程中,团队设定查询执行比为 1:999(即每 999 次数据查询后进行 1 次环境状态更新),贴近智能体的真实交互模式,同时控制模拟进程数为 2、4、8、16 和 32。每种实验条件下,团队重复测试五次,每次持续 10 秒,并记录查询速率(QPS) 在 10^2 至 10^5 之间的变化情况。实验结果表明,即使智能体数量和查询速率显著增加,系统仍保持稳定运行,能够高效处理大规模智能体交互,为大规模社会模拟提供实时、可靠的计算支持。
为了实现真实、高效地大规模社会模拟,团队构建了一个高效、可扩展、支持大规模社会人智能体并行执行的社会模拟引擎。该引擎不仅结合了 LLM 驱动的多智能体系统和真实城市社会环境,更在系统架构上进行了深度优化,以确保模拟结果既具备现实合理性,又能大规模、高效运行。
传统多智能体框架(如 CAMEL、AgentScope)通常依赖严格的消息传递机制来组织智能体间的交互,以保证任务的执行顺序。然而,在现实社会中,个体的行为决策并非总是受外部输入直接驱动,而是源自个体记忆、认知状态和环境约束的自主整合。因此,团队的社会模拟引擎采用了更接近现实的异步模拟架构,让每个智能体作为独立的模拟单元,不依赖特定的执行顺序,而是通过消息系统进行信息交换,实现智能体之间的相互影响。
为了提升大规模并行模拟的计算效率,团队基于 Ray 分布式计算框架,结合 Python 的 asyncio 机制进行异步执行,使模拟任务能够高效利用多核计算资源,并支持分布式集群扩展。同时,为了降低智能体间通信的系统开销,团队引入了智能体分组(Agent Group)机制,使多个智能体可以在单个进程中运行,从而减少进程间通信开销,提高计算效率。此外,为了实现大规模社会智能体的高并发、可靠消息传输,团队引入了 MQTT 通信协议,该协议广泛应用于物联网场景,具备高吞吐量和低延迟的特点,非常适用于大规模社会模拟中智能体间的信息交换。
在系统架构上,团队采用模块化设计,包括共享服务层、模拟任务管理层和可选的 GUI 交互层。共享服务层包括 LLM API 接口、MQTT 消息服务器、数据库存储和指标管理系统,确保模拟过程中数据传输高效、智能体行为可记录、结果可视化。模拟任务管理层则基于 Ray 框架,提供高效的智能体管理和任务调度能力,使得不同实验能够独立执行,同时共享计算资源,提升可扩展性和复用性。
大型社会模拟器通过数字化和虚拟化的方式,使研究者能够在无需进行实际实验的情况下,模拟并观察社会现象的变化过程,显著降低了研究的风险和成本。同时模拟器能够在不同情境下进行多维度的数据采集和实验设计,解决传统研究因受限于时间、空间和资源等因素所带来的局限。团队提供可视化交互工具与社会学研究工具箱,支持实时监测、主动干预和数据收集,助力社会实验研究。
-
实时可视化监测:直观展示社交网络、经济活动、移动轨迹 等核心变量,支持实验参数调整,精准跟踪社会演化过程。
-
访谈(Interviews):研究者可实时向智能体提问,获取基于记忆、当前状态和环境的回答,不影响其正常行为。
-
调查问卷(Surveys):支持 批量分发结构化问卷,智能体按预设规则作答,确保数据一致性,便于趋势分析。
-
干预实验(Interventions):提供三种行为干预方式,测试社会情境下的个体与群体响应,包括:1)智能体配置:预设性格、目标和关系,影响初始行为倾向;2)记忆操控:修改情绪和认知,观察对决策与社交互动的影响。3)外部信息干预:发送特定信息(如灾害预警)测试应急响应与传播模式。
社会模拟器的应用不仅限于具体的社会实验,它还可以作为社会科学研究的核心方法工具,辅助开展前期研究和假设验证,辅助政策决策者和公共事务参与主体进行智能决策。研究团队可以利用其进行初步的理论构建、实验设计和政策效果评估,为后续的实证研究提供依据。这种工具的灵活性和可扩展性使得研究者能够在不同的社会情境和变量条件下,快速测试理论假设并验证其可行性,为学术研究的精准性和实用性提供有力保障。
为了评估社会模拟引擎的扩展性和计算效率,团队进行了大规模测试,模拟不同数量的智能体,并测量系统在高并发场景下的表现。在消息通信系统方面,团队测试了 MQTT、Redis Pub/Sub 和 RabbitMQ,比较了它们的并行处理能力、吞吐量(msg/s)和辅助工具支持。实验结果显示,MQTT 和 Redis Pub/Sub 满足高吞吐需求。
在大规模智能体模拟方面,团队在 64 核服务器上运行实验,32 核分配给模拟引擎,32 核用于智能体执行,并测试了 1,000 和 10,000 智能体在不同进程数(8、16、32) 下的运行情况。实验测量了 总执行时间、LLM API 响应时间、模拟器 API 响应时间和令牌消耗,结果表明 Ray 分布式计算框架和智能体分组机制大幅提高了模拟效率,确保系统在 高并发负载下仍能稳定运行。
上表展示了随着智能体数量增加,系统在分布式计算下的可扩展性及性能表现。实验表明,令牌使用模式(包括输入和输出)保持稳定,分布式并行框架能够有效支持大规模智能体的执行,充分利用多核计算能力,成功缓解了 CPU 瓶颈,确保了系统的可扩展性。同时,实验结果也表明,在完全并行的条件下,执行效率主要受限于大模型 API 调用的性能。
为了展示大规模社会模拟器在社会科学研究中的价值,团队开展了一系列典型社会实验,涵盖干预实验、访谈和调查问卷等方法。实验聚焦 观点极化、煽动性消息传播与治理、UBI 政策和飓风冲击下的社会动态,深入探讨个体与群体行为在不同社会机制下的演化规律。
观点极化指社会群体内部的观点逐渐分化,形成难以调和的对立阵营。本实验以枪支管控政策为议题,模拟社会智能体的观点演化过程。实验设计包含对照组和两个干预组:在对照组中,智能体通过相互讨论更新观点,没有外部干预,观点的演化完全依赖于智能体之间的自主社交交互;在同质信息组中,智能体仅接收到与其立场相同的信息,从而模拟信息茧房效应;在对立信息组中,智能体仅接收与其立场相反的信息,旨在测试不同观点的影响。通过这种实验设计,研究人员仅需要书写简单实验配置文件,即可在模拟器中开展该实验:
如上图所示,针对枪支管控这一政治议题,三种实验设置下的观点变化呈现出明显的差异。在对照组中,智能体之间进行自由讨论,没有外部干预,结果显示 39% 的智能体在互动后变得更加极化,而 33% 的智能体则倾向于持更加温和的观点。与此相比,在同质信息组中,观点极化现象更加显著,52% 的智能体的观点变得更加极端。这表明,与志同道合的个体过度互动可能会加剧观点的极化,即真实世界中常见的 “回音室效应”。而在对立信息组中,89% 的智能体的观点变得更加温和,11% 的智能体甚至被说服接受了对立的观点。这表明,接触到不同意见的内容能够有效缓解观点极化,或可成为应对极化现象的一种有效策略。
煽动性消息指包含极端观点或误导性信息的内容,这类信息在社交网络中的快速传播可能加剧群体冲突,影响公共讨论环境。本实验模拟 煽动性信息在社交网络中的传播,并测试不同的内容治理策略对其扩散模式和群体情绪的影响。实验包括对照组和煽动性信息组:在对照组中,智能体仅传播普通信息,团队观察其自然扩散过程及情绪演化。在煽动性信息组,团队引入带有强烈情绪表达的煽动性内容,分析其对信息传播速度和群体情绪的影响。针对煽动性信息传播的治理,团队设计了节点干预和边干预 两种策略,其中节点干预 通过检测并封禁反复传播煽动性内容的账户、以减少信息源头,边干预则在发现煽动性内容传播时切断社交连接,以遏制其扩散。实验还通过与智能体的交互式访谈探究个体在分享煽动性消息时的心理动因。在模拟器中开展该实验的配置如下:
实验结果显示,煽动性消息在社交网络中具有更强的传播潜力和更高的情绪反应。节点干预,即暂停频繁传播煽动性内容的账户,比边干预更有效,能够更好地控制煽动性消息的扩散。情绪强度分析的结果表明,煽动性消息显著放大了网络中的情绪强度,而节点干预在调节情绪反应方面表现尤为突出。进一步,访谈结果揭示,强烈的情绪反应和社会责任感是推动煽动性信息分享的主要驱动因素,用户常因同情或担忧而分享信息,希望引起公众关注或推动社会反应。总体来看,煽动性信息具有更强的传播性和情绪引导力,与真实人类社会中的观测结果高度一致。同时,节点干预在信息控制和情绪调节方面更为有效,为优化社交网络内容管理策略提供了有力支持。
4.3 全民基本收入(Universal Basic Income,UBI)政策推演
UBI 旨在缓解贫困、促进经济稳定和提升社会福祉,尽管其高昂成本和经济影响存在争议,但作为 改善收入分配和增强社会保障的政策工具,已成为研究焦点。本实验通过模拟 UBI 政策的干预效果,探讨其对个体经济行为和宏观经济环境的影响。实验包括对照组和 UBI 干预组。对照组中,智能体在无 UBI 政策的条件下进行经济活动;干预组则模拟实施 UBI,每名智能体每月获得 $1,000 的无条件收入,以观察其消费、储蓄、就业选择等行为变化。实验基于 UBI 试点地区(如美国德克萨斯州)的人口分布数据,并通过对比两组模拟的 经济和社会指标,评估 UBI 对个体和整体经济的影响,分析其是否与现实 UBI 社会实验的结果相符。
实验结果显示,模拟中的经济系统随着时间推移逐渐稳定,实际 GDP 和智能体消费水平的波动逐渐缩小。团队在第 96 步引入了 UBI 政策,并比较了接下来 24 步内的经济和社会指标,具体包括智能体消费水平和抑郁水平(使用 CES-D 量表进行调查问卷评估)。结果表明,UBI 政策显著提高了消费水平并降低了抑郁水平,这与德州 UBI 政策的影响相似,验证了模拟的现实性。此外,通过对智能体的访谈,分析了它们对 UBI 政策的看法。访谈结果显示,UBI 政策的影响与利率、长期福利、储蓄和生活必需品等关键因素密切相关,反映了现实中公众对 UBI 政策的普遍认知。这些结果一方面支持了 UBI 政策在提高消费和改善心理健康方面的效果,另一方面也证明了模拟器作为低成本实验场地验证政策的有效性。
飓风等极端自然灾害对社会结构和个体行为产生深远影响,理解此类事件对人口流动、基础设施和社会稳定的冲击对于优化应急响应和降低灾害风险至关重要。本实验模拟飓风来袭期间的社会动态,分析个体在灾害环境下的行为模式。实验基于 2019 年飓风多里安(Hurricane Dorian) 对美国东南部的影响,选取南卡罗来纳州哥伦比亚市作为案例研究。数据来源包括 SafeGraph 移动数据(记录城市内人群流动模式)和 Census Block Group(CBG)数据(提供人口统计特征),用于构建 1,000 名社会智能体,模拟其在飓风期间的行为变化。
实验结果显示,模拟智能体在飓风事件中的移动模式与真实数据高度一致,活动水平随飓风来临大幅下降,并在灾后逐步恢复,符合实际人群出行趋势。模拟数据与真实人口流动的时间演化相似,验证了模拟器在复现极端天气下人类行为的有效性,为优化灾害应对策略提供支持。
面向未来智能社会治理探索,AgentSociety 将成为人机共生、治理创新、后稀缺经济模式的试验场,测试 AI 议员参与立法对民主决策的影响,模拟 UBI 与机器人税组合政策,甚至在数字环境推演 AI 时代的法律与伦理框架,探讨科技与社会的共存模式。团队所提出的 AgentSociety 是一个基于大语言智能体的大型社会模拟器,正在从 “预测与解释工具” 逐渐进化为 “智能社会治理实验室”。其核心价值不仅在于分析社会现象,更在于构建一个实验平台,用于政策沙盒测试、危机预警和未来社会形态探索,助力社会治理与文明演化。
AgentSociety 同时提供在线使用和离线运行两种智能体部署方式,欢迎智能社会治理同仁和社会科学研究人员关注使用。
目前平台正处于内测阶段(详见 https://agentsociety.readthedocs.io/en/latest/,https://agentsociety.fiblab.net/exp/1a4c4fa5-04c1-4973-9433-b8b696f2fda0)。研发团队诚挚欢迎来自社会科学、大模型、智能体等各个领域的学者尝试平台并提出宝贵建议和意见。平台提供易用的在线实验环境,包括智能体、城市社会环境、社会科学研究工具箱、完善的手册文档与实验案例以及在线指导。后续内部评测后,将提供在线使用模式。
用户可以通过邮箱 agentsociety.fiblab2025@gmail.com 提交研究提案。经过团队审核和讨论后,团队将通过邮件发送内测账号,协助您顺利完成实验。期待与大家共同探索和推动社会科学研究的前沿发展!
用户可以在官方网站 https://agentsociety.readthedocs.io/en/latest/ 下载离线版本,在本地部署后进行智能体的配置和实验,平台提供适用于 Linux、MacOS Arm 等不同类型操作系统的相应版本,方便模拟环境的快速部署和测试。
(文:机器之心)