Investigating and Extending Homans’ Social Exchange Theory with Large Language Model based Agents

Investigating and Extending Homans’ Social Exchange Theory with Large Language Model based Agents

论文概览

本文假设大型语言模型(LLM)代理可模拟人类社会交换行为以验证并扩展霍曼斯的社会交换理论(SET),通过构建包含类人代理框架的多代理虚拟社会并开展多轮资源交换实验,验证了SET的六个核心命题,提出并验证了三个扩展推论,最终确立了一种连接社会科学与计算机科学的跨学科研究范式。

核心问题

传统社会科学研究霍曼斯SET的方法存在局限:真人实验难以控制变量、成本高且可重复性差,传统基于规则的多代理建模(ABM)无法捕捉人类复杂的认知过程与情感反应,因此需开发一种既能还原真实人类社会交换行为,又能灵活调控实验条件的新方法,以全面验证并扩展SET。

主要贡献

  1. 开创了利用LLM代理研究霍曼斯SET的跨学科方向,搭建了社会科学与计算机科学的研究桥梁。
  2. 设计了包含信念-欲望-意图(BDI)、亲和度、认知风格(REI)、社会价值取向(SVO)等模块的类人代理框架,以及多轮谈判-交换机制的多代理社会。
  3. 通过系统性实验验证了SET的六个核心命题在LLM代理社会中完全成立,证明该代理环境是研究SET的有效工具。
  4. 扩展了传统SET,提出三个新推论(稳定性推论、互惠推论、韧性推论),并通过代理实验与真人实验验证了推论的有效性。

研究方法

  1. 代理框架设计:单个代理包含BDI模块(模拟决策逻辑)、亲和度模块(动态追踪互动情感评分)、REI模块(量化理性/经验型认知风格)、SVO模块(区分利己型/亲社会型取向)及记忆模块(记录完整互动历史)。
  2. 多代理社会设置:初始配置3个代理(M = 3)和3种资源(N = 3),资源价值规则为:单资源单位价值r1 = 1,两种资源组合价值r2 = 4,三种资源组合价值r3 = 9;每个代理初始拥有5单位每种资源,每轮获得15单位专属资源(S = 15),社会以“谈判-交换”两阶段轮次运行。
  3. 实验设计:以Claude-3.5-sonnet为基础LLM,每个实验重复5次取平均值,核心实验为10轮代理交换,后续扩展至20轮以研究系统韧性,并通过真人-代理互动实验验证推论。

各章节详解

1. 引言(Introduction)

介绍了SET的核心地位(社会科学解释人类互动的基础框架,跨社会学、心理学、经济学等领域),分析了传统研究方法的缺陷,提出利用LLM代理模拟人类行为的创新思路,明确了论文的研究目标与四大核心贡献。

2. 预备知识(Preliminary)

详细阐述霍曼斯SET的六个核心命题: 1. 成功命题:获得奖励的行为更可能重复(如成功交换后倾向于再次合作)。 2. 刺激命题:与过去奖励相关的相似刺激会触发相似行为(如需求特定资源时优先选择过往合作对象)。 3. 价值命题:结果价值越高,行为发生概率越大(如倾向于组合资源以获取更高价值)。 4. 剥夺-满足命题:频繁获得的奖励价值会递减(如资源过剩后优先获取稀缺资源)。 5. 攻击-赞同命题:意外惩罚引发攻击行为,意外奖励或避免惩罚引发赞同行为(如交换违约会引发负面反应)。 6. 理性命题:个体基于过往经验和成功概率选择期望价值最高的行为(如权衡收益与合作可靠性选择伙伴)。

3. 构建的代理社会(The Constructed Agent Society)

3.1 单代理框架(Single Agent Framework)

核心模块协同运作:BDI模块定义决策目标与计划,亲和度模块根据交换公平性动态调整(合作则提升,违约则下降),REI模块通过1-5分量化认知风格,SVO模块通过提示词模板区分利己型(优先个人收益)与亲社会型(优先互惠)代理,记忆模块为所有决策提供历史依据。

3.2 多代理社会(Multi-Agent Society)

社会以轮次推进,每轮包含两个阶段: 1. 谈判阶段:代理最多进行3轮讨论,可提出交换提议、回应提议或放弃,阶段结束条件为完成3轮讨论或所有代理放弃。 2. 交换阶段:代理独立决定资源分配,可遵守或违背谈判承诺,交换后所有行为与结果公开,代理更新BDI与亲和度模块。实验共运行10轮,记录代理行为与资源动态。

4. 霍曼斯SET的验证(Validation of Homans’ SET)

实验发现代理社会呈现三阶段行为模式:初始探索期(小规模交换试探可靠性)、合作繁荣期(基于信任开展大规模高价值交换)、策略终局期(受终局效应影响,优先个人收益,违约增加),并基于此验证了六个命题: - 成功/价值命题:合作繁荣期交换价值较初始期提升56.5%(中位数从3.83升至6.00),终局期仍维持高价值(6.50)。 - 剥夺-满足命题:资源稀缺时提议接受率达70%,资源充裕时降至23%,符合边际效用递减规律。 - 攻击-赞同命题:轻微违约(0-5)导致未来交换减少33.3%,中度违约(5-10)减少65.1%,严重违约(10-15)减少97%,反应与违约程度正相关。 - 理性/刺激命题:代理基于信任水平与资源需求调整策略,相似场景下表现出稳定的互动模式,符合理性决策与刺激触发逻辑。

5. 霍曼斯SET的扩展(Extensions of Homans’ SET)

通过调整代理设置开展实验,提出并验证三个推论: #### 5.1 认知风格的影响(Cognitive Style) - 实验设计:对比纯理性与纯经验型代理的行为差异。 - 结果:理性代理的交换价值与亲和度波动更大,经验型代理更稳定;理性代理可能获得高收益但风险高,经验型代理收益中等但稳定。 - 推论1(稳定性推论):理性个体易获高收益但面临高损失风险,经验型个体收益更稳定但水平中等。

5.2 社会价值取向的影响(Social Value Orientations)

  • 实验设计:对比利己型(Proself)与亲社会型(Prosocial)代理的行为差异。
  • 结果:利己型代理违约率高(多为少交付资源),收益波动大(μ = 300.3σ = 108.8);亲社会型代理履约率高,收益更高且稳定(μ = 343.0σ = 84.1)。
  • 推论2(互惠推论):基于互利原则的交换行为能实现更稳定高效的资源分配,亲社会取向构建的交换网络更具韧性。

5.3 社会系统韧性(Social System Resilience)

  • 实验设计:将模拟扩展至20轮,第10轮引入信任违约(代理拒绝履行承诺)。
  • 结果:违约后代理交换活动暂时减少,但基于资源相互依赖需求,通过适应性策略逐渐恢复稳定交换。
  • 推论3(韧性推论):成熟的社会交换系统会通过成员的适应性行为维持稳定性,核心驱动力是个体间的资源依赖。

5.4 真人实验验证(Real-World Experiments)

招募3名人类参与者与2个LLM代理互动,第10轮代理触发信任违约,结果显示人类与代理的交换恢复模式高度一致,验证了韧性推论的有效性。

6. 相关工作(Related Work)

  • SET相关研究:传统研究多依赖真人实验或简单ABM,近年虽有研究融入情感维度或二维模型,但未解决行为模拟的真实性问题。
  • LLM驱动的代理建模:现有研究已应用于模拟日常生活、宏观经济、竞争行为等,但尚未系统用于SET的验证与扩展,本文填补了这一空白。

7. 结论(Conclusion)

总结LLM代理能有效模拟人类社会交换行为,成功验证并扩展了霍曼斯SET,确立了跨学科研究范式;同时指出研究局限(实验环境简化、LLM成本限制、未考虑文化因素等),并提出未来方向(复杂交换场景设计、大规模实验、文化因素纳入)。

8. 局限性(Limitations)

实验环境简化(结构化谈判与基础资源类型)、LLM API成本限制了实验规模与轮次、对代理内部决策过程的分析不够深入、未考虑文化因素对交换动态的影响。

9. 附录(Appendices)

详细介绍了真人实验规则(初始资源分配、每轮资源注入、计分方式、亲和度定义、补偿公式$Compensation = 10 + \frac{V}{6}$)、实验技术细节(基于AgentScope框架,Claude-3.5-sonnet参数设置)及LLM代理的提示词模板(BDI更新、交易决策、亲和度更新等)。