效率与公平视角下惩罚规则对群体性合作的MPA影响分析

论文价格:0元/篇 论文用途:仅供参考 编辑:论文网 点击次数:0
论文字数:**** 论文编号:lw202317350 日期:2023-07-16 来源:论文网
本文是一篇MPA论文,本文从制度选择视角入手,认为影响制度选择的因素主要有管理者主观偏好(公平偏好,效率偏好和庇护偏好)和客观约束条件(惩罚资源和信息)两个方面,从公平和效率两大原则,研究三种惩罚规则在不同约束条件下的优先性和共生性。研究采用数学建模和计算机仿真方法,建立包含一个惩罚机构和多个主体的社会惩罚系统,探究不同规则下的社会合作水平和惩罚机构的资源积累量。

1 绪论

1.1 研究背景与意义
1.1.1 群体性合作
自人类社会产生开始,合作问题就一直是影响人类发展的重大问题。原始人类合伙捕猎以解决生存问题 [1–3],现代国际社会中国家之间通过贸易合作、生产合作以及科技领域的合作谋求更大的发展。21世纪以后,随着互联网和去中心化的发展,国际合作和区域合作越发明显。2015 年3 月中国政府提出“一带一路”发展计划,实现政策沟通、道路联通、贸易畅通、货币流通、民心相通的利益共同体、命运共同体和责任共同体。2017 年10 月18日,习近平同志在十九大报告中指出,中国要秉持共商、共建、共享的全球治理观。随着社会发展,社会分工越发精细,需要人们在工作领域协调互助、资源共享、合作解决问题。此外,社会成员的彼此合作是构建和谐社会的基础,否则社会无法正常运转。合作在人类社会以及人类文明的建立和发展过程中承担着不可替代的作用 [4]。
尽管合作在当今社会如此重要,但是合作关系的形成并非一蹴而就,并且合作关系的维持也是困难重重。根据亚当斯密提出的经济学和社会科学的“第一定律”,当个体只谋求自身利益时,理性的集体结果会自动出现 [5]。这一理论被称为“看不见的手”。但事实上,在个人利益与集体利益之间并不必然存在和谐的关系,往往存在冲突。例如,国际合作在全球气候治理中存在的问题,本质上就是各国利益和人类社会共同利益之间的冲突问题。所有的国家为尽可能地发展自身经济利益,滥用气候资源,无限制地排放温室气体,从而导致最终全球气候恶化的悲剧。为了达到保护公共气候这一共同目标,各国需要制定一致同意的合作协议以降低空气污染。但是,首先协议是很难达成的,这么多年的联合国气候大会都没有形成一致同意的方案。其次,合作协议是脆弱的,因为任何一个国家如果私自破坏协议将获得更大利益。这里所提到的合作尽管他们的表现形式有所差异,但其行为具有一个共同特点:即合作者为了公共利益付出一定的成本,不合作者在此过程中往往不用付出任何代价却可以共享合作带来的收益。
.........................

1.2 研究视角:制度选择
在博弈论视角下,经济学家将制度分别看作是博弈的参与人、博弈规则和博弈过程中参与人的均衡策略三种制度观。尼尔逊将制度看作是博弈的特定参与人。诺斯和赫尔维茨认为制度是一种博弈规则,是人所创造的用以约束人们交互的行为框架,并将其分为正式制度(宪法,法律制度和契约)和非正式制度(规范和习俗)赫尔维茨更是将博弈规则具体表述为:在任何环境下参与人能够选择的行动以及参与人决策的每一个组合所对应的物质结果,并将其称之为机制(mechanism)或博弈形式(game form)。他所关注的是如何设计一项制度,该制度既能实现给定社会目标(效率,公平)又能在一系列环境(偏好,资源禀赋)下与参与人激励相容。肖特、格雷夫等学者则认为制度是一种均衡,主要是基于不同的博弈均衡概念–演化博弈论(evolutionary game approach)和重复博弈论两方面展开(repeated game approach)。
青木昌彦 [55] 的制度观是被人普遍接受的,他认为“制度是关于博弈重复进行的主要方式的共有信念的自我维系系统”。他用“共有信念”将正式规则和非正式规则统一起来,制度不仅是法律条文,只要是人们共同信念都是制度,比如贿赂。他将制度分析建立在以有限理性为基础的演化博弈理论上。“自我维系系统”说明制度不是静止一成不变的,而是动态演化的。人们虽然不具备完全理性假设下的全部知识,但是人类是智能体,会通过学习、模仿、适应和惰性等自身所能接触到的最优的策略,从而使得制度一直处于动态演化之中,直到到达稳态,形成进化稳定策略(Evolution stablestrategy,ESS),成为一种新制度。青木昌彦的制度观认为,制度是内生的,是个体默契理解的结果,每个参与者都试图实现自己的最佳结果。
不同国家有不同的惩罚制度,同一国家的不同地区的惩罚制度也不尽相同,那么惩罚作为社会执法的典型代表,究竟如何选择和如何实施?我们认为,惩罚制度选择的多样性在于两方面的因素,一方面是客观约束,包括惩罚者掌握潜在被惩罚个体的信息量以及惩罚资源的有限性。另一方面是惩罚设计者或执行者的主观偏好,即主观因素。惩罚者会综合考虑主客观两方面因素选择惩罚制度。
..........................

2 公平与效率:惩罚机制设计中的价值选择

2.1 公平惩罚
公平原则是制度选择的主要原则之一。公平的制度设计在群体性合作中具有重要作用。最后通牒博弈是研究人类公平性最常用的研究框架,提议者提出一种资源分配方案,如果响应者接受,则按照这种方案进行资源分配,否则方案无效,提议者和响应者都无法获得任何资源。普遍观点认为个体出于公平偏好而拒绝不公平的分配提议。Santos et al [56] 将最后通牒博弈中两人博弈扩展到自动学习的多人博弈,发现严格的组内标准会使提倡者更加倾向公平,在同步更新或是异步更新,不同初始状态,不同收益分配模式下,该结果具有鲁棒性。Branas-Garza et al [57] 在独裁者博弈(dictatorgame) 中探讨了最后通牒博弈中惩罚者的本质,发现两种完全不同的惩罚者可以共存,一种是亲社会惩罚者,另一种是反社会惩罚者,显然这类惩罚者是完全不公平的。反社会惩罚者的存在对于社会合作以及社会系统的稳定性具有潜在危险。Szolnoki etal [58] 引入纯策略的空间最后通牒博弈后,出现循环优势现象,高度网状相图中的连续和不连续相变反映出人类在追求公平过程中存在复杂性。Iranzo et al [59] 在最后通牒博弈中引入空间结构,发现利他行为是一种普遍现象,自发出现了提议者的提议非常接近接受者的阈值这种特征。Sinatra et al [60] 通过分析复杂网络中的最后通牒博弈研究社会系统中合作行为的出现,在自然选择规则下使用复制动力学算法,在社会惩罚机制中使用Bak-Sneppen 动力学算法发现利他行为以自组织方式局部出现。在社会惩罚机制下,涌现大量慷慨的个体,其原因既不是由于名声也不是昂贵的惩罚,而是纯粹的无标度网络效应结合利他主义的实施。事实上,惩罚本身反映了对公平的追求。 ′Ubeda&Du′e?nezGuzm′an [61]利用囚徒困境模式研究了腐败的惩罚者以及惩罚者与非惩罚者之间具有权力不对称时的合作演化情况,发现腐败可以增加人群的平均收益,昂贵的惩罚有益于整个社会群体。
.........................

2.2 效率惩罚
成本(资源)约束是效率惩罚的前提。在公共品博弈中,惩罚效率主要表现在对群体性合作水平的促进程度。关于惩罚效率的研究主要存在两个方面,惩罚机制本身是否是有效的?如果有效,哪种惩罚机制是更有效的?其背后机理是什么?
Ostrom等人 [76]提出的“多中心自组织治理理论”认为通过政府、社群、市场等多层级多中心的组织形态和多样化的制度安排之间的合作与协同来化解外部性,进而实现公共池塘资源的长效治理。自主治理理论的中心问题是一群相互依赖的委托人如何才能把自己组织起来,进行自主治理,从而能够在所有参与者都面对搭便车、规避责任以及其他机会主义行为诱惑的情况下,取得稳定的共同收益。它产生于深刻的理论分析和广泛的实证分析中,目的是要解决公共物品尤其是公共池塘资源的治理中的搭便车困境。
Herrmann et al. [77] 从跨文化角度进行研究,揭示在不同地区中惩罚机制有可能形成报复和反社会惩罚。他们在全球十六个地区进行了人类惩罚和合作行为的差异性研究。结果显示: 惩罚行为在不同地区具有明显的差异,比如在成都、波士顿、诺丁汉、默尔本、圣加伦及的惩罚主要是针对低水平的公共投资行为和个体搭便车者; 而在雅典、利雅得以及马斯喀特等地区,相当大比例的惩罚支出被用于反社会的惩罚行为。在利雅得、雅典和伊斯坦布尔等地区,反社会惩罚行为甚至抵消惩罚机制所带来的合作效益。认为一个国家公民薄弱的合作规范意识和低下的法治水平是反社会惩罚的重要影响因素,只有在强有力的合作规范下,惩罚才有利于社会。

Nikiforakis [78] 从情感角度研究了惩罚效率。他认为人类天生具有害怕报复和反报复的心理,而Fehr [26]的实验设置削弱了个体的报复性惩罚机会。因此,他在公共品博弈和惩罚博弈两阶段实验基础上,引入了第三个阶段:允许个体在前两阶段博弈之后,再一次做出惩罚决策,并将其称做“反惩罚阶段”。研究结果揭示: 在只包含前两个博弈阶段的实验中,无论是在陌生人群体中还是在熟人群体中,均可形成稳定的合作,而且平均供给水平超过50% ; 但是,在包含全部三个博弈阶段的实验中,自愿供给水平跟平均公共供给水平均低于50% ,并且出现了逐步降低的现象,反映了合作的脆弱性。当存在反惩罚机会时,个体的惩罚意愿会下降,将近25%是出于报复的目的。

............................

3 惩罚效率与惩罚公平的合作演化模型. . . . . . . . . . . . . . . . . . 16
3.1 实验模型设计 . . . . . . . . . . . . . . . . . . 16
3.1.1 个体策略选择 . . . . . . . . . . . . . . . . . . . . 16
3.1.2 惩罚机构规则选择 . . . . . . . . . . . . . . . . . . 18
4 三种惩罚规则对群体性合作的影响分析 . . . . . . . . . . . . . . . . . . . . . 29
4.1 完全惩罚情景下惩罚规则对合作演化的影响 . . . . . . . .. . . . . . . 29
4.1.1 捐赠和惩罚程度变量组合对合作的影响 . . . . . . . . . . . . . . . 29
4.1.2 惩罚成本和惩罚程度变量组合对合作的影响 . . . . . . . . . . . . 32
5 结论与展望 . . . . . . . . . . . . . . .. . . . 48
5.1 主要研究结论 . . . . . . . . . .. . . . . . 48
5.2 公共管理启示 . . . . . . . . . . . . . . . . . . . . 49
5.3 未来研究展望 . . . . . . . . . . . . . . . . . 50

4 三种惩罚规则对群体性合作的影响分析

4.1 完全惩罚情景下惩罚规则对合作演化的影响
在人群中所有背叛者都会被惩罚的情况下,惩罚机制作为一种执法手段,在个体视角看来,无论在何种规则下,背叛者都会被惩罚,不存在公平性问题;从惩罚机构视角下,由于惩罚规则的不同可能会导致惩罚资源的可持续性不同,从而影响整个群体的合作水平。这部分研究的变量有:惩罚性合作者的捐赠α,背叛者的惩罚程度/罚款额β,惩罚机构的个体惩罚成本基数(获取信息难易程度)γ;参数有:惩罚率f = 1 表示全部惩罚,合作回报系数 r 表示低合作程度的社会 (r = 2.0,3.5) 和高合作程度的社会(r = 3.8, 4.0)。
4.1.1 捐赠和惩罚程度变量组合对合作的影响
惩罚捐赠影响惩罚机构的初始资金积累,直接决定惩罚能否实施;而惩罚程度代表制度对违反者的宽容程度。就惩罚机构功能维系而言,这两个变量都是惩罚资源的来源,与资源积累呈正相关关系。
首先,我们对比探讨了三种惩罚规则在惩罚捐赠 α 和弱惩罚程度 β 变化的条件下对合作演化的影响,假定惩罚成本基数为参数,取值γ = 0.5。首先分析对合作水平的促进程度,结果如图 4.1 所示。从上到下表示三种惩罚规则,分别是:无偏好,成本偏好和情感偏好;从左到右表示合作回报系数,分别是低合作程度( r = 2.0,3.5) 和高合作程度( r = 3.8,4.0);从蓝色到红色表示合作水平从0 到1,即人群从全背叛到全合作。我们发现,三种不同的惩罚规则并无显著差别,除了当 r = 3.5 时。此时,合作区域有微小差别,成本偏好规则大于无偏好规则,最后是情感偏好规则。总体来看,只要惩罚捐赠α > 0, 便对合作水平无影响,影响合作水平的关键在于惩罚程度(或罚款程度)。合作的形成对惩罚程度有严格的界限要求,当 r ≥ 3.5 时,需满足 β ≥ 3;当 r = 2.0 时,需满足β ≥ 4,这表明惩罚太过宽容无法促进群体合作。有趣的是,在 r = 2.0, β = 2.5 条件下,三种规则下均出现了合作现象,合作率为0.44。对于该现象我们将在微观机理分析中详细讨论。


..........................

5 结论与展望

5.1 主要研究结论
本研究基于公共品博弈模型,建立了一个包含单个惩罚机构和多个主体的社会仿真系统。在公平和效率两大原则下,研究不同的惩罚规则在促进群体性合作的过程中的优先性。从制度选择视角出发,影响惩罚制度选择的主要因素有两方面:惩罚者的主观偏好和客观约束条件。客观约束主要有惩罚者所拥有的惩罚资源和惩罚者所掌握的主体信息情况。主观偏好设置了成本偏好、情感偏好和无偏好三种。不同的制度选择反映的是公平和效率两大价值观的选择。通过仿真模拟得出结论:

在全部惩罚情景下,三种惩罚规则的差异取决于惩罚资源是否具有可持续性。在效率视角下,所有背叛者均被惩罚,无论其位于什么位置。此时,成本偏好规则意味着惩罚机构先花费较低成本惩罚那些掌握信息较多的背叛者,后花费较高成本惩罚那些掌握信息较少的背叛者;情感偏好规则则与其相反。如果惩罚资源是可持续的,无论规则怎样,消耗资源总量是相等的,也就是说,此时三种不同规则并无差异,该区域为(γ = 0.5;α > 0;β > 3.5(r = 2.0)或者β > 3(r ≥ 3.5));然而,如果惩罚机构拥有的惩罚资源有限,那么成本偏好规则会在已有资源下,比情感偏好规则惩罚更多的背叛者,罚款便会带来资源收入,惩罚资源可能出现可持续的情况;而情感偏好规则是一种浪费资源的方式,在有限的资源下,惩罚最少的背叛者,惩罚资源可持续的可能性最小;无偏好的惩罚方式是随机选择背叛者进行惩罚,因此,在有限资源条件下,比成本偏好劣势,而比情感偏好具有优势。该资源有限区域位于(r = 3.5,β = 2.5,γ = 0.5, f = 1,α ∈ [0.4,1])。

在部分惩罚情景下,三种惩罚规则的差异十分显著。无论是促进合作水平,还是促进资源积累,无偏好规则占据显著性优势,其次是成本偏好规则,最后是情感偏好规则。不过,在某些条件下,成本偏好规则比无偏好规则具有优势,无论是合作水平还是资源积累量,该区域是低惩罚率、低合作回报系数、低惩罚成本和宽容的惩罚区域,即(r = 2.0,β = 5,α = 0.5, f < 0.5,γ ≤ 0.3)。这表示在社会合作程度较低,信息通畅的社会,如果实行低惩罚率且宽容的惩罚,选择成本偏好规则比选择无偏好规则更有效。

参考文献(略)

如果您有论文相关需求,可以通过下面的方式联系我们
客服微信:371975100
QQ 909091757 微信 371975100