双人多策略博弈中的单边控制方法研究

 2022-01-22 11:01

论文总字数:24798字

摘 要

Press和Dyson提出的ZD策略为博弈论中合作问题提供了新的思路。通过采用此类特殊的策略,博弈者可以单方面地对博弈的预期收益进行干涉和控制,也就是说,ZD策略是一种单边控制方法。这个独特的想法引起了诸多学者的兴趣,ZD策略也逐渐被拓展。但是,之前的文献大多都着眼于全连通网络下的ZD策略的性质的研究,对复杂网络中的ZD策略的研究还不够全面。因此,本文将系统地对复杂网络中的ZD策略的演化性质进行分析。

本文主要探究双人博弈中的含有ZD策略的多策略演化结果,即探究ZD策略与多种其他策略共存的情况下的个体演化结果。在对ZD策略进行推导的基础上,我们将从演化博弈论的角度,利用演化稳定策略与模仿者动态的方法,从随机正则图入手,推导出ZD策略的演化性质,并进一步对更复杂的网络结构进行研究。此外,我们将在复杂网络上进行模拟仿真实验,从而对ZD策略的演化性质有更直观的认识。由仿真结果可以看出,慷慨ZD策略能单方面且高效地促进网络中个体的合作。最后,我们还将对多人多策略博弈中的ZD策略进行简要的分析。

关键词:ZD策略,单边控制方法,双人多策略博弈,演化博弈论

Analysis of Unilateral Control Methods in Two-Person and Multi-Strategy Games

Abstract

ZD strategy proposed by Press and Dyson has provided a new idea for cooperation in game theory. Adopting the special strategies, players may unilaterally enforce a fixed linear relationship in two-person games, which means that ZD strategy is a unilateral control method. This dramatic idea has expanded our understanding and many works have been done based on the strategy. However, the previous works mainly focus on the evolution of ZD strategy in well-mixed network and the analysis in complex network is not comprehensive. Thus, we will analyze the evolution of ZD strategy in complex network systematically.

In this paper, we mainly focus on two-person and multi-strategy games where ZD strategy competes with other strategies. Firstly, we induce ZD strategy by Akin’s Lemma. Then we analyze the evolution of ZD strategy from a perspective of evolutionary game theory with methods of evolutionarily stable strategy and replicator dynamics. We follow the order from random regular graphs to complex graphs. Through experimental simulations and analysis, we have a more direct and thorough understanding of ZD strategy,which shows that generous ZD strategy promotes cooperation unilaterally and effectively. Finally we give the brief analysis of ZD strategy in multi-person and multi-strategy games.

Keywords: ZD strategy, unilateral control method, two-person and multi-strategy games, evolutionary game theory

目 录

摘要 I

Abstract II

第一章 引言 1

1.1演化博弈论 1

1.2合作问题与ZD策略 1

1.3论文结构与创新点 2

第二章 IPD中的ZD策略 3

2.1 ZD策略的推导 3

2.1.1囚徒困境与单边控制方法 3

2.1.2 Akin引理 3

2.1.3 ZD策略 4

2.2 ZD策略的例子 5

2.2.1敲诈ZD策略 5

2.2.2慷慨ZD策略 6

2.2.3公平ZD策略与均衡ZD策略 7

第三章 双人ZD策略的演化分析 8

3.1演化稳定策略 8

3.2动态演化模型 9

3.2.1网络模型 10

3.2.2网络中的演化规则 11

3.3基于配对近似法的理论分析 12

3.3.1 DB规则 12

3.3.2 BD规则 15

3.3.3 IM规则 15

3.3.4复杂网络中的情形 16

3.4 基于强化学习方法的认识 16

3.5 数值模拟 18

3.5.1 随机正则图上的模拟 18

3.5.2 复杂网络上的模拟 22

第四章 多人ZD策略 25

4.1 多人博弈 25

4.2 多人ZD策略 25

4.3 多人博弈的演化 26

第五章 总结 28

致 谢 28

参考文献(References) 29

第一章 引言

1.1演化博弈论

自冯·诺依曼的著作[1]起,系统的博弈理论研究已经有七十余年的发展。博弈论着眼于游戏中个体的心理预期与实际行为,并在此基础上研究相应的优化策略。传统的博弈理论常常隐含着完全理性与完全信息的假定[2],而在现实生活中,个体之间的差异与具体博弈问题本身的复杂性使得这两点往往难以达成。囚徒困境就是一个很好的例子,纯粹理性的选择是背叛,但是现实中有很多人选择合作,这是传统的博弈理论难以解释的。

不同于传统的博弈理论,John Maynard Smith于1982年出版的著作《Evolution and the Theory of Games》系统地描述了演化博弈论的理论[3],这一理论并不要求参与者是完全理性或者信息完全的个体。演化博弈论最早源于遗传生态学的研究。研究发现,在多数情况下,动植物的演化都可以在不依赖于任何理性假设的前提下进行解释[4]。针对这一现象,John Maynard Smith和George Robert Price在1973年合作发表的论文[5]中提出了演化稳定策略(Evolutionarily Stable Strategy,ESS)的概念,标志着演化博弈理论的正式诞生。随后模仿者动态(Replicator Dynamic)概念的提出[6]又是演化博弈理论的一次突破性发展。这两个概念分别描述了演化博弈系统的稳定状态和动态收敛过程,在这两个概念的基础上,演化博弈论有了很大的进展。

1.2合作问题与ZD策略

一直以来,合作问题都是博弈论的主要课题之一。在各种经典博弈问题与收益机制研究中,已经有许多文献对其中的合作的形成与维持进行了理论分析与模拟[2]。一般而言,合作行为是收益驱动的,由于立场不同,要达成共同合作并不容易。因此,在以往的研究中,基于常识的判断,人们常常忽视了合作问题中单边控制的可能性。

然而,在2012年,Press和Dyson的一篇关于重复囚徒困境(Iterated Prisoner’s Dilemma,IPD)中的ZD(Zero-Determinant)策略的论文表明,在IPD中,博弈者可以单方面地对双方的收益关系进行约束,利用一个收益的线性关系来实现单边控制[7]。这是一个相当大的突破,它向给我们提供了一个全新的思路,并且推动了对单边控制方法的研究。

剩余内容已隐藏,请支付后下载全文,论文总字数:24798字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;