博弈论公选课论文_博弈论课程论文

2020-02-28 其他范文 下载本文

博弈论公选课论文由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“博弈论课程论文”。

博弈论浅述

什么是博弈论?

标准的说,博弈论又被称为对策论(Games Theory),是研究具有斗争或竞争性 质现象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科。

简单的说,博弈论说的就是博、弈之间道理和奥妙。举一个经典的例子,博弈论中的“智猪博弈”。这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。

如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?

改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。

改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。

改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。

对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。

原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。

从这样一个简单而经典的例子中,我们可以最直观的体验到,博弈论对于人们的社会、经济、生活等方方面面的指导意义。

要了解博弈论,首先就要了解博弈论中最基本的几个名词的含义。

(1)决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。

(2)对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。

(3)局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。

(4)策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

(5)得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

(6)次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。

(7)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。

那么究竟什么是纳什均衡呢?

在博弈G=﹛S1,„,Sn:u1,„,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,„,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,„s*i-1,sij*,s*i+1,„,sn*)的最佳对策,也即ui(s1*,„s*i-1,si*,s*i+1,„,sn*)≥ui(s1*,„s*i-1,sij*,s*i+1,„,sn*)对任意sij∈Si都成立,则称(s1*,„,sn*)为G的一个纳什均衡。

但要注意的是,纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态。

以下的囚徒困境就是一个例子。

在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。

囚徒困境博弈 [Prisoner's dilemma] A╲B 坦白 坦白-8,-8

抵赖 0,-10 抵赖-10,0-1,-1 对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。

博弈论,并不只是单纯的最优化或者是分析利益最大化。它考虑到得了人的心理,更符合实际,更贴近事实。给我们打开了另一种用来分析和解决我们生活中实际问题的大门。

世界是有经纬线的棋盘,每一次选择,每一个行为从某种程度上都是一场博弈,只有善于博弈,乐于博弈,才能乐在其中,其乐无穷。

博弈论公选课论文2

与天斗,其乐无穷,与地斗,其乐无穷,与人斗,其乐无穷。博弈论,即博、弈之论。博弈无时不在无处不在日常生活中的一切均可从博弈得到解释大到美日贸易战小到今天早上你突然......

公选课论文

NO.150 积极心理学与幸福人生的心得体会姓名:王旭 班级:自动化151电话:*** 不知不觉,积极心理学的课程已经快要结束了。犹记得,金老师第一次上课时这样对我们解释她的名......

公选课企业文化论文

工程管理1001顾静飞u201017072 中外企业文化价值观对比分析摘要:企业文化的核心是价值观。价值观是一个企业的基本概念和信仰,它为企业员工规定出成功的标准和方向。许多著名......

公选课企业文化论文

工程管理1001顾静飞u201017072中外企业文化价值观对比分析摘要:企业文化的核心是价值观。价值观是一个企业的基本概念和信仰,它为企业员工规定出成功的标准和方向。许多著名的......

公选课知识产权法论文

论我国的知识产权保护知识产权主要指个人及其组织在脑力劳动方面创造并完成的智力成果而依法享有的专有权利。它具有无形性、双重性、确认性和独占性的特点。根据我国知识产......

《博弈论公选课论文.docx》
将本文的Word文档下载,方便收藏和打印
推荐度:
博弈论公选课论文
点击下载文档
相关专题 博弈论课程论文 论文 公选 博弈论 博弈论课程论文 论文 公选 博弈论
[其他范文]相关推荐
[其他范文]热门文章
下载全文