#纳什均衡# 什么是纳什均衡?
因为美丽心灵这部电影,弄得好多人没有真的懂纳什均衡是在说啥……
电影里的大意是这样:四个朋友在酒吧里看上了一个美女,都想去搭讪,纳什说,如果我们按照亚当斯密的观点,每人都只为自己着想,一上来就都去找她,就会互相干扰,最后谁也得不到。但是大家(按照纳什的观点)既考虑自己的利益,又考虑整体的利益,分别各自去找她的同伴,结果就是大家都获益。
但是,这特么根本不是纳什均衡呀……
定义:在非合作类博弈中,如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处。
(纳什证明了,如果允许混合策略,那么任何一个博弈,只要参与者数量是有限的、参与者可以选择的纯策略也是有限的,那么这个博弈至少有一个纳什均衡。)
(另外,别把纳什均衡和囚徒困境混了。纳什均衡是个广泛得多的概念。)
例子:打猎。
两个猎人出发去打猎。假设一头鹿有400公斤肉,但必须两人合作才能打到,一个人打什么都获得不了。同地区有一群兔子,一共有200公斤肉,两人合作可以全部打完,但一个人打也可以获得100公斤肉。两个猎人各自都知道对方的平衡策略,但不能通过任何方式影响对方的决策。最终的结果会怎样?
那么,
A 鹿B 鹿: 200,200
A 鹿B 兔: 0,100
A 兔B 鹿: 100,0
A 兔B 兔: 100,100
这里面有两个纳什均衡。
(1)两人都猎鹿:任何一人单方切换成猎兔子,都会让自己的收益从200跌到100。
(2)两人都猎兔子:任何一人单方切换成猎鹿,都会让自己的收益从100跌到0。
注意,这里面都是单方更改。要是双方同时从兔子换成鹿,都会更好——但纳什均衡不考虑这个。
这也造成了一个问题:纳什均衡从全局看起来不见得是“理性”的,不是看起来的最优解,但是对每个人来说,它的确是在别人不可控时自己的最优解。
好了,我们回到开始的酒吧场景。
从纳什均衡的角度来看,电影里的“纳什”一开始的出发点就是错的呀。谁在乎什么全局最优、谁在乎什么亚当斯密的公众福利!纳什均衡理论根本就没有考虑这些。那归别的模型管。纳什均衡是每个人自己的最优解。酒桌上扯的那堆东西,和纳什均衡毫无关联。
那么,这个策略是纳什均衡吗?根本不均衡呀。
我们先假设有两个朋友,每人有两种策略:(1)找那个美女,(2)找她的同伴。每人自己会挑一个互不冲突的同伴。假设找美女的“得分”是5,找同伴的得分是3,冲突的得分是0。
A 1 B 1: 0,0
A 1 B 2: 5,3
A 2 B 1: 3,5
A 2 B 2: 3,3
那么这里有两个纳什均衡:A1B2,A2B1。是的,所有人都去找同伴,这根本不均衡,因为任何一人切换成策略1都会更好;得有一个人去找那位美女,才是均衡的。
如果朋友多了,也是一样。当且仅当有一个人去找美女剩下的人找同伴的时候,这才是真均衡。
所以实际上,酒吧间的场景用博弈论分析是这样的:
四个人有四种可能的均衡,每一种均衡都是一个人去找美女,剩下三人找同伴。
实际的决策当然不一定会形成均衡,因为现实中信息不那么透明,有可能大家各自做各自的选择结果撞了。
假如大家都能感知到别人的策略的话,那么就是谁抢先,谁占便宜。我抢在第一个选择策略1,那么剩下的人就只能选策略2了。这是一个纳什均衡。
假如大家并不能感知到别人的策略,但大家都是聪明人,都是同步做出决策,那可能会出现好玩的场景:一开始所有人第一反应是策略1,但大家会意识到别人的第一反应和自己一样,这样自己吃亏,我应该换策略2。但别人也是聪明人,我能想到的他们也能想到,于是大家都会换策略2。但如果大家都会换策略2,那我改成策略1不就捡漏了吗?于是我应该改策略1,但别人也会这么想,也会改回1……如此陷入死循环。
现实中死循环应该是不至于,但结果还是:谁先敢于向同伴亮明自己选择了策略1,谁占便宜。