《《博弈論:原理、模型與教程》Nash 均衡第02節(jié)重復(fù)剔除劣戰(zhàn)略行為》由會(huì)員分享,可在線閱讀,更多相關(guān)《《博弈論:原理、模型與教程》Nash 均衡第02節(jié)重復(fù)剔除劣戰(zhàn)略行為(16頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、《博弈論:原理、模型與教程》
第一部分 完全信息靜態(tài)博弈
第2章 Nash 均衡
第2.1節(jié) 占優(yōu)行為
第2.2節(jié) 反復(fù)剔除劣戰(zhàn)略行為
第2.3節(jié) Nash均衡
2.2 反復(fù)剔除劣戰(zhàn)略行為
(已精細(xì)訂正?。?
1、定義2-3
【例2-3】
【例2-4】
【例2-5】
2、定義2-4
在“囚徒困境”中,“坦白”是小偷的占優(yōu)戰(zhàn)略,也就是說(shuō),相對(duì)于戰(zhàn)略“抵賴”,“坦白”在任何狀況下都是小偷的最優(yōu)選擇。因此,小偷只會(huì)選擇戰(zhàn)略“坦白”。
反過(guò)來(lái)也可以這樣理解:相對(duì)于戰(zhàn)略“坦白”,
2、小偷選擇“抵賴”所得到的支付都要不不小于選擇“坦白”所的得到的。既然選擇“抵賴”的所得總是不不小于選擇“坦白”的所得,小偷固然就不會(huì)選擇“抵賴”,這也就相稱于小偷將戰(zhàn)略“抵賴”從自己的選擇中剔除掉了。
考察更一般的人博弈情形。在人博弈中,如果存在參與人的占優(yōu)戰(zhàn)略,那么她在博弈中的戰(zhàn)略選擇問(wèn)題就很簡(jiǎn)樸:選擇占優(yōu)戰(zhàn)略。
但在大多數(shù)博弈問(wèn)題中,參與人的占優(yōu)戰(zhàn)略并不存在。雖然不存在占優(yōu)戰(zhàn)略,但在某些博弈問(wèn)題中,參與人在對(duì)自己的戰(zhàn)略進(jìn)行比較時(shí),也許會(huì)發(fā)現(xiàn)這樣的情形:存在兩個(gè)戰(zhàn)略和(,),雖然不是占優(yōu)戰(zhàn)略,但與相比,自己在任何狀況下選擇的所得都要不小于選擇的所得。在這種狀況下,理性參與
3、人的選擇又有什么樣的特點(diǎn)呢?雖然不能擬定參與人最后會(huì)選擇什么樣的戰(zhàn)略,但可以肯定的是,理性參與人絕對(duì)不會(huì)選擇戰(zhàn)略。由于參與人選擇戰(zhàn)略,還不如直接選擇戰(zhàn)略(由于參與人在任何狀況下選擇的所得都要不小于選擇的所得)。
定義2-3 在人博弈中,如對(duì)于參與人,存在戰(zhàn)略,,對(duì),有
則稱戰(zhàn)略為參與人的劣戰(zhàn)略,或者說(shuō)戰(zhàn)略相對(duì)于戰(zhàn)略占優(yōu)。
在博弈中,如果戰(zhàn)略是參與人劣戰(zhàn)略,那么參與人肯定不會(huì)選擇戰(zhàn)略。這也是相稱于參與人將戰(zhàn)略從自己的戰(zhàn)略集剔除掉,直接從戰(zhàn)略集中選擇自己的戰(zhàn)略。參與人的這種選擇行為稱之為剔除劣戰(zhàn)略行為。剔除劣行為也是理性參與人選擇行為的基本特性之一。
4、
考察戰(zhàn)略式博弈。如果戰(zhàn)略是參與人的劣戰(zhàn)略 ,那么參與人將只會(huì)從戰(zhàn)略集中選擇自己的戰(zhàn)略。令,構(gòu)造一種新的戰(zhàn)略式博弈。此時(shí),對(duì)戰(zhàn)略式博弈的求解問(wèn)題就可以轉(zhuǎn)換為對(duì)的求解。
【例2-3】 考察圖2-4中的戰(zhàn)略式博弈,其中參與人1有兩個(gè)戰(zhàn)略——和,參與人2有三個(gè)戰(zhàn)略,和。
1,0
參與人1
3,2
1,1
2,2
2,0
0,1
圖2-4 戰(zhàn)略式博弈
參與人2
從圖2-4中可以看出:戰(zhàn)略相對(duì)于戰(zhàn)略占優(yōu),也就是說(shuō)是參與人2的劣戰(zhàn)略。因此,對(duì)圖2-4中博弈問(wèn)題的求解就可以轉(zhuǎn)換
5、為對(duì)圖2-5中博弈的求解。
1,0
參與人1
3,2
2,2
0,1
圖2-5 戰(zhàn)略式博弈
參與人2
遵循上面的求解思路,如果在新構(gòu)造出來(lái)的戰(zhàn)略式博弈中,存在參與人的某個(gè)劣戰(zhàn)略,那么又可以構(gòu)造出一種新的戰(zhàn)略式博弈,其中參與人的戰(zhàn)略集為。此時(shí),對(duì)戰(zhàn)略式博弈的求解問(wèn)題就可以轉(zhuǎn)換為對(duì)的求解。而參與人的這種不斷剔除劣戰(zhàn)略的行為稱為反復(fù)剔除劣戰(zhàn)略行為。
【例2-4】 考察圖2-6中的戰(zhàn)略式博弈,其中參與人1有三個(gè)博弈——,和,參與人2有三個(gè)戰(zhàn)略,和。
6、
1,0
參與人1
3,2
1,1
3,2
2,0
2,1
圖2-6 戰(zhàn)略式博弈
參與人2
2,1
1,3
3,2
從圖2-6中可以看出:戰(zhàn)略是參與人2的劣戰(zhàn)略。因此,對(duì)圖2-6中博弈問(wèn)題的求解就可以轉(zhuǎn)換為對(duì)圖2-7中博弈的求解。
1,0
參與人1
3,3
3,2
2,1
圖2-7 戰(zhàn)略式博弈
參與人2
2,1
1,3
從圖2-7中又可以看出:戰(zhàn)略是參與人1的劣戰(zhàn)略。因此,對(duì)圖2
7、-7中博弈問(wèn)題的求解就可以轉(zhuǎn)換為對(duì)圖2-8中博弈的求解。也就是對(duì)圖2-6中原博弈問(wèn)題的求解就可以轉(zhuǎn)換為對(duì)圖2-8中博弈的求解。
1,0
參與人1
3,2
3,2
2,1
圖2-8 戰(zhàn)略式博弈
參與人2
如果以上反復(fù)剔除劣戰(zhàn)略的過(guò)程可以不斷進(jìn)行下去,直到新構(gòu)造出來(lái)的博弈中每個(gè)參與人都只有一種戰(zhàn)略,那么由所有的參與人剩余的唯一戰(zhàn)略所構(gòu)成的戰(zhàn)略組合就是原博弈問(wèn)題的解,稱之為“反復(fù)剔除的占優(yōu)均衡”。此時(shí),也稱原博弈問(wèn)題是“反復(fù)剔除劣戰(zhàn)略可解的”。
【例2-5】 考察圖2-9中的戰(zhàn)略
8、式博弈,其中參與人1有三個(gè)戰(zhàn)略——、和,參與人2有三個(gè)戰(zhàn)略,和。
1,0
參與人1
3,1
1,1
3,3
2,0
2,2
圖2-9 戰(zhàn)略式博弈
參與人2
2,4
1,3
3,2
從圖2-9中可以看出:戰(zhàn)略是參與人2的劣戰(zhàn)略。因此,對(duì)圖2-9中博弈問(wèn)題的求解就可以轉(zhuǎn)換為對(duì)圖2-10中博弈的求解。
從圖2-10中又可以看出:戰(zhàn)略是參與人1的劣戰(zhàn)略。因此,對(duì)圖2-10中博弈問(wèn)題的求解就可以轉(zhuǎn)換為對(duì)圖2-11中博弈的求解。
9、
1,0
參與人1
3,1
3,3
2,2
圖2-10 戰(zhàn)略式博弈
參與人2
2,4
1,3
1,0
參與人1
3,1
3,3
2,2
圖2-11 戰(zhàn)略式博弈
參與人2
從圖2-11中又可以看出:戰(zhàn)略是參與人2的劣戰(zhàn)略。因此,對(duì)圖2-11中博弈問(wèn)題的求解就可以轉(zhuǎn)換為對(duì)圖2-12中博弈的求解。
3,3
參與人1
2,2
圖2-12 戰(zhàn)略式博弈
參與人2
10、
在圖2-12中,參與人2只有一種戰(zhàn)略,參與人1選擇戰(zhàn)略,因此原博弈問(wèn)題的解為戰(zhàn)略組合。而就是所謂的反復(fù)剔除的占優(yōu)均衡。
在某些博弈問(wèn)題中,參與人在對(duì)自己的戰(zhàn)略進(jìn)行比較時(shí),還也許會(huì)發(fā)現(xiàn)這樣的情形:存在兩個(gè)戰(zhàn)略和(,),與相比,雖然選擇的所得并不一定總是不小于選擇的所得,但自己在任何狀況下選擇的所得都不會(huì)比選擇的所得小,并且在某些狀況下選擇的所得嚴(yán)格不小于選擇的所得。顯然,在這種狀況下,理性的參與人將戰(zhàn)略從自己的選擇中剔除掉也是有道理的。與定義2-3中所定義的劣戰(zhàn)略相仿,稱戰(zhàn)略、為參與人的弱劣戰(zhàn)略。
定義2-4 在人博弈中,如果對(duì)于參與人,存在戰(zhàn)略
11、,對(duì),有
且,使得
則稱戰(zhàn)略為參與人的弱劣戰(zhàn)略,或者說(shuō)戰(zhàn)略相對(duì)于戰(zhàn)略弱占優(yōu)。
有時(shí)為了表述以便,也將定義2-3所定義的劣戰(zhàn)略稱為嚴(yán)格劣戰(zhàn)略,而將弱劣戰(zhàn)略和嚴(yán)格劣戰(zhàn)略統(tǒng)稱為劣戰(zhàn)略。
與反復(fù)剔除嚴(yán)格劣戰(zhàn)略的思路同樣,也可以采用反復(fù)剔除弱劣戰(zhàn)略的措施來(lái)求解博弈問(wèn)題。
但需要注意的是,在反復(fù)剔除的過(guò)程中,如果每次可以剔除的劣戰(zhàn)略(涉及嚴(yán)格劣戰(zhàn)略和弱劣戰(zhàn)略)不只一種,那么各個(gè)劣戰(zhàn)略剔除的順序不同,得到的博弈成果就有也許不同。除非每次剔除的都是嚴(yán)格列戰(zhàn)略。
下面通過(guò)一種例子來(lái)闡明這個(gè)問(wèn)題。(重點(diǎn)!)
考察圖2-13中的戰(zhàn)略式博弈。在圖2-13中,和是參與人2的
12、劣戰(zhàn)略。
參與人1
3,3
3,1
1,2
1,1
2,0
2,0
圖2-13 戰(zhàn)略式博弈
參與人2
3,4
1,3
3,2
如果一方面剔除劣戰(zhàn)略,那么在新博弈中,戰(zhàn)略成為弱劣戰(zhàn)略,如果再剔除,則博弈的成果為戰(zhàn)略組合;如果一方面剔除劣戰(zhàn)略,那么在新博弈中,戰(zhàn)略成為弱劣戰(zhàn)略,如果再剔除,則博弈的成果為戰(zhàn)略組合。
導(dǎo)致博弈成果不同的因素在于:在原博弈中,和原本互不占優(yōu),但是如果先剔除,則相對(duì)于弱占優(yōu),就也許因此被剔除掉;如果先剔除掉,則相對(duì)于弱占優(yōu),就也許因此被剔除掉。因此,當(dāng)和的剔除順序不同步,參與人1保存下來(lái)的戰(zhàn)
13、略就也許不同。但是,如果只容許剔除嚴(yán)格劣戰(zhàn)略,那么無(wú)論是先剔除還是,得到的博弈成果都是戰(zhàn)略組合和。
為了進(jìn)一步闡明問(wèn)題,考察圖2-14中戰(zhàn)略式博弈,圖2-14 中博弈與圖2-13中博弈的不同之處僅在于戰(zhàn)略組合下參與人1的支付不同。
參與人1
4,3
3,1
1,2
1,1
2,0
2,0
圖2-14 戰(zhàn)略式博弈
參與人2
3,4
1,3
3,2
在圖2-14中,和也是互不占優(yōu)。但是,在剔除劣戰(zhàn)略和的過(guò)程中,無(wú)論是先剔除還是,只會(huì)浮現(xiàn)相對(duì)于占優(yōu)的情形,而不會(huì)浮現(xiàn)相對(duì)于占優(yōu)或弱占優(yōu)的情形。因此,無(wú)論剔除劣戰(zhàn)
14、略的順序如何,博弈的成果都是戰(zhàn)略組合。
前面多次提到博弈分析是在假設(shè)博弈問(wèn)題的構(gòu)造和參與人完全理性為共同知識(shí)的前提下進(jìn)行的,目前分析如果沒(méi)有這樣的假設(shè),所得到的博弈問(wèn)題的解——占優(yōu)戰(zhàn)略均衡和反復(fù)剔除的占優(yōu)均衡與否存在。
當(dāng)參與人理性時(shí),如果參與人的占優(yōu)戰(zhàn)略,那么無(wú)論其她參與人與否理性或者與否懂得她是理性的,她都會(huì)選擇占優(yōu)戰(zhàn)略。因此,如果博弈中存在占優(yōu)戰(zhàn)略均衡且所有的參與人都理性,那么博弈的成果就是占優(yōu)戰(zhàn)略均衡。也就是說(shuō),不需要完全理性為共同知識(shí)就可保證占優(yōu)戰(zhàn)略均衡為博弈的成果。但是,必須清晰:存在占優(yōu)戰(zhàn)略均衡的博弈絕對(duì)只是博弈問(wèn)題中的很少數(shù),在大多數(shù)狀況下占優(yōu)戰(zhàn)
15、略均衡是不存在的。
更重要的是,如果僅僅假設(shè)參與人是理性的,就會(huì)發(fā)現(xiàn)及時(shí)博弈問(wèn)題是“反復(fù)剔除劣戰(zhàn)略可解的”,也無(wú)法保證博弈的成果就是反復(fù)剔除的占優(yōu)均衡,這是由于:在反復(fù)剔除過(guò)程的每一步中,如果只假設(shè)參與人理性,那么只能保證參與人將其劣戰(zhàn)略剔除掉;而如果其她參與人不懂得她是理性的,就不能保證其她參與人懂得她已將劣戰(zhàn)略剔除掉。在這種狀況下,就不能講原博弈問(wèn)題轉(zhuǎn)換為新的博弈問(wèn)題,也就是說(shuō),雖然剔除劣戰(zhàn)略行為是理性參與人選擇行為的基本特性,但如果僅僅假設(shè)參與人理性是不能保證反復(fù)剔除的。
在例2-3中,如果參與人1不懂得參與人2的理性的,她就不懂得自己面臨的博弈問(wèn)題已由圖2-4中的戰(zhàn)略式博弈
16、轉(zhuǎn)換為圖2-5中的博弈。同樣,如果參與人2不懂得參與人1懂得自己是理性的,圖2-4中的戰(zhàn)略式博弈也不能轉(zhuǎn)換為圖2-5中的博弈。
在例2-4中,要保證圖2-6的中博弈轉(zhuǎn)換為圖2-8中的博弈,就必須規(guī)定每個(gè)參與人都懂得博弈問(wèn)題轉(zhuǎn)換的每一步(即每一次剔除劣戰(zhàn)略),并且還要懂得其她參與人懂得博弈問(wèn)題轉(zhuǎn)換的每一步。
具體講就是:
(1)參與人2是理性;
(2)參與人1懂得到參與人2理性,參與人2懂得參與人1懂得到參與人2理性;
(3)參與人1是理性,參與人2懂得到參與人1理性,參與人1懂得參與人2懂得到參與人1理性。
而在例2-5中,對(duì)參與人理性假設(shè)的規(guī)定就更為復(fù)雜,除了例2-4中所規(guī)定的以上3點(diǎn)外,對(duì)理性尚有進(jìn)一步的規(guī)定。
因此,隨著博弈中參與人人數(shù)的增長(zhǎng)及參與人戰(zhàn)略空間的增大,反復(fù)剔除的過(guò)程就會(huì)越來(lái)越復(fù)雜,對(duì)理性假設(shè)的規(guī)定也就越來(lái)越高。
因此,為了保證博弈分析的順利進(jìn)行,一般都假設(shè)參與人完全理性為共同知識(shí)。
基于同樣的理由,也假設(shè)博弈問(wèn)題的構(gòu)造(涉及參與人的支付)為共同知識(shí)。