《第3章 2信息經(jīng)濟(jì)學(xué)研究方法 博弈論4coin》由會員分享,可在線閱讀,更多相關(guān)《第3章 2信息經(jīng)濟(jì)學(xué)研究方法 博弈論4coin(27頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、3.5 不完全信息動態(tài)博弈不完全信息動態(tài)博弈3.5.1 不完全信息博弈不完全信息博弈 “自然”首先選擇參與人的類型,參與人自己知道,其他參與人不知道;參與人開始行動,后行動者能觀測到先行動者的行動,但不能觀測到先行動者的類型;后行動者通過觀察先行動者所選擇的行動來推斷類型或修正對其類型的先驗(yàn)信念(概率分布),然后選擇自己的最優(yōu)行動;先行動者預(yù)測到自己的行動將被后行動者所利用,就會設(shè)法選擇傳遞對自己最有利的信息,避免傳遞對自己不利的信息。13.5.2 3.5.2 貝葉斯法則先驗(yàn)概率(prior probability):修正之前的判斷;后驗(yàn)概率(posterior probability):修正
2、之后的判斷23.5.2 3.5.2 貝葉斯法則貝葉斯法則:假定參與人i有K個(gè)類型,有H個(gè)行動,用k和sh分別代表一個(gè)特定的類型和戰(zhàn)略,假定i屬于k的先驗(yàn)概率是p(k)0,p(k)=1,i選擇sh的條件概率為p(shk),p(shk)=1。33.5.2 3.5.2 貝葉斯法則貝葉斯法則:假如觀測到i選擇了sh,i屬于類型k的后驗(yàn)概率Prob(ksh)有以下公式存在:43.5.2 3.5.2 貝葉斯法則貝葉斯法則舉例:假定現(xiàn)實(shí)中分為好人(1)和壞人(2)(type),所有的事分為好事(s1)和壞事(s2)(strategy),那么一個(gè)人干好事的概率ps1就等于他是好人的概率p(1)(先驗(yàn)概率)乘以
3、好人干好事的概率p(s11),加上他是壞人的概率p(2)乘以壞人干好事p(s12)的概率,即ps1=p(s11)p(1)+p(s12)p(2)(邊緣概率)。53.5.2 3.5.2 貝葉斯法則貝葉斯法則舉例:假定觀測到一個(gè)人干了一件好事,那么這個(gè)人是好人的后驗(yàn)概率為:63.5.2 3.5.2 貝葉斯法則貝葉斯法則舉例:假設(shè)認(rèn)為這個(gè)人是好人的先驗(yàn)概率為1/2,那么在觀測到他干了好事之后來修正他是好人的先驗(yàn)概率依賴于這件事好到什么程度。假設(shè)這件事非常好,好人一定干,壞人一定不干,則有p(s11)=1,p(s12)=0,那么后驗(yàn)概率Prob(1s1)=(1*1/2)/(1*1/2+0*1/2)=1假
4、設(shè)這是一件非常一般的好事,好人會干,壞人也會干,則有p(s11)=1,p(s12)=1,后驗(yàn)概率Prob(1s1)=(1*1/2)/(1*1/2+1*1/2)=1/2假設(shè)介于上述兩種之間,好人肯定會做,壞人可能做也可能不做,則有p(s11)=1,p(s12)=1/2,后驗(yàn)概率Prob(1s1)=(1*1/2)/(1*1/2+1/2*1/2)=2/373.5.3 3.5.3 精煉貝葉斯均衡(PBNE)PBNE是不完全信息動態(tài)均衡的基本均衡概念,是澤爾騰的完全信息動態(tài)博弈子博弈精煉納什均衡(SPNE)和海薩尼的不完全信息靜態(tài)博弈貝葉斯均衡(BNE)的結(jié)合。BNE中,參與人的信念是事前給定的,均衡概
5、念沒有規(guī)定參與人如何修正自己的信念。SPNE要求均衡戰(zhàn)略不僅在整個(gè)博弈上構(gòu)成納什均衡,而且要求在每個(gè)子博弈上構(gòu)成納什均衡,剔除了那些包含不可置信威脅的戰(zhàn)略。83.5.3 3.5.3 精煉貝葉斯均衡(PBNE)PBNE要求,給定每一個(gè)參與人有關(guān)其他參與人類型的后驗(yàn)信念,參與人的戰(zhàn)略組合在每一個(gè)后續(xù)博弈(continuation game,每一個(gè)信息集開始的博弈的剩余部分,不同于開始于單結(jié)信息集的子博弈)上構(gòu)成貝葉斯均衡。99.5.3 9.5.3 精煉貝葉斯均衡(PBNE)PBNE要求:(1)在每一個(gè)信息集上,決策者必須有一個(gè)定義在屬于該信息集的所有決策結(jié)上的一個(gè)概率分布(信念);(2)給定該信息
6、集上的概率分布和其他參與人的后續(xù)戰(zhàn)略,參與人的行動必須是最優(yōu)的;(3)每一個(gè)參與人根據(jù)貝葉斯法則和均衡戰(zhàn)略修正后驗(yàn)概率。103.5.3 3.5.3 精煉貝葉斯均衡(PBNE)精煉貝葉斯均衡的定義:s*()=(s1*(1),sn*(n)和一個(gè)后驗(yàn)概率組合 ,滿足:(P)對于所有的參與人i,在每一個(gè)信息集h,存在(B)是使用貝葉斯法則從先驗(yàn)概率pi(-ii),觀測到的行動 和最優(yōu)戰(zhàn)略 得到的。113.5.3 3.5.3 精煉貝葉斯均衡(PBNE)精煉貝葉斯均衡是均衡戰(zhàn)略和均衡信念的結(jié)合:給定信念 ,戰(zhàn)略s*=(s1*,sn*)是最優(yōu)的;給定戰(zhàn)略s*=(s1*,sn*),信念 是使用貝葉斯法則從均衡
7、戰(zhàn)略和所觀測到的行動得到的。123.5.4 3.5.4 信號傳遞博弈及其應(yīng)用信號傳遞博弈(signaling games)是一種比較簡單但有廣泛應(yīng)用意義的不完是一種比較簡單但有廣泛應(yīng)用意義的不完全信息動態(tài)博弈(斯賓塞,全信息動態(tài)博弈(斯賓塞,19741974)博弈中有兩個(gè)參與人博弈中有兩個(gè)參與人,1,1的類型是私人信息的類型是私人信息,為信號發(fā)送者為信號發(fā)送者;2;2的類型是公共信息的類型是公共信息,為信號接為信號接收者。收者。133.5.4 3.5.4 信號傳遞博弈及其應(yīng)用博弈順序(1)“自然”首先選擇1的類型,2只知道1屬于的先驗(yàn)概率p=p();(2)1在觀測到類型后選擇發(fā)出信號mM,M=
8、m1,mJ是信號空間;(3)2觀測到m(而非)使用貝葉斯法則從先驗(yàn)概率p得到后驗(yàn)概率 ,然后選擇戰(zhàn)略aA;(4)支付函數(shù)分別為u1(m,a,),u2(m,a,)。143.5.4 3.5.4 信號傳遞博弈及其應(yīng)用信號傳遞博弈的精煉貝葉斯均衡是戰(zhàn)略組合(m*(),a*(m)和后驗(yàn)概率 的結(jié)合,它滿足:(P1)a*(m)argmax u2(m,a,)(P2)m*()argmaxu1(m,a*(m),);(B)是參與人2使用貝葉斯法則從先驗(yàn)概率p=p()、觀測到的信號m和參與人1的最優(yōu)戰(zhàn)略m*()得到的。153.5.4 3.5.4 信號傳遞博弈及其應(yīng)用分離均衡(Separating equilibri
9、um)不同類型發(fā)送者以1的概率選擇不同信號,或者說,沒有任何類型選擇與其他類型相同的信號。在分離均衡下,信號準(zhǔn)確地揭示出類型。163.5.4 3.5.4 信號傳遞博弈及其應(yīng)用分離均衡(Separating equilibrium)如果m1是類型1的最優(yōu)選擇,m1就不可能是2的最優(yōu)選擇,并且,m2一定是類型2的最優(yōu)選擇,即:u1(m1,s*(m),1)u1(m2,s*(m),1)u1(m2,s*(m),2)u1(m1,s*(m),2)后驗(yàn)概率為:173.5.4 3.5.4 信號傳遞博弈及其應(yīng)用混同均衡(pooling equilibrium)不同類型的發(fā)送者選擇相同的信號,或者說,沒有任何類型選
10、擇與其他類型不同的信號,因此,接收者不修正先驗(yàn)概率。183.5.4 3.5.4 信號傳遞博弈及其應(yīng)用混同均衡(pooling equilibrium)假定mj是均衡戰(zhàn)略,那么:u1(mj,s*(m),1)u1(m,s*(m),1)u1(mj,s*(m),2)u1(m,s*(m),2)193.5.4 3.5.4 信號傳遞博弈及其應(yīng)用市場進(jìn)入博弈 假定有兩個(gè)時(shí)期t=1,2。在 t=1,市場上一個(gè)壟斷企業(yè)(在位者)在生產(chǎn),一個(gè)潛在的進(jìn)入者考慮是否進(jìn)入。如果進(jìn)入,兩個(gè)企業(yè)進(jìn)行庫諾特博弈,否則在位者仍是一個(gè)壟斷者。假定在位者有兩個(gè)可能類型,高成本或低成本,其概率分別為,1-(先驗(yàn)信念)。假定進(jìn)入者只有一
11、個(gè)類型,進(jìn)入成本為2。如果進(jìn)入,生產(chǎn)成本函數(shù)與高成本的在位者相同。203.5.4 3.5.4 信號傳遞博弈及其應(yīng)用市場進(jìn)入博弈 在t=1,作為壟斷者的在位者要決定該時(shí)期的價(jià)格,有三種可能的價(jià)格選擇,p=4,p=5或p=6;如果在位者是高成本,對應(yīng)三種價(jià)格選擇的利潤分別是:2,6,或7 如果在位者是低成本,對應(yīng)三種價(jià)格選擇的利潤分別是:6,9,或8213.5.4 3.5.4 信號傳遞博弈及其應(yīng)用市場進(jìn)入博弈 在t=2,如果在位者是高成本,兩企業(yè)成本函數(shù)相同,對稱的庫諾特均衡產(chǎn)量下的價(jià)格為p=5,每個(gè)企業(yè)的利潤是3;如果在位者是低成本,非對稱的庫諾特均衡產(chǎn)量下的價(jià)格為p=4,在位者利潤是5,進(jìn)入者
12、利潤是1;在完全信息情況下,如果在位者是高成本,進(jìn)入者選擇進(jìn)入;如果在位者是低成本,進(jìn)入者選擇不進(jìn)入。223.5.4 3.5.4 信號傳遞博弈及其應(yīng)用市場進(jìn)入博弈N在位者在位者進(jìn)入者進(jìn)入者高低P=4 P=5 P=6 P=4 P=5 P=6 進(jìn)進(jìn) 不不 進(jìn)進(jìn) 不不 進(jìn)進(jìn) 不不 進(jìn)進(jìn) 不不 進(jìn)進(jìn) 不不 進(jìn)進(jìn) 不不第一階段 (2,0)(2,0)(6,0)(6,0)(7,0)(7,0)(6,0)(6,0)(9,0)(9,0)(8,0)(8,0)第二階段 (3,1)(7,0)(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(5,-1)(9,0)1-233.5.4 3.
13、5.4 信號傳遞博弈及其應(yīng)用市場進(jìn)入博弈求解(一)單階段最優(yōu)壟斷價(jià)格p=6(高成本)或p=5(低成本),不是精煉貝葉斯均衡。如果進(jìn)入者這樣選擇,則后驗(yàn)概率(6)=1(選擇p=6證明在位者是高成本),(5)=0(選擇p=5證明在位者是低成本)給定后驗(yàn)概率,當(dāng)觀測到在位者選擇p=6,進(jìn)入者選擇進(jìn)入,在位者兩期利潤=7+3=10;而如果模仿低成本企業(yè),選擇p=5,則得到兩期利潤=6+7=13。因此p=6不是高成本在位者的最優(yōu)選擇243.5.4 3.5.4 信號傳遞博弈及其應(yīng)用市場進(jìn)入博弈求解(二)假定 1/2,得到混同均衡,兩類在位者選擇相同的價(jià)格給定進(jìn)入者的后驗(yàn)概率和戰(zhàn)略,如果高成本選擇p=6,進(jìn)
14、入者進(jìn)入,u1=7+3=10,如果選擇p=5,進(jìn)入者不進(jìn)入,u1=6+7=13,p=5是高成本的最優(yōu)選擇;如果低成本選擇p=5,u1=9+9=18,大于選擇其他任何價(jià)格時(shí)的利潤,p=5是低成本的最優(yōu)選擇。給定兩類在位者都選擇p=5,進(jìn)入者不能從觀測到的價(jià)格中得到任何新的信息,即后驗(yàn)概率=1*/(1*+1*(1-)=1/2,(式中的1分別為高成本、低成本時(shí)在位者選擇p=5的概率)進(jìn)入的期望利潤*1+(1-)*(-1)=2-10,不進(jìn)入的期望利潤為0,因此不進(jìn)入是最優(yōu)的。253.5.4 3.5.4 信號傳遞博弈及其應(yīng)用市場進(jìn)入博弈求解(三)假定 1/2,得到分離均衡,兩類在位者選擇不同價(jià)格如果不同
15、類型在位者選擇相同的價(jià)格,進(jìn)入者得不到新的信息,將選擇進(jìn)入,因?yàn)?1+(1-)*(-1)=2 -10。給定進(jìn)入者一定會進(jìn)入,在位者的最優(yōu)選擇是p=6(高成本)或p=5(低成本),前面已經(jīng)證明不是一個(gè)均衡。給定進(jìn)入者的后驗(yàn)概率和戰(zhàn)略,低成本在位者選擇p=6(認(rèn)為他是高成本,進(jìn)入),u1=8+5=13;選擇p=5,進(jìn)入者進(jìn)入,u1=9+5=14;選擇p=4,進(jìn)入者不進(jìn)入,u1=6+9=15,最優(yōu)戰(zhàn)略為p=4,進(jìn)入者不進(jìn)入。給定進(jìn)入者的后驗(yàn)概率和戰(zhàn)略,高成本在位者選擇p=4,進(jìn)入者不進(jìn)入,u1=2+7=9;選擇p=5,進(jìn)入者進(jìn)入,u1=6+3=9;選擇p=6,進(jìn)入者進(jìn)入,u1=7+3=10,因此p=6是最優(yōu)的。26課堂延伸趣味博弈:海盜分金幣的博弈求解27