[所有分類]博弈論:原理、模型與教程第04章Nash均衡解的特性第02節(jié)Nash均衡的存在性
《[所有分類]博弈論:原理、模型與教程第04章Nash均衡解的特性第02節(jié)Nash均衡的存在性》由會(huì)員分享,可在線閱讀,更多相關(guān)《[所有分類]博弈論:原理、模型與教程第04章Nash均衡解的特性第02節(jié)Nash均衡的存在性(33頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、《博弈論:原理、模型與教程》 第一部分 完全信息靜態(tài)博弈 第4章 Nash均衡解的特性 4.2 Nash均衡解的存在性 (已精細(xì)訂正?。? =============== =============== 本節(jié)推薦參考文獻(xiàn): (01)張石生.不動(dòng)點(diǎn)理論及應(yīng)用(M). 重慶:重慶出版社,1984年8月第1版. (注:有趣的是,該書的責(zé)任編輯尹明善,就是后來從摩配起步創(chuàng)業(yè)成功的力帆老總) (02)張奠宙,顧鶴榮.不動(dòng)點(diǎn)定理(M). 沈陽:遼寧教育出版社,1989年4月第1版. (03)王則軻,左再思,李志強(qiáng).經(jīng)濟(jì)學(xué)拓?fù)浞椒ǎ∕). 北京:北京大學(xué)
2、出版社,2002年1月第1版. =============== =============== 將Nash均衡作為博弈的解,會(huì)面臨這樣的問題:Nash均衡是否存在,或者說對于所關(guān)心的博弈問題,是否一定存在一個(gè)Nash均衡? 非常慶幸的是,我們能夠得到一個(gè)肯定的答案。 下面將對本書所涉及的博弈論中一些經(jīng)典的存在性結(jié)論進(jìn)行介紹。 定理4-1(Nash均衡的存在性定理1,1950) 每一個(gè)有限的戰(zhàn)略式博弈至少存在一個(gè)Nash均衡(包括純戰(zhàn)略和混合戰(zhàn)略Nash均衡)。 定理4-1是博弈論中關(guān)于Nash均衡存在性的最基本定理。1950年,John Nash
3、在文章Equilibrium points in n-person games 中首次提出Nash均衡的概念,并給出該存在性定理。無論怎樣強(qiáng)調(diào)該定理對于博弈論以后的發(fā)展的意義都不過分,因?yàn)镹ash均衡之后的博弈論的發(fā)展(尤其是非合作博弈論的發(fā)展)基本上都是以該定理為基石的。定理4-1的條件簡單,但得出的結(jié)論卻十分肯定。 下面給出的定理的詳細(xì)證明。供有興趣的讀者參考。 為證明該定理,先給出如下必要的基本概念。 定義4-1 從集合到集合的一個(gè)規(guī)則,若滿足:,都中的一個(gè)集合與之對應(yīng),則稱為由到的對應(yīng),記為:→。 簡單地說,對應(yīng)是函數(shù)概念的擴(kuò)展,函數(shù)將集合中的點(diǎn)映到中的點(diǎn),而
4、對應(yīng)將集合中的點(diǎn)映到中的子集。 對應(yīng):→的圖像是指中的集合︱。對應(yīng):→為上半連續(xù)的,是指和中任意包含的開集,在中都存在的一個(gè)鄰域,只要,就有。顯然對應(yīng)的上半連續(xù)性為函數(shù)連續(xù)性概念的擴(kuò)展,對應(yīng)一個(gè)函數(shù)它的上半連續(xù)性就等于它的連續(xù)性。對應(yīng):→的圖像為閉圖,是指任意給定若就有。閉圖將閉集的概念推廣到集合的直積中。若對應(yīng)的值域?yàn)榫o集,則有閉圖就意味著為上半連續(xù)的。有了這些基本概念,下面證明基本定理4-1. 證明的基本思想是將Kakutani不動(dòng)點(diǎn)定理應(yīng)用于參與人的反應(yīng)對應(yīng)上。 參與人的反應(yīng)對應(yīng) 為對手選擇時(shí),將每一個(gè)戰(zhàn)略組合映射到的一個(gè)混合戰(zhàn)略集。給定對手選擇,給混合戰(zhàn)略集中的每個(gè)戰(zhàn)略最大化參與
5、人的支付。這里雖然只依賴于,而不依賴于,仍將 寫作的對應(yīng),因?yàn)樯院髸?huì)在戰(zhàn)略組合空間之中尋找一個(gè)不動(dòng)點(diǎn)。定義反應(yīng)對應(yīng)為的Cartesian直積,即,則的不動(dòng)點(diǎn)為滿足 的戰(zhàn)略組合,因此對每個(gè)參與人,,所以的不動(dòng)點(diǎn)即為一個(gè)Nash均衡。因此,對定理4-1的證明轉(zhuǎn)化為證明參與人的反應(yīng)對應(yīng)具有不動(dòng)點(diǎn)。 由Kakutani不動(dòng)點(diǎn)定理,,存在不動(dòng)點(diǎn)的充分條件為: ①為有限維歐氏空間的緊的凸子集; ②非空; ③為凸; ④有閉圖。 在這里,若①成立,即為緊集,且④成立,則對應(yīng)為上半連續(xù)的。 下面分別證明這些條件滿足: 首先,因?yàn)闉榫S數(shù)為的單純形,所以①滿足。 其次,因?yàn)槊恳粋€(gè)參與人的支
6、付函數(shù)在自己的混合戰(zhàn)略上是線性的,因此也是連續(xù)的。連續(xù)函數(shù)在緊集上取得最大值,所以非空,②滿足。 再次,為了證明③ ,采用反證法。 若非凸,則存在及 ,且存在,使得,但對每一個(gè),有 因此若,是相對于的最優(yōu)反應(yīng),那么它們的加權(quán)平均也是。而這與非凸矛盾,所以凸。 最后,仍用反證法證明④ 。 假設(shè)④不滿足,則存在序列但,所以存在,。因此存在和,使得。又因?yàn)闉檫B續(xù)的且,因此對足夠大的,有 所以對于 嚴(yán)格優(yōu)于,這與矛盾。所以 ④ 滿足。 至此,也就完成了有限博弈中Nash均衡的存在性的證明。
7、 在經(jīng)濟(jì)學(xué)和現(xiàn)實(shí)生活中也有很多無限博弈,即參與人的戰(zhàn)略有無限多個(gè)或參與人的戰(zhàn)略能在一個(gè)集合中連續(xù)取值,如廠商之間的價(jià)格或產(chǎn)量競爭。對應(yīng)于這些情況有如下的存在性定理。 定理4-2(Nash均衡的存在性定理2,Debru 1952,Glicksberg 1952,Fan 1952) 對于戰(zhàn)略式博弈,若為歐氏空間的非空緊凸子集,支付函數(shù)關(guān)于戰(zhàn)略組合連續(xù),關(guān)于擬凹,則該博弈存在純戰(zhàn)略的Nash均衡。 該定理的證明與Nash均衡的存在性定理4-1類似,支付函數(shù)關(guān)于所有參與人戰(zhàn)略組合的連續(xù)性意味著反應(yīng)對應(yīng)具有閉圖。另外,支付函數(shù)關(guān)于自己戰(zhàn)略的擬凹性意味著反應(yīng)對應(yīng)為凸值的。同樣
8、運(yùn)用Kakutani不動(dòng)點(diǎn)定理便可以證明該定理。 注意:在上述定理中關(guān)于參與人戰(zhàn)略組合的連續(xù)性條件是非常重要的,它類似于有限博弈中期望支付關(guān)于混合戰(zhàn)略是連續(xù)的,因此Nash均衡的存在性定理4-1可以看作是該定理的特例。但同時(shí)在參與人的支付函數(shù)上該定理的條件較Nash均衡的存在性條件強(qiáng),但正是因?yàn)檩^強(qiáng)的條件從而導(dǎo)致了較強(qiáng)的結(jié)果——純戰(zhàn)略Nash均衡的存在性!在很多博弈中不存在純戰(zhàn)略的Nash均衡,但卻存在混合戰(zhàn)略 Nash均衡,因此將上述條件放松便得到相關(guān)條件下關(guān)于混合戰(zhàn)略的存在性結(jié)論。 定理4-3(Nash均衡的存在性定理3,Glicksberg 1952) 對于戰(zhàn)略式博弈
9、,若戰(zhàn)略空間為距離空間中的非空緊子集,支付函數(shù)關(guān)于戰(zhàn)略組合連續(xù),則該博弈存在混合戰(zhàn)略的Nash均衡(將純戰(zhàn)略Nash均衡作為混合戰(zhàn)略Nash均衡的特例)。 在上述關(guān)于Nash均衡的存在性定理4-2和定理4-3中,都要求參與人的支付關(guān)于所有參與人戰(zhàn)略組合的連續(xù)性,在經(jīng)濟(jì)學(xué)的一些理論或應(yīng)用中,非連續(xù)性或非擬凹的收益函數(shù)是很常見的。如果有不連續(xù)的收益,則一個(gè)緊的戰(zhàn)略空間就不再確保參與人對應(yīng)其對手戰(zhàn)略的最優(yōu)反應(yīng)一定存在。為了探尋此時(shí)均衡的存在性,Dasgupta進(jìn)一步對以上存在性條件進(jìn)行放松,得到如下存在性定理。 定理4-4(Nash均衡的存在性定理4,Dasgupta和Maski
10、n 1986) 對于戰(zhàn)略式博弈 ,若對于所有的,為有限維歐氏空間的非空緊凸子集;關(guān)于擬凹,關(guān)于上半連續(xù)且 關(guān)于連續(xù),則該博弈存在一個(gè)純戰(zhàn)略的Nash均衡。 該定理的證明仍然與前述定理的證明類似,仍然采用Kakutani不動(dòng)點(diǎn)定理,其中收益函數(shù)關(guān)于自己戰(zhàn)略的擬凹性保證了反應(yīng)對應(yīng)的凸值性,的極大值關(guān)于的連續(xù)性及的上半連續(xù)性保證了反應(yīng)對應(yīng)具有閉圖,因此證明過程類似定理4-1,這里不再重復(fù)。 在上述定理的基礎(chǔ)上,Dasgupta繼續(xù)對的連續(xù)性及擬凹性進(jìn)行放松,得到了當(dāng)支付函數(shù)只在戰(zhàn)略集的某個(gè)子集上不連續(xù)時(shí),相關(guān)條件下混合戰(zhàn)略均衡的存在性。其思想是用有限分割去近似戰(zhàn)略空間,證明的方
11、法仍然是用Kakutani不動(dòng)點(diǎn)定理。由于涉及一些較復(fù)雜的數(shù)學(xué)名詞的解釋,這里不再介紹,建議有興趣的讀者參閱相關(guān)文獻(xiàn)。 至此為止,所列出的關(guān)于Nash均衡的存在性結(jié)論其證明思想都是Kakutani不動(dòng)點(diǎn)定理。從數(shù)學(xué)上看,以上一系列的存在性定理都是在不斷放松Kakutani不動(dòng)點(diǎn)定理成立的條件,而且都在試圖不斷放松對支付函數(shù)的要求以滿足Kakutani不動(dòng)點(diǎn)定理的條件。在反應(yīng)對應(yīng)具體凸性這一點(diǎn)上它們是相同的。當(dāng)反應(yīng)對應(yīng)的凸性不再滿足,而只是滿足一定的單調(diào)性(通常指單調(diào)增,有些情況下可以單調(diào)減)時(shí),支付函數(shù)也只是滿足一定的單調(diào)性時(shí),關(guān)于Nash均衡的存在性結(jié)論也已經(jīng)有所發(fā)展,這便是超模博
12、弈理論。超模博弈理論為戰(zhàn)略空間只是滿足一定的序結(jié)構(gòu),支付函數(shù)只是滿足一定的單調(diào)性的博弈的Nash均衡存在性提供了一定的保證,不僅如此,它還保證了這種博弈有純戰(zhàn)略的Nash均衡。在戰(zhàn)略空間的一定序結(jié)構(gòu)下,該類博弈的Nash均衡的戰(zhàn)略集的上下界存在且與可理性化戰(zhàn)略集的上下界重合。在思想方法上由于反應(yīng)對應(yīng)的凸性假設(shè)不再必要,該類博弈的Nash均衡的存在性的理論基礎(chǔ)不再是Kakutani不動(dòng)點(diǎn)定理,而是Tarski不動(dòng)點(diǎn)定理。關(guān)于該類博弈的具體內(nèi)容有興趣的讀者請參閱Topkis的相關(guān)著作。 [實(shí)際講授] ============================ =========
13、=================== 第一部分 回顧 例子1 猜幣游戲 一般地,用表示在給定參與人2的戰(zhàn)略的情況下,參與人1的最優(yōu)反應(yīng)。由式(3-4)可得 = = (3-10) 在式(3-10)中,參與人1的期望收益在時(shí)隨遞增,在時(shí)隨遞減。因此當(dāng)時(shí),參與人1的最優(yōu)反應(yīng)(即選擇正面);當(dāng)時(shí),參與人1的最優(yōu)反應(yīng)(即選擇反面)(參見圖3-7中的兩段水平虛線)。 1 (反面) (正面) (正面)1 (反面) 圖3-7 參與人
14、的最優(yōu)反應(yīng) 前面已經(jīng)提到,在時(shí),參與人1選擇純戰(zhàn)略正面或反面是無差異的。而且從式(3-10)可以看到,參與人1的期望收益在時(shí)與無關(guān),所有混合戰(zhàn)略對參與人1都是無差異的。也就是說,當(dāng)時(shí),對于到之間的任何,混合戰(zhàn)略都是對的最優(yōu)反應(yīng),即(參見圖3-7所示中間的豎線段)。 綜上分析,可得參與人1最優(yōu)反應(yīng)為 (3-11) 在式(3-11)中,當(dāng)時(shí),可以為 中的任一值,從而使得有不止一個(gè)值。因此,稱為參與人1的最優(yōu)反應(yīng)響應(yīng)(best correspondence),而不是最優(yōu)反應(yīng)函數(shù) 最優(yōu)反應(yīng)函數(shù)表示給定參與人2的一個(gè)戰(zhàn)略,參與人1僅有一個(gè)最
15、優(yōu)戰(zhàn)略與之相對應(yīng);而最優(yōu)反應(yīng)響應(yīng)則表示給定參與人2的一個(gè)戰(zhàn)略,參與人1不只有一個(gè)最優(yōu)戰(zhàn)略與之相對應(yīng)。參見第5章中關(guān)于Cournot模型的介紹。 。 對稱地,可得參與人2的最優(yōu)反應(yīng)響應(yīng)。 將參與人1與參與人2的最優(yōu)反應(yīng)響應(yīng)置于同一張平面,最優(yōu)反應(yīng)響應(yīng)曲線的交點(diǎn),即是Nash均衡。 (反面) 1 1/2 1 O (正面) (反面) 正面 圖 參與人1的最優(yōu)反應(yīng)對應(yīng) 1/2 1 正面 1/2 背面 0 1 正面 圖 參與人2的最優(yōu)反應(yīng)對應(yīng) 1/2 納
16、什均衡點(diǎn)(不動(dòng)點(diǎn)) 1 正面 1/2 背面 0 1 正面 圖 納什均衡點(diǎn) 例子2 Cournot寡頭博弈模型 假設(shè)每個(gè)寡頭企業(yè)具有相同的不變單位成本,即 ,需求函數(shù)為線性形式,所以 此時(shí),最優(yōu)化的一階條件為 企業(yè)的最優(yōu)反應(yīng)函數(shù)為 聯(lián)立求解上式,可得企業(yè)的Nash均衡產(chǎn)量為 (5-1) 企業(yè)的Nash均衡利潤分別為 (5-2) 在上述簡單假設(shè)下,兩個(gè)企業(yè)的最優(yōu)反應(yīng)函數(shù)均為直線,兩條
17、直線的交點(diǎn)即為Nash均衡,如圖5-1所示。 (不動(dòng)點(diǎn)) 圖5-1 Cournot 模型的Nash均衡 第二部分 實(shí)施Nash定理的證明 已經(jīng)知道,在考慮混合戰(zhàn)略的情況下,一個(gè)完全信息靜態(tài)博弈“通?!倍即嬖诩{什均衡。這一認(rèn)識(shí)最早由納什(Nash,1950,1951)進(jìn)行了證明,稱為納什定理。 定理2.1 納什定理 如果完全信息靜態(tài)博弈是有限的,即參與人是有限的,包含的純策略也是有限的,那么一定存在至少一個(gè)(純策略或混合策略)納什均衡。 所謂“通?!敝傅木褪遣┺牡挠邢扌浴5侥壳盀橹?,我們分析的博弈都滿足這兩個(gè)
18、條件。參與人有限——通常為兩個(gè)人。也是有限的——要么存在若干個(gè)純策略,例如猜幣游戲;要么雖然純策略由無窮多,但卻是有界閉集 在數(shù)學(xué)中,有界閉集必然意味著是有限的,即它不是無限的,或者說拒斥了無限情。 ,例如古諾模型中的戰(zhàn)略集,所以前面分析的靜態(tài)博弈都存在納什均衡。 對納什定理的證明分三個(gè)部分來完成: 第一步,介紹不動(dòng)點(diǎn)定理; 第二步,說明納什均衡就是不動(dòng)點(diǎn); 第三步,完成證明。 第一步,不動(dòng)點(diǎn)定理。 先來看圖2-29。 0 0 1 A D C 1 B 不動(dòng)點(diǎn) 圖2-29 從區(qū)間[0,1]區(qū)間[0,1]連續(xù)函數(shù)具有不動(dòng)
19、點(diǎn) 圖2-29中的方框?yàn)檎叫?。?5°線,它實(shí)際上等價(jià)于函數(shù)。線上的每一點(diǎn)都滿足,把滿足的稱為不動(dòng)點(diǎn)。 線所代表的函數(shù)自變量取值為,稱為定義域,而因變量的取值為,稱為值域。定義域和值域都為的函數(shù),又可寫作,讀作從到的映射。 現(xiàn)在做一個(gè)小游戲:拿一支筆,從線出發(fā)任意畫一條曲線,記住可以任意畫,但必須連續(xù)畫不能斷裂,至到線結(jié)束。這時(shí)發(fā)現(xiàn)無論如何畫,這條曲線一定會(huì)和相交,這個(gè)交點(diǎn)就是不動(dòng)點(diǎn)。因?yàn)槿我猱嫷那€等價(jià)于一個(gè)函數(shù),沒有斷裂意味著它是連續(xù)的,與線相交意味著,所以交點(diǎn)為不動(dòng)點(diǎn)。 所有任意畫的曲線都有如下的性質(zhì): (1)定義域是非空的、有界的、閉的、凸集合,簡稱非空凸緊集。有界
20、閉集即為緊集。 (2)函數(shù)是連續(xù)的,并且是自身對自身的映射。 上面考慮的只是一元函數(shù),對于元函數(shù)是不是如果滿足上述性質(zhì)就存在不動(dòng)點(diǎn)?布勞爾(Brower)定理肯定地回答了這一點(diǎn)。 定理2.2—布勞爾(Brower)不動(dòng)點(diǎn)定理。 假設(shè)是一個(gè)非空凸緊集合,并且是一個(gè)連續(xù)函數(shù);那么必有一個(gè)不動(dòng)點(diǎn);即,存在一個(gè)使得。 這里為實(shí)數(shù),為實(shí)數(shù)的重笛卡爾積,為維向量。在前面的例子中。在實(shí)際運(yùn)用中,我們常常遇到的不是函數(shù)而是對應(yīng)的情況,例如猜幣游戲這個(gè)博弈存在的是最優(yōu)反應(yīng)對應(yīng),而不是函數(shù),這就有了對布勞爾不動(dòng)點(diǎn)定理的推廣。 定理2.3—角谷(Kakutani)不動(dòng)點(diǎn)定理。
21、假設(shè)是非空凸緊集,并且是上半連續(xù)對應(yīng),并且對于每一個(gè),集合是非空凸集,那么必有一個(gè)不動(dòng)點(diǎn)。即,存在一個(gè)使得。 角谷不動(dòng)點(diǎn)定理與布勞爾不動(dòng)點(diǎn)定理的區(qū)別在于: ①映射為對應(yīng)而不是函數(shù),所以為一個(gè)集合(一個(gè)點(diǎn)也能組成集合,所以函數(shù)是對應(yīng)的特例)。 ②映射是上半連續(xù)的。一個(gè)對應(yīng)只有既是上半連續(xù)又是下半連續(xù)才能稱為連續(xù),因而上半連續(xù)比連續(xù)的要求要弱。 關(guān)于對應(yīng)的上半連續(xù),就是指如果存在一個(gè)序列收斂于并且收斂于,那么一定有(如果只有唯一值,那么就變?yōu)椋?,即對?yīng)包含著它的極限點(diǎn)。 在圖2-30(a)中,當(dāng),即從的左邊向其收斂時(shí),,但我們看到,即對應(yīng)并不包含極限點(diǎn),所以它不是上半連續(xù)的。
22、在圖2-30(b)中,對應(yīng)包含它的每一個(gè)序列的極限點(diǎn),特別是,因而它滿足上半連續(xù),但它不是連續(xù)的。例如,猜幣游戲中每個(gè)參與人的最優(yōu)反應(yīng)對應(yīng)就是上半連續(xù)的。對于函數(shù)而言,上半連續(xù)就等同于連續(xù)。 (a)非上半連續(xù) (b)上半連續(xù) 圖2-30 對應(yīng)的上半連續(xù) 第二步,納什均衡是不動(dòng)點(diǎn)。 根據(jù)納什均衡的定義,在給定其他參與人策略的情況下,參與人選擇一個(gè)策略以使其收益最大化,并且對每一個(gè)參與人都如此,即納什均衡是一個(gè)使每一個(gè)參與人收益最大的策略組合。針對其他參與人不同的策略,參與人都有一個(gè)最優(yōu)策略與之
23、相對應(yīng),用數(shù)學(xué)來表示就是最優(yōu)反應(yīng)函數(shù)或?qū)?yīng)。如果參與人的最優(yōu)反應(yīng)函數(shù)(對應(yīng))定義為那么個(gè)參與人的最優(yōu)反應(yīng)函數(shù)(對應(yīng))就構(gòu)成了一個(gè)方程,將其定義為,即 如果是納什均衡,它一定滿足,即納什均衡是一個(gè)不動(dòng)點(diǎn)。例如,古諾模型中的最優(yōu)反應(yīng)函數(shù)共同構(gòu)成了一個(gè)方程組,這個(gè)方程的解既是不動(dòng)點(diǎn),也是納什均衡。 第三步,完成證明。 現(xiàn)在要完成的是證明:①最優(yōu)反應(yīng)對應(yīng)的定義域?yàn)榉强胀咕o集;②為上半連續(xù)的對應(yīng)。 由于是的方程組,滿足這兩個(gè)條件,總的策略方程必然滿足這兩個(gè)條件,而根據(jù)不動(dòng)點(diǎn)定理,我們知道存在著不動(dòng)點(diǎn),使得。 (1)定義域?yàn)榉强胀咕o集。所謂有界集合就是任意畫一個(gè)圓(圓的半
24、徑可以任意大,但不能無窮大)可以把它包下。所謂閉集就是包含邊界的集合。有界閉集即為緊致集合,簡稱緊集。所謂凸集就是在集合內(nèi)任意找兩點(diǎn),連接兩點(diǎn)的直線一定位于集合中。圖2-31中的直線和三角平面顯然是有界的,同時(shí)也是閉的,即它們是緊集。同時(shí)它們也是凸集。 而圖2-32中的環(huán)是非空緊集,但卻不是凸集。 1 1 B A B A 0 圖2-31 非空凸緊集 圖2-32 圓為凸集,環(huán)為非凸集 如果博弈有個(gè)人參與人,參與人有個(gè)純策略,那么策略方程的定義域?yàn)?,它表示的重笛卡爾積,例如函數(shù),那么函數(shù)的定義域就為,即都從集合中取值。由
25、于混合策略的取值為,顯然為非空凸緊集,所以也是非空凸緊集。在古諾模型中,它的定義域雖然與上面講的有所不同,即純策略有無窮多個(gè),但策略(產(chǎn)量)的取值為,它同樣是非空凸集。這表明納什均衡真正需要的并不是“有限的”要求,而是策略空間必須為緊致集合。如果一個(gè)參與人有兩個(gè)純策略,那么所有混合策略集合(策略空間)就是滿足都大于等于零的直線。如果有三個(gè)純策略,那么所有的混合策略集合(策略空間)就是一個(gè)滿足都大于等于零的一個(gè)三角平面。如果2-31所示。 (2)最優(yōu)反應(yīng)對應(yīng)是上半連續(xù)的。根據(jù)前面的介紹,我們已經(jīng)知道混合策略空間是非空凸緊集,并且預(yù)期收益函數(shù)是混合策略的線性函數(shù),因而它是連續(xù)的和凹的(因?yàn)槠?/p>
26、好為理性),這就保證了根據(jù)最大化預(yù)期收益函數(shù)得到的最優(yōu)反應(yīng)對應(yīng)必然是上半連續(xù)和非空凸集,這在數(shù)學(xué)上被稱為最大化定理。 綜上所述,最優(yōu)反應(yīng)方程滿足不動(dòng)點(diǎn)定理的兩個(gè)條件:策略空間為非空凸緊集,最優(yōu)反應(yīng)對應(yīng)為上半連續(xù)并且是非空凸集。因而存在著不動(dòng)點(diǎn),而不動(dòng)點(diǎn)就是納什均衡。 ============================ ============================ 《知識(shí)擴(kuò)展》 一、集值映射及其半連續(xù)性 這里限于在歐氏空間中展開討論,當(dāng)然,我們也說成拓?fù)淇臻g,但在這里的上下文,讀者可以將拓?fù)淇臻g直接理解為歐氏空間。 設(shè)是一個(gè)拓?fù)淇臻g,的所有子集
27、的全體記作。即.注意, ,。 定義9.1.1 設(shè)和是兩個(gè)拓?fù)淇臻g。若對任一,確定的一個(gè)子集(己作)與之對應(yīng)。這樣得到的對應(yīng)稱作一個(gè)點(diǎn)對集映射(point-to-set mapping)或一個(gè)集值映射(set-valued mapping)。 相應(yīng)地,以往對每個(gè)確定一個(gè)的映射,稱為單值映射(single-valued mapping)。 如同單值映射的情形,我們引進(jìn)集值映射的圖像的概念。 定義9.1.2 設(shè)是一個(gè)集值映射。稱的子集 為的圖像(graph)表現(xiàn)。 下面我們建立集值映射的半連續(xù)性和連續(xù)性的概念。 定義9.1.3 設(shè)是一個(gè)集值映射
28、,。若對的與之交非空的每個(gè)開集,存在中包含的一個(gè)開集使得蘊(yùn)涵,就說在是下半連續(xù)的(lower semicontinuous)。 若對的包含的每個(gè)開集,存在中包含的一個(gè)開集使得蘊(yùn)涵,就說在是上半連續(xù)的(upper semicontinuous)。 若在既是下半連續(xù)的又是上半連續(xù)的,就說在是連續(xù)的(continuous)。 集值映射的兩種半連續(xù)性和連續(xù)性,都是單值映射的通常的連續(xù)性概念的推廣。事實(shí)上,如果把單值映射看作在定義域的每點(diǎn)取值域的一個(gè)單點(diǎn)集的集值映射,則作為集值映射的下半連續(xù)性、上半連續(xù)性和連續(xù)性,都與作為單值映射的通常的連續(xù)性吻合。 圖9.1 對于集值映射,下
29、半連續(xù)性和上半連續(xù)性是不同的。請看下面的例子。 例9.1.1 設(shè)是實(shí)數(shù)軸上的一個(gè)閉區(qū)間,集值映射由圖9.1給出。容易驗(yàn)證,在任一點(diǎn),連續(xù)性是不成問題的。即在任一點(diǎn),既是下半連續(xù)的又是上半連續(xù)的。但在,是下半連續(xù)的而不是上半連續(xù)的。 例9.1.2 仍取為閉區(qū)間,集值映射由圖9.2給出。容易驗(yàn)證,在任一點(diǎn),連續(xù)性是不成問題的,但在,是上半連續(xù)的卻不是下半連續(xù)的。 圖9.2 定義9.1.4 若在的每個(gè)點(diǎn)都是下半連續(xù)的,就說在是下半連續(xù)的。若在的每個(gè)點(diǎn)都是上半連續(xù)的,就說在是上半連續(xù)的。若在的每個(gè)點(diǎn)都是連續(xù)的,就說在是連續(xù)的。 為了下面討論的方便,我們引入集值映
30、射的逆象的概念。 定義9.1.5 設(shè)是一個(gè)集值映射,是的一個(gè)子集。稱 為的下逆象,或的相交逆;稱 為的上逆象,或的包含逆。 基于上述定義,馬上可以證明下面的定理。 【定理9.1.1】 是下半連續(xù)的充要條件是“開集的相交逆為開集”,即若是的開集,則是的開集。是上半連續(xù)的充要條件是“開集的包含逆為開集”,即若是的開集,則是的開集。 利用這個(gè)定理,易知例9.1.1的是下半連續(xù)的,因?yàn)殚_集的相交逆都是開集,但不是上半連續(xù)的,因?yàn)殚_集的包含逆不都是開集。同樣,對于例9.1.2的,因?yàn)殚_集的包含逆都是開集,所以是上半連續(xù)的,但開集的相交逆不都是開集,所以不
31、是下半連續(xù)的。 下面是一個(gè)更為方便的上半連續(xù)性判別法。為行文方便,歐氏空間的子空間也稱為歐氏空間。注意在歐氏空間中,子集作為子空間的緊致性與有界閉性等價(jià)。 【定理9.1.2】 設(shè)和是歐氏空間,并且緊致,集值映射使得對每個(gè),是的緊致子集。那么,為上半連續(xù)的充要條件是:的圖像表現(xiàn) 是中的一個(gè)閉子集。 根據(jù)這個(gè)定理,僅僅因?yàn)槔?.1.1中的映射的圖像表現(xiàn)的閉性在處遭到破壞,我們馬上知道不是上半連續(xù)的。但例9.1.2中的集值映射的圖像表現(xiàn)是中的閉集,即知是上半連續(xù)的。 二、Kakutani不動(dòng)點(diǎn)定理 我們主要關(guān)心有強(qiáng)烈應(yīng)用背景的歐氏空間凸子集到其非
32、空緊致凸子集族的集值映射。 設(shè)為歐氏空間的凸集,我們約定,記的非空緊致凸子集族為。當(dāng)然,。 定義1 設(shè)是歐氏空間的凸集,是集值映射。如果使得,就說是集值映射的一個(gè)不動(dòng)點(diǎn)。 為區(qū)別起見,常常把由定義的不動(dòng)點(diǎn)稱為Brouwer不動(dòng)點(diǎn),而把由定義的不動(dòng)點(diǎn)稱為Kakutani不動(dòng)點(diǎn)。后者是前者在集值映射情形的推廣。 Brouwer不動(dòng)點(diǎn)定理說,閉胞腔的連續(xù)自映射必有不動(dòng)點(diǎn)。 而Kakutani不動(dòng)點(diǎn)定理說,緊凸集的上半連續(xù)的集值自映射必有不動(dòng)點(diǎn)。 三、Nash定理的一般證明(重點(diǎn),講?。? 我們首先在博弈的一般表示之下將Nash均衡的概念加以推廣,使之包含混合策略的
33、情形。 設(shè)為一個(gè)有個(gè)參與人的博弈, ,每個(gè)為第個(gè)參與人的一個(gè)純策略。上的一個(gè)概率分布為第個(gè)參與人的一個(gè)混合策略,這里, , ,并且。 這時(shí), 為這個(gè)博弈的參與人分別采用混合策略時(shí),第個(gè)參與人所得到的期望支付。 為符號(hào)方便,我們?nèi)缜坝? 定義1 設(shè)博弈,,第個(gè)參與人的混合策略為,為第個(gè)參與人的期望支付。個(gè)參與人的一組混合策略稱為博弈的一個(gè)Nash均衡,如果對任意的參與人及參與人的任意混合策略,有 下面我們就證明Nash定理。 【定理1】 設(shè)博弈,這里為有限正整數(shù),每個(gè)為有限集,則博弈至少存在一個(gè)Nash均衡。 注意,這個(gè)均衡既可能是純策略
34、均衡,也可能是混合策略均衡。 證明 (0)對于任意的,記其概率空間為 每個(gè)為第個(gè)參與人的一個(gè)混合策略。顯然是一個(gè)前面講過的維標(biāo)準(zhǔn)單純形。 對以下單純形的笛卡爾積,如前引進(jìn)簡便記法: (1)記第個(gè)參與人的最佳反應(yīng)對應(yīng)為:,這里表示的所有非空緊致凸子集的集合。對任意顯然是的非空閉子集,所以是的非空緊致子集。因?yàn)槠谕Ц妒羌儾呗灾Ц逗瘮?shù)的線性組合(事實(shí)上還是凸組合),所以是的凸子集??梢?對任意是的非空緊致凸子集。這時(shí), 表示除第個(gè)參與人之外的其余個(gè)參與人采用策略時(shí),第個(gè)參與人的一個(gè)最佳混合策略。 定義總的最優(yōu)反應(yīng)對應(yīng)映射為,, 這里表示的所有子集的集合。
35、 (2)如果有Kakutani不動(dòng)點(diǎn),即有,則憐顯然就是該博弈的一個(gè)Nash均衡。 (3)利用Kakutani不動(dòng)點(diǎn)定理證明確實(shí)存在Kakutani不動(dòng)點(diǎn)。 我們來驗(yàn)證確實(shí)滿足Kakutani不動(dòng)點(diǎn)定理的條件即: 為非空緊致凸集,對任一,為的非空緊致凸子集,并且為上半連續(xù)的集值映射。 首先由于都是維標(biāo)準(zhǔn)單純形,因而是非空緊致凸的,這樣很顯然就是非空緊致凸集。 對于任意,因?yàn)楦魇欠强站o致集,所以各非空緊致,所以也是非空緊致集。 如果,那么對每個(gè),已經(jīng)達(dá)到最大。設(shè)是和的任意凸組合,那么也達(dá)到這個(gè)最大,可見。由此可見, 是凸集。 這樣可以寫作,這里同樣表示的所有非空緊致凸子集的集合。 剩下只須驗(yàn)證的上半連續(xù)性,而這只須驗(yàn)證的圖像是閉集即可。 設(shè),且,我們來證明。 由于,也就是,,即對所有,,有.由于是線性因而是連續(xù)的,當(dāng)時(shí),上述不等關(guān)系保持不變,即有對所有,, 也即 , 這就說明 證畢。 ============================ ============================ 33
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。