无码任你躁久久久久久久-激情亚洲一区国产精品-超碰97久久国产精品牛牛-久久se精品一区精品二区国产

首頁 > 文章中心 > 進化博弈理論

進化博弈理論

前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇進化博弈理論范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

進化博弈理論

進化博弈理論范文第1篇

引言

一、兩個簡單的例子

1.1 老鷹(Hawk)與鴿子(Dove)博弈

1.2 系統選擇博弈

二、進化博弈理論的產生及其發展

2.1 理性的由來及其缺陷

2.2 心理學研究成果及有限理性概念的提出

2.3 進化博弈理論的產生及其發展

三、進化博弈理論的基本內容

3.1 進化博弈理論基本模型分類

3.2 進化博弈理論基本均衡概念-----進化穩定策略

3.3 進化博弈理論基本動態概念----模仿者動態

四、進化博弈理論的應用

五、傳統方法的缺陷及進化博弈理論研究方法的現實性

5.1 新古典經濟學均衡分析法的缺陷

5.2 經典博弈理論的策略互動分析法及其缺陷

5.3 進化博弈理論局部動態分析方法的現實性

5.3.1 局部動態分析法的均衡觀

5.3.2 局部動態法的時間觀

5.3.3 局部動態法的均衡選擇觀

5.3.4 局部動態法的特殊性

六、結論

參考文獻

摘要

本文從兩個簡單的博弈例子出發,以通俗的語言全面介紹了進化博弈理論的理性基礎及其形成、發展、基本內容和部分應用,在此基礎上文章進一步比較了新古典經濟學、經典博弈理論 ①及進化博弈理論在研究方法上的不同之處,并特別強調了進化博弈理論局部動態法的均衡觀、時間觀、均衡選擇觀及方法上的特殊性。進化博弈理論的局部動態分析方法既是經濟學研究方法的一次創新又是經濟學直面現實的有力武器。

關鍵詞:沉默互動;社會互動;進化穩定策略;模仿者動態;均衡分析法;局部動態法

引言

為什么同樣一項經濟制度在某個地方對經濟發展有積極的推動作用而在另一個地方對經濟發展卻起著消極的阻礙作用?為什么能夠有效降低交易費用的中介在一些地方會出現而在另一些地方卻不能出現?為什么同樣的管理方法在一個地方顯示出高效率而在另一地方卻不具有效率?諸如此類的問題,新古典經濟學利用均衡分析法都無法給出令人滿意的答案。均衡分析法的最大缺陷是把經濟系統中參與人看作是互不聯系的單個人(僅研究單個生產者或消費者的行為),不能把其所考察的問題放在一定的環境中去,該方法完全忽略了制度環境、社會環境及人文環境等對參與人行為的影響,單純考察某個條件與結果之間的一一對應關系。因而,無法對現實中出現的諸多現象給予合理的解釋。博弈理論盡管把參與人之間行為互動關系納入到了模型之中,但依然沒能跳出新古典均衡分析法的基本框架,并且由于其對理性賦予更強的假定,使得該理論更加脫離現實。進化博弈理論則一反常規,從一種全新的視角來考察經濟及社會問題,它所提供的局部動態研究方法是從更現實的社會人出發,把其所考察的問題都置于一定的環境中進行更全面的分析,因而,其結論更接近于現實且具有較強的說服力。進化博弈理論屬于經濟學的前沿理論,該理論從其理論框架建立到現在僅僅只有近三十年的歷史,但其在經濟學、社會學、生態學等領域卻得到了廣泛的應用,近年來已經成為主流經濟的研究方法之一。在我國由于歷史原因,對經濟學的研究起步較晚,特別對進化博弈這樣的前沿理論更是知者甚少,本文的主要目的是以通俗的語言介紹進化博弈理論的相關內容及其應用,讓讀者對該理論有一個全面的了解。

本文的結構如下:第一部分給出進化博弈理論的兩個典型的例子;第二部分對進化博弈理論的產生及其發展進行闡述;第三部分對進化博弈理論的基本內容進行簡要的介紹;第四部分概述進化博弈理論的有關應用;第五部分論述傳統的經濟學研究方法的缺陷及進化博弈理論研究方法的現實性;第六部分對進化博弈理論的發展及理論前景進行簡要的說明。

一、兩個簡單的例子

為了下文說明的方便,本文先給出進化博弈理論中兩個具有代表性的例子,在此基礎上再進一步給出該理論的基本內容及其研究方法的基本特點。

1.1 老鷹(Hawk)與鴿子(Dove)博弈

假定一個生態環境中有老鷹與鴿子兩種動物,它們為了生存需要爭奪有限的資源(如食物或生存空間等)而競爭。老鷹一般比較兇悍,必要時在斗爭中直到重傷。鴿子一般比較溫馴,競爭時在強敵面前常常退縮。競爭中獲勝者得到了生存資源就可以更好地繁衍后代,重傷者則不利于其后代生長,即會減少其后代的數量。如果群體中老鷹與鴿子相遇并競爭資源,那么老鷹就會輕而易舉地獲得全部資源,而鴿子由于害怕強敵退出爭奪,從而不能獲得任何資源(當然不會受傷);如果群體中兩個鴿子相遇并競爭生存資源,由于它們均膽小怕事不愿意戰斗,結果平分資源;如果群體中兩個老鷹相遇并競爭有限的生存資源,由于它們都非常勇猛而相互殘殺,直到雙方受到重傷而精疲力竭,結果雖然雙方都獲得部分生存資源但損失慘重,入不敷出。假定競爭中得到全部資源為50個單位(該數字也可以表示為生物的適應度、繁殖成活率或后代數量);得不到資源則表示其適應度為零;雙方重傷則用來表示。于是老鷹、鴿子兩種動物進行的資源競爭可以用一個對稱博弈來描述,博弈的支付矩陣如下:

操作依賴于該群體的初始狀態。如果初始時,該宿舍有多于4人使用操作系統,那么該宿舍所有學生最終都會使用該操作系統;否則所有學生最終會使用操作系統。

二、進化博弈理論的產生及其發展

進化博弈理論是經濟學研究方法的一次創新,該理論從否定傳統理論賴以成立的基礎----理性人假定出發而建立起來一個新的分析框架,它結合了生態學、社會學、心理學及經濟學的最新發展成果,從有限理性的社會人出發來分析參與人的資源配置行為。

2.1 理性的由來及其缺陷

經濟學自從古希臘哲學中分離出來并成為一門系統的學問,是在亞當•斯密1776年發表《國富論》之后。以斯密為代表的古典經濟學關注的核心是資源的稀缺程度如何能被人類經濟活動所減少,他們關注的重點不是資源配置問題而是國民財富的增長及國別差異的原因。1890年馬歇爾《經濟學原理》的出版,標志著新古典經濟學的成形,馬歇爾之后,新古典經濟學關注的核心逐漸轉向在給定稀缺程度下資源的最優配置問題。稀缺資源的配置是需要人的參與,也就是說經濟學研究的問題演變為關于經濟中參與人如何把稀缺的資源配置到效率最高地方去的問題,強調個體行為在資源配置中的作用。經濟中參與人的決策行為是通過高度復雜的思維活動作出的,為了更好地從微觀個體行為來解釋資源配置問題,新古典經濟學借用了哲學中“理性”概念對復雜的人類行為過程進行了抽象的假定。然而,理性一詞用于經濟學時卻對其含義的理解與哲學中對其含義的理解已經有了明顯的區別。哲學中的理性是指人類所特有的用以探索自然和社會奧秘的認知能力,當代偉大的哲學家康德在其著作《純理性批判》一書中指出,人類理性即認知能力并不是萬能的,而是有限的。經濟學中的理性則是指一種行為方式,具體地說即是經濟中參與人對其所處世界的各種狀態及不同狀態對自己支付的意義都具有完全信息,并且在既定的條件下每個參與人都具有選擇使自己獲得最大效用或最大利潤的能力。

經濟學家認為理性是至高無上的,人們憑借理性就可以完全地認識自然與社會。經濟學中對理性的含義經過這樣的處理以后,就使得經濟學能夠充分運用數學理論發展的成果來進行分析。為了應用數學工具并更好地處理經濟問題,傳統經濟學家們從偏好,信念及理性三個方面來界定經濟主體的特征,其中信念就是個體認為不同結果將會出現的基于個體所獲信息之上的條件概率。偏好則是基于不同結果的信念之上的序。理性是根據上述偏好及信念,個體獲得最優決策的程度以及個體根據已經獲得的信息來修正其信念的能力。這三個特征使得經濟學研究的對象由現實人轉向了理想化的對象,經濟學越來越偏離了現實。

由理性概念而引致的缺陷首先表現在理性人具有無限的信息收集及處理能力的均衡觀,認為經濟系統常常處于均衡狀態,非均衡只是一種暫時的現象,當受到外生因素擾動而使系統偏離均衡狀態時,系統會以線性的方式回歸均衡,這種機械式線性反應的均衡觀來源于牛頓力學,由此而得出的比較靜態分析法完全忽視了系統受到非線性擾動及連續因素的影響。其次表現在由全知全能的理性人而引致的均衡跳躍觀,認為經濟系統達到均衡或者從一個均衡到另一個均衡是不需要時間的,認為時間是可逆的,即經濟變量與物理學的變量一樣,只要條件相同系統的均衡也就相同,市場和經濟對于過去的記憶是短暫的或者是沒有的。這種應用經典牛頓力學分析方法來分析高度復雜的參與人經濟行為使得其預測效果大打折扣。最后表現在其比較靜態分析方法上,傳統經濟學的最基本分析方法----比較靜態分析法賴以成立的基礎是假定經濟系統只受到外界一個個相互獨立、互不重疊的沖擊的影響,或者當一個因素的影響消除之后,下一因素才開始對經濟系統產生影響。我們知道現實世界是普遍聯系的,各種因素之間不可能相互獨立,系統中任何一個因素的變動都會引起其他因素的變動,這些因素之間相互作用的時間可能很短也可能很長,各因素對最終目標會產生不同程度的影響。比較靜態法卻只見局部不見整體,企圖通過比較不同均衡來找出系統達到均衡的條件,因此得不出符合現實的結論,其研究方法上的局限性大大降低了其理論的現實意義。

2.2 心理學研究成果及有限理性概念的提出

隨著經濟學家對理論研究的深入,特別近來實驗經濟學的迅速發展,主流經濟學賴以成立的基礎“理性人”假定及其基本的比較靜態均衡分析法越來越受到了人們的質疑。相繼出現了許多其他的研究方法,其中在經濟學中影響最大的就是心理學的研究方法。心理學應用于經濟分析有著非常曲折的歷史。事實上,斯密、馬歇爾、庇古、費雪爾和凱恩斯等一批古典經濟學家都仔細地分析了偏好和信念的心理學基礎。但從1940’s開始,一方面受到薩繆爾森及希克斯等新一派基于理性假定經濟學家的影響,心理分析在經濟學中的地位慢慢地被降低了;另一方面理性模型也遇到了許多如Allais(1952)悖論等難以給出合理解釋的經濟現象。于是1960’s開始,許多微觀經濟學家再次運用心理學研究方法來解釋現實中的異常現象,宏觀經濟學也把經驗法則和適應性預期納入到其模型之中,正是在這一時期心理學家Simon(1957)提出了其著名的“有限理性”概念。然而,1970’s初隨著Robert Lucas等人提出的理性預期理論、Selten、Kreps等倡導的強調正確信念及貝葉斯修正的博弈理論及Stiglitz、Spence等研究的信息經濟學理論相繼成為主流經濟學的一部分,經濟學界再一次掀起了排除滲透在經濟學領域中心理學研究方法的熱潮,心理的研究方法在經濟學界幾乎無立足之地,嚴格理性假定席卷整個經濟學界。行為經濟學的發起者Amos Tversky在經濟學界根本找不到志趣相投者。1970’s末期,隨著心理學家Amos Tversky與Kahneman合作發表了一系列應用心理分析方法來研究經濟學問題的原創性文章,如1974年他們在Science發表的Judgment under uncertainty: Heuristics and biases,1979年他們合作在Econometrica發表Prospect theory: An analysis of decision under risk,慢慢消除了經濟學界中存在的對心理學分析方法的偏見,此后應用心理分析方法來解釋經濟現象的文獻見諸于各種經濟學期刊之中,心理分析方法也漸漸地成為了主流經濟學的研究方法之一。

進入1980’s,隨著經典博弈理論、生態理論及心理學理論研究的深入發展,特別是心理學家西蒙把其在心理學領域研究的成果直接應用經濟分析并因此獲得了諾貝爾經濟學獎,極大地激勵著經濟及社會學家從現實人行為出發來解釋經濟及社會現象。心理學研究表明人類認知過程首先表現為人們通過一種“感知秩序”進行學習活動,并形成分散的非同質的知識,其中“感知秩序”是指人的理解力、知識和人類行動之間的關系;其次表現為個體通過學習所達到的理性程度的有限性,組織學習個體學習行為的整合而形成的多層次“理性結構”,個體理性便會在一個累積性的組織或制度環境中得到塑造和提高并發揮作用,在這個過程中,個體學習行為總會受到組織、習慣和文化等制度性的限制和影響。西蒙認為人類并不是完全理性而是有限理性的,因為人類認知能力有著心理的臨界極限,人類進行推理活動需要消耗大量的能量,推理也是一種相對稀缺的資源,另外決策者決策時需要大量的信息,而這些信息是不可能免費獲得的,獲得決策所需要的信息是需要大量成本的。考慮到參與人有限的知識水平、有限的推理能力、有限的信息收集及處理能力,經濟主體的決策行為并非總是最大化的結果,其決策受到參與人所處的社會環境、過去的經驗、日常慣例及其他人相似情形下的行為選擇等因素的影響。在有限理性條件下,由于參與人無法免費獲得決策所需要的全部信息,并且參與人即使獲得了決策所需要的全部信息也可能由于有限的計算能力而無法得出最優決策。因此,參與人只能采取模仿、學習等簡單的直觀決策方法或一些固定的常規來進行決策。人類的決策結果受到復雜的認知過程的影響,不同的人或者同一個人在不同時間即使給出相同的條件也可能會得出不同的決策結果,即決策結果受到認知過程的路徑影響。

2002年諾貝爾經濟學獎得主之一心理學家丹尼爾·卡內曼(Daniel Kahneman)將源于心理學的綜合洞察力應用于研究在不確定條件下參與人的決策過程及行為結果并展示了人為決策是如何異于標準經濟理論預測的結果。在1979年,他與有著深厚數學及哲學背景的心理學家特韋爾斯基(Tversky)提出了震撼經濟學界的“前景理論”(Prospect theory)。他們的發現激勵了新一代經濟學研究人員運用認知心理學來研究經濟學,使經濟學的理論更加豐富。一個理論獲得諾貝爾經濟學獎不僅是對獲獎者過去成就的肯定,更主要說明了獲獎理論將會成為主流經濟學未來的發展方向。2002年諾貝爾經濟學獎授予給丹尼爾·卡內曼標志著經濟學的研究對象從傳統的“經濟人”轉向現實的“社會人”,經濟學直面現實。如何從有限理性出發來研究參與人的行為,許多經濟學家對之進行了廣泛而深入的研究并提出了許多理論,在這些理論之中影響最大且受到了經濟學界普遍接受的理論即進化博弈理論。

2.3 進化博弈理論的產生及其發展

進化博弈理論源于對生態現象的解釋,1960年代生態學家Lewontin就開始運用進化博弈理論的思想來研究生態問題。生態學家從動植物進化的研究中發現,動植物進化結果在多數情況下都可以用博弈論的納什均衡概念來解釋。然而,博弈論是研究完全理性的人類互動行為時提出來的,為什么能夠解釋根本無理性可言的動植物的進化現象呢?我們知道動植物的進化遵循達爾文“優勝劣汰”生物進化理論,生態演化的結果卻能夠利用博弈理論來給予合理的解釋,這種巧合意味著我們可以去掉經典博弈理論中理性人假定的要求。另外,1960年代生態學理論研究取得突破性的進展,非合作博弈理論研究成果也不斷涌現并日趨成熟,進化博弈理論具備了產生的現實及理論基礎。

進化博弈理論應用于研究經濟學問題在學術界曾經引起極大的爭議,爭論的焦點在于理性假定。當時由于理性概念在經濟學界已經根深蒂固。多數人認為利用研究生態演化的進化博弈理論來研究參與人的行為是不合適的。因為動植物行為是完全由其基因所決定的,而經濟問題則涉及到具有邏輯思維及學習、模仿能力的理性參與人的行為,因此,借助于進化博弈理論來研究遠比動植物復雜的人類行為顯然是行不通的。但隨著心理學研究的發展及有限理性概念的提出,越來越多的經濟學家應用進化博弈理論來解釋經濟現象并獲得了巨大的成功,利用進化博弈理論來研究并解釋經濟現象的文獻大量出現于各種經濟學期刊了。盡管如此,利用進化博弈理論來解釋經濟現象還是需要對該理論的基本分析框架作出相應的調整。如果去掉參與人偏好、信念及理性假定等條件,那么參與人是如何作出決策的呢?進化博弈理論在處理有限理性參與人決策問題時,常常假定參與人遵循某種比貝葉斯法則更簡單的行為規則,這種行為規則應該告訴如何采取行動及如何根據經驗來改變行為選擇,這樣參與人只要知道什么會發生,而不必知道為什么會發生。

1970年代,生態學家Maynard Smith and Price(1973)結合生物進化論與經典博弈理論在研究生態演化現象的基礎上而提出了進化博弈理論的基本均衡概念----進化穩定策略(Evolutionarily stable stragegy ESS),目前學術界普遍認為進化穩定策略概念的提出標志著進化博弈理論的誕生。此后,生態學家Taylor and Jonker(1978)在考察生態演化現象時首次提出了進化博弈理論的基本動態概念----模仿者動態(Replicator Dynamics)。至此,進化博弈理論有了明確的研究目標。

1980年代以后,隨著新古典經濟學及博弈論固有的缺陷逐漸被人們所認識,有限理性概念得到了學術界的普遍認可,加之進化博弈理論在解釋生態現象時獲得的巨大成功,特別是經濟學界于1992年在康奈爾大學召開的進化博弈理論學術會議,正式確立了該理論的學術地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等經濟學家從不同的角度對傳統的進化博弈理論分析框架進行拓展,并使之逐漸轉化為描述經濟行為的理論。目前,進化博弈理論的基本理論體系雖然已經形成但還是相當粗糙。因此,它仍然處于不斷發展和完善的階段,但該理論提供了比傳統理論更具現實性且能夠更準確地解釋并預測參與人行為的研究方法,從而得到了越來越多的經濟學家、社會學家、生態學家的重視,我們有理由相信該理論成為主流經濟學的一部分已經為時不遠。

三、進化博弈理論的基本內容

進化博弈理論結合經典博弈理論及生態理論研究成果,并以有限理性的參與人群體為研究對象,利用動態分析方法把影響參與人行為的各種因素納入其模型之中,并以系統論的觀點來考察群體行為的演化趨勢。

進化生態學與博弈論的結合至少已有三十幾年的歷史,初看起來使人覺得奇怪,因為博弈論常常假定參與人是完全理性的,而基因和其他的演化載體常常被假定是以一種完全機械的方式運動。然而一旦用參與人群體來代替博弈論中的參與者個人,用群體中選擇不同純策略的個體占群體中個體總數的百分比來代替博弈論中的混合策略,那么這兩種理論就達到了形式上的統一。盡管這兩種理論在形式上達到了統一,但進化博弈理論與經典博弈理論還是存在本質區別。在進化博弈理論中每個參與人都是隨機地從群體中抽取并進行重復、匿名博弈,他們沒有特定的博弈對手 ④。在這種情況下,參與人既可以通過自己的經驗直接獲得決策信息,也可以通過觀察在相似環境中其他參與人的決策并模仿而間接地獲得決策信息,還可以通過觀察博弈的歷史而從群體分布中獲得決策信息。對參與人來說,觀察群體行為的歷史即估算群體分布是非常重要的,首先,群體分布包含了對手如何選擇策略的信息。其次,通過觀察群體分布也有助于參與人知道什么是好的策略什么是不好的策略。參與人常常會模仿好的策略⑤ 而不好的策略則會在進化過程中淘汰,模仿是學習過程中的一個重要組成部分,成功的行為不僅以說教的形式傳遞下來,而且也容易被模仿。參與人由于受到理性的約束而其行為是幼稚的(Naive),其決策不是通過迅速的最優化計算得到,而是需要經歷一個適應性的調整過程,在此過程中參與人會受到其所處環境中各種確定性或隨機性因素影響。因此,系統均衡是達到均衡過程的函數,要更準確地描述參與人行為就必須考察經濟系統的動態調整過程,動態均衡概念及動態模型在進化博弈理論中占有相當重要的地位。

3.1 進化博弈理論基本模型分類

進化博弈理論的基本模型按其所考察的群體數目可分為單群體模型(Monomorphic Population Model)與多群體模型(Polymorphic Populations Model)。單群體模型直接來源生態學的研究,在研究生態現象時,生態學家常常把同一個生態環境中所有種群看作一個大群體,由于生物的行為是由其基因唯一確定的,因而可以把生態環境中每一個種群都程式化為一個特定的純策略。經過這樣處理以后,整個群體就相當于一個選擇不同純策略(純策略集的數目就相當于群體中的種群數)的個體。群體中隨機抽取的個體兩兩進行的都是對稱博弈,有些文獻中稱這類模型為對稱模型(Symmetry model)。嚴格地說,單群體時個體進行的并不是真正意義上的博弈,博弈是在個體與群體分布所代表的虛擬參與人之間進行。如第一部分的老鷹----鴿子博弈,該生態環境中有兩個種群老鷹與鴿子,它們代表兩個不同的純策略,用進化方法進行處理時認為該生態群體中每個個體都有兩種可供選擇策略即老鷹策略與鴿子策略,此時的博弈并不是在隨機抽取的兩個個體之間進行,而是每個個體都觀察群體狀態(選擇老鷹策略與鴿子策略個體數在群體中所占的比例),給定此狀態它就可以計算自己選擇不同策略所得的期望支付(嚴格地說這并不是期望支付,但為了說明的方便本文仍然借用該概念)進而確定選擇哪一個策略不選擇哪一個策略,對物種而言這就意味著種群數量的增加或減少。

多群體模型是由Selten (1980)首次提出并進行研究的,他在傳統單群體生態進化模型中通過引入角色限制行為(Role Conditioned Behavior)而把對稱模型變為了非對稱模型。在非對稱博弈個體之間有角色區分,此時可以從大群體中區分出不同的小群體,群體中隨機抽取的個體之間進行真正意義上的兩兩配對重復、匿名非對稱博弈,有時又稱之為非對稱模型(Asymmetry model)。如果我們把系統選擇博弈中的宿舍變成學校(整個學校相當于一個大群體)而把十個人變成十個班(每一個班看成是一個小群體,且同一班的同學無角色區分即與單群體情形一樣),每個班的學生都有多種選擇,此時該校學生所進行的計算機系統選擇博弈就是非對稱博弈。非對稱博弈模型并不是對單群體博弈模型的簡單改進,由單群體到多群體涉及到一系列的如均衡及穩定性等問題的變化。Selten(1980)證明了“在多群體博弈中進化穩定均衡都是嚴格納什均衡⑥ ”的結論,這就說明在多群體博弈中,傳統的進化穩定均衡概念就顯示出其局限性了。同時,在模仿者動態下,同一博弈在單群體與多群體時也會有不同的進化穩定均衡。

按照群體在演化過程中所受到的影響因素是確定性的還是隨機性的,進化博弈模型可分為確定性動態模型和隨機性動態模型。確定性模型一般比較簡單并且能夠較好地描述系統的演化趨勢,因而,理論界對之進行較多的研究。隨機性模型需要考慮許多隨機因素對動態系統的影響,一般比較復雜,但該類模型卻能夠更準確地描述系統的行為,近年來理論界對之也進行廣泛的探討[對隨機動態的詳細討論可以參閱這方面的經典文獻Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 進化博弈理論基本均衡概念-----進化穩定策略

進化博弈理論的基本均衡概念---進化穩定策略⑦ [文獻2、5有詳細介紹]是由Maynard Smith and Price(1973)及Maynard Smith(1974)在研究生態演化問題時提出來的,其直觀思想是:如果一個群體(原群體)的行為模式能夠消除任何小的突變群體,那么這種行為模式一定能夠獲得比突變群體高的支付,隨著時間的演化突變者群體最后會從原群體中消失,原群體所選擇的策略就是進化穩定策略。系統選擇進化穩定策略時所處的狀態即是進化穩定狀態,此時的均衡就是進化穩定均衡。下面給出Maynard Smith and Price(1973)對進化穩定策略的定義(此后本文稱之為原初定義),用符號表示如下:

說是進化穩定策略,如果,存在一個<,不等式對任意都成立。其中A是群體中個體博弈時的支付矩陣;y表示突變策略;是一個與突變策略y有關的常數,稱之為侵入邊界(Invasion Barriers);表示選擇進化穩定策略群體與選擇突變策略群體所組成的混合群體。實際上相當于該吸引子對應吸引域的半徑,也就說進化穩定策略考察的是系統落于該均衡的吸引域范圍之內的動態性質,而落于吸引域范圍之外是不考慮的,所以說它只能夠描述系統的局部動態性質。至于系統是如何進入吸引域的原初的進化穩定策略定義所沒有給予足夠的重視。

要準確地理解進化穩定策略概念就必須正確理解突變者和侵入邊界的含義。我們可借助于前面的兩個例子來理解。在老鷹、鴿子博弈中,當該生態環境中只有老鷹(或只有鴿子)時,這時系統已經處于均衡狀態,但它們都是不穩定的均衡,因為這兩個均衡都可以被突變者侵入。開始時,假定該生態環境處于老鷹均衡,如果由于某種原因而進入鴿子時,那么隨著時間的演化,整個生態系統最終就會穩定于一半為老鷹一半為鴿子的狀態,即混合策略納什均衡是進化穩定的。這說明該博弈中兩個純策略納什均衡是不穩定的。因為,當系統處于純策略所表示的狀態時,只要存在突變者系統就會離開這種狀態,所以它們都不是進化穩定的。相反混合策略納什均衡卻不一樣,即當系統處于一半是老鷹一半是鴿子時,如果由于某種因素使得系統偏離該狀態,那么系統會自動恢復到原來狀態。另外,在系統選擇博弈中突變者、侵入邊界就更為明顯,所謂突變者即是指選擇進化穩定策略以外的策略者,且侵入邊界與不同的均衡有關。該博弈有兩個純策略納什均衡和一個混合策略納什均衡(),前一個均衡所對應的侵入邊界就是,也就是說如果選擇操作系統的學生數占群體總數的比例大于(即學生數大于4),那么選擇操作系統的突變者就不可能侵入到該群體中,如果選擇操作系統的學生數占群體總的比例小于(即學生數小于4),那么選擇操作系統的突變者就會侵入到該群體中而原來選擇操作系統的學生會轉而學習操作系統。

最初進化穩定策略定義有比較苛刻的條件限制,如單群體、群體中個體數目無限大、系統只受到不連續且互不重疊沖擊的影響等。這些條件大大地限制該定義的應用,隨著學術界對進化博弈理論研究的深入,許多理論家們從不同的角度對最初定義進行了拓展,如Selten 1980首次給出了適應于描述多群體均衡的定義;Schaffer 1988首次給出了適應于描述有限規模群體的均衡定義;Foster and Young(1990)首次給出了適應于描述連續隨機系統的均衡定義等等(有關對進化穩定策略進行拓展的討論見文獻[5])。最初定義是在解釋生態現象時提出來的,如果進行經濟分析,時需要進行相應的改變。在分析生態現象時,把每一個種群的行為都程式化為一個策略,因此進化的結果將會是突變種群的消失(消失的原因在于生物的行為是由其遺傳基因唯一確定的)。如果用于經濟分析,那么進化的結果將是那些選擇突變策略的個體最終會改變策略而選擇進化穩定策略(因為人類可以通過學習、模仿等來改變自己所選擇的策略)。

經典博弈理論中的核心概念納什均衡即是指一種策略組合,在該策略組合下任何個人單獨偏離都不會變得比不偏離好。納什均衡是一個靜態概念,不能描述系統的動態性質,用數學語言來說它是動態系統的不動點,納什的成功就是在于他應用拓撲學的不動點定理證明了納什均衡的存在性。進化穩定策略必定是納什均衡策略,它是納什均衡的精練,文獻[3]對此有詳細的介紹。在進化穩定策略的定義中引入突變者及侵入邊界使之能夠更好地描述系統的局部動態性質。第一部分的兩個例子中,按照納什均衡的概念是無法得知兩個系統最終會選擇哪一個均衡,但利用進化穩定策略卻可以說明系統最終會穩定哪一個均衡并可以分析系統達到不同均衡的條件,在某種程度上,較好地解決了多重均衡選擇問題。

3.3 進化博弈理論基本動態概念----模仿者動態

進化博弈理論來源于生態學的研究,該理論基本上從“優勝劣汰”的進化論觀點來看待群體行為的調整過程。一般的進化過程都包括兩個可能的行為演化機制:選擇機制(Selection Mechanism)和突變機制(Mutation mechanism)。選擇機制是指本期中能夠獲得較高支付的策略,在下期被更多參與者選擇;突變是指參與者以隨機(無目的性)的方式選擇策略,因此突變策略可能獲得較高支付也可能獲得較低支付,突變一般很少發生。新的突變也必須經過選擇,并且只有獲得較高支付的策略才能生存(Survive)下來。進化博弈理論需要解決的關鍵問題就是如何描述群體行為的這種選擇機制和突變機制。博弈理論家對群體行為調整過程進行了廣泛而深入的研究,由于他們考慮問題的角度不同,對群體行為調整過程的研究重點也就不同,因而提出了不同的動態模型,如Weibull(1995) 提出的模仿動態(Imitation Dynamics)模型,認為人們常常模仿其他人的行為尤其是能夠產生較高支付的行為;Börgers and Sarin(1995,1997)等提出并應用強化動態(Reinforcement Dynamics)來研究現實中參與人的學習過程;Skyrms (1986) 引入了意向動態(Deliberational Dynamics)模型對哲學中的理性問題進行了討論;Swinkels(1993)提出了近似調整動態(Myopic Adjustment Dynamics);Borgers and Sarin(1995)提出了刺激—反應動態(Stimulus-Response Dynamics)等等。到目前為止,在進化博弈理論中應用得最多的還是由Taylor and Jonker(1978)在對生態現象進行解釋時首次提出描述單群體動態調整過程的模仿者動態(Replicator Dynamics)。所謂模仿者動態是指使用某一策略人數的增長率等于使用該策略時所得的支付與平均支付之差。下面就給出Taylor and Jonker(1978)提出的模仿者動態的微分形式:

化的而且因素之間的互動作用也是需要時間的。因此,均衡只是一種暫時現象或者在多數情況下,系統根本不可能達到的現象,要更準確地考察參與人的行為就必須運用系統論的觀點,把行為互動性、因素互動性及時間因素納入到其模型之中。

5.2 經典博弈理論的策略互動分析法及其缺陷

考慮到新古典經濟學沒有把參與人行為之間的互動關系納入到其模型之中,經典博弈理論則在理性人假定的基礎上把參與人行為的互動關系納入到其模型之中進一步考察了參與人的決策問題。在我國,對人類互動行為的研究至少可以追溯到三國時期田賽馬的故事,但作為一種正式理論提出來,一般認為是始于馮·諾意曼和摩根斯藤(Von Neumann and O. Morgenstern, 1944)出版的《博弈論與經濟行為》一書,直到納什(Nash 1950)在研究非合作博弈的基礎上提出著名的納什均衡(Nash Equilibrium)概念才使得博弈論成為一門完整的理論。經過近五十年的發展,終于在1994年,三位杰出的博弈論大師:納什(John F. Nash)、澤爾藤(Rechard Selten)和海薩尼(John C. Harsanyi)獲得了經濟學的最高榮譽——諾貝爾經濟學獎,在全球經濟學界再次掀起了對博弈論的研究熱潮。經典博弈論為社會科學提供了一個新的研究視角,使我們能夠以全新的方法來處理各種沖突與合作的問題。博弈論作為一種理論工具,其應用相當廣泛。在信息經濟學中得到了充分的應用,1996年諾獎得主Mirrlees等、2001年諾獎得主Akerlof等都對信息經濟學研究作出了卓越的貢獻。這充分說明了博弈論在經濟學的地位可見一斑。

經典博弈理論的核心概念----納什均衡就是由普林斯頓大學數學家納什在研究非合作博弈時提出來的。納什均衡即是指給定其他參與人選擇的情況下,每一個人單獨偏離均衡都不會變得比不偏離好,顯然納什均衡是一個靜態均衡概念。經典博弈理論盡管把參與人的互動行為引入到其模型之中,并認為現實中參與人不是孤立地作出自己的決策,每一個參與人的決策不僅依賴于其自身所面臨的條件及其所擁有的信息,而且也依賴于其他參與人的決策選擇。但該理論卻面臨著其自身無法克服的缺點。首先,博弈論中的互動是一種“沉默互動⑨ ”,這種互動不允許參與人之間存在任何形式的交流,即假定參與人都是一個個只會理性計算的孤立經濟人而非社會人,一旦引入社會互動,許多博弈都無法進行分析,也就是說經典博弈理論中的互動并不“社會互動”而是孤立的“沉默互動”。其次,博弈論的基本均衡概念納什均衡要求博弈各方都是理性的,并且理性是共同知識,博弈時如果某一方選擇了非理,那么博弈就無法進行下去。特別地該理論在利用后向歸納法(Backward Induction)對納什均衡進行精練時,不但要求參與人完全理性,而且還要求參與人的行為滿足序貫理性(Sequential Rationality)要求。這一比理性更強的要求使得博弈論更加遠離現實人。再次,在處理參與人所面臨的不確定性時,不僅要求各參與人知道世界的各種狀態,而且要求參與人知道每一種狀態所出現的概率,并且給定一個先念信念,當出現任何新信息時,每個參與人都能夠應用貝葉斯法則修正自己的先念信念,也就是說參與人不但具有很強的計算、推理能力,而且能夠在一個大的狀態空間上應用貝葉斯法則解決相當復雜的問題。現實中多數情況下,參與人并不都具有這種計算、推理能力。最后,博弈論碰到了其最棘手的問題就是多重均衡的處理,當博弈出現多重均衡特別是多重嚴格納什均衡時,盡管許多理論家提出了一些方法(Selten(1965)提出的子博弈精煉納什均衡概念,Selten(1975)提出的顫抖手精練納什均衡,Kerps—wilson(1982)提出的序貫均衡,Schelling(1960)提出的聚點均衡等)來處理多重均衡問題,但始終沒能獲得一致認可的結論。

與新古典經濟學相比,經典博弈理論雖然在其模型中納入了行為的“沉默互動”關系,但該理論給出的研究方法仍然沒能跳出新古典經濟學的均衡分析框架,這種只注重結果而忽略達到結果的過程的分析方法依然把對經濟系統的影響因素都看作為一個個孤立因素,依然認為影響因素與決策結果是一一對應的關系,依然沒能把參與人所處社會環境等因素納入到其模型之中,因而不能準確地描述現實中人的決策行為,其結論也僅僅具有理論意義而缺乏政策含義。

5.3 進化博弈理論局部動態分析方法的現實性

進化博弈理論利用達爾文“優勝劣汰”的生物進化論、經典博弈理論并結合心理學的研究成果,從西蒙提出有限理性(Bounded Rationality)的參與人群體出發,通過對群體行為的研究進一步得出參與人個體的行為。進化博弈理論跨越了完全理性的“經濟人”與有限理性的“社會人”的鴻溝,實現了經濟學研究方法革命性的突破。與傳統均衡分析法相比,進化博弈理論的局部動態分析方法在以下幾個方面獨具特色。

5.3.1 局部動態分析法的均衡觀

傳統的均衡分析方法認為完全理性參與人能夠對環境的任何變化作出迅速的最優反應,因而,經濟系統是常常處于均衡狀態的,分析參與人的行為只需要研究均衡結果,并以此來預測經濟人的行為,通過比較不同均衡結果來尋找系統達到均衡的條件。這種處理方法為了數學上處理的方便而撇開現實中“因素互動”而分別考察單個因素對均衡的影響,使得理論更加缺乏現實基礎。進化博弈理論則完全摒棄傳統理論中非現實的“理性人”假定,直接從有限理性參與人群體出發而提出的一種全新的研究方法----局部動態法。局部動態法把經濟系統達到均衡結果的過程納入到其模型之中,認為經濟系統達到均衡需要一個長期的漸進過程,均衡結果依賴于達到均衡的過程,也就是說任何一個結果都是路徑依賴的,它與混沌經濟學完全動態的研究方法具有某種程度的相似之處。

5.3.2 局部動態法的時間觀

傳統的均衡分析法并沒有納入因素互動關系并且理性計算是不需要時間的,所以得出經濟系統常常是均衡的結論。進化博弈理論的局部動態法一個顯著特征就是把參與人的決策過程時間及因素互動的時間納入到其基本模型之中,強調系統達到均衡的過程,并認為經濟系統由于受到各種互動行為及互動因素的影響,有些系統達到均衡可能只需要很短的時間,有些系統達到均衡可能需要很長的時間,有些系統可能無法達到均衡。時間因素對經濟學研究有著非常重要的意義,如均衡分析法無法考慮宏觀經濟政策中“時滯”使得許多實施時有效的政策在發生作用時卻出現了與原意相反的結果。時間是度量政策效率的一個很重要的因素,如果不考慮時間因素有些政策可能很有效率,但納入時間因素,一些需要太長時間才能使系統達到意愿均衡的政策可能根本就沒有效率。進化博弈理論把時間納入到模型分析中并充分應用數學中的相圖來描述經濟系統達到均衡的路徑,這樣有利于決策者控制經濟系統使之朝向既定的目標前進,也有利于決策者尋找能夠最大限度地促進系統向意愿均衡轉化的因素,使系統盡快達到有效率的均衡。

5.3.3 局部動態法的均衡選擇觀

新古典經濟學研究的邏輯有理性就有均衡,然后在既定均衡下通過對不同均衡的比較來尋找系統達到不同均衡的條件,即比較靜態法,最后結合條件找出希望達到的均衡,因此,該理論不存在真正意義的均衡選擇問題。經典博弈理論提供的分析方法在多數情況下都存在其自身所無法處理的多重均衡問題。如老鷹與鴿子博弈及系統選擇博弈中多重均衡問題。進化博弈理論的局部動態法引入突變因素就能夠較好地解決了多重均衡的選擇問題,在老鷹與鴿子博弈中,盡管全是老鷹(全是鴿子)都是均衡的,但這兩個均衡都極不穩定即都不是進化穩定均衡,一旦有鴿子(老鷹)突變者進入該系統就會使系統偏離,隨著時間的推移而使得系統趨向于混合策略進化穩定均衡即一半鴿子一半老鷹(該均衡是一個全局吸引子);在系統選擇博弈中經典博弈理論無法解釋系統最終會趨于哪一個均衡,局部動態法引入了突變因素就能夠很好地解決了均衡選擇問題,即系統最終會趨于哪一個均衡依賴于系統的初始狀態即路徑依賴。進化博弈理論的基本均衡概念----進化穩定均衡描述的是當經濟系統一旦進入到某一均衡的吸引域內時,系統就會對其他的突變策略具有一定程度(即在突變邊界內)的抵抗力。

5.3.4 局部動態法的特殊性

新古典經濟學與經典博弈理論均衡分析法都是以單個消費者、單個生產者、單個市場為研究對象來考察參與人的最優決策行為,并由此研究整個社會的資源配置問題。然而它們卻碰到了如何由個體行為轉化到群體行為的困難,因為這種轉化過程涉及到各種互動因素的影響。一個明顯的例子是經典博弈理論中囚徒困境博弈,在該博弈中兩個囚徒都從個體理性出發,但得到了集體非理性均衡的結論。也就是說,均衡分析法根本無法實現從個體行為向集體行為的過渡,在此框架內尋找宏觀經濟的微觀基礎的困難是非常大的。進化博弈理論的局部動態法則從人的社會性出發,利用系統論的處理方法來看待參與人的決策行為。該理論直接以參與人的群體為其研究的邏輯起點,在考慮到影響參與人行為的社會因素、文化因素、民族習俗及個體生活習慣等因素的基礎上進一步考察群體中有限理性個體的行為互動關系,很巧妙地避開由個體行為向集體行為轉化問題,因而能夠更加真實地反應現實人的決策過程及其決策結果。

六、結論

進化博弈理論是經濟學領域的前沿理論,它來源于對生態現象的研究,雖然該理論應用于經濟分析的時間不長,但它為經濟學研究提供了一個全新的分析方法,較好地克服了新古典經濟學及經典博弈理論中理性假定及多重均衡的困難。并且,應用進化博弈理論來研究經濟系統能夠獲得比傳統理論更準確的結果,能夠更加現實地解釋經濟現象,因而在短期內為多數經濟學家所接受。從某種意義上說引入進化博弈理論局部動態法來分析經濟中參與人的行為是經濟學研究方法的一次創新。

注釋: ①本文把源于馮·諾意曼和摩根斯藤經納什發展而成的博弈理論稱之為經典博弈理論。 ②即無性生殖,這樣假定的意思就是說后代繼承其母體的策略,并且永遠不改變,當然用于研究人類的行為時,需要作相應的調整。 ③所謂近視調整即是指參與人不管未來怎么樣,只知道使當前的支付最大化 ④ 經典博弈理論中每一個參與人都有特定的博弈對象,并且,在重復動態博弈中,后行動者通過觀察先行動者的理而利用貝葉斯法則來修正自己的先念信念,然后,在此信念下選擇使自己獲得最大支付的策略。 ⑤好的策略即是指能夠獲得較高支付的策略。 ⑥所謂嚴格納什均衡即是嚴格占優納什均衡。給定對手選擇的情況下,每個人都通過選擇嚴占優的策略而組成的納什均衡。 ⑦事實上,這與Selten提出的顫抖手均衡概念具有相似性,所謂顫抖手均衡是指一個戰略組合,只有當它在允許所有參與人都可能犯錯誤時仍是每一個參與人的最優戰略的組合時才是一個均衡,其嚴格定義可以參閱張維迎的《博弈論與信息經濟學》。其中的顫抖或者犯錯誤與進化穩定策略中的突變因素有差不多的含義,但它們之間存在本質上的不同。 ⑧由模仿者動態方程進行支付變換,可得。 ⑨這一點我們可以從博弈論一個著名的捐款----回贈實驗中看出,募捐者要求每一個人都自愿捐款,最終募捐者以3倍于捐款總額的錢平均分派給每個捐款者,為了使得博弈能夠分析下去,募捐者要求自愿捐款時每個人都不得與其他人討論,否則該博弈就無法進行下去,因此,本文稱博弈論中的互動是一種沉默互動而非社會互動。這個實驗充分體現了古典經濟學及博弈論研究對象上的一致性,即它們都是研究單個個體的行為而排除了人的一個重要特征----社會性。參考文獻

[1] 王則柯(1999):《博弈論平話》,中國經濟出版社。

[2] 張維迎(1999):《博弈論與信息經濟學》,上海三聯出版社。

[3] 張良橋,馮從文(2001):《進化穩定均衡與納什均衡:兼談進化博弈理論的發展》,《經濟科學》,3,103-111。

[4] 張良橋(2001):《理性與有限理性:論經典博弈理論與進化博弈理論之關系》,《世界經濟》,8,74-78。

[5] 張良橋(2003):《論進化穩定策略》,《經濟評論》,2,70-74。

[6] 張良橋,郭立國(2003):《論模仿者動態》,《中山大學學報自然科學版》,3。

[7] 楊小凱(2000):《新興古典經濟學和超邊際分析》,中國人民大學出版社。

[8] 青木昌彥, 奧野正寬(1999):《經濟體制的比較制度分析》, 魏加寧等譯, 北京: 中國發展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

進化博弈理論范文第2篇

關鍵詞:知識共享 進化博弈 蛙鳴博弈

企業內部的知識有多種形式,如個人經驗、產品信息、客戶信息、工作流程、各種文檔。企業知識共享,就是員工互相交流彼此的知識,使知識由個人的經驗擴散到企業的層面,從而提高企業的工作效率。知識共享在企業中產生的是一種知識放大效應,它通過知識管理等手段,使企業的知識資源不斷得到整合與利用,從根本上推動企業競爭能力的提升。

進化博弈理論與企業知識共享機制

對于企業知識共享機制問題,可以用博弈理論進行研究。目前,國內一些研究已對此做出了初步的探索,如用“囚徒困境”模型解釋不愿知識共享的問題,但是這些分析研究均是應用經典博弈理論進行分析。經典博弈理論從博弈方的完全理性出發,在信息充分的前提下找到了博弈的均衡解。然而對現實中的決策行為者來說,完全理性是很難滿足的高要求。當社會經濟環境和決策問題較復雜時,人的理性局限是非常明顯的。因此要保證博弈分析的理論和應用價值,必須對有理性局限的博弈方之間的博弈進行分析,進化博弈論從有限理性的個體出發,以群體行為為研究對象,合理解釋了生物行為的進化過程。生物進化中生物性狀和行為特征動態變化過程的“復制動態”,在有限理性博弈分析中正是模擬有限理性博弈方學習博弈和調整策略過程最主要的動態機制之一,而生物進化理論中具有在動態調整過程中達到,在受到少量干擾后仍能“恢復”的穩健性均衡概念“進化穩定策略”,正是有限理性博弈分析最核心的均衡概念,或者說動態策略穩定性概念。

一般來說, 在企業內部的知識共享行為上,行為主體的理性層次較低。這主要是因為這類決策是群體決策,而行為是企業行為。此時行為主體意識到錯誤和調整策略的能力較差,其行為變化更多的是一種緩慢進化而不是快速學習與調整機制。因此可以用生物進化的復制動態機制模擬,即進化穩定策略(ESS)。在重復博弈中,具備有限信息的個體根據其既得利益不斷地在邊際上對其策略進行調整以追求自身利益的改善,不斷地用較滿足的事態代替較不滿足的事態,最終達到一種動態平衡。在這種平衡中,任何一個個體不再愿意單方面改變其策略,這種平衡狀態下的策略稱為進化穩定策略。因此,利用進化博弈的方法分析企業知識共享機制更加接近于現實情況,也更有實際意義。

理論基礎和模型構建

(一)理論基礎

假定兩類行為主體均采用純策略,令S是行為主體所有純策略的集合,(S)代表所有在t階段采用純策略s∈S的行為主體集合,定義狀態變量θt(S)表示在t階段采用純策略 s的行為主體的群體比例向量,于是有:

根據前面的假設,有限理性的行為主體有一定的統計分析能力和對不同策略收益的事后判斷能力, 收益較差的行為人遲早會發現這種差異,并開始學習模仿另一類行為人, 因此行為人的比例是隨時間而變化的,是時間的函數。上述比例隨時間變化的速度取決于行為主體的學習模仿速度。學習模仿速度取決于兩個因素: 一是模仿對象數量的大小(可用相應類型的行為人的比例表示),因為這關系到觀察和模仿的難易程度;二是模仿對象的成功程度(可用模仿對象的策略收益超過平均收益的幅度表示),因為這關系到判斷差異的難易程度和對模仿激勵的大小。于是,有以下連續時間的動態模型:

這是一個模仿者復制動態方程,在本模型中,有如下的定理:

定理(Fudenberrg,1998)模仿者動態的一個穩定穩態是一個納什均衡,更一般地說,具有源于內部路徑限制的任何穩態都是納什均衡。反之, 如果對于一個非納什均衡,存在一個σ>0,所有內部路徑最終將從該穩態的σ鄰域內被清除。

(二)模型構建

假設與前提條件。

1.博弈方:假設該博弈方都是有限理性,且劃分為兩類,即同事群體1和同事群體2。分析的框架是反復在兩個群體中各隨機抽取一個成員配對進行博弈。博弈方的學習和策略模仿局限在他們所在的群體內部。這樣我們就可以分別對兩類群體進行復制動態和進化穩定策略分析。

2.行為策略。博弈方都有兩種行為方式:共享;不共享。如果他們的知識都不愿共享,相互封鎖,那么個人的知識就會出現低水平重復,使他們各自獲得的利益不多,假設為0收益;如果有一個企業成員打破常規,進行知識共享,那么他就獲得m(0.5<m<1)發展機會,但共享者是有學習成本z的;如果他們的知識都實行共享,就會獲得更多的發展機會p(m<p<1),此時各有學習成本z。

3.行為策略的采取比例。博弈方中可能采取“共享”與“不共享”的比例分別為x、1-x。

4.得益矩陣。用w表示參與人的收益。隨機博弈中雙方的得益矩陣如圖1所示。

企業知識共享行為的博弈分析

由得益矩陣可知,該博弈的納什均衡取決于其中P、m、z的具體水平或者說相對水平。根據上述假設,按照博弈的一般公式:

博弈方1中,“共享”類型參與人的收益為:

根據進化穩定策略的性質, 一個穩定態必須對微小擾動具有穩健性才能稱為進化穩定策略。也就是說,作為進化穩定策略的點x*,除了本身必須是均衡狀態外,還必須具有這樣的性質,即如果某些博弈方由于偶然的錯誤偏離了它們,復制動態還會使x恢復到x*。在數學上,相當于要求當干擾使x出現低于x*時,必須大于0,當干擾使x出現高于x*時, 必須小于0。這就是微分方程的“穩定性定理”。

當0<(m-x)/(1-P)<1時,上述進化過程復制動態的三個穩定狀態都是合理的,因為都處于0≤x≤1的有效范圍。這時候復制動態方程的相位如圖2所示。

由圖2可以看出,x*=(m-z)/(1-P)是進化穩定策略。這意味著一旦企業內少數成員開始共享,那么隨著獲得利益的機會增多,就有更多的成員進行仿效,開始共享,直到組織中成員共享的數量比重為x*=(m-z)/(1-P)。如果超出這個比重,甚至所有的成員都進行共享,那么就會出現有些成員不愿貢獻自己的知識讓他人共享,反而利用其他成員創造環境氛圍,從中牟利,出現“搭便車”的現象,最終仍然回到了x*=(m-z)/(1-P)的均衡比例。

隨著支付矩陣的不同取值,x*可能與其它的兩全解相等或者不存在第三個解,博弈退化為只有兩個穩定態。

當(m-z)/(1-P)<0,也就是m由圖3不難看出,這時候復制動態的唯一穩定的均衡點為x*=0,也就是說企業所有的成員都是不愿共享的。只要不是一開始所有成員都是共享型的極端情況,最終都會在長期的動態變化中趨于不共享。即使是所有成員都共享,只要在組織內部有不共享的人出現,就會破壞共享學習的氛圍,破壞整個企業的現狀,企業去管理就會增加成本,這樣企業反而不去管,最終會趨向所有成員都不愿共享的均衡。

當(m-z)/(1-P)>1,也就是m-z>1-P的情況。此時,復制動態的三個不動點中也只有x*=0和x*=1兩點符合要求。復制動態方程的相位如圖4所示。

由圖4可以看出,現在的進化穩定策略是x*=1,也就是所有的成員都共享,整個企業組織就是學習共享型的。在社會環境和成員的素質都很好以及從學習中獲得的收益遠遠大于成本代價時,這樣的條件下是合理的。

通過對以上三種情況的分析,我們可以知道,企業知識共享機制是個長期的問題,無法以短期來解決。企業中的成員不是每個都是知識共享型的,而是存在著“搭便車”的現象,在有限理性的條件下,不是所有的企業都是知識共享型的,不是所有的企業都能做到長期性的知識共享。這也可以解釋我國有很多的企業在實施知識管理,但真正取得好的結果的卻并不多。

企業知識共享的行為演化機制

通過進化博弈的參數分析,可以看出企業知識共享機制的進化博弈包括如下幾種可能的行為演化機制。

企業知識共享機制的選擇機制,即在博弈中能夠獲得較高收益的策略,在以后演化過程中被更多的參與者選擇。通過進化博弈的得益矩陣分析,使企業知識共享機制容易實現較高效率進化策略均衡。只要調整好P、m和z的大小,就可以保證較高效率的企業知識共享機制順利進行。具體來說是要求用更低的成本z,創造更多的發展機會P和m,企業就會促使更多的工作人員去實施知識共享。為此企業需要加大內部不共享行為的機會成本,務必對企業內部成員的知識自私行為進行懲罰和壓制,以提高這種變異的門檻,使這種不愿知識共享的行為成為一種風險很大收益很小的活動,從而壓縮不實現知識共享者的生存空間,避免企業內部的知識共享機制向不利的方向演進。

企業知識共享機制的放棄機制,即在博弈中獲得較低收益的策略,在以后演化過程中被更多的參與者放棄。在進化博弈分析的第二種情況下,由于m企業知識共享機制的突變機制,即參與者以隨機(無目的性)的方式選擇策略,其中包括突變策略,參與者將選擇獲得較高收益的策略。通過進化博弈的得益矩陣分析,使p-z 變大或1-m 變小,促使(p-z)-(1-m)增大,保證企業較易地實現較高相互支持、相互協作、相互溝通,鼓勵和促進企業內部的知識共享行為,褒揚部門、同事的團隊精神,把知識共享變成一種自動機制,從而使企業內部采取知識共享行為者獲得較高的收益,這樣使企業內部采取少數不共享行為的人所占的比例越來越小,提高企業知識共享機制向理想方向進化的可能性和比例,從而促進企業知識共享機制向最理想的方向演進。

參考文獻:

1.謝識予.有限理性條件下的進化博弈理論.上海財經大學學報,2001(5)

進化博弈理論范文第3篇

關鍵詞:班級安全文化;進化博弈;有限理性

一、問題的提出

學校是培育人才的搖籃,班級是學校的基本構成單元。班級安全文化是指班級在教學、科研以及生活等領域所創造的理念、形象、設施與行為等的總和,班級安全文化建設是學校安全文化建設的基本立足點。學生是班級的主體,班級安全文化是全班學生共建共享的,一個班級的安全文化氛圍濃厚只是一枝獨秀,只有當學校所有班級的安全文化不斷優化,才能有助于學校安全文化的提升,為學生的學習和生活提供安全保障。徹底否定傳統博弈論賴以成立的基礎即“理性人假設”的進化博弈理論從具有有限理性的“社會人”出發,分析參與人的行為從而建立起嶄新的分析框架。自從1973年生態學家史密斯和普賴斯引進進化穩定策略,TaylorandJonker于1978年提出模仿者動態概念后,進化博弈論被廣泛應用于各學科。經典的博弈論建立在完全理性的假設基礎上,在解釋現實行為方面具有明顯不足。而進化博弈論用于解釋群體之間的行為是如何相互影響的動態變化過程,因而適用于班級安全文化建設的解釋性分析及探索性研究。

二、有限理性條件下學生之間的安全文化建設進化博弈分析

學生作為行為主體,具有有限理性,在班級安全文化建設中的策略選擇也是可模仿學習的。運用進化博弈原理對具有有限理性的學生間的相互行為及班級安全文化建設進行分析,頗具理論及現實意義。

(一)基本假設

學生之間是無差異的,由學生組成的群體成員間進行了隨機配對博弈,形成兩人對稱博弈,學生的策略選擇受其他學生的策略影響,策略的調整是一個緩慢的動態調整過程。

(二)模型構建

第一,博弈參與者。根據進化博弈原理,將隨機配對的兩名學生分別記作“學生1”和“學生2”。在班級安全文化建設中,學生有認真參與和敷衍了事兩種選擇。第二,博弈方的行為策略。在班級安全文化建設中,學生采取的博弈策略有兩種:一是積極主動,另一種是敷衍應付,分別記作“主動”和“敷衍”。第三,博弈得益。通過開展班級安全文化建設,假設兩名學生都能夠認真學習安全知識和技能,可以在很大程度上避免和防范常見校園安全事故,即使遇到安全事件也能盡其所能成功應對的概率為1,從而獲得一定的效用,記作V。假設兩名學生中,一名學生在班級安全文化建設中采取“主動”策略,安全素質得以提高,從而獲得了安全文化建設效用,另一名學生選擇“敷衍”策略。嚴格來講,學校安全事故的發生具有偶然性,即兩名學生在防范和應對校園安全事故時也有一定的成功概率,分別記作R和r。因此,采取“主動”策略的學生獲得的效用水平為V*R,采取“敷衍”策略的學生獲得的效用水平為r*V,且r≤R,0≤r≤1,0≤R≤1。假設在班級安全文化建設中,兩名學生都采取“敷衍”策略,則獲得的效用均為M,可正可負,在學校安全形勢比較穩定的條件下,學生即使不積極主動參與班級安全文化建設,也不會有任何損失,此時M為正值。相反,校園安全事件的發生會造成一定的人身財產損失以及不良聲譽,此時M為負值。

(三)隨機配對的兩名學生

對稱博弈模型的納什均衡求解根據劃線法對博弈模型進行分析,班級安全文化建設中“主動”的學生都能獲得較高的效用,即V*R≥M。根據班級安全文化建設實際,運用劃線法求解得:當r≤R,V*R>M時,“主動”是每名學生在任何情況下都不會改變的占優策略,因此(認真學習,認真學習)成為隨機配對的兩名學生對稱博弈模型的唯一納什均衡。當r≥R,V*R<M,存在兩個納什均衡,即兩名學生會相互影響,(認真學習,認真學習)和(敷衍學習,敷衍學習),學生以一定的概率選擇參與班級安全文化建設策略,要么都“主動”,要么都“敷衍”。當r≥R,認真學習安全知識和技能,即“主動”參與班級安全文化建設的學生仍然不幸遇到安全事故,當事故具有偶然性時,“主動”參與班級安全文化建設的學生會改變策略,轉為“敷衍”參與班級安全文化建設。

(四)有限理性條件下學生之間的安全文化建設進化博弈分析

當進行班級安全文化建設,對學生開展安全教育和安全管理時,假定以y(t)表示選擇純策略———“主動”參與班級安全文化建設策略的學生人數在群體中所占的比重,則選擇“敷衍”策略的學生人數所占比重為1-y(t)。

三、結論及建議

通過構建學生參與班級安全文化建設的進化博弈模型并進行分析求解,得到不同條件下兩種不同的進化穩定策略,從而得出學生在參與班級安全文化建設過程中,受其他同學的影響非常明顯,要么都“主動”,要么都“敷衍”。安全文化建設是一種居安思危、預防為主、防患于未然的系統工程,如同溫水煮蛙實驗。從學生參與班級安全文化建設的演化過程看,要改變目前多數學生都存在“敷衍”的現狀,應注重對學生學習安全知識和技能的引導,強化安全防范意識,提高“主動”參與班級安全文化建設的效用。采取多種形式開展班級安全文化建設,對學生開展人性化的安全管理尤其是參與式管理,例如通過應急演練、情境模擬等方式吸引學生參與,激發學生的學習力,提高學生安全素質,提升班級安全文化建設實效。

參考文獻:

[1]石連海學校安全問題分析與對策[J].當代教育科學,2011,(16):27-30.

進化博弈理論范文第4篇

影子銀行是游離在傳統銀行體系之外的金融體系。它能夠促進信貸市場進行有效的資金配置,刺激經濟發展。然后影子銀行不受監管,難以把控,從而導致其產生負面影響。2008年美國的次貸危機國內外學者幾乎將內因歸結于影子銀行。但是,在如今互聯網金融發展的背景下,想要完全消除影子銀行是不可能的,引導影子銀行朝著積極正面的方向發展才是正確之路。若是影子銀行與傳統銀行能夠實現合作共贏,那將成功解決對影子銀行的監管問題。

二、相關概念闡述

(一)影子銀行

影子銀行一詞來源于美國次貸危機爆發后,首次被Paul Mcculleys提出的。后來FBS(2011)正式指出,影子銀行是傳統銀行體系之外所涉及信用融資活動的機構。這成為了國內外學者接受度最大的界定。

我國對影子銀行的界定一直與體制外金融、民間金融、民營金融、地下金融等概念混用的現象。但是大家對影子銀行的基本認知都包括未受國家法律規范,游離于監管當局監管之外等等。有的學者還指出,除了金融機構外,還應包含金融創新產品、服務以及產品和服務適用的金融市場。不過由于本文討論的是兩個主體間的合作關系,故而本文所指的影子銀行即是游離于傳統銀行管理體系之外的非銀行金融機構。

(二)有限理性

由于現實生活中許多現象無法用傳統金融學來解釋,故而后起之秀――行為金融學因合理解釋了這些金融現象被廣大學者所接受,行為金融學與傳統金融理論最大的不同之處就在于,行為金融學認為是投資者不是完全理性人,而是有限理性人。他們總是會受到心理、環境、他人的影響而作出決定。投資行為不全是根據利益最大化原則,還包括安全最大化等等。

(三)進化博弈模型

進化博弈論博弈是一個動態的博弈過程,是有限理性博弈雙方群體在一定的前提下對當前局面進行選擇,在一個群體中得益較差的博弈方遲早會發現這種差異,并開始學習模仿得益較高的博弈方,后經過自我體驗以及學習其他人的選擇,而不斷改變自己的策略。最終市場會根據“優勝劣汰”的自然規律,形成一個穩定的策略。這種類似于生物進化論的動態博弈方式被稱為進化博弈論。最終形成的策略成為進化穩定策略(ESS)。

本文基于進化博弈論的研究方法,對傳統銀行和影子銀行二者的合作進行預測,并判斷何時能夠達到二者自然選擇“合作”策略。基于進化博弈論的基本理論,我們假設傳統銀行和影子銀行都是有限的理性人,對兩個博弈方不再細分其內部的個體,并且假設傳統銀行與影子銀行的最大的區分是是否受監管當局監管。

三、影子銀行和傳統銀行合作問題的進化博弈分析

我們粗略地假定我國金融市場中有傳統銀行機構和影子銀行兩類機構,而雙方面臨的選擇只有“合作”和“不合作”兩種策略,自我的選擇和其他群體的選擇都將影響自身與他人的收益。他們都將依據這種相對收益率不斷地調整自己的策略。兩個群體不斷地博弈交流,最終通過“物競天擇、適者生存”的進化法則自發進化到具有穩定性的均衡狀態――進化穩定策略(ESS)。

1.博弈雙方的得益

我們先假設傳統銀行和影子銀行在非合作狀態下的收益分別為Rc和RY。我們假設,當二者采取合作時,由于渠道拓寬,客戶量增大以及銷售效率提升,雙方的收益將會增加πc和πY,此時雙方存在一個合作的成本分別Cc和CY,且我們假定πc大于Cc,πY大于CY。根據上述假設,可以得到如表1所示的矩陣圖。我們發現,如果傳統銀行與影子銀行都是理性“經濟人”時,表1的結果必然存在一個純戰略的納什均衡(合作、合作);但是如果我們把前提假設放寬至“有限理性”,我們發展最后的進化穩定策略并非都是(合作,合作)

2.傳統銀行和影子銀行的期望得益及其動態微分方程

假定當t時,x是傳統銀行群體中選擇合作策略的銀行占傳統銀行的且X∈(0,1),則選擇不合作策略銀行比例為1-x;同理,在影子銀行群體中,y是選擇合作策略的銀行占影子銀行的比例,且Y∈(0,1),則選擇不合作策略的銀行比例為1-y。

在傳統銀行群體中采取“合作”和“不合作”策略兩類博弈方的期望得益分別為μCHZ和μCNH,群體平均期望得益為μC:

3、基于傳統銀行群體和影子銀行復制動態微分方程的分析

從(7)式可知,傳統銀行群體中選擇“合作”策略博弈方的比例x的變化率與該類型博弈方的超額期望得益呈正相關關系,也與該類型博弈方的比例x呈正相關。

當y=時,,傳統銀行中選擇 “合作 ”策略的銀行的比例的變化率為0,即采取“合作”策略的博弈方比例不會發生變化,此時傳統銀行群體處于穩定狀態。當,即采取“合作”策略的銀行獲得超額收益,那么,選擇“不合作”策略的銀行將逐漸發現并調整策略的策,選擇“合作”策略,選擇“合作”的比例x會向趨近1,此時是該群體復制動態下的一個ESS。當,即采取“合作”策略的博弈方的期望得益小于群體平均得益。那么, 選擇“合作”策略的銀行也會逐漸選擇“不合作”策略,采取“合作”策略的博弈方數量會逐漸減少,直到X=0 ,此時是該群體復制動態下的另一個ESS。下圖1給出了上述三種情況 的動態變化的相位圖和穩定狀態。

同理可知影子銀行群里的情況。當,在影子銀行里選擇“合作”策略銀行比例y的變化率為0 ,即y不會發生變化,此時影子銀行群體處于穩定狀態。當0,即選擇“合作”的影子能夠獲得超額收益,此時采取“不合作”策略的銀行將會調整策略,最終選擇“合作”,之后y會向趨近1,當y=1時,該群體處于進化穩定策略。當,表示,選擇“合作”的影子銀行不能獲得超額收益,甚至所獲得的收益低于平均收益,故而采取“合作”策略的銀行數量會調整策略,y會向趨近0,此時是該群體復制動態下的另一個進化穩定策略。下圖2給出了上述三種情況的動態變化的相位圖和穩定狀態。

4. 傳統銀行與影子銀行合作的進化博弈系統復制動態分析將傳統銀行和影子銀行兩個特殊群體類型的比例變化復制動態的關系用一個坐標平面圖表示,可得到下圖3:

從圖 3中A、B、C和D四個區域我們可發現,傳統銀行和影子銀行的合作博弈過程中,最終會趨向(0,0)和(1,1)這兩個進化穩定策略。同時,若傳統銀行與影子銀行是處于 B區域時,二者將收斂到進化穩定策略(1,1),即采用“合作”策略;而傳統銀行與影子銀行在C區域時,二者將收斂到進化穩定策略(0,0),即采用“不合作”策略,當他們處在A和D 兩個區域時,二者是否選擇“合作”是不確定的。傳統銀行和影子銀行能夠選擇“合作”策略由雙方合作后的收益增加量與成本決定。想要增加B區域的面積,提高傳統銀行與影子銀行趨向納什均衡(合作、合作),有兩種方法。一是在傳統銀行與影子合作時他們的收益增加量πc和Cc不變時,讓二者的合作成本Cc和CY越小;二是當雙方的初始合作成本Cc和CY一定時,提高雙方獲得的合作收益增加量πc和πY。

進化博弈理論范文第5篇

Research on Enterprise Independent

Innovation Risk Compensation System Evolution

Based on Evolutionary Game

ZHAO Shi1,2, XIE Kefan1

(1. School of Management, Wuhan University of Technology, Wuhan 430070;

2. Shanghai Precision and Gravels Logisitics Co., LTD, Shanghai 201700)

Abstract: On the basis of three major entities behavioral analysis in enterprise independent innovation risk compensation system which is at an early stage of development in China, this paper structures enterprise independent innovation risk compensation system evolution model with evolutionary game theory and system dynamics theory. Then it analyzes the evolutionary stability of enterprise independent innovation risk compensation system by example simulation, and based on it, analyzes the effects of risk compensation policy, independent innovation will and risksharing will on the enterprise independent innovation risk compensation system evolution, proves the availability and necessity of enterprise independent innovation risk compensation policy, reveals the evolutionary mechanism of enterprise independent innovation risk compensation system, and proposes the policy proposals of carrying out the risk compensation policy and propaganda policy at the same time.

Key words: risk compensation; system dynamics; enterprise independent innovation; evolutionary game

1引言

隨著知識經濟時代的不斷發展,創新能力已經成為了企業重要的核心競爭力,而我國政府也認識到企業自主創新是國家經濟持續高速發展的重要基礎。自政府提出構建以企業為核心的技術創新支撐平臺以來,我國企業在全國以及區域性企業自主創新支撐平臺的支持下,得到了長足的發展;但與發達國家相比,我國企業在自主創新能力和自主創新績效上仍然存在較大差距。究其原因,從客觀而言是創新環境不完善和創新資源不充足,從主觀而言則是自主創新的高風險阻礙了企業的自主創新意愿。因此,降低企業自主創新風險,減少企業自主創新的阻滯力是提高企業自主創新源動力的關鍵,也是促進我國企業自主創新不可忽視的重點。

企業自主創新風險防范機制主要由三個維度構成:企業承擔、社會分攤和政府補償。企業承擔是指企業作為自主創新的核心主體,是風險防范措施的決策者和實施者,也是風險損失的最終承擔者。技術創新風險的減少和防范與組織策略有重要的關系[1],很多關鍵的策略可以用于技術創新風險的防范和管理,以促使技術創新項目達到利益最大化[2],尋求社會分攤作為一種有償的風險防范渠道,是企業防范自主創新風險的一個重要策略。然而因自主創新風險過高而引起的風險分攤契約締結障礙阻礙了社會風險分攤機制的運行,因而,政府補償在企業自主創新風險補償機制中起著重要的促進和調節作用。

我國對于企業自主創新風險補償的研究源于20世紀80年代,最初的補償方式為設立經營風險準備金或經營風險基金。林躍武認為企業技術創新風險客觀存在,且嚴重阻礙了企業的技術創新,建立風險補償體系十分必要[3]。企業技術創新風險補償體系是國家和各級政府部門為了健全和完善技術創新活動的外部環境,促進技術創新活動,在考慮到技術創新活動本身的高投入與高風險特點的基礎上,遵循風險與收益對等的原則,對參與技術創新活動的主體,包括企業、科技保險公司、貸款銀行、擔保機構及風險投資公司所進行的一種全面、系統、規范的補償機制與制度安排[4]。由此可見,我國對于企業風險補償的研究主要集中于政府補償,而國外學者則對于政府直接投入企業技術創新項目存在異議,認為企業風險補償應基于企業或聯盟的內部機制。例如:針對聯盟項目利益分配問題的風險補償[5],以高質量的產品組合策略開展企業風險補償[6],利率波動引起的企業風險補償[7],企業人力資源的風險補償問題[8]等等。

系統的運作基礎主要是系統內主體的決策變化,而系統的進化過程就是系統內主體通過不斷的分析、決策、學習和博弈不斷進化的過程,因此,進化博弈理論是開展系統進化分析的有效工具。龔健等運用進化博弈模型分析了企業海外R&D戰略聯盟的進化過程[9],于斌斌則運用進化博弈理論研究了產業集群產業鏈中企業的進化過程[10]。

2企業自主創新風險補償系統的主體及假設

企業自主創新風險補償系統主要涉及三方行為主體:自主創新企業、政府和社會風險分攤組織。雖然社會風險分攤組織包含了保險公司、銀行、信貸擔保公司、風險投資公司等不同類型的主體,但他們在與政府的博弈過程中存在較高的相似性和一致性,在企業自主創新風險補償政策中也屬于同一類被調節對象,因而將其共同視為一方主體。三方主體在企業自主創新風險補償系統中,以實現自身利益最大化為目標進行動態決策,并通過各自的決策相互影響、相互作用,構成動態博弈關系,而企業自主創新風險補償系統即是基于這種動態博弈關系運作[11]。

為了使復雜的企業自主創新風險補償過程簡單化,以便于運用模型進行分析,基于企業自主創新風險補償體系中各方主體行為的特點和我國社會經濟情況,對主體作出如下假設:

(1)假設企業自主創新風險補償系統中的三方主體均有兩種策略選擇:政府可選擇推行風險補償政策和不推行風險補償政策;企業可選擇開展自主創新和不開展自主創新;社會風險分攤組織可選擇分攤風險和不分攤風險。

(2)主體中的“政府”為風險補償的實施主體,可以是中央政府,也可以是地方政府,政策調整范圍與政府管轄范圍一致,其決策基于政策覆蓋的全部區域。其決策為實時決策,而非定期決策,即政府可以根據自主創新風險補償的發展現狀隨時作出決策,并立即推行政策的實施,不考慮政策有效期和政策延遲情況。該假設主要用于保證博弈過程連續性。

(3)政府的風險補償行為主要包括兩類:直接補償和間接補償。對直接從事創新活動的企業的補償是直接補償,對社會風險分攤組織的補償是間接補償。兩種補償政策屬于同一個政策系統,即政府一旦決定開展風險補償,則兩種補償方式同時進行。風險補償強度為定值,風險補償的額度只受到風險發生概率的影響。所有風險補償均為風險損失補償(事后補償),即只有當企業開展自主創新項目發生損失,或社會風險分攤組織分攤企業自主創新風險發生損失時,補償政策才生效。假設政府有充足的資金進行補償,但在決策時,充分考慮補償的成本,即服從經濟人假設。此外,在博弈過程中,政府獲得的所有社會效益全部轉化為經濟收益,以經濟指標表現。

(4)假設自主創新企業的風險偏好為風險中性,政府的風險補償政策對其具有正效應,且為了有效防范自主創新風險,企業具有分攤自主創新風險的意愿。此外,假設自主創新企業具有獨立投資和開展自主創新項目的能力,而自主創新結果只有成功和失敗兩種,即一旦發生風險損失則視為自主創新項目失敗,企業無法獲取風險收益[12]。

(5)假設社會風險分攤組織為政策覆蓋區域內的大中型風險分攤組織,具有分攤企業自主創新風險的能力。社會風險分攤組織的風險偏好也為風險中性,政府的風險補償政策對其具有正效應。

為了便于進行進化博弈分析,基于以上假設前提,對博弈分析過程中設計的一些基本變量做出如下假設:

(1)假設若自主創新企業進行自主創新,其全部投入總額為Cy,項目成功時獲取的收益為πy。自主創新項目失敗(發生風險損失)的概率為p,成功并獲取收益的概率為1-p。若企業不開展自主創新,則會因失去市場競爭優勢造成經營收益下降,從而遭受損失,該損失與產業整體的技術創新競爭力有關,而產業整體的技術創新競爭力主要受到政府補償和社會風險分攤的影響,因而,該損失可以根據是否有政府補償和社會風險分攤分為四類。由于政府補償只是一種輔作用,而社會風險分攤為企業自主創新風險防范的主要力量,所以社會風險分攤影響強于政府補償影響,從而產生的損失分別為:政府補償且社會分攤時為Lyza,有社會分攤無政府補償時為Lya,有政府補償無社會分攤時為Lyzd,兩者皆無時為Lyd,且Lyza>Lya>Lyzd>Lyd。

(2)假設若社會風險分攤組織開展社會風險分攤業務,則固定成本為Cx,當自主創新項目失敗時,其分擔的風險損失為s。分攤風險所獲得的收益與政府補償相關,當有政府補償時,風險分攤收益較高,為Δπxa;當無政府補償時,風險分攤收益較低,為Δπxd。若社會風險分攤組織不開展社會風險分攤業務,而企業存在分攤風險的需求,則社會風險分攤組織會因為丟失市場份額而產生損失,這一損失與企業的風險分攤需求強度和社會風險分攤組織的整體風險分攤能力有關,當政府進行補償時,企業自主創新意愿較強,風險分攤需求較大,且社會風險分攤組織受到政府補償后,整體分攤能力提高,因而不開展社會風險分攤業務的損失較大為Lxa,反之,當政府不進行補償時,損失較小為Lx。

(3)假設政府推行和運作補償政策的費用是Cz,當發生風險損失時,對企業的直接補償為O1,對社會風險分攤組織的風險損失補償為O2。當政府開展風險補償時,企業開展技術創新所產生的社會效益,在有社會風險分攤條件下為Δπza,在無社會風險分攤條件下為Δπzd;當政府不開展風險補償時,企業開展技術創新所產生的社會效益,在有社會風險分攤條件下為Δπ0a,在無社會風險分攤條件下為Δπ0d,且Δπza>Δπ0a>Δπzd>Δπ0d。

(4)假設在系統運作過程中政府選擇補償策略的概率為z,選擇不補償策略的概率為1-z;企業選擇自主創新策略的概率為y,選擇不創新策略的概率為1-y;社會風險分攤組織選擇分攤的概率為x,選擇不分攤策略的概率為1-x。

(5)以上所有假設變量均為正實數,其中0

3企業自主創新風險補償系統進化模型的構建

基于進化博弈思想,在企業自主創新風險補償系統中,各方主體的策略選擇決策基礎主要是其所選策略的效用,因而基于系統中各方主體的策略選擇和各方利益機制構建博弈效用矩陣,如表1所示。表1企業自主創新風險補償的博弈效用矩陣

自主創新企業創新(y)不創新(1-y)政府補償(z)社會風險

分攤組織分攤(x)(Δπza-Cz-p(O1+O2),Δπxa+pO2-Cx-ps,(1-p)πy+pO1-Cy+ps)(-Cz,-Cx,-Lyza)不分攤(1-x)(Δπzd-Cz-pO1,-Lxa,(1-p)πy+pO1-Cy)(-Cz,0,-Lyzd)不補償(1-z)社會風險

分攤組織分攤(x)(Δπ0a,Δπxd-Cx-ps,(1-p)πy-Cy+ps)(0,-Cx,-Lya)不分攤(1-x)(Δπ0d,-Lx,(1-p)πy-Cy)(0,0,-Lyd)注:表格中效用順序為政府效用、社會風險分攤組織效用、企業效用

基于企業自主創新風險補償博弈效用矩陣可以構建各方主體的效用模型如下:

(1)政府的效用模型

設政府選擇補償策略時效用為uz1,選擇不補償策略時效用為uz2,可得:

uz1=xyΔπza-xypO2+yΔπzd-ypO1-Cz-xyΔπzd(1)

uz2=xyΔπ0a-xyΔπ0d+yΔπ0d(2)

(2)社會風險分攤組織的效用模型

設社會風險分攤組織選擇分攤策略時效用為ux1,選擇不分攤策略時效用為ux2,可得:

ux1=zy(Δπxa-Δπxd)+zypO2+yΔπxd-yps-Cx (3)

ux2=zy(Lx-Lxa)-yLx(4)

(3)企業的效用模型

設企業選擇創新策略時效用為uy1,選擇不創新策略時效用為uy2,可得:

uy1=zpO1+xps+(1-p)πy-Cy(5)

uy2=zxLyzd-zxLyza-zLyzd-xLya+xzLya-Lyd+zLyd+xLyd-xzLyd (6)

為了進一步分析三方主體的進化博弈過程,根據進化博弈理論,構建三方主體動態復制方程[13]得:

dxdt=x(ux1-ux)=x(x-1)(ux2-ux1)=x(x-1)[zy(Lx-Lxa)-yLx-zy(Δπxa-Δπxd)-zypO2-yΔπxd+yps+Cx](7)

dydt=y(uy1-uy)=y(y-1)(uy2-uy1)=y(y-1)[zxLyzd-zxLyza-zLyzd-xLya+xzLya-Lyd+zLyd+xLyd-xzLyd-zpO1+xps+(1-p)πy-Cy] (8)

dzdt=z(uz1-uz)=z(z-1)(uz2-uz1)=z(z-1)[xyΔπ0a-xyΔπ0d+yΔπ0d-xyΔπza-xypO2-yΔπzd+ypO1+Cz +xyΔπzd] (9)

為了進一步分析企業自主創新風險補償系統的進化機理,將進化博弈理論與系統動力學理論結合,基于系統中各方主體的博弈效用模型和動態復制方程,運用Vensim軟件,構建如圖1所示的企業自主創新風險補償系統流圖。

4企業自主創新風險補償的系統進化分析

為了對企業自主創新風險補償的系統進化機理進行分析,并驗證企業自主創新風險補償系統進化模型的有效性,本文以武漢市企業自主創新風險補償系統為算例,進行模擬計算分析。

為了保證算例參數設計的一般性,有效規避進化博弈中的特殊穩定點,基于進化穩定理論,算例參數應符合以下條件:

Cx

Cy-(1-p)πy

Cy-(1-p)πy

Cz

基于以上參數設計條件和一般企業技術創新數據設計算例參數如表2所示。表2參數值表

參數名稱參數值參數名稱參數值參數名稱參數值參數名稱參數值Δπza10Δπxa8Lya25O22Δπzd6Δπxd6Lyd15p 06Cz2Cx4Lyza3s 5Δπ0a4Lx2Lyzd2πy5Δπ0d2Lxa3O13Cy4注:以上參數除損失概率p外,其他參數單位均為百萬

首先,對系統的進化穩定性進行分析,取x、y、z的初始值為(03,03,02)和(04,04,05)分別進行模擬,得到如圖2、圖3所示的模擬計算結果。由圖2和圖3可知,企業自主創新風險補償系統有兩個進化穩定點:(1,1,1)和(0,0,0)。當三個主體選擇補償、創新和分攤策略的初始概率大于一定值時,系統最終將穩定于(1,1,1)點,即穩定于(分攤,創新,補償)策略組合;反之,當三個主體選擇補償、創新和分攤策略的初始概率小于一定值時,系統最終將穩定于(0,0,0)點,即穩定于(不分攤,不創新,不補償)策略組合。

然后,分析政府補償政策對企業自主創新風險補償系統進化的影響。在不考慮政府補償政策的情況下,三方系統變為兩方系統,根據進化博弈穩定性分析可得:

當CxLxa+Δπxd-ps

當0

當Cy-(1-p)πyLya+ps

當0

為了分析政府補償的作用,依據以上進化博弈分析結果,取(x,y)初始值為(02,03),使系統在政府補償概率初始值為0時的進化穩定點為(0,0)。然后,取政府補償概率為02,04,06,08分別進行系統模擬計算,得到如圖3所示的系統進化結果比較圖。

基于以上模擬結果可知,政府補償政策對企業自主創新風險補償系統具有推動性作用,隨著政府補償初始概率的增大,企業和社會風險分攤組織的進化穩定點從(0,0)轉向(1,1),該結果說明,政府的風險補償政策有利于促進企業自主創新行為和社會風險分攤組織對企業自主創新風險的分攤,只要政府堅持推行企業自主創新風險補償政策,最終企業和社會風險分攤組織會選擇(創新,分攤)策略組合。

第三,分析社會風險分攤組織的風險分攤意愿對企業自主創新風險補償系統進化的影響。取系統初始值為(03,04,04)和(06,04,04)分別進行模擬計算,得到如圖4所示的進化結果比較圖。

如圖4所示,當社會風險分攤組織的分攤意愿增強,企業的創新意愿和政府的補償意愿會提高得更快,系統會更快達到進化穩定點(1,1,1)。該結果說明,社會風險分攤組織風險分攤意愿的提高有助于增強企業的自主創新意愿和政府的風險補償意愿,促使系統快速向有效的穩定點進化。

第四,分析企業自主創新意愿對企業自主創新風險補償系統進化的影響。取系統初始值為(04,03,04)和(04,06,04)分別進行模擬計算,得到如圖5所示的進化結果比較圖。

如圖5所示,當企業的自主創新意愿增強,社會風險分攤組織的風險分攤意愿和政府的補償意愿會提高得更快,系統會更快地達到進化穩定點(1,1,1)。該結果說明,企業的自主創新意愿的提高有助于增強社會風險分攤組織的風險分攤意愿和政府的風險補償意愿,促使系統快速向有效的穩定點進化。

5結論

通過企業自主創新風險補償的系統進化分析可以得到以下結論:

(1)政府推行企業自主創新風險補償政策有助于提高企業的自主創新意愿,促進社會風險分攤組織主動分攤企業自主創新風險,進而促進區域企業自主創新,推動區域的科技和經濟發展。

(2)扶持區域社會風險分攤組織有助于提高區域企業自主創新能力。政府通過扶持區域社會風險分攤組織,提高其風險分攤能力和風險分攤意愿,從而通過有償的社會風險分攤輔助企業進行自主創新風險防范,提高區域企業自主創新能力和意愿。

主站蜘蛛池模板: 北安市| 灌云县| 古交市| 万宁市| 长泰县| 江津市| 东至县| 通城县| 改则县| 中超| 莒南县| 酒泉市| 新民市| 贺州市| 收藏| 平罗县| 星子县| 绥宁县| 丹寨县| 宁夏| 资中县| 延庆县| 大同市| 台东市| 乌兰察布市| 宾川县| 太原市| 留坝县| 司法| 大埔区| 财经| 盐池县| 中山市| 贵德县| 渭源县| 赤壁市| 宕昌县| 兰考县| 寿宁县| 会宁县| 泰宁县|