成語中的“博弈論”
智者博弈,博,局戲;弈,圍棋也。 博弈又稱博戲,是一門古老的游戲?!妒辣尽氛f,“烏曹作博”,烏曹乃是夏代著名之能工巧匠。千百年來,博弈更是與人們的生活緊緊相連,從圍棋、象棋到馬吊、紙牌,一直到各種各樣的彩票游戲??于是我們的歷史長河中就這樣形成了別具風情的博弈文化。
回顧上下五千年的歷史,古人對于博弈也有深刻的詮釋,他們或用成語,或用俗語,或用典故將其流傳下來,下面我就來聊聊成語中的“博弈論”。
一、知彼知己
說到知彼知己我想起“惟前知其當然,事至不懼,而徐為之圖”。我覺得這個成語博弈思想的精華:信息集、策略、行動等。
博弈論的基本概念包括:參與人、行為、信息、戰(zhàn)略、支付函數、結果、均衡。 二、囚徒困境——事與愿違、約法三章、鷸蚌相爭、假途滅虢
“囚徒困境”包含了幾個基本的預設前提:處于困境下,各方都不知道別人的選擇,因而只能猜測;每個人都是理性的人,從自己的利益出發(fā)去作出選擇;他們與困境之間,是一種不可逆轉的關系,即他們無法通過自己的力量去左右局勢,只能在困境的局勢下想辦法盡可能讓自己的損失最小。
這就是一種弱者的選擇。
當然,這只是一種博弈論的模型,具體到現實領域,沒有哪個具體的事件是完全符合“囚徒困境”的模式的。但是,這種“弱者對損失最小化的選擇”的基本精神卻是存在的。
從“囚徒困境”的模式,我們也可以看到,在這個模式中,理性的人最后的選擇都是“背叛”,不通過合作的方式與他人共同擺脫困境。而現實之中,背叛與合作是并存的,而且各方之間的信息也并非都是完全閉塞的。所以說,現實比理論更精彩,“囚徒困境”的理論模型固然高明,但現實中的事件則更發(fā)人深省。在具體的現實中,合作還是背叛,弱者的選擇都不是固定的,不過盡可能減少損失,讓自己得利,則是不變的原則。 1、事與愿違、約法三章
這個是我們大家最先接觸到的,最經典的到博弈均衡案例——“囚徒困境”。
在“囚徒困境”的例子中兩個囚徒都希望自己獲得的得益為0即不用判刑,但實際上事與愿違,最后的結果為都坦白(-5,-5),如果事先兩囚徒約法三章,兩人都選擇不坦白,則可為(-1,-1),對兩人來說是最好的選擇。
2、鷸蚌相爭
假設鷸在啄蚌時咬住了它的肉,而這時蚌夾住了它的嘴,且蚌很重使鷸無法飛行,于是可以得到下面矩陣:
鷸
放 不放
蚌 放 0,0 -10,5
不放 5,-10 -5,-5
即:1.蚌選擇放。若鷸選擇放,那么大家都沒效用都是0;若鷸選擇不放,那么鷸就可以吃
,蚌被吃掉效用為-10。 掉蚌,效用為5
2.蚌選擇不放。若鷸選擇放,那么蚌就可以最起碼白白夾鷸兩天,如果下場雨還能把鷸餓死,實在不行兩天后還可以選擇松口掉入水中,達到一定的報仇需求,所以它的效用為5,而鷸的效用為-10;若鷸選擇不放,則大家可能最后都死,但因互相害死了對方,所以都得到了一定的效用,所以都為-5。
由此可知,不管鷸如何選擇,不放都是蚌的最優(yōu)策略,鷸也相同,這就變成了囚徒困境。 3、假途滅虢
這是在合作中的敵我,同盟之間的博弈。當時擺在虞國君臣面前的選擇有以下幾種:
A(接受晉國的建議,背叛自己的盟友,保持自己的國家不受戰(zhàn)爭侵擾;
B(接受晉國的建議,背叛自己的盟友,但自己也被晉國消滅;
C(不接受晉國的建議,直接被晉國攻擊,國家滅亡;
D(不接受晉國的建議,晉國不進行報復,國家能夠保持獨立。其具體的博弈矩陣如下:
從以上的矩陣可以看出,接受賄賂是虞國的嚴格優(yōu)勢策略。然而從現實情況來看,接受賄賂,增強了國力,晉國即使攻打,也有力量抵抗;如果晉國當時不攻打的話,那虞國就毫無損失地擁有這些珍寶,真是何樂而不為的事啊~當然,還有其他的情況,就是不接受晉國的請求,兩國開戰(zhàn),打敗晉國——按照當時的軍事力量對比,這是不可能的。這充分說明了不背叛就會被淘汰。
三、斗雞博弈——破釜沉舟、窮寇莫追、哀兵必勝
這三個成語都是描述在動態(tài)的斗雞博弈中威脅有效的現象。在動態(tài)斗雞博弈中,后動的一方處于劣勢,為了改變博弈的結果,后動的一方可以選擇實行有效的威脅。對于理性的對手,要讓威脅有效,后動的一方可以有兩種選擇:使對手相信自己是非理性的或者使對手相信自己不能選擇后退。前者描述的是“哀兵必勝”的現象。后動的一方相信自己是處于正義,無論對方選擇什么行動都會選擇前進,這時獲知這一信息的理性對手反而會作出對后動的一方有利的決策。后者可以說是“窮寇莫追”“哀兵必勝”描述的現象。另外,當后動的一方切斷自己的退路或被逼入絕境時,先動的一方也會作出對后動的一方有利的決策。
以破釜沉舟為例,假設A為破釜沉舟方:
B
進攻 后退
A 破釜沉舟 5,-5 10,0
不破釜沉舟 -5,10 15,0
因為B不可能后退,所以A采取破釜沉舟的策略更好。此時的納什均衡為(10,0)。 四、合作博弈——相輔相成、狼狽為奸
1、相輔相成
以政府稅收與社會福利為例,若低稅收,一方面增加了居民的可支配收入,提升了消費的自由度,加強了個人福利;但另一方面也減少了政府收入,從而降低了政府在教育、醫(yī)療、住房等多方面的投入,損失了社會福利。高稅收則相反。
第一種是高稅收、高福利,就是通常所說的福利國家,像法國、瑞典等北歐各國;第二是低稅收、低福利,也稱自由國家,像美國、新加坡等;第三種是低稅收、高福利,這種模式基本上不可能存在;第四種是高稅收、低福利,這顯然不是民之所愿,非長久之計。
政府
高稅收 低稅收
居民 高福利 10,10 15,5
低福利 5,15 10,10
所以,總體而言,只有稅收和福利同高同低、相輔相成的狀態(tài)才能稱之為“合理”。 2、狼狽為奸
狼狽為奸是合作博弈的典范。
據說狼和狽是一類動物。狼的前腿長,后腿短;狽則相反,前腿短,后腿長。狽每次出去都必須依靠狼,把它的前腿搭在狼的后腿上才能行動,否則就會寸步難行。有一次,狼和狽走到一個人家的羊圈外面,雖然里面有許多只羊,但是羊圈既高又堅固,于是它們想出了一個好主意:讓狼騎在狽的脖子上,再由狽用兩條長的后腿直立起來,把狼馱得很高,然后,狼就用它兩條長長的前腳,攀住羊圈,把羊叼走。
狽
合作 不合作
狼 合作 10,10 0,0
不合作 0,0 0,0
此矩陣中只有(合作,合作)才是最優(yōu)策略。
五、其他博弈
1、兩害相權取其輕
我們所熟知的納什均衡是建立在參加者的理性行為基礎上的,各博弈放得策略選擇不僅依賴自己的理性,而且也依賴于其他博弈方的理性。但有些博弈中的博弈方的理性是有局限性的,這會使得某些博弈方達不到納什均衡。以二手車市場上買不到好車為例。這恰好符合二手市場的情形——極大化極小策略。賣方知道自己車子的質量但買方卻不一定知道,為了避免可能遭受的巨大損失,買方可能采取比較保守的策略,即采取“兩害相權取其輕”的策略,最終造成二手市場上買不到好車的尷尬局面。
2、還有一些博弈,例如貨比三家,最簡單的信息不平等博弈;螳螂捕蟬,黃雀在后說明靜態(tài)博弈不足取,通觀全局才最重要;一個和尚有水喝,兩個和尚挑水喝,三個和尚沒水喝,說明搭便車的想法不可取;比上不足 比下有余,很多博弈最終的結果都是如此。還有以直報怨,也可以用重復博弈進行分析;以靜制動是動態(tài)博弈應該考慮的問題等。
結語:成語中的博弈論還有很多,如果把目光放得更遠些,就會發(fā)現歷史的長河中到處都閃耀著博弈的光輝,大浪淘沙,它們是智者留下的瑰寶,是歷史的記憶;如果把目光拉近些,就會發(fā)現我們身邊也不缺乏關于博弈的例子,借用一句話,生活中并不缺乏博弈,而是缺乏發(fā)現博弈的眼睛。