您現在的位置是：首頁 > 音樂首頁 音樂

博弈思維：長達一生的策略遊戲

由夢過09 發表于音樂2021-09-19

博弈博弈論策略均衡納什

簡介假設有n個局中人參與博弈，給定其他人策略的條件下，每個局中人選擇自己的最優策略（個人最優策略可能依賴於也可能不依賴於他人的戰略），從而使自己效用最大化

零和博弈是嚴格競爭博弈嗎

正確的決策可以使決策者得到的利益最大化。錯誤的決策則會使決策者身陷泥淖難以自拔。博弈思維可以強化我們理性的行為選擇意識，增強自己的分析力，弱化對手的“理性判斷力”，透過資訊戰迷惑對手，打亂其陣腳，竭力避免自己做出錯誤選擇。

生活中的你想必常會為下面的現象的矛盾感到困惑：

在商場中，誠實不是道德的優良，而是貪婪的另外一種表現。

斷絕了後路，卻反而提高了我們的利益。

企業看似盲目燒錢燒包，財富反而增加了。

大學畢業十年後，發現往昔的班花心甘情願嫁給了無錢無勢也無貌的班裡最不起眼的那個男生。

被微薄的薪水逼迫得馬上就要把辭職信甩出，在陷入難堪的境地之後決心最後一次提出加薪，結果這次吝嗇的老闆眼都沒眨一下就點頭同意了。

以上這些事可能的嗎？你一直半信半疑。這些都是可能的，在現實中都相當多的例子，都得到過驗證。這些現象背後其實就是蘊含著博弈論原理。只要我們懂得了博弈論的一些原理，並將這些博弈策略應用到我們的生活與工作中，我們也可以出奇制勝，改變生活的原來軌道。說到博弈論，我們常常被其著作中大量的數學模型嚇倒。其實，博弈論不是學者們用來唬人的把戲，而是一種一般性的分析方法。一個不會程式設計的人照樣可以成為電腦應用高手一樣，沒有高深的數學知識，我們同樣透過博弈論的學習成為生活中的策略高手。比如孫臏，沒有學過高等數學，但他照樣可以透過策略來幫助田忌贏得賽馬。

博弈論首先是人們思索現實世界的一套邏輯，其次才是把這套邏輯嚴密化的數學形式。博弈論的目的在於巧妙的策略，把複雜的問題簡單化。我們學習博弈論的目的，不是為了享受博弈分析的過程，而是為了贏取更好的結局。

博弈論，亦稱對策論，是運籌學的一個分支，最初是運用數學方法來研究有利害衝突的雙方在競爭性的活動中是否存在自己制勝對方的最優策略，以及如何找出這種策略。思維是行動的先導。人類的許多重要活動都是正確思維的產物。博弈論傳遞給我們的，正是一把開啟智慧的金鑰匙。常見的博弈論原理主要有以下幾個：

1、最經典的非零和博弈——囚徒的困境。假設有兩個小偷A和B聯合犯事、私入民宅被警察抓住。警方將兩人分別置於不同的兩個房間內進行審訊，對每一個犯罪嫌疑人，警方給出的政策是：如果一個犯罪嫌疑人坦白了罪行，交出了贓物，於是證據確鑿，兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白，則兩人各被判刑8年；如果另一個犯罪嫌人沒有坦白而是抵賴，則以妨礙公務罪（因已有證據表明其有罪）再加刑2年，而坦白者有功被減刑8年，立即釋放。如果兩人都抵賴，則警方因證據不足不能判兩人的偷竊罪，但可以私入民宅的罪名將兩人各判入獄1年。對A來說，儘管他不知道B作何選擇，但他知道無論B選擇什麼，他選擇“坦白”總是最優的。顯然，根據對稱性，B也會選擇“坦白”，結果是兩人都被判刑8年。但是，倘若他們都選擇“抵賴”，每人只被判刑1年。兩個人各自從自身最優利益出發，最終卻不能達到集體的最優利益；每一個人以自己利益考慮，最終也不能達到自身的最優選擇。

2、納什均衡原理。納什均衡原理又稱為非合作博弈均衡，是博弈論的一個重要術語，以約翰·納什命名。假設有n個局中人參與博弈，給定其他人策略的條件下，每個局中人選擇自己的最優策略（個人最優策略可能依賴於也可能不依賴於他人的戰略），從而使自己效用最大化。所有局中人策略構成一個策略組合（Strategy Profile）。納什均衡指的是這樣一種戰略組合，這種策略組合由所有參與人最優策略組成。即在給定別人策略的情況下，沒有人有足夠理由打破這種均衡。例如，囚徒的困境中（坦白，坦白）就是一個納什均衡。

3、有限次重複的囚徒困境。如果重複囚徒困境將被精確地重複N次，已知N是一個常數，那麼會產生另一個有趣的事實。納什均衡就是每次都背叛。這很容易用歸納法證明。你也可以在最後的回合背叛，既然你的對手將沒有機會懲罰你。因此，你們都將在最後的回合背叛。這時，你可以在倒數第二回閤中背叛，既然最後一回無論你做什麼，你的對手都將背叛。因此不會改變均衡的結果。

4、無限次重複的囚徒困境。在重複的囚徒困境中，博弈被反覆地進行。因而每個參與者都有機會去“懲罰”另一個參與者前一回合的不合作行為。這時，合作可能會作為均衡的結果出現。欺騙的動機這時可能被受到懲罰的威脅所克服，從而可能導向一個較好的、合作的結果。作為反覆接近無限的數量，納什均衡趨向於帕累托最優。

5、零和博弈。零和博弈又稱“零和遊戲”，與非零和博弈相對，是博弈論的一個概念，屬非合作博弈，指參與博弈的各方，在嚴格競爭下，一方的收益必然意味著另一方的損失，博弈各方的收益和損失相加總和永遠為“零”。雙方不存在合作的可能。

博弈分為靜態博弈和動態博弈。靜態博弈是指在博弈中，兩個參與人同時選擇或兩人不同時選擇，但後行動者並不知道先行動者採取什麼樣的具體行動。例如囚徒的困境。博弈論在軍事鬥爭、系統控制和人與自然的鬥爭中都有一定作用。諸葛亮的《隆中對》對天下大勢的分析和提出聯吳抗曹的戰略便是典型的對策論。《孫子兵法》早就有“知己知彼，百戰不殆”的高論，更有“不戰而屈人之兵”的最優策略。孫武其實就是著名的策略思想家。博弈論的策略思維簡言之就是“瞭解對手如何戰勝你，然後戰而勝之”的科學。

生手怕熟手，熟手怕高手，高手怕千手，千手怕失手。正所謂一山還比一山高，能人背後有能人。生活就如同一個棋局，我們每個人都不是孤立存在的，上學時要努力爭取好的成績，歷經數年寒窗苦讀為備戰高考而博弈；工作後還要給自己充電，否則就可能因優勝劣汰而面臨失業；在人際交往中要想建立良好的人緣關係，做到遊刃有餘、左右逢源，就要學會用博弈的策略來武裝自己，使自己在為人處世時變得更加睿智、更加主動。

人的生存同樣與人的策略選擇有關。其實，生存就是一系列決策，正確的決策可以使決策者得到的利益最大化。錯誤的決策則會使決策者身陷泥淖難以自拔。博弈思維可以強化我們理性的行為選擇意識，增強自己的分析力，弱化對手的“理性判斷力”，透過資訊戰迷惑對手，打亂其陣腳，竭力避免自己做出錯誤選擇。

博弈思維法是思維方法中比較複雜、難以把握的方法。它具有理論中的多樣性和行動上的一次性特點。決策之前，思維主體應儘可能預測事態發展可能出現的一切情況，即“下棋看三步”，具有前瞻性，在此基礎上對比選擇最佳方案，付諸實施。博弈方法需要藉助於一定的心理分析。參加博弈的雙方其觀念中的多元選擇絕對保密，各自最後方案的決定又要依賴於對對手的分析、估測。因此，估計對手的實力固然很重要，但根據雙方以往交手的情況，揣摩對方現在的心理更為重要。可以說，這是一場心理的較量。正如麻將桌上的老手常對新手大傷腦筋一樣，倘若對手不按常理出牌，自己費盡心機的謀劃效果可能會大打折扣。

現在我們經常會遇到各種各樣的家電價格大戰，彩電大戰、冰箱大戰、空調大戰、微波爐大戰……這些大戰的受益者首先是消費者。每當看到一種家電產品的價格大戰，百姓都會“沒事兒偷著樂”。在這裡，我們可以解釋廠家價格大戰的結局也是一個“納什均衡”，而且價格戰的結果是誰都沒錢賺。因為博弈雙方的利潤正好是零。競爭的結果是穩定的，即是一個“納什均衡”。這個結果可能對消費者是有利的，但對廠商而言是災難性的。所以，價格戰對廠商而言意味著自殺。從這個案例中我們可以引伸出兩個問題，一是競爭削價的結果或“納什均衡”可能導致一個有效率的零利潤結局。二是如果不採取價格戰，作為一種敵對博弈論（vivalry game）其結果會如何呢？每一個企業，都會考慮採取正常價格策略，還是採取高價格策略形成壟斷價格，並盡力獲取壟斷利潤。如果壟斷可以形成，則博弈雙方的共同利潤最大。這種情況就是壟斷經營所做的，通常會抬高價格。另一個極端的情況是廠商用正常的價格，雙方都可以獲得利潤。從這一點，我們又引出一條基本準則：“把你自己的戰略建立在假定對手會按其最佳利益行動的基礎上”。事實上，完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。在這種狀態下，每一個廠商或消費者都是按照所有的別人已定的價格來進行決策。在這種均衡中，每一企業要使利潤最大化，消費者要使效用最大化，結果導致了零利潤，也就是說價格等於邊際成本。在完全競爭的情況下，非合作行為導致了社會所期望的經濟效率狀態。如果廠商採取合作行動並決定轉向壟斷價格，那麼社會的經濟效率就會遭到破壞。這就是為什麼WTO和各國政府要加強反壟斷的意義所在。

實際生活中的例子要比故事複雜得多，博弈思維大有用武之地，但必須避免機械地生搬硬套。項羽破釜沉舟、背水而戰，將士拼死而戰，置之死地而後生；馬謖在街亭之戰中也採用這個策略，在險地紮營，卻被阻斷水源，招致慘敗。