Page 8 - Science Focus (issue20)
P. 8

人類總是令人失望。無論是做分組作業還是解決全球                               博 弈 論 中 的 遊 戲 有 著 一 個 均 衡 點(equilibrium​                     跟你「合作」;如果朋友採用的策略也是重複對方上回合選                            結了雙方走不同路線下美軍可以進行襲擊的日數:
        暖化問題,我們心裡雖然知道要跟別人合作才能做好一件                             point),又名納 許均衡(Nash​equilibrium;註一):那                            擇的話,你們倆就能一直「合作」,實現遊戲中最理想的結局。
        事情,但是最後總是會為了一己私利,令最理想的情況無法                            發生在兩名玩家都對遊戲結果感到滿意,而不會改變他們                                                                                               可以進行襲擊的日數           日軍:北航道           日軍:南航道
        出現。可是為什麼人類會這樣做呢?數學中的博弈論也許                             策略的時候​[1]。在這情況下,遊戲已經自然而然地達到                                         然而,這情境未免過份理想化;畢竟在現實世界中,人總                                                   2天              2天
        能解答你的問題。                                              了最適的(optimal)結果,這結果也稱為這局遊戲的價值                                    會犯錯。假設你繼續使用能令你致勝的策略(即是重複對方                                美軍:北航道

                                                                                                                               上回合的選擇),但對方不時會因為不小心搞錯而在某些回
                                                              (game​value)。所以在囚犯困境裡的確存在著一個「最
            要介紹博弈論,就讓我們先來看看一個只有一回合的                           好」的解決方法,也就是說,這遊戲的優勢策略(dominant​                                  合作出錯誤的選擇,那你仍能勝出遊戲嗎?現在讓我們回到                                美軍:南航道               1天              3天
        的遊戲。假設你是一名囚犯,獄警為了取得情報,不斷引誘                            strategy)是「背叛」;可是,它並不會帶來最好的結果。                                   模擬器,如果遊戲中普遍都是不太靠譜的對手,他們有百分
        你告發另一個同樣被關在獄中的朋友。如果你和朋友都保                                                                                              之五的機會會在每回合犯錯,而一半人的策略是只會背叛對                                根據以上列表,我們知道日軍會採取北航道,以儘量減
        持緘默,他們就不會有足夠證據,你和朋友都只會面臨一年                                但是在現實生活中,我們每天都需要作出不同的決定。                                     手,其他人則採取其他不同策略的話,那麼你的致勝策略將                            少受襲的日數(註三);另一方面,對美軍而言兩條航道都沒
        刑期;只要你們其中一個招供,對方就得面臨三年刑期,而                            如果「遊戲」不止得一局,將會發生什麼情況?可以告訴你                                       會是:在被對手連續兩次背叛後選擇「只會背叛」。可是隨                            有一條有特別優勢,因此如果純粹考慮上述推論,在日軍可
        告密者則會被釋放;如果你們互相吿發對方,你們都會被                             的是,當「遊戲」多於一回合時,不停地背叛對手未必是「遊                                      著對手犯錯的機率提升,殘酷的現實是,最後的贏家將會是                            能會走北航道的情況下,同樣選擇北航道是較明智的選擇。
        監禁兩年。壞消息是:在獄中,你無法和朋友商量決定。                             戲」的優勢策略,而我們有著不少新的策略,譬如在不同回                                       永遠背叛對手的玩家。如果你細心想想,這個故事暗示了現                            現實上,兩軍也的確走了北航道,盟軍對日軍進行了兩天的
        這時候,你會怎樣做呢?                                           合中隨機選擇「合作」和「背叛」,或者重複朋友上一回合                                       實世界上溝通的重要性,溝通最好是清晰準確的;少許誤會                            持續空襲,成功阻止了日軍佔領新畿內亞。這就是博弈論的
                                                              的選擇;你可以選擇純策略(根據一個預先制定的計劃行                                        也許會得到原諒,但重重的誤解卻會引起人與人之間廣泛                             精彩之處:它不只是數字上的分析,而是能應用至歷史或生
            這就是著名的囚犯困境(prisoner’s​dilemma):如                  事)或混合策略(涉及利用機率去選擇策略)[2]。為了方便                                     的猜疑​[3]。
        果你一味只顧保護自己利益,最好的結局將不會發生。任何                            解說,我們可以把上面的遊戲重整一下,將刑期變成一場賭                                                                                             物學的層面。
        渴望得到自由的人都會選擇背棄朋友,因為如果朋友沒有                             博分數的遊戲​—​因為胡亂調整刑期有點奇怪,而且我們現                                         看到這裡,你可能認為現實生活根本和這些遊戲沒有關                               你可能會問,在這樣的情況下,我們應該怎樣是好?事
        告發你而你告發他,你將會馬上得到自由;如果朋友告發你                            在能夠扣減分數。                                                         係​—​我們不會每天被拷問,也不需要每天押下賭注​—​但                          實上,我們在現實生活中面對的往往都不是零和遊戲,雖
        的話,那你更應該要告發他,因為至少你可以早一年出獄。                                                                                             博弈論厲害的地方是它能夠跨越數學和社會科學,不少理                             然不少人的認知仍然停留在零和遊戲的層面上​[3],但是
        然而,這遊戲最理想的情況是你們都保持緘默,然後大家                                           朋友:合作(付出:1)        朋友:背叛(付出:0)                     論學者嘗試過利用博弈論分析歷史上的重大決定。值得關                             你的快樂的確不需要建構在別人的痛苦上,因為事情總有
        在一年後重獲自由。你擔心朋友會出賣你的這份恐懼(又或                                                                                             注的例子當然有第二次世界大戰,因為在戰爭中,往往不是                            著雙贏的辦法。這可能聽起來像陳腔濫調:我們應該去尋
        是你打從心底對自由的渴望)會驅使你背叛你親愛的朋友。                               你:合作         你:+2               你:-1                          你死就是我亡,交戰雙方沒有折衷的餘地,因此戰爭是教科                            找能達致雙贏的辦法,事情往往有協商的餘地,你也不用
                                                                 (付出:1)       朋友:+2              朋友:+3                         書中典型分析均衡點的例子。我們通常稱這種情形為零和                             為了抬高自己而貶低別人。

                          朋友:合作             朋友:背叛                             你:+3               你:0                           遊戲(zero-sum​game),當中一方的得益將無可避免地造
                                                                 你:背叛
                          你:1年刑期            你:3年刑期               (付出:0)                                                        成對方的損失,這與文初提及的囚犯困境有所不同,因為現
            你:合作                                                              朋友:-1              朋友:0                          在「合作」並不是一個選項。                                         1​ 納許均衡以數學家John​Nash(1928–2015)命名。John​Nash是一位對博
                          朋友:1年刑期           朋友:獲得自由                                                                                                                                    弈論和幾何學影響深遠的數學家,前者使他贏得1994年諾貝爾經濟學獎;電

                          你:獲得自由            你:2年刑期                如果你不想自己著手計算的話,我們可以將這個情境輸                                        在二戰中的俾斯麥海海戰,一位日本上將被迫選擇北邊                             影《有你終生美麗》中的主角亦是以他作為藍本。
            你:背叛                                              入電腦程式(註二),然後讓它運行數回合,看看會發生什                                       或南邊其中一條航道 [4]。美國上將 George​Kenney 嘗試                   2​ 你可能會想自己親手操作一下模擬器,另外亦正是它啟發了本文的創作:
                          朋友:3年刑期           朋友:2年刑期           麼事情。我們會發現,這次遊戲的最終贏家採用的致勝策                                        預測日軍的路線,以便盟軍能對日本海軍進行更持續的轟                               https://ncase.me/trust/​
                                                              略是重複對方上一回合的選擇。古語有云:「己所不欲,勿                                       炸。簡單而言,日軍希望減少被轟炸的日數,而美軍則希望                            3​ 從日軍的角度考慮,如果美軍選擇北航道的話,南北兩條航道都一樣危險;可
                                                                                                                                                                                       是如果美軍走南航道的話,日軍選擇北航道會比較安全。因此整體而言,走
                                                              施於人」​—​它似乎能簡潔地總結這場遊戲。如果你想贏                                       進行最持久的轟炸。兩條航道的航程均為三天,但美軍的攻                              北航道對於日軍而言是上策。
                                                              的話,最好第一回合就選擇「合作」,因為你也希望朋友會                                       擊計劃受不同因素限制,例如北航道的低能見度等。下表總





                                                                                                                                 References 參考資料:
                                                                                                                                 [1] Pilkington, A. (2016). Optimal Mixed Strategy for Zero-Sum Games. Personal Collection
                                                                                                                                    of A. Pilkington, University of Notre Dame, Notre Dame, IN, USA. Retrieved from
                                                                                                                                    https://www3.nd.edu/~apilking/math10170/information/Lectures/16%20Optimal%20
                                                                                                                                    Mixed%20Strategy.pdf
                                                                                                                                 [2] Manea, M. (2016) Strategic-Form Games: Dominated Strategies, Rationalizability,
                                                                                                                                    and Nash Equilibrium; Epistemic Foundations. Personal Collection of M. Manea,
                                                                                                                                    Massachusetts Institute of Technology, Cambridge, MA, USA. Retrieved from https://
                                                                                                                                    ocw.mit.edu/courses/economics/14-126-game-theory-spring-2016/lecture-notes/
                                                                                                                                    MIT14_126S16_gametheory.pdf
                                                                                                                                 [3] Case, N. (2017, July). The Evolution of Trust: Feetnotes. Retrieved from https://ncase.
                                                                                                                                    me/trust/notes/
                                                                                                                                 [4] Cornell University. (2016, September 16). Game Theory in World War 2. Retrieved from
                                                                                                                                    https://blogs.cornell.edu/info2040/2016/09/16/game-theory-in-world-war-2/









                                                                                                                                                                                                                                       7
   3   4   5   6   7   8   9   10   11   12   13