囚徒困境：在競爭與合作之間取得平衡

ETH储备银行 · 2026-02-24T15:00:40+00:00

重點摘要囚徒困境說明了自私行為如何導致次佳的結果。在囚徒困境中，合作並不總是符合個人最佳利益。在商業中，識別囚徒困境有助於平衡競爭與合作。艾伯特·塔克

ETH储备银行

2026-02-24 15:00:40

主要重點

囚徒困境說明了自私行為如何導致次佳的結果。
在囚徒困境中，合作並不總是符合個人最佳利益。
在商業中，識別囚徒困境有助於平衡競爭與合作。
艾伯特·塔克（Albert Tucker）於1950年將囚徒困境引入博弈論。
囚徒困境展示了個人決策如何影響團體結果。

獲取基於27年以上可信專業經驗的個性化AI解答。

詢問

囚徒困境是由麥瑞爾·弗拉德（Merrill Flood）和梅爾文·德雷舍（Melvin Dresher）於1950年在蘭德公司（Rand Corporation）提出的悖論。後來由加拿大數學家艾伯特·威廉·塔克（Albert William Tucker）正式化並命名。

囚徒困境基本上提供了一個理解如何在合作與競爭之間取得平衡的框架，這些概念有時也能成為策略決策的有用工具。因此，它在商業、金融、經濟、政治科學乃至哲學、心理學、生物學和社會學等多個領域都有應用。

VioletaStoimenova / Getty Images

解釋囚徒困境

囚徒困境的情境如下：兩名嫌疑人因犯罪被捕，分別在警察局的不同房間，無法相互溝通。檢察官分別告知他們以下內容：

如果你認罪並同意作證指控另一名嫌疑人，而他不認罪，你的指控將被撤銷，你將獲得自由，而另一人將服三年刑期。
如果你不認罪，但另一人認罪，你將被判刑三年，而他將獲得自由。
如果你們都認罪，雙方都將被判兩年監禁。
如果你們都不認罪，雙方都將被控輕罪，判一年監禁。

嫌疑人應該怎麼做？這就是囚徒困境的核心。

囚徒困境的基本原則

要使囚徒困境悖論成立，必須具備一些基本概念，包括：

**必須有兩個玩家。**情境涉及兩個個人或實體，他們共同牽涉在一個情境中，例如共同犯罪或面臨共同決策。
**決策同時進行。**雙方在不知對方選擇的情況下作出決定。這種同步決策是此悖論的關鍵，因為每一方都必須在不知道對方決策的情況下做出選擇。
**必須有多種結果組合。**收益矩陣是一個表格，列出雙方可能的選擇組合及其對應的結果或收益，幫助可視化不同決策的後果。稍後我們會詳細介紹收益矩陣。
**可以是互相合作或互相背叛。**玩家可以選擇合作（追求雙贏結果）或背叛（追求自我利益）。囚徒困境的張力來自個人利益與集體利益之間的衝突。
**每個玩家都有一個優勢策略。**該策略是無論對方選擇何種，都能帶來最佳結果的選擇。這個優勢策略通常是理性選擇，但若雙方都採用，則可能導致次佳結果。
**假設玩家是理性決策者。**這意味著人們傾向於最大化自身利益。這一假設是博弈論和理性選擇模型的基本前提，驅動選擇之間的衝突。

評估最佳策略

讓我們先建立一個收益矩陣，如下表所示。這裡的“收益”以監禁時間長短（用負號表示；數字越大越好）來衡量。“合作”和“背叛”分別代表嫌疑人合作（例如都不認罪）或背叛（其中一人認罪而另一人不認罪）。格子（a）到（d）中的第一個數字是嫌疑人A的收益，第二個是嫌疑人B的收益。

囚徒困境 – 收益矩陣
嫌疑人B




合作
背叛
嫌疑人A
合作
(a) -1, -1
© -3, 0

背叛
(b) 0, -3
(d) -2, -2

優勢策略是指不論對方採取何種策略，都能為自己帶來最大利益的策略。在此情境中，雙方都選擇背叛（認罪）是理性行為，因為認罪能最小化平均監禁時間。以下是可能的結果：

如果A和B都合作（都不認罪），都判一年（見格子（a））。
如果A認罪但B不認罪，A獲得自由，B服三年（見格子（b））。
如果A不認罪但B認罪，A服三年，B獲得自由（見格子（c））。
如果雙方都認罪，雙方都判兩年（見格子（d））。

所以，如果A認罪，他們可能獲得自由或兩年監禁；如果不認罪，則可能獲得一年或三年監禁。B面臨的困境與此相同。

囚徒困境的後果

囚徒困境巧妙地展示了當每個人追求自身利益時，結果往往比雙方合作更糟。在上述例子中，合作（雙方都保持沉默、不認罪）會讓兩名嫌疑人都只服一年監禁，其他結果則是兩到三年的判刑。

在現實中，理性且只追求最大利益的人通常會選擇背叛，而非合作。如果雙方都假設對方不會背叛，結果會是格子（d）——兩人都背叛，最終都服兩年監禁。

在囚徒的例子中，合作（不認罪）能避免三年的最高刑期，而認罪則可能在最好的情況下讓人獲得自由，最壞情況則是判兩年。背叛的最大風險是被判三年，尤其當A對B保持沉默的信心被打破，B卻認罪（反之亦然）。

這種激勵背叛（不合作）但合作可能帶來最佳結果的困境，在商業和經濟中以多種方式展現。

快速事實

艾伯特·塔克（Albert Tucker）於1950年首次向史丹佛大學的研究生心理學學生展示囚徒困境，作為博弈論的範例。

商業中的囚徒困境應用

在現實世界中，囚徒困境的經典例子是兩個競爭者在市場上的較量。許多行業中，主要競爭對手常常是兩家。例如，在美國，可口可樂（KO）與百事可樂（PEP）在軟飲市場激烈競爭，家得寶（HD）與勞氏（LOW）在建材領域。這些競爭在商學院中成為許多案例研究的題材。其他激烈的對手還包括加拿大的星巴克（SBUX）與Tim Horton’s（QSR），以及全球手機市場的蘋果（AAPL）與三星。

以可口可樂與百事可樂為例，假設前者考慮降價其標誌性汽水。如果降價，百事可能也不得不跟進以維持市場份額，這可能導致雙方利潤大幅下降。

任何一方的降價都可被視為背叛，因為它打破了保持高價和最大化利潤的默契協議。若可口可樂降價而百事保持高價，前者可能贏得更多市場份額並獲得額外利潤。

理解囚徒困境中的收益矩陣

假設可口可樂與百事的額外利潤如下：

兩者都保持高價，利潤各增加5億美元（由於需求正常增長）。
一方降價（背叛），另一方不降（合作），前者利潤增加7.5億美元，因為市場份額擴大，後者利潤不變。
兩者都降價，飲料銷量增加抵消降價損失，雙方利潤各增加2.5億美元。

利潤矩陣如下（數字以百萬美元的額外利潤表示）：

可口可樂 vs. 百事可樂 – 收益矩陣
百事可樂




合作
背叛
可口可樂
合作
500, 500
0, 750

背叛
750, 0
250, 250

其他常見的囚徒困境例子還包括新產品或技術開發，以及公司在廣告和市場推廣上的投入。

例如，兩家公司若在某年度默契保持廣告預算不變，則其淨收入可能保持在較高水平。但若一方背叛，增加廣告預算，則可能獲得更大利潤，因為銷售額的增加抵消了額外的廣告費用。然而，若雙方都增加預算，彼此的投入可能相互抵銷，導致效果不佳，利潤反而降低。

經濟中的囚徒困境應用

美國的債務僵局是囚徒困境的經典例子之一。

假設解決美國債務問題的效益是下一次選舉的選票數。合作意味著雙方願意維持現狀，控制不斷擴大的預算赤字；背叛則是採取更保守的措施，縮減支出。

如果雙方都合作，經濟能更順利復甦，選票也會增加。但如果A黨積極解決債務問題，而B黨不合作，B可能會失去選票，轉而支持A。

若雙方都選擇不合作，激烈的經濟動盪（股市下跌、信用評級下調、政府關門）可能導致雙方選票都受損。

如何運用囚徒困境？

囚徒困境可用於個人決策，例如買車、薪資談判等。

比如，你在看新車，走進經銷商。你的“收益”是滿意度（非數值），你希望以最低價格、最佳配置買到車，而銷售員則希望賣出最高價以獲取最大佣金。

合作意味著不議價，接受標價（銷售員滿意），買到車就走。背叛則是議價，追求更低價格。假設滿意度用0到10的數值表示，10代表完全滿意，0代表完全不滿意，收益矩陣如下：

買家 vs. 銷售員 – 收益矩陣
銷售員




合作
背叛
買家
合作
(a) 7, 7
© 0, 10

背叛
(b) 10, 0
(d) 3, 3

這個矩陣告訴我們什麼？如果你強硬議價，成功獲得大幅降價，滿意度可能最高，但銷售員可能不滿（失去佣金）。反之，如果銷售員堅持原價，你可能不滿，但他會較滿意。

如果你直接接受標價（格子a），滿意度較低，銷售員也可能不太滿意，因為你願意付全價可能讓他覺得可以賣更貴或多加點配備。

格子(d)則是雙方都經過長時間議價，最終妥協，滿意度都較低。

薪資談判也類似，不要第一個接受的報價（除非你確信自己值更多），因為這可能讓你損失潛在的更高收入。談判爭取更高薪資，可能拿到更豐厚的待遇；但如果雇主不願意調整，則可能不滿意最終結果。

希望薪資談判不要惡化，否則雙方都會不滿。前述買賣雙方的收益矩陣也可以擴展，顯示求職者與雇主的滿意度。

經濟中的囚徒困境範例

最後，談談囚徒困境在經濟學中的應用。一個宏觀經濟的例子是政府在經濟衰退時的財政政策。

當經濟衰退時，各國政府面臨是否採取擴張性財政政策以刺激經濟增長的抉擇。然而，這些政策的效果取決於其他國家的行動。

假設所有國家同步採取擴張性政策，全球需求增加，經濟可能復甦。但如果某國選擇保守策略，實行緊縮或削減預算，短期內可能較穩定，但全球經濟可能受損。

這情境類似囚徒困境：每個政府都必須決定是合作（共同推行擴張政策）還是背叛（採取緊縮措施）。若所有國家合作，全球經濟更有可能復甦；若有國家背叛，追求最大個人利益，則整體復甦受阻，結果對所有國家都不佳。

囚徒困境的解答是什麼？

沒有絕對正確的答案。它是一個悖論，展示了個人決策如何影響整體結果。

用簡單的話說，囚徒困境是什麼？

兩名囚犯面臨是否認罪或保持沉默的選擇，彼此無法溝通。每個人的選擇都會影響對方。如果一人認罪而另一人不認，認罪者獲得自由，另一人則判較長刑期；雙方都保持沉默，則都判較短刑期；雙方都認罪，則都判中等刑期。博弈論預測，通常人們會選擇對自己最有利的選項。

囚徒困境的最佳策略是什麼？

囚徒困境並不存在一個絕對的“最佳策略”或“答案”。它展示了兩個自利行為的實體，並不會為雙方產生最優的共同收益。

最終結論

囚徒困境告訴我們，追求個人利益並不總能帶來最佳結果。企業、政府和個人在行動時，考慮合作的可能性，可能會得到更好的整體結果。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

讚賞
點讚
留言
轉發
分享

留言

0/400

暫無留言

熱門話題
查看更多
#
BTC能否重返7萬美元？
3.38萬熱度
#
川普下令停用AnthropicAI產品
14.61萬熱度
#
深度創作營
8.22萬熱度
#
幣圈生存指南
8.15萬熱度
#
Gate廣場發帖領五萬美金紅包
47.75萬熱度

熱門 Gate Fun
查看更多

1
POCO
PocongMoon
市值:$0.1持有人數:0
0.00%
2
CYW
CyWhale
市值:$0.1持有人數:1
0.00%
3
派先锋看过来
派先锋看过来
市值:$0.1持有人數:0
0.00%
4
初代同事
初代同事
市值:$2410.34持有人數:1
0.00%
5
RIBBT
RibbIT
市值:$0.1持有人數:1
0.00%

囚徒困境：在競爭與合作之間取得平衡

主要重點

解釋囚徒困境

囚徒困境的基本原則

評估最佳策略

囚徒困境的後果

快速事實

商業中的囚徒困境應用

理解囚徒困境中的收益矩陣

經濟中的囚徒困境應用

如何運用囚徒困境？

經濟中的囚徒困境範例

囚徒困境的解答是什麼？

用簡單的話說，囚徒困境是什麼？

囚徒困境的最佳策略是什麼？

最終結論

熱門話題

BTC能否重返7萬美元？

川普下令停用AnthropicAI產品

深度創作營

幣圈生存指南

Gate廣場發帖領五萬美金紅包

熱門 Gate Fun

POCO

PocongMoon

CYW

CyWhale

派先锋看过来

派先锋看过来

初代同事

初代同事

RIBBT

RibbIT

置頂