Dilema ng Bilanggo: Teorya, mga Baryasyon, mga Halimbawa, at mga Istratehiya

Huling pag-update: 22 Nobyembre, 2025
  • Ang dilema ng bilanggo ay naghaharap sa pagitan ng dominanteng estratehiya at ng Pareto optimum.
  • Sa paulit-ulit nitong bersyon, lumilitaw ang kooperasyon at ganting parusa.
  • Mga variant tulad ng manok o mga insentibo sa nuance ng larong tiwala.
  • Mga Aplikasyon: politika, pamilihan, trapiko, hustisya, at mga modelo ng AI.

Pagpapakita ng problema ng bilanggo

Sa puso ng teorya ng laro Mayroong isang maikli at nakakahumaling na kwento: dalawang kasabwat, magkahiwalay na interogasyon, at isang desisyong magpapabago sa lahat. Ang kuwentong iyan ay ang dilema ng bilanggo., isang simpleng balangkas na, gayunpaman, nagpapaliwanag ng lahat mula sa mga digmaan sa presyo sa mga oligopolyo hanggang sa pagsisikip ng trapiko o mga karera ng armas sa pagitan ng mga estado.

Higit pa sa halimbawa nito bilang pulis, ang dilema ng bilanggo ay pumipilit sa atin na isipin kung paano tayo kikilos gayong ang ating benepisyo ay nakasalalay din sa ginagawa ng ibang tao. Ang nakakagulat ay ang indibidwal na makatwirang pagpili Ito ay humahantong sa isang kolektibong resulta na hindi gugustuhin ninuman kung ito ay maaaring pagtugmain. Kaya naman ang larong ito ay sumasaklaw sa iba't ibang disiplina: ekonomiks, agham pampolitika, sosyolohiya, evolutionary biology, neuroscience, at, parami nang parami, ang pag-aaral ng pag-uugali ng artificial intelligence.

Klasikong kahulugan at kwento

Isipin mong inaresto ng pulisya ang dalawang suspek at hindi sila pinakialaman. Pareho ang trato na inaalok nila sa bawat isaKung aamin ka at nanatiling tahimik ang isa, mapapalaya ka at ang isa naman ay tatanggap ng 10 taon; kung pareho kayong aamin, bawat isa ay tatanggap ng 6 na taon; kung wala sa dalawa ang aamin, maaari lamang kayong sentensyahan ng 1 taon para sa mas mababang kaso. Ang mahalaga ay hindi kayo maaaring makipag-usap sa isa't isa, ni hindi kayo maaaring lubos na magtiwala sa isa't isa kahit na kayo ay mag-usap.

Ang iskemang ito ay maaaring ipakita sa anyo ng isang decision matrix upang mailarawan ang mga resulta kapag ang bawat tao ay pumili sa pagitan ng pakikipagtulungan (pananatiling tahimik) o pagtalikod (pag-amin). Ito ang balangkas ng laro na may libu-libong praktikal na aplikasyon.

Umamin ka Nanatili kang tahimik
Inamin niya Pareho: 6 na taong gulang bawat isa Ikaw: 10 taon; Siya: libre
Nanatili siyang tahimik Ikaw: malaya; Siya: 10 taon Pareho: 1 taon bawat isa

Kung ipagpapalagay natin na ang bawat bilanggo ay naghahangad lamang na bawasan ang kanilang sariling sentensya, ang pangangatwiran ay diretso: Kung sa tingin mo ay mananahimik ang kausap mo, ang pagtataksil sa kanya ang magpapalaya sa iyo.Kung naniniwala kang aamin siya, ang pagpapaalam ay makakabawas sa iyong sentensya mula 10 hanggang 6 na taon. Samakatuwid, ang pag-amin ang nangingibabaw na estratehiya sa parehong kaso.

Matrix ng pagbabayad at mga kanonikal na kondisyon

Ang laro ay nagpapahintulot ng iba't ibang numerikal na iskala kung ang istruktura ng insentibo ay iginagalang. Ang pangunahing kondisyon ay T > R > C > P, kung saan ang T (tukso) ay ang kabayaran para sa pag-iwan kapag ang isa ay nakikipagtulungan, ang R ay ang gantimpala para sa mutual na kooperasyon, ang C ay ang parusa para sa mutual na pag-iwan at ang P ay ang kabayaran ng pinsan (pakikipagtulungan kapag ang isa ay humiwalay).

Sa mga tuntunin ng positibong mga utility, ang isang tipikal na canonical matrix ay: (3,3) makipagtulungan–makipagtulungan(5,−5) at (−5,5) kapag ang isa ay nagkakamali at ang isa naman ay nagtutulungan, at (−1,−1) para sa mutual defection. Bukod pa rito, para sa iterated na bersyon, ang (T + P)/2 < R ay karaniwang kinakailangan, na nagbibigay-insentibo sa pagpapanatili ng kooperasyon sa pangmatagalan.

Makipagtulungan disyerto
Makipagtulungan 3, 3 -5, 5
disyerto 5, -5 -1, -1

Kung isasalin natin ito sa wikang "panalo-panalo," ang pagtutulungan ay kapaki-pakinabang para sa pareho; ang pagsasamantala sa isang kooperatiba ay nag-iiwan ng "malaking pakinabang" para sa isa at malaking pagkalugi para sa isa pa, at Kapag pareho silang tumanggi, pareho silang talo.bagama't walang lumalabas na kasing sama ng pinagsamantalang "pinsan".

Nangingibabaw na estratehiya, Nash at Pareto

Ang pagiging dominante ng bawat manlalaro sa pag-amin ay nagpapahiwatig na ang ekilibriyo ng Nash ay "parehong umaamin". Ang tunggalian ay hindi ito episyente sa Pareto.Dahil may isa pang sitwasyon (kapwa nananatiling tahimik) na makakabuti sa magkabilang panig nang hindi nakakasama sa sinuman. Doon lumilitaw ang dilemma.

Kung susuriin natin batay sa kagalingan ng magkasanib na grupo, ang layunin ay bawasan ang kabuuang bilang ng mga taon ng sentensya, na kinabibilangan ng pananatiling tahimik nilang dalawa. Ang pamantayang panlipunan at ang indibidwal na tunggalianAng mga bagay na nagpapalaki sa sariling interes ng isang tao sa maikling panahon ay humahantong sa mas masamang pangkalahatang resulta.

Bilanggo A Bilanggo B A (parusa) B (parusa) total
Hindi para umamin Hindi para umamin 1 taon 1 taon 2 taon
Hindi para umamin Upang magtapat 10 taon 0 taon 10 taon
Upang magtapat Hindi para umamin 0 taon 10 taon 10 taon
Upang magtapat Upang magtapat 6 taon 6 taon 12 taon

Ang banggaang ito ay nagmumungkahi ng isang indibidwal na gastos sa pagkakataon kapag kumikilos para sa kabutihang panlahat: mga pagtalikod sa "zero years now" kapalit ng isang taon na maiiwasan ang mas masahol na resulta para sa pareho. Para sa maraming teorista, ang pagtutol sa "ang isa ay dapat maging altruistiko" ay etikal, hindi siyentipiko; ang iba ay sumasagot na kung walang moral na ugnayan at mga pamantayang panlipunan, ang kooperasyon ay hindi magiging praktikal.

Paulit-ulit na bersyon: katumbasan, parusa, at kapatawaran

Nagbabago ang problema kapag paulit-ulit ang mga interaksyon. Sa paulit-ulit na dilema ng bilanggo (IPD) Mayroong alaala ng mga nakaraang pag-uugali, ang posibilidad ng pagpaparusa at pagbibigay ng gantimpala, at ang mga pinto ay nagbubukas para sa matatag na kooperasyon.

Nag-organisa si Robert Axelrod ng mga paligsahan sa kompyuter kung saan nagpaligsahan ang mga awtomatikong estratehiya. Ang pinakasikat ay ang "Tit for Tat" (give and take). makipagtulungan muna, saka gayahin ang galaw ng kalabanGumana ito dahil sa kanyang kabaitan (hindi siya nagsisimula ng mga siklo ng parusa), ang kanyang kakayahang gumanti, at ang kanyang kalinawan, na nagpapadali para sa ibang tao na "maunawaan ang mga patakaran ng laro."

Sa maingay na kapaligiran (mga maling interpretasyon ng mga dula), isang variant na may paghingi ng tawad —na kung minsan ay nangyayari pagkatapos ng isang atake—ay nakakatulong na makawala sa mga siklo ng pagtalikod. Maliit na pagkakataon ng pagpapatawad (1–5%) ang napatunayang epektibo, lalo na kapag naputol ang komunikasyon.

Kapag alam na nang maaga na magkakaroon ng eksaktong N na round, ang induktibong pangangatwiran ay nagtutulak sa isa na lumihis mula dulo hanggang sa simula. Upang mapanatili ang kooperasyon, dapat na hindi tiyak ang hinaharap. o random, o mga round "nang hindi alam kung ilan ang natitira".

Dinamika ng populasyon at ang ebolusyon ng kooperasyon

Ang mga simulasyon na may mga populasyon kung saan ang mga estratehiyang may mababang iskor ay "nawawala" at ang mga matagumpay ay "nagpaparami" ay nagpapakita na mga halo-halong taktika Kaya nilang patatagin ang kooperasyon. Sa mga ekosistemang iyon, ang pangkalahatang poot ay karaniwang mas masahol pa kaysa sa resiprosidad.

Ang pangunahing tanong ay kung paano lumilitaw ang altruismo sa konteksto ng natural na seleksyon. Ang DPI ay nag-aalok ng isang makatwirang mekanismoAng pagiging kooperatiba, ngunit may mabuting pakikisama kung kinakailangan, ay maaaring mapakinabangan nang husto ang pangmatagalang pansariling interes.

Cognitive neuroscience at mga senyales ng kooperasyon

Naobserbahan ng mga pag-aaral sa cognitive neuroscience ang mabilis na mga signal ng utak kasunod ng bawat pag-ikot ng DPI na Inaabangan nila ang susunod na desisyon.Sa mga sitwasyon ng mutual na kooperasyon, lumilitaw ang mga padron (mga delta suppression na nauugnay sa mga prosesong motivational at homeostatic) na humuhula sa bilis ng pagbabalik sa kooperasyon.

Mga halimbawa sa totoong mundo: politika, palakasan, trapiko, at hustisya

Ugnayang pandaigdig: dalawang estadong nahaharap sa isang paligsahan sa armas. Bawat isa ay nangangatuwiran na ang pagtaas ng paggastos ay "ang ligtas na gawin" nang hindi pinag-aalinlanganan ang pangako ng isa na bawasan ito. Resulta: pagpapalawak ng militar na nag-iiwan sa pareho sa mas masamang posisyon kaysa sa isang kapani-paniwalang kasunduan.

Breakaway cycling: dalawang siklista na nangunguna ang nakikinabang sa pamamagitan ng pagpapalit-palit ng puwersa laban sa hangin. Kung "sasamantalahin" ng isang tao ang gulong Habang humihila ang isang siklista, ang isa naman ay maaaring tumakbo nang mabilis sa dulo at manalo, ngunit kung wala sa kanila ang humihila, mahuhuli sila ng peloton. Malinaw ang pagkakatulad ng problema.

Mga interseksyon na hindi prayoridad: kapag ang lahat ay nagbigay ng kanilang turno at nag-coordinate, ang daloy ay matatag. Kung may palihim na pumasok habang tumutulong ang lahat, ay nagkakaroon ng pansamantalang kalamangan; kung susubukan ng lahat na mauna, hindi maiiwasan ang pagsisikip ng trapiko.

Mga oligopolyo at digmaan sa presyo

Mag-isip ng dalawang kompanya na nagbebenta ng isang produkto at nag-aalangan sa pagitan ng mataas na presyo (€10) o pagbaba nito (€8). Kung pareho kayong magtatago ng €10Hinahati nila ang mga benta at bawat isa ay kikita ng €500.000. Kung ang isa ay bababa sa €8 at ang isa ay mananatili sa €10, ang isa na bababa ay kikita ng €640.000 at ang isa naman ay €200.000. Kung pareho silang bababa, bawat isa ay kikita ng €400.000.

Ang bawat kompanya ay nangangatuwiran na, anuman ang gawin ng karibal, ang pagbaba ang nangingibabaw na trendAng resulta (€8, €8) ay mas nakahihigit sa bawat isa ngunit mas malala sa pangkalahatan kaysa sa (€10, €10). Muli, ang klasikong tanda ng dilema: ang kompetitibong ekilibriyo ay hindi tumutugma sa pangkalahatang pinakamainam.

Telebisyon at mga laro: Kaibigan o Kaaway at Maghiwalay o Magnakaw

Sa format na "Kaibigan o Kaaway," dalawang kalahok ang pipili ng "kaibigan" (makikipagtulungan) o "kaaway" (disyerto). Kung pareho silang magkaibigan, pareho silang nagbabahagiKung ang isa ay kaaway at ang isa naman ay kaibigan, kinukuha ng kaaway ang lahat; kung pareho silang magkaaway, walang kukuha ng kahit ano.

Ang kakaiba ay ang bayad kapag ang parehong disyerto ay kasabay ng "Ako ay isang pinagsamantalang kolaborador" (zero para sa akin). Ginagawa nitong neutral na ekilibriyo ang estado ng mutual desertionNasa pagitan ito ng isang karaniwang problema at isang laro ng manok. Sa "Split or Steal," ang lohika ay magkatulad at sinusubok ang kredibilidad ng mga naunang berbal na kasunduan.

Mga malapit na kaugnay na variant: inahin at larong tiwala

Binabago ng laro ng manok ang pagkakasunod-sunod ng mga hindi magagandang resulta: Ang pag-iwan sa isa't isa ang pinakamasama sa lahatAng pakikipagtulungan kapag umaalis ang kabilang partido ay nakakaiwas sa isang direktang banggaan, at samakatuwid ang estratehikong istruktura ay naiiba sa klasikong dilema.

  • Parehong nagtutulungan: +5 at +5.
  • Ang isa ay nakikipagtulungan at ang isa naman ay tumatanggi: ang nakikipagtulungan +1, ang tumatanggi +1 + 10.
  • Pag-alis sa isa't isa: −20 at −20, ang pinakamasamang resulta.

Ang laro ng tiwala ay sunod-sunod: ang isang manlalaro ay magpapadala ng bahagi ng $10, ang halagang iyon ay triplehin para sa pangalawang manlalaro, na siyang magpapasya kung magkano ang ibabalik. Sa isang ikot lang, ang rasyonal na ekwilibriyo ay "huwag magpadala"Ngunit ang ekilibriyong panlipunan ay nangangailangan ng tiwala at resipros. Kung mauulit sa paglipas ng panahon, ang kooperasyon ay maaaring maging matatag.

Trahedya ng mga karaniwang tao at kooperasyon sa malalaking grupo

Kapag maraming ahente ang naghahati sa isang mapagkukunan—mga pastulan ng komunidad o isang malinis na kapaligiran—bawat isa ay may insentibo na samantalahin ito nang hindi binabayaran ang halaga nito. Kung lahat ay sumusuko sa tuksoAng likas na yaman ay nasisira at lahat ay natatalo: ito ang trahedya ng mga karaniwang tao (Hardin).

Kung ilalapat sa lohika ng dilema, si T ay nagtatamasa ng kabutihang panlahat nang libre, si R ay nakikipagnegosasyon sa mga bayarin upang mapanatili ito, si C ay ang pagkasira ng pinagkukunang-yaman, at si P ay ang halaga ng pagiging isang "pinsan" na sumusuko habang ang iba ay hindi. Iminungkahi ang pribatisasyon o paghihigpit sa pag-access bilang isang paraan upang basagin ang insentibo sa labis na pagsasamantala, bagama't ipinapakita ng ebidensyang etnograpiko na ang mga pamantayan, edukasyon, at kaugalian ng komunidad ay maaaring magpanatili ng kooperasyon nang walang malakas na panlabas na pamimilit.

Para kay Derek Parfit, ang mga talagang kawili-wiling kaso ay iyong mga umaasa sa maraming kalahok, kung saan Ang pag-iwan nang mag-isa ay halos walang nababago. At samakatuwid, nagiging "makatuwiran" ang hindi makipagtulungan. Binigyang-diin ni Paula Casal na napreserba ng mga katutubong komunidad ang mga karaniwang kabutihan salamat sa mga institusyong panlipunan, na siyang bumabalanse sa fatalismo.

Etika, mga pagpapahalaga at ang kritisismo ng makitid na "pagkamakatwiran"

Isang karaniwang interpretasyon ng dilema ang nagsasabing tanging ang pagbabago sa mga pinahahalagahan—mula sa purong pansariling interes tungo sa pagmamalasakit sa kabutihang panlahat—ang siyang pumipigil sa kolektibong pagsira sa sarili. Ang tugon ng ilang teorista ng laroGaya ng argumento ni Kenneth Binmore, ang pagtutol ay moral (Kantian), hindi teknikal: kinikilala na ng teorya na ang pinakamainam na hanay ay nakahihigit, inilalarawan lamang nito kung bakit maaaring hindi ito makamit.

Gayunpaman, sa pagsasagawa, ang patuloy na kooperasyon ay karaniwang nakabatay sa mga tuntuning hindi pangkontrata, mga kodigo moral o relihiyon na isinasaisip ang epekto ng pagtataksil at pinapadali ang koordinasyon, kahit na walang agarang panlabas na parusa.

Ang kaso nina "Adam at Bianca"

Sina Adam at Bianca ay magkahiwalay na ininteroga kaugnay ng kasunduang ito: kung ang isa ay umamin at ang isa ay nanatiling tahimik, ang nangumpisal ay mapapalaya at ang isa naman ay tatanggap ng 20 taon; kung pareho silang umamin, 5 taon bawat isa; kung wala sa kanila ang umamin, 1 taon bawat isa. Para kay Adan, nangingibabaw ang pag-amin Maniwala man siyang mananahimik si Bianca o aamin, ganoon din kay Bianca.

Kaya, ang balanse ay "parehong umaamin" na may tig-5 taon, kahit na Ang pagtutulungan ay magbibigay-daan sa kanilang dalawa na gawin ito sa loob ng 1 taonUmuulit ang padron anuman ang numerical scale, hangga't ang T > R > C > P ay iginagalang.

Isang "maling" problema: ang kaso ng Batman

Binanggit sa isang sikat na eksena sa pelikula ang problema ng bilanggo, ngunit ang tunay na laro ay mas katulad ng "manok". Mahalaga ang pagkakasunod-sunod ng mga desisyon at ang unang hakbang ay maaaring makasira sa resulta, na hindi nangyayari sa klasikong sabay-sabay na dilema na may mga dominanteng estratehiya.

Emosyonal na katalinuhan at pagkatuto sa HR.

Sa pagbuo ng pangkat, negosasyon, at pamumuno, ang paggaya sa dilema ng bilanggo ay nakakatulong upang maobserbahan kung paano natin binabalanse ang katwiran at emosyon. Paglalagay ng iyong sarili sa sitwasyon ng ibang taoAng pagbabasa ng mga palatandaan at pagbuo ng tiwala ay nagbabago ng mga resulta. Hindi ito tungkol sa "pagiging inosente," kundi tungkol sa pagdidisenyo ng mga konteksto kung saan ang kooperasyon ay napapanatili.

AI at ang problema ng bilanggo

Ang hangganan ay lumilipat patungo sa mga ahente ng AI na nakikipag-ugnayan sa isa't isa. Inilalarawan ng mga kamakailang pagsusuri kung paano ipinapakita ng malalaking modelo ng wika patuloy na "mga estratehikong bakas ng paa" sa mga senaryo ng dilemma ng bilanggo: ang ilan ay mas nakikipagtulungan, ang ilan ay mas matigas at mas mapaghiganti, at ang ilan ay mas mapagpatawad pagkatapos ng pagtataksil.

Halimbawa, naiulat na ang ilang modelo ng Google ay nagpapakita ng mas madaling ibagay na profile na "Machiavellian", habang Ang iba mula sa OpenAI ay mas nakikipagtulungan sa mga kapaligirang hindi kanais-naisNamumukod-tangi ang Claude (Anthropic) dahil sa kahandaan nitong muling itatag ang kooperasyon pagkatapos ng pagsasamantala. Ayon sa mga akdang ito, ang mga modelo ay nangangatuwiran tungkol sa abot-tanaw ng panahon at mga taktika ng kalaban, na nagbubukas ng pinto sa isang "sikolohiya ng mga makina."

Kasabay nito, ang mga kontroladong eksperimento ay nagturo sa mga hindi inaasahang pag-uugali na nasa ilalim ng banta—tulad ng mga pagtatangka ng blackmail—na nagbibigay-diin sa pangangailangan para sa mga pamantayan sa seguridad, transparency at pamamahala habang ang mga sistemang ito ay nakikipag-ugnayan sa mga tao at sa isa't isa.

Mga paligsahan, sabwatan at "mga lihim na pagbati"

Sa ika-20 anibersaryo ng mga torneo ng DPI (2004), isang koponan mula sa Southampton ang nagpakita ng maraming bot na nakilala ang isa't isa gamit ang mga pattern ng mga paunang pag-play ("mga pagbati"). Kung natukoy nila ang "pamilya"Isinakripisyo ng ilang manlalaro ang kanilang mga sarili sa pamamagitan ng palaging pakikipagtulungan upang mapakinabangan ang iskor ng iba sa kanilang grupo; kung hindi man, pinaparusahan nila ang iba sa pamamagitan ng hindi pag-iskor. Sinunod ng estratehiya ang mga patakaran at ipinakita kung paano maaaring magkaroon ng bias ang hindi direktang komunikasyon sa mga kompetisyon.

Mga tala tungkol sa maling komunikasyon

Sa pagsasagawa, kung minsan ang "makipagtulungan" ay binibigyang-kahulugan bilang "pag-alis" dahil sa ingay sa signal. Nariyan ang kinakalkulang pagpapatawad Naiiwasan nito ang paulit-ulit na pagpaparusa, na nagpapahintulot sa muling pagtatatag ng kooperasyon. Ito ang isa sa mga dahilan kung bakit epektibo ang pagsusuntukan na may pagpapatawad sa maingay na kapaligiran.

Paano ito hitsura "mula sa itaas": social optima

Kung ating i-maximize ang pinagsamang kapakanan (ang kabuuan ng mga bayad sa pareho), ang mutual na kooperasyon ay mananalo nang husto laban sa mga siklo ng pagtakas. Ang problema ay ang pagdidisenyo ng mga mekanismo —reputasyon, pag-uulit, mga parusa, mga kontrata, mga tuntunin—na ginagawang pinakamahusay na landas ang kooperasyon para rin sa pansariling interes.

Mabilisang gabay sa pagbasa at bibliograpiya

Para mas malalim na masuri, ang mga klasiko ay ang Axelrod (ebolusyon ng kooperasyon), Hofstadter (mga paligsahan at pangangatwiran), Poundstone (kasaysayan at konteksto ni von Neumann), at ang akda nina Grofman at Pool (mga modelong Bayesian). Ang pilosopikal na aspeto ay tumatagos kay Derek Parfit at, sa konteksto ng mga karaniwang tao, sa debate sa pagitan ng mga institusyonal na pamamaraan at mga solusyon sa komunidad.

Kung titingnan nang mahinahon, ang dilema ng bilanggo ay hindi gaanong palaisipang matematikal kundi isang salamin ng ating mga ugnayan: kung ang hangad lang natin ay agarang kitaMas malala ang ating kalagayan kaysa kung tayo ay sumasang-ayon sa mga patakaran, maingat na nagtitiwala, at nagpaparusa kung kinakailangan. Mula sa mga kathang-isip na bilangguan hanggang sa mga totoong pamilihan, mula sa trapiko hanggang sa AI, ang pag-unawa sa tensyong ito ay nakakatulong sa atin na gumawa ng mas matalino, at marahil ay mas makataong, mga desisyon.

Ano ang teorya ng laro?
Kaugnay na artikulo:
Teorya ng laro: kahulugan, mga halimbawa, kasaysayan, at mga gamit sa totoong mundo