Zatvorenikova dilema

S Wikipedije, slobodne enciklopedije
Idi na navigaciju Idi na pretragu

Zatvorenikova dilema je standardni primjer igre analizirane u teoriji igara koja pokazuje zašto dvije potpuno racionalne osobe možda ne sarađuju, čak i ako se čini da je to u njihovom najboljem interesu. Prvobitno su ga uokvirili Merrill Flood i Melvin Dresher dok je radio u RAND korporaciji 1950. godine. Albert W. Tucker je formalizirao igru sa nagradama za kaznu zatvora i nazvao je "zatvoreničkom dilemom", [1] predstavivši je na sljedeći način:

Dva člana kriminalne organizacije su uhapšena i zatvorena. Svaki zatvorenik je u samici bez mogućnosti komunikacije sa drugim. Tužioci nemaju dovoljno dokaza da osude par po glavnoj optužbi, ali imaju dovoljno da osude oboje po manjoj optužbi. Istovremeno, tužioci svakom zatvoreniku nude povoljnu ponudu. Svakom zatvoreniku se daje mogućnost ili da izda drugog svjedočeći da je drugi počinio zločin, ili da sarađuje sa drugim šutnjom. Mogući ishodi su:

  • Ako A i B izdaju jedan drugog, svaki od njih služi dvije godine zatvora
  • Ako A izda B, a B šuti, A će biti pušten na slobodu, a B će služiti tri godine zatvora
  • Ako A šuti, ali B izda A, A će služiti tri godine zatvora, a B će biti pušten na slobodu
  • Ako i A i B šute, obojica će odslužiti samo jednu godinu zatvora (po blažoj optužbi).

Podrazumijeva se da zatvorenici neće imati priliku da nagrađuju ili kažnjavaju svog partnera osim zatvorskih kazni koje dobiju i da njihova odluka sama po sebi neće uticati na njihov ugled u budućnosti. Kako izdaja partnera nudi veću nagradu nego saradnja s njim, svi čisto racionalni sebični zatvorenici će izdati onog drugog, što znači da je jedini mogući ishod za dva čisto racionalna zatvorenika da izdaju jedan drugog, iako bi međusobna saradnja donijela veće rezultate. [2]

U ovom slučaju, "izdati" se definira kao dominantna strategija za oba igrača. Dominantna strategija je najbolji odgovor jednog igrača na drugog i usklađena je sa principom Sigurne stvari. [3] Zatvorenikova dilema također ilustrira da odluke koje se donose pod kolektivnom racionalnošću ne moraju nužno biti iste kao one koje se donose pod individualnom racionalnošću, a ovaj sukob se može posmatrati i u situaciji koja se zove „Tragedija zajedničkog dobra“. Ovaj slučaj ukazuje na činjenicu da su javna dobra uvijek sklona prekomjernoj upotrebi. [3]

U stvarnosti, takva sistemska pristrasnost prema kooperativnom ponašanju se dešava uprkos onome što je predviđeno jednostavnim modelima „racionalne“ akcije u sopstvenim interesima. [4] [5] [6] [7] Ova predrasuda prema saradnji poznata je od kada je test prvi put sproveden u RAND-u; uključeni sekretari vjerovali su jedni drugima i radili zajedno za najbolji zajednički ishod. [8] Zatvorenikova dilema postala je fokus opsežnog eksperimentalnog istraživanja. [9] [10] Ovakva eksperimentalna istraživanja obično imaju jedan od ova tri oblika: pojedinačna igra, ponavljana igra i ponavljana igra protiv programiranog igrača, svaki s različitim svrhama. [3] Kao rezime ovih eksperimenata, njihovi rezultati opravdavaju Kategorički imperativ koji je postavio Kant, koji kaže da se od racionalnog agenta očekuje da "postupa na način na koji želite da drugi djeluju". Ova teorija je od vitalnog značaja za situaciju kada postoje različiti igrači, svaki koji djeluje u svom najboljem interesu, i mora uzeti u obzir tuđe postupke kako bi formirao svoj vlastiti izbor. Također, teorija ističe međusobnu povezanost igrača u takvoj igri, i na taj način naglašava činjenicu da strategija mora uzeti u obzir reakcije drugih kao uspješne, uključujući njihovu reakciju, njihovu sklonost imitiranju, itd. [3]

Postoji i proširena verzija igre. U ovoj verziji, klasična igra se igra više puta između istih zatvorenika, koji kontinuirano imaju priliku da kazne drugog za prethodne odluke. Ako je igračima poznat koliko puta će se igra odigrati, tada će (povratnom indukcijom) dva klasično racionalna igrača više puta izdavati jedan drugog, iz istih razloga kao i varijanta s jednim udarcem. U igri beskonačne ili nepoznate dužine ne postoji fiksna optimalna strategija, a održavaju se turniri dileme zatvorenika kako bi se takmičili i testirali algoritmi za takve slučajeve. [11]

Ponovljena verzija dileme zatvorenika je od posebnog interesa za istraživače. Zbog njegove iterativne prirode, prethodni istraživači su primijetili da se učestalost saradnje igrača može promijeniti, na osnovu rezultata svake iteracije. Konkretno, igrači mogu biti manje voljni da sarađuju ako njegov kolega nije sarađivao mnogo puta, što izaziva razočarenje. S druge strane, kako vrijeme prolazi, saradnja bi se mogla povećati uglavnom zahvaljujući činjenici da je uspostavljen "prešutni sporazum" između igrača. Još jedan interesantan aspekt u vezi sa ponovljenom verzijom eksperimenta, međutim, jeste da je ovaj prešutni sporazum između igrača uvijek bio uspješno uspostavljen iako je broj iteracija javno objavljen za obje strane. [3]

Igra dileme zatvorenika može se koristiti kao model za mnoge situacije u stvarnom svijetu koje uključuju kooperativno ponašanje. U povremenoj upotrebi, oznaka "zatvorenička dilema" može se primijeniti na situacije koje ne odgovaraju striktno formalnim kriterijima klasičnih ili iterativnih igara: naprimjer, one u kojima bi dva entiteta mogla ostvariti značajnu korist od saradnje ili pate od neuspjeha da to učine, ali smatraju da je teško ili skupo – ne nužno nemoguće – koordinirati svoje aktivnosti.

Dva zatvorenika su odvojena u zasebne prostorije i ne mogu međusobno komunicirati.

Pretpostavlja se da oba zatvorenika razumiju prirodu igre, nemaju lojalnost jedni prema drugima i da neće imati priliku za odmazdu ili nagradu izvan igre. Bez obzira na to šta drugi odluči, svaki zatvorenik dobija veću nagradu izdajući onog drugog. Obrazloženje uključuje analizu najboljih odgovora oba igrača: B će ili sarađivati ili odstupiti. Ako B sarađuje, A bi trebalo da defektira, jer je bolje otići na slobodu nego služiti godinu dana. Ako B defektira, A takođe treba da defektira, jer je bolje služiti 2 godine nego služiti 3. Dakle, u svakom slučaju, A bi trebalo da defektira pošto je prebjeg A-ov najbolji odgovor bez obzira na B-ovu strategiju. Paralelno razmišljanje će pokazati da bi B trebao defekt.

Budući da prebjeg uvijek rezultira boljom isplatom od saradnje, bez obzira na izbor drugog igrača, to je striktno dominantna strategija i za A i za B. Uzajamni prebjeg je jedina snažna Nasheva ravnoteža u igri (tj. jedini ishod iz kojeg bi svaki igrač mogao samo pogoršavaju jednostranom promjenom strategije). Dilema je, dakle, da međusobna saradnja daje bolji ishod od međusobnog prebjega, ali nije racionalan ishod jer je izbor saradnje, iz perspektive vlastitih interesa, iracionalan. Dakle, Zatvorenikova dilema je igra u kojoj Nashova ravnoteža nije Pareto efikasna.


  1. ^ Poundstone 1993.
  2. ^ Milovsky, Nicholas. "The Basics of Game Theory and Associated Games". Pristupljeno 11 February 2014.
  3. ^ a b c d e Rapoport, Anatol (2016), "Prisoner's Dilemma", The New Palgrave Dictionary of Economics (jezik: engleski), London: Palgrave Macmillan UK, str. 1–5, ISBN 978-1-349-95121-5, pristupljeno 2021-11-29 CS1 održavanje: nepreporučeni parametar (link)
  4. ^ Fehr, Ernst; Fischbacher, Urs (Oct 23, 2003). "The Nature of human altruism" (PDF). Nature. 425 (6960): 785–91. Bibcode:2003Natur.425..785F. doi:10.1038/nature02043. PMID 14574401. Pristupljeno February 27, 2013.
  5. ^ Tversky, Amos; Shafir, Eldar (2004). Preference, belief, and similarity: selected writings (PDF). Massachusetts Institute of Technology Press. ISBN 9780262700931. Pristupljeno February 27, 2013.
  6. ^ Toh-Kyeong, Ahn; Ostrom, Elinor; Walker, James (Sep 5, 2002). "Incorporating Motivational Heterogeneity into Game-Theoretic Models of Collective Action" (PDF). Public Choice. 117 (3–4): 295–314. doi:10.1023/b:puch.0000003739.54365.fd. Pristupljeno June 27, 2015.
  7. ^ Oosterbeek, Hessel; Sloof, Randolph; Van de Kuilen, Gus (Dec 3, 2003). "Cultural Differences in Ultimatum Game Experiments: Evidence from a Meta-Analysis" (PDF). Experimental Economics. 7 (2): 171–88. doi:10.1023/B:EXEC.0000026978.14316.74. Arhivirano s originala (PDF), May 12, 2013. Pristupljeno February 27, 2013.
  8. ^ Ormerod, Paul (2010-12-22). Why Most Things Fail. ISBN 9780571266142.
  9. ^ Deutsch, M. (1958). Trust and suspicion. Journal of Conflict Resolution, 2(4), 265–279. https://doi.org/10.1177/002200275800200401
  10. ^ Rapoport, A., & Chammah, A. M. (1965). Prisoner's Dilemma: A study of conflict and cooperation. Ann Arbor, MI: University of Michigan Press.
  11. ^ Kaznatcheev, Artem (March 2, 2015). "Short history of iterated prisoner's dilemma tournaments". Journal of Conflict Resolution. 24 (3): 379–403. doi:10.1177/002200278002400301. Pristupljeno February 8, 2016.