Iterowany dylemat aresztowanych polega na ciągłym rozgrywaniu dylematu aresztowanych. Ci sami gracze grają wielokrotnie ze sobą, decydując o tym co zrobią (czy fałszywe oskarżą przeciwnika czy nie) w rozgrywanej rundzie na podstawie informacji o tym co robił przeciwnik we wcześniejszych rundach.
Zagadnieniem tym w 1984 roku zajął się Robert Axelrod, amerykański politolog i matematyk, autor książki „Ewolucja współpracy”. Zaproponował on zorganizowanie turnieju, w którym w sposób ciągły rozgrywano by dylemat aresztowanych, kumulując wyniki uzyskiwane przez każdą ze stron. Wprowadzenie tej iteracyjności jest dość abstrakcyjne, bo jakiż sens ma stawianie oskarżonym raz za razem tej samej propozycji i przyglądanie się, jaki łączny wyrok sobie nawzajem fundują? Gdyby jednak nie chodziło o wyrok, lecz o pieniądze lub punkty przetrwania, zagadnienie miałoby jak najbardziej życiowy charakter. Turniej oczywiście rozegrano, a obserwacje okazały się nader ciekawe.
Zadaniem zaproszonych z całego świata naukowców było opracowanie w postaci podprogramów komputerowych najskuteczniejszych strategii rozgrywania tej gry. Strategię należy rozumieć dokładnie tak, jak została zdefiniowana: realizujący ją podprogram musi wyznaczyć akcję, którą ma wykonać gracz w bieżącej rundzie. W pierwszym kroku rozgrywki komputer prosił strategię gracza A o podanie akcji: „Co robisz? Zeznajesz czy nie?”, jednocześnie to samo pytanie zadawał strategii gracza B. Na podstawie udzielonych odpowiedzi odczytywał z tabelki wyroki i dodawał je do kont poszczególnych graczy. W każdym kroku obie strategie udzielały odpowiedzi, nie wiedząc, jaką akcję w tej rundzie podjęła strategia konkurencyjna, natomiast obu strategiom znane były wszystkie ruchy zrealizowane w poprzednich rundach oraz wszelkie informacje pochodzące z dotychczas przeprowadzonych rozgrywek pomiędzy innymi strategiami.
Kolejne rundy przebiegały dokładnie według tego samego scenariusza: strategie niezależnie od siebie udzielały odpowiedzi i na ich podstawie z tabeli wypłat odczytywane były wyroki i ponownie dodawane do kont graczy. Gra toczyła się, aż w pewnym losowym momencie ją kończono. Za zwycięską uważana była ta strategia, która uzyskała najmniejszy łączny wyrok.
Turniej wygrała strategia nazwana przyjazny wet za wet. Zasada jej działania była dość prosta: w pierwszym kroku nigdy nie oskarżała fałszywie, a w następnych robiła dokładnie to samo co jej przeciwniczka w rundzie poprzedniej. Ciekawostką jest, że porównujący ją z innymi strategiami matematycy przypisali jej pewne ludzkie przymioty, podając przy okazji ich definicje:
Nazwa cechy | Opis cechy |
---|---|
Przyjazna | Zaczyna od współpracy |
Gotowa do współpracy | Nie zrywa współpracy jako pierwsza |
Mściwa | Bo na brak współpracy natychmiast odpowiada brakiem współpracy |
Potrafiąca wybaczyć | Na współpracę natychmiast odpowiada współpracą |
Niezazdrosna | Nie stara się osiągnąć wyniku lepszego niż przeciwnik |
Przejrzysta | Jest łatwa do zrozumienia przez przeciwnika |
Sprawiedliwa (zapewniająca równość) | Gwarantuje uzyskanie wyniku nie gorszego niż przeciwnik, gorszy może być zaledwie o stratę w pojedynczej rundzie. W porównaniu z przeciwnikiem nie straci dużo |
Nazwa | Opis działania strategii | L |
---|---|---|
Przyjazny Wet za Wet | Zaczyna od współpracy, później robi to co zrobił przeciwnik w rundzie poprzedniej | Nie |
Zaczyna od fałszywego oskarżenia, później robi to co zrobił przeciwnik w rundzie poprzedniej | Nie | |
Przyjazny Wet za Wet z losowością | Zaczyna od współpracy, później robi to co zrobił przeciwnik w rundzie poprzedniej losowo jednak zmieniając tę decyzję | Tak |
Przyjazny Pawłow | Zaczyna od współpracy, jeśli ruch okazał się korzystny ruch nie jest zmieniany w następnej rundzie, jeśli okazał się niekorzystny to jest zmieniany | Nie |
Skruszony Zdrajca | Tak jak Przyjazny Wet za Wet, lecz czasem fałszywie oskarża zamiast współpracować. Jeśli przeciwnik na jego fałszywe oskarżenie odpowie fałszywym oskarżeniem to z powodu wyrzutów sumienia odpowiada współpracą. | Nie |
Naiwny Siewca Pokoju | Tak jak Przyjazny Wet za Wet, czasem zmieniając fałszywe oskarżenie na współpracę | Tak |
50% Losowy Wariat | Decyzję podejmuje losowo, z prawdopodobieństwem 50% na 50% | Tak |
Ponury Zdrajca | Zawsze fałszywie oskarża | Nie |
Lojalny aż do bólu | Zawsze współpracuje | Nie |
Niewybaczający | Współpracuje, lecz gdy przeciwnik fałszywie oskarży, nigdy nie wybaczy i zawsze będzie fałszywie oskarżał | Nie |
Dostosowujący się | Zaczyna w,w,w,w,w,o,o,o,o,o po czym podejmuje takie decyzje, które przyniosły mu najlepszy wynik w poprzedniej rundzie | Nie |
Powolny | Współpracuje do momentu gdy przeciwnik go fałszywie oskarży, po czym oskarża przeciwnika tyle razy ile ten go oskarżył, następnie dwukrotnie współpracuje. | Nie |
Iterowany Dylemat Aresztowanych na stronie Wydziału Nauk Ekonomicznych Uniwersytetu Warszawskiego
"The Evolution of Trust" by Nicky Case, july 2017 - gra oparta o Iterowany Dylemat Aresztowanych, w którą można pograć z wirtualnym partnerem. Grając, w bardzo prosty sposób dowiadujemy się o co chodzi.
Iterowany dylemat aresztowanych a Ewangelia w artykule Drugi policzek i bezbożna nauka. Czy warto być uczciwym i dobrym wobec innych?