Iterowany Dylemat Aresztowanych

opis tabela strategii symulacja komputerowa linki

Opis

Iterowany dylemat aresztowanych polega na ciągłym rozgrywaniu dylematu aresztowanych. Ci sami gracze grają wielokrotnie ze sobą, decydując o tym co zrobią (czy fałszywe oskarżą przeciwnika czy nie) w rozgrywanej rundzie na podstawie informacji o tym co robił przeciwnik we wcześniejszych rundach.

Zagadnieniem tym w 1984 roku zajął się Robert Axelrod, amerykański politolog i matematyk, autor książki „Ewolucja współpracy”. Zaproponował on zorganizowanie turnieju, w którym w sposób ciągły rozgrywano by dylemat aresztowanych, kumulując wyniki uzyskiwane przez każdą ze stron. Wprowadzenie tej iteracyjności jest dość abstrakcyjne, bo jakiż sens ma stawianie oskarżonym raz za razem tej samej propozycji i przyglądanie się, jaki łączny wyrok sobie nawzajem fundują? Gdyby jednak nie chodziło o wyrok, lecz o pieniądze lub punkty przetrwania, zagadnienie miałoby jak najbardziej życiowy charakter. Turniej oczywiście rozegrano, a obserwacje okazały się nader ciekawe.

Zadaniem zaproszonych z całego świata naukowców było opracowanie w postaci podprogramów komputerowych najskuteczniejszych strategii rozgrywania tej gry. Strategię należy rozumieć dokładnie tak, jak została zdefiniowana: realizujący ją podprogram musi wyznaczyć akcję, którą ma wykonać gracz w bieżącej rundzie. W pierwszym kroku rozgrywki komputer prosił strategię gracza A o podanie akcji: „Co robisz? Zeznajesz czy nie?”, jednocześnie to samo pytanie zadawał strategii gracza B. Na podstawie udzielonych odpowiedzi odczytywał z tabelki wyroki i dodawał je do kont poszczególnych graczy. W każdym kroku obie strategie udzielały odpowiedzi, nie wiedząc, jaką akcję w tej rundzie podjęła strategia konkurencyjna, natomiast obu strategiom znane były wszystkie ruchy zrealizowane w poprzednich rundach oraz wszelkie informacje pochodzące z dotychczas przeprowadzonych rozgrywek pomiędzy innymi strategiami.

Kolejne rundy przebiegały dokładnie według tego samego scenariusza: strategie niezależnie od siebie udzielały odpowiedzi i na ich podstawie z tabeli wypłat odczytywane były wyroki i ponownie dodawane do kont graczy. Gra toczyła się, aż w pewnym losowym momencie ją kończono. Za zwycięską uważana była ta strategia, która uzyskała najmniejszy łączny wyrok.

Turniej wygrała strategia nazwana przyjazny wet za wet. Zasada jej działania była dość prosta: w pierwszym kroku nigdy nie oskarżała fałszywie, a w następnych robiła dokładnie to samo co jej przeciwniczka w rundzie poprzedniej. Ciekawostką jest, że porównujący ją z innymi strategiami matematycy przypisali jej pewne ludzkie przymioty, podając przy okazji ich definicje:

Nazwa cechy	Opis cechy
Przyjazna	Zaczyna od współpracy
Gotowa do współpracy	Nie zrywa współpracy jako pierwsza
Mściwa	Bo na brak współpracy natychmiast odpowiada brakiem współpracy
Potrafiąca wybaczyć	Na współpracę natychmiast odpowiada współpracą
Niezazdrosna	Nie stara się osiągnąć wyniku lepszego niż przeciwnik
Przejrzysta	Jest łatwa do zrozumienia przez przeciwnika
Sprawiedliwa (zapewniająca równość)	Gwarantuje uzyskanie wyniku nie gorszego niż przeciwnik, gorszy może być zaledwie o stratę w pojedynczej rundzie. W porównaniu z przeciwnikiem nie straci dużo

Tabela Strategii

Nazwa	Opis działania strategii	L
Przyjazny Wet za Wet	Zaczyna od współpracy, później robi to co zrobił przeciwnik w rundzie poprzedniej	Nie
Nieprzyjazny Wet za Wet	Zaczyna od fałszywego oskarżenia, później robi to co zrobił przeciwnik w rundzie poprzedniej	Nie
Przyjazny Wet za Wet z losowością	Zaczyna od współpracy, później robi to co zrobił przeciwnik w rundzie poprzedniej losowo jednak zmieniając tę decyzję	Tak
Przyjazny Pawłow	Zaczyna od współpracy, jeśli ruch okazał się korzystny ruch nie jest zmieniany w następnej rundzie, jeśli okazał się niekorzystny to jest zmieniany	Nie
Skruszony Zdrajca	Tak jak Przyjazny Wet za Wet, lecz czasem fałszywie oskarża zamiast współpracować. Jeśli przeciwnik na jego fałszywe oskarżenie odpowie fałszywym oskarżeniem to z powodu wyrzutów sumienia odpowiada współpracą.	Nie
Naiwny Siewca Pokoju	Tak jak Przyjazny Wet za Wet, czasem zmieniając fałszywe oskarżenie na współpracę	Tak
50% Losowy Wariat	Decyzję podejmuje losowo, z prawdopodobieństwem 50% na 50%	Tak
Ponury Zdrajca	Zawsze fałszywie oskarża	Nie
Lojalny aż do bólu	Zawsze współpracuje	Nie
Niewybaczający	Współpracuje, lecz gdy przeciwnik fałszywie oskarży, nigdy nie wybaczy i zawsze będzie fałszywie oskarżał	Nie
Dostosowujący się	Zaczyna w,w,w,w,w,o,o,o,o,o po czym podejmuje takie decyzje, które przyniosły mu najlepszy wynik w poprzedniej rundzie	Nie
Powolny	Współpracuje do momentu gdy przeciwnik go fałszywie oskarży, po czym oskarża przeciwnika tyle razy ile ten go oskarżył, następnie dwukrotnie współpracuje.	Nie

Symulacja komputerowa

Linki

Iterowany Dylemat Aresztowanych na stronie Wydziału Nauk Ekonomicznych Uniwersytetu Warszawskiego
"The Evolution of Trust" by Nicky Case, july 2017 - gra oparta o Iterowany Dylemat Aresztowanych, w którą można pograć z wirtualnym partnerem. Grając, w bardzo prosty sposób dowiadujemy się o co chodzi.
Iterowany dylemat aresztowanych a Ewangelia w artykule Drugi policzek i bezbożna nauka. Czy warto być uczciwym i dobrym wobec innych?