Góra strony
Fizyka Życia

Iterowany Dylemat Aresztowanych

opis  tabela strategii  symulacja komputerowa  linki 

Opis  

Iterowany dylemat aresztowanych polega na ciągłym rozgrywaniu dylematu aresztowanych. Ci sami gracze grają wielokrotnie ze sobą, decydując o tym co zrobią (czy fałszywe oskarżą przeciwnika czy nie) w rozgrywanej rundzie na podstawie informacji o tym co robił przeciwnik we wcześniejszych rundach.

Zagadnieniem tym w 1984 roku zajął się Robert Axelrod, amerykański politolog i matematyk, autor książki „Ewolucja współpracy”. Zaproponował on zorganizowanie turnieju, w którym w sposób ciągły rozgrywano by dylemat aresztowanych, kumulując wyniki uzyskiwane przez każdą ze stron. Wprowadzenie tej iteracyjności jest dość abstrakcyjne, bo jakiż sens ma stawianie oskarżonym raz za razem tej samej propozycji i przyglądanie się, jaki łączny wyrok sobie nawzajem fundują? Gdyby jednak nie chodziło o wyrok, lecz o pieniądze lub punkty przetrwania, zagadnienie miałoby jak najbardziej życiowy charakter. Turniej oczywiście rozegrano, a obserwacje okazały się nader ciekawe.

Zadaniem zaproszonych z całego świata naukowców było opracowanie w postaci podprogramów komputerowych najskuteczniejszych strategii rozgrywania tej gry. Strategię należy rozumieć dokładnie tak, jak została zdefiniowana: realizujący ją podprogram musi wyznaczyć akcję, którą ma wykonać gracz w bieżącej rundzie. W pierwszym kroku rozgrywki komputer prosił strategię gracza A o podanie akcji: „Co robisz? Zeznajesz czy nie?”, jednocześnie to samo pytanie zadawał strategii gracza B. Na podstawie udzielonych odpowiedzi odczytywał z tabelki wyroki i dodawał je do kont poszczególnych graczy. W każdym kroku obie strategie udzielały odpowiedzi, nie wiedząc, jaką akcję w tej rundzie podjęła strategia konkurencyjna, natomiast obu strategiom znane były wszystkie ruchy zrealizowane w poprzednich rundach oraz wszelkie informacje pochodzące z dotychczas przeprowadzonych rozgrywek pomiędzy innymi strategiami.

Kolejne rundy przebiegały dokładnie według tego samego scenariusza: strategie niezależnie od siebie udzielały odpowiedzi i na ich podstawie z tabeli wypłat odczytywane były wyroki i ponownie dodawane do kont graczy. Gra toczyła się, aż w pewnym losowym momencie ją kończono. Za zwycięską uważana była ta strategia, która uzyskała najmniejszy łączny wyrok.

Turniej wygrała strategia nazwana przyjazny wet za wet. Zasada jej działania była dość prosta: w pierwszym kroku nigdy nie oskarżała fałszywie, a w następnych robiła dokładnie to samo co jej przeciwniczka w rundzie poprzedniej. Ciekawostką jest, że porównujący ją z innymi strategiami matematycy przypisali jej pewne ludzkie przymioty, podając przy okazji ich definicje:


Nazwa cechy Opis cechy
Przyjazna Zaczyna od współpracy
Gotowa do współpracy Nie zrywa współpracy jako pierwsza
Mściwa Bo na brak współpracy natychmiast odpowiada brakiem współpracy
Potrafiąca wybaczyć Na współpracę natychmiast odpowiada współpracą
Niezazdrosna Nie stara się osiągnąć wyniku lepszego niż przeciwnik
Przejrzysta Jest łatwa do zrozumienia przez przeciwnika
Sprawiedliwa (zapewniająca równość) Gwarantuje uzyskanie wyniku nie gorszego niż przeciwnik, gorszy może być zaledwie o stratę w pojedynczej rundzie. W porównaniu z przeciwnikiem nie straci dużo

 


Tabela Strategii  

 

Nazwa Opis działania strategii L
Przyjazny Wet za Wet Zaczyna od współpracy, później robi to co zrobił przeciwnik w rundzie poprzedniej Nie
Nieprzyjazny Wet za Wet Zaczyna od fałszywego oskarżenia, później robi to co zrobił przeciwnik w rundzie poprzedniej Nie
Przyjazny Wet za Wet z losowością Zaczyna od współpracy, później robi to co zrobił przeciwnik w rundzie poprzedniej losowo jednak zmieniając tę decyzję Tak
Przyjazny Pawłow Zaczyna od współpracy, jeśli ruch okazał się korzystny ruch nie jest zmieniany w następnej rundzie, jeśli okazał się niekorzystny to jest zmieniany Nie
Skruszony Zdrajca Tak jak Przyjazny Wet za Wet, lecz czasem fałszywie oskarża zamiast współpracować. Jeśli przeciwnik na jego fałszywe oskarżenie odpowie fałszywym oskarżeniem to z powodu wyrzutów sumienia odpowiada współpracą. Nie
Naiwny Siewca Pokoju Tak jak Przyjazny Wet za Wet, czasem zmieniając fałszywe oskarżenie na współpracę Tak
50% Losowy Wariat Decyzję podejmuje losowo, z prawdopodobieństwem 50% na 50% Tak
Ponury Zdrajca Zawsze fałszywie oskarża Nie
Lojalny aż do bólu Zawsze współpracuje Nie
Niewybaczający Współpracuje, lecz gdy przeciwnik fałszywie oskarży, nigdy nie wybaczy i zawsze będzie fałszywie oskarżał Nie
Dostosowujący się Zaczyna w,w,w,w,w,o,o,o,o,o po czym podejmuje takie decyzje, które przyniosły mu najlepszy wynik w poprzedniej rundzie Nie
Powolny Współpracuje do momentu gdy przeciwnik go fałszywie oskarży, po czym oskarża przeciwnika tyle razy ile ten go oskarżył, następnie dwukrotnie współpracuje. Nie

 


Symulacja komputerowa  

 


Linki