|
|||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||
Dilema prizonierului este un paradox, componentă centrală a teoriei jocurilor. În cazul dilemei este vorba despre un joc de tip sumă non-zero care a fost formulat de către angajaţi ai companiei RAND Corporation. Merrill Flood şi Melvin Drescher descriu o dilemă socială ca pe un joc între două persoane, care arată cum pot conduce hotărârile raţionale individuale la rezultate colective neoptime. Termenul dilema prizonierului a fost formulat de Albert Tucker de la Universitatea Princeton.
modifică Descrierea situaţieiDoi prizonieri sunt bănuiţi că au săvârşit o infracţiune. Pedeapsa maximă pentru această infracţiune este de cinci ani. Celor doi prizonieri li se face o propunere pe care cei doi o cunosc. Dacă unul dintre ei mărturiseşte şi astfel îşi împovărează partenerul, atunci scapă nepedepsit – celălalt trebuie să ispăşească o pedeapsă de cinci ani. Dacă cei doi decid să nu mărturisească, rămân doar dovezi prezumptive care le vor aduce o pedeapsă de doi ani. Dacă amândoi mărturisesc, pe fiecare îl aşteaptă o pedeapsă de patru ani. Prizonierii sunt chestionaţi separat unul de celălalt, astfel încât nici unul dintre ei nu va cunoaşte nici înainte şi nici după chestionare intenţia celuilalt. Această dilemă poate fi numită paradox, deoarece decizia prizonierilor luată individual şi conştient (aceea de a mărturisi) şi decizia colectivă (aceea de a tăinui) sunt divergente. Marticea recompenselor arată în felul următor:
Semnificaţia rezultatelor:
Cele patru modalităţi de combinare existente nu depind numai de propria decizie, ci şi de deciziile complicilor (interdependenţă comportamentală). În mod individual, pare să fie pentru fiecare avantajos să coopereze. Prizonierul se gândeşte astfel: Dacă celălalt cooperează, îmi pot reduce pedeapsa la patru ani, dacă cooperez şi eu; însă dacă celălalt tăinuieşte faptele săvârşite: pot să-mi reduc pedeapsa de la doi ani la zero prin declaraţia mea! Deci trebuie să mărturisesc faptele orice s-ar întâmpla!. Decizia de a mărturisi faptele săvârşite nu depinde de comportamentul celuilalt şi pare să fie întotdeauna avantajos să mărturisească. O astfel de strategie care este aleasă fără a ţine cont de decizia oponentului este denumită strategie dominantă. Cum arată şi matricea, cei doi prizonieri ar fi totuşi mai avantajaţi dacă amândoi s-ar decide să tăinuiască faptele. Atunci ar primi fiecare doar câte doi ani de detenţie. Locul de desfăşurare a jocului împiedică înţelegerea dintre cei doi prizonieri şi provoacă astfel o trădare unilaterală prin care trădătorul speră să obţină pentru sine cel mai bun rezultat achitarea (dacă celălalt prizonier tăinuieşte faptele) sau să primească o pedeapsă de patru ani în loc de cinci (dacă celălalt prizonier mărturiseşte). Dacă amândoi fac acest lucru, îşi înrăutăţesc astfel şi individual situaţia, deoarece acum fiecare primeşte câte patru ani în loc de câte doi ani. Dilema prizonierului constă din această divergenţă a strategiilor posibile. Presupusa analiză progresivă, raţională a situaţiei induce pe cei doi prizonieri la mărturisire, ceea ce conduce la un rezultat prost (alocare care nu este optimă). Rezultatul mai bun ar fi atins prin cooperare, însă acesta este susceptibil de trădarea încrederii. Jucătorii raţionali se întâlnesc într-un punct care în acest caz este denumit echilibru Nash pareto-ineficient. modifică Jocuri şi strategiimodifică Jocul unicConform analizei clasice a jocului, în dilema prizonierului jucată o singură dată, singura strategie raţională pentru individul interesat de binele propriu este aceea de a nu coopera cu celălalt prizonier, ci să mărturisească şi astfel să-l trădeze pe celălalt. Prin decizia sa prizonierul nu poate influenţa comportamentul celuilalt prizonier şi independent de decizia luată de celălalt se plasează într-o poziţie mai bună dacă nu cooperează (mărturiseşte). Această analiză condiţionează faptul că jucătorii se întâlnesc o singură dată, iar hotărârile lor nu pot influenţa interacţiunile de mai târziu. Deoarece este vorba despre o dilemă autentică, din această analiză nu reiese nici o instrucţiune clară (concluzie prescriptivă) pentru interacţiuni reale corespunzătoare unei dileme a prizonierului. Într-un joc unic trebuie precizat că este indiferent dacă cele două părţi s-au înţeles între ele. Situaţia rămâne la fel după o eventuală discuţie! modifică Jocul repetat (finit)Situaţia se schimbă, dacă jocul este jucat în mai multe runde (aşa numitele turnee iterate). În acest caz o înşelare a încrederii este răzbunată în jocul următor sau într-un joc de mai târziu, iar cooperarea este răsplătită. Numărul rundelor nu trebuie să fie cunoscut dinainte, ci trebuie să fie necunoscut. În caz contrar s-ar putea ca pentru strategii de fapt cooperante să fie profitabil ca în ultima rundă să intervină trădarea, deoarece pentru aceasta nu mai este posibilă o recompensă. Astfel, penultima rundă devine ultima, pentru care rezultă din nou aceeaşi situaţie. Din aceasta reiese o soluţe neoptimă. Problema ultimei runde se aplanează dacă jocul este jucat ca un - presupus sau actual - turneu nesfârşit. Cât de benefică este o anumită strategie într-un astfel de turneu, depinde întotdeauna de strategiile concurente pe care aceasta le influenţează şi nu poate fi declarată în mod absolut. modifică Jocul infinitJocul se repetă, fără ca jucătorii să ştie când va avea loc ultima rundă. Dacă jucătorii se află în această dilemă, atunci poate exista o lipsă de cooperare în jocul următor. Faptul de a nu coopera nu este răsplătit (în mod inevitabil), deoarece pentru trădare (în mod direct) se va primi pedeapsă în jocul următor, în timp ce cooperarea este răsplătită (în mod constant). Tit-for-tat (Ochi pentru ochi) înseamnă pedeapsă pentru trădare în perioada următoare. În acest caz se vorbeşte despre încredere calculată. Politologul american Robert Axelrod a organizat la începutul anilor '80 un concurs pe calculator, pe tema dilemei prizonierului repetată. El făcea ca programele de calculator să concureze între ele pe baza a diferite strategii. Cea mai de succes strategie şi în acelaşi timp una dintre cele mai uşoare a fost Strategia ochi pentru ochi, dezvoltată de Anatol Rapoport. Aceasta însemna cooperare (renunţare la trădare), atâta timp cât şi celălalt coopera. Dacă celălalt încerca să-şi creeze un avantaj (trădare), atunci şi cealaltă parte trăda. modifică Competiţii dinamico-evolutiveO dezvoltare a jocului pe mai multe runde este jocul pe mai multe generaţii. Dacă toate strategiile apar în mai multe runde unele împotriva celorlalte şi una împotriva celeilalte, rezultatele obţinute vor fi numărate împreună, pentru fiecare strategie. Pentru o rundă următoare, strategiile de succes le înlocuiesc pe cele cu mai puţin succes. Strategia cea mai de succes apare cu o densitate mai mare în generaţia următoare. Şi această variantă a competiţiei a fost implementată de Axelrod. Strategiile care au tendinţa de a înşela, au obţinut aici la început rezultate relativ bune – atâta timp cât au venit în contact cu alte strategii care aveau tendinţa de a coopera lăsându-se exploatate. Dacă strategiile înşelătoare sunt de succes, atunci strategiile cooperative se vor rări de la o generaţie la alta – strategiile înşelătoare reuşind să anuleze chiar şi fundamentul succesului. Dacă două strategii înşelătoare se întâlnesc, se obţin rezultate mai proaste decât în cazul în care s-ar întâlni două strategii cooperante. Strategiile înşelătoare se pot dezvolta doar prin exploatarea partenerilor de joc. Pe de altă parte, strategiile cooperante se dezvoltă cel mai bine, dacă vin în contact unele cu altele. O minoritate de strategii cooperante, cum ar fi Tit-for-tat (ochi pentru ochi) poate pretinde astfel a se afla chiar într-o majoritate de strategii înşelătoare. Astfel de strategii care se pot stabili prin generaţii şi care sunt rezistente invaziilor altor strategii se numesc strategii evolutive stabile. Strategia Tit-for-tat a putut fi întrecută în anul 2004 de o strategie nouă, propusă de Universitatea Southampton şi care în cazul unei întâlniri faţă în faţă şi după un schimb iniţial recurge la două roluri de exploatator şi respectiv de victimă, pentru a permite exploatatorului o poziţie de conducere (master-and-servant). În acest caz este necesară o anumită marime critică, şi anume strategia master-and-servant nu poate fi stabilită dintr-o populaţie incipientă. Deoarece partenerii de joc comunică codat despre comportamenul lor de început, există obiecţia că strategia master-and-servant încalcă regulile jocului, despre care partenerii de joc sunt chestionaţi izolati unii de ceilalţi. Strategia aminteşte de populaţiile de insecte unde insectele lucrătoare renunţă total la reproducţie şi îşi dedică forţa de muncă pentru bunăstarea reginei prolifice. Condiţiile necesare răspândirii strategiilor cooperative sunt: a) se joacă în mai multe runde; b) jucătorii se pot recunoaşte între ei de la o rundă la alta, pentru ca în caz de nevoie să poată fi recompensaţi; c) nu se ştie când se vor întâlni jucătorii pentru ultima oară. modifică Câteva strategii selectatePentru dilema prizonierului jucată în mai multe runde există mai multe strategii diferite. Pentru anumite strategii s-au încetăţenit anumite nume (traducerea din paranteză):
modifică Strategia optimăSingura strategie tit-for-tat simplă, însă foarte eficientă şi de succes pe termen lung prezintă totuşi desfigurări, deoarece amândoi jucătorii se pot bloca într-o confruntare de durată, dacă după o anumită perioadă amândoi jucătorii aleg pe termen lung această strategie denumită Vendetta (ital.: răzbunare). modifică Bibliografie
modifică Vezi şi
|
| All Right Reserved © 2007, Designed by Stylish Blog. |