Nash echilibru. Teoria jocurilor pentru economiști (John Nash)
În anii 1930, John von Neumann
conținut
- Pe scurt despre teoria jocurilor
- Dilema prizonierului și descoperirea științifică
- Exemplu de dilemă a prizonierului
- Lanțul deducerilor logice
- "tăcere, nu poți vorbi" sau "nu poți tăcea, nu poți vorbi"
- Soluția optimă optimă nash
- Egoiste sau raționale
- Experimentul de sex masculin
- Toată viața noastră este un joc
- Strategii mixte
- Penalitate și strategie mixtă
Diferența lungă dintre scrierea unei disertații și recunoașterea universală a devenit un test pentru un matematician. Geniul fără recunoaștere a dus la încălcări mintale grave, dar această sarcină John Nash ar putea rezolva datorită unei minți logice frumoase. Teoria sa despre "echilibrul Nash" a fost premiată cu Premiul Nobel și viața sa în adaptarea filmului "Beautiful Mind".
Pe scurt despre teoria jocurilor
Din moment ce teoria echilibrului lui Nash explică comportamentul oamenilor în condiții de interacțiune, merită luată în considerare conceptele de bază ale teoriei jocurilor.
Teoria jocurilor studiază comportamentul participanților (agenților) în condiții de interacțiune între ele prin tipul de joc, unde rezultatul depinde de decizia și comportamentul mai multor persoane. Participantul ia decizii pe baza predicțiilor sale despre comportamentul restului, care se numește strategie de joc.
Există, de asemenea, o strategie dominantă, în care participantul primește rezultatul optim pentru orice comportament al altor participanți. Aceasta este cea mai bună strategie câștigătoare pentru jucător.
Dilema prizonierului și descoperirea științifică
prizonier dilemă - acesta este cazul cu jocul, în cazul în care jucătorii sunt obligați să ia decizii raționale, atingerea unui obiectiv comun în alternative de conflict. Întrebarea este care din aceste opțiuni aleg, realizându-și interesul personal și general, precum și imposibilitatea de a obține ambele. Jucătorii par a fi împrăștiați în condiții grele de joc, ceea ce uneori le face să se gândească foarte productiv.
Această dilemă a fost investigată de matematicianul american John Nash. Echilibrul pe care la derivat a devenit revoluționar în felul său. În mod deosebit, acest nou gând a influențat opinia economiștilor cu privire la modul în care jucătorii de pe piață fac o alegere, ținând seama de interesele celorlalți, cu interacțiunea strânsă și intersecția intereselor.
Cel mai bine este să studiem teoria jocurilor pe exemple specifice, deoarece această disciplină matematică însăși nu este teoretică uscată.
Exemplu de dilemă a prizonierului
De exemplu, doi oameni au comis jaf, au căzut în mâinile poliției și sunt interogați în celule separate. În același timp, ofițerii de poliție oferă fiecărui partid condiții favorabile în care va fi eliberat în caz de mărturie împotriva partenerului său. Fiecare dintre criminali are următorul set de strategii pe care le va lua în considerare:
- Ambii dau simultan mărturie și primesc 2,5 ani de închisoare.
- Ambele au tăcut în același timp și primesc un an, deoarece în acest caz baza de probă a vinovăției lor va fi mică.
- Unul dă mărturie și primește libertate, iar celălalt tăgăduiește și primește 5 ani de închisoare.
Evident, rezultatul cazului depinde de decizia ambilor participanți, dar nu pot fi de acord deoarece stau în diferite celule. De asemenea, este clar văzut conflictul intereselor lor personale în lupta pentru un interes comun. Fiecare deținut are două opțiuni de acțiune și patru opțiuni pentru rezultate.
Lanțul deducerilor logice
Astfel, criminalul A consideră următoarele opțiuni:
- Am tăcut și partenerul meu este tăcut - amândoi vom primi un an de închisoare.
- Îmi dau un partener și el mă preda - amândoi avem 2.5 ani în închisoare.
- Eu am tăcut, iar partenerul meu mă dă pe mine - o să am 5 ani în închisoare și e liber.
- Îi dau mâna pe un partener și el este tăcut - am libertate și are 5 ani de închisoare.
Oferim o matrice de soluții și rezultate posibile pentru claritate.
Tabelul rezultatelor probabile ale dilemei prizonierului.
Întrebarea este: ce va alege fiecare participant?
"Tăcere, nu poți vorbi" sau "nu poți tăcea, nu poți vorbi"
Pentru a înțelege alegerea participantului, trebuie să treceți prin lanțul reflecțiilor sale. În urma raționamentului criminalului A: dacă păstrez tăcerea și păstrez tăcerea partenerului meu, vom obține un minim de timp (1 an), dar nu pot afla cum se va comporta. Dacă dă mărturie împotriva mea, atunci este mai bine pentru mine să mărturisesc, altfel aș putea să stau jos timp de 5 ani. Este mai bine pentru mine să stau 2,5 ani, decât timp de 5 ani. Dacă nu spune nimic, atunci mai am nevoie să mărturisesc, pentru că voi fi liber. În mod similar, participantul B susține și el.
Nu este greu de înțeles că strategia dominantă pentru fiecare dintre infractori este darea de probe. Punctul optim al acestui joc vine atunci când ambii infractori dau dovadă și primesc "premiul" - 2,5 ani în închisoare. Teoria jocurilor lui Nash o numește echilibru.
Soluția Optimă Optimă Nash
Natura revoluționară a vederii lui Nashev este, ce este echilibrul Nu este optim dacă luăm în considerare participantul individual și interesul său personal. La urma urmei, cea mai bună opțiune este să rămâi tăcut și să te eliberezi.
Echilibrul Nash este un punct de interes comun, în care fiecare participant alege o opțiune care este optimă pentru el numai dacă ceilalți participanți aleg o anumită strategie.
Având în vedere opțiunea, atunci când ambii infractori sunt tăcuți și primesc doar 1 an, îl puteți numi opțiunea Pareto-optimă. Cu toate acestea, este posibil numai dacă criminalii ar fi putut aranja în avans. Dar chiar și acest lucru nu ar garanta acest rezultat, deoarece ispita de a se retrage din convingere și de a evita pedeapsa este mare. Lipsa de încredere între ele și pericolul de a obține 5 ani face necesară alegerea unei variante cu recunoaștere. Pentru a reflecta asupra faptului că participanții vor rămâne la opțiune cu tăcere, acționând concertat, este pur și simplu irațional. O astfel de concluzie poate fi făcută dacă studiem echilibrul Nash. Exemplele dovedesc adevărul.
Egoiste sau raționale
Teoria echilibrului lui Nash a dat concluzii uimitoare, care au respins principiile preexistente. De exemplu, Adam Smith a privit comportamentul fiecăruia dintre participanți ca fiind complet egoist, care a adus sistemul în echilibru. Această teorie a fost numită "mâna invizibilă a pieței".
John Nash a văzut că, dacă toți participanții acționează, urmărindu-și propriile interese, atunci acest lucru nu va duce niciodată la un rezultat optim al grupului. Având în vedere că gândirea rațională este inerentă fiecărui participant, alegerea pe care o oferă strategia de echilibru Nash este mai probabilă.
Experimentul de sex masculin
Un exemplu viu este jocul "paradoxul blondei", care, deși pare inadecvat, este o ilustrație vie care arată cum funcționează teoria jocurilor lui Nash.
În acest joc trebuie să vă imaginați că compania de tipi liberi a venit la bar. În apropiere este o companie de fete, dintre care una este preferabilă altora, spune o blondă. Cum se îndreaptă băieții pentru a obține cea mai bună prietena pentru ei înșiși?
Deci, raționamentul tipilor: dacă toată lumea începe să se cunoască cu blonda, atunci cel mai probabil, nu va ajunge la nimeni, atunci prietenii ei nu vor să se întâlnească. Nimeni nu vrea să fie a doua opțiune de backup. Dar dacă băieții aleg să evite blonda, probabilitatea ca fiecare dintre băieți să-și găsească o prietena bună printre fete este mare.
Situația echilibrului Nash nu este optimă pentru băieți, deoarece, urmărindu-și numai propriile interese egoiste, toată lumea ar alege o blondă. Se poate vedea că urmărirea numai a intereselor egoiste va echivala cu prăbușirea intereselor de grup. Echilibrul potrivit lui Nash va însemna că fiecare tip acționează în interesele sale personale, care vin în contact cu interesele întregului grup. Aceasta este o opțiune non-optimă pentru toată lumea personală, dar optimă pentru toată lumea, pe baza unei strategii globale de succes.
Toată viața noastră este un joc
Luarea deciziilor în condiții reale este foarte asemănătoare cu jocul atunci când vă așteptați la un anumit comportament rațional de la alți participanți. În afaceri, în muncă, într-o echipă, într-o companie și chiar în relațiile cu sexul opus. De la tranzacții mari la situații normale de viață, totul se supune uneia sau altei legi.
Desigur, situațiile de joc cu criminalii și un bar sunt doar excelente ilustrații care demonstrează echilibrul lui Nash. Exemple de astfel de dileme apar adesea pe piața reală și, în special, funcționează în cazurile în care doi monopolisti controlează piața.
Strategii mixte
Adesea suntem implicați nu într-unul, ci în mai multe jocuri. Alegerea uneia dintre opțiunile pentru un joc, ghidată de o strategie rațională, dar veți intra într-un alt joc. După mai multe decizii raționale, puteți constata că rezultatul dvs. nu vă convine. Ce ar trebui să fac?
Luați în considerare două tipuri de strategii:
- O strategie pură este comportamentul unui participant, care are la bază gândirea despre comportamentul posibil al altor participanți.
- O strategie mixtă sau strategie aleatorie alternând strategiile pure aleatoriu sau alegerea unei strategii pure cu o anumită probabilitate. Această strategie este numită și Randomized.
Având în vedere acest comportament, primim o privire nouă asupra echilibrului asupra lui Neshu. Dacă ați spus anterior că jucătorul alege o strategie o dată, atunci vă puteți imagina un alt comportament. Puteți permite opțiunea ca jucătorii să aleagă o strategie aleatoriu cu o anumită probabilitate. Jocuri în care este imposibil să găsești echilibrul lui Nash în strategii pure, întotdeauna să le amesteci.
Echilibrul Nash în strategii mixte se numește echilibru mixt. Acesta este un echilibru în care fiecare participant alege frecvența optimă pentru alegerea strategiilor sale, cu condiția ca alți participanți să-și aleagă strategiile la o anumită frecvență.
Penalitate și strategie mixtă
Un exemplu de strategie mixtă poate fi citat într-un joc de fotbal. Cea mai bună ilustrare a unei strategii mixte este, probabil, o lovitură de pedeapsă. Deci, avem un portar care poate să sară doar într-un colț și un jucător care va bate o pedeapsă.
Deci, dacă pentru prima dată jucătorul alege o strategie pentru a face o lovitură în colțul din stânga și portarul intră, de asemenea, în acest colț și prinde mingea, cum pot evolua evenimentele pentru a doua oară? Dacă jucătorul lovește colțul opus, este probabil prea evident, dar lovitura la același colț nu este mai puțin evidentă. Prin urmare, atât portarul, cât și atacantul nu au de ales decât să se bazeze pe alegeri aleatorii.
Deci, alternând alegerile aleatorii cu o anumită strategie pură, jucătorul și portarul încearcă să obțină rezultatul maxim.
- Cum de a desena FNAP? Astăzi, eroul nostru este Fox Fox
- Istoria Palatului Buckingham
- Faceți cunoștință cu prietenul nostru englez: sos Worchester
- Primii laureați ai premiului Nobel în economie
- Teoreticianul jocului John Nash
- Spune-mi un film interesant de urmărit
- Cum de a face o lalea de hârtie: clasa noastră de master va spune
- "Jocul minții": recenzii. Drama biografică a lui Ron Howard despre viața lui John Forbes…
- "Studiul naturii și cauzelor bogăției popoarelor" în teoria lui Adam Smith
- Alexandra Hedison: biografie și filme
- Rick Nash - celebrul jucator de hochei cu mainile puternice si inima mare
- Compoziția "Cartea este prietenul și consilierul nostru": cum se scrie (plan detaliat)
- Premiul Abel, laureații și realizările sale
- Filmul "Jocuri de rațiune" (2002): actori și roluri
- Teoria relativității lui Einstein și noi cercetări pe această temă
- Regent`s Park: istoric, descriere și reguli de vizitare
- Aventura și actorii filmului "Omul nostru din San Remo"
- Filmul "Fără compromis" (2011): actori, complot, roluri
- Fizica cuantică și relația ei cu realitatea universului
- Teoria jocurilor în economie și în alte domenii ale activității umane
- Ce este OMG și cum se schimbă limba noastră?