Mida mänguteooria uurib. Mänguteooria majanduses ja teistes inimtegevuse valdkondades

Naljakas näide mänguteooria rakendamisest on Anthony Pierce’i fantaasiaraamatus The Brave Golem.

Palju teksti

"Mõte, mida ma teile kõigile näitan, on koguda vajalik arv punkte," alustas Grundy. Punktid võivad olla väga erinevad – kõik sõltub otsuste kombinatsioonist, mille mängus osalejad teevad. Oletame näiteks, et iga osaleja tunnistab oma mängukaaslase vastu. Sel juhul saab igale osalejale anda ühe punkti!
- Üks punkt! ütles Merenõid, näidates mängu vastu ootamatut huvi. Ilmselgelt tahtis nõid veenduda, et golemil poleks võimalust, et deemon Xanth oleks temaga rahul.
“Oletame nüüd, et ükski mängus osaleja ei tunnista oma kamraadi vastu! Grandi jätkas. - Sel juhul saab igaüks anda kolm punkti. Eriti tahan märkida, et seni, kuni kõik osalejad tegutsevad ühtemoodi, antakse neile sama arv punkte. Kellelgi pole teise ees eeliseid.
- Kolm punkti! ütles teine ​​nõid.
- Aga nüüd on meil õigus soovitada, et üks mängijatest hakkas teise vastu tunnistama ja teine ​​vaikib siiani! ütles Grandi. - Sel juhul saab see, kes selle tõendi annab, korraga viis punkti ja see, kes vaikib, ei saa ühtegi punkti!
– Ahaa! hüüasid mõlemad nõiad ühest suust, lakkudes röökivalt huuli. Oli selge, et mõlemad toovad selgelt kumbki viis punkti.
"Ma kaotasin kogu aeg punkte!" hüüdis deemon. – Kuid te olete olukorda ainult kirjeldanud, kuid te pole veel esitanud viisi selle lahendamiseks! Mis on teie strateegia? Pole vaja aega raisata!
"Oota, ma seletan nüüd kõik!" hüüdis Grundy. "Igaüks meist neljast – oleme kaks golemit ja kaks nõida – võitlevad oma vastastega. Muidugi püüavad nõiad mitte milleski kellelegi järele anda ...
- Muidugi! hüüasid mõlemad nõiad taas üksmeelselt. Nad said golemist poolest sõnast suurepäraselt aru!
"Ja teine ​​golem järgib minu taktikat," jätkas Grundy segamatult. Ta vaatas oma kahepalgelist otsa. "Muidugi tead?
- Oh, kindlasti! Mina olen sinu koopia! Ma saan suurepäraselt aru, mida sa arvad!
- See on suurepärane! Sel juhul teeme esimese liigutuse, et deemon saaks ise veenduda. Igas heitluses on mitu vooru, et kogu strateegia saaks end lõpuni väljendada ja jätta mulje ühtsest süsteemist. Võib-olla peaksin alustama.

"Nüüd peab igaüks meist oma paberitükkidele märgid panema!" golem pöördus nõia poole. - Kõigepealt peaksite joonistama naeratava näo. See tähendab, et me ei tunnista kaasvangi vastu. Võite joonistada ka kulmu kortsutava näo, mis tähendab, et mõtleme ainult iseendale ja anname oma kaaslasele vajaliku tunnistuse. Oleme mõlemad teadlikud, et parem oleks, kui keegi ei osutuks selliseks väga kortsuliseks näoks, kuid teisest küljest saab kulmutsev nägu naeratava ees teatud eelised! Aga lõpptulemus on see, et igaüks meist ei tea, mida teine ​​valib! Me ei saa teada enne, kui mängupartner oma joonise avaldab!
- Alusta, pätt! sõimas nõid. Ta, nagu alati, ei saanud ilma kuritahtlike epiteetideta!
- Valmis! hüüatas Grundy ja joonistas oma paberile suure naeratava näo nii, et nõid ei näinud, mida ta sinna oli joonistanud. Nõid pani ta liigutama, tehes ka näo. Peab arvama, et ta kujutas kindlasti ebasõbralikku füsiognoomiat!
"Noh, nüüd peame lihtsalt üksteisele oma jooniseid näitama," teatas Grundy. Tagasi pöördudes avas ta joonise avalikkusele ja näitas seda igas suunas, et kõik joonistust näeksid. Midagi pahameelt nurisedes tegi Merenõid sama.
Nagu Grundy lootis, paistis nõia joonistusest välja vihane, rahulolematu nägu.
"Nüüd te, lugupeetud pealtvaatajad," ütles Grundy pidulikult, "vaadake, et nõid eelistas minu vastu tunnistada. Ma ei kavatse seda teha. Seega kogub Merenõid viis punkti. Ja seetõttu ei saa ma ühtegi punkti. Ja siin…
Pealtvaatajate ridadest käis taas läbi kerge müra. Kõik tundsid golemile selgelt kaasa ja igatsesid, et Merenõid kaotaks.
Kuid mäng on alles alanud! Kui vaid tema strateegia oleks õige...
"Nüüd saame liikuda edasi teise ringi!" teatas Grandi pidulikult. Peame liigutusi uuesti kordama. Igaüks joonistab näo, mis on talle lähemal!
Nii nad tegidki. Grundy tegi nüüd sünge ja rahulolematu näo.
Kohe, kui mängijad oma joonistusi näitasid, nägi publik, et nüüd on mõlemad vihased näod joonistanud.
- Kumbki kaks punkti! ütles Grandi.
"Seitse kaks minu kasuks!" hüüdis nõid rõõmsalt. "Sa ei pääse siit välja, pätt!"
- Alustame uuesti! hüüdis Grundy. Nad tegid veel ühe joonise ja näitasid neid avalikkusele. Jälle samad kurjad näod.
- Igaüks meist kordas eelmist käiku, käitus isekalt ja seetõttu, mulle tundub, on parem mitte kellelegi punkte anda! ütles golem.
Aga ma ikka juhin mängu! - ütles nõid rõõmsalt käsi hõõrudes.
- Hea küll, ära tee lärmi! ütles Grandi. - Mäng ei ole läbi. Vaatame, mis saab! Seega, kallis publik, alustame neljanda vooruga!
Mängijad tegid taas joonistusi, näidates avalikkusele, mida nad oma lehtedele olid joonistanud. Mõlemad linad näitasid publikule taas samu vihaseid nägusid.
- Kaheksa - kolm! karjus nõid kurja naeru puhkedes. "Sa kaevasid oma rumala strateegiaga endale haua, golem!"
- Viies voor! hüüdis Grundy. Kordus sama, mis eelmistes voorudes - jälle vihased näod, muutus ainult skoor - sai üheksa - neli nõia kasuks.
- Nüüd viimane, kuues voor! Grundy ütles. Tema esialgsed arvutused näitasid, et just see voor peaks saama otsustavaks. Nüüd tuli teooriat praktikaga kinnitada või ümber lükata.
Paar kiiret ja närvilist pliiatsiliigutust paberil – ja mõlemad joonistused ilmusid avalikkuse silme ette. Jälle kaks nägu, nüüd isegi paljaste hammastega!
- Kümme - viis minu kasuks! Minu mäng! Ma võitsin! koperdas merenõid.

"Sa tõesti võitsid," nõustus Grundy süngelt. Publik vaikis kurjakuulutavalt.
Deemon liigutas huuli, et midagi öelda.

Kuid meie võistlus pole veel lõppenud! hüüdis Grundy valjult. "See oli alles mängu esimene osa.
- Anna sulle terve igavik! nurises deemon Xanth rahulolematult.
- See on õige! ütles Grundy rahulikult. - Aga üks ring ei lahenda midagi, ainult metoodilisus näitab parimat tulemust.
Nüüd lähenes golem teisele nõiale.
– Tahaksin selle vooru mängida teise vastasega! teatas ta. - Igaüks meist kujutab nägusid, nagu see oli eelmisel korral, siis demonstreerib ta, mida ta on avalikkusele joonistanud!
Ja nii nad tegidki. Tulemus oli sama, mis eelmine kord – Grundy joonistas naeratava näo, nõid aga pealuu. Ta saavutas kohe koguni viiepunktilise edumaa, jättes Grundy selja taha.
Ülejäänud viis vooru lõppesid ootuspäraste tulemustega. Taas oli skoor kümme-viis Merenõia kasuks.
"Golem, mulle väga meeldib teie strateegia!" naeris nõid.
- Niisiis, olete vaadanud kahte mänguvooru, kallid vaatajad! hüüdis Grundy. - Mina kogusin seega kümme punkti ja mu rivaalid - kakskümmend!
Publik, kes samuti punkte luges, noogutas nukralt pead. Nende arv ühtis golemi omaga. Ainult Frakto-nimeline pilv tundus väga rahul olevat, kuigi loomulikult ei meeldinud see ka nõiale.
Kuid Rapunzelia naeratas golemile tunnustavalt – ta uskus temasse jätkuvalt. Ta võis olla ainus, kes teda nüüd uskus. Grandi lootis, et ta õigustab seda piiritut usaldust.
Nüüd on Grundy lähenenud oma kolmandale vastasele – oma doppelgängerile. Ta pidi olema tema viimane vastane. Kiiresti paberile pliiatsit kritseldades näitasid golemid pabereid avalikkusele. Kõik nägid kahte naervat nägu.
- Pange tähele, kallid vaatajad, igaüks meist eelistas olla hea kambrikaaslane! hüüdis Grundy. - Ja seetõttu ei saanud keegi meist selles mängus vastase ees vajalikku eelist. Seega saame mõlemad kolm punkti ja liigume järgmisse ringi!
Teine ring on alanud. Tulemus oli sama, mis eelmisel korral. Siis ülejäänud ringid. Ja igas voorus said mõlemad vastased taas kolm punkti! See oli lihtsalt uskumatu, aga publik oli valmis kõike toimuvat kinnitama.

Lõpuks sai see ringkäik läbi ja Grundy pliiatsit kiiresti paberil liigutades hakkas tulemust arvutama. Lõpuks teatas ta pidulikult:
- Kaheksateist kaheksateist korda! Kokku viskasin mina kakskümmend kaheksa punkti, vastased aga kolmkümmend kaheksa!
"Nii et sa kaotasid," teatas merenõid rõõmsalt. - Üks meist on võitja!
- Võib olla! Grundy vastas rahulikult. Nüüd tuleb veel üks oluline hetk. Kui kõik läheb plaanipäraselt...
- Peame töö lõpetama! hüüdis teine ​​golem. "Ma pean veel võitlema ka kahe merenõiaga!" Mäng ei ole veel läbi!
- Jah, muidugi, tule! ütles Grandi. - Kuid lihtsalt juhinduge strateegiast!
- Oh, kindlasti! kinnitas tema doppelgänger talle.
See golem lähenes ühele nõiale ja ringkäik algas. See lõppes sama tulemusega, millega Grundy ise sarnasest ringist lahkus – skoor oli nõia kasuks kümme-viis. Nõid säras väljendamatust rõõmust ja publik langes süngesse vaikusesse. Demon Xant nägi välja veidi väsinud, mis polnud kuigi hea enne.
Nüüd oli käes viimane voor – üks nõid pidi võitlema teise vastu. Igal neist oli kakskümmend punkti, mille ta suutis golemitega võideldes saada.
"Kui lubate mul nüüd vähemalt paar lisapunkti saada..." sosistas Merenõid vandenõulikult oma kahepalgelisele mehele.
Grandi püüdis vähemalt väliselt rahulikuks jääda, kuigi tema hinges möllas vastuoluliste tunnete orkaan. Tema õnn sõltus nüüd sellest, kui õigesti ta mõlema nõia võimalikku käitumist ette ennustas – oli ju nende iseloom sisuliselt sama!
Nüüd tuleb ehk kõige kriitilisem hetk. Aga kui ta eksis!
"Miks ma peaksin sulle järele andma!" krooksus teine ​​nõid esimesele. "Tahan ise rohkem punkte koguda ja siit minema saada!"
"Noh, kui te nii jultunult käitute," karjus kaebaja, "siis ma peksan su läbi nii, et te ei näe enam välja nagu mina!"
Üksteisele vihkavaid pilke heites nõiad joonistasid oma joonised ja näitasid neid avalikkusele. Muidugi ei saanud seal olla midagi muud peale kahe pealuu! Kumbki sai ühe punkti.
Nõiad, kes külvasid üksteist needustega, läksid teisele ringile. Tulemus jälle sama – jälle kaks kohmakalt joonistatud pealuud. Nõiad said seega kumbki ühe punkti rohkem. Publik salvestas usinalt kõike.
See jätkus ka edaspidi. Kui ringkäik lõppes, leidsid väsinud nõiad, et nad olid kumbki kogunud kuus punkti. Järjekordne loosimine!
- Nüüd arvutame tulemused ja võrdleme kõike! ütles Grandi võidukalt. "Nõiad said igaüks kakskümmend kuus punkti ja golemid kakskümmend kaheksa punkti. Mis meil siis on? Ja meil on tulemus, et golemitel on rohkem punkte!
Publikusse tungis üllatusest õhkutõus. Erutatud pealtvaatajad hakkasid oma paberilehtedele kirjutama arvude veerge, kontrollides loenduse õigsust. Paljud selle aja jooksul lihtsalt ei lugenud kogutud punktide arvu, uskudes, et nad teadsid juba mängu tulemust. Mõlemad nõiad hakkasid nördimusest urisema, pole selge, keda nad juhtunus täpselt süüdistavad. Deemon Xanthi silmad lõid taas valvsa tulega särama. Tema usaldus oli õigustatud!
"Ma palun teil, kallis publik, pöörata tähelepanu tõsiasjale," tõstis Grundy käe, nõudes publiku rahunemist, "et ükski golemitest ei võitnud ühtegi vooru. Aga lõplik võit jääb ikkagi ühele meist, golemitest. Tulemused on kõnekamad, kui võistlus jätkub! Tahan öelda, mu kallid vaatajad, et igaveses duellis osutub minu strateegia alati võiduks!
Deemon Xant kuulas huviga, mida Grundyl oli öelda. Lõpuks avas ta suu ja paiskas auru välja.
– Milline on teie strateegia?
- Ma nimetan seda "Ole kindel, kuid aus"! selgitas Grundy. - Alustan mängu ausalt, aga siis hakkan kaotama, sest puutun kokku väga konkreetsete partneritega. Seega, kui esimeses voorus selgub, et Merenõid hakkab minu vastu tunnistama, jään ma teises ringis automaatselt kaotajaks – ja nii kuni lõpuni. Tulemus võib olla erinev, kui nõid muudab oma mängutaktikat. Aga kuna ta ei osanud sellisele asjale mõeldagi, siis mängisime edasi eelmise malli järgi. Kui ma oma doppelgangeriga mängima hakkasin, oli ta minu vastu hea ja ma olin tema vastu hea järgmises mänguvoorus. Seetõttu läks ka meie mäng teisiti ja mõneti üksluiselt, sest taktikat me muuta ei tahtnud...
"Aga te pole võitnud ühtegi vooru! Deemon vastas üllatunult.
- Jah, ja need nõiad pole kaotanud ühtegi vooru! Grundy kinnitas. - Aga võit ei lähe ju automaatselt sellele, kellel on voorud alles. Võidab see, kes kogus kõige rohkem punkte ja see on hoopis teine ​​asi! Mul õnnestus oma doppelgängeriga mängides rohkem punkte saada kui nõidadega mängides. Omakasupüüdlik suhtumine tõi neile küll hetkevõidu, kuid pikemas perspektiivis selgus, et just tänu sellele kaotasid mõlemad kogu mängu. Seda juhtub ka sageli!

Kuigi ma lõpetasin füüsika-tehnoloogiateaduskonna, ei lugenud nad mulle ülikoolis mänguteooriat ette. Kuna aga mängisin üliõpilasaastatel palju, esmalt eelistuses ja seejärel bridžis, huvitas mind mänguteooria ja meisterdasin väikese õpiku. Ja hiljuti lahendas saidi lugeja Mihhail mänguteooria probleemi. Mõistes, et ülesannet mulle kohe ei anta, otsustasin mänguteooriaalaseid teadmisi mälus värskendada. Pakun teile väikest raamatut - populaarne esitlus mänguteooria elementide ja mõnede maatriksmängude lahendamise meetodite kohta. See ei sisalda peaaegu mingeid tõendeid ja illustreerib teooria põhisätteid näidetega. Raamatu kirjutas matemaatik ja teaduse populariseerija Jelena Sergeevna Wentzel. Tema õpikust "Tõenäosusteooria" õppis mitu põlvkonda nõukogude insenere. Jelena Sergeevna kirjutas ka mitmeid kirjandusteoseid I. Grekova pseudonüümi all.

Elena Wentzel. Mänguteooria elemendid. – M.: Fizmatgiz, 1961. – 68 lk.

Laadige alla lühike kokkuvõte vormingus või

§ 1. Mänguteooria aine. Põhimõisted

Mitmete praktiliste probleemide lahendamisel (majanduse, sõjanduse jms vallas) tuleb analüüsida olukordi, kus on kaks (või enam) vastandlikku eesmärki taotlevat sõdivat osapoolt, ning ühe või teise poole iga tegevuse tulemust. osapooled sõltuvad sellest, millise tegevuse vastase valib. Me nimetame selliseid olukordi "konfliktolukordadeks".

Konfliktsituatsioonide näiteid võib tuua arvukalt erinevatest praktikavaldkondadest. Kõik vaenutegevuse käigus tekkivad olukorrad kuuluvad konfliktiolukordadesse: iga sõdija rakendab kõiki tema käsutuses olevaid meetmeid, et takistada vaenlasel edu saavutamast. Konfliktsituatsioonid hõlmavad ka olukordi, mis tekivad relvasüsteemi, selle lahingukasutusviiside valimisel ja üldiselt sõjaliste operatsioonide kavandamisel: kõik selle valdkonna otsused tuleks teha lähtudes vaenlase tegevusest, mis on meile kõige vähem kasulik. . Konfliktsituatsioonide hulka kuuluvad mitmed olukorrad majandusvaldkonnas (eriti vaba konkurentsi olemasolul); kaubandusettevõtted, tööstusettevõtted jne tegutsevad sõdijatena.

Vajadus selliseid olukordi analüüsida äratas ellu erilise matemaatilise aparaadi. Mänguteooria pole sisuliselt midagi muud kui matemaatiline konfliktsituatsioonide teooria. Teooria eesmärk on välja töötada soovitused iga vastase ratsionaalse tegutsemise kohta konfliktiolukorras. Iga praktikast otseselt võetud konfliktsituatsioon on väga keeruline ja selle analüüsi teeb keeruliseks arvukate juhuslike tegurite olemasolu. Olukorra matemaatilise analüüsi võimaldamiseks on vaja abstraheerida sekundaarsetest, juhuslikest teguritest ja koostada olukorra lihtsustatud, formaliseeritud mudel. Me nimetame sellist mudelit "mänguks".

Mäng erineb reaalsest konfliktsituatsioonist selle poolest, et see viiakse läbi täpselt määratletud reeglite järgi. Inimkond on pikka aega kasutanud selliseid formaliseeritud konfliktsituatsioonide mudeleid, mis on mängud selle sõna otseses tähenduses. Näiteks male, kabe, kaardimängud jne. Kõik need mängud on oma olemuselt võistluslikud, kulgedes teadaolevate reeglite järgi ja lõppedes ühe või teise mängija "võiduga" (võiduga).

Sellised formaalselt reguleeritud, kunstlikult organiseeritud mängud on mänguteooria põhimõistete illustreerimiseks ja valdamiseks sobivaim materjal. Selliste mängude praktikast laenatud terminoloogiat kasutatakse ka teiste konfliktsituatsioonide analüüsimisel: neis osalenud osapooli nimetatakse tinglikult "mängijateks" ja kokkupõrke tulemust ühe mängu "võiduks". peod.

Mängus võivad põrkuda kahe või enama vastase huvid; esimesel juhul nimetatakse mängu "topelt", teisel - "mitmekordne". Mitmemängus osalejad võivad selle käigus moodustada koalitsioone – alalisi või ajutisi. Kahe püsiva koalitsiooni olemasolul muutub mitmikmäng paarismänguks. Paarismängud on kõige suurema praktilise tähtsusega; Siin piirdume ainult selliste mängude kaalumisega.

Alustame elementaarse mänguteooria tutvustamist mõne põhimõiste sõnastamisest. Vaatleme paarismängu, milles osalevad kaks vastandlike huvidega mängijat A ja B. "Mängu" all peame silmas sündmust, mis koosneb osapoolte A ja B tegevuste jadast. Selleks, et mäng saaks allutada matemaatilisele analüüsile, peavad mängureeglid olema täpselt sõnastatud. "Mängureeglite" all mõeldakse tingimuste süsteemi, mis reguleerib mõlema poole võimalikke tegevusvariante, kummalgi poolel oleva informatsiooni hulka teise käitumise kohta, "käikude" (individuaalsete otsuste) vaheldumise järjestust. mängu ajal tehtud), samuti mängu tulemus või tulemus, mis viib selle käikude komplekti. Seda tulemust (võitu või kaotust) ei määrata alati kvantitatiivselt, kuid tavaliselt on võimalik seda teatud arvuga väljendada, seades mõõtmisskaala. Näiteks malemängus võib võidule tinglikult määrata väärtuse +1, kaotusele -1, viigile 0.

Mängu nimetatakse nullsummamänguks, kui üks mängija võidab selle, mille teine ​​kaotab, s.t. mõlema poole väljamaksete summa on null. Nullsummamängus on mängijate huvid otseselt vastandlikud. Siin käsitleme ainult selliseid mänge.

Kuna nullsummamängus on ühe mängija väljamakse võrdne teise vastupidise märgiga väljamaksega, siis on ilmne, et sellise mängu analüüsimisel saab arvestada vaid ühe mängija väljamaksega. Olgu selleks näiteks mängija A. Mugavuse huvides kutsume edaspidi poolt A tinglikult “meie” ja poolt B – “vastane”.

Sel juhul loetakse pool A (“me”) alati “võitjaks” ja pool B (“vastane”) “kaotajaks”. See formaalne tingimus ei tähenda ilmselgelt esimesele mängijale tegelikku eelist; on lihtne näha, et see asendatakse selle vastandiga, kui väljamaksemärk on vastupidine.

Me kujutame mängu arengut ajas kui järjestikuste etappide või "käikude" seeriat. Liikumine mänguteoorias on valik ühe mängureeglitega ette nähtud valiku vahel. Liigutused jagunevad isiklikeks ja juhuslikeks. Isiklik käik on ühe mängija teadlik valik antud olukorras võimalikust käigust ja selle elluviimine. Isikliku käigu näide on mis tahes käik malemängus. Sooritades järgmist käiku, teeb mängija teadliku valiku ühe võimalikust valikust, mis on laual antud nuppude paigutuse jaoks võimalik. Iga isikliku käigu võimalike valikute komplekt on reguleeritud mängureeglitega ja sõltub mõlema poole eelnevate käikude koguarvust.

Juhuslik käik on valik mitmete võimaluste hulgast, mis tehakse mitte mängija otsusel, vaid mõne juhusliku valiku mehhanismi abil (mündi, täringu viskamine, kaartide segamine ja jagamine jne). Näiteks esimese kaardi andmine ühele eelistatud mängijale on juhuslik käik 32 võrdselt võimaliku variandiga. Et mäng oleks matemaatiliselt defineeritud, peavad mängureeglid iga juhusliku käigu puhul täpsustama võimalike tulemuste tõenäosusjaotuse.

Mõned mängud võivad koosneda ainult juhuslikest käikudest (nn puhtad õnnemängud) või ainult isiklikest käikudest (male, kabe). Enamik kaardimänge kuulub segatüüpi mängude hulka, s.o. sisaldab nii juhuslikke kui ka isiklikke käike.

Mänge ei liigitata mitte ainult käikude laadi (isiklik, juhuslik), vaid ka igale mängijale teise tegevuse kohta saadava teabe olemuse ja hulga järgi. Mängude eriklass on nn "täieliku teabega mängud". Täieliku teabega mäng on mäng, kus iga mängija teab igal isiklikul käigul kõigi eelnevate, nii isiklike kui juhuslike käikude tulemusi. Täieliku teabega mängud on näiteks male, kabe ja tuntud mäng tic-tac-toe.

Enamik praktilise tähtsusega mänge ei kuulu täieliku teabega mängude klassi, kuna teadmatus vastase tegevuse kohta on tavaliselt konfliktiolukordade oluline element.

Mänguteooria üks põhimõisteid on mõiste "strateegia". Mängija strateegia on reeglite kogum, mis üheselt määravad valiku antud mängija igaks isiklikuks käiguks, olenevalt mängu jooksul kujunenud olukorrast. Tavaliselt teeb otsuse (valiku) iga isikliku käigu kohta mängija ise mängu käigus, olenevalt hetkeolukorrast. Samas teoreetiliselt asi ei muutu, kui kujutame ette, et kõik need otsused teeb mängija ette. Selleks peaks mängija eelnevalt koostama nimekirja kõikidest võimalikest olukordadest mängu käigus ja pakkuma igale neist oma lahendus. Põhimõtteliselt (kui mitte praktiliselt) on see võimalik iga mängu puhul. Kui selline otsustussüsteem vastu võetakse, tähendab see, et mängija on valinud teatud strateegia.

Mängija, kes on valinud strateegia, ei saa nüüd isiklikult mängus osaleda, vaid asendab oma osalemise reeglite nimekirjaga, mida mõni mittehuvitav isik (kohtunik) talle kohaldab. Strateegia saab anda ka automaatile konkreetse programmi näol. Nii mängitakse praegu arvutimalet. Et mõiste "strateegia" oleks mõistlik, peavad mängus olema isiklikud käigud; pelgalt juhuslikest käikudest koosnevates mängudes strateegiaid pole.

Sõltuvalt võimalike strateegiate arvust jagunevad mängud "lõpmatuteks" ja "lõpmatuteks". Mängu peetakse lõplikuks, kui igal mängijal on ainult piiratud arv strateegiaid. Finaalmäng, milles mängija A on m strateegiad ja mängija B n strateegiat nimetatakse mxn-mänguks.

Mõelge mängule mxn, kus on kaks mängijat A ja B ("meie" ja "vastane"). Tähistame oma strateegiaid A 1 , A 2 , …, A m vaenlase strateegiaid B 1 , B 2 , …, B n . Laske mõlemal poolel valida konkreetne strateegia; meile saab see A i , vastasele B j . Kui mäng koosneb ainult isiklikest käikudest, siis strateegiate A i , B j valik määrab unikaalselt mängu tulemuse – meie väljamakse. Tähistame seda kui ij . Kui mäng sisaldab lisaks isiklikele juhuslikele käikudele, siis on strateegiapaari A i , B j väljamakse juhuslik väärtus, mis sõltub kõigi juhuslike käikude tulemustest. Sel juhul on eeldatava tasuvuse loomulik hinnang selle keskmine väärtus (matemaatiline ootus). Sama märgiga tähistame nii väljamakset ennast (juhuslike käikudeta mängus) kui ka selle keskmist väärtust (juhuslike käikudega mängus).

Andke meile teada iga strateegiapaari väljamakse väärtused a ij (või keskmine väljamakse). Väärtused saab kirjutada ristkülikukujulise tabeli (maatriksi) kujul, mille read vastavad meie strateegiatele (A i) ja veerud vastavad vastase strateegiatele (B j). Sellist tabelit nimetatakse väljamaksemaatriksiks või lihtsalt mängumaatriksiks. Mängu maatriks mxn on näidatud joonisel fig. üks.

Riis. 1. mxn maatriks

Mängu maatriksi lühendatakse kui ‖a ij ‖. Mõelge mõnele mängude elementaarsele näitele.

Näide 1 Kaks mängijat A ja B asetavad üksteisele otsa vaatamata lauale mündi esiküljega ülespoole või sabad vastavalt oma äranägemisele. Kui mängijad on valinud samad küljed (mõlemal on vapp või mõlemal sabad), võtab mängija A mõlemad mündid; vastasel juhul võtab need mängija B. Mäng on vaja analüüsida ja selle maatriks koostada. Lahendus. Mäng koosneb ainult kahest käigust: meie kord ja vastase kord, mõlemad isiklikud. Mäng ei kuulu täieliku infoga mängude hulka, kuna käigu sooritamise hetkel ei tea seda sooritav mängija, mida teine ​​on teinud. Kuna igal mängijal on ainult üks isiklik käik, on mängija strateegia valik selles üksikus isiklikus käigus.

Meil on kaks strateegiat: A 1 – vali vapp ja A 2 – vali sabad; vastasel on samad kaks strateegiat: B 1 - vapp ja B 2 - sabad. Seega on see mäng 2 × 2 mäng. Mündi võiduks loeme +1. Mängu maatriks:

Selle mängu näitel, olgu see nii elementaarne kui tahes, saab selgitada mõningaid mänguteooria olulisi ideid. Oletame esmalt, et antud mängu sooritatakse ainult üks kord. Siis on ilmselgelt mõttetu rääkida teistest mõistlikumatest mängijate "strateegiatest". Iga mängija võib samal põhjusel teha mis tahes otsuse. Mängu korrates olukord aga muutub.

Tõepoolest, oletame, et oleme (mängija A) valinud endale mingi strateegia (näiteks A 1) ja jääme sellest kinni. Seejärel arvab vastane esimeste käikude tulemuste põhjal ära meie strateegia ja reageerib sellele meie jaoks kõige ebasoodsamal viisil, s.t. vali sabad. Meile on selgelt kahjumlik alati ühe strateegia rakendamine; selleks, et mitte olla kaotaja, peame valima mõnikord vapi, mõnikord sabad. Kui aga vappe ja sabasid teatud järjestuses (näiteks ühe kaudu) vaheldame, võib vaenlane seda ka aimata ja sellele strateegiale meie jaoks halvimal viisil reageerida. Ilmselgelt on usaldusväärne viis tagada, et vaenlane ei teaks meie strateegiat, korraldada valik igal liigutusel, kui me ise seda ette ei tea (seda saab tagada näiteks mündi viskamisega). Seega läheneme intuitiivse arutlemise abil ühele mänguteooria olemuslikule mõistele – mõistele "segastrateegia", s.o. nii, et "puhtad" strateegiad – antud juhul A 1 ja A 2 – vahelduvad juhuslikult teatud sagedustega. Selles näites on sümmeetrilisuse huvides eelnevalt selge, et strateegiad A 1 ja A 2 peavad vahelduma sama sagedusega; keerulisemates mängudes ei pruugi lahendus olla kaugeltki triviaalne.

Näide 2 Mängijad A ja B panevad korraga ja üksteisest sõltumatult kirja ühe kolmest numbrist: 1, 2 või 3. Kui kirjutatud numbrite summa on paaris, siis B maksab A-le selle summa rublades; kui see on paaritu, siis vastupidi, A maksab B-le selle summa. On vaja mängu analüüsida ja selle maatriksit koostada.

Lahendus. Mäng koosneb kahest käigust; mõlemad on isiklikud. Meil on (A) kolm strateegiat: A 1 – kirjuta 1; Ja 2 - kirjuta 2; A 3 – kirjuta 3. Vastasel (B) on samad kolm strateegiat. Mäng on 3 × 3 mäng:

Ilmselgelt, nagu ka eelmisel juhul, võib vaenlane reageerida igale meie valitud strateegiale meie jaoks halvimal viisil. Tõepoolest, kui valime näiteks strateegia A 1 , vastab vaenlane sellele alati strateegiaga B 2 ; strateegia A 2 kohta - strateegia B 3; strateegia A 3 kohta – strateegia B 2 ; seega viib iga teatud strateegia valik meid paratamatult kaotuseni (samas ei tohi unustada, et vaenlane on samas hädas). Selle mängu lahendus (ehk mõlema mängija jaoks kõige kasumlikumate strateegiate komplekt) antakse §-s 5.

Näide 3 Meie käsutuses on kolme tüüpi relvi: A 1, A 2, A 3; vaenlasel on kolme tüüpi lennukeid: B 1, B 2, B 3. Meie ülesanne on lennukile pihta saada; vaenlase ülesanne on hoida teda võitmatuna. Relvade A 1 kasutamisel tabatakse õhusõidukeid B 1, B 2, B 3 tõenäosustega vastavalt 0,9, 0,4 ja 0,2; kui relvastatud A 2 - tõenäosusega 0,3, 0,6 ja 0,8; kui relvastatud A 3 - tõenäosusega 0,5, 0,7 ja 0,2. Olukord tuleb sõnastada mänguteoreetiliselt.

Lahendus. Olukorda võib vaadelda kui 3x3 mängu kahe isikliku ja ühe juhusliku käiguga. Meie isiklik samm on relvade tüübi valik; vaenlase isiklik käik – lahingus osalemise lennuki valik. Juhuslik käik – relvade kasutamine; see käik võib lõppeda lennuki lüüasaamise või mittelüümisega. Meie tasu on üks, kui lennuk saab pihta, ja null muul juhul. Meie strateegiad on kolm relvavalikut; vaenlase strateegiad – kolm lennukivalikut. Iga antud strateegiapaari väljamakse keskmine väärtus ei ole midagi muud kui tõenäosus tabada antud lennukit antud relvaga. Mängu maatriks:

Mänguteooria eesmärk on välja töötada soovitused mängijate mõistlikuks käitumiseks konfliktiolukordades, s.t. nende kõigi "optimaalse strateegia" kindlaksmääramine. Mänguteoorias on mängija optimaalne strateegia selline strateegia, mis annab mängu mitmekordsel kordamisel antud mängijale maksimaalse võimaliku keskmise kasu (või minimaalse võimaliku keskmise kaotuse). Selle strateegia valikul on arutluse aluseks eeldus, et vaenlane on vähemalt sama tark kui meie ise ning teeb kõik selleks, et takistada meil oma eesmärki saavutamast.

Mänguteoorias on kõik soovitused välja töötatud nende põhimõtete alusel; Seetõttu ei võta see arvesse riskielemente, mis igas reaalses strateegias paratamatult esinevad, ega ka iga mängija võimalikke valearvestusi ja vigu. Mänguteoorial, nagu igal keeruka nähtuse matemaatilisel mudelil, on omad piirangud. Kõige olulisem neist on see, et võidud vähendatakse kunstlikult ühele numbrile. Enamikus praktilistes konfliktsituatsioonides tuleb mõistliku strateegia väljatöötamisel arvestada mitte ühe, vaid mitme numbrilise parameetriga - sündmuse õnnestumise kriteeriumiga. Strateegia, mis on ühe kriteeriumi järgi optimaalne, ei pruugi olla optimaalne ka teiste järgi. Kuid teadvustades neid piiranguid ja seetõttu mitte pimesi järgides mängumeetoditega saadud soovitusi, võib mänguteooria matemaatilist aparaati siiski mõistlikult kasutada, kui mitte täpselt “optimaalse”, siis igal juhul “vastuvõetava” väljatöötamiseks. strateegia.

§ 2. Mängu alumine ja ülemine hind. "minimax" põhimõte

Mõelge mängule mxn maatriksiga, nagu joonisel fig. 1. Tähistame tähega i meie strateegia numbrit; täht j on vastase strateegia number. Seadsime endale ülesandeks määrata kindlaks oma optimaalne strateegia. Analüüsime järjestikku kõiki oma strateegiaid, alustades A 1-st.

Strateegia A i valimisel peame alati eeldama, et vastane vastab sellele ühe strateegiaga B j, mille puhul meie väljamakse a ij on minimaalne. Määratleme selle tasuvusväärtuse, s.o. väikseim arvudest a ij sisse i-th rida. Tähistage seda α i:

Siin tähistab märk min (minimaalne j-s) selle parameetri väärtuste miinimumi kõigi võimalike j-de jaoks. Kirjutame üles arvud α i ; parempoolse maatriksi kõrval täiendava veeruna:

Valides mistahes strateegia A i, peame eeldama, et vastase mõistlike tegevuste tulemusena ei võida me rohkem kui α i . Loomulikult, tegutsedes kõige ettevaatlikumalt ja lootes kõige mõistlikuma vastasega (st vältides igasugust riski), peame peatuma strateegial, mille puhul arv α i on maksimaalne. Seda maksimaalset väärtust tähistame α-ga:

või, võttes arvesse valemit (2.1),

Väärtust α nimetatakse mängu madalamaks hinnaks, vastasel juhul - maksimaalseks väljamakseks või lihtsalt maksimumiks. Arv α asub maatriksi teatud real; mängija A strateegiat, mis sellele reale vastab, nimetatakse maksimiinstrateegiaks. Ilmselgelt, kui järgime maksimaalstrateegiat, on meile tagatud vastase igasuguse käitumise eest tasu, vähemalt mitte väiksem kui α. Seetõttu nimetatakse α väärtust "mängu madalamaks hinnaks". See on garanteeritud miinimum, mille saame endale kindlustada, järgides kõige ettevaatlikumat (“edasikindlustus”) strateegiat.

Ilmselgelt saab sarnase arutluskäigu läbi viia ka vastase B puhul. Kuna vastane on huvitatud meie väljamakse minimeerimisest, peab ta iga oma strateegia üle vaatama selle strateegia maksimaalse väljamakse seisukohast. Seetõttu kirjutame maatriksi allosas iga veeru maksimaalsed väärtused:

ja leidke β j miinimum:

β väärtust nimetatakse mängu ülemiseks hinnaks, muidu - "minimax". Minimax väljamaksele vastavat vastase strateegiat nimetatakse tema "minimax strateegiaks". Järgides oma kõige ettevaatlikumat minimax strateegiat, garanteerib vastane endale järgmise: ükskõik, mida me tema vastu teeme, kaotab ta igal juhul summa, mis ei ületa β. Ettevaatusprintsiipi, mis dikteerib mängijatele sobivate strateegiate valiku (maksimaalne ja minimax), nimetatakse mänguteoorias ja selle rakendustes sageli "minimaxi põhimõtteks". Mängijate kõige ettevaatlikumatele maximin ja minimax strateegiatele viidatakse mõnikord üldmõistega "minimax strateegiad".

Näidetena määratleme 1. jaotise näidete 1, 2 ja 3 jaoks mängu madalama ja ülemise hinna ning minimaxi strateegiad.

Näide 1 Paragrahvi 1 näites 1 on mäng antud järgmise maatriksiga:

Kuna väärtused α i ja β j on konstantsed ja võrdub vastavalt –1 ja +1, siis on ka mängu alumine ja ülemine hind –1 ja +1: α = –1, β = +1 . Iga mängija A strateegia on tema maksimum ja iga mängija B strateegia on tema minimaalne strateegia. Järeldus on triviaalne: mis tahes oma strateegiast kinni pidades võib mängija A garanteerida, et ta ei kaota rohkem kui 1; sama võib garanteerida ka mängija B.

Näide 2 Paragrahvi 1 näites 2 on antud mäng maatriksiga:

Mängu madalam hind α = –3; mängu ülemine kulu on β = 4. Meie maksimumstrateegia on A 1 ; süstemaatiliselt rakendades võime julgelt eeldada võitu vähemalt -3 (kaotust maksimaalselt 3). Vastase minimax strateegia on ükskõik milline strateegiatest B 1 ja B 2 ; neid süstemaatiliselt rakendades saab ta igal juhul garanteerida, et ta ei kaota rohkem kui 4. Kui me kaldume oma maksimiinstrateegiast kõrvale (näiteks valime strateegia A 2), saab vaenlane meid selle eest "karistada", rakendades strateegiat B. 3 ja meie väljamakse vähendamine -5-ni; samamoodi võib vastase minimaxi strateegiast taganemine suurendada tema kaotust 6-ni.

Näide 3 Paragrahvi 1 näites 3 on maatriksiga mäng antud:

Mängu madalam hind α = 0,3; ülemine hindamismäng β = 0,7. Meie kõige ettevaatlikum (maksimaalne) strateegia on A 2 ; A 2 relvi kasutades garanteerime, et tabame lennukit keskmiselt mitte vähem kui 0,3 juhtudest. Vastase kõige ettevaatlikum (minimax) strateegia on B 2 ; seda lennukit kasutades võib vaenlane olla kindel, et teda tabatakse mitte rohkem kui 0,7 korral.

Viimast näidet kasutades on mugav demonstreerida minimaxi strateegiate üht olulist omadust – nende ebastabiilsust. Rakendagem oma kõige ettevaatlikumat (maksimaalset) strateegiat A 2 ja vastast tema kõige ettevaatlikumat (minimax) strateegiat B 2 . Kuni mõlemad vastased neist strateegiatest kinni peavad, on keskmine väljamakse 0,6; see on suurem kui mängu alumine, kuid väiksem kui ülemine hind. Oletame nüüd, et vaenlane on teada saanud, et me kasutame strateegiat A2; ta vastab sellele kohe strateegiaga B 1 ja vähendab väljamakset 0,3-ni. Meil on omakorda hea vastus strateegiale B 1: strateegia A 1 , mis annab meile väljamakse 0,9 jne.

Seega on olukord, kus mõlemad mängijad kasutavad oma minimax strateegiaid, ebastabiilne ja seda võib rikkuda saadud info vastaspoole strateegia kohta. Siiski on mõned mängud, mille minimaxi strateegiad on stabiilsed. Need on mängud, mille madalam hind on võrdne ülemisega: α = β. Kui mängu alumine hind on võrdne ülemisega, siis nende ühist väärtust nimetatakse mängu netohinnaks (mõnikord lihtsalt mängu hinnaks), tähistame seda tähega ν.

Kaaluge näidet. Olgu 4×4 mäng antud maatriksiga:

Leiame mängu madalama hinna: α = 0,6. Leiame mängu ülemise hinna: β = 0,6. Need osutusid samaks, seetõttu on mängu netokulu võrdne α = β = ν = 0,6. Väljamakse maatriksis esile tõstetud element 0.6 on nii minimaalne oma reas kui ka maksimum veerus. Geomeetrias nimetatakse sadulapunktiks pinna punkti, millel on sarnane omadus (samaaegne miinimum piki üht koordinaati ja maksimum piki teist), analoogia põhjal kasutatakse seda terminit ka mänguteoorias. Maatriksi elementi, millel on see omadus, nimetatakse maatriksi sadulapunktiks ja mängul öeldakse olevat sadulapunkt.

Sadulpunkt vastab minimax strateegiate paarile (selles näites A 3 ja B 2). Neid strateegiaid nimetatakse optimaalseteks ja nende kombinatsioon on mängu lahendus. Mängu lahendusel on järgmine tähelepanuväärne omadus. Kui üks mängijatest (näiteks A) järgib oma optimaalset strateegiat ja teine ​​mängija (B) kaldub mingil moel oma optimaalsest strateegiast kõrvale, siis kõrvalekaldumise teinud mängija jaoks ei saa see kunagi olla kasumlik, näiteks mängija B kõrvalekalle võib parimal juhul jätta võimenduse muutumatuks ja halvimal juhul suurendada seda. Ja vastupidi, kui B järgib oma optimaalset strateegiat ja A kaldub omast kõrvale, ei saa see A-le mingil juhul kasulik olla.

Seda väidet on lihtne kontrollida vaadeldava mängu näitel sadulapunktiga. Näeme, et sadulapunktiga mängu puhul on minimax strateegiatel omamoodi “stabiilsus”: kui üks pool peab kinni oma minimax strateegiast, siis võib teisele omast kõrvalekaldumine olla ainult kahjumlik. Pange tähele, et antud juhul ei saa mängija enda käitumist muuta asjaolu, et igal mängijal on info, et vastane on valinud oma optimaalse strateegia: kui ta ei taha tegutseda oma huvide vastaselt, peab ta järgima oma optimaalset strateegiat. Optimaalsete strateegiate paar sadulapunktiga mängus on justkui "tasakaalupositsioon": igasugune kõrvalekalle optimaalsest strateegiast viib kõrvalekalduva mängija ebasoodsate tagajärgedeni, sundides teda naasma algsele positsioonile.

Seega on iga sadulapunktiga mängu jaoks lahendus, mis määrab mõlemale poolele optimaalse strateegiapaari, mis erinevad järgmiste omaduste poolest.

1) Kui mõlemad pooled järgivad oma optimaalseid strateegiaid, on keskmine väljamakse võrdne mängu netohinnaga ν, mis on nii selle alumine kui ka ülemine hind.

2) Kui üks osapooltest järgib oma optimaalset strateegiat, teine ​​aga kaldub omast kõrvale, siis võib kõrvale kalduv pool sellest ainult kaotada ega saa mingil juhul oma kasu suurendada.

Sadulaotsaga mängude klass pakub suurt huvi nii teoreetilisest kui praktilisest küljest. Mänguteoorias on tõestatud, et eelkõige on igal täieliku informatsiooniga mängul sadulapunkt ja järelikult on igal sellisel mängul lahendus, s.t. mõlema poole jaoks on paar optimaalset strateegiat, mis annab keskmise väljamakse, mis on võrdne mängu hinnaga. Kui täiusliku informatsiooniga mäng koosneb ainult isiklikest käikudest, siis kui kumbki pool rakendab oma optimaalset strateegiat, peab see alati lõppema üsna kindla tulemusega, nimelt mängu hinnaga täpselt võrdse väljamaksega.

Täieliku teabega mängu näitena võtame tuntud mängu müntide asetamise ümarlauale. Kaks mängijat asetavad ümarlauale vaheldumisi identseid münte, valides iga kord mündi keskkoha suvalise asukoha; Müntide vastastikune katmine ei ole lubatud. Mängija, kes paneb sisse viimase mündi, võidab (kui teistele ei jää ruumi). On ilmselge, et selle mängu tulemus on alati ette määratud ja on olemas täpselt määratletud strateegia, mis tagab usaldusväärse võidu mängijale, kes paneb mündi esikohale. Nimelt peab ta esmalt asetama mündi laua keskele ning seejärel vastama igale vastase liigutusele sümmeetrilise käiguga. Sel juhul saab teine ​​mängija käituda nii, nagu talle meeldib, muutmata mängu etteantud tulemust. Seetõttu on see mäng mõttekas ainult mängijatele, kes ei tea optimaalset strateegiat. Sarnane on olukord male ja muude täieliku teabega mängudega; igal neist mängudest on sadulapunkt ja lahendus, mis näitab igale mängijale tema optimaalset strateegiat; malepartii lahendust ei leita ainult seetõttu, et males on võimalike käikude kombinatsioonide arv liiga suur, et oleks võimalik konstrueerida väljamaksemaatriksit ja leida selles sadulapunkti.

§ 3. Puhtad ja segastrateegiad. Mängu lahendamine segastrateegiates

Praktilise tähtsusega piiratud mängude hulgas on sadulaotsaga mänge suhteliselt harva; tüüpilisem on juhtum, kui mängu alumine ja ülemine hind on erinevad. Selliste mängude maatrikseid analüüsides jõudsime järeldusele, et kui igale mängijale on antud üksainus strateegia valik, siis mõistlikult tegutsevast vastasest lähtudes tuleks see valik määrata minimax põhimõttel. Järgides oma maksimaalstrateegiat, garanteerime endale kindlasti mängu madalama hinnaga α võrdse väljamakse vastase igasuguse käitumise eest. Tekib loomulik küsimus: kas on võimalik tagada endale α-st suurem keskmine väljamakse, kui te ei kasuta ainult ühte "puhast" strateegiat, vaid vahetate juhuslikult mitut strateegiat? Selliseid kombineeritud strateegiaid, mis seisnevad mitme juhusliku seaduse järgi vahelduva puhta strateegia rakendamises teatud sageduste suhtega, nimetatakse mänguteoorias segastrateegiateks.

Ilmselgelt on iga puhas strateegia erijuht segatud strateegia puhul, kus kõiki strateegiaid peale ühe rakendatakse nullsagedusega ja seda sagedusega 1. Selgub, et kasutades mitte ainult puhast, aga ka segastrateegiaid, saame iga lõpliku mängulahenduse, st. paar (üldiselt segatud) strateegiat nii, et kui mõlemad mängijad neid rakendavad, on väljamakse võrdne mängu hinnaga ja optimaalsest strateegiast ühepoolse kõrvalekalde korral saab väljamakse muutuda ainult selles suunas kõrvalekalduvale mängijale ebasoodne.

Väljatoodud väide on mänguteooria nn põhiteoreemi sisu. Selle teoreemi tõestas esmakordselt von Neumann 1928. aastal. Teoreemi teadaolevad tõestused on suhteliselt keerulised; seetõttu esitame ainult selle sõnastuse.

Igal lõplikul mängul on vähemalt üks lahendus (võib-olla segastrateegiate vallas).

Otsusest tulenevat väljamakset nimetatakse mängu hinnaks. Põhiteoreemist järeldub, et igal lõplikul mängul on hind. Ilmselt jääb mängu väärtus ν alati mängu madalama väärtuse α ja mängu ülemise väärtuse β vahele:

(3.1) α ≤ ν ≤ β

Tõepoolest, α on maksimaalne garanteeritud väljamakse, mille saame endale tagada, rakendades ainult oma puhtaid strateegiaid. Kuna segastrateegiate hulka kuuluvad erijuhul kõik puhtad, lubades lisaks puhastele ka segastrateegiaid, siis me igal juhul oma võimalusi ei halvenda; seega ν ≥ α. Samamoodi, arvestades vastase võimeid, näitame, et ν ≤ β, mis viitab nõutavale ebavõrdsusele (3.1).

Tutvustame segastrateegiate jaoks spetsiaalset tähistust. Kui meie segastrateegia seisneb näiteks strateegiate A 1, A 2, A 3 rakendamises sagedustega p 1, p 2, p 3 ja p 1 + p 2 + p 3 = 1, tähistame seda strateegiat.

Samamoodi tähistatakse vastase segastrateegiat järgmiselt:

kus q 1, q 2, q 3 - sagedused, milles strateegiad B1, B2, B3 on segunenud; q 1 + q 2 + q 3 = 1.

Oletame, et oleme leidnud mängule lahenduse, mis koosneb kahest optimaalsest segatud strateegiast S A *, S B *. Üldjuhul ei kuulu tema optimaalsesse segastrateegiasse kõik konkreetsele mängijale kättesaadavad puhtad strateegiad, vaid ainult osa neist. Mängija optimaalses segastrateegias sisalduvaid strateegiaid nimetame tema "kasulikeks" strateegiateks. Selgub, et mängu lahendusel on veel üks tähelepanuväärne omadus: kui üks mängijatest järgib oma optimaalset segastrateegiat S A * (S B *), siis jääb väljamakse samaks ja võrdseks mängu hinnaga ν, olenemata sellest. mida teine ​​mängija teeb, välja arvatud juhul, kui ta ületab selle "kasulikud" strateegiad. Näiteks võib ta kasutada kõiki oma "kasulikke" strateegiaid nende puhtal kujul ja võib neid ka segada mis tahes vahekorras.

§ 4. Mängude lahendamise elementaarsed meetodid. Mängud 2x2 ja 2xn

Kui mängul mxn sadulapunkti pole, siis on lahenduse leidmine üldiselt üsna keeruline ülesanne, eriti suurte m ja n puhul. Mõnikord saab seda ülesannet lihtsustada, vähendades esmalt strateegiate arvu, kustutades mõned üleliigsed. Üleliigsed strateegiad on a) dubleerivad ja b) ilmselgelt kahjumlikud. Mõelge näiteks maatriksmängule:

On lihtne näha, et strateegia A 3 kordab täpselt ("kahekordistab") strateegiat A 1 , nii et iga neist kahest strateegiast saab läbi kriipsutada. Lisaks, võrreldes stringe A 1 ja A 2, näeme, et stringi A 2 iga element on väiksem (või võrdne) stringi A 1 vastavast elemendist. On ilmne, et me ei tohiks kunagi kasutada A2 strateegiat, see on ilmselgelt kahjumlik. Kriipsutades maha A 3 ja A 2, viime maatriksi lihtsamale kujule. Lisaks märgime, et strateegia B3 on vaenlase jaoks ilmselgelt ebasoodne; selle kustutades viime maatriksi lõplikule kujule:

Seega on 4x4 mäng taandatud 2x3 mänguks, kõrvaldades dubleerivad ja ilmselgelt kahjumlikud strateegiad.

Dubleerivate ja ilmselt kahjumlike strateegiate kõrvaldamise protseduur peaks alati eelnema mängu lahendamisele. Lõplike mängude lihtsaimad juhtumid, mida saab alati lahendada elementaarsete meetoditega, on 2x2 ja 2xn mängud.

Mõelge maatriksiga 2 × 2 mängule:

Siin võib esineda kaks juhtumit: 1) mängul on sadulapunkt; 2) mängul pole sadulapunkti. Esimesel juhul on lahendus ilmne: see on strateegiapaar, mis ristuvad sadulapunktis. Muuseas märgime, et 2×2 mängus vastab sadulapunkti olemasolu alati teadlikult ebasoodsate strateegiate olemasolule, mis tuleb eelanalüüsis kõrvaldada.

Olgu seal sadulapunktita ja seetõttu ei võrdu mängu alumine hind ülemisega: α ≠ β. On vaja leida mängija A optimaalne segastrateegia:

Seda eristab omadus, et olenemata vastase tegevusest (kui ta ei ületa oma "kasulikke" strateegiaid), on väljamakse võrdne mängu väärtusega ν. 2x2 mängus on "kasulikud" mõlemad vastase strateegiad, vastasel juhul oleks mängul lahendus puhtas strateegiavaldkonnas (sadulapunkt). See tähendab, et kui jääme oma optimaalse strateegia juurde (4.1), siis saab vastane kasutada ükskõik millist oma puhast strateegiat B 1 , B 2 ilma keskmist väljamakset ν muutmata. Siit on meil kaks võrrandit:

millest, võttes arvesse, et p 1 + p 2 = 1, saame:

Leiame mängu väärtuse ν, asendades väärtused p 1 , p 2 mis tahes võrrandis (4.2).

Kui mängu hind on teada, siis vastase optimaalse strateegia määramiseks

piisab ühest võrrandist, näiteks:

millest, arvestades, et q 1 + q 2 = 1, saame:

Näide 1 Leiame § 1 näites 1 käsitletud 2×2 mängule lahenduse maatriksiga:

Mängul pole sadulapunkti (α = –1; β = +1) ja seetõttu peab lahendus olema segastrateegiate piirkonnas:

Peate leidma p 1 , p 2 , q 1 ja q 2 . P 1 jaoks on meil võrrand

1*p 1 + (–1) (1 – p 1) = (–1) p 1 + 1 (1 – p 1)

kust p 1 = 1/2, p 2 = 1/2.

Samamoodi leiame: q 1 = 1/2, q 2 = 1/2, ν = 0.

Seetõttu on iga mängija jaoks optimaalne strateegia juhuslikult vaheldumisi oma kahe puhta strateegia vahel, kasutades mõlemat võrdselt sageli; sel juhul on keskmine võimendus võrdne nulliga.

Saadud järeldus oli juba eelnevalt piisavalt selge. Järgmises näites käsitleme keerukamat mängu, mille lahendus pole nii ilmne. Näide on algeline näide mängudest, mida tuntakse "petmise" või "pettuse" mängudena. Praktikas kasutatakse konfliktiolukordades sageli erinevaid vaenlase eksitamise meetodeid (desinformatsioon, valesihtmärkide seadmine jne). Näide on oma lihtsusele vaatamata üsna õpetlik.

Näide 2 Mäng on järgmine. Kaarte on kaks: äss ja kahek. Mängija A tõmbab ühe neist juhuslikult; B ei näe, millise kaardi ta tõmbas. Kui A tõmbab ässa, teatab ta: "Mul on äss," ja nõuab vastaselt 1 rubla. Kui A tõmbas kahekohalise välja, siis võib ta kas A 1) öelda "Mul on äss" ja nõuda vastaselt 1 rubla või A 2) tunnistada, et tal on kahek ja maksta vastasele 1 rubla.

Vaenlane, kui talle vabatahtlikult makstakse 1 rubla, saab selle ainult vastu võtta. Kui nad nõuavad temalt 1 rubla, siis võib ta kas B 1) uskuda mängijat A, et tal on äss ja anda talle 1 rubla või B 2) nõuda tšekki, et veenduda väite A tõesuses. Kui selle tulemusel kontrollida, selgub, et A-l on tõesti äss, B peab A-le maksma 2 rubla. Kui selgub, et A petab ja tal on kahekesi, maksab mängija A mängijale B 2 rubla. On vaja mängu analüüsida ja leida iga mängija jaoks optimaalne strateegia.

Lahendus. Mäng on suhteliselt keerulise ülesehitusega; see koosneb ühest kohustuslikust juhuslikust käigust – mängija A valikust ühe kahest kaardist – ja kahest isiklikust käigust, mida aga ei pruugita sooritada. Tõepoolest, kui A on ässa tõmmanud, siis ta ei tee ühtegi isiklikku liigutust: talle antakse ainult üks võimalus - nõuda 1 rubla, mida ta ka teeb. Sel juhul kantakse isiklik käik - uskuda või mitte uskuda (s.t maksta või mitte maksta 1 rubla) - mängijale B. Kui A sai esimese juhusliku käigu tulemusena kahekümne, siis antakse talle isiklik käik. käik: maksa 1 rubla või proovi vastast petta ja nõua 1 rubla (lühidalt: “ära peta” või “petta”). Kui A valib esimese, peab B leppima vaid 1 rublaga; kui A valis viimase, siis antakse mängijale B isiklik käik: uskuda või mitte uskuda A (st maksta A-le 1 rubla või nõuda kontrollimist).

Iga mängija strateegiad on reeglid, mis ütlevad mängijale, mida teha, kui talle antakse isiklik käik. Ilmselgelt on A-l ainult kaks strateegiat: A 1 – petta, A 2 – mitte petta. B-l on ka kaks strateegiat: B 1 – usu, B 2 – ei usu. Ehitame mängu maatriksi. Selleks arvutame välja iga strateegiakombinatsiooni keskmise tasuvuse.

1. A 1 B 1 (A petab, B usub). Kui A sai ässa (selle tõenäosus on ½, siis talle isiklikku käiku ei anta; ta nõuab 1 rubla ja mängija B usub teda; A väljamakse rublades on 1. Kui A sai kahe (selle tõenäosus on ka ½), ta petab vastavalt oma strateegiale ja nõuab 1 rubla; usub temasse ja maksab; väljamakse A on samuti võrdne 1-ga. Keskmine väljamakse: a 11 = ½ * 1 + ½ * 1 = 1.

2. A 1 B 2 (A petab, B ei usu). Kui A-l on äss, pole tal isiklikku käiku; ta nõuab 1 rubla; Tema strateegia järgi ta B-d ei usu ja tšeki tulemusena maksab 2 rubla (A väljamakse on +2). Kui A sai kahekümne, nõuab ta vastavalt oma strateegiale 1 rubla; B tema sõnul ei usu; Selle tulemusena maksab A 2 rubla (A kasum on -2). Keskmine võit on: a 12 = ½*(+2) + ½*(–2) = 0.

3. A 2 B 1 (A ei peta, B usub). Kui A tõmbab ässa, nõuab ta 1 rubla; B vastavalt oma strateegiale maksab; A väljamakse on +1. Kui A tõmbab kahekohalise, maksab ta vastavalt oma strateegiale 1 rubla; B-l jääb üle vaid nõustuda (A väljamakse on -1). Keskmine võit on: ja 21 = ½*(+1) + ½*(–1) = 0.

4. A 2 B 2 (A ei peta, B ei usu). Kui A tõmbab ässa, nõuab ta 1 rubla; B tšekid ja tšeki tulemusena maksab 2 rubla (väljamakse +2). Kui A võttis kahekesi välja, maksab ta 1 rubla; Jääb üle vaid nõustuda (väljamakse on 1). Keskmine võit on: ja 22 = ½*(+2) + ½*(–1) = ½.

Ehitame mängu maatriksi:

Maatriksil pole sadulapunkti. Mängu alumine hind α = 0, mängu ülemine hind β = ½. Leiame mängule lahenduse segastrateegiate valdkonnas. Rakendades valemit (4.3), saame:

need. Mängija A peab kasutama oma esimest strateegiat (petma) ühe kolmandiku kordadest ja oma teist (ära peta) kaks kolmandikku ajast. Samal ajal võidab ta keskmiselt mängu hinna ν = 1/3.

Väärtus ν = 1/3 näitab, et sellistel tingimustel on mäng A jaoks kasumlik ja B jaoks ebasoodne. Kasutades oma optimaalset strateegiat, saab A alati kindlustada positiivse keskmise väljamakse. Pange tähele, et kui A kasutaks oma kõige ettevaatlikumat (maksimaalset) strateegiat (sel juhul on mõlemad strateegiad A 1 ja A 2 maksimaalsed), oleks tema keskmine väljamakse võrdne nulliga. Seega annab segastrateegia kasutamine A-le võimaluse realiseerida oma eelist B ees, mis nende mängureeglite alusel tekib.

Määratleme optimaalse strateegia B. Meil ​​on: q 1 *1 + q 2 *0 = 1/3, q 1 = 1/3, q 2 = 2/3. Kus

st. mängija B peab kolmandikul juhtudest A-d uskuma ja maksma talle 1 rubla ilma kontrollimata ning kahel kolmandikul juhtudest - kontrollima. Siis kaotab ta iga mängu kohta keskmiselt 1/3. Kui ta kasutaks oma minimax puhast strateegiat B 2 (ei usu), kaotaks ta keskmiselt 1/2 mängu kohta.

2×2 mängu lahendusele võib anda lihtsa geomeetrilise tõlgenduse. Olgu maatriksiga 2×2 mäng

Võtame x-telje lõigu pikkusega 1 (joonis 4.1). Lõigu vasakpoolne ots (punkt, mille abstsiss on x = 0) tähistab strateegiat A 1 ; lõigu parem ots (x = 1) - strateegia A 2 . Joonistame punktide A 1 ja A 2 kaudu kaks risti x-teljega: telg ma– mina ja telg II–II. teljel ma– mina lükkame väljamaksed strateegia A 1 alusel edasi; teljel II–II-võidud strateegiaga A 2 . Mõelge vastase strateegiale B 1 ; see annab kaks punkti telgedel ma– mina ja II–II ordinaatidega vastavalt a 11 ja a 21 . Tõmbame läbi nende punktide sirge B 1 B 1. Ilmselgelt, kui kasutame vastase strateegia B 1 jaoks segastrateegiat

siis meie keskmist võimendust, mis antud juhul võrdub a 11 p 1 + a 21 p 2 , esindab punkt M sirgel B 1 B 1 ; selle punkti abstsiss on p 2 . Sirget B 1 B 1 , mis kujutab strateegia B 1 väljamakset, nimetatakse tinglikult "strateegiaks B 1".

Ilmselgelt saab strateegiat B 2 üles ehitada täpselt samamoodi (joonis 4.2).

Peame leidma optimaalse strateegia S A *, st sellise, mille puhul minimaalne väljamakse (B mis tahes käitumise korral) muutuks maksimumiks. Selleks konstrueerime strateegiate B 1, B 2 väljamakse alampiiri, s.o. katkendjoon B 1 NB 2 märgitud joonisel fig. 4.2 paksu joonega. See alampiir väljendab mängija A minimaalset tasumist mis tahes tema segastrateegia puhul; punkt N, mille juures see minimaalne väljamakse saavutab maksimumi, määrab lahenduse ja mängu hinna. On hästi näha, et punkti N ordinaat on mängu hind ν ja selle abstsiss on p 2 - strateegia A 2 rakendamise sagedus optimaalses segastrateegias S A *.

Meie puhul määras mängu lahenduse strateegiate ristumispunkt. Kuid see ei ole alati nii; joonisel fig. Joonisel 4.3 on kujutatud juhtum, kui vaatamata strateegiate ristumiskoha olemasolule annab lahendus mõlema mängija jaoks puhtad strateegiad (A 2 ja B 2) ning mängu hind on ν = a 22 . Sel juhul on maatriksil sadulapunkt ja strateegia A 1 on ilmselgelt kahjumlik, sest mis tahes puhta vastase strateegia puhul annab see väiksema väljamakse kui A 2 .

Juhul, kui vaenlasel on tahtlikult ebasoodne strateegia, on geomeetriline tõlgendus joonisel fig. 4.4.

Sel juhul langeb väljamakse alumine piir kokku strateegiaga B 1, strateegia B 2 on vastase jaoks ilmselgelt kahjumlik.

Geomeetriline tõlgendus võimaldab visualiseerida ka mängu alumist ja ülemist hinda (joonis 4.5).

Illustreerimiseks konstrueerime näidetes 1 ja 2 käsitletud 2×2 mängude geomeetrilisi tõlgendusi (joonised 4.6 ja 4.7).

Oleme näinud, et iga 2×2 mängu saab lahendada elementaarsete trikkide abil. Täpselt samamoodi saab lahendada mis tahes 2xn mängu. kus meil on ainult kaks strateegiat ja vaenlasel on suvaline arv.

Olgu meil kaks strateegiat: A 1 , A 2 ja vaenlane - n strateegiat: B 1 , B 2 , ..., B n . Maatriks ‖a ij ‖ on antud; sellel on kaks rida ja n veergu. Nagu kahe strateegia puhul, anname probleemile geomeetrilise tõlgenduse; n vastase strateegiat on kujutatud n sirgjoonega (joonis 4.8). Ehitame väljamakse alumise piiri (polüjoon B 1 MNB 2) ja leiame sellelt maksimaalse ordinaadiga punkti N. See punkt annab mängule lahenduse (strateegia ) punkti N ordinaat võrdub mängu hinnaga ν ja abstsiss on võrdne strateegia A 2 sagedusega р 2.

Sel juhul saadakse vastase optimaalne strateegia, kasutades segu kahest "kasulikust" strateegiast: B 2 ja B 4 , mis ristuvad punktis N. Strateegia B 3 on ilmselgelt kahjumlik ja strateegia B 1 on kahjumlik optimaalse strateegia S A korral. *. Kui A jääb oma optimaalse strateegia juurde, siis väljamakse ei muutu, olenemata sellest, millist tema “kasulikku” strateegiat B kasutab, muutub see aga juhul, kui B lülitub üle strateegiatele B 1 või B 3 . Mänguteoorias on tõestatud, et igal lõplikul mängul mxn on lahendus, milles kummagi poole "kasulike" strateegiate arv ei ületa kahest arvust m ja n väikseimat. Eelkõige tuleneb sellest, et mängul 2xm on alati lahendus, milles kummalgi poolel ei osale rohkem kui kaks "kasulikku" strateegiat.

Geomeetrilist tõlgendust kasutades saab anda lihtsa viisi mis tahes 2xm mängu lahendamiseks. Otse jooniselt leiame paari “kasulikku” vaenlase strateegiat B j ja B k, mis ristuvad punktis N (kui punktis N ristub rohkem kui kaks strateegiat, siis võtame neist suvalised kaks). Teame, et kui mängija A järgib oma optimaalset strateegiat, siis väljamakse ei sõltu sellest, millises proportsioonis B oma "kasulikke" strateegiaid kasutab.

Nendest võrranditest ja tingimusest p 2 = 1 - p 1 leiame p1, p2 ja mängu väärtuse ν. Teades mängu hinda, saate kohe määrata optimaalse strateegia mängija B. Selleks lahendatakse näiteks võrrand: q j a 1 j + q k a 1 k = ν, kus q j + q k = 1. Juhul, kui meil on m strateegiat ja vaenlasel on ainult kaks, siis ilmselgelt, probleem lahendatakse täiesti sarnasel viisil; piisab, kui märkida, et väljamakse märki pöörates on võimalik muuta mängija A "võitjast" "kaotajaks". Mängu on võimalik lahendada väljamaksemärki muutmata; siis lahendatakse probleem otse B jaoks, kuid konstrueeritakse mitte alumine, vaid ülemine väljamakse piir (joonis 4.9). Piiril otsitakse minimaalse ordinaadiga punkt N, milleks on mängu hind ν.

Mõelge ja lahendage mitu näidet 2×2 ja 2xm mängude kohta, mis on praktilise tähtsusega mängude lihtsustatud näited.

Näide 3 Pool A saadab kaks pommitajat vaenlase piirkonda B ma ja II; ma lendab ees II- taga. Üks pommitajatest – pole ette teada, kumb – peaks pommi kandma, teine ​​täidab eskordi funktsiooni. Vaenlase piirkonnas ründab pommitajaid hävitaja küljelt B. Pommitajad on relvastatud erineva tulekiirusega kahuritega. Kui hävitaja ründab tagapommitajat II, siis lasevad selle pihta ainult selle pommitaja kahurid; kui ta ründab esipommitajat, siis tulistavad mõlema pommitaja kahurid tema pihta. Võitleja tabamise tõenäosus on esimesel juhul 0,3, teisel 0,7.

Kui hävitajat pommitaja kaitsetulega alla ei lase, tabab ta valitud sihtmärki tõenäosusega 0,6. Pommitajate ülesanne on pomm sihtmärgini viia; võitleja ülesanne on seda ära hoida, s.t. tulistada alla kandepommitaja. On vaja valida osapoolte optimaalsed strateegiad:

a) külje A jaoks: millist pommitajat tuleks kandjana kasutada?

b) B-poole jaoks: millist pommitajat rünnata?

Lahendus. Meil on lihtne 2 × 2 mängu juhtum; võit - vedaja mittelöömise tõenäosus. Meie strateegiad: A 1 – kandja – pommitaja ma; 2 - kandur - pommitaja II. Vaenlase strateegiad: B 1 – pommitajat rünnatakse ma; Aastal 2 - pommitaja ründab II. Koostame mängumaatriksi, s.o. leidke iga strateegiakombinatsiooni keskmine tasuvus.

1. A 1 B 1 (kandja ma, rünnati ma). Kandur ei saa pihta, kui pommitajad hävitaja alla tulistavad, või kui nad seda ei tee, kuid see ei taba sihtmärki: a 11 = 0,7 + 0,3 * 0,4 = 0,82.

2. A 2 B 1 (kandja II, rünnati ma). a 21 = 1

3. A 1 B 2 (kandja ma, rünnati II). A 12 = 1

4. A 2 B 2 (kandja II, rünnati II). A 22 = 0,3 + 0,7 * 0,4 \u003d 0,58

Mängu maatriks on järgmisel kujul:

Mängu madalam hind on 0,82; ülemine hind 1. Maatriksil pole sadulapunkti; otsime lahendust segastrateegiate valdkonnas. Meil on:

p 1 * 0,82 + p 2 * 1 = ν

p1 *1 + p2 *0,58 = v

p 1 = 0,7; p 2 \u003d 0,3

Meie optimaalne strateegia jah, st peate kandjaks sagedamini valima ma, kuidas II. Mängu väärtus on ν = 0,874. Teades ν, määrame q 1 ja q 2 - strateegiate B 1 ja B 2 sagedused vastase optimaalses strateegias S B *. Meil on: q 1 * 0,82 + q 2 * 1 \u003d 0,874 ja q 2 \u003d 1 - q 1, kust q 1 = 0,7; q 2 \u003d 0,3, st vaenlase optimaalne strateegia on .

Näide 4 Külg A ründab objekti, pool B kaitseb seda. Küljel A on kaks tasapinda; B-küljel on kolm õhutõrjekahurit. Iga lennuk on võimsa relva kandja; objekti tabamiseks piisab, kui vähemalt üks lennuk sellele läbi tungib. Külg A õhusõiduk võib valida objektile lähenemise kolmes suunas: ma, II, III(Joon. 4.10). Vaenlane (pool B) võib paigutada mis tahes oma relva mis tahes suunas; samal ajal tulistab iga relv läbi ainult antud suunaga seotud ruumiala, mitte aga läbi naabersuundade. Iga püstol võib tulistada ainult ühte lennukit; tulistatud lennukit tabatakse tõenäosusega 1. A-pool ei tea, kuhu relvad on paigutatud; pool B ei tea, kust lennukid tulevad. Külje A ülesanne on tabada objekti; poole B ülesanne on tema lüüasaamist ära hoida. Leia mängule lahendus.

Lahendus. Mäng on 2×3 mäng. Kasum – objekti tabamise tõenäosus. Meie võimalikud strateegiad on järgmised: A 1 – saatke kumbki üks lennuk kahte erinevasse suunda. A 2 - saatke mõlemad lennukid samas suunas. Vaenlase strateegiad: B 1 - asetage üks relv kummaski suunas; B 2 - asetage kaks relva ühes suunas ja üks teises; In 3 - asetage kõik kolm relva ühes suunas. Teeme mängu maatriksi.

1. A 1 B 1 (lennukid lendavad eri suundades; relvad asetatakse ükshaaval). Ilmselgelt ei tungi sel juhul objektile läbi ükski lennuk: a 11 = 0.

2. A 2 B 1 (lennukid lendavad koos ühes suunas; relvad on paigutatud ükshaaval). Ilmselgelt liigub sel juhul üks lennuk objektile tulistamata: ja 21 = 1.

3. A 1 B 2 (lennuk lendab ükshaaval; vaenlane kaitseb kahte suunda ja jätab kolmanda kaitseta). Tõenäosus, et vähemalt üks õhusõiduk läbib objekti, on võrdne tõenäosusega, et üks neist valib kaitsmata suuna: ja 12 = 2/3.

4. A 2 B 2 (lennukid lendavad koos ühes suunas; vaenlane kaitseb ühte suunda kahe püssiga ja ühte ühega, st tegelikult kaitseb ühte suunda ja jätab kaks kaitseta). Tõenäosus, et vähemalt üks lennuk läbib objekti, on võrdne tõenäosusega, et paar lennukit valib tegelikult kaitsmata suuna: a 22 = 2/3.

5. A 1 B 3 (lennukid lendavad ükshaaval; vaenlane kaitseb kolme relvaga ainult ühte suunda): a 13 = 1.

6. A 2 B 3 (mõlemad lennukid lendavad koos; vaenlane kaitseb kolme relvaga ainult ühte suunda). Objekti tabamiseks peab lennuk valima kaitsmata suuna: a 23 = 2/3.

Mängu maatriks:

Maatriksist on näha, et strateegia B 3 on ilmselgelt kahjumlik võrreldes B 2-ga (seda oleks võinud eelnevalt otsustada). Strateegia B 3 maha kriipsutades väheneb mäng 2x2 mänguks:

Maatriksil on sadulapunkt: mängu alumine hind 2/3 langeb kokku ülemisega. Samas märgime, et meie (A) jaoks on strateegia A 1 ilmselgelt kahjumlik. Järeldus: mõlemad osapooled A ja B peavad alati kasutama oma puhast strateegiat A 2 ja B 2, s.t. peame saatma lennukeid 2 võrra, valides juhuslikult paari saatmise suuna; vaenlane peab oma relvad paigutama järgmiselt: kaks - ühes suunas, üks - teises ja ka nende suundade valik tuleb teha juhuslikult (siin, nagu näeme, sisaldavad "puhtad strateegiad" juba juhuse elementi ). Neid optimaalseid strateegiaid rakendades saame alati konstantse keskmise väljamakse 2/3 (st objekt saab löögi tõenäosusega 2/3). Pange tähele, et mängu leitud lahendus ei ole unikaalne; lisaks puhaste strateegiate lahendusele on olemas terve hulk mängija A segastrateegiaid, mis on optimaalsed, alates p 1 \u003d 0 kuni p 1 \u003d 1/3 (joonis 4.11).

Lihtne on näiteks otse kontrollida, et samasugune keskmine kasum 2/3 saavutatakse, kui rakendame oma strateegiaid A 1 ja A 2 vahekorras 1/3 ja 2/3.

Näide 5 Samad tingimused, mis eelmises näites, kuid meie jaoks on võimalikud neli ründesuunda ja vaenlasel on neli relva.

Lahendus. Meil on endiselt kaks võimalikku strateegiat: A 1 - saada lennukid ükshaaval, A 2 - saada kaks lennukit koos. Vaenlasel on viis võimalikku strateegiat: B 1 - asetage üks relv kummaski suunas; B 2 - asetage kaks relva kahes erinevas suunas; Aastal 3 - asetage kaks relva ühes suunas ja üks korraga - teises kahes; In 4 - asetage kolm relva ühes suunas ja üks teises suunas; In 5 - asetage kõik neli relva ühes suunas. Strateegiad B 4 , B 5 jäetakse eelnevalt kõrvale, kuna need on ilmselgelt kahjumlikud. Sarnaselt eelmise näitega argumenteerides koostame mängumaatriksi:

Mängu alumine hind on 1/2, ülemine 3/4. Maatriksil pole sadulapunkti; lahendus peitub segastrateegiate valdkonnas. Kasutades geomeetrilist tõlgendust (joonis 4.12), toome välja vaenlase "kasulikud" strateegiad: B 1 ja B 2.

Sagedused p 1 ja p 2 määratakse võrranditest: p 1 * 0 + (1 - p 1) * 1 = ν ja p 1 * 5/6 + (1 - p 1) * 1/2 = ν; kust p 1 = 3/8; p2 = 5/8; ν = 5/8, s.o. meie optimaalne strateegia on . Seda kasutades garanteerime endale keskmise võidu 5/8. Teades mängu hinda ν = 5/8, leiame vastase "kasulike" strateegiate sagedused q 1 ja q 2: q 1 * 0 + (1 - q 1) * 5/6 = 5/8 , q 1 = ¼, q 2 = ¾. Optimaalne vaenlase strateegia oleks: .

Näide 6 Poolel A on kaks strateegiat A 1 ja A 2, poolel B on neli strateegiat B 1 , B 2 , B 3 ja B 4 . Mängu maatriks on järgmisel kujul:

Leia mängule lahendus.

Lahendus. Mängu madalam hind 3; üles 4. Geomeetriline tõlgendus (joonis 4.13) näitab, et mängija B kasulikud strateegiad on B 1 ja B 2 või B 2 ja B 4:

Mängijal A on lõpmatult palju optimaalseid segastrateegiaid: optimaalses strateegias võib p 1 varieeruda vahemikus 1/5 kuni 4/5. Mängu väärtus on ν = 4. Mängijal B on puhas optimaalne strateegia B 2 .

§ 5. Lõplike mängude lahendamise üldmeetodid

Siiani oleme käsitlenud vaid kõige elementaarsemaid 2xn-tüüpi mänge, mis on lahendatavad väga lihtsalt ja lubavad mugavat ja illustreerivat geomeetrilist tõlgendust. Üldjuhul on mängu mxn lahendamine üsna keeruline ülesanne ning ülesande keerukus ja lahendamiseks vajalike arvutuste hulk suureneb m ja n suurenedes järsult. Need raskused ei ole aga põhimõttelised ja on seotud vaid väga suure arvutustemahuga, mis võib paljudel juhtudel osutuda praktiliselt teostamatuks. Lahenduse leidmise meetodi fundamentaalne aspekt jääb iga m puhul samaks.

Illustreerime seda mängu 3xn näitel. Anname sellele geomeetrilise tõlgenduse – juba ruumilise. Kolm meie strateegiat A 1 , A 2 ja A 3 on esindatud kolme punktiga tasapinnal tere; esimene asub lähtepunktis (joonis 5.1), teine ​​ja kolmas asuvad telgedel Oh ja OU lähtepunktist 1 kaugusel.

Teljed tõmmatakse läbi punktide A 1, A 2 ja A 3 mama, IIII ja IIIIII, tasapinnaga risti tere. teljel mama väljamakseid lükatakse edasi strateegia A 1 telgedel IIII ja IIIIII- strateegiate A 2, A 3 väljamaksed. Iga vaenlase strateegiat B j tähistab tasapind, mis lõikab telgedelt maha mama, IIII ja IIIIII segmendid, mis on võrdsed vastavate strateegiate A 1 , A 2 ja A 3 ning strateegia B j väljamaksetega. Olles nii konstrueerinud kõik vaenlase strateegiad, saame kolmnurga A 1, A 2 ja A 3 kohal olevate tasandite perekonna (joonis 5.2). Selle perekonna jaoks on võimalik konstrueerida ka madalam väljamakse piir, nagu tegime 2xn puhul, ja leida sellel piiril punkt N maksimaalse kõrgusega tasapinnast tere. See kõrgus on mängu hind ν.

Optimaalse strateegia S A * strateegiate A 1, A 2 ja A 3 sagedused p 1 , p 2 , p 3 määratakse punkti N koordinaatide (x, y) järgi, nimelt: p 2 = x, p 3 = y, p 1 = 1 - p 2 - p 3. Sellist geomeetrilist konstruktsiooni, isegi 3xn korpuse puhul, pole aga lihtne teostada ning see nõuab palju aega ja kujutlusvõimet. Mängu puhul kandub see aga üldiselt m-mõõtmelisse ruumi ja kaotab igasuguse nähtavuse, kuigi geomeetrilise terminoloogia kasutamine võib mõnel juhul olla kasulik. Praktikas mxn mängude lahendamisel on mugavam kasutada mitte geomeetrilisi analoogiaid, vaid arvutuslikke analüütilisi meetodeid, seda enam, et need meetodid on ainsad, mis sobivad ülesande lahendamiseks arvutites.

Kõik need meetodid on sisuliselt taandatud probleemi lahendamisele järjestikuste katsetuste abil, kuid katsete järjestuse järjestamine võimaldab koostada algoritmi, mis viib lahenduseni kõige ökonoomsemal viisil. Siin peatume põgusalt ühel mxn mängude lahendamise arvutusmeetodil – nn "lineaarse programmeerimise" meetodil. Selleks anname esmalt mängu mxn lahenduse leidmise probleemi üldise ülevaate. Olgu mäng mxn antud m mängija А strateegiaga A 1 , А 2 , …, А m ja mängija А n strateegiaga B 1 , B 2 , …, B n ning väljamakse maatriks ‖a i j ‖. Nõutakse mängule lahenduse leidmist, st. kaks optimaalset mängijate A ja B segastrateegiat

kus p 1 + p 2 + ... + p m = 1; q 1 + q 2 + ... + q n = 1 (mõned arvud p i ja q j võivad olla võrdsed nulliga).

Meie optimaalne strateegia S A * peaks andma meile tulu, mis ei ole väiksem kui ν vastase mis tahes käitumise eest ja väljamakse, mis on võrdne ν tema optimaalse käitumise eest (strateegia S B *). Samamoodi peaks strateegia S B * andma vaenlasele kahju, mis ei ületa ν meie käitumise korral ja võrdne ν meie optimaalse käitumise korral (strateegia S A *).

Mängu väärtuse ν väärtus sel juhul on meile teadmata; eeldame, et see on võrdne mõne positiivse arvuga. Seda eeldades ei riku me arutluskäigu üldistust; selleks, et ν > 0, piisab ilmselt sellest, et maatriksi ‖a i j ‖ kõik elemendid on mittenegatiivsed. Seda saab alati saavutada, kui lisada elementidele ‖a i j ‖ piisavalt suur positiivne väärtus L; samas kui mängu hind tõuseb L, kuid lahendus ei muutu.

Valime oma optimaalse strateegia S A *. Siis on meie keskmine väljamakse vastase strateegia Bj puhul võrdne: a j = p 1 a 1j + p 2 a 2j + … + p m a mj . Meie optimaalsel strateegial S A * on omadus, et see annab vastase igasuguse käitumise korral väljamakse, mis ei ole väiksem kui ν; seetõttu ei saa ükski arv a j olla väiksem kui ν. Meil on mitmeid tingimusi:

Jagame võrratused (5.1) positiivse väärtusega ν ja tähistame

Siis saab tingimused (5.1) kirjutada kujul

kus ξ 1 , ξ 2 , …, ξ m on mittenegatiivsed arvud. Kuna p 1 + p 2 + ... + p m = 1, siis suurused ξ 1, ξ 2, ..., ξ m rahuldavad tingimust

(5.3) ξ 1 + ξ 2 + … + ξ m = 1/ν.

Tahame oma garanteeritud võidu võimalikult kõrgeks muuta; Ilmselgelt omandab sel juhul võrdsuse (5.3) parem pool minimaalse väärtuse. Seega taandatakse mängule lahenduse leidmise ülesanne järgmiseks matemaatiliseks ülesandeks: määrata mittenegatiivsed suurused ξ 1 , ξ 2 , …, ξ m, mis vastavad tingimustele (5.2), nii et nende summa Φ = ξ 1 + ξ 2 + … + ξ m oli minimaalne.

Tavaliselt äärmuslike väärtuste (maksimum ja miinimum) leidmisega seotud probleemide lahendamisel funktsioon diferentseeritakse ja tuletised võrdsustatakse nulliga. Kuid selline tehnika on antud juhul kasutu, kuna funktsioon Φ, mis tuleb taandada miinimumini, on lineaarne ja selle tuletised kõigi argumentide suhtes on võrdsed ühega, s.o. ei kao kunagi. Järelikult saavutatakse funktsiooni maksimum kuskil argumentide muutumise piirkonna piiril, mille määrab argumentide ja tingimuste mittenegatiivsuse nõue (5.2). Ekstreemsete väärtuste leidmise meetod diferentseerimise abil ei sobi ka juhtudel, kui mängu lahendamiseks määratakse alumise (või ülemise) väljamakse piiri maksimum, nagu tegime näiteks 2xn mängude lahendamisel. Tõepoolest, alumine piir koosneb sirgjoonte lõikudest ja maksimum ei saavutata punktis, kus tuletis on võrdne nulliga (sellist punkti pole üldse olemas), vaid intervalli piiril või sirgete lõikude lõikepunkt.

Selliste, praktikas üsna levinud ülesannete lahendamiseks on matemaatikas välja töötatud spetsiaalne lineaarne programmeerimisaparaat. Lineaarse programmeerimise probleem püstitatakse järgmiselt. Antud lineaarvõrrandisüsteem:

On vaja leida suuruste ξ 1 , ξ 2 , …, ξ m mittenegatiivsed väärtused, mis vastavad tingimuste (5.4) nõuetele ja samal ajal minimeerides suuruste ξ 1, ξ 2 antud homogeense lineaarfunktsiooni, …, ξ m (lineaarne vorm): Φ = c 1 ξ 1 + c 2 ξ 2 + … + c m ξ m

On lihtne mõista, et ülaltoodud mänguteooria probleem on lineaarse programmeerimisülesande erijuhtum c 1 = c 2 = ... = c m = 1. Esmapilgul võib tunduda, et tingimused (5.2) on ei ole samaväärsed tingimustega (5.4), kuna võrdusmärkide asemel sisaldavad need ebavõrdsusmärke. Ebavõrdsusmärkidest on aga lihtne vabaneda, võttes kasutusele uued fiktiivsed mittenegatiivsed muutujad z 1 , z 2 , …, z n ja kirjutades tingimused (5.2) kujul:

Minimeeritav vorm Φ on Φ = ξ 1 + ξ 2 + … + ξ m . Lineaarne programmeerimisseade võimaldab suhteliselt väikese arvu järjestikuste näidiste abil valida nõuetele vastavad väärtused ξ 1 , ξ 2 , …, ξ m. Suurema selguse huvides demonstreerime siin selle seadme kasutamist otse konkreetsete mängude lahendamise materjalil.

Näide 1 Paragrahvi 1 näites 2 toodud 3 × 3 mängule tuleb leida lahendus maatriksiga:

Et kõik ij ei oleks negatiivsed, lisame maatriksi kõikidele elementidele L = 5. Saame maatriksi:

Sel juhul tõuseb mängu hind 5 võrra, kuid otsus ei muutu.

Määratleme optimaalse strateegia S A *. Tingimused (5.2) on järgmisel kujul:

kus ξ 1 = p 1 / ν, ξ 2 = p 2 / ν, ξ 3 = p 3 / ν. Ebavõrdsusmärkidest vabanemiseks võtame kasutusele näivmuutujad z 1 , z 2 , z 3 ; tingimused (5.6) võib kirjutada järgmiselt:

Lineaarvorm Φ on: Φ = ξ 1 + ξ 2 + ξ 3 ja see tuleks teha võimalikult väikeseks. Kui kõik kolm strateegiat B on "kasulikud", kaovad kõik kolm näivat muutujat z 1 , z 2 , z 3 (st iga strateegia B j puhul saavutatakse mängu hinnaga ν võrdne väljamakse). Kuid meil pole endiselt põhjust väita, et kõik kolm strateegiat on "kasulikud". Selle kontrollimiseks proovime väljendada Φ kuju näivate muutujate z 1 , z 2 , z 3 kaudu ja vaatame, kas saavutame nende nulliga võrdsustades kuju miinimumi. Selleks lahendame võrrandid (5.7) muutujate ξ 1, ξ 2, ξ 3 suhtes (st väljendame ξ 1, ξ 2, ξ 3 näivmuutujate z 1, z 2, z 3 kaudu ):

Liites ξ 1, ξ 2, ξ 3, saame: Φ = 1/5 + z 1 /20 + z 2 /10 + z 3 /20. Siin on kõigi z-de koefitsiendid positiivsed; järelikult võib iga z 1 , z 2 , z 3 suurenemine üle nulli viia ainult vormi Φ suurenemiseni ja me tahame, et see oleks minimaalne. Seetõttu on z 1 , z 2 , z 3 väärtused, mis muudavad vormi Φ miinimumiks, z 1 = z 2 = z 3 = 0. Seetõttu on vormi Φ minimaalne väärtus: 1/ν = 1 /5, kust mängu hind ν = 5. Asendades valemitesse (5.8) nullväärtused z 1 , z 2 , z 3, leiame: ξ 1 = 1/20, ξ 2 = 1/10, ξ 3 = 1/20 või korrutades need ν-ga, p 1 \u003d 1/4, p 2 = 1/2, p 3 \u003d 1/4. Seega leitakse optimaalne strateegia A: , st. me peame kirjutama arvu 1 ühel veerandil juhtudest, 2 pooltel juhtudel ja 3 ülejäänud neljandikul juhtudest.

Teades mängu hinda ν = 5, saame teadaolevaid meetodeid kasutades leida vastase optimaalse strateegia . Selleks kasutame oma kahte "kasulikku" strateegiat (näiteks A 2 ja A 3) ja kirjutame üles võrrandid:

9q 1 + 11 (1-q 2 -q 1) = 5,

kust q 1 = q3 = 1/4; q 2 \u003d 1/2. Vastase optimaalne strateegia on sama, mis meil: . Nüüd tagasi algse (mitte teisendatud) mängu juurde. Selleks tuleb maatriksi elementidele liidetud mängu väärtusest ν = 5 lahutada vaid väärtus L = 5. Saame algse mängu hinna v 0 = 0. Seetõttu annavad mõlema poole optimaalsed strateegiad keskmise väljamakse, mis on võrdne nulliga; mäng on mõlemale poolele võrdselt kasulik või ebasoodne.

Näide 2 Spordiklubil A on võistkonna A 1 , A 2 ja A 3 komplekteerimiseks kolm varianti . Klubi B - ka kolm varianti B 1 , B 2 ja B 3 . Võistlusel osalemiseks avaldust esitades ei tea ükski klubi, millise koosseisu vastane valib. Varasemate kohtumiste kogemusest ligilähedaselt teada erinevate meeskondade komplekteerimisvõimalustega klubi A võitmise tõenäosused annab maatriks:

Leidke sagedus, millega klubid peaksid omavahelises kohtumises iga meeskonna välja panema, et saavutada suurim keskmine võitude arv.

Lahendus. Mängu madalam hind on 0,4; ülemine 0,6; otsime lahendust segastrateegiate valdkonnas. Et mitte tegeleda murdudega, korrutame kõik maatriksi elemendid 10-ga; sel juhul tõuseb mängu hind 10 korda ja otsus ei muutu. Saame maatriksi:

Tingimused (5.5) on järgmisel kujul:

ja miinimumtingimus Φ = ξ 1 + ξ 2 + ξ 3 = min.

Kontrollime, kas kõik kolm vastase strateegiat on "kasulikud". Hüpoteesina eeldame esmalt, et näivmuutujad z 1 , z 2 , z 3 on võrdsed nulliga ja kontrollimiseks lahendame võrrandid (5.10) ξ 1 , ξ 2 , ξ 3 jaoks:

(5.12) 136Φ = 30 +13z 1 +18z 2 – 51z 3

Valem (5.12) näitab, et muutujate z 1 ja z 2 suurendamine nende oletatud väärtusest nullist võib ainult suurendada Φ, samas kui z 3 suurendamine võib vähendada Φ. Kuid z 3 suurendamist tuleb teha ettevaatlikult, et väärtused ξ 1, ξ 2, ξ 3, olenevalt z 3-st, ei muutuks sel juhul negatiivseks. Seetõttu määrame väärtused z 1 ja z 2 võrdsete võrrandite (5.11) paremal küljel nulliga ja suurendame väärtust z 3 vastuvõetavate piirideni (kuni mis tahes väärtusest ξ 1 , ξ 2, ξ 3 kaob). Teisest võrrandist (5.11) on näha, et z 3 suurenemine on ξ 2 väärtuse puhul “ohutu” – sellest alates see ainult suureneb. Mis puudutab väärtusi ξ 1 ja ξ 3, siis siin on z 3 suurenemine võimalik ainult teatud piirini. ξ 1 väärtus kaob, kui z 3 = 10/23; suurus ξ 3 kaob varem, juba z 3 = 1/4 juures. Seetõttu, andes z 3-le selle maksimaalse lubatud väärtuse z 3 = 1/4, muudame ka väärtuse ξ 3 nulliks.

Kontrollimaks, kas vorm Φ muutub miinimumiks, kui z 1 = 0, z 2 = 0, ξ 3 = 0, väljendame ülejäänud (nullist mittekuuluvad) muutujad z 1 , z 2 , ξ 3 kujul, mis on väidetavalt võrdne nulliga . Lahendades võrrandid (5.10) ξ 1 , ξ 2 ja z 3 suhtes, saame:

(5.13) 32Φ = 7 + Зz 1 + 4z 2 + ξ 3

Valemist (5.13) on näha, et mis tahes z 1 , z 2 , ξ 3 suurenemine üle nende oletatavate nullväärtuste võib ainult suurendada Φ kuju. Seetõttu leitakse mängu lahendus; see määratakse väärtustega z 1 = z 2 = ξ 3 = 0, millest ξ 1 = 1/32, ξ 2 = 3/16, z 3 = 1/4. Asendades valemiga (5.13), leiame mängu väärtuse ν: 32Φ = 7 = 32/ν; v = 32/7. Meie optimaalne strateegia: . "Kasulikke" strateegiaid (kompositsioonid A 1 ja A 2) tuleks rakendada sagedustega 1/7 ja 6/7; koostis A 3 – ei tohi kunagi kasutada.

Vastase optimaalse strateegia leidmiseks saab üldjuhul teha järgmist: pöörata tagasimaksemärk, lisada maatriksi elementidele konstantne väärtus L, et muuta need mittenegatiivseteks, ja lahendada probleem vastase jaoks samal viisil. nagu me selle enda jaoks lahendasime. Kuid asjaolu, et me juba teame mängu väärtust ν, lihtsustab ülesannet mõnevõrra. Lisaks lihtsustab antud juhul ülesannet täiendavalt asjaolu, et lahenduses osalevad ainult kaks "kasulikku" vaenlase strateegiat B 1 ja B 2, kuna z 3 väärtus ei ole võrdne nulliga ja seetõttu strateegiaga B 3 mängu hinda ei saavutata . Valides mängija A mis tahes “kasuliku” strateegia, näiteks A 1, saab leida sagedused q 1 ja q 2 . Selleks kirjutame üles võrrandi 8q 1 + 2(1 - q 1) = 32/7, kust q 1 = 3/7, q 2 = 4/7; Vastase optimaalne strateegia oleks: , st. vaenlane ei tohiks kasutada kompositsiooni B 3 ning kompositsioone B 1 ja B 2 tuleks kasutada sagedustega 3/7 ja 4/7.

Tulles tagasi algse maatriksi juurde, määrame mängu tõelise väärtuse ν 0 = 32/7:10 = 0,457. See tähendab, et suure kohtumiste arvu korral on klubi A võitude arv 0,457 kõigist kohtumistest.

§ 6. Ligikaudsed meetodid mängude lahendamiseks

Tihti pole praktilistes ülesannetes vaja leida mängu täpset lahendust; piisab, kui leida ligikaudne lahendus, mis annab mängu hinna lähedase keskmise väljamakse. Ligikaudne teadmine mängu hinnast ν võib juba anda lihtsa maatriksi analüüsi ning mängu alumise (α) ja ülemise (β) hinna määratluse. Kui α ja β on lähedased, ei ole praktiliselt vaja täpset lahendust otsida ja piisab, kui valida puhtad minimax strateegiad. Juhtudel, kus α ja β ei ole lähedased, saab praktilise lahenduse mängude lahendamiseks numbriliste meetodite abil, millest toome põgusalt esile iteratsioonimeetodi.

Iteratsioonimeetodi idee on järgmine. Mängitakse "mõtteeksperimenti", kus vastased A ja B kasutavad oma strateegiaid üksteise vastu. Katse koosneb elementaarsete mängude jadast, millest igaühel on etteantud mängumaatriks. See algab sellest, et me (mängija A) valime juhuslikult ühe oma strateegiatest, näiteks A i . Vaenlane vastab sellele oma strateegiaga B j , mis on meile kõige vähem kasulik, s.t. vähendab strateegia A i tasuvust miinimumini. Sellele käigule vastame oma strateegiaga А k , mis annab maksimaalse keskmise väljamakse, kui vastane kasutab strateegiat B j . Järgmine - jälle vaenlase kord. Ta vastab meie käigupaarile A i ja A k oma strateegiaga B j , mis annab meile nende kahe strateegia (A i , A k) ja nii edasi väikseima keskmise tulu. Iteratiivse protsessi igal etapil reageerib iga mängija teise mängija mis tahes käigule oma strateegiaga, mis on optimaalne kõigi tema varasemate käikude suhtes, mida peetakse segastrateegiaks, milles puhtad strateegiad on esindatud proportsioonides, mis vastavad nende kasutamise sagedus.

See meetod on justkui mängijate tegeliku praktilise "treeningu" mudel, kui igaüks neist uurib oma kogemuse põhjal vastase käitumist ja püüab sellele vastata viisil, mis on talle kasulik. Kui sellist õppeprotsessi jäljendamist piisavalt kaua jätkata, siis keskmine kasum ühe käigupaari kohta (elementaarmäng) kaldub mängu hinna juurde ning sagedused p 1 ... p m ; q 1 … q n , millele mängijate strateegiad selles loosimises vastavad, lähenevad sagedustele, mis määravad optimaalsed strateegiad. Arvutused näitavad, et meetodi konvergents on väga aeglane, kuid see ei ole kiirete arvutite jaoks takistuseks.

Illustreerime iteratiivse meetodi rakendamist eelmise lõigu näites 2 lahendatud 3×3 mängu näitel. Mängu annab maatriks:

Tabelis 6.1 on näidatud iteratiivse protsessi esimesed 18 sammu. Esimene veerg annab algmängu numbri (käigupaar) n; teises - number i mängija A valitud strateegia; järgmises kolmes - "kumulatiivne kasum" esimese jaoks n mängud vastase strateegiatega B 1 , B 2 , B 3 . Väikseim neist väärtustest on alla joonitud. Järgmiseks tuleb number j vastase valitud strateegia ja vastavalt sellele kogunenud väljamakse n nende väärtuste strateegiatega A 1 , A 2 , A 3 mängudes on maksimum ülevalt alla joonitud. Allajoonitud väärtused määravad teise mängija reageerimisstrateegia valiku. Järgmised veerud näitavad järjest: minimaalne keskmine väljamakse ν võrdne minimaalse akumuleeritud väljamaksega jagatud mängude arvuga n; maksimaalne keskmine võit, mis on võrdne maksimaalse kogutud võidu jagamisega n, ja nende aritmeetiline keskmine ν* = (ν + )/2. Suurendusega n kõik kolm väärtust ν ja ν* lähenevad mängu väärtusele ν, kuid väärtus ν* läheneb sellele loomulikult suhteliselt kiiremini.

Tabel 6.1.

Nagu näitest näha, on iteratsioonide konvergents väga aeglane, kuid juba nii väike arvutus võimaldab leida ligikaudse mänguhinna väärtuse ja paljastada “kasulike” strateegiate levimuse. Arvutusmasinate kasutamisel suureneb meetodi väärtus oluliselt. Mängude iteratiivse lahendamise meetodi eeliseks on see, et strateegiate arvu kasvades suureneb arvutuste maht ja keerukus suhteliselt nõrgalt. m ja n.

§ 7. Mõne lõpmatu mängu lahendamise meetodid

Lõpmatu mäng on mäng, milles vähemalt ühel osapoolel on lõpmatu hulk strateegiaid. Üldised meetodid selliste mängude lahendamiseks pole veel välja töötatud. Kuid praktika jaoks võivad huvi pakkuda mõned konkreetsed juhtumid, mis võimaldavad suhteliselt lihtsat lahendust. Vaatleme kahe vastase A ja B mängu, kummalgi on lõpmatu (loendamatu) strateegiakomplekt; need mängija A strateegiad vastavad pidevalt muutuva parameetri erinevatele väärtustele X, ja B puhul - parameeter juures. Sel juhul määrab mängu maatriksi ‖a ij ‖ asemel mingi kahe pidevalt muutuva argumendi funktsioon. a (x, y), mida me nimetame väljamaksefunktsiooniks (pange tähele, et funktsioon ise a (x, y) ei pea olema pidev). win funktsioon a(x, y) saab geomeetriliselt kujutada mõne pinnaga a (x, y) argumendi muutmise ala kohal (x, y)(Joonis 7.1)

Väljamakse funktsiooni analüüs a(x, y) tehakse sarnaselt väljamakse maatriksi analüüsiga. Esiteks leitakse mängu madalam hind α; sest see määratakse igaühe jaoks X funktsiooni miinimum a(x, y) kõigi jaoks juures: , siis otsitakse kõigi nende väärtuste maksimumi X(maksimaalne):

Mängu ülemine hind (minimax) on määratletud sarnaselt:

Vaatleme juhtumit, kui α = β. Kuna mängu hind ν jääb alati α ja β vahele, on nende koguväärtus ν. Võrdsus α = β tähendab, et pind a(x, y) sellel on sadulapunkt, st selline punkt koordinaatidega x 0, y 0, milles a(x, y) on samal ajal miinimum juures ja maksimum X(joonis 7.2).

Tähendus a(x, y) siinkohal on mängu hind ν: ν = a(x 0, y 0). Sadulapunkti olemasolu tähendab, et sellel lõpmatul mängul on puhas strateegialahendus; x 0, y 0 on optimaalsed puhtad strateegiad A ja B. Üldjuhul, kui α ≠ β, võib mängul olla lahendus ainult segastrateegiate piirkonnas (võib-olla mitte ainuke). Lõpmatu arvu mängude segastrateegial on strateegiate tõenäosusjaotus X ja juures peetakse juhuslikeks muutujateks. See jaotus võib olla pidev ja määratud tihedustega f 1 (X) ja f 2 (y); võib olla diskreetne ja siis koosnevad optimaalsed strateegiad üksikute puhaste strateegiate komplektist, mis on valitud nullist erineva tõenäosusega.

Juhul, kui lõpmatul mängul pole sadulapunkti, on võimalik anda mängu alumisest ja ülemisest hinnast visuaalne geomeetriline tõlgendus. Mõelge lõpmatule mängule, millel on väljamaksefunktsioon a(x, y) ja strateegiad x, y, täites pidevalt telgede segmente (x 1, x 2) ja (kell 1, kell 2). Mängu madalama hinna α määramiseks peame "vaatama" pinda a(x, y) telje küljelt juures, st. projekteerige see tasaseks hoa(joonis 7.3). Saame teatud joonise, mis on külgedelt piiratud sirgjoontega x \u003d x 1 ja x \u003d x 2 ning ülalt ja alt - kõverate K B ja K N. Mängu madalam hind α pole ilmselgelt midagi enamat kui kõvera maksimaalne ordinaat K H.

Samamoodi tuleb mängu ülemise hinna β leidmiseks "vaadata" pealispinda a(x, y) telje küljelt X(projitseerida pind tasapinnale uOa) ja leida projektsiooni ülemise piiri K B minimaalne ordinaat (joonis 7.4).

Vaatleme kahte elementaarset näidet lõpmatutest mängudest.

Näide 1 Mängijatel A ja B on mõlemal loendamatu hulk võimalikke strateegiaid X ja juures ja 0 ≤ x ≤ 1; 0 ≤ y ≤ 1. Väljamaksefunktsioon a jaoks on antud avaldisega a (x, y) - (x - y) 2 . Leia mängule lahendus.

Lahendus Pind a(x, y) on paraboolne silinder (joonis 7.5) ja sellel pole sadulapunkti. Määrakem mängu madalam hind; ilmselgelt kõigile X; seega = 0. Määrame mängu ülemise hinna. Selleks leiame fikseeritud juures

Maksimum saavutatakse sel juhul alati intervalli piiril (kui x = 0 või x = 1), s.t. see on võrdne suuruste y 2 omaga; (1 - y) 2 , mis on suurem. Kujutame nende funktsioonide graafikuid (joon. 7.6), s.o. pinna projektsioon a(x, y) lennukile uOa. Paks joon joonisel fig. 7.6 näitab funktsiooni. Ilmselgelt saavutatakse selle minimaalne väärtus, kui y = 1/2 ja see on võrdne 1/4-ga. Seetõttu on mängu ülemine kulu β = 1/4. Sel juhul langeb mängu ülemine hind kokku mängu hinnaga ν. Tõepoolest, mängija A saab rakendada segastrateegiat S A = , milles äärmuslikud väärtused x = 0 ja x = 1 on kaasatud samade sagedustega; siis mis tahes strateegia puhul on mängija B keskmine väljamakse mängija A jaoks: ½ a 2 + ½ (1 - y) 2 . Seda väärtust on lihtne kontrollida mis tahes väärtuste puhul juures 0 ja 1 vahel on väärtus, mis ei ole väiksem kui ¼: ½y 2 + ½(1 - y) 2 ≥ ¼.

Seega saab mängija A seda segastrateegiat kasutades garanteerida endale mängu kõrgeima hinnaga võrdse väljamakse; kuna mängu hind ei saa olla suurem kui ülemine hind, siis on selline strateegia S A optimaalne: S A = S A *.

Jääb üle leida mängija B optimaalne strateegia. Ilmselgelt, kui mängu hind ν on võrdne mängu ülemise hinnaga β, siis on mängija B optimaalne strateegia alati tema puhas minimax strateegia, mis tagab talle mängu kõrgeim hind. Sel juhul on selline strateegia y 0 = ½. Tõepoolest, selle strateegia puhul pole tema väljamakse suurem kui ¼, hoolimata sellest, mida mängija A teeb. See tuleneb ilmsest ebavõrdsusest (x - ½) 2 = x(x -1) + ¼ ≤ ¼

Näide 2 Pool A ("meie") tulistab vaenlase lennukit B. Mürsudest kõrvalehoidmiseks võib vaenlane manööverdada mõningase ülekoormusega juures, millele ta saab oma äranägemise järgi lisada väärtusi juures= 0 (sirgjooneline liikumine) kuni juures = juuresmax(lend mööda maksimaalse kumerusega ringi). Me eeldame juuresmax mõõtühik, s.o. paneme juuresmax= 1. Võitluses vaenlase vastu saame kasutada sihikuid, mis põhinevad ühel või teisel hüpoteesil sihtmärgi liikumise kohta mürsu lennu ajal. Ülekoormus X selles hüpoteetilises manöövris võib eeldada, et see on võrdne mis tahes väärtusega 0 kuni 1. Meie ülesanne on lüüa vaenlast; vaenlase ülesanne on jääda võitmatuks. Andmete katkemise tõenäosus X ja juures on ligikaudu väljendatud valemiga: a(x, y) = , kus juures- vaenlase poolt rakendatud ülekoormus; x - ülekoormus, sihikuga arvestatud. Mõlema poole jaoks on vaja kindlaks määrata optimaalsed strateegiad.

Lahendus. Ilmselgelt mängu lahendus ei muutu, kui seame p = 1. Väljamakse funktsioon a(x, y) mida kujutab joonisel fig. 7.7.

See on silindriline pind, mille generaatorid on paralleelsed koordinaatnurga poolitajaga tere, ja generatriksiga risti oleva tasapinna lõige on normaaljaotuse kõvera tüüpi kõver. Kasutades ülal pakutud mängu alumise ja ülemise hinna geomeetrilist tõlgendust, leiame β = 1 (joonis 7.8) ja (joonis 7.9). Mängul pole sadulapunkti; lahendust tuleb otsida segastrateegiate vallast. Probleem on mõneti sarnane eelmise näite probleemiga. Tõepoolest, väikeste väärtuste jaoks k funktsioon käitub nagu funktsioon – (x – y) 2, ja mängu lahendus saadakse siis, kui eelmise näite lahenduses on mängijate A ja B rollid vastupidised; need. meie optimaalne strateegia on puhas strateegia x = 1/2 ja vastase optimaalne strateegia S B = on kasutada äärmuslikke strateegiaid y = 0 ja y = 1 sama sagedusega. See tähendab, et me peame alati kasutama ulatust, arvutatud ülekoormuse jaoks x = 1/2 ja vaenlane peab pooltel juhtudel manöövrit üldse kasutamata ja pooleks - maksimaalselt võimalik manöövrit.

Riis. 7.8 Joon. 7.9.

On lihtne tõestada, et see lahendus kehtib k ≤ 2 korral. Tõepoolest, vastase strateegia keskmine väljamakse on S B = ja meie strateegia puhul X väljendatud funktsiooniga , millel väärtustel k ≤ 2 on üks maksimum, kui x = 1/2, mis on võrdne mängu madalama hinnaga α. Seetõttu tagab strateegia S B rakendamine vastasele mitte suurema kaotuse kui α, millest on selge, et α - mängu madalam maksumus - on mängu hind ν.

K > 2 korral on funktsioonil a(x) kaks maksimumi (joonis 7.10), mis paiknevad sümmeetriliselt x = 1/2 ümber punktides x 0 ja 1 - x 0 ning x 0 väärtus sõltub k-st.

Ilmselgelt kl k\u003d 2 x 0 \u003d 1 - x 0 \u003d ½; suurenemisega k punktid x 0 ja 1 - x 0 nihkuvad üksteisest eemale, lähenedes äärmuslikele punktidele (0 ja 1). Seetõttu sõltub mängu lahendus k-st. Määrame k konkreetse väärtuse, näiteks k = 3, ja leiame mängule lahenduse; Selleks määrame kõvera a(x) maksimumi abstsissi x 0. Võrdsustades funktsiooni a(x) tuletise nulliga, kirjutame võrrandi x 0 määramiseks:

Sellel võrrandil on kolm juurt: x \u003d 1/2 (kus on saavutatud miinimum) ja x 0, 1 - x 0, kus saavutatakse maksimumid. Lahendades võrrandi numbriliselt, leiame ligikaudu x 0 ≈ 0,07; 1 - x 0 ≈ 0,93.

Tõestame, et antud juhul on mängu lahendus järgmine strateegiapaar:

Meie ja vaenlase strateegiaga juures keskmine väljamakse on

Leidke 0 juures minimaalne a 1 (y).< у < 1. Функция a 1 (y) симметрична относительно y = 1/2 и может иметь только один или два максимума; ее минимум, во всяком случае, достигается либо в середине отрезка (0, 1), либо на его концах. Полагая у = 0 (или у = 1), найдем

Seadistades y = 1/2, saame

mis on suurem kui 1 (0); seega ei ole mängu hind väiksem kui 1 (0):

Nüüd oletame, et vastane kasutab strateegiat S B * ja meie kasutame strateegiat x. Siis on keskmine väljamakse

Kuid me oleme valinud x 0 täpselt nii, et x = x 0 saavutatakse avaldise (7.2) maksimum; Järelikult

need. strateegiat S B * kasutav vastane suudab ära hoida kaotuse, mis on suurem kui 0,530; seetõttu on ν = 0,530 mängu hind ja strateegiad S A * ja S B * annavad lahenduse. See tähendab, et me peame kasutama sihikuid x = 0,07 ja x = 0,93 sama sagedusega ning vaenlane ei tohiks manööverdada sama sagedusega ja manööverdada maksimaalse ülekoormusega.

Pange tähele, et väljamakse ν = 0,530 on märgatavalt suurem kui mängu madalam hind , mille saaksime ise pakkuda, rakendades oma maksimaalstrateegiat x 0 = 1/2.

Üks praktilisi viise lõpmatute mängude lahendamiseks on nende ligikaudne taandamine lõplikeks. Sellisel juhul liidetakse iga mängija jaoks tinglikult üheks strateegiaks terve hulk võimalikke strateegiaid. Sel moel saab loomulikult vaid mängu ligikaudse lahenduse, kuid enamasti pole täpset lahendust vaja.

Siiski tuleb meeles pidada, et selle nipi rakendamisel võivad segastrateegiate piirkonna lahendused ilmneda isegi juhtudel, kui algse lõpmatu mängu lahendus on võimalik puhaste strateegiate abil, st. kui lõpmatul mängul on sadulapunkt. Kui taandades lõpmatu mängu lõplikuks, saadakse segalahendus, mis sisaldab ainult kahte naabruses olevat “kasulikku” strateegiat, siis on mõttekas proovida nende vahel rakendada algse lõpmatu mängu puhast strateegiat.

Kokkuvõtteks märgime, et erinevalt piiratud mängudest ei pruugi lõpmatutel mängudel lahendust olla. Toome näite lõpmatust mängust, millel pole lahendust. Kaks mängijat nimetavad kumbki suvalise täisarvu. Suurema numbri nimetanu saab teiselt 1 rubla. Kui mõlemad helistavad samale numbrile, lõpeb mäng viigiga. Ilmselgelt ei saa mängul lahendust olla. Siiski on lõpmatute mängude klasse, millele lahendus on kindlasti olemas.

Ja küberneetika, eriti need, kes on huvitatud intelligentsetest agentidest.

Lugu

Optimaalsed lahendused või strateegiad matemaatilises modelleerimises pakuti välja juba 18. sajandil. Tootmise ja hinnakujunduse probleeme oligopolis, millest said hiljem mänguteooria õpikunäited, käsitleti 19. sajandil. A. Cournot ja J. Bertrand. XX sajandi alguses. E. Lasker, E. Zermelo, E. Borel esitasid huvide konflikti matemaatilise teooria idee.

Matemaatiline mänguteooria pärineb neoklassikalisest majandusteadusest. Teooria matemaatilisi aspekte ja rakendusi tutvustati esmakordselt John von Neumanni ja Oskar Morgensterni 1944. aasta klassikalises raamatus "Mänguteooria ja majanduskäitumine". Mängude teooria ja majanduskäitumine).

See matemaatika valdkond on avalikus kultuuris leidnud mõningast peegeldust. 1998. aastal avaldas Ameerika kirjanik ja ajakirjanik Sylvia Nazar raamatu Nobeli majanduspreemia laureaadi ja mänguteooria valdkonna teadlase John Nashi saatusest; ja aastal valmis raamatu põhjal film "Mõttemängud". Mõned Ameerika telesaated, nagu "Sõber või vaenlane", "Alias" või "NUMB3RS", viitavad oma episoodides perioodiliselt teooriale.

Matemaatiline mänguteooria areneb praegu kiiresti, kaalutakse dünaamilisi mänge. Mänguteooria matemaatiline aparaat on aga kulukas. Seda kasutatakse legitiimsete ülesannete täitmiseks: poliitika, monopolide majandus ja turujõu jaotus jne. Mitmetest kuulsatest teadlastest on saanud Nobeli majanduspreemia laureaadid panuse eest sotsiaal-majanduslikke protsesse kirjeldava mänguteooria arendamisse. J. Nash tõusis tänu mänguteooriaalasele uurimistööle külma sõja läbiviimise vallas üheks juhtivaks asjatundjaks, mis kinnitab mänguteooria ülesannete ulatust.

Mängu esitlus

Mängud on rangelt määratletud matemaatilised objektid. Mängu moodustavad mängijad, iga mängija jaoks strateegiate komplekt ja väljamaksete märge või maksed, mängijaid iga strateegiakombinatsiooni jaoks. Enamikku koostöömänge kirjeldatakse iseloomuliku funktsiooniga, teiste tüüpide puhul kasutatakse sagedamini tavalist või ekstensiivset vormi. Mängu kui olukorra matemaatilise mudeli iseloomustavad tunnused:

  1. mitme osaleja olemasolu;
  2. osalejate käitumise ebakindlus, mis on seotud nende igaühe olemasoluga mitmed tegutsemisvõimalused;
  3. osalejate huvide erinevus (lahknevus);
  4. osalejate käitumise vastastikune seotus, kuna igaühe saadud tulemus sõltub kõigi osalejate käitumisest;
  5. kõigile osalejatele teadaolevate käitumisreeglite olemasolu.

Ulatuslik vorm

Põhiartikkel: Lai mänguvorm

Ekstensiivse või laiendatud kujul olevad mängud on kujutatud suunatud puuna, kus iga tipp vastab olukorrale, kus mängija valib oma strateegia. Igale mängijale määratakse terve tase tippe. Maksed registreeritakse puu allosas, igaühe all lehe tipp.

Vasakpoolsel pildil on mäng kahele mängijale. Mängija 1 valib esimesena strateegia F või U. Mängija 2 analüüsib oma positsiooni ja otsustab, kas valida strateegia A või R. Tõenäoliselt valib esimene mängija U ja teine ​​A (igaühe jaoks on see optimaalsed strateegiad); siis saavad nad vastavalt 8 ja 2 punkti.

Ulatuslik vorm on väga illustratiivne, eriti mugav on kujutada rohkem kui kahe mängijaga mänge ja järjestikuste käikudega mänge. Kui osalejad teevad samaaegseid liigutusi, siis on vastavad tipud kas ühendatud punktiirjoonega või visandatud pideva joonega.

normaalne vorm

Mängija 2
strateegia 1
Mängija 2
strateegia 2
Mängija 1
strateegia 1
4 , 3 –1 , –1
Mängija 1
strateegia 2
0 , 0 3 , 4
Tavaline vorm 2 mängijaga mängu jaoks, kummalgi on 2 strateegiat.

Tavalises ehk strateegilises vormis mängu kirjeldatakse maksemaatriks. Maatriksi iga külg (täpsemalt mõõde) on mängija, read määratlevad esimese mängija strateegiad ja veerud teise mängija strateegiad. Kahe strateegia ristumiskohas näete väljamakseid, mida mängijad saavad. Parempoolses näites, kui mängija 1 valib esimese strateegia ja mängija 2 valib teise strateegia, siis ristumiskohas näeme (−1, −1), mis tähendab, et käigu tulemusena kaotasid mõlemad mängijad ühe punkt iga.

Mängijad valisid enda jaoks maksimaalse tulemusega strateegiad, kuid kaotasid teise mängija käigu teadmatuse tõttu. Tavaliselt tähistab tavavorm mänge, milles tehakse käike samaaegselt, või vähemalt eeldatakse, et kõik mängijad ei tea, mida teised osalejad teevad. Sellised mängud puuduliku teabega arutatakse allpool.

iseloomulik funktsioon

Ülekantava kasulikkusega ühismängudes, st võimalusega kanda raha ühelt mängijalt teisele, on kontseptsiooni võimatu rakendada individuaalsed maksed. Selle asemel kasutatakse nn iseloomulikku funktsiooni, mis määrab iga mängijate koalitsiooni väljamakse. Eeldatakse, et tühja koalitsiooni tasuvus on null.

Selle lähenemisviisi põhjendusi võib leida von Neumanni ja Morgensterni raamatust. Koalitsioonimängude tavavormi uurides leidsid nad, et kui koalitsioon moodustatakse mängus, kus on kaks poolt C, siis koalitsioon on sellele vastu N \ C. See näeb välja nagu mäng kahele mängijale. Kuid kuna võimalike koalitsioonide jaoks on palju võimalusi (nimelt 2 N, kus N on mängijate arv), siis väljamakse C tuleb mõni iseloomulik kogus olenevalt koalitsiooni koosseisust. Formaalselt esindab sellisel kujul mängu (nimetatakse ka TU-mänguks) paar (N,v), kus N on kõigi mängijate kogum ja v: 2 N → R on iseloomulik funktsioon.

Seda esitusviisi saab rakendada kõikidele mängudele, sealhulgas neile, millel puudub ülekantav utiliit. Praegu on olemas viise mis tahes mängu muutmiseks tavalisest vormist iseloomulikuks vormiks, kuid vastupidine teisendamine pole kõigil juhtudel võimalik.

Mänguteooria rakendamine

Mänguteooriat kui üht lähenemist rakendusmatemaatikas kasutatakse inimeste ja loomade käitumise uurimiseks erinevates olukordades. Esialgu hakkas mänguteooria arenema majandusteaduse raames, võimaldades mõista ja selgitada majandusagentide käitumist erinevates olukordades. Hiljem laienes mänguteooria ulatus ka teistele sotsiaalteadustele; Praegu kasutatakse mänguteooriat inimkäitumise selgitamiseks politoloogias, sotsioloogias ja psühholoogias. Mänguteoreetilist analüüsi kasutas loomade käitumise kirjeldamiseks esmakordselt Ronald Fisher 1930. aastatel (kuigi isegi Charles Darwin kasutas mänguteooria ideid ilma formaalse põhjenduseta). Mõistet "mänguteooria" Ronald Fisheri töödes ei esine. Sellegipoolest toimub töö sisuliselt kooskõlas mänguteoreetilise analüüsiga. Majandusteaduses tehtud arenguid rakendas John Mainard Smith raamatus Evolution and Game Theory. Mänguteooriat ei kasutata ainult käitumise ennustamiseks ja selgitamiseks; mänguteooriat on püütud kasutada eetilise või võrdluskäitumise teooriate väljatöötamiseks. Majandusteadlased ja filosoofid on hea käitumise paremaks mõistmiseks kasutanud mänguteooriat.

Kirjeldus ja modelleerimine

Esialgu kasutati mänguteooriat inimpopulatsioonide käitumise kirjeldamiseks ja modelleerimiseks. Mõned teadlased usuvad, et vastavates mängudes tasakaalu määramisega saavad nad ennustada inimpopulatsioonide käitumist tõelise vastasseisu olukorras. Seda lähenemist mänguteooriale on viimasel ajal kritiseeritud mitmel põhjusel. Esiteks, simulatsioonides kasutatud eeldusi rikutakse sageli päriselus. Teadlased võivad eeldada, et mängijad valivad käitumise, mis maksimeerib nende kogukasu (majandusliku mehe mudel), kuid praktikas ei vasta inimeste käitumine sageli sellele eeldusele. Sellel nähtusel on palju selgitusi – irratsionaalsus, diskussiooni modelleerimine ja isegi mängijate erinevad motivatsioonid (sh altruism). Mänguteoreetiliste mudelite autorid vaidlevad sellele vastu, öeldes, et nende eeldused on sarnased füüsika omadega. Seega, isegi kui nende eeldused ei täitu alati, saab mänguteooriat kasutada mõistliku ideaalmudelina analoogia põhjal samade mudelitega füüsikas. Mänguteooriale langes aga uus kriitikalaine, kui katsete tulemusena selgus, et inimesed ei järgi praktikas tasakaalustrateegiaid. Näiteks mängudes Centipede ja Dictator ei kasuta osalejad sageli strateegiaprofiili, mis moodustab Nashi tasakaalu. Arutelu selliste katsete tähtsuse üle jätkub. Teise vaatenurga kohaselt ei ole Nashi tasakaal eeldatava käitumise ennustus, vaid seletab ainult seda, miks juba Nashi tasakaalus olevad populatsioonid jäävad sellesse olekusse. Siiski jääb lahtiseks küsimus, kuidas need populatsioonid Nashi tasakaaluni jõuavad. Mõned teadlased sellele küsimusele vastust otsides lülitusid evolutsioonilise mänguteooria uurimisele. Evolutsioonilised mänguteooria mudelid eeldavad mängijate piiratud ratsionaalsust või irratsionaalsust. Nimest hoolimata ei tegele evolutsiooniline mänguteooria niivõrd liikide loodusliku valikuga. See mänguteooria haru uurib bioloogilise ja kultuurilise evolutsiooni mudeleid, aga ka õppeprotsessi mudeleid.

Normatiivne analüüs (parima käitumise tuvastamine)

Teisest küljest peavad paljud teadlased mänguteooriat mitte käitumise ennustamise, vaid olukordade analüüsimise vahendiks, et selgitada välja ratsionaalse mängija jaoks parim käitumine. Kuna Nashi tasakaal sisaldab strateegiaid, mis kõige paremini reageerivad teise mängija käitumisele, tundub Nashi tasakaalu kontseptsiooni kasutamine käitumise valimiseks üsna mõistlik. Seda mänguteoreetiliste mudelite kasutamist on aga ka kritiseeritud. Esiteks, mõnel juhul on mängijal kasulik valida strateegia, mis ei ole tasakaalus, kui ta eeldab, et ka teised mängijad ei järgi tasakaalustrateegiaid. Teiseks võimaldab kuulus vangide dilemma mäng tuua veel ühe vastunäite. Vangide dilemmas seab omakasu taga ajamine mõlemad mängijad hullemasse olukorda, kui nad oleksid omakasu ohverdades.

Mängutüübid

Ühistuline ja mittekoostööaldis

Mängu nimetatakse kooperatiivseks või koalitsioon, kui mängijad saavad gruppidesse ühineda, võttes teiste mängijate ees teatud kohustusi ja koordineerides nende tegevust. Selle poolest erineb see koostöövabadest mängudest, kus igaüks on kohustatud ise mängima. Meelelahutuslikud mängud on harva koostööaldised, kuid sellised mehhanismid pole igapäevaelus haruldased.

Tihti arvatakse, et koostöömängud erinevad just mängijate oskuse poolest omavahel suhelda. Üldiselt pole see tõsi. On mänge, kus suhtlemine on lubatud, kuid mängijad taotlevad isiklikke eesmärke ja vastupidi.

Kahest tüüpi mängudest kirjeldavad koostöövõimetud mängud olukordi väga üksikasjalikult ja annavad täpsemaid tulemusi. Ühistud käsitlevad mängu protsessi tervikuna. Katsed ühendada need kaks lähenemisviisi on andnud märkimisväärseid tulemusi. nn Nashi programm on juba leidnud lahendusi mõnele koostöömängule kui mittekoostööliste mängude tasakaaluolukordadele.

Hübriidmängud sisaldavad koostöö- ja mittekoostöömängude elemente. Näiteks võivad mängijad moodustada gruppe, kuid mängu mängitakse koostöövabas stiilis. See tähendab, et iga mängija järgib oma grupi huve, püüdes samal ajal saavutada isiklikku kasu.

Sümmeetriline ja asümmeetriline

AGA B
AGA 1, 2 0, 0
B 0, 0 1, 2
Asümmeetriline mäng

Põhiartikkel: Sümmeetriline mäng

Mäng on sümmeetriline, kui mängijate vastavad strateegiad on võrdsed, st neil on samad väljamaksed. Teisisõnu, kui mängijad saavad kohti vahetada ja samal ajal nende väljamaksed samade käikude eest ei muutu. Paljud uuritud mängud kahele mängijale on sümmeetrilised. Eelkõige on need järgmised: vangide dilemma, hirvejaht, kullid ja tuvid. Asümmeetriliste mängudena võib tuua "Ultimaatumi" või "Diktaatori".

Parempoolses näites võib mäng esmapilgul tunduda sümmeetriline sarnaste strateegiate tõttu, kuid see pole nii - lõppude lõpuks on teise mängija väljamakse strateegiaprofiilidega (A, A) ja (B, B) on suurem kui esimene.

Nullsumma ja nullist erineva summa

Nullsumma mängud- eriline sort pideva summa mängud st need, kus mängijad ei saa olemasolevaid ressursse ega mängu fondi suurendada ega vähendada. Sel juhul on kõigi võitude summa võrdne mis tahes käigu kõigi kaotuste summaga. Vaadake paremale – numbrid tähendavad makseid mängijatele – ja nende summa igas lahtris on null. Sellised mängud on näiteks pokker, kus üks võidab kõik teiste panused; reversi, kus lüüakse vastase nuppe; või banaalne vargus.

Paljud matemaatikute uuritud mängud, sealhulgas juba mainitud vangide dilemma, on teistsugused: nullsummata mängudÜhe mängija võit ei pruugi teise jaoks tähendada kaotust ja vastupidi. Sellise mängu tulemus võib olla nullist väiksem või suurem. Selliseid mänge saab nullsummaks teisendada – seda tehakse tutvustamise teel fiktiivne mängija, mis "omastab" ülejäägi või korvab rahapuuduse.

Teine nullist erineva summaga mäng on kaubandus kus iga osaleja kasu saab. Tuntud näide, kus see väheneb, on

Selle peatüki õppimise tulemusena peaks õpilane:

tea

Mängude kontseptsioonid domineerimise põhimõttel, Nashi tasakaal, mis on tagurpidi induktsioon jne; kontseptuaalsed lähenemised mängu lahendamisele, ratsionaalsuse ja tasakaalu mõiste tähendus interaktsioonistrateegia raames;

suutma

Eristada mänge strateegilistes ja laiendatud vormides, ehitada "mängupuu"; sõnastada konkurentsi mängumudeleid erinevat tüüpi turgude jaoks;

oma

Mängu tulemuse määramise meetodid.

Mängud: põhimõisted ja põhimõtted

Esimese katse luua matemaatiline mängude teooria tegi 1921. aastal E. Borel. Iseseisva teadusvaldkonnana esitleti mänguteooriat esmakordselt süstemaatiliselt J. von Neumanni ja O. Morgensterni monograafias "Mänguteooria ja majanduskäitumine" aastal 1944. Sellest ajast saadik on paljud majandusteooria osad (näiteks teooria ebatäiuslik konkurents, majanduslike stiimulite teooria jne.) arenes välja tihedas kokkupuutes mänguteooriaga. Mänguteooriat rakendatakse edukalt ka sotsiaalteadustes (näiteks hääletamisprotseduuride analüüs, tasakaalukontseptsioonide otsimine, mis määravad indiviidide koostöö- ja koostöövalmiduse). Reeglina tõrjuvad valijad äärmuslikke vaatenurki esindavaid kandidaate, kuid kahest erinevat kompromisslahendust pakkuvast kandidaadist ühe valides tekib võitlus. Isegi Rousseau idee evolutsioonist "loomulikust vabadusest" "kodanikuvabaduseks" vastab formaalselt mänguteooria seisukohalt koostöö vaatenurgale.

Mäng- see on idealiseeritud matemaatiline mudel mitme inimese (mängija) kollektiivsest käitumisest, kelle huvid on erinevad, mis põhjustab konflikti. Konflikt ei tähenda tingimata poolte antagonistlike vastuolude olemasolu, vaid on alati seotud teatud tüüpi lahkarvamustega. Konfliktolukord on antagonistlik, kui ühe osapoole väljamakse suurenemine teatud summa võrra toob kaasa teise poole väljamakse vähenemise sama summa võrra ja vastupidi. Huvide antagonism tekitab konflikti ja huvide kokkulangevus taandab mängu tegevuste koordineerimisele (koostööle).

Konfliktsituatsiooniks on näiteks olukorrad, mis kujunevad välja ostja ja müüja suhetes; erinevate ettevõtete konkurentsitingimustes; vaenutegevuse käigus jne. Mängunäideteks on ka tavamängud: male, kabe, kaardimängud, saalimängud jne (sellest ka nimetus "mänguteooria" ja selle terminoloogia).

Enamikus mängudes, mis tulenevad finants-, majandus- ja juhtimissituatsioonide analüüsist, ei ole mängijate (poolte) huvid rangelt antagonistlikud ega kattuvad absoluutselt. Ostja ja müüja lepivad kokku, et müügis kokku leppimine on nende ühistes huvides, kuid nad peavad jõuliselt kauplema, et valida vastastikuse eelise piires konkreetne hind.

Mänguteooria on konfliktsituatsioonide matemaatiline teooria.

Mäng erineb tegelikust konfliktist selle poolest, et seda peetakse teatud reeglite järgi. Need reeglid määravad kindlaks käikude jada, kummalgi poolel oleva teabe hulga teise käitumise kohta ja mängu tulemuse olenevalt olukorrast. Reeglid kehtestavad ka mängu lõpu, mil teatud liigutuste jada on juba tehtud ja rohkem käike ei lubata.

Mänguteoorial, nagu igal matemaatilisel mudelil, on omad piirangud. Üks neist on oponentide täieliku (ideaalse) mõistlikkuse oletus. Tõelise konflikti korral on sageli parim strateegia arvata, milles vaenlane loll on, ja kasutada seda rumalust enda huvides.

Mänguteooria puuduseks on ka see, et igaüks mängijatest peab teadma vastase kõiki võimalikke tegevusi (strateegiaid), teada on vaid, millist neist ta antud mängus kasutab. Tõelise konflikti korral see tavaliselt nii ei ole: vaenlase kõigi võimalike strateegiate loend on lihtsalt teadmata ja konfliktiolukorras on sageli parim lahendus vaenlasele teadaolevatest strateegiatest kaugemale minemine, "tuimestamine". teda millegi täiesti uue, ennenägematuga.

Mänguteooria ei sisalda riskielemente, mis reaalsetes konfliktides mõistlike otsustega paratamatult kaasnevad. See määrab konfliktis osalejate kõige ettevaatlikuma edasikindlustuskäitumise.

Lisaks leitakse mänguteoorias optimaalsed strateegiad ühe näitaja (kriteeriumi) suhtes. Praktilistes olukordades on sageli vaja arvestada mitte ühe, vaid mitme numbrilise kriteeriumiga. Strateegia, mis on optimaalne ühes mõõdus, ei pruugi olla optimaalne teise puhul.

Teades neid piiranguid ja seetõttu mitte pimesi järgides mänguteooriate soovitusi, on siiski võimalik paljude reaalsete konfliktiolukordade jaoks välja töötada täiesti vastuvõetav strateegia.

Praegu tehakse teadusuuringuid, mille eesmärk on mänguteooria rakendusalade laiendamine.

Kirjandusest leiate järgmised mängu moodustavate elementide määratlused.

Mängijad- need on interaktsioonis osalevad subjektid, mis on esindatud mängu kujul. Meie puhul on need leibkonnad, ettevõtted, valitsus. Väliste asjaolude määramatuse korral on aga üsna mugav kujutada mängu juhuslikke komponente, mis ei sõltu mängijate käitumisest, "looduse" tegudena.

Mängureeglid. Mängureeglid on mängijatele kättesaadavad toimingute või käikude komplektid. Sel juhul võivad tegevused olla väga mitmekesised: ostjate otsused ostetud kaupade või teenuste mahu kohta; ettevõtted - toodangu mahu kohta; valitsuse kehtestatud maksude tase.

Mängu tulemuse (tulemuse) kindlaksmääramine. Iga mängijate tegevuste kombinatsiooni jaoks määratakse mängu tulemus peaaegu mehaaniliselt. Tulemuseks võib olla: tarbijakorvi koosseis, ettevõtte väljundi vektor või muude kvantitatiivsete näitajate kogum.

Võidud. Võidu mõistele omistatud tähendus võib eri tüüpi mängude puhul erineda. Samal ajal on vaja selgelt eristada järguskaalal mõõdetud kasu (näiteks kasulikkuse tase) ja väärtusi, mille puhul on intervallide võrdlemine mõttekas (näiteks kasum, heaolu tase).

Info ja ootused. Ebakindlusel ja pidevalt muutuval teabel võib olla äärmiselt tõsine mõju suhtluse võimalikele tulemustele. Seetõttu tuleb mängu arendamisel arvestada info rolliga. Sellega seoses kontseptsioon teabekomplekt mängija, st. kogu teave mängu seisu kohta, mis tal võtmetähtsusega ajahetkedel on.

Arvestades mängijate juurdepääsu teabele, on üldteadmiste intuitiivne idee või reklaam, mis tähendab järgmist: fakt on hästi teada, kui kõik mängijad on sellest teadlikud ja kõik mängijad teavad, et ka teised mängijad teavad sellest.

Juhtudeks, kui üldteadmise mõiste rakendamisest ei piisa, on üksikisiku mõiste ootustele osalejad - ideed selle kohta, kuidas mängu olukord selles etapis on.

Mänguteoorias eeldatakse, et mäng koosneb liigub, mida esitavad mängijad samaaegselt või järjestikku.

Liigutused on isiklikud ja juhuslikud. Liikumist nimetatakse isiklik, kui mängija valib selle teadlikult võimalike tegevusvariantide hulgast ja viib selle ellu (näiteks mis tahes käik malemängus). Liikumist nimetatakse juhuslik, kui tema valikut ei tee mängija, vaid mingi juhusliku valiku mehhanism (näiteks mündi viskamise tulemuste põhjal).

Mängijate poolt mängu algusest lõpuni tehtud käikude kogum nimetatakse pidu.

Üks mänguteooria põhimõisteid on strateegia mõiste. strateegia mängijat nimetatakse reeglite kogumiks, mis määravad iga isikliku käigu jaoks tegevusvariandi valiku, olenevalt mängu jooksul kujunenud olukorrast. Lihtsates (ühe käiguga) mängudes, kui mängija saab igas mängus teha ainult ühe käigu, langevad strateegia ja võimaliku tegevussuuna mõisted kokku. Sel juhul katab mängija strateegiate kogu kõik tema võimalikud tegevused ja kõik mängija jaoks võimalikud i tegevus on tema strateegia. Keerulistes (mitme käiguga) mängudes võivad mõisted "võimalike toimingute variant" ja "strateegia" üksteisest erineda.

Mängija strateegiat nimetatakse optimaalne, kui see annab antud mängijale maksimaalse võimaliku keskmise kasu või minimaalse võimaliku keskmise kaotuse, olenemata sellest, milliseid strateegiaid vastane kasutab, kui mängu korratakse mitu korda. Kasutada võib ka muid optimaalsuse kriteeriume.

Võimalik, et maksimaalset tasuvust tagaval strateegial puudub teine ​​oluline optimaalsuse esitus, näiteks lahenduse stabiilsus (tasakaal). Mängu lahendus on jätkusuutlik(tasakaal), kui sellele otsusele vastavad strateegiad moodustavad olukorra, mille muutmisest pole huvitatud ükski mängija.

Kordame, et mänguteooria ülesanne on leida optimaalsed strateegiad.

Mängude klassifikatsioon on näidatud joonisel fig. 8.1.

  • 1. Sõltuvalt käikude tüübist jagunevad mängud strateegilisteks ja hasartmängudeks. hasartmängud mängud koosnevad ainult juhuslikest käikudest, millega mänguteooria ei tegele. Kui juhuslike käikude kõrval on ka isiklikud käigud või kõik käigud on isiklikud, siis selliseid mänge kutsutakse strateegiline.
  • 2. Sõltuvalt mängijate arvust jagatakse mängud paaris- ja mitmikmängudeks. AT paarismäng osalejate arv on kaks mitmekordne- rohkem kui kaks.
  • 3. Mitmikmängus osalejad võivad moodustada alalisi või ajutisi koalitsioone. Mängijate omavaheliste suhete iseloomu järgi jagunevad mängud koostöövabadeks, koalitsioonilisteks ja kooperatiivseteks.

Mittekoalitsioon nimetatakse mängudeks, kus mängijatel ei ole õigust sõlmida kokkuleppeid, moodustada koalitsioone ning iga mängija eesmärk on saada võimalikult suur individuaalne kasu.

Mänge, kus mängijate tegevuse eesmärk on maksimeerida kollektiivide (koalitsioonide) väljamakseid ilma nende hilisemat mängijate vahel jagamist nimetatakse koalitsioon.

Riis. 8.1.

väljaränne ühistu mäng on koalitsiooni väljamaksete jagamine, mis ei tulene mängijate teatud tegude, vaid nende etteantud kokkulepete tulemusena.

Selle kohaselt ei võrrelda koostöömängudes eelistustes mitte olukordi, nagu mittekoostöömängudes, vaid jaotusi; ja võrdlus ei piirdu individuaalse kasu arvestamisega, vaid on keerulisem.

  • 4. Iga mängija strateegiate arvu järgi jagunevad mängud lõplik(iga mängija strateegiate arv on piiratud) ja lõputu(iga mängija strateegiate hulk on lõpmatu).
  • 5. Vastavalt sellele, kui palju on mängijatel teavet varasemate käikude kohta, jagatakse mängud mängudeks täielik teave(kogu info eelmiste käikude kohta on olemas) ja puudulik teave. Täieliku teabega mängud on näiteks male, kabe jms.
  • 6. Kirjelduse tüübi järgi jagunevad mängud positsioonimängudeks (või mängudeks laiendatud kujul) ja tavavormis mängudeks. Positsioonimängud on antud mängupuu kujul. Kuid iga positsioonimängu saab taandada normaalne vorm, kus iga mängija teeb ainult ühe iseseisva käigu. Positsioonimängudes tehakse liigutusi diskreetsetel aegadel. Olemas diferentsiaalmängud, milles käike tehakse pidevalt. Need mängud uurivad kontrollitava objekti tagaajamise probleeme teise kontrollitava objektiga, võttes arvesse nende käitumise dünaamikat, mida kirjeldavad diferentsiaalvõrrandid.

Samuti on olemas peegeldavad mängud, mis arvestavad olukordi seoses vaenlase võimaliku tegevussuuna ja käitumise vaimse taastootmisega.

7. Kui mõne mängu võimaliku mängu väljamaksete summa on null N mängijad(), siis räägi sellest nullsumma mäng. Vastasel juhul on mängud nn nullsummata mängud.

Selge, nullsumma paarimäng on antagonistlik kuna ühe mängija võit on võrdne teise kaotusega ja järelikult on nende mängijate eesmärgid otse vastupidised.

Nimetatakse lõplikku paarikaupa nullsummamängu maatriksmäng. Sellist mängu kirjeldab väljamaksete maatriks, milles antakse esimese mängija väljamaksed. Maatriksi rea number vastab esimese mängija rakendatud strateegia numbrile, veerg vastab teise mängija rakendatud strateegia numbrile; rea ja veeru ristumiskohas on esimese mängija vastav kasum (teise mängija kaotus).

Nimetatakse lõpliku paarismängu, mille summa ei ole null bimatrix mäng. Sellist mängu kirjeldavad kaks väljamakse maatriksit, kumbki vastava mängija jaoks.

Võtame järgmise näite. Mäng "Rekord". Mängijal 1 olgu testiks valmistuv õpilane ja 2. mängijal testi sooritav õpetaja. Oletame, et õpilasel on kaks strateegiat: A1 – valmistu testiks hästi; A 2 - ära valmista. Õpetajal on ka kaks strateegiat: B1 - pane test; B 2 – ära asu teele. Mängijate väljamaksete väärtuste hinnang võib põhineda näiteks järgmistel kaalutlustel, mis kajastuvad väljamakse maatriksites:

See mäng on vastavalt ülaltoodud klassifikatsioonile strateegiline, paaris, koostöövõimetu, lõplik, tavavormis kirjeldatud, nullist erineva summaga. Lühidalt võib seda mängu nimetada bimatrixiks.

Ülesanne on määrata õpilase ja õpetaja jaoks optimaalsed strateegiad.

Veel üks näide tuntud bimatrix mängust Prisoner's Dilemma.

Mõlemal mängijal on kaks strateegiat: A 2 ja B 2 – agressiivse käitumise strateegiad, a A mina ja B i - rahumeelne käitumine. Oletame, et "rahu" (mõlemad mängijad on rahumeelsed) on mõlema mängija jaoks parem kui "sõda". Juhtum, kui üks mängija on agressiivne ja teine ​​rahumeelne, on agressori jaoks tulusam. Olgu selles bimaatriksmängus mängijate 1 ja 2 väljamakse maatriksitel vorm

Mõlema mängija jaoks domineerivad agressiivsed strateegiad A2 ja B2 rahumeelsete strateegiate Axe ja B v Seega on domineerivate strateegiate ainsaks tasakaaluks vorm (A2, B 2), st. postuleeritakse, et koostööst keeldumise tagajärjeks on sõda. Samal ajal annab tulemus (A1, B1) (maailm) mõlemale mängijale suurema väljamakse. Seega satub koostööst hoiduv egoistlik käitumine vastuolus kollektiivsete huvidega. Kollektiivsed huvid dikteerivad rahumeelsete strateegiate valiku. Samal ajal, kui mängijad teavet ei vaheta, on sõda kõige tõenäolisem tulemus.

Sel juhul on olukord (A1, B1) Pareto optimaalne. See olukord on aga ebastabiilne, mis toob kaasa võimaluse, et mängijad rikuvad sõlmitud kokkulepet. Tõepoolest, kui esimene mängija rikub kokkulepet ja teine ​​mitte, suureneb esimese mängija väljamakse kolmeni ja teise mängija langeb nullini ja vastupidi. Veelgi enam, iga mängija, kes ei riku kokkulepet, kaotab rohkem, kui teine ​​mängija rikub kokkulepet, kui siis, kui nad mõlemad lepingut rikuvad.

On kaks peamist mänguvormi. mäng sisse ulatuslik vorm kujutatud otsuse tegemise "puu" diagrammina, kus "juur" vastab mängu alguspunktile ja iga uue "haru" algus, nn. sõlm,- selles etapis saavutatud olek mängijate juba tehtud toimingutega. Igale lõppsõlmele - igale mängu lõpp-punktile - määratakse väljamakse vektor, iga mängija jaoks üks komponent.

strateegiline, teisiti kutsutakse normaalne, vorm Mängu esitus vastab mitmemõõtmelisele maatriksile ja iga dimensioon (kahemõõtmelisel juhul read ja veerud) sisaldab ühe agendi võimalike toimingute komplekti.

Maatriksi eraldi lahter sisaldab väljamaksete vektorit, mis vastab mängija strateegiate antud kombinatsioonile.

Joonisel fig. 8.2 esitab mängu ulatusliku vormi ja tabelis. 8.1 - strateegiline vorm.

Riis. 8.2.

Tabel 8.1. Mäng koos üheaegse otsustamisega strateegilises vormis

Mänguteooria komponentide klassifikatsioon on üsna üksikasjalik. Sellise liigituse üheks üldisemaks kriteeriumiks on mänguteooria jaotus mittekoostööliste mängude teooriaks, milles otsustusobjektideks on indiviidid ise, ja koostöömängude teooriaks, milles mänguteooria subjektid. otsustajad on üksikisikute rühmad või koalitsioonid.

Koostööväliseid mänge esitatakse tavaliselt tavalistes (strateegilistes) ja laiendatud (ulatuslikes) vormides.

  • Vorobjov N. N. Mänguteooria ökojomistidele-küberistidele. Moskva: Nauka, 1985.
  • Wentzel E.S. Operatsiooniuuringud. Moskva: Nauka, 1980.

Ameerika populaarsest ajaveebist Cracked.

Mänguteooria eesmärk on õppida, kuidas teha parim käik ja saada võimalikult suur osa võidupirukast, lõigates osa sellest teistelt mängijatelt ära. See õpetab analüüsima paljusid tegureid ja tegema loogiliselt kaalutud järeldusi. Arvan, et seda tuleks uurida pärast numbreid ja enne tähestikku. Lihtsalt sellepärast, et liiga paljud inimesed teevad olulisi otsuseid intuitsiooni, salaennustuste, tähtede asetuse ja muu sellise põhjal. Olen mänguteooriat hoolikalt uurinud ja nüüd tahan teile rääkida selle põhitõdedest. Võib-olla lisab see teie ellu tervet mõistust.

1. Vangide dilemma

Berto ja Robert arreteeriti pangaröövi pärast, kuna nad ei suutnud põgenemiseks varastatud autot õigesti kasutada. Politsei ei suuda tõestada, et just nemad röövisid panka, kuid tabasid nad varastatud autos. Nad viidi erinevatesse ruumidesse ja igaühele pakuti kokkulepet: anda kaasosaline üle ja saata ta kümneks aastaks vangi ning pääseda ise vabadusse. Aga kui nad mõlemad üksteist reedavad, saavad mõlemad 7 aastat. Kui keegi midagi ei ütle, siis istuvad mõlemad 2 aastat maha ainult autovarguse pärast.

Selgub, et kui Berto vaikib, aga Robert ta reedab, läheb Berto 10 aastaks vangi ja Robert vabaneb.

Iga vang on mängija ja igaühe kasu saab esitada "valemina" (mida saavad mõlemad, mida saab teine). Näiteks kui ma sind löön, näeks minu võiduskeem välja selline (saan jämeda võidu, sul on väga valus). Kuna igal vangil on kaks võimalust, saame tulemused esitada tabelis.

Praktiline rakendus: sotsiopaatide tuvastamine

Siin näeme mänguteooria peamist rakendust: tuvastada sotsiopaadid, kes mõtlevad ainult iseendale. Pärismänguteooria on võimas analüütiline tööriist ja amatöörlus toimib sageli punase lipuna, mille pea reedab auväärset inimest. Intuitiivsed inimesed arvavad, et parem on olla kole, sest see toob kaasa lühema vanglakaristuse, olenemata sellest, mida teine ​​mängija teeb. Tehniliselt on see õige, kuid ainult siis, kui olete lühinägelik inimene, kes seab numbrid inimeludest kõrgemale. Seetõttu on mänguteooria rahanduses nii populaarne.

Vangide dilemma tegelik probleem on see, et see ignoreerib andmeid. Näiteks ei arvestata sellega, et kohtute kümneks aastaks vangi mõistetud inimese sõprade, sugulaste või isegi võlausaldajatega.

Mis kõige hullem, kõik, kes on seotud vangide dilemmaga, käituvad nii, nagu nad poleks seda kunagi kuulnud.

Ja parim samm on vait olla ja kahe aasta pärast koos hea sõbraga kasutada ühist raha.

2. Domineeriv strateegia

See on olukord, kus teie tegevused annavad suurima kasu, olenemata teie vastase tegevusest. Mis ka ei juhtuks, tegite kõik õigesti. Seetõttu usuvad paljud vangide dilemma inimesed, et reetmine viib "parima" tulemuseni olenemata sellest, mida teine ​​inimene teeb, ja sellele meetodile omane teadmatus tegelikkusest muudab kõik ülilihtsaks.

Enamikul meie mängitavatest mängudest ei ole rangelt domineerivaid strateegiaid, sest muidu oleksid need kohutavad. Kujutage ette, et teeksite alati sama asja. Kivi-paber-käärid mängus domineerivat strateegiat pole. Aga kui mängiksite inimesega, kellel olid käes ahjukindad ja kes saaks näidata ainult kivi või paberit, oleks teil domineeriv strateegia: paber. Teie paber mähib tema kivi või tulemuseks on viik ja te ei saa kaotada, kuna vastane ei saa kääre näidata. Nüüd, kui teil on domineeriv strateegia, oleks loll midagi muud proovida.

3. Sugude lahing

Mängud on huvitavamad, kui neil puudub rangelt domineeriv strateegia. Näiteks sugupoolte lahing. Anjali ja Borislav lähevad kohtingule, kuid ei suuda otsustada balleti ja poksi vahel. Anjali armastab poksimist, sest talle meeldib näha verd voolamas karjuvate pealtvaatajate rõõmuks, kes arvavad end olevat tsiviliseeritud vaid sellepärast, et maksid kellegi murtud peade eest.

Borislav tahab balletti vaadata, sest mõistab, et baleriinid läbivad palju vigastusi ja kõige raskema treeningu, teades, et üks vigastus võib kõik lõpetada. Balletitantsijad on maailma suurimad sportlased. Baleriin võib sulle jalaga pähe lüüa, aga ta ei tee seda kunagi, sest tema jalg on palju rohkem väärt kui sinu nägu.

Nad tahavad igaüks tegeleda oma lemmiktegevusega, kuid nad ei taha seda üksinda nautida, seega on nende võiduskeem järgmine: kõrgeim väärtus on teha seda, mis neile meeldib, madalaim väärtus on lihtsalt teise inimesega koos olemine ja null on üksildus.

Mõned soovitavad kangekaelselt balansseerida sõja äärel: kui teed, mida tahad, ükskõik mida, peab teine ​​sinu valikule kohanema või kaotab kõik. Nagu ma juba ütlesin, Lihtsustatud mänguteooria on lollide märkamisel suurepärane.

Praktiline rakendus: vältige teravaid nurki

Loomulikult on sellel strateegial ka olulisi puudusi. Esiteks, kui kohtlete oma kohtinguid nagu "soode lahingut", siis see ei tööta. Eraldage nii, et igaüks teist leiaks inimese, kes talle meeldib. Ja teine ​​probleem on see, et selles olukorras on osalejad endas nii ebakindlad, et ei saa hakkama.

Tõeliselt võidukas strateegia igaühe jaoks on teha seda, mida nad tahavad, ja pärast või järgmisel päeval, kui nad on vabad, minge koos kohvikusse. Või vaheldumisi poksi ja balleti vahel, kuni meelelahutusmaailmas tehakse revolutsioon ja leiutatakse poksiballett.

4. Nashi tasakaal

Nashi tasakaal on liigutuste kogum, kus keegi ei taha pärast tõsiasja midagi teisiti teha. Ja kui suudame selle toimima panna, asendab mänguteooria kogu planeedi filosoofilise, religioosse ja finantssüsteemi, sest "soovist mitte ebaõnnestuda" on saanud inimkonna jaoks võimsam liikumapanev jõud kui tuli.

Jagame 100 dollari kiiresti ära. Sina ja mina otsustame, kui palju sajast nõuame ja samal ajal teatame ka summad. Kui meie kogusumma on alla saja, saavad kõik, mida tahtsid. Kui kogusumma on üle saja, saab soovitud summa see, kes küsis kõige vähem, ahnem aga selle, mis üle jääb. Kui küsime sama summat, saab igaüks 50 dollarit. Kui palju te küsite? Kuidas te raha jagate? On ainult üks võidukäik.

Nõue $51 annab teile maksimaalse summa olenemata sellest, mida teie vastane valib. Kui ta küsib rohkem, saate 51 dollarit. Kui ta küsib 50 või 51 dollarit, saate 50 dollarit. Ja kui ta küsib vähem kui 50 dollarit, saate 51 dollarit. Igal juhul pole muud võimalust, mis tooks teile rohkem raha kui see. Nashi tasakaal on olukord, kus me mõlemad valime $51.

Praktiline rakendus: kõigepealt mõtle

See on kogu mänguteooria mõte. Sa ei pea võitma, rääkimata teistele mängijatele haiget tegemisest, kuid sa pead tegema enda jaoks parima käigu, olenemata sellest, mis teistel sinu jaoks varuks on. Ja veelgi parem, kui see käik on kasulik teistele mängijatele. See on omamoodi matemaatika, mis võib ühiskonda muuta.

Selle idee huvitav variant on joomine, mida võib nimetada ajasõltuvusega Nash Equilibriumiks. Kui jood piisavalt, ei huvita sind teiste inimeste tegevus, ükskõik mida nad ka ei teeks, kuid järgmisel päeval kahetsed väga, et teisiti ei teinud.

5. Visemäng

Visemängus osalevad mängija 1 ja mängija 2. Iga mängija valib korraga pea või saba. Kui nad arvavad õigesti, saab mängija 1 mängija 2 penni. Kui nad seda ei tee, saab mängija 2 mängija 1 mündi.

Võidumaatriks on lihtne...

…optimaalne strateegia: mängi täiesti juhuslikult. See on raskem, kui arvate, sest valik peab olema täiesti juhuslik. Kui eelistate pead või sabasid, võib vastane seda teie raha ära võtta.

Muidugi on siin tegelik probleem see, et oleks palju parem, kui nad loobiksid üksteisele ühe sendi. Selle tulemusena oleks nende kasum sama ja sellest tulenev trauma võib aidata neil õnnetutel tunda midagi muud peale kohutava igavuse. Lõppude lõpuks on see kõigi aegade halvim mäng. Ja see on ideaalne mudel penaltiseeriaks.

Praktiline rakendus: karistus

Jalgpallis, jäähokis ja paljudes teistes mängudes on lisaaeg penaltiseeria. Ja need oleks huvitavamad, kui lähtuksid sellest, mitu korda saavad täisvormis mängijad "ratast" teha, sest see oleks vähemalt nende füüsiliste võimete näitaja ja seda oleks lõbus vaadata. Väravavahid ei saa kohe liikumise alguses selgelt palli või litri liikumist kindlaks teha, sest kahjuks meie spordialadel robotid endiselt ei osale. Väravavaht peab valima suuna vasakule või paremale ja lootma, et tema valik langeb kokku väravat lööva vastase valikuga. Sellel on midagi ühist mündimänguga.

Pane aga tähele, et see ei ole ideaalne näide peade ja sabade sarnasusest, sest isegi õige suuna korral ei pruugi väravavaht palli kätte saada ning ründaja võib väravast mööda lüüa.

Mis on meie järeldus mänguteooria järgi? Pallimängud peaksid lõppema mitme palliga, kus mängijatele antakse iga minut üks-ühele lisapall/litter, kuni kumbki pool on saavutanud kindla tulemuse, mis viitas mängijate tõelisele oskusele ja mitte näiline kokkusattumus.

Mängu targemaks muutmiseks tuleks ju kasutada mänguteooriat. Ja see tähendab paremat.