Minimax - mis see on, määratlus ja mõiste

Lang L: none (table-of-contents):

Minimax - mis see on, määratlus ja mõiste
Minimax - mis see on, määratlus ja mõiste
Anonim

Miinimum on mänguteoorias meetod, mille eesmärk on oodatava kaotuse minimeerimine. Selleks eeldab mängija, et tema vastase otsus on ebasoodne. See tähendab, et enne vastase liikumist on oodata halvimat stsenaariumi.

Teisiti öeldes koosneb minimax-meetod sellest, kuidas teha parim otsus, eeldades, et teine ​​mängija valib teie jaoks halvima stsenaariumi.

Peame arvestama, et see meetod on rakendatav kahe inimese mängus (kaks mängijat) ja see ei ole koostööaldis, vaid nullsummamäng. See tähendab, et see, mida üks mängija võidab, kaotab teine ​​ja vastupidi. Järelikult on iga agent huvitatud oma kasulikkuse maksimeerimisest, isegi kui see teeb teisele haiget.

Siinkohal peame ka meeles pidama, et mänguteooria on matemaatika ja majanduse haru, mis uurib valikut, mis optimeerib indiviidi olukorda, kui kulud ja tulud pole eelnevalt fikseeritud, vaid sõltuvad teiste otsustest.

Minimax-algoritm otsustuspuul

Näeme, kuidas minimax-meetodit rakendatakse mitme sõlmega otsustuspuus. Mäng algab alt ja lõpeb tulemusega tipptasemel.

Puu põhjas teeb vastane esimese käigu, seega on oodata halvimat tulemust. Siis teisel tasemel püüab mängija x oma kasumit maksimeerida, võttes arvesse vastase varem tehtud otsust.

Kolmandal tasemel on jälle vastase kord ja nii edasi. Näitame allpool näidet.

Minimax-algoritmi näide

Järgmises otsustuspuus näitame mängija x poolt igal mängu hetkel saadud tulemusi. Baasis, esimesel tasemel, teeb vastane otsuse. Sel põhjusel on välja toodud stsenaariumid, kus mängija võib kaotada -10 või võita 5.

Teisel tasemel on mängija x ülesanne, nii et ta maksimeerib oma kasumit. 10 kaotuse või 1 võidu vahel võidate 1. Samamoodi võidate 5 või 7 vahel 7.

Seejärel on taas vastase kord, nii et antakse stsenaariumid, kus mängijal x on vastavalt juhtumile halvim tulemus, -3 ja 4. Lõpuks teeb mängija x kaotuse 3 või 4 kaotamise vahel otsuse, mis lubab viimast.

Peame arvestama, et iga sõlme väärtused sõltuvad kasuliku funktsioonist.

Oletame, et puu paremaks mõistmiseks tehakse otsus toote jaotuse kohta. Võistleja (vastane) saab jaotuse sisse tellida (vt puu vasakut serva). Sel juhul peab ta valima näiteks edasimüüja A ja B vahel. Seega valib ta esimese, põhjustades mängija x kaotuse 10 (Kui ta valiks B, võidaks mängija x 12).

Kuid võib-olla eelistab vastane oma kaupa ise levitada, kui ta saab rentida mootorsõidukeid või osta veoautot. Valige mõlemast stsenaariumist esimene, mis on mängija x jaoks vähem meelitav, sest ta võidab 5 ja mitte 10.