Teorya ng larong matematika. Mga halimbawa ng pag-record at paglutas ng mga laro mula sa buhay

Bagama't nagtapos ako sa Faculty of Physics and Technology, hindi ako tinuruan ng game theory sa unibersidad. Pero dahil pasok na ako taon ng mag-aaral Naglaro ako ng maraming unang kagustuhan at pagkatapos ay tulay, ang teorya ng laro ay interesado sa akin, at pinagkadalubhasaan ko ang isang maliit na aklat-aralin. At kamakailan lamang, nalutas ng site reader na si Mikhail ang isang problema sa teorya ng laro. Napagtatanto na ang gawain ay hindi madali para sa akin, nagpasya akong mag-ayos sa aking kaalaman sa teorya ng laro. Nag-aalok ako sa iyo ng isang maliit na libro - isang tanyag na pagtatanghal ng mga elemento ng teorya ng laro at ilang mga solusyon matrix laro. Naglalaman ito ng halos walang ebidensya at naglalarawan ng mga pangunahing probisyon ng teorya na may mga halimbawa. Ang libro ay isinulat ng mathematician at popularizer ng agham na si Elena Sergeevna Ventzel. Maraming henerasyon ng mga inhinyero ng Sobyet ang nag-aral mula sa kanyang aklat-aralin na "Theory of Probability." Sumulat din si Elena Sergeevna ng ilang mga akdang pampanitikan sa ilalim ng pseudonym na I. Grekova.

Elena Ventzel. Mga elemento ng teorya ng laro. – M.: Fizmatgiz, 1961. – 68 p.

I-download maikling buod sa pormat o

§ 1. Paksa ng teorya ng laro. Pangunahing Konsepto

Kapag nilulutas ang isang bilang ng mga praktikal na problema (sa larangan ng ekonomiya, usaping militar, atbp.), kinakailangan na pag-aralan ang mga sitwasyon kung saan mayroong dalawa (o higit pa) na naglalabanang partido na humahabol sa magkasalungat na layunin, at ang resulta ng bawat aksyon ng isa sa ang mga partido ay nakasalalay sa kung anong paraan ng pagkilos ang pipiliin ng kaaway. Tatawagin natin ang mga ganitong sitwasyon na "mga sitwasyon ng salungatan."

Maraming mga halimbawa ng mga sitwasyon ng salungatan mula sa iba't ibang lugar ng pagsasanay ang maaaring ibigay. Ang anumang sitwasyon na lumitaw sa panahon ng mga operasyong militar ay nabibilang sa mga sitwasyon ng salungatan: bawat isa sa mga partidong nakikipaglaban ay gumagawa ng lahat ng mga hakbang na magagamit dito upang maiwasan ang kaaway na makamit ang tagumpay. Kasama rin sa mga sitwasyon ng salungatan ang mga sitwasyon na lumitaw kapag pumipili ng isang sistema ng armas, mga paraan ng paggamit nito sa labanan, at sa pangkalahatan kapag nagpaplano ng mga operasyong militar: ang bawat isa sa mga desisyon sa lugar na ito ay dapat gawin na isinasaalang-alang ang mga aksyon ng kaaway na hindi gaanong kapaki-pakinabang para sa sa amin. Ang isang bilang ng mga sitwasyon sa larangan ng ekonomiya (lalo na sa pagkakaroon ng libreng kumpetisyon) ay nabibilang sa mga sitwasyon ng salungatan; ang mga trading firm, industriyal na negosyo, atbp. ay kumikilos bilang mga partidong nakikipaglaban.

Ang pangangailangang pag-aralan ang mga ganitong sitwasyon ay nagbunga ng isang espesyal na kasangkapang pangmatematika. Ang teorya ng laro ay hindi hihigit sa isang matematikal na teorya ng mga sitwasyon ng salungatan. Ang layunin ng teorya ay upang bumuo ng mga rekomendasyon sa makatwirang kurso ng pagkilos para sa bawat isa sa mga kalaban sa panahon sitwasyon ng tunggalian. Ang bawat sitwasyon ng salungatan na direktang kinuha mula sa pagsasanay ay napakakumplikado, at ang pagsusuri nito ay kumplikado sa pagkakaroon ng maraming mga kadahilanan na nag-aambag. Upang gawing posible ang mathematical analysis ng sitwasyon, kinakailangan na mag-abstract mula sa pangalawang, incidental na mga kadahilanan at bumuo ng isang pinasimple, pormal na modelo ng sitwasyon. Ang modelong ito ay tatawagin nating "laro."

Ang laro ay naiiba sa isang tunay na sitwasyon ng salungatan dahil ito ay nilalaro ayon sa napaka-espesipikong mga panuntunan. Matagal nang ginagamit ng sangkatauhan ang gayong mga pormal na modelo ng mga sitwasyon ng salungatan na mga laro sa literal na kahulugan ng salita. Kasama sa mga halimbawa ang chess, checkers, card game, atbp. Ang lahat ng mga larong ito ay nasa kalikasan ng isang kumpetisyon, na nagpapatuloy ayon sa mga kilalang tuntunin at nagtatapos sa "tagumpay" (panalo) ng isa o ibang manlalaro.

Ang ganitong pormal na kinokontrol, artipisyal na organisadong mga laro ay kumakatawan sa pinakaangkop na materyal para sa paglalarawan at pag-master ng mga pangunahing konsepto ng teorya ng laro. Ang mga terminolohiya na hiniram mula sa pagsasanay ng mga naturang laro ay ginagamit din sa pagsusuri ng iba pang mga sitwasyon ng salungatan: ang mga partidong kasangkot sa kanila ay karaniwang tinatawag na "mga manlalaro", at ang resulta ng banggaan ay ang "panalo" ng isa sa mga partido.

Ang mga interes ng dalawa o higit pang mga kalaban ay maaaring magbanggaan sa laro; sa unang kaso ang laro ay tinatawag na "ipinares", sa pangalawa - "maramihan". Ang mga kalahok sa maraming laro ay maaaring bumuo ng mga koalisyon sa panahon ng laro - permanente o pansamantala. Sa pagkakaroon ng dalawang permanenteng koalisyon, ang maramihang laro ay nagiging isang pares na laro. Pinakamahusay praktikal na kahalagahan magkaroon ng dobleng laro; Dito ay lilimitahan natin ang ating sarili sa pagsasaalang-alang lamang ng mga ganitong laro.

Simulan natin ang ating presentasyon ng elementarya na teorya ng laro sa pamamagitan ng pagbabalangkas ng ilang pangunahing konsepto. Isasaalang-alang namin ang isang pares na laro kung saan lumahok ang dalawang manlalaro na A at B na may magkasalungat na interes. Ang ibig sabihin ng "laro" ay isang kaganapan na binubuo ng isang serye ng mga aksyon ng mga partidong A at B. Upang ang isang laro ay sumailalim sa mathematical analysis, ang mga panuntunan ng laro ay dapat na tumpak na mabalangkas. Ang "mga tuntunin ng laro" ay nangangahulugang isang sistema ng mga kundisyon na kumokontrol sa mga posibleng opsyon para sa mga aksyon ng magkabilang panig, ang dami ng impormasyon ng bawat panig tungkol sa pag-uugali ng isa, ang pagkakasunud-sunod ng mga papalit-palit na "paggalaw" (mga indibidwal na desisyon na ginawa sa panahon ng laro), pati na rin ang resulta o kinalabasan ng laro kung saan hahantong ito. isang hanay ng mga galaw. Ang resultang ito (manalo o pagkatalo) ay hindi palaging may quantitative expression, ngunit kadalasan ay posible, sa pamamagitan ng pagtatatag ng ilang sukat ng pagsukat, na ipahayag ito sa isang tiyak na numero. Halimbawa, sa isang larong chess, ang isang panalo ay maaaring may kondisyong italaga ng isang halaga ng +1, isang pagkatalo -1, isang draw 0.

Ang laro ay tinatawag na zero-sum game kung ang isang manlalaro ay nanalo sa kung ano ang natalo ng isa, i.e. ang kabuuan ng mga panalo ng magkabilang panig ay zero. Sa isang zero-sum game, ang mga interes ng mga manlalaro ay direktang sumasalungat. Dito ay isasaalang-alang lamang natin ang mga ganitong laro.

Dahil sa isang zero-sum game ang kabayaran ng isa sa mga manlalaro ay katumbas ng kabayaran ng isa na may kabaligtaran na tanda, kung gayon, malinaw naman, kapag sinusuri ang naturang laro, maaari nating isaalang-alang ang kabayaran ng isa lamang sa mga manlalaro. Hayaan itong maging, halimbawa, player A. Sa hinaharap, para sa kaginhawahan, karaniwang tatawagin natin ang side A na "kami", at side B - "ang kaaway".

Sa kasong ito, ang panig A (“kami”) ay palaging ituturing na “nagwagi”, at ang panig B (“ang kaaway”) bilang ang “talo”. Ang pormal na kondisyong ito ay malinaw na hindi nangangahulugan ng anumang tunay na kalamangan para sa unang manlalaro; madaling makita na ito ay pinalitan ng kabaligtaran nito kung ang tanda ng panalo ay baligtad.

Iisipin natin ang pag-unlad ng laro sa paglipas ng panahon bilang binubuo ng ilang sunud-sunod na yugto o "paggalaw". Sa teorya ng laro, ang paglipat ay ang pagpili ng isa sa mga opsyon na ibinigay ng mga patakaran ng laro. Ang mga galaw ay nahahati sa personal at random. Ang isang personal na paglipat ay isang malay na pagpili ng isa sa mga manlalaro ng isa sa mga posibleng galaw sa isang partikular na sitwasyon at ang pagpapatupad nito. Ang isang halimbawa ng isang personal na galaw ay alinman sa mga galaw sa isang laro ng chess. Kapag nagsasagawa ng susunod na galaw, ang manlalaro ay gumagawa ng malay-tao na pagpili ng isa sa mga opsyon na posible sa isang naibigay na pag-aayos ng mga piraso sa pisara. Ang hanay ng mga posibleng opsyon para sa bawat personal na galaw ay kinokontrol ng mga patakaran ng laro at depende sa kabuuan ng mga nakaraang galaw ng magkabilang panig.

Ang isang random na paglipat ay isang pagpipilian mula sa isang bilang ng mga posibilidad, na isinasagawa hindi sa pamamagitan ng desisyon ng manlalaro, ngunit sa pamamagitan ng ilang random na mekanismo ng pagpili (paghagis ng barya, dice, shuffling at dealing card, atbp.). Halimbawa, ang pagbibigay ng unang card sa isa sa mga kagustuhang manlalaro ay isang random na paglipat na may 32 pantay na posibleng opsyon. Para matukoy sa matematika ang isang laro, dapat tukuyin ng mga panuntunan ng laro ang probability distribution ng mga posibleng resulta para sa bawat random na paglipat.

Ang ilang mga laro ay maaaring binubuo lamang ng mga random na galaw (tinatawag na purong pagsusugal) o ng mga personal na galaw lamang (chess, checkers). Karamihan sa mga card game ay nabibilang sa mixed type games, i.e. naglalaman ng parehong random at personal na mga galaw.

Ang mga laro ay inuri hindi lamang sa likas na katangian ng mga galaw (personal, random), kundi pati na rin sa likas na katangian at dami ng impormasyong magagamit ng bawat manlalaro tungkol sa mga aksyon ng isa. Ang isang espesyal na klase ng mga laro ay ang tinatawag na "mga laro na may kumpletong impormasyon." Ang larong may kumpletong impormasyon ay isang laro kung saan alam ng bawat manlalaro, sa bawat personal na galaw, ang mga resulta ng lahat ng nakaraang galaw, parehong personal at random. Kasama sa mga halimbawa ng mga larong may kumpletong impormasyon ang chess, checkers, at ang kilalang larong "tic-tac-toe."

Karamihan sa mga larong may praktikal na kahalagahan ay hindi kabilang sa klase ng mga larong may kumpletong impormasyon, dahil ang kawalan ng katiyakan tungkol sa mga aksyon ng kalaban ay karaniwang isang mahalagang elemento ng mga sitwasyon ng labanan.

Isa sa mga pangunahing konsepto ng teorya ng laro ay ang konsepto ng "diskarte". Ang diskarte ng isang manlalaro ay isang hanay ng mga panuntunan na natatanging tumutukoy sa pagpili para sa bawat personal na galaw ng isang partikular na manlalaro, depende sa sitwasyong lalabas sa panahon ng laro. Karaniwan, ang desisyon (pagpipilian) para sa bawat personal na galaw ay ginagawa ng manlalaro sa panahon ng laro mismo, depende sa umiiral na sitwasyon. tiyak na sitwasyon. Gayunpaman, ayon sa teorya, ang bagay ay hindi magbabago kung akala natin na ang lahat ng mga desisyong ito ay ginawa ng manlalaro nang maaga. Upang gawin ito, ang manlalaro ay kailangang mag-compile nang maaga ng isang listahan ng lahat ng posibleng mga sitwasyon sa panahon ng laro at magbigay ng kanyang sariling solusyon para sa bawat isa sa kanila. Sa prinsipyo (kung hindi praktikal) posible ito para sa anumang laro. Kung tinanggap ang naturang sistema ng desisyon, nangangahulugan ito na ang manlalaro ay pumili ng isang tiyak na diskarte.

Ang manlalaro na pumili ng diskarte ay hindi na maaaring lumahok nang personal sa laro, ngunit palitan ang kanyang paglahok ng isang listahan ng mga panuntunan na ilalapat sa kanya ng ilang taong walang interes (ang hukom). Ang diskarte ay maaari ding tukuyin sa awtomatikong makina sa anyo ng isang partikular na programa. Ganito kasalukuyang nilalaro ang computer chess. Para magkaroon ng kahulugan ang konsepto ng "diskarte", dapat mayroong mga personal na galaw sa laro; Sa mga larong binubuo lamang ng mga random na galaw, walang mga diskarte.

Depende sa bilang ng mga posibleng diskarte, ang mga laro ay nahahati sa "finite" at "infinite". Ang isang laro kung saan ang bawat manlalaro ay may limitadong bilang lamang ng mga diskarte ay tinatawag na isang may hangganang laro. Isang may hangganang laro kung saan mayroon ang manlalarong A m mga diskarte, at manlalaro B - n Ang mga diskarte ay tinatawag na larong mxn.

Isaalang-alang ang laro mxn ng dalawang manlalaro A at B (“kami” at “kalaban”). Ipapahiwatig namin ang aming mga diskarte A 1 , A 2 , …, A m at ang mga diskarte ng kalaban B 1 , B 2 , …, B n . Hayaang pumili ang bawat panig ng isang tiyak na diskarte; para sa amin ito ay magiging A i, para sa kaaway B j. Kung ang laro ay binubuo lamang ng mga personal na galaw, kung gayon ang pagpili ng mga diskarte A i, B j ay natatanging tumutukoy sa kinalabasan ng laro - ang ating mga panalo. Tukuyin natin itong isang ij. Kung ang laro ay naglalaman, bilang karagdagan sa mga personal, mga random na galaw, kung gayon ang kabayaran para sa isang pares ng mga diskarte A i, B j ay isang random na halaga, depende sa mga kinalabasan ng lahat ng mga random na galaw. Sa kasong ito, ang natural na pagtatantya ng inaasahang kabayaran ay ang average na halaga nito ( inaasahang halaga). Gagamitin namin ang parehong sign upang tukuyin ang parehong panalo mismo (sa isang laro na walang random na galaw) at ang average na halaga nito (sa isang laro na may mga random na galaw).

Ipaalam sa amin ang mga halaga ng isang ij ng kabayaran (o average na kabayaran) para sa bawat pares ng mga diskarte. Ang mga halaga ay maaaring isulat sa anyo ng isang hugis-parihaba na talahanayan (matrix), ang mga hilera kung saan tumutugma sa aming mga diskarte (A i), at ang mga haligi ay tumutugma sa mga diskarte ng kalaban (B j). Ang talahanayang ito ay tinatawag na payoff matrix o simpleng game matrix. Ang matrix ng larong mxn ay ipinapakita sa Fig. 1.

kanin. 1. Matrix mxn

Sa madaling salita, tutukuyin natin ang matrix ng larong ‖a ij‖. Tingnan natin ang ilang pangunahing halimbawa ng mga laro.

Halimbawa 1. Dalawang manlalaro A at B, nang hindi tumitingin sa isa't isa, naglalagay ng barya sa mesa, mga ulo o buntot, sa kanilang paghuhusga. Kung pinili ng mga manlalaro ang magkaparehong panig (parehong may coat of arms o pareho silang may mga ulo), ang manlalaro A ay kukuha ng parehong barya; kung hindi ay kukunin sila ng manlalaro B. Kinakailangang pag-aralan ang laro at likhain ang matrix nito. Solusyon. Ang laro ay binubuo lamang ng dalawang galaw: ang aming galaw at ang galaw ng kalaban, parehong personal. Ang laro ay hindi nabibilang sa mga laro na may kumpletong impormasyon, dahil sa sandali ng paglipat ay hindi alam ng manlalaro kung ano ang ginawa ng iba. Dahil ang bawat manlalaro ay may isang personal na galaw lamang, ang diskarte ng manlalaro ay isang pagpipilian sa nag-iisang personal na hakbang na ito.

Mayroon kaming dalawang diskarte: A 1 - pumili ng isang coat of arms at A 2 - pumili ng mga buntot; Ang kaaway ay may parehong dalawang diskarte: B 1 - coat of arm at B 2 - tails. Kaya, ang larong ito ay isang 2x2 na laro. Ibibilang namin ang panalo sa isang barya bilang +1. Game Matrix:

Gamit ang halimbawa ng larong ito, gaano man ito elementarya, mauunawaan ng isa ang ilang mahahalagang ideya ng teorya ng laro. Ipagpalagay muna natin na isang beses lang nilalaro ang larong ito. Pagkatapos, malinaw naman, walang punto sa pag-uusap tungkol sa anumang "mga diskarte" ng mga manlalaro na mas matalino kaysa sa iba. Ang bawat isa sa mga manlalaro na may parehong batayan maaaring gumawa ng anumang desisyon. Gayunpaman, kapag ang laro ay paulit-ulit, ang sitwasyon ay nagbabago.

Sa katunayan, ipagpalagay natin na tayo (manlalaro A) ay pumili ng ilang diskarte para sa ating sarili (sabihin, A 1) at manatili dito. Pagkatapos, batay sa mga resulta ng mga unang hakbang, huhulaan ng kaaway ang tungkol sa aming diskarte at tutugon ito sa hindi gaanong kapaki-pakinabang na paraan para sa amin, i.e. pumili ng mga buntot. Malinaw na hindi kapaki-pakinabang para sa amin na palaging gumamit ng isang diskarte; Upang hindi maging isang talunan, kailangan natin kung minsan ay pumili ng isang amerikana, kung minsan ay isang buntot. Gayunpaman, kung papalitan natin ang mga sandata at buntot sa isang tiyak na pagkakasunud-sunod (halimbawa, sa pamamagitan ng isa), maaari ding hulaan ito ng kaaway at tumugon sa diskarteng ito sa pinakamasamang paraan para sa atin. Malinaw, ang isang maaasahang paraan upang matiyak na hindi malalaman ng kaaway ang aming diskarte ay ang pag-aayos ng pagpili sa bawat hakbang kapag kami mismo ay hindi alam ito nang maaga (maaari itong matiyak, halimbawa, sa pamamagitan ng paghahagis ng barya). Kaya, sa pamamagitan ng intuitive na pangangatwiran, nilapitan namin ang isa sa mga mahahalagang konsepto ng teorya ng laro - ang konsepto ng "halo-halong diskarte", i.e. tulad ng kapag ang "purong" na mga diskarte - sa kasong ito A 1 at A 2 - random na kahalili sa ilang mga frequency. Sa halimbawang ito, para sa mga kadahilanan ng mahusay na proporsyon, malinaw nang maaga na ang mga diskarte A 1 at A 2 ay dapat na kahalili ng parehong dalas; sa mas kumplikadong mga laro ang solusyon ay maaaring malayo sa walang kabuluhan.

Halimbawa 2. Ang mga manlalaro A at B nang sabay-sabay at independiyente sa isa't isa ay nagsusulat ng isa sa tatlong numero: 1, 2 o 3. Kung ang kabuuan ng mga nakasulat na numero ay pantay, pagkatapos ay binabayaran ni B si A ng halagang ito sa rubles; kung ito ay kakaiba, kung gayon, sa kabaligtaran, binabayaran ni A si B ng halagang ito. Kinakailangang pag-aralan ang laro at likhain ang matrix nito.

Solusyon. Ang laro ay binubuo ng dalawang liko; pareho silang personal. Tayo (A) ay may tatlong estratehiya: A 1 - write 1; A 2 - isulat ang 2; A 3 - isulat ang 3. Ang kalaban (B) ay may parehong tatlong estratehiya. Ang laro ay isang 3x3 na laro:

Malinaw, tulad ng sa nakaraang kaso, ang kaaway ay maaaring tumugon sa anumang diskarte na pipiliin natin sa paraang pinakamasama para sa atin. Sa katunayan, kung pipiliin natin, halimbawa, ang diskarte A 1, ang kaaway ay palaging tutugon dito gamit ang diskarte B 2; sa diskarte A 2 - diskarte B 3; sa diskarte A 3 - diskarte B 2; kaya, anumang pagpili ng isang tiyak na diskarte ay hindi maiiwasang magdadala sa atin sa pagkatalo (gayunpaman, hindi natin dapat kalimutan na ang kaaway ay nasa parehong pagkabalisa). Ang solusyon sa larong ito (ibig sabihin, ang hanay ng mga pinakakumikitang diskarte ng parehong manlalaro) ay ibibigay sa § 5.

Halimbawa 3. Mayroon kaming tatlong uri ng mga armas na magagamit namin: A 1, A 2, A 3; Ang kaaway ay may tatlong uri ng sasakyang panghimpapawid: B 1, B 2, B 3. Ang aming gawain ay tumama sa eroplano; Ang gawain ng kalaban ay panatilihin siyang hindi matalo. Kapag gumagamit ng mga armas A 1, ang sasakyang panghimpapawid B 1, B 2, B 3 ay tinamaan ayon sa pagkakabanggit na may probabilidad na 0.9, 0.4 at 0.2; na may armament A 2 - na may posibilidad na 0.3, 0.6 at 0.8; na may armament A 3 - na may probabilidad na 0.5, 0.7 at 0.2. Kinakailangang bumalangkas ng sitwasyon sa mga tuntunin ng teorya ng laro.

Solusyon. Ang sitwasyon ay maaaring ituring bilang isang 3x3 na laro na may dalawang personal na galaw at isang random na isa. Ang aming personal na galaw ay ang pagpili ng uri ng armas; Ang personal na galaw ng kalaban ay ang pagpili ng sasakyang panghimpapawid na lalahok sa labanan. Random na paglipat - paggamit ng mga armas; ang hakbang na ito ay maaaring magresulta o hindi sa pagkatalo ng sasakyang panghimpapawid. Ang aming kabayaran ay isa kung ang eroplano ay tumama, at katumbas ng zero kung hindi. Ang aming mga diskarte ay tatlong mga pagpipilian sa armas; mga diskarte ng kaaway - tatlong mga pagpipilian sa sasakyang panghimpapawid. Ang average na kabayaran para sa bawat ibinigay na pares ng mga diskarte ay walang iba kundi ang posibilidad na matamaan ang isang partikular na sasakyang panghimpapawid gamit ang isang ibinigay na armas. Game Matrix:

Ang layunin ng teorya ng laro ay bumuo ng mga rekomendasyon para sa makatwirang pag-uugali ng mga manlalaro sa mga sitwasyon ng salungatan, i.e. pagtukoy ng "pinakamainam na diskarte" para sa bawat isa sa kanila. Ang pinakamainam na diskarte ng isang manlalaro sa teorya ng laro ay isang diskarte na, kapag ang laro ay inulit ng maraming beses, ay nagbibigay sa ibinigay na manlalaro ng maximum na posibleng average na panalo (o ang pinakamababang posibleng average na pagkatalo). Kapag pumipili ng diskarteng ito, ang batayan ng pangangatwiran ay ang pag-aakala na ang kaaway ay hindi bababa sa matalino tulad ng ating sarili at ginagawa ang lahat upang pigilan tayo sa pagkamit ng ating layunin.

Sa teorya ng laro, ang lahat ng mga rekomendasyon ay binuo batay sa mga prinsipyong ito; samakatuwid, hindi nito isinasaalang-alang ang mga elemento ng panganib na hindi maiiwasang naroroon sa bawat tunay na diskarte, pati na rin ang mga posibleng maling kalkulasyon at pagkakamali ng bawat manlalaro. Ang teorya ng laro, tulad ng anumang modelo ng matematika ng isang kumplikadong kababalaghan, ay may mga limitasyon nito. Ang pinakamahalaga sa kanila ay ang mga panalo ay artipisyal na nabawasan sa isa isahan. Sa karamihan ng mga praktikal na sitwasyon ng salungatan, kapag bumubuo ng isang makatwirang diskarte, kinakailangang isaalang-alang hindi isa, ngunit ilang mga numerical na parameter - pamantayan para sa tagumpay ng kaganapan. Ang isang diskarte na pinakamainam ayon sa isang pamantayan ay hindi kinakailangang maging pinakamainam ayon sa iba. Gayunpaman, ang pagkakaroon ng kamalayan sa mga limitasyong ito at samakatuwid ay hindi bulag na sumusunod sa mga rekomendasyong nakuha sa pamamagitan ng mga pamamaraan ng laro, maaari pa ring matalinong gamitin ang matematikal na kagamitan ng teorya ng laro upang bumuo, kung hindi eksaktong isang "pinakamainam", at hindi bababa sa isang "katanggap-tanggap" na diskarte .

§ 2. Mas mababa at mas mataas na presyo ng laro. Prinsipyo ng Minimax

Isaalang-alang ang larong mxn na may matrix tulad ng sa Fig. 1. Ipapahiwatig namin ang bilang ng aming diskarte na may titik i; ang letrang j ay ang bilang ng diskarte ng kalaban. Itakda natin ang ating sarili ng isang gawain: upang matukoy ang ating pinakamainam na diskarte. Suriin natin ang bawat isa sa ating mga diskarte nang sunud-sunod, simula sa A 1 .

Kapag pumipili ng isang diskarte A i, dapat tayong laging umasa sa katotohanan na ang kaaway ay tutugon dito gamit ang isa sa mga estratehiya B j kung saan ang ating kabayaran ay minimal. Tukuyin natin itong panalong halaga, i.e. ang pinakamababa sa mga numerong a ij in i ika linya. Tukuyin natin itong α i:

Dito ang sign min (minimum sa j) ay nagpapahiwatig ng pinakamababa sa mga halaga ng parameter na ito para sa lahat ng posibleng j. Isulat natin ang mga bilang α i ; sa tabi ng matrix sa kanan bilang karagdagang column:

Kapag pumipili ng anumang diskarte A i , dapat tayong umasa sa katotohanan na bilang resulta ng mga makatwirang aksyon ng kaaway hindi tayo mananalo ng higit sa α i . Naturally, ang pagkilos ng pinaka-maingat at pagbibilang sa pinaka-makatwirang kalaban (i.e., pag-iwas sa anumang panganib), dapat nating piliin ang diskarte kung saan ang bilang na α i ang pinakamataas. Tukuyin natin ang pinakamataas na halagang ito α:

o, isinasaalang-alang ang formula (2.1),

Ang halagang α ay tinatawag na mas mababang presyo ng laro, kung hindi man ay ang maximin payoff o simpleng maximin. Ang bilang na α ay nasa isang tiyak na hilera ng matrix; ang diskarte ng manlalaro A na tumutugma sa linyang ito ay tinatawag na diskarte ng maximin. Malinaw, kung susundin natin ang diskarte ng maximin, ginagarantiyahan tayo ng isang panalo, hindi bababa sa hindi bababa sa α, anuman ang pag-uugali ng kaaway. Samakatuwid, ang halagang α ay tinatawag na "mas mababang presyo ng laro." Ito ang garantisadong minimum na maibibigay natin sa ating sarili sa pamamagitan ng pagsunod sa pinakamaingat na diskarte ("reinsurance").

Malinaw, ang isang katulad na pangangatwiran ay maaaring isagawa para sa kalaban B. Dahil ang kalaban ay interesado sa pagliit ng ating pakinabang, dapat niyang suriin ang bawat isa sa kanyang mga estratehiya mula sa punto ng view ng pinakamataas na pakinabang para sa diskarteng ito. Samakatuwid, sa ilalim ng matrix isusulat namin ang pinakamataas na halaga para sa bawat haligi:

at hanapin ang minimum ng β j:

Ang halagang β ay tinatawag na pinakamataas na presyo ng laro, kung hindi man ay kilala bilang "minimax". Ang diskarte ng kalaban na naaayon sa minimax payoff ay tinatawag na kanyang "minimax strategy." Sa pamamagitan ng pagsunod sa kanyang pinaka-maingat na diskarte sa minimax, ginagarantiyahan ng kaaway ang kanyang sarili sa mga sumusunod: anuman ang gawin natin laban sa kanya, sa anumang kaso ay mawawalan siya ng halagang hindi hihigit sa β. Ang prinsipyo ng pag-iingat, na nagdidikta na ang mga manlalaro ay pumili ng naaangkop na mga diskarte (maximin at minimax), ay madalas na tinatawag na "minimax na prinsipyo" sa teorya ng laro at mga aplikasyon nito. Ang pinaka-maingat na maximin at minimax na mga diskarte ng mga manlalaro ay tinutukoy kung minsan bilang "minimax na mga diskarte."

Bilang mga halimbawa, tinutukoy namin ang mas mababa at mataas na presyo ng laro at mga diskarte sa minimax para sa mga halimbawa 1, 2 at 3 ng § 1.

Halimbawa 1. Sa Halimbawa 1 § 1, isang laro ang ibinigay na may sumusunod na matrix:

Dahil ang mga halaga α i at β j ay pare-pareho at katumbas ng –1 at +1, ayon sa pagkakabanggit, ang mas mababa at mataas na presyo ng laro ay katumbas din ng –1 at +1: α = –1, β = +1 . Anumang diskarte ng player A ay ang kanyang maximin na diskarte, at anumang diskarte ng player B ay ang kanyang minimax na diskarte. Ang konklusyon ay walang halaga: sa pamamagitan ng pananatili sa alinman sa kanyang mga diskarte, ang manlalaro A ay magagarantiya na siya ay matatalo ng hindi hihigit sa 1; Ang manlalaro B ay magagarantiya ng pareho.

Halimbawa 2. Sa Halimbawa 2 § 1 isang laro na may matrix ay ibinigay:

Mababang presyo ng laro α = –3; ang pinakamataas na presyo ng laro ay β = 4. Ang aming maximin na diskarte ay A 1 ; Sa pamamagitan ng sistematikong paglalapat nito, matatag nating asahan na manalo ng hindi bababa sa -3 (hindi hihigit sa 3 matalo). Ang minimax na diskarte ng kaaway ay alinman sa mga estratehiya B 1 at B 2; sa pamamagitan ng sistematikong paglalapat ng mga ito, siya, sa anumang kaso, ay magagarantiya na siya ay mawawalan ng hindi hihigit sa 4. Kung tayo ay lumihis sa ating maximin na diskarte (halimbawa, pumili ng diskarte A 2), ang kaaway ay maaaring "parusahan" para dito sa pamamagitan ng paglalapat diskarte B 3 at ang pagbabawas ng aming mga panalo ay -5; Gayundin, ang pag-atras ng kalaban mula sa kanyang minimax na diskarte ay maaaring tumaas ang kanyang pagkatalo sa 6.

Halimbawa 3. Sa Halimbawa 3 ng § 1 isang laro na may matrix ay ibinigay:

Mababang presyo ng laro α = 0.3; ang pinakamataas na presyo ng laro ay β = 0.7. Ang aming pinaka-maingat (maximin) na diskarte ay A 2 ; Sa pamamagitan ng paggamit ng mga armas na A2, ginagarantiya namin na tatamaan namin ang sasakyang panghimpapawid sa karaniwan sa hindi bababa sa 0.3 ng lahat ng kaso. Ang pinaka-maingat (minimax) na diskarte ng kaaway ay B 2 ; Sa paggamit ng sasakyang panghimpapawid na ito, makatitiyak ang kaaway na tatamaan ito nang hindi hihigit sa 0.7 ng lahat ng kaso.

Naka-on huling halimbawa Maginhawang ipakita ang isang mahalagang katangian ng mga diskarte sa minimax - ang kanilang kawalang-tatag. Gamitin natin ang ating pinaka-maingat (maximin) na diskarte A 2 , at ang kaaway ay gumamit ng kanyang pinaka-maingat (minimax) na diskarte B 2 . Hangga't ang parehong kalaban ay sumusunod sa mga estratehiyang ito, ang average na kabayaran ay 0.6; ito ay higit pa sa mas mababang presyo, ngunit mas mababa kaysa sa mataas na presyo ng laro. Ngayon ipagpalagay natin na alam ng kaaway na gumagamit tayo ng diskarte A 2 ; agad siyang tutugon ng diskarte B 1 at babawasan ang mga panalo sa 0.3. Sa turn, mayroon kaming magandang sagot sa diskarte B 1: diskarte A 1, na nagbibigay sa amin ng kabayarang 0.9, atbp.

Kaya, ang sitwasyon kung saan ginagamit ng parehong manlalaro ang kanilang mga diskarte sa minimax ay hindi matatag at maaaring lumabag sa natanggap na impormasyon tungkol sa diskarte ng kabilang panig. Gayunpaman, mayroong ilang mga laro kung saan ang mga diskarte sa minimax ay matatag. Ito ang mga laro kung saan ang mas mababang presyo ay katumbas ng itaas: α = β. Kung ang mas mababang presyo ng laro ay katumbas ng mas mataas na presyo, kung gayon ang kanilang pangkalahatang kahulugan ay tinatawag na netong presyo ng laro (kung minsan ay presyo lang ng laro), ito ay ating ituturo sa pamamagitan ng titik ν.

Tingnan natin ang isang halimbawa. Hayaang ibigay ng matrix ang larong 4x4:

Hanapin natin ang mas mababang presyo ng laro: α = 0.6. Hanapin natin ang pinakamataas na presyo ng laro: β = 0.6. Sila ay naging pareho, samakatuwid, ang laro ay may netong presyo na katumbas ng α = β = ν = 0.6. Ang Element 0.6, na naka-highlight sa payment matrix, ay parehong pinakamababa sa row nito at maximum sa column nito. Sa geometry, ang isang punto sa ibabaw na may katulad na katangian (sabay-sabay na minimum sa isang coordinate at maximum sa isa pa) ay tinatawag na saddle point; sa pamamagitan ng pagkakatulad, ang terminong ito ay ginagamit sa teorya ng laro. Ang isang elemento ng matrix na may ganitong katangian ay tinatawag na saddle point ng matrix, at ang laro ay sinasabing may saddle point.

Ang saddle point ay tumutugma sa isang pares ng minimax na mga diskarte (sa halimbawang ito, A 3 at B 2). Ang mga estratehiyang ito ay tinatawag na pinakamainam, at ang kanilang kumbinasyon ay tinatawag na solusyon sa laro. Ang solusyon sa laro ay may mga sumusunod kahanga-hangang ari-arian. Kung ang isa sa mga manlalaro (halimbawa, A) ay sumunod sa kanyang pinakamainam na diskarte, at ang isa pang manlalaro (B) ay lumihis mula sa kanyang pinakamainam na diskarte sa anumang paraan, kung gayon para sa manlalaro na gumawa ng paglihis, hindi ito maaaring kumita; tulad ng isang paglihis ng manlalaro B maaaring pinakamahusay na senaryo ng kaso iwanan ang mga panalo na hindi nagbabago, at sa pinakamasamang kaso, dagdagan ito. Sa kabaligtaran, kung ang B ay sumunod sa kanyang pinakamainam na diskarte, at ang A ay lumihis mula sa kanya, kung gayon hindi ito maaaring maging kapaki-pakinabang para kay A.

Ang pahayag na ito ay madaling ma-verify gamit ang halimbawa ng larong isinasaalang-alang na may saddle point. Nakikita namin na sa kaso ng isang laro na may saddle point, ang mga diskarte sa minimax ay may isang uri ng "katatagan": kung ang isang panig ay sumunod sa kanyang minimax na diskarte, kung gayon maaari lamang itong maging disadvantageous para sa iba na lumihis mula sa sarili nito. Tandaan na sa kasong ito, ang kaalaman ng sinumang manlalaro na pinili ng kalaban ang kanyang pinakamainam na diskarte ay hindi makakapagbago sa sariling pag-uugali ng manlalaro: kung ayaw niyang kumilos laban sa kanyang sariling mga interes, dapat siyang sumunod sa kanyang pinakamainam na diskarte. Ang isang pares ng pinakamainam na diskarte sa laro ng saddle point ay parang "posisyon ng balanse": anumang paglihis mula sa pinakamainam na diskarte ay humahantong sa hindi kanais-nais na mga kahihinatnan para sa lumilihis na manlalaro, na pumipilit sa kanya na bumalik sa kanyang orihinal na posisyon.

Kaya, para sa bawat laro na may saddle point, mayroong isang solusyon na tumutukoy sa isang pares ng pinakamainam na diskarte para sa magkabilang panig, na naiiba sa mga sumusunod na katangian.

1) Kung ang parehong partido ay sumunod sa kanilang pinakamainam na mga diskarte, kung gayon ang average na kabayaran ay katumbas ng netong presyo ng larong ν, na ito rin ang mas mababa at mataas na presyo nito.

2) Kung ang isa sa mga partido ay sumunod sa pinakamainam na diskarte nito, at ang iba ay lumihis mula sa sarili nito, kung gayon ang lumilihis na partido ay maaari lamang matalo at sa anumang kaso ay hindi maaaring tumaas ang mga panalo nito.

Ang klase ng mga laro na may saddle point ay may malaking interes mula sa parehong teoretikal at praktikal na pananaw. Sa teorya ng laro, napatunayan na, sa partikular, ang bawat laro na may kumpletong impormasyon ay may saddle point, at, samakatuwid, ang bawat naturang laro ay may solusyon, i.e. mayroong isang pares ng pinakamainam na diskarte para sa magkabilang panig na nagbibigay ng average na kabayaran na katumbas ng halaga ng laro. Kung ang isang laro na may kumpletong impormasyon ay binubuo lamang ng mga personal na galaw, kung gayon kapag ang bawat panig ay inilapat ang pinakamainam na diskarte nito, dapat itong palaging magtatapos sa isang mahusay na tinukoy na resulta, ibig sabihin, isang panalo na eksaktong katumbas ng halaga ng laro.

Bilang isang halimbawa ng isang laro na may kumpletong impormasyon, ibinibigay namin ang kilalang laro ng paglalagay ng mga barya sa isang round table. Dalawang manlalaro ang salit-salit na naglalagay ng magkaparehong barya sa round table, sa bawat oras na pumipili ng arbitrary na posisyon para sa gitna ng barya; hindi pinapayagan ang mutual covering ng mga barya. Ang manlalaro na naglagay ng huling barya ay mananalo (kapag walang natitira para sa iba). Malinaw, ang kinalabasan ng larong ito ay palaging paunang natukoy, at mayroong isang mahusay na tinukoy na diskarte na nagsisiguro ng isang tiyak na panalo para sa manlalaro na unang naglalagay ng barya. Ibig sabihin, dapat niyang ilagay ang barya sa gitna ng talahanayan sa unang pagkakataon, at pagkatapos ay tumugon sa bawat galaw ng kalaban na may simetriko na galaw. Sa kasong ito, ang pangalawang manlalaro ay maaaring kumilos ayon sa gusto niya nang hindi binabago ang paunang natukoy na resulta ng laro. Samakatuwid, ang larong ito ay may katuturan lamang para sa mga manlalaro na hindi alam ang pinakamainam na diskarte. Ang sitwasyon ay katulad sa chess at iba pang mga laro na may kumpletong impormasyon; alinman sa mga larong ito ay may saddle point at isang solusyon na nagpapahiwatig sa bawat manlalaro ng kanyang pinakamainam na diskarte; ang solusyon sa larong chess ay hindi lamang natagpuan dahil ang bilang ng mga kumbinasyon ng mga posibleng galaw sa chess ay masyadong malaki para ito ay posible na makabuo ng isang payoff matrix at makahanap ng saddle point dito.

§ 3. Dalisay at pinaghalong estratehiya. Paglutas ng pinaghalong diskarte sa laro

Sa mga may hangganang laro na may praktikal na kahalagahan, ang mga laro na may saddle point ay medyo bihira; ang isang mas karaniwang kaso ay kapag ang mas mababa at mataas na presyo ng laro ay magkaiba. Pag-aralan ang mga matrice ng naturang mga laro, dumating kami sa konklusyon na kung ang bawat manlalaro ay bibigyan ng pagpili ng isang solong diskarte, kung gayon, umaasa sa isang makatwirang kumikilos na kalaban, ang pagpipiliang ito ay dapat na matukoy ng prinsipyo ng minimax. Sa pamamagitan ng pagsunod sa aming maximin na diskarte, tiyak na ginagarantiyahan namin ang aming sarili na panalo na katumbas ng mas mababang presyo ng larong α, anuman ang ugali ng kalaban. Isang natural na tanong ang bumangon: posible bang magarantiya ang isang average na kabayaran na mas malaki kaysa sa α kung gumagamit ka ng hindi lamang isang "purong" diskarte, ngunit random na kahalili ng ilang mga diskarte? Ang ganitong pinagsamang mga estratehiya, na binubuo ng paggamit ng ilang purong estratehiya, na nagpapalit-palit random na batas na may tiyak na frequency ratio ay tinatawag na mixed strategies sa game theory.

Malinaw, ang bawat purong diskarte ay isang espesyal na kaso ng isang halo-halong isa, kung saan ang lahat ng mga diskarte maliban sa isa ay inilapat na may mga zero na frequency, at ang isang ito ay may dalas na 1. Lumalabas na, gamit hindi lamang ang dalisay, kundi pati na rin ang mga pinaghalong diskarte, ito ay posibleng makuha para sa bawat may hangganang desisyon sa laro, i.e. isang pares ng (pangkalahatang halo-halong) mga diskarte na kapag ginamit ng dalawang manlalaro ang mga ito, ang kabayaran ay magiging katumbas ng halaga ng laro, at sa anumang isang panig na paglihis mula sa pinakamainam na diskarte, ang kabayaran ay maaari lamang magbago sa direksyon na hindi pabor para sa ang lihis.

Ang nakasaad na pahayag ay bumubuo sa nilalaman ng tinatawag na pangunahing teorama ng teorya ng laro. Ang teorama na ito ay unang napatunayan ni von Neumann noong 1928. Ang mga kilalang patunay ng teorama ay medyo kumplikado; Samakatuwid, ibibigay lamang natin ang pagbabalangkas nito.

Ang bawat larong may hangganan ay may kahit isang solusyon (maaaring nasa larangan ng magkahalong diskarte).

Ang kabayaran na nagreresulta mula sa desisyon ay tinatawag na halaga ng laro. Mula sa pangunahing teorama ito ay sumusunod na ang bawat may hangganan na laro ay may presyo. Malinaw, ang presyo ng larong ν ay palaging nasa pagitan ng mas mababang presyo ng larong α at ng mataas na presyo ng larong β:

(3.1) α ≤ ν ≤ β

Sa katunayan, ang α ay ang pinakamataas na garantisadong pakinabang na matitiyak natin para sa ating sarili gamit lamang ang ating mga purong estratehiya. Dahil ang mga pinaghalong estratehiya ay kinabibilangan, bilang isang espesyal na kaso, ang lahat ng mga purong estratehiya, kung gayon sa pamamagitan ng pagpapahintulot, bilang karagdagan sa mga dalisay, mga pinaghalong estratehiya, kami, sa anumang kaso, ay hindi nagpapalala sa aming mga kakayahan; samakatuwid, ν ≥ α. Katulad nito, kung isasaalang-alang ang mga kakayahan ng kaaway, ipapakita namin na ang ν ≤ β, na nagpapahiwatig ng hindi pagkakapantay-pantay (3.1) na napatunayan.

Ipakilala natin ang isang espesyal na notasyon para sa magkahalong mga diskarte. Kung, halimbawa, ang aming pinaghalong diskarte ay binubuo ng paggamit ng mga estratehiya A 1, A 2, A 3 na may mga frequency na p 1, p 2, p 3, at p 1 + p 2 + p 3 = 1, tutukuyin namin ang diskarteng ito.

Katulad nito, tutukuyin natin ang magkahalong diskarte ng kaaway:

kung saan ang q 1, q 2, q 3 ay ang mga frequency kung saan pinaghalo ang mga estratehiya B 1, B 2, B 3; q 1 + q 2 + q 3 = 1.

Ipagpalagay natin na nakahanap tayo ng solusyon sa larong binubuo ng dalawang pinakamainam na pinaghalong estratehiya S A *, S B *. Sa pangkalahatan, hindi lahat ng purong diskarte na available sa isang partikular na manlalaro ay kasama sa kanyang pinakamainam na pinaghalong diskarte, ngunit ilan lamang. Tatawagin namin ang mga estratehiyang kasama sa pinakamainam na pinaghalong diskarte ng isang manlalaro na kanyang "kapaki-pakinabang" na mga diskarte. Lumalabas na ang solusyon sa laro ay may isa pang kahanga-hangang pag-aari: kung ang isa sa mga manlalaro ay nananatili sa kanyang pinakamainam na pinaghalong diskarte S A * (S B *), kung gayon ang kabayaran ay nananatiling hindi nagbabago at katumbas ng halaga ng laro ν, anuman ang ginagawa ng ibang manlalaro, maliban kung lumampas siya sa mga "kapaki-pakinabang" na diskarte nito. Halimbawa, maaari niyang gamitin ang alinman sa kanyang "kapaki-pakinabang" na mga diskarte sa purong anyo, at maaari ding paghaluin ang mga ito sa anumang sukat.

§ 4. Mga pamamaraan sa elementarya para sa paglutas ng mga laro. Mga Laro 2x2 at 2xn

Kung ang larong mxn ay walang saddle point, ang paghahanap ng solusyon sa pangkalahatan ay medyo mahirap na gawain, lalo na para sa malalaking m at n. Minsan ang gawaing ito ay maaaring gawing simple kung babawasan mo muna ang bilang ng mga diskarte sa pamamagitan ng pagtanggal ng ilang hindi kailangan. Ang mga sobrang estratehiya ay a) duplikatibo at b) halatang hindi kumikita. Isaalang-alang, halimbawa, ang isang matrix na laro:

Madaling i-verify na ang diskarte A 3 ay eksaktong umuulit ("mga duplicate") na diskarte A 1, kaya ang alinman sa dalawang diskarte na ito ay maaaring alisin. Susunod, sa paghahambing ng mga string A 1 at A 2, makikita natin na ang bawat elemento ng string A 2 ay mas mababa (o katumbas) sa katumbas na elemento ng string A 1. Malinaw, hindi tayo dapat gumamit ng diskarte A2; ito ay malinaw na hindi kumikita. Sa pamamagitan ng pagtawid sa A 3 at A 2, dinadala namin ang matrix sa isang mas simpleng anyo. Susunod, tandaan namin na ang diskarte B 3 ay malinaw na hindi kumikita para sa kaaway; Sa pamamagitan ng pagtawid nito, dinadala namin ang matrix sa huling anyo nito:

Kaya, ang 4x4 na laro ay nabawasan sa isang 2x3 na laro sa pamamagitan ng pag-aalis ng mga duplicate at halatang hindi kumikitang mga diskarte.

Ang pamamaraan para sa pag-aalis ng mga duplicate at halatang hindi kumikitang mga diskarte ay dapat palaging mauna sa solusyon ng laro. Ang pinakasimpleng mga kaso ng mga larong may hangganan, na palaging malulutas gamit ang mga elementaryang pamamaraan, ay mga larong 2x2 at 2xn.

Isaalang-alang ang isang 2x2 na laro na may matrix:

Dalawang kaso ang maaaring mangyari dito: 1) ang laro ay may saddle point; 2) ang laro ay walang saddle point. Sa unang kaso, ang solusyon ay halata: ito ay isang pares ng mga diskarte na nagsasalubong sa isang saddle point. Tandaan natin sa paraan na sa isang 2x2 na laro ang pagkakaroon ng saddle point ay palaging tumutugma sa pagkakaroon ng malinaw na hindi kapaki-pakinabang na mga diskarte na dapat alisin sa panahon ng paunang pagsusuri.

Hayaang walang saddle point at, samakatuwid, ang mas mababang presyo ng laro ay hindi katumbas ng itaas: α ≠ β. Kailangan nating hanapin ang pinakamainam na pinaghalong diskarte para sa player A:

Ito ay nakikilala sa pamamagitan ng pag-aari na, anuman ang mga aksyon ng kalaban (maliban kung lumampas siya sa mga limitasyon ng kanyang "kapaki-pakinabang" na mga diskarte), ang kabayaran ay magiging katumbas ng halaga ng laro ν. Sa isang 2x2 na laro, parehong "kapaki-pakinabang" ang mga diskarte ng kalaban - kung hindi, ang laro ay magkakaroon ng purong solusyon sa diskarte (saddle point). Nangangahulugan ito na kung susundin natin ang ating pinakamainam na diskarte (4.1), maaaring gamitin ng kalaban ang alinman sa kanyang mga purong diskarte B 1, B 2 nang hindi binabago ang average na kabayaran ν. Mula dito mayroon kaming dalawang equation:

mula sa kung saan, isinasaalang-alang na ang p 1 + p 2 = 1, nakuha namin ang:

Nahanap namin ang presyo ng laro ν sa pamamagitan ng pagpapalit ng mga halaga p 1, p 2 sa alinman sa mga equation (4.2).

Kung ang presyo ng laro ay kilala, pagkatapos ay upang matukoy ang pinakamainam na diskarte ng kalaban

Ang isang equation ay sapat, halimbawa:

kung saan, isinasaalang-alang na q 1 + q 2 = 1, mayroon tayong:

Halimbawa 1. Hanapin natin ang solusyon sa larong 2×2 na isinasaalang-alang sa Halimbawa 1 ng § 1 na may matrix:

Ang laro ay walang saddle point (α = –1; β = +1), at, samakatuwid, ang solusyon ay dapat na nasa lugar ng pinaghalong mga diskarte:

Kailangan nating hanapin ang p 1, p 2, q 1 at q 2. Para sa p 1 mayroon kaming equation

1*p 1 + (–1)(1 – p 1) = (–1)p 1 + 1(1 – p 1)

kung saan p 1 = 1/2, p 2 = 1/2.

Parehong nakikita natin ang: q 1 = 1/2, q 2 = 1/2, ν = 0.

Samakatuwid, ang pinakamainam na diskarte para sa bawat manlalaro ay ang random na paghalili sa pagitan ng kanyang dalawang purong diskarte, gamit ang bawat isa nang pantay-pantay; sa kasong ito ang average na pakinabang ay magiging zero.

Ang konklusyon ay sapat na malinaw nang maaga. Sa susunod na halimbawa ay titingnan natin ang higit pa mapaghamong laro, ang solusyon nito ay hindi masyadong halata. Ang halimbawa ay isang panimulang halimbawa ng mga laro na kilala bilang "panlilinlang" o "panlilinlang" na mga laro. Sa pagsasagawa, sa mga sitwasyon ng salungatan, ang iba't ibang paraan ng panlilinlang sa kaaway ay kadalasang ginagamit (disinformation, paglalagay ng mga maling target, atbp.). Ang halimbawa, sa kabila ng pagiging simple nito, ay lubos na nakapagtuturo.

Halimbawa 2. Ang laro ay ang mga sumusunod. Mayroong dalawang baraha: isang alas at dalawa. Ang Manlalaro A ay gumuhit ng isa nang random; Hindi nakita ni B kung aling card ang inilabas niya. Kung naglabas si A ng isang ace, idineklara niya: "Mayroon akong isang ace," at humihingi ng 1 ruble mula sa kanyang kalaban. Kung kumuha si A ng deuce, maaari niyang alinman sa A 1) sabihin ang "Mayroon akong alas" at humingi ng 1 ruble mula sa kalaban, o A 2) aminin na mayroon siyang deuce at bayaran ang kalaban ng 1 ruble.

Ang kaaway, kung siya ay boluntaryong binayaran ng 1 ruble, maaari lamang itong tanggapin. Kung hihilingin siya ng 1 ruble, maaari niyang B 1) paniwalaan ang manlalaro A na mayroon siyang alas at bigyan siya ng 1 ruble, o B 2) humingi ng tseke upang matiyak kung totoo ang pahayag ni A. Kung ang resulta ay After checking, may alas pala talaga si A, dapat magbayad si B ng 2 rubles. Kung lumalabas na si A ay nanloloko at may deuce, binabayaran ng player A ang player B ng 2 rubles. Kinakailangang pag-aralan ang laro at hanapin ang pinakamainam na diskarte para sa bawat manlalaro.

Solusyon. Ang laro ay may medyo kumplikadong istraktura; Binubuo ito ng isang mandatoryong random na paglipat - pagpili ng player A ng isa sa dalawang card - at dalawang personal na galaw, na, gayunpaman, ay hindi kinakailangang isagawa. Sa katunayan, kung kumuha si A ng isang alas, kung gayon hindi siya gagawa ng anumang personal na paglipat: binibigyan lamang siya ng isang pagkakataon - upang humingi ng 1 ruble, na ginagawa niya. Sa kasong ito, ang personal na paglipat - maniwala o hindi maniwala (ibig sabihin, magbayad o hindi magbayad ng 1 ruble) - ay ibinibigay sa manlalaro B. Kung nakatanggap si A ng dalawa bilang resulta ng unang random na paglipat, pagkatapos ay bibigyan siya ng isang personal na paglipat : magbayad ng 1 ruble o subukang dayain ang kaaway at humingi ng 1 ruble (sa madaling salita: "huwag manlinlang" o "manlinlang"). Kung pipiliin ni A ang una, ang B ay maaari lamang tumanggap ng 1 ruble; kung pinili ni A ang pangalawa, ang manlalaro B ay bibigyan ng personal na pagpipilian: maniwala o hindi maniwala sa A (ibig sabihin, magbayad ng A 1 ruble o humiling ng pag-verify).

Ang mga diskarte ng bawat manlalaro ay mga panuntunan na nagpapahiwatig kung ano ang dapat gawin ng isang manlalaro kapag binigyan ng personal na pagkakataon. Malinaw, ang A ay may dalawang diskarte lamang: A 1 - para manlinlang, A 2 - hindi para manlinlang. Mayroon ding dalawang estratehiya ang B: B 1 - maniwala, B 2 - huwag maniwala. Bumuo tayo ng isang game matrix. Upang gawin ito, kinakalkula namin ang average na panalo para sa bawat kumbinasyon ng mga diskarte.

1. A 1 B 1 (Nagdaraya si A, naniniwala si B). Kung nakatanggap si A ng ace (ang probabilidad nito ay ½), hindi siya bibigyan ng personal na paglipat; humihingi siya ng 1 ruble, at naniniwala sa kanya ang player B; Ang kabayaran ni A sa rubles ay 1. Kung nakatanggap si A ng deuce (ang posibilidad ng ito rin ay ½), nanloloko siya ayon sa kanyang diskarte at humihingi ng 1 ruble; Naniniwala si B at nagbabayad; ang panalong A ay katumbas din ng 1. Average na panalo: a 11 = ½*1 + ½*1 = 1.

2. A 1 B 2 (Nagdaraya si A, hindi naniniwala si B). Kung makakuha ng alas si A, wala siyang personal na galaw; hinihingi niya ang 1 ruble; Si B, ayon sa kanyang diskarte, ay hindi naniniwala dito at, bilang resulta ng tseke, nagbabayad ng 2 rubles (ang kabayaran ni A ay +2). Kung nakatanggap si A ng masamang marka, siya, ayon sa kanyang diskarte, ay humihingi ng 1 ruble; Sa, ayon sa kanyang sarili, hindi siya naniniwala; bilang resulta, nagbabayad si A ng 2 rubles (ang kabayaran ni A ay –2). Ang average na panalo ay: a 12 = ½*(+2) + ½*(–2) = 0.

3. A 2 B 1 (Hindi nanlinlang si A, naniniwala si B). Kung kumuha si A ng isang alas, humihingi siya ng 1 ruble; Nagbabayad si B ayon sa kanyang diskarte; Ang kabayaran ni A ay +1. Kung kumuha si A ng isang deuce, ayon sa kanyang diskarte ay nagbabayad siya ng 1 ruble; Maaari lamang tanggapin ni B (ang kabayaran ni A ay –1). Ang average na panalo ay: a 21 = ½*(+1) + ½*(–1) = 0.

4. A 2 B 2 (Hindi nanlinlang si A, hindi naniniwala si B). Kung kumuha si A ng isang alas, humihingi siya ng 1 ruble; Ang mga tseke ng B at bilang resulta ng tseke ay nagbabayad ng 2 rubles (ang mga panalo ay +2). Kung kumuha si A ng isang deuce, magbabayad siya ng 1 ruble; Ang natitira ay tanggapin (ang kabayaran ay 1). Ang average na panalo ay: a 22 = ½*(+2) + ½*(–1) = ½.

Binubuo namin ang matrix ng laro:

Ang matrix ay walang saddle point. Ang mas mababang presyo ng laro ay α = 0, ang pinakamataas na presyo ng laro ay β = ½. Maghanap tayo ng solusyon sa laro sa larangan ng pinaghalong estratehiya. Sa paglalapat ng formula (4.3), nakukuha natin ang:

mga. Dapat gamitin ng Manlalaro A ang kanyang unang diskarte (cheat) sa isang-katlo ng lahat ng mga kaso, at ang kanyang pangalawa (huwag mandaya) sa dalawang-katlo ng lahat ng mga kaso. Sa kasong ito, mananalo siya sa average sa presyo ng laro ν = 1/3.

Ang halagang ν = 1/3 ay nagpapahiwatig na sa ilalim ng mga kundisyong ito ang laro ay kumikita para sa A at hindi kanais-nais para sa B. Gamit ang kanyang pinakamainam na diskarte, palaging masisiguro ni A ang isang positibong average na kabayaran. Tandaan na kung gagamitin ni A ang kanyang pinaka-maingat (maximin) na diskarte (sa kasong ito, parehong mga diskarte A 1 at A 2 ay maximin), magkakaroon siya ng average na kabayaran na zero. Kaya, ang paggamit ng isang pinaghalong diskarte ay nagbibigay sa A ng pagkakataon na mapagtanto ang kalamangan nito sa B, na lumitaw sa ilalim ng ibinigay na mga patakaran ng laro.

Tukuyin natin ang pinakamainam na diskarte B. Mayroon tayong: q 1 *1 + q 2 *0 = 1/3, q 1 = 1/3, q 2 = 2/3. saan

i.e. ang manlalaro B ay dapat maniwala sa A sa isang ikatlo ng lahat ng mga kaso at magbayad sa kanya ng 1 ruble nang hindi sinusuri, at sa dalawang katlo ng mga kaso - suriin. Pagkatapos ay matatalo siya sa average na 1/3 ng bawat laro. Kung ginamit niya ang kanyang minimax pure strategy B 2 (wag maniwala), matatalo siya sa average na 1/2 sa bawat laro.

Ang solusyon sa larong 2x2 ay maaaring bigyan ng simpleng geometric na interpretasyon. Hayaang magkaroon ng 2x2 game na may matrix

Kumuha tayo ng isang seksyon ng abscissa axis ng haba 1 (Larawan 4.1). Ang kaliwang dulo ng seksyon (ang puntong may abscissa x = 0) ay maglalarawan ng diskarte A 1; kanang dulo ng seksyon (x = 1) - diskarte A 2. Gumuhit tayo ng dalawang patayo sa abscissa axis sa pamamagitan ng mga puntos A 1 at A 2: axis ako–ako at axis II–II. Sa axis ako–ako ipagpaliban namin ang mga panalo para sa diskarte A 1; sa axis II–II-mga kabayaran para sa diskarte A 2. Isaalang-alang ang diskarte ng kaaway B 1; nagbibigay ito ng dalawang puntos sa mga palakol ako–ako At II–II na may ordinates a 11 at a 21, ayon sa pagkakabanggit. Gumuhit tayo ng tuwid na linya B 1 B 1 sa mga puntong ito. Malinaw, kung gagamit tayo ng pinaghalong diskarte sa diskarte ng kaaway B 1

pagkatapos ang aming average na nakuha, katumbas sa kasong ito sa isang 11 p 1 + a 21 p 2, ay kakatawanin ng punto M sa tuwid na linya B 1 B 1; Ang abscissa ng puntong ito ay katumbas ng p 2. Ang tuwid na linya B 1 B 1, na naglalarawan ng kabayaran para sa diskarte B 1, ay karaniwang tatawaging "diskarte B 1".

Malinaw, ang diskarte B 2 ay maaaring gawin sa eksaktong parehong paraan (Larawan 4.2).

Kailangan nating hanapin ang pinakamainam na diskarte S A *, ibig sabihin, isa kung saan ang pinakamababang pakinabang (para sa anumang pag-uugali B) ay magiging maximum. Para magawa ito, gagawa kami ng lower bound para sa mga panalo para sa mga diskarte B 1, B 2, i.e. sirang linya B 1 NB 2 na minarkahan sa Fig. 4.2 na may makapal na linya. Ipapahayag ng lower bound na ito ang pinakamababang kabayaran ng player A para sa alinman sa kanyang mga pinaghalong diskarte; ang punto N kung saan ang pinakamababang kabayaran na ito ay umabot sa pinakamataas na tumutukoy sa desisyon at presyo ng laro. Madaling i-verify na ang ordinate ng point N ay ang halaga ng laro ν, at ang abscissa nito ay katumbas ng p 2 - ang dalas ng aplikasyon ng diskarte A 2 sa pinakamainam na pinaghalong diskarte S A *.

Sa aming kaso, ang solusyon sa laro ay tinutukoy ng intersection point ng mga diskarte. Gayunpaman, hindi ito palaging mangyayari; sa Fig. Ipinapakita ng 4.3 ang kaso kung kailan, sa kabila ng pagkakaroon ng intersection ng mga diskarte, ang solusyon ay nagbibigay ng mga purong diskarte para sa parehong mga manlalaro (A 2 at B 2), at ang halaga ng laro ay ν = a 22. Sa kasong ito, ang matrix ay may saddle point, at ang diskarte A 1 ay malinaw na hindi kumikita, dahil para sa anumang purong diskarte ng kalaban, nagbibigay ito ng mas maliit na kabayaran kaysa sa A 2.

Sa kaso kapag ang kaaway ay may malinaw na hindi kumikitang diskarte, ang geometric na interpretasyon ay may anyo na ipinapakita sa Fig. 4.4.

Sa kasong ito, ang mas mababang limitasyon ng panalo ay tumutugma sa diskarte B 1, ang diskarte B 2 ay malinaw na hindi kumikita para sa kalaban.

Ginagawa rin ng geometric na interpretasyon na mailarawan ang mas mababa at matataas na presyo ng laro (Larawan 4.5).

Upang ilarawan, buuin natin ang mga geometric na interpretasyon ng 2×2 na larong tinalakay sa mga halimbawa 1 at 2 (Larawan 4.6 at 4.7).

Tiniyak namin na ang anumang 2x2 na laro ay malulutas sa mga pangunahing pamamaraan. Anumang 2xn laro ay maaaring malutas sa eksaktong parehong paraan. kung saan mayroon lamang tayong dalawang diskarte, at ang kalaban ay may arbitrary na numero.

Magkaroon tayo ng dalawang estratehiya: A 1, A 2, at ang kaaway ay may n estratehiya: B 1, B 2, ..., B n. Ang matrix ‖a ij ‖ ay ibinigay; ito ay binubuo ng dalawang row at n column. Katulad ng kaso ng dalawang estratehiya, bigyan natin ang problema ng geometric na interpretasyon; n mga diskarte ng kaaway ay ipapakita bilang n tuwid na linya (Larawan 4.8). Binubuo namin ang mas mababang hangganan ng mga panalo (ang putol na linya B 1 MNB 2) at hanapin dito ang punto N na may pinakamataas na ordinate. Ang puntong ito ay nagbibigay ng solusyon sa laro (diskarte ) ang ordinate ng point N ay katumbas ng halaga ng laro ν, at ang abscissa ay katumbas ng frequency p 2 ng diskarte A 2 .

Sa kasong ito, ang pinakamainam na diskarte ng kaaway ay nakukuha sa pamamagitan ng paggamit ng pinaghalong dalawang "kapaki-pakinabang" na estratehiya: B 2 at B 4, na nagsasalubong sa punto N. Ang Diskarte B 3 ay halatang hindi kumikita, at ang diskarte B 1 ay hindi kumikita sa pinakamainam na diskarte SA. *. Kung mananatili si A sa kanyang pinakamainam na diskarte, hindi magbabago ang kabayaran, kahit alin sa kanyang "kapaki-pakinabang" na mga diskarte na ginagamit ni B, gayunpaman, magbabago ito kung lumipat si B sa mga diskarte B 1 o B 3. Sa teorya ng laro, napatunayan na ang anumang finite game mxn ay may solusyon kung saan ang bilang ng "kapaki-pakinabang" na mga diskarte sa magkabilang panig ay hindi lalampas sa mas maliit sa dalawang numero na m at n. Sa partikular, sumusunod dito na ang larong 2xm ay laging may solusyon kung saan hindi hihigit sa dalawang "kapaki-pakinabang" na mga diskarte ang kasangkot sa magkabilang panig.

Gamit ang geometric na interpretasyon, maaari kaming magbigay ng isang simpleng paraan upang malutas ang anumang 2xm na laro. Direkta mula sa pagguhit ay nakita namin ang isang pares ng "kapaki-pakinabang" na mga diskarte ng kaaway na B j at B k na nagsasalubong sa punto N (kung higit sa dalawang diskarte ang nagsalubong sa punto N, kunin ang alinman sa dalawa sa kanila). Alam namin na kung ang manlalaro A ay sumunod sa kanyang pinakamainam na diskarte, kung gayon ang kabayaran ay hindi nakasalalay sa proporsyon kung saan ginagamit ni B ang kanyang "kapaki-pakinabang" na mga diskarte, samakatuwid,

Mula sa mga equation na ito at sa kondisyong p 2 = 1 – p 1, makikita natin ang p1, p2 at ang presyo ng laro ν. Alam ang presyo ng laro, maaari mong agad na matukoy ang pinakamainam na diskarte manlalaro B. Upang gawin ito, lutasin, halimbawa, ang equation: q j a 1 j + q k a 1 k = ν, kung saan q j + q k = 1. Sa kaso kapag mayroon tayong m mga diskarte, at ang kalaban ay may dalawa lamang, malinaw naman, ang problema ay nalutas sa isang ganap na katulad na paraan; Sapat na tandaan na sa pamamagitan ng pag-reverse ng tanda ng mga panalo, maaari mong gawing "talo" ang player A mula sa isang "nagwagi." Maaari mong lutasin ang laro nang hindi binabago ang panalong sign; pagkatapos ang problema ay malulutas nang direkta para sa B, ngunit hindi ang mas mababa, ngunit ang itaas na hangganan ng pakinabang ay itinayo (Larawan 4.9). Sa hangganan, hinahanap ang isang punto N na may pinakamababang ordinate, na siyang halaga ng larong ν.

Isaalang-alang at lutasin natin ang ilang halimbawa ng mga larong 2x2 at 2xm, na mga pinasimpleng halimbawa ng mga laro na may praktikal na kahalagahan.

Halimbawa 3. Ang Gilid A ay nagpapadala ng dalawang bomber sa lokasyon ng kaaway B ako At II; ako lumilipad sa harap II- sa likod. Ang isa sa mga bombero - hindi alam nang maaga kung alin - ang dapat magdala ng bomba, ang isa ay nagsisilbing escort. Sa lugar ng kaaway, ang mga bombero ay inatake ng isang manlalaban mula sa gilid B. Ang mga bombero ay armado ng mga kanyon na may iba't ibang bilis ng apoy. Kung ang isang manlalaban ay umatake sa isang rear bomber II, pagkatapos ay ang mga baril lamang ng bomber na ito ang nagpaputok dito; kung aatakehin niya ang front bomber, ang mga baril ng parehong mga bombero ay magpapaputok sa kanya. Ang posibilidad na matamaan ang isang manlalaban sa unang kaso ay 0.3, sa pangalawang 0.7.

Kung ang isang manlalaban ay hindi nabaril ng defensive fire mula sa mga bombero, tatama ito sa napiling target na may posibilidad na 0.6. Ang gawain ng mga bombero ay ihatid ang bomba sa target; Ang gawain ng manlalaban ay pigilan ito, i.e. barilin ang isang carrier bomber. Kinakailangang piliin ang pinakamainam na diskarte ng mga partido:

a) para sa side A: aling bomber ang dapat gamitin bilang carrier?

b) para sa side B: aling bomber ang aatake?

Solusyon. Mayroon kaming isang simpleng kaso ng isang 2x2 na laro; ang panalo ay ang posibilidad na hindi matalo ang carrier. Ang aming mga diskarte: A 1 - carrier - bomber ako; Isang 2 - carrier - bomber II. Mga diskarte ng kaaway: B 1 - atakehin ang bomber ako; B 2 - pag-atake ng bomber II. Gumawa tayo ng game matrix, i.e. Hanapin natin ang average na kabayaran para sa bawat kumbinasyon ng mga diskarte.

1. A 1 B 1 (tagapagdala ako, inatake ako). Hindi tatamaan ang carrier kung barilin ng mga bombero ang manlalaban, o hindi, ngunit hindi ito tatama sa target nito: a 11 = 0.7 + 0.3 * 0.4 = 0.82.

2. A 2 B 1 (carrier II, inatake ako). a 21 = 1

3. A 1 B 2 (carrier ako, inatake II). A 12 = 1

4. A 2 B 2 (carrier II, inatake II). A 22 = 0.3 + 0.7*0.4 = 0.58

Ang matrix ng laro ay ganito ang hitsura:

Mababang presyo ng laro 0.82; mataas na presyo 1. Ang matrix ay walang saddle point; Naghahanap kami ng solusyon sa larangan ng pinaghalong estratehiya. Meron kami:

p 1 *0.82 + p 2 *1 = ν

p 1 *1 + p 2 *0.58 = ν

p 1 = 0.7; p 2 = 0.3

Ang aming pinakamainam na diskarte oo, ibig sabihin, kailangan mong pumili nang mas madalas bilang carrier ako, paano II. Ang presyo ng laro ay ν = 0.874. Alam ang ν, tinutukoy namin ang q 1 at q 2 - ang mga frequency ng mga diskarte B 1 at B 2 sa pinakamainam na diskarte ng kalaban S B *. Mayroon tayong: q 1 *0.82 + q 2 *1 = 0.874 at q 2 = 1 – q 1, kung saan ang q 1 = 0.7; q 2 = 0.3, ibig sabihin, ang pinakamainam na diskarte ng kaaway ay .

Halimbawa 4. Side A ay umaatake sa bagay, side B ang nagtatanggol dito. Ang Side A ay may dalawang eroplano; side B ay may tatlong anti-aircraft gun. Ang bawat sasakyang panghimpapawid ay isang carrier ng isang malakas na nakamamatay na armas; Upang matamaan ang isang bagay, sapat na para sa hindi bababa sa isang sasakyang panghimpapawid na makalusot dito. Side A aircraft ay maaaring pumili upang lapitan ang bagay sa alinman sa tatlong direksyon: ako, II, III(Larawan 4.10). Ang kaaway (panig B) ay maaaring maglagay ng alinman sa kanyang mga baril sa anumang direksyon; sa kasong ito, ang bawat baril ay pumutok lamang sa isang lugar ng espasyo na may kaugnayan sa isang naibigay na direksyon, at hindi bumaril sa mga kalapit na direksyon. Ang bawat baril ay maaari lamang magpaputok ng isang sasakyang panghimpapawid; ang isang pinaputok na sasakyang panghimpapawid ay tamaan nang may posibilidad 1. Hindi alam ng Gilid A kung saan matatagpuan ang mga baril; Hindi alam ng Side B kung saan manggagaling ang mga eroplano. Ang trabaho ng Side A ay maabot ang target; Ang gawain ng side B ay pigilan ang kanyang pagkatalo. Hanapin ang solusyon sa laro.

Solusyon. Ang laro ay isang larong 2x3. Ang panalo ay ang posibilidad na matamaan ang bagay. Ang aming mga posibleng diskarte: A 1 - magpadala ng isang eroplano sa dalawang magkaibang direksyon. A 2 - ipadala ang parehong mga eroplano sa parehong direksyon. Mga diskarte ng kaaway: B 1 - maglagay ng isang baril sa bawat direksyon; B 2 - ilagay ang dalawang baril sa isang direksyon at isa sa isa pa; Sa 3 - ilagay ang lahat ng tatlong baril sa parehong direksyon. Gumawa tayo ng game matrix.

1. A 1 B 1 (lumilipad ang mga eroplano sa iba't ibang direksyon; ang mga baril ay inilalagay nang paisa-isa). Malinaw, sa kasong ito, walang isang eroplano ang makakalusot sa bagay: a 11 = 0.

2. A 2 B 1 (sabay-sabay na lumilipad ang mga eroplano sa isang direksyon; ang mga baril ay inilalagay nang paisa-isa). Malinaw, sa kasong ito ang isang eroplano ay dadaan sa bagay nang hindi pinaputukan: a 21 = 1.

3. A 1 B 2 (isa-isang lumilipad ang mga eroplano; pinoprotektahan ng kaaway ang dalawang direksyon at iniiwan ang pangatlo na walang proteksyon). Ang posibilidad na kahit isang eroplano ay makalusot sa bagay ay katumbas ng posibilidad na ang isa sa kanila ay pumili ng isang hindi protektadong direksyon: a 12 = 2/3.

4. A 2 B 2 (ang mga eroplano ay lumilipad nang magkasama sa isang direksyon; pinoprotektahan ng kaaway ang isang direksyon gamit ang dalawang baril at ang isa ay may isa, ibig sabihin, talagang pinoprotektahan ang isang direksyon at iniiwan ang dalawang hindi protektado). Ang posibilidad na kahit isang eroplano ay makalusot sa bagay ay katumbas ng posibilidad na ang isang pares ng mga eroplano ay pipili ng isang talagang hindi protektadong direksyon: a 22 = 2/3.

5. A 1 B 3 (isa-isang lumilipad ang mga eroplano; isang direksyon lang ang depensa ng kaaway na may tatlong baril): a 13 = 1.

6. A 2 B 3 (parehong lumilipad ang dalawang eroplano; isang direksyon lang ang depensa ng kaaway na may tatlong baril). Para sa isang bagay na tamaan, ang sasakyang panghimpapawid ay dapat pumili ng isang hindi protektadong direksyon: isang 23 = 2/3.

Game Matrix:

Malinaw mula sa matrix na ang diskarte B 3 ay malinaw na hindi kumikita kumpara sa B 2 (maaaring ito ay napagpasyahan nang maaga). Sa pamamagitan ng pag-aalis ng diskarte B 3, ang laro ay nabawasan sa isang 2x2 na laro:

Ang matrix ay may saddle point: ang mas mababang presyo ng laro 2/3 coincides sa itaas na isa. Kasabay nito, tandaan namin na para sa amin (A) ang diskarte A 1 ay halatang hindi kumikita. Konklusyon: ang magkabilang panig A at B ay dapat palaging gumamit ng kanilang mga purong estratehiya A 2 at B 2, i.e. dapat tayong magpadala ng mga eroplano sa 2s, random na pinipili ang direksyon kung saan ipinapadala ang pares; ang kaaway ay dapat maglagay ng mga baril tulad nito: dalawa - sa isang direksyon, isa sa isa pa, at ang pagpili ng mga direksyon na ito ay dapat ding gawin nang random (dito, tulad ng nakikita natin, ang "mga purong diskarte" ay may kasamang elemento ng randomness). Sa pamamagitan ng paglalapat ng mga pinakamainam na estratehiyang ito, palagi tayong makakakuha ng pare-parehong average na kabayaran na 2/3 (ibig sabihin, ang bagay ay tatamaan ng probabilidad na 2/3). Tandaan na ang nahanap na solusyon sa laro ay hindi natatangi; bilang karagdagan sa solusyon sa mga purong estratehiya, mayroong isang buong seksyon ng halo-halong mga diskarte ng manlalaro A na pinakamainam, mula p 1 = 0 hanggang p 1 = 1/3 (Fig. 4.11).

Madali, halimbawa, na direktang i-verify na ang parehong average na dagdag na 2/3 ay makukuha kung ilalapat natin ang ating mga diskarte A 1 at A 2 sa proporsyon ng 1/3 at 2/3.

Halimbawa 5. Ang parehong mga kondisyon tulad ng sa nakaraang halimbawa, ngunit apat na direksyon ng pag-atake ay posible para sa amin, at ang kaaway ay may apat na baril.

Solusyon. Mayroon pa kaming dalawang posibleng diskarte: A 1 - magpadala ng mga eroplano nang paisa-isa, A 2 - magpadala ng dalawang eroplano nang magkasama. Ang kaaway ay may limang posibleng estratehiya: B 1 - maglagay ng isang baril sa bawat direksyon; Sa 2 - ilagay ang dalawang baril sa dalawang magkaibang direksyon; Sa 3 - ilagay ang dalawang baril sa isang direksyon at isa bawat isa sa iba pang dalawa; B 4 - ilagay ang tatlong baril sa isang direksyon at isa sa isa pa; Sa 5 - ilagay ang lahat ng apat na baril sa isang direksyon. Itatapon namin nang maaga ang mga diskarte B 4 at B 5 bilang halatang hindi kumikita. Nangangatuwirang katulad sa nakaraang halimbawa, binubuo namin ang matrix ng laro:

Ang mas mababang presyo ng laro ay 1/2, ang itaas ay 3/4. Ang matrix ay walang saddle point; ang solusyon ay namamalagi sa lugar ng pinaghalong mga diskarte. Gamit ang geometric na interpretasyon (Larawan 4.12), itinatampok namin ang "kapaki-pakinabang" na mga diskarte ng kaaway: B 1 at B 2.

Tinutukoy namin ang mga frequency p 1 at p 2 mula sa mga equation: p 1 *0 + (1 – p 1)*1 = ν at p 1 *5/6 + (1 – p 1)*1/2 = ν; saan p 1 = 3/8; p 2 = 5/8; ν = 5/8, ibig sabihin. ang aming pinakamainam na diskarte ay . Sa paggamit nito, ginagarantiyahan namin ang aming sarili ng average na panalo na 5/8. Alam ang halaga ng larong ν = 5/8, makikita natin ang mga frequency q 1 at q 2 ng "kapaki-pakinabang" na diskarte ng kalaban: q 1 *0 + (1 – q 1)*5/6 = 5/8, q 1 = ¼, q 2 = ¾. Ang pinakamainam na diskarte ng kaaway ay: .

Halimbawa 6. Ang Gilid A ay may dalawang estratehiya A 1 at A 2, ang panig B ay may apat na estratehiya B 1, B 2, B 3 at B 4. Ang matrix ng laro ay ganito ang hitsura:

Hanapin ang solusyon sa laro.

Solusyon. Pinakamababang presyo laro 3; top 4. Ang geometric na interpretasyon (Larawan 4.13) ay nagpapakita na ang mga kapaki-pakinabang na diskarte para sa player B ay B 1 at B 2 o B 2 at B 4:

Ang Manlalaro A ay may napakaraming pinakamainam na pinaghalong diskarte: sa pinakamainam na diskarte, ang p 1 ay maaaring mag-iba mula 1/5 hanggang 4/5. Ang halaga ng laro ay ν = 4. Ang Manlalaro B ay may purong pinakamainam na diskarte B 2 .

§ 5. Mga pangkalahatang pamamaraan para sa paglutas ng mga larong may hangganan

Sa ngayon ay isinasaalang-alang lamang namin ang pinaka elementarya na mga laro ng uri ng 2xn, na maaaring malutas nang simple at nagbibigay-daan para sa isang maginhawa at visual na geometric na interpretasyon. Sa pangkalahatang kaso, ang paglutas ng larong mxn ay isang medyo mahirap na problema, at ang pagiging kumplikado ng problema at ang dami ng mga kalkulasyon na kinakailangan upang malutas ito ay tumataas nang husto sa pagtaas ng m at n. Gayunpaman, ang mga paghihirap na ito ay hindi isang pangunahing katangian at nauugnay lamang sa isang napakalaking dami ng mga kalkulasyon, na sa ilang mga kaso ay maaaring maging halos imposible. Ang pangunahing aspeto ng paraan para sa paghahanap ng solusyon ay nananatiling pareho para sa anumang m.

Ilarawan natin ito gamit ang halimbawa ng larong 3xn. Bigyan natin ito ng geometric na interpretasyon - isa nang spatial. Ang aming tatlong diskarte na A 1 , A 2 at A 3 ay kakatawanin ng tatlong puntos sa eroplano xOy; ang una ay namamalagi sa pinagmulan ng mga coordinate (Larawan 5.1), ang pangalawa at pangatlo - sa mga palakol Oh At OU sa mga distansyang 1 mula sa simula.

Ang mga ax ay iginuhit sa pamamagitan ng mga puntos A 1, A 2 at A 3 akoako, IIII At IIIIII, patayo sa eroplano xOy. Sa axis akoako ang mga panalo para sa diskarte A 1 ay ipinagpaliban sa mga palakol IIII At IIIIII- mga panalo para sa mga diskarte A 2, A 3. Ang bawat diskarte ng kaaway na B j ay kakatawanin ng isang eroplanong pinutol ang mga palakol akoako, IIII At IIIIII mga segment na katumbas ng mga panalo para sa kaukulang mga diskarte A 1, A 2 at A 3 at diskarte B j. Ang pagkakaroon ng pagbuo ng lahat ng mga diskarte ng kaaway sa ganitong paraan, makakakuha tayo ng isang pamilya ng mga eroplano sa ibabaw ng tatsulok A 1, A 2 at A 3 (Larawan 5.2). Para sa pamilyang ito, maaari ka ring gumawa ng lower bound para sa kabayaran, tulad ng ginawa namin sa kaso ng 2xn, at hanapin sa hangganang ito ang punto N na may pinakamataas na taas sa itaas ng eroplano. xOy. Ang taas na ito ang magiging halaga ng laro ν.

Ang mga frequency p 1 , p 2 , p 3 ng mga diskarte A 1 , A 2 at A 3 sa pinakamainam na diskarte S A * ay matutukoy ng mga coordinate (x, y) ng point N, lalo na: p 2 = x, p 3 = y, p 1 = 1 – p 2 – p 3 . Gayunpaman, ang gayong geometric na konstruksyon, kahit na para sa 3xn na kaso, ay hindi madaling ipatupad at nangangailangan ng maraming oras at pagsisikap ng imahinasyon. Sa pangkalahatang kaso ng laro, inililipat ito sa m-dimensional na espasyo at nawawala ang lahat ng kalinawan, kahit na ang paggamit ng geometric na terminolohiya sa ilang mga kaso ay maaaring maging kapaki-pakinabang. Kapag nilulutas ang mga laro ng mxn sa pagsasanay, mas maginhawang gumamit ng mga pagkakatulad sa pagkalkula kaysa sa mga geometriko. Analytical pamamaraan, lalo na dahil ang mga pamamaraang ito ay ang tanging angkop para sa paglutas ng problema sa mga computer.

Ang lahat ng mga pamamaraang ito ay mahalagang bumaba sa paglutas ng isang problema sa pamamagitan ng sunud-sunod na mga pagsubok, ngunit ang pag-order ng pagkakasunud-sunod ng mga pagsubok ay nagbibigay-daan sa iyo na bumuo ng isang algorithm na humahantong sa isang solusyon sa pinaka-ekonomikong paraan. Dito tatalakayin natin sandali ang isang computational method para sa paglutas ng mga laro ng mxn - ang tinatawag na "linear programming" na paraan. Upang gawin ito, nagbibigay muna kami ng pangkalahatang pagbabalangkas ng problema sa paghahanap ng solusyon sa larong mxn. Hayaang ibigay ang isang laro mxn na may m mga diskarte A 1 , A 2 , …, A m ng manlalaro A at n diskarte B 1 , B 2 , …, B n ng manlalaro B at ang payment matrix ‖a i j ‖ ay ibinigay. Kinakailangan na makahanap ng solusyon sa laro, i.e. dalawang pinakamainam na pinaghalong diskarte ng mga manlalaro A at B

kung saan ang p 1 + p 2 + … + p m = 1; q 1 + q 2 + … + q n = 1 (maaaring zero ang ilan sa mga numerong p i at q j).

Ang aming pinakamainam na diskarte na S A * ay dapat magbigay sa amin ng isang pakinabang na hindi bababa sa ν para sa anumang pag-uugali ng kaaway, at isang pakinabang na katumbas ng ν para sa kanyang pinakamainam na pag-uugali (diskarte S B *). Katulad nito, ang diskarte S B * ay dapat magbigay sa kaaway ng pagkawala na hindi hihigit sa ν para sa alinman sa ating pag-uugali at katumbas ng ν para sa ating pinakamainam na pag-uugali (diskarte SA *).

Ang halaga ng larong ν sa kasong ito ay hindi alam sa amin; ipagpalagay natin na ito ay katumbas ng ilan positibong numero. Sa paniniwalang ito, hindi natin nilalabag ang pangkalahatan ng pangangatwiran; Para sa ν > 0, malinaw na sapat na ang lahat ng elemento ng matrix ‖a i j‖ ay hindi negatibo. Ito ay palaging makakamit sa pamamagitan ng pagdaragdag ng isang sapat na malaking positibong halaga sa mga elementong ‖a i j ‖ L; ang presyo ng laro ay tataas ng L, ngunit hindi magbabago ang desisyon.

Piliin natin ang ating pinakamainam na diskarte S A *. Kung gayon ang aming average na kabayaran para sa diskarte ng kalaban na B j ay magiging katumbas ng: a j = p 1 a 1j + p 2 a 2j + … + p m a mj . Ang aming pinakamainam na diskarte S A * ay may pag-aari na, para sa anumang pag-uugali ng kaaway, nagbibigay ito ng kabayaran na hindi bababa sa ν; samakatuwid, ang alinman sa mga numerong a j ay hindi maaaring mas mababa sa ν. Nakakakuha kami ng ilang kundisyon:

Hatiin natin ang mga hindi pagkakapantay-pantay (5.1) sa positibong halaga ν at denote

Pagkatapos ang mga kondisyon (5.1) ay isusulat sa form

kung saan ξ 1, ξ 2, …, ξ m - di-negatibong mga numero. Dahil ang р 1 + p 2 + … + p m = 1, kung gayon ang mga dami ξ 1, ξ 2, …, ξ m ay nakakatugon sa kundisyon

(5.3) ξ 1 + ξ 2 + … + ξ m = 1/ν.

Gusto naming gawin ang aming mga garantisadong panalo bilang mataas hangga't maaari; Malinaw, sa kasong ito, ang kanang bahagi ng pagkakapantay-pantay (5.3) ay may pinakamababang halaga. Kaya, ang problema sa paghahanap ng solusyon sa laro ay nabawasan sa sumusunod na problema sa matematika: matukoy ang mga di-negatibong dami ξ 1, ξ 2, ..., ξ m, kasiya-siyang kondisyon (5.2), upang ang kanilang kabuuan Φ = ξ 1 + ξ 2 + ... + ξ m ay minimal.

Karaniwan, kapag nilulutas ang mga problema na may kaugnayan sa paghahanap ng mga matinding halaga (maxima at minima), ang pag-andar ay pinag-iba at ang mga derivative ay itinakda na katumbas ng zero. Ngunit ang gayong pamamaraan ay walang silbi sa kasong ito, dahil ang function na Φ, na kailangang mabawasan, ay linear, at ang mga derivatives nito na may paggalang sa lahat ng mga argumento ay katumbas ng isa, i.e. huwag mawala kahit saan. Dahil dito, ang maximum ng function ay nakakamit sa isang lugar sa hangganan ng hanay ng mga pagbabago sa mga argumento, na tinutukoy ng pangangailangan ng hindi negatibiti ng mga argumento at kundisyon (5.2). Ang pamamaraan ng paghahanap ng matinding mga halaga gamit ang pagkita ng kaibhan ay hindi rin angkop sa mga kaso kung saan ang maximum ng mas mababang (o pinakamababa sa itaas) na limitasyon ng mga panalo ay tinutukoy upang malutas ang laro, tulad ng ginawa namin, halimbawa, kapag nilulutas ang 2xn na mga laro . Sa katunayan, ang mas mababang hangganan ay binubuo ng mga seksyon ng mga tuwid na linya, at ang maximum ay nakakamit hindi sa punto kung saan ang derivative ay katumbas ng zero (walang ganoong punto sa lahat), ngunit sa hangganan ng pagitan o sa punto ng intersection ng mga tuwid na seksyon.

Upang malutas ang mga naturang problema, na madalas na nakatagpo sa pagsasanay, isang espesyal na linear programming apparatus ang binuo sa matematika. Ang problema sa linear programming ay nabuo bilang mga sumusunod. Dahil sa isang sistema ng mga linear na equation:

Kinakailangang maghanap ng mga di-negatibong halaga ng mga dami ξ 1, ξ 2, …, ξ m, kasiya-siyang kondisyon (5.4) at sa parehong oras ay pinaliit ang ibinigay na homogenous linear function ng mga dami ξ 1, ξ 2, …, ξ m (linear form): Φ = c 1 ξ 1 + c 2 ξ 2 + … + c m ξ m

Madaling makita na ang problema sa teorya ng laro na ipinakita sa itaas ay isang espesyal na kaso ng isang linear na problema sa programming na may c 1 = c 2 = ... = c m = 1. Sa unang tingin ay maaaring mukhang hindi katumbas ng mga kondisyon (5.2) sa mga kundisyon (5.4), dahil sa halip ay pantay na mga palatandaan ang mga ito ay naglalaman ng mga palatandaan ng hindi pagkakapantay-pantay. Gayunpaman, madaling alisin ang mga palatandaan ng hindi pagkakapantay-pantay sa pamamagitan ng pagpapakilala ng mga bagong kathang-isip na di-negatibong mga variable z 1, z 2, ..., z n at mga kondisyon sa pagsulat (5.2) sa anyo:

Ang form na Φ na kailangang i-minimize ay Φ = ξ 1 + ξ 2 + … + ξ m. Ang linear programming apparatus ay nagbibigay-daan, sa pamamagitan ng medyo maliit na bilang ng mga sunud-sunod na sample, na piliin ang mga halaga ξ 1, ξ 2, ..., ξ m na nakakatugon sa mga itinakdang kinakailangan. Para sa higit na kalinawan, ipapakita namin dito ang paggamit ng apparatus na ito nang direkta sa materyal ng paglutas ng mga partikular na laro.

Halimbawa 1. Kinakailangang maghanap ng solusyon sa larong 3×3 na ibinigay sa Halimbawa 2 ng § 1, na may matrix:

Upang gawing hindi negatibo ang lahat, idinagdag namin ang L = 5 sa lahat ng elemento ng matrix. Nakukuha namin ang matrix:

Sa kasong ito, ang presyo ng laro ay tataas ng 5, ngunit ang solusyon ay hindi magbabago.

Tukuyin natin ang pinakamainam na diskarte S A *. Ang mga kondisyon (5.2) ay may anyo:

kung saan ξ 1 = p 1 /ν, ξ 2 = p 2 /ν, ξ 3 = p 3 /ν. Upang mapupuksa ang mga palatandaan ng hindi pagkakapantay-pantay, ipinakilala namin ang mga dummy variable z 1, z 2, z 3; mga kondisyon (5.6) ay isusulat bilang:

Ang linear na anyo ng Φ ay: Φ = ξ 1 + ξ 2 + ξ 3 at dapat gawin kasing maliit hangga't maaari. Kung ang lahat ng tatlong diskarte B ay "kapaki-pakinabang", pagkatapos ang lahat ng tatlong dummy variable na z 1 , z 2 , z 3 ay maglalaho (ibig sabihin, isang kabayaran na katumbas ng halaga ng laro ν ay makakamit para sa bawat diskarte B j). Ngunit wala pa kaming dahilan para sabihin na lahat ng tatlong estratehiya ay "kapaki-pakinabang." Upang suriin ito, subukan nating ipahayag ang form na Φ sa mga tuntunin ng dummy variable z 1, z 2, z 3 at tingnan kung nakakamit natin ang isang minimum ng form sa pamamagitan ng pagtatakda ng mga ito na katumbas ng zero. Upang gawin ito, lutasin natin ang mga equation (5.7) na may paggalang sa mga variable ξ 1, ξ 2, ξ 3 (i.e., ipahayag ang ξ 1, ξ 2, ξ 3 sa pamamagitan ng mga kathang-isip na variable z 1, z 2, z 3):

Pagdaragdag ng ξ 1, ξ 2, ξ 3, makuha natin ang: Φ = 1/5 + z 1/20 + z 2/10 + z 3/20. Dito ang mga coefficient para sa lahat ng z ay positibo; Nangangahulugan ito na ang anumang pagtaas sa z 1, z 2, z 3 sa itaas ng zero ay maaari lamang humantong sa pagtaas ng hugis ng Φ, at gusto namin itong maging minimal. Dahil dito, ang mga halaga ng z 1, z 2, z 3, na ginagawang pinakamababa ang form na Φ, ay z 1 = z 2 = z 3 = 0. Samakatuwid, ang pinakamababang halaga ng form na Φ: 1/ν = 1/5, kung saan ang presyo ng laro ν = 5. Ang pagpapalit ng mga zero na halaga ng z 1, z 2, z 3 sa mga formula (5.8), makikita natin ang: ξ 1 = 1/20, ξ 2 = 1/10, ξ 3 = 1/20, o, pagpaparami ng mga ito sa ν, p 1 = 1/4, p 2 = 1/2, p 3 = 1/4. Kaya, ang pinakamainam na diskarte A ay matatagpuan: , ibig sabihin. dapat nating isulat ang numero 1 sa isang quarter ng lahat ng mga kaso, 2 sa kalahati ng mga kaso at 3 sa natitirang quarter ng mga kaso.

Alam ang halaga ng laro ν = 5, maaari tayong gumamit ng mga kilalang pamamaraan na para mahanap ang pinakamainam na diskarte ng kalaban . Upang gawin ito, gagamitin namin ang aming anumang dalawang "kapaki-pakinabang" na diskarte (halimbawa, A 2 at A 3) at isulat ang mga equation:

9q 1 + 11 (1-q 2 -q 1) = 5,

kung saan q 1 = q3 = 1/4; q 2 = 1/2. Ang pinakamainam na diskarte ng kalaban ay magiging katulad ng sa atin: . Ngayon bumalik tayo sa orihinal (hindi na-convert) na laro. Upang gawin ito, kailangan mo lamang ibawas ang halagang L = 5 na idinagdag sa mga elemento ng matrix mula sa presyo ng laro ν = 5. Kunin natin ang presyo ng orihinal na laro v 0 = 0. Dahil dito, ang pinakamainam na diskarte ng magkabilang panig ay nagbibigay ng average na kabayaran na katumbas ng zero; ang laro ay pantay na kapaki-pakinabang o disadvantageous para sa parehong partido.

Halimbawa 2. Ang sports club A ay may tatlong opsyon para sa komposisyon ng koponan: A 1, A 2 at A 3. Club B - mayroon ding tatlong opsyon B 1, B 2 at B 3. Kapag nag-a-apply para lumahok sa kompetisyon, hindi alam ng alinman sa club kung aling squad ang pipiliin ng kalaban. Ang mga probabilidad ng club A na manalo para sa iba't ibang komposisyon ng koponan, na tinatayang kilala mula sa karanasan ng mga nakaraang pagpupulong, ay ibinibigay ng matrix:

Hanapin ang dalas kung saan dapat ilagay ng mga club ang bawat isa sa kanilang mga squad sa mga laban laban sa isa't isa upang makamit ang pinakamalaking average na bilang ng mga panalo.

Solusyon. Mababang presyo ng laro 0.4; tuktok 0.6; Naghahanap kami ng solusyon sa larangan ng pinaghalong estratehiya. Upang maiwasan ang pagharap sa mga fraction, i-multiply natin ang lahat ng elemento ng matrix sa 10; sa kasong ito, ang presyo ng laro ay tataas ng 10 beses, ngunit ang desisyon ay hindi magbabago. Nakukuha namin ang matrix:

Ang mga kondisyon (5.5) ay may anyo:

at ang pinakamababang kondisyon ay Φ = ξ 1 + ξ 2 + ξ 3 = min.

Sinusuri namin kung lahat ng tatlong diskarte ng kaaway ay "kapaki-pakinabang". Bilang isang hypothesis, ipinapalagay muna namin na ang mga dummy variable na z 1, z 2, z 3 ay katumbas ng zero, at upang suriin ay malulutas namin ang mga equation (5.10) para sa ξ 1, ξ 2, ξ 3:

(5.12) 136Φ = 30 +13z 1 +18z 2 – 51z 3

Ang formula (5.12) ay nagpapakita na ang pagtaas ng mga variable na z 1 at z 2 mula sa kanilang ipinapalagay na halaga na zero ay maaari lamang tumaas ang Φ, habang ang pagtaas ng z 3 ay maaaring bumaba ng Φ. Gayunpaman, ang pagtaas sa z 3 ay dapat gawin nang maingat upang ang mga halaga ξ 1, ξ 2, ξ 3, depende sa z 3, ay hindi maging negatibo. Samakatuwid, itakda natin ang mga halagang z 1 at z 2 na katumbas ng zero sa kanang bahagi ng mga pagkakapantay-pantay (5.11), at pataasin ang halagang z 3 sa mga katanggap-tanggap na limitasyon (hanggang sa alinman sa mga halaga ξ 1 , ξ 2 , ξ 3 napupunta sa zero). Mula sa pangalawang pagkakapantay-pantay (5.11) malinaw na ang pagtaas sa z 3 ay "ligtas" para sa halaga ξ 2 - tumataas lamang ito mula dito. Tulad ng para sa mga halaga ξ 1 at ξ 3, dito ang pagtaas sa z 3 ay posible lamang sa isang tiyak na limitasyon. Ang halaga ξ 1 ay nagiging zero sa z 3 = 10/23; ang halaga ξ 3 ay naglalaho nang mas maaga, nasa z 3 = 1/4. Samakatuwid, ang pagbibigay ng z 3 sa maximum nito pinahihintulutang halaga z 3 = 1/4, gagawin namin ang halaga ξ 3 sa zero.

Upang suriin kung ang form na Φ ay lumiliko sa isang minimum sa z 1 = 0, z 2 = 0, ξ 3 = 0, ipinapahayag namin ang natitirang (hindi zero) na mga variable sa mga tuntunin ng parang zero z 1, z 2, ξ 3. Ang paglutas ng mga equation (5.10) para sa ξ 1, ξ 2 at z 3, makuha natin ang:

(5.13) 32Φ = 7 + Зz 1 + 4z 2 + ξ 3

Mula sa formula (5.13) malinaw na ang anumang pagtaas sa z 1, z 2, ξ 3 na lampas sa kanilang ipinapalagay na mga zero value ay maaari lamang tumaas ang hugis ng Φ. Dahil dito, ang solusyon sa laro ay natagpuan; ito ay tinutukoy ng mga halaga z 1 = z 2 = ξ 3 = 0, kung saan ξ 1 = 1/32, ξ 2 = 3/16, z 3 = 1/4. Ang pagpapalit sa formula (5.13), makikita natin ang presyo ng laro ν: 32Φ = 7 = 32/ν; ν = 32/7. Ang aming pinakamainam na diskarte: . Ang mga "kapaki-pakinabang" na estratehiya (mga komposisyon A 1 at A 2) ay dapat ilapat sa mga frequency na 1/7 at 6/7; komposisyon A 3 - hindi kailanman gamitin.

Upang mahanap ang pinakamainam na diskarte ng kaaway, sa pangkalahatang kaso, magagawa mo ito: baguhin ang tanda ng kabayaran sa kabaligtaran, magdagdag ng pare-parehong halaga ng L sa mga elemento ng matrix upang gawin silang hindi negatibo, at lutasin ang problema para sa kaaway sa parehong paraan kung paano natin ito nalutas para sa ating sarili. Gayunpaman, ang katotohanan na alam na natin ang presyo ng laro ν ay medyo nagpapasimple sa problema. Bilang karagdagan, sa partikular na kaso na ito, ang problema ay higit na pinasimple sa pamamagitan ng katotohanan na dalawang "kapaki-pakinabang" na diskarte ng kaaway B 1 at B 2 lamang ang kasangkot sa solusyon, dahil ang halaga ng z 3 ay hindi katumbas ng zero, at, samakatuwid, , sa diskarte B 3 ang halaga ng laro ay hindi nakakamit . Sa pamamagitan ng pagpili ng anumang "kapaki-pakinabang" na diskarte ng manlalaro A, halimbawa A 1, mahahanap mo ang mga frequency q 1 at q 2. Upang gawin ito, isinusulat namin ang equation na 8q 1 + 2(1 – q 1) = 32/7, kung saan q 1 = 3/7, q 2 = 4/7; Ang pinakamainam na diskarte ng kaaway ay: , ibig sabihin. ang kaaway ay hindi dapat gumamit ng komposisyon B 3, at ang mga komposisyon B 1 at B 2 ay dapat gamitin na may mga frequency na 3/7 at 4/7.

Pagbabalik sa orihinal na matrix, tinutukoy namin ang tunay na halaga ng laro ν 0 = 32/7:10 = 0.457. Nangangahulugan ito na sa isang malaking bilang ng mga pagpupulong, ang bilang ng mga tagumpay ng club A ay magiging 0.457 ng lahat ng mga pagpupulong.

§ 6. Tinatayang pamamaraan para sa paglutas ng mga laro

Kadalasan sa mga praktikal na problema ay hindi na kailangang makahanap ng eksaktong solusyon sa laro; Ito ay sapat na upang makahanap ng isang tinatayang solusyon na nagbibigay ng isang average na kabayaran malapit sa halaga ng laro. Ang tinatayang kaalaman sa presyo ng larong ν ay maaaring makuha sa pamamagitan ng simpleng pagsusuri ng matrix at pagpapasiya ng mas mababang (α) at ​​itaas (β) na mga presyo ng laro. Kung malapit ang α at β, halos hindi na kailangang maghanap ng eksaktong solusyon, at sapat na ang pagpili ng mga purong diskarte sa minimax. Sa mga kaso kung saan ang α at β ay hindi malapit, ang isang praktikal na solusyon ay maaaring makuha gamit ang numerical na pamamaraan mga solusyon sa mga laro, kung saan mai-highlight natin ang paraan ng pag-ulit.

Ang ideya ng paraan ng pag-ulit ay bumaba sa mga sumusunod. Ang isang "eksperimento sa pag-iisip" ay nilalaro kung saan ginagamit ng mga kalaban na A at B ang kanilang mga diskarte laban sa isa't isa. Ang eksperimento ay binubuo ng isang pagkakasunud-sunod ng mga elementarya na laro, na ang bawat isa ay may matrix ng isang partikular na laro. Nagsisimula ito sa katotohanan na kami (manlalaro A) ay random na pumili ng isa sa aming mga diskarte, halimbawa A i. Ang kaaway ay tumugon dito gamit ang kanyang diskarte B j , na hindi gaanong kapaki-pakinabang para sa atin, i.e. ginagawang minimum ang kabayaran para sa diskarte A i. Tumutugon kami sa hakbang na ito gamit ang aming diskarte na A k, na nagbibigay ng pinakamataas na average na pakinabang kapag ang kalaban ay gumagamit ng diskarte B j. Susunod, turn na naman ng kalaban. Tumugon siya sa aming pares ng mga galaw na A i at A k gamit ang kanyang diskarte na B j, na nagbibigay sa amin ng pinakamaliit na average na kabayaran para sa dalawang estratehiyang ito (A i, A k), at iba pa. Sa bawat hakbang ng umuulit na proseso, ang bawat manlalaro ay tumutugon sa anumang galaw ng isa pang manlalaro gamit ang kanyang sariling diskarte, na pinakamainam na nauugnay sa lahat ng kanyang nakaraang mga galaw, na itinuturing bilang ilang pinaghalong diskarte kung saan ang mga purong diskarte ay ipinakita sa mga proporsyon na tumutugma sa dalas ng kanilang paggamit.

Ang pamamaraang ito ay tulad ng isang modelo ng tunay na praktikal na "pagsasanay" ng mga manlalaro, kapag ang bawat isa sa kanila ay nakakaranas ng pag-uugali ng kaaway at sinusubukang tumugon dito sa paraang kapaki-pakinabang para sa kanilang sarili. Kung ang gayong imitasyon ng proseso ng pag-aaral ay nagpatuloy ng sapat na katagalan, kung gayon ang average na pakinabang sa bawat isang pares ng mga galaw (elementarya na laro) ay may posibilidad sa presyo ng laro, at ang mga frequency p 1 ... p m ; q 1 ... q n , na makakatagpo ng mga diskarte ng mga manlalaro sa larong ito, ay lalapit sa mga frequency na tumutukoy sa pinakamainam na mga diskarte. Ipinapakita ng mga kalkulasyon na ang convergence ng pamamaraan ay napakabagal, ngunit hindi ito isang balakid para sa mga high-speed na makina ng pagkalkula.

Ilarawan natin ang aplikasyon ng umuulit na paraan gamit ang halimbawa ng larong 3x3 na nalutas sa halimbawa 2 ng nakaraang talata. Ang laro ay ibinigay ng matrix:

Ipinapakita ng talahanayan 6.1 ang unang 18 hakbang ng umuulit na proseso. Ang unang column ay nagbibigay ng bilang ng elementarya na laro (pares ng mga galaw) n; sa pangalawang - numero i ang napiling diskarte ng manlalaro A; sa susunod na tatlo - "mga naipon na panalo" para sa una n mga laro na may mga diskarte ng kalaban B 1, B 2, B 3. Ang pinakamababa sa mga halagang ito ay may salungguhit. Sunod sunod ang numero j diskarte na pinili ng kalaban at, nang naaayon, ang mga naipon na panalo para sa n mga laro para sa mga diskarte A 1 , A 2 , A 3 ng mga halagang ito ang maximum ay nakasalungguhit sa itaas. Tinutukoy ng mga may salungguhit na halaga ang pagpili ng diskarte sa pagtugon ng ibang manlalaro. Ang mga sumusunod na column ay sunud-sunod na nagpapakita: ang pinakamababang average na panalo ν, katumbas ng pinakamababang naipon na panalo na hinati sa bilang ng mga laro n; maximum na average na panalo, katumbas ng maximum na naipon na panalo na hinati ng n, at ang kanilang arithmetic mean ν* = (ν + )/2. Kapag tumaas n lahat ng tatlong halaga ν at ν* ay lalapit sa presyo ng laro ν, ngunit ang halaga ν* ay natural na lalapit dito nang mas mabilis.

Talahanayan 6.1.

Tulad ng makikita mula sa halimbawa, ang convergence ng mga pag-ulit ay napakabagal, ngunit kahit na ang isang maliit na kalkulasyon ay ginagawang posible upang mahanap ang tinatayang halaga ng presyo ng laro at tukuyin ang pamamayani ng "kapaki-pakinabang" na mga diskarte. Kapag gumagamit ng mga makina sa pagkalkula, ang halaga ng pamamaraan ay tumataas nang malaki. Ang bentahe ng umuulit na paraan ng paglutas ng mga laro ay ang dami at pagiging kumplikado ng mga kalkulasyon ay tumataas nang kaunti habang ang bilang ng mga diskarte ay tumataas. m At n.

§ 7. Mga pamamaraan para sa paglutas ng ilang walang katapusang laro

Ang walang katapusang laro ay isang laro kung saan kahit isa sa mga partido ay may walang katapusang bilang ng mga diskarte. Ang mga pangkalahatang pamamaraan para sa paglutas ng mga naturang laro ay hindi pa rin mahusay na binuo. Gayunpaman, ang ilang mga espesyal na kaso na nagbibigay-daan sa isang medyo simpleng solusyon ay maaaring maging interesado para sa pagsasanay. Isaalang-alang ang isang laro ng dalawang kalaban na A at B, na ang bawat isa ay may walang hanggan (hindi mabilang) na hanay ng mga estratehiya; ang mga diskarte na ito para sa player A ay tumutugma sa iba't ibang mga halaga ng isang patuloy na pagbabago ng parameter X, at para sa B - parameter sa. Sa kasong ito, sa halip na ang matrix ‖a ij ‖ ang laro ay tinutukoy ng isang tiyak na function ng dalawang patuloy na nagbabagong argumento a(x, y), na tatawagin nating payoff function (tandaan na ang function mismo a(x, y) hindi kailangang tuloy-tuloy). Win function a(x, y) ay maaaring kinakatawan ng geometriko ng ilang ibabaw a(x, y) sa itaas ng lugar ng pagbabago ng argumento (x, y)(Larawan 7.1)

Pagsusuri ng function ng kabayaran a(x, y) ay isinasagawa katulad ng pagsusuri ng matrix ng pagbabayad. Una, ang mas mababang presyo ng larong α ay matatagpuan; para sa layuning ito ay tinutukoy para sa bawat isa X pinakamababang function a(x, y) sa lahat sa: , kung gayon ang maximum ng mga halagang ito ay hahanapin sa lahat X(maximin):

Ang pinakamataas na presyo ng laro (minimax) ay tinutukoy nang katulad:

Isaalang-alang natin ang kaso kapag α = β. Dahil ang presyo ng larong ν ay palaging nasa pagitan ng α at β, ang kanilang kabuuang halaga ay ν. Ang pagkakapantay-pantay α = β ay nangangahulugan na ang ibabaw a(x, y) ay may saddle point, ibig sabihin, isang punto na may mga coordinate x 0, y 0, kung saan a(x, y) ay sa parehong oras minimal sa sa at maximum X(Larawan 7.2).

Ibig sabihin a(x, y) sa puntong ito ay ang presyo ng laro ν: ν = a(x 0, y 0). Ang pagkakaroon ng saddle point ay nangangahulugan na ang isang ibinigay na walang katapusang laro ay may purong solusyon sa diskarte; x 0, y 0 kumakatawan sa pinakamainam na purong estratehiya A at B. Sa pangkalahatang kaso, kapag α ≠ β, ang laro ay maaari lamang magkaroon ng solusyon sa domain ng magkahalong estratehiya (marahil hindi lamang ang isa). Ang pinaghalong diskarte para sa walang katapusang mga laro ay mayroong ilang probability distribution para sa mga diskarte X At sa, itinuturing na mga random na variable. Ang distribusyon na ito ay maaaring tuloy-tuloy at tinutukoy ng mga density f 1 (X) At f 2 (y); maaaring discrete, at pagkatapos ay ang pinakamainam na mga diskarte ay binubuo ng isang set ng mga indibidwal na purong diskarte na pinili na may ilang nonzero probabilities.

Sa kaso kung saan ang isang walang katapusang laro ay walang saddle point, maaari kaming magbigay ng isang malinaw na geometric na interpretasyon ng mas mababa at mas mataas na mga presyo ng laro. Isaalang-alang ang isang walang katapusang laro na may function ng kabayaran a(x, y) at mga estratehiya x, y, patuloy na pinupuno ang mga segment ng mga palakol (x 1, x 2) At (y 1, y 2). Upang matukoy ang mas mababang presyo ng larong α, kailangan mong "tumingin" sa ibabaw a(x, y) mula sa gilid ng ehe sa, ibig sabihin. i-project ito sa isang eroplano xOa(Larawan 7.3). Nakukuha namin ang isang tiyak na pigura na nakatali sa mga gilid ng mga tuwid na linya x = x 1 at x = x 2, at sa itaas at ibaba ng mga kurba K B at K H. Ang mas mababang presyo ng larong α, malinaw naman, ay wala nang iba pa. kaysa sa pinakamataas na ordinate ng curve KH.

Katulad nito, upang mahanap ang pinakamataas na presyo ng laro β, kailangan mong "tumingin" sa ibabaw a(x, y) mula sa gilid ng ehe X(i-project ang ibabaw sa isang eroplano uOa) at hanapin ang pinakamababang ordinate ng itaas na hangganan ng projection ng K B (Larawan 7.4).

Tingnan natin ang dalawang elementarya na halimbawa ng walang katapusang mga laro.

Halimbawa 1. Ang mga manlalaro A at B bawat isa ay may hindi mabilang na hanay ng mga posibleng diskarte X At sa, at 0 ≤ x ≤ 1; 0 ≤ y ≤ 1. Ang payoff function para sa a ay ibinibigay ng expression na a (x, y) – (x – y) 2 . Hanapin ang solusyon sa laro.

Solusyon: Ang ibabaw na a(x, y) ay isang parabolic cylinder (Fig. 7.5) at walang saddle point. Tukuyin natin ang mas mababang presyo ng laro; malinaw naman para sa lahat X; kaya = 0. Alamin natin ang pinakamataas na presyo ng laro. Upang gawin ito, maghanap kami ng isang nakapirming sa

Sa kasong ito, ang maximum ay palaging nakakamit sa hangganan ng pagitan (sa x = 0 o x = 1), i.e. ito ay katumbas ng mga dami y 2; (1 – y) 2, na mas malaki. Ilarawan natin ang mga graph ng mga function na ito (Larawan 7.6), i.e. projection sa ibabaw a(x, y) papunta sa eroplano uOa. Ang makapal na linya sa Fig. Ipinapakita ng 7.6 ang function. Malinaw, ang pinakamababang halaga nito ay nakakamit sa y = 1/2 at katumbas ng 1/4. Samakatuwid, ang pinakamataas na presyo ng laro ay β = 1/4. Sa kasong ito, ang pinakamataas na presyo ng laro ay tumutugma sa presyo ng laro ν. Sa katunayan, ang manlalaro A ay maaaring maglapat ng magkahalong diskarte S A = , kung saan ang mga matinding halaga x = 0 at x = 1 ay nangyayari na may parehong mga frequency; pagkatapos, para sa anumang diskarte ng player B, ang average na kabayaran ng player A ay magiging katumbas ng: ½у 2 + ½(1 – y) 2. Madaling i-verify na ang dami na ito para sa anumang mga halaga sa sa pagitan ng 0 at 1 ay may halaga na hindi bababa sa ¼: ½у 2 + ½(1 – y) 2 ≥ ¼.

Kaya, ang manlalaro A, gamit ang pinaghalong diskarte na ito, ay magagarantiya sa kanyang sarili ng panalo na katumbas ng pinakamataas na presyo ng laro; dahil ang presyo ng laro ay hindi maaaring mas malaki kaysa sa mataas na presyo, kung gayon ang diskarteng ito na S A ay pinakamainam: S A = S A *.

Ito ay nananatili upang mahanap ang pinakamainam na diskarte ng player B. Malinaw, kung ang presyo ng laro ν ay katumbas ng pinakamataas na presyo ng laro β, kung gayon ang pinakamainam na diskarte ng manlalaro B ay palaging ang kanyang purong minimax na diskarte, na ginagarantiyahan sa kanya ang mataas na presyo ng laro. Sa kasong ito, ang naturang diskarte ay 0 = ½. Sa katunayan, sa diskarteng ito, anuman ang gawin ng manlalaro A, ang kanyang kabayaran ay hindi hihigit sa ¼. Ito ay sumusunod mula sa halatang hindi pagkakapantay-pantay (x – ½) 2 = x(x –1) + ¼ ≤ ¼

Halimbawa 2. Ang Gilid A (“kami”) ay nagpapaputok sa sasakyang panghimpapawid ng kaaway B. Upang makaiwas sa sunog, maaaring magmaniobra ang kalaban nang may kaunting karga sa, kung saan siya, sa kanyang pagpapasya, ay maaaring magtalaga ng mga halaga mula sa sa= 0 (linear motion) hanggang sa = samax(flight kasama ang isang bilog ng maximum curvature). Ipinapalagay namin samax yunit ng pagsukat, i.e. ilagay natin samax= 1. Sa paglaban sa kalaban, maaari tayong gumamit ng mga kagamitang pang-sighting batay sa isa o ibang hypothesis tungkol sa paggalaw ng target sa panahon ng paglipad ng projectile. Overload X sa hypothetical maniobra na ito ay maaaring ipagpalagay na katumbas ng anumang halaga mula 0 hanggang 1. Ang aming gawain ay tamaan ang kaaway; Ang gawain ng kalaban ay manatiling walang talo. Ang posibilidad ng pagkatalo para sa data X At sa ay tinatayang ipinahayag ng formula: a(x, y) = , saan sa- labis na karga na inilapat ng kaaway; x - labis na karga na isinasaalang-alang sa paningin. Ito ay kinakailangan upang matukoy ang pinakamainam na mga diskarte ng parehong partido.

Solusyon. Malinaw, ang solusyon ng laro ay hindi magbabago kung itatakda natin ang p = 1. Payoff function a(x, y) kinakatawan ng ibabaw na ipinapakita sa Fig. 7.7.

Ito ay isang cylindrical na ibabaw, ang mga generator na kung saan ay parallel sa bisector ng coordinate angle xOy, at ang seksyon sa pamamagitan ng isang eroplanong patayo sa generatrix ay isang kurba tulad ng isang normal na kurba ng pamamahagi. Gamit ang geometric na interpretasyon ng mas mababa at mataas na presyo ng laro na iminungkahi sa itaas, makikita natin ang β = 1 (Larawan 7.8) at (Larawan 7.9). Ang laro ay walang saddle point; kailangang hanapin ang solusyon sa larangan ng pinaghalong estratehiya. Ang gawain ay medyo katulad ng problema sa nakaraang halimbawa. Sa katunayan, sa maliit na halaga k ang function ay kumikilos halos tulad ng isang function –(x – y) 2, at ang solusyon sa laro ay makukuha kung sa solusyon ng nakaraang halimbawa ay pinapalitan natin ang mga tungkulin ng mga manlalaro A at B; mga. ang aming pinakamainam na diskarte ay ang purong diskarte x = 1/2, at ang pinakamainam na diskarte ng kalaban S B = ay ang paggamit ng matinding estratehiya y = 0 at y = 1 na may pantay na frequency. Nangangahulugan ito na dapat nating gamitin ang layunin sa lahat ng pagkakataon dinisenyo para sa isang labis na karga ng x = 1/2, at ang kaaway ay dapat sa kalahati ng lahat ng mga kaso ay hindi gumamit ng anumang maniobra, at sa kalahati - ang pinakamataas na posibleng maniobra.

kanin. 7.8 Fig. 7.9.

Madaling patunayan na ang solusyon na ito ay magiging wasto para sa mga halaga k ≤ 2. Sa katunayan, ang average na kabayaran para sa diskarte ng kalaban S B = at para sa aming diskarte X ipinahayag ng function , na para sa mga halaga k ≤ 2 ay may isang maximum sa x = 1/2, katumbas ng mas mababang presyo ng larong α. Dahil dito, ang paggamit ng diskarte na S B ay ginagarantiyahan ang kalaban ng pagkawala na hindi hihigit sa α, kung saan malinaw na ang α - ang mas mababang presyo ng laro - ay ang presyo ng laro ν.

Para sa k > 2, ang function na a(x) ay may dalawang maxima (Larawan 7.10), na matatagpuan sa simetriko na may paggalang sa x = 1/2 sa mga puntong x 0 at 1 – x 0, at ang halaga ng x 0 ay nakasalalay sa k.

Obviously, kapag k= 2 x 0 = 1 – x 0 = ½; sa pagtaas k ang mga puntos x 0 at 1 – x 0 ay gumagalaw, papalapit sa matinding puntos(0 at 1). Samakatuwid, ang solusyon ng laro ay nakasalalay sa k. Magtakda tayo ng isang tiyak na halaga ng k, halimbawa k = 3, at humanap tayo ng solusyon laro; Upang gawin ito, tinutukoy namin ang abscissa x 0 ng maximum ng curve a(x). Itinutumbas ang derivative ng function na a(x) sa zero, sumusulat kami ng isang equation upang matukoy ang x 0:

Ang equation na ito ay may tatlong ugat: x = 1/2 (kung saan naabot ang minimum) at x 0, 1 – x 0, kung saan naabot ang maximum. Ang paglutas ng equation ayon sa numero, makikita natin ang humigit-kumulang x 0 ≈ 0.07; 1 – x 0 ≈ 0.93.

Patunayan natin na ang solusyon sa laro sa kasong ito ay ang mga sumusunod na pares ng mga diskarte:

Sa diskarte natin at diskarte ng kalaban sa ang average na panalo ay

Hanapin natin ang pinakamababang a 1 (y) sa 0< у < 1. Функция a 1 (y) симметрична относительно y = 1/2 и может иметь только один или два максимума; ее минимум, во всяком случае, достигается либо в середине отрезка (0, 1), либо на его концах. Полагая у = 0 (или у = 1), найдем

Ang pagtatakda ng y = 1/2, nakukuha namin

na mas malaki sa isang 1 (0); samakatuwid, ang presyo ng laro ay hindi bababa sa isang 1 (0):

Ngayon sabihin natin na ang kalaban ay gumagamit ng diskarte S B *, at gumagamit kami ng diskarte x. Pagkatapos ay ang average na pakinabang ay magiging

Ngunit pinili namin ang x 0 nang eksakto upang sa x = x 0 ang maximum ng expression (7.2) ay nakakamit; kaya naman,

mga. ang kalaban na gumagamit ng diskarte S B * ay maaaring maiwasan ang pagkatalo na higit sa 0.530; samakatuwid, ang ν = 0.530 ay ang presyo ng laro, at ang mga diskarte na S A * at S B * ay nagbibigay ng solusyon. Nangangahulugan ito na dapat tayong gumamit ng mga tanawin na may x = 0.07 at x = 0.93 na may parehong frequency, at ang kaaway ay hindi dapat magmaniobra na may parehong frequency at maniobra na may pinakamataas na labis na karga.

Tandaan na ang kabayaran ν = 0.530 ay kapansin-pansing mas malaki kaysa sa mas mababang presyo ng laro , na maibibigay namin sa aming sarili sa pamamagitan ng paglalapat ng aming maximin na diskarte x 0 = 1/2.

Ang isa sa mga praktikal na paraan upang malutas ang walang katapusang mga laro ay upang bawasan ang mga ito ng tinatayang sa mga may hangganan. Sa kasong ito, ang buong hanay ng mga posibleng diskarte para sa bawat manlalaro ay may kondisyong pinagsama sa isang diskarte. Sa ganitong paraan, siyempre, maaari ka lamang makakuha ng tinatayang solusyon sa laro, ngunit sa karamihan ng mga kaso ay hindi kinakailangan ang eksaktong solusyon.

Gayunpaman, dapat tandaan na kapag inilalapat ang diskarteng ito, ang mga solusyon sa larangan ng halo-halong mga diskarte ay maaaring lumitaw kahit na sa mga kaso kung saan ang solusyon ng orihinal na walang katapusang laro ay posible sa mga purong estratehiya, i.e. kapag ang isang walang katapusang laro ay may saddle point. Kung, sa pamamagitan ng pagbabawas ng isang walang katapusang laro sa isang may hangganan, isang halo-halong solusyon ang nakuha, na kinabibilangan lamang ng dalawang katabing "kapaki-pakinabang" na mga diskarte, kung gayon makatuwirang subukang ilapat ang dalisay na diskarte ng orihinal na walang katapusan na laro na intermediate sa pagitan nila.

Sa konklusyon, tandaan namin na ang mga larong walang hanggan, hindi tulad ng mga may hangganan, ay maaaring walang solusyon. Magbigay tayo ng isang halimbawa ng isang walang katapusang laro na walang solusyon. Dalawang manlalaro ang bawat pangalan ng anumang integer. Pinangalanan mas malaking bilang tumatanggap ng 1 ruble mula sa isa pa. Kung pareho silang tumawag sa parehong numero, ang laro ay magtatapos sa isang draw. Ang laro ay malinaw na walang solusyon. Gayunpaman, may mga klase ng walang katapusang laro kung saan tiyak na mayroong solusyon.

Paunang Salita

Ang layunin ng artikulong ito ay gawing pamilyar ang mambabasa sa mga pangunahing konsepto ng teorya ng laro. Mula sa artikulo matututunan ng mambabasa kung ano ang teorya ng laro at isasaalang-alang isang maikling kasaysayan teorya ng laro, kilalanin ang mga pangunahing prinsipyo ng teorya ng laro, kabilang ang mga pangunahing uri ng mga laro at anyo ng kanilang representasyon. Tatalakayin ng artikulo ang klasikal na problema at ang pangunahing problema ng teorya ng laro. Ang huling seksyon ng artikulo ay nakatuon sa pagsasaalang-alang ng mga problema ng paglalapat ng teorya ng laro sa pagpapatibay ng mga desisyon sa pamamahala at praktikal na aplikasyon ng teorya ng laro sa pamamahala.

Panimula.

ika-21 siglo. Ang edad ng impormasyon, mabilis na pagbuo ng mga teknolohiya ng impormasyon, mga inobasyon at mga makabagong teknolohiya. Ngunit bakit ang edad ng impormasyon? Bakit may mahalagang papel ang impormasyon sa halos lahat ng prosesong nagaganap sa lipunan? Napakasimple ng lahat. Ang impormasyon ay nagbibigay sa amin ng napakahalagang oras, at sa ilang mga kaso kahit na ang pagkakataon na maunahan ito. Pagkatapos ng lahat, hindi lihim na sa buhay ay madalas mong kailangang harapin ang mga gawain kung saan kailangan mong gumawa ng mga pagpapasya sa mga kondisyon ng kawalan ng katiyakan, sa kawalan ng impormasyon tungkol sa mga tugon sa iyong mga aksyon, ibig sabihin, ang mga sitwasyon ay lumitaw kung saan ang dalawa (o higit pang) partido ituloy ang iba't ibang layunin, at ang mga resulta ng anumang aksyon ng bawat partido ay nakasalalay sa mga aktibidad ng kasosyo. Ang ganitong mga sitwasyon ay nangyayari araw-araw. Halimbawa, kapag naglalaro ng chess, pamato, domino, at iba pa. Sa kabila ng katotohanan na ang mga laro ay pangunahing nakakaaliw sa likas na katangian, sa pamamagitan ng kanilang likas na katangian ay nauugnay ang mga ito sa mga sitwasyon ng salungatan kung saan ang salungatan ay likas na sa layunin ng laro - ang pagkapanalo ng isa sa mga kasosyo. Kasabay nito, ang resulta ng bawat galaw ng manlalaro ay depende sa tugon ng kalaban. Sa ekonomiya, ang mga sitwasyon ng salungatan ay nangyayari nang napakadalas at may magkakaibang kalikasan, at ang kanilang bilang ay napakalaki na imposibleng bilangin ang lahat ng mga sitwasyon ng salungatan na lumitaw sa merkado sa hindi bababa sa isang araw. Kasama sa mga sitwasyon ng salungatan sa ekonomiya, halimbawa, ang mga relasyon sa pagitan ng supplier at consumer, mamimili at nagbebenta, bangko at kliyente. Sa lahat ng mga halimbawa sa itaas, ang sitwasyon ng salungatan ay nabuo sa pamamagitan ng pagkakaiba sa mga interes ng mga kasosyo at ang pagnanais ng bawat isa sa kanila na gumawa ng pinakamainam na mga desisyon na napagtanto ang kanilang mga layunin sa pinakamalaking lawak. Kasabay nito, dapat isaalang-alang ng lahat hindi lamang ang kanilang sariling mga layunin, kundi pati na rin ang mga layunin ng kanilang kapareha, at isaalang-alang ang mga desisyon na hindi alam nang maaga na gagawin ng mga kasosyong ito. Upang mahusay na malutas ang mga problema sa mga sitwasyon ng salungatan, kailangan ang mga pamamaraang nakabatay sa siyentipiko. Ang ganitong mga pamamaraan ay binuo ng matematikal na teorya ng mga sitwasyon ng salungatan, na tinatawag na teorya ng laro.

Ano ang teorya ng laro?

Ang teorya ng laro ay isang kumplikado, multi-dimensional na konsepto, kaya tila imposibleng bigyang-kahulugan ang teorya ng laro gamit lamang ang isang kahulugan. Tingnan natin ang tatlong diskarte sa pagtukoy ng teorya ng laro.

1.Ang teorya ng laro ay isang mathematical na pamamaraan para sa pag-aaral ng pinakamainam na estratehiya sa mga laro. Ang laro ay isang proseso kung saan lumalahok ang dalawa o higit pang partido, nakikipaglaban para sa pagsasakatuparan ng kanilang mga interes. Ang bawat panig ay may sariling layunin at gumagamit ng ilang diskarte na maaaring humantong sa panalo o pagkatalo - depende sa pag-uugali ng ibang mga manlalaro. Tinutulungan ka ng teorya ng laro na pumili pinakamahusay na mga diskarte isinasaalang-alang ang mga ideya tungkol sa iba pang mga kalahok, kanilang mga mapagkukunan at kanilang mga posibleng aksyon.

2. Ang teorya ng laro ay isang sangay ng inilapat na matematika, o mas tiyak, pananaliksik sa pagpapatakbo. Kadalasan, ang mga pamamaraan ng teorya ng laro ay ginagamit sa ekonomiya, medyo mas madalas sa iba. mga agham panlipunan- sosyolohiya, agham pampulitika, sikolohiya, etika at iba pa. Mula noong 1970s, ito ay pinagtibay ng mga biologist upang pag-aralan ang pag-uugali ng hayop at ang teorya ng ebolusyon. Ang teorya ng laro ay napakahalaga para sa artificial intelligence at cybernetics.

3. Isa sa mga pinakamahalagang variable kung saan nakasalalay ang tagumpay ng isang organisasyon ay ang pagiging mapagkumpitensya. Malinaw, ang kakayahang mahulaan ang mga aksyon ng mga kakumpitensya ay nangangahulugan ng isang kalamangan para sa anumang organisasyon. Teorya ng laro - isang paraan para sa pagmomodelo ng pagtatasa ng epekto ginawang desisyon sa mga katunggali.

Kasaysayan ng teorya ng laro

Mga pinakamainam na solusyon o estratehiya sa pagmomolde ng matematika ay iminungkahi noong ika-18 siglo. Ang mga problema sa produksyon at pagpepresyo sa ilalim ng mga kondisyon ng oligopoly, na kalaunan ay naging mga halimbawa ng aklat-aralin ng teorya ng laro, ay isinasaalang-alang noong ika-19 na siglo. A. Cournot at J. Bertrand. Sa simula ng ika-20 siglo. Iniharap ni E. Lasker, E. Zermelo, E. Borel ang ideya ng isang matematikal na teorya ng salungatan ng interes.

Ang teorya ng larong matematika ay nagmula sa neoclassical economics. Ang matematikal na aspeto at aplikasyon ng teorya ay unang binalangkas sa klasikong 1944 na aklat nina John von Neumann at Oscar Morgenstern, Game Theory at Economic Behavior.

Si John Nash, pagkatapos ng pagtatapos mula sa Carnegie Polytechnic Institute na may dalawang degree - isang bachelor's at master's degree - ay pumasok sa Princeton University, kung saan siya ay dumalo sa mga lektura ni John von Neumann. Sa kanyang mga sinulat, binuo ni Nash ang mga prinsipyo ng "managerial dynamics". Sinuri ng mga unang konsepto ng teorya ng laro ang mga zero-sum na laro, kung saan may mga natatalo at nanalo sa kanilang gastos. Bumuo si Nash ng mga pamamaraan ng pagsusuri kung saan ang lahat ng kasangkot ay mananalo o matatalo. Ang mga sitwasyong ito ay tinatawag na "Nash equilibrium" o "non-cooperative equilibrium"; sa sitwasyon, ang mga partido ay gumagamit ng pinakamainam na diskarte, na humahantong sa paglikha ng isang matatag na ekwilibriyo. Ito ay kapaki-pakinabang para sa mga manlalaro na panatilihin ang balanseng ito, dahil ang anumang pagbabago ay magpapalala sa kanilang sitwasyon. Ang mga gawang ito ni Nash ay gumawa ng isang seryosong kontribusyon sa pagbuo ng teorya ng laro, at ang mga kasangkapang pangmatematika ng economic modeling ay binago. Ipinakikita ni John Nash na ang klasikong diskarte ni A. Smith sa kompetisyon, kung saan ang lahat ay para sa kanyang sarili, ay suboptimal. Ang mas pinakamainam na mga diskarte ay kapag sinusubukan ng lahat na gumawa ng mas mahusay para sa kanilang sarili habang gumagawa ng mas mahusay para sa iba. Noong 1949, sumulat si John Nash ng isang disertasyon sa teorya ng laro, at pagkaraan ng 45 taon ay natanggap niya ang Nobel Prize sa Economics.

Bagama't ang teorya ng laro ay orihinal na tumatalakay sa mga modelong pang-ekonomiya, nanatili itong pormal na teorya sa loob ng matematika hanggang sa 1950s. Ngunit mula noong 1950s. Ang mga pagtatangka ay nagsisimulang maglapat ng mga pamamaraan ng teorya ng laro hindi lamang sa ekonomiya, ngunit sa biology, cybernetics, teknolohiya, at antropolohiya. Sa panahon ng Ikalawang Digmaang Pandaigdig at kaagad pagkatapos nito, ang militar ay naging seryosong interesado sa teorya ng laro, na nakita dito ang isang makapangyarihang kasangkapan para sa pag-aaral ng mga madiskarteng desisyon.

Noong 1960 - 1970 ang interes sa teorya ng laro ay kumukupas, sa kabila ng makabuluhang mga resulta sa matematika na nakuha sa oras na iyon. Mula noong kalagitnaan ng 1980s. Ang aktibong praktikal na paggamit ng teorya ng laro ay nagsisimula, lalo na sa ekonomiya at pamamahala. Sa nakalipas na 20 - 30 taon, ang kahalagahan ng teorya ng laro at interes ay lumalago nang malaki, ilang mga lugar ng modernong teoryang pang-ekonomiya imposibleng ipaliwanag nang hindi inilalapat ang teorya ng laro.

Ang isang malaking kontribusyon sa aplikasyon ng teorya ng laro ay ang gawain ni Thomas Schelling, Nobel laureate sa economics noong 2005, "The Strategy of Conflict." Isinasaalang-alang ni T. Schelling ang iba't ibang "istratehiya" ng pag-uugali ng mga kalahok sa labanan. Ang mga estratehiyang ito ay tumutugma sa mga taktika sa pamamahala ng salungatan at mga prinsipyo ng pagsusuri ng salungatan sa conflictology at pamamahala sa salungatan sa organisasyon.

Mga pangunahing prinsipyo ng teorya ng laro

Kilalanin natin ang mga pangunahing konsepto ng teorya ng laro. Ang modelo ng matematika ng isang sitwasyon ng salungatan ay tinatawag laro, mga partidong sangkot sa tunggalian - mga manlalaro. Upang ilarawan ang isang laro, kailangan mo munang tukuyin ang mga kalahok nito (mga manlalaro). Ang kundisyong ito ay madaling matupad kapag pinag-uusapan natin tungkol sa mga ordinaryong laro tulad ng chess, atbp. Iba ang sitwasyon sa “market games”. Dito hindi laging madaling makilala ang lahat ng mga manlalaro, i.e. kasalukuyan o potensyal na mga kakumpitensya. Ipinapakita ng pagsasanay na hindi kinakailangang kilalanin ang lahat ng mga manlalaro; kinakailangan upang matuklasan ang mga pinakamahalaga. Ang mga laro ay karaniwang sumasaklaw ng ilang panahon kung saan ang mga manlalaro ay nagsasagawa ng sunud-sunod o sabay-sabay na mga aksyon. Ang pagpili at pagpapatupad ng isa sa mga aksyon na ibinigay ng mga patakaran ay tinatawag pag-unlad manlalaro. Maaaring maging personal at random ang mga galaw. Personal na galaw- ito ay isang malay na pagpili ng manlalaro ng isa sa mga posibleng aksyon (halimbawa, isang paglipat sa isang laro ng chess). Random na galaw ay isang random na piniling aksyon (halimbawa, pagpili ng card mula sa isang shuffled deck). Maaaring nauugnay ang mga pagkilos sa mga presyo, dami ng benta, gastos sa pananaliksik at pagpapaunlad, atbp. Ang mga panahon kung saan ang mga manlalaro ay gumagawa ng kanilang mga galaw ay tinatawag mga yugto mga laro. Ang mga galaw na pinili sa bawat yugto sa huli ay matukoy "mga pagbabayad"(panalo o pagkatalo) ng bawat manlalaro, na maaaring ipahayag sa materyal na mga ari-arian o pera. Ang isa pang konsepto sa teoryang ito ay diskarte ng manlalaro. Diskarte Ang isang manlalaro ay isang hanay ng mga panuntunan na tumutukoy sa pagpili ng kanyang aksyon sa bawat personal na galaw, depende sa kasalukuyang sitwasyon. Karaniwan sa panahon ng laro, sa bawat personal na galaw, ang manlalaro ay gumagawa ng isang pagpipilian depende sa partikular na sitwasyon. Gayunpaman, sa prinsipyo posible na ang lahat ng mga desisyon ay ginawa ng manlalaro nang maaga (bilang tugon sa anumang naibigay na sitwasyon). Nangangahulugan ito na ang manlalaro ay pumili ng isang partikular na diskarte, na maaaring tukuyin bilang isang listahan ng mga panuntunan o isang programa. (Sa ganitong paraan maaari mong laruin ang laro gamit ang isang computer.) Sa madaling salita, ang diskarte ay tumutukoy sa mga posibleng aksyon na nagpapahintulot sa manlalaro sa bawat yugto ng laro na pumili mula sa isang tiyak na bilang ng mga alternatibong opsyon ang hakbang na tila sa kanya ang "pinakamahusay na tugon" sa mga aksyon ng ibang mga manlalaro. Tungkol sa konsepto ng diskarte, dapat tandaan na tinutukoy ng manlalaro ang kanyang mga aksyon hindi lamang para sa mga yugto na aktwal na naabot ng isang partikular na laro, kundi pati na rin para sa lahat ng mga sitwasyon, kabilang ang mga maaaring hindi lumabas sa panahon ng isang partikular na laro. Ang laro ay tinatawag silid-pasingawan, kung ito ay nagsasangkot ng dalawang manlalaro, at maramihan, kung ang bilang ng mga manlalaro ay higit sa dalawa. Para sa bawat pormal na laro, ipinakilala ang mga panuntunan, i.e. isang sistema ng mga kundisyon na tumutukoy sa: 1) mga opsyon para sa mga aksyon ng mga manlalaro; 2) ang dami ng impormasyon na mayroon ang bawat manlalaro tungkol sa pag-uugali ng kanilang mga kasosyo; 3) ang pakinabang na humahantong sa bawat hanay ng mga aksyon. Karaniwan, ang panalo (o pagkatalo) ay maaaring mabilang; halimbawa, maaari mong pahalagahan ang isang pagkatalo bilang zero, isang panalo bilang isa, at isang draw bilang ½. Ang laro ay tinatawag na zero-sum game, o antagonistic, kung ang pakinabang ng isa sa mga manlalaro ay katumbas ng pagkawala ng isa pa, ibig sabihin, upang makumpleto ang laro, sapat na upang ipahiwatig ang halaga ng isa sa kanila. Kung italaga natin A- panalo ng isa sa mga manlalaro, b- ang mga panalo ng isa, pagkatapos ay para sa isang zero-sum game b = -a, samakatuwid ito ay sapat na upang isaalang-alang, halimbawa A. Ang laro ay tinatawag panghuli, kung ang bawat manlalaro ay may limitadong bilang ng mga diskarte, at walang katapusan- kung hindi. Nang sa gayon magpasya laro, o paghahanap solusyon sa laro, dapat kang pumili ng diskarte para sa bawat manlalaro na nakakatugon sa kundisyon pinakamainam, mga. dapat matanggap ng isa sa mga manlalaro maximum na panalo kapag ang pangalawa ay dumikit sa kanyang diskarte. Kasabay nito, ang pangalawang manlalaro ay dapat magkaroon pinakamababang pagkawala, kung ang una ay mananatili sa kanyang diskarte. ganyan estratehiya ay tinatawag pinakamainam. Ang mga pinakamainam na estratehiya ay dapat ding matugunan ang kondisyon Pagpapanatili, ibig sabihin, dapat na hindi kanais-nais para sa sinuman sa mga manlalaro na abandunahin ang kanilang diskarte sa larong ito. Kung ang laro ay paulit-ulit nang ilang beses, kung gayon ang mga manlalaro ay maaaring interesado na hindi manalo at matalo sa bawat partikular na laro, ngunit sa average na panalo (pagkatalo) sa lahat ng batch. Layunin Ang teorya ng laro ay upang matukoy ang pinakamainam mga diskarte para sa bawat manlalaro. Kapag pumipili ng pinakamainam na diskarte, natural na ipagpalagay na ang parehong mga manlalaro ay kumikilos nang makatwiran sa mga tuntunin ng kanilang mga interes.

Kooperatiba at hindi kooperatiba

Ang laro ay tinatawag na kooperatiba, o koalisyon, kung ang mga manlalaro ay maaaring magkaisa sa mga grupo, na isagawa ang ilang mga obligasyon sa iba pang mga manlalaro at i-coordinate ang kanilang mga aksyon. Naiiba ito sa mga larong hindi kooperatiba kung saan dapat maglaro ang lahat para sa kanilang sarili. Ang mga larong pang-libangan ay bihirang kooperatiba, ngunit ang gayong mga mekanismo ay hindi karaniwan sa pang-araw-araw na buhay.

Madalas na ipinapalagay na kung bakit naiiba ang mga laro ng kooperatiba ay ang kakayahan ng mga manlalaro na makipag-usap sa isa't isa. Sa pangkalahatan, hindi ito totoo. May mga laro kung saan pinapayagan ang komunikasyon, ngunit ang mga manlalaro ay naghahangad ng mga personal na layunin, at kabaliktaran.

Sa dalawang uri ng laro, ang mga hindi kooperatiba ay naglalarawan ng mga sitwasyon nang detalyado at nagbubunga ng mas tumpak na mga resulta. Isinasaalang-alang ng mga kooperatiba ang proseso ng laro sa kabuuan.

Kasama sa mga hybrid na laro ang mga elemento ng larong kooperatiba at hindi kooperatiba. Halimbawa, ang mga manlalaro ay maaaring bumuo ng mga grupo, ngunit ang laro ay lalaruin sa isang hindi kooperatiba na istilo. Nangangahulugan ito na ang bawat manlalaro ay hahabulin ang mga interes ng kanyang grupo, habang sa parehong oras ay sinusubukan na makamit ang personal na pakinabang.

Symmetrical at asymmetrical

Asymmetrical na laro

Magiging simetriko ang laro kapag pantay-pantay ang mga kaukulang diskarte ng mga manlalaro, ibig sabihin, magkapareho sila ng mga pagbabayad. Sa madaling salita, kung ang mga manlalaro ay maaaring magpalit ng mga lugar at ang kanilang mga panalo para sa parehong mga galaw ay hindi magbabago. Maraming dalawang-player na laro na pinag-aralan ay simetriko. Sa partikular, ito ay: "Prisoner's Dilemma", "Deer Hunt". Sa halimbawa sa kanan, ang laro sa unang tingin ay maaaring mukhang simetriko dahil sa magkatulad na mga diskarte, ngunit hindi ito ang kaso - pagkatapos ng lahat, ang kabayaran ng pangalawang manlalaro na may mga profile ng diskarte (A, A) at (B, B) magiging mas malaki kaysa sa una.

Zero-sum at non-zero-sum

Ang mga larong zero-sum ay isang espesyal na uri ng mga constant-sum na laro, iyon ay, ang mga kung saan hindi maaaring dagdagan o bawasan ng mga manlalaro ang magagamit na mapagkukunan, o ang pondo ng laro. Sa kasong ito, ang kabuuan ng lahat ng panalo ay katumbas ng kabuuan ng lahat ng pagkatalo para sa anumang paglipat. Tumingin sa kanan - ang mga numero ay kumakatawan sa mga pagbabayad sa mga manlalaro - at ang kanilang kabuuan sa bawat cell ay zero. Kabilang sa mga halimbawa ng mga naturang laro ang poker, kung saan nanalo ang isa sa lahat ng taya ng iba; reversi, kung saan ang mga piraso ng kaaway ay nakuha; o banal pagnanakaw.

Maraming mga laro na pinag-aralan ng mga mathematician, kabilang ang nabanggit na "Prisoner's Dilemma", ay may ibang uri: sa non-zero sum games Ang panalo ng isang manlalaro ay hindi nangangahulugang pagkatalo ng iba, at kabaliktaran. Ang kinalabasan ng naturang laro ay maaaring mas mababa o higit sa zero. Ang ganitong mga laro ay maaaring ma-convert sa zero sum - ito ay ginagawa sa pamamagitan ng pagpapakilala fictitious player, na "nag-aangkop" sa sobra o bumubuo sa kakulangan ng pondo.

Ang isa pang laro na may non-zero sum ay kalakalan, kung saan nakikinabang ang bawat kalahok. Kasama rin dito ang mga dama at chess; sa huling dalawa, maaaring gawing mas malakas ng manlalaro ang kanyang ordinaryong piraso, na magkakaroon ng kalamangan. Sa lahat ng mga kasong ito, tumataas ang halaga ng laro. Ang isang kilalang halimbawa kung saan ito bumababa ay digmaan.

Parallel at serial

Sa parallel na laro, ang mga manlalaro ay gumagalaw nang sabay-sabay, o hindi bababa sa hindi nila alam ang mga pagpipilian ng iba hanggang Lahat hindi gagawa ng kanilang galaw. Sa sunud-sunod, o pabago-bago Sa mga laro, ang mga kalahok ay maaaring gumawa ng mga galaw sa isang paunang natukoy o random na pagkakasunud-sunod, ngunit sa parehong oras ay nakakatanggap sila ng ilang impormasyon tungkol sa mga nakaraang aksyon ng iba. Ang impormasyong ito ay maaaring maging hindi masyadong kumpleto, halimbawa, maaaring malaman ng isang manlalaro na ang kanyang kalaban mula sa sampu ng kanyang mga diskarte tiyak na hindi pumili panglima, nang walang natutunan tungkol sa iba.

Ang mga pagkakaiba sa pagtatanghal ng parallel at sequential na mga laro ay tinalakay sa itaas. Ang una ay karaniwang ipinakita sa normal na anyo, at ang huli sa malawak na anyo.

May kumpleto o hindi kumpletong impormasyon

Ang isang mahalagang subset ng mga sequential na laro ay mga laro na may kumpletong impormasyon. Sa ganitong laro, alam ng mga kalahok ang lahat ng mga galaw na ginawa hanggang sa kasalukuyang sandali, pati na rin ang mga posibleng diskarte ng kanilang mga kalaban, na nagpapahintulot sa kanila sa ilang mga lawak na mahulaan ang kasunod na pag-unlad ng laro. Ang kumpletong impormasyon ay hindi magagamit sa mga parallel na laro, dahil ang mga kasalukuyang galaw ng mga kalaban ay hindi alam. Karamihan sa mga larong pinag-aralan sa matematika ay nagsasangkot ng hindi kumpletong impormasyon. Halimbawa, ang lahat ng "asin" Mga dilemma ng bilanggo namamalagi sa hindi pagkakumpleto nito.

Mga halimbawa ng larong may kumpletong impormasyon: chess, checkers at iba pa.

Ang konsepto ng kumpletong impormasyon ay madalas na nalilito sa katulad na isa - perpektong impormasyon. Para sa huli, sapat lamang na malaman ang lahat ng mga diskarte na magagamit sa mga kalaban; ang kaalaman sa lahat ng kanilang mga galaw ay hindi kinakailangan.

Mga larong may walang katapusang bilang ng mga hakbang

Ang mga laro sa totoong mundo, o mga larong pinag-aralan sa ekonomiya, ay malamang na tumagal pangwakas bilang ng mga galaw. Ang matematika ay hindi gaanong limitado, at itinakda ang teorya sa mga partikular na deal sa mga laro na maaaring magpatuloy nang walang katapusan. Bukod dito, ang nagwagi at ang kanyang mga panalo ay hindi tinutukoy hanggang sa katapusan ng lahat ng mga galaw.

Ang gawain na karaniwang ibinibigay sa kasong ito ay hindi upang makahanap ng pinakamainam na solusyon, ngunit upang makahanap ng hindi bababa sa isang panalong diskarte.

Mga larong discrete at tuluy-tuloy

Karamihan sa mga laro ay pinag-aralan discrete: mayroon silang limitadong bilang ng mga manlalaro, galaw, kaganapan, kinalabasan, atbp. Gayunpaman, ang mga bahaging ito ay maaaring i-extend sa maraming totoong numero. Ang mga laro na kinabibilangan ng mga naturang elemento ay kadalasang tinatawag na differential game. Nauugnay ang mga ito sa ilang uri ng sukat ng materyal (karaniwang sukat ng oras), bagaman ang mga kaganapang nagaganap sa mga ito ay maaaring magkahiwalay sa kalikasan. Hinahanap ng mga larong naiiba ang kanilang aplikasyon sa engineering at teknolohiya, pisika.

Metagames

Ito ay mga laro na nagreresulta sa isang hanay ng mga panuntunan para sa isa pang laro (tinatawag na target o laro-bagay). Ang layunin ng metagame ay pataasin ang pagiging kapaki-pakinabang ng ibinigay na ruleset.

Form ng pagtatanghal ng laro

Sa teorya ng laro, kasama ang pag-uuri ng mga laro, ang anyo ng pagtatanghal ng laro ay gumaganap ng isang malaking papel. Karaniwan, ang isang normal o matrix na anyo ay nakikilala at isang pinalawak na anyo, na tinukoy sa anyo ng isang puno. Ang mga form na ito para sa isang simpleng laro ay ipinapakita sa Fig. 1a at 1b.

Upang magtatag ng isang unang koneksyon sa larangan ng kontrol, ang laro ay maaaring ilarawan bilang mga sumusunod. Dalawang negosyo na gumagawa ng mga katulad na produkto ay nahaharap sa isang pagpipilian. Sa isang kaso, maaari silang magkaroon ng posisyon sa merkado sa pamamagitan ng pagtatakda ng mataas na presyo, na magbibigay sa kanila ng average na kita ng cartel P K . Kapag pumasok sa matinding kompetisyon, parehong tumatanggap ng tubo P W . Kung ang isa sa mga kakumpitensya ay nagtatakda ng mataas na presyo, at ang pangalawa ay nagtatakda ng mababang presyo, pagkatapos ay napagtanto ng huli ang isang monopolyong tubo P M , habang ang iba ay nagkakaroon ng mga pagkalugi P G . Ang isang katulad na sitwasyon ay maaaring lumitaw, halimbawa, kapag ang parehong mga kumpanya ay dapat na ipahayag ang kanilang presyo, na pagkatapos ay hindi maaaring baguhin.

Sa kawalan ng mahigpit na mga kondisyon, kapaki-pakinabang para sa parehong mga negosyo na magtakda ng mababang presyo. Ang diskarte sa "mababang presyo" ay ang nangingibabaw para sa anumang kumpanya: kahit na anong presyo ang pipiliin ng isang nakikipagkumpitensyang kumpanya, palaging mas mainam na magtakda ng mababang presyo. Ngunit sa kasong ito, ang mga kumpanya ay nahaharap sa isang dilemma, dahil ang kita ng P K (na para sa parehong mga manlalaro ay mas mataas kaysa sa kita ng P W) ay hindi nakakamit.

Ang estratehikong kumbinasyon ng "mababang presyo/mababang presyo" na may kaukulang mga pagbabayad ay kumakatawan sa isang Nash equilibrium, kung saan hindi kanais-nais para sa alinmang manlalaro na hiwalay na lumihis mula sa piniling diskarte. Ang konseptong ito ng ekwilibriyo ay mahalaga sa paglutas ng mga estratehikong sitwasyon, ngunit sa ilalim ng ilang mga pangyayari ay nangangailangan pa rin ito ng pagpapabuti.

Tulad ng para sa dilemma sa itaas, ang resolusyon nito ay nakasalalay, sa partikular, sa orihinalidad ng mga galaw ng mga manlalaro. Kung ang negosyo ay may pagkakataon na muling isaalang-alang ang mga madiskarteng variable nito (sa kasong ito ang presyo), kung gayon ang isang kooperatiba na solusyon sa problema ay matatagpuan kahit na walang mahigpit na kasunduan sa pagitan ng mga manlalaro. Iminumungkahi ng intuwisyon na sa paulit-ulit na pakikipag-ugnayan sa pagitan ng mga manlalaro, ang mga pagkakataon ay lumitaw upang makamit ang katanggap-tanggap na "kabayaran." Kaya, sa ilalim ng ilang mga pangyayari, hindi nararapat na magsikap para sa panandaliang mataas na kita sa pamamagitan ng paglalaglag ng presyo kung ang isang "digmaan sa presyo" ay maaaring lumitaw sa hinaharap.

Tulad ng nabanggit, ang parehong mga larawan ay nagpapakilala sa parehong laro. Ang pagtatanghal ng laro sa normal na anyo sa normal na kaso ay nagpapakita ng "synchronicity". Gayunpaman, hindi ito nangangahulugan ng "simultaneity" ng mga kaganapan, ngunit nagpapahiwatig na ang pagpili ng diskarte ng manlalaro ay isinasagawa sa kamangmangan sa pagpili ng diskarte ng kalaban. Sa isang pinalawak na anyo, ang sitwasyong ito ay ipinahayag sa pamamagitan ng isang hugis-itlog na espasyo (patlang ng impormasyon). Sa kawalan ng puwang na ito, ang sitwasyon ng laro ay magkakaroon ng ibang karakter: una, ang isang manlalaro ay kailangang gumawa ng desisyon, at ang isa ay maaaring gawin ito pagkatapos niya.

Klasikong problema sa teorya ng laro

Isaalang-alang natin ang isang klasikong problema sa teorya ng laro. Pangangaso ng usa ay isang kooperatiba na simetriko na laro mula sa teorya ng laro na naglalarawan ng salungatan sa pagitan ng mga personal na interes at pampublikong interes. Ang laro ay unang inilarawan ni Jean-Jacques Rousseau noong 1755:

"Kung sila ay nangangaso ng isang usa, kung gayon naunawaan ng lahat na dahil dito ay obligado siyang manatili sa kanyang puwesto; ngunit kung ang isang liyebre ay tumakbo malapit sa isa sa mga mangangaso, kung gayon walang alinlangan na ang mangangaso na ito, nang walang kirot ng budhi, ay gagawin. humayo sa kanya at, nang maabutan ang biktima, kakaunti ang magdadalamhati na sa ganitong paraan ay pinagkaitan niya ang kanyang mga kasamahan ng biktima."

Ang pangangaso ng usa ay isang klasikong halimbawa ng hamon ng pagbibigay ng kabutihang pampubliko habang tinutukso ang tao na sumuko sa pansariling interes. Dapat bang manatili ang mangangaso sa kanyang mga kasama at tumaya sa isang hindi gaanong kanais-nais na pagkakataon upang maihatid ang malaking biktima sa buong tribo, o dapat ba niyang iwanan ang kanyang mga kasama at ipagkatiwala ang kanyang sarili sa isang mas maaasahang pagkakataon na nangangako sa kanyang sariling pamilya ng isang liyebre?

Pangunahing problema sa teorya ng laro

Isaalang-alang ang isang pangunahing problema sa teorya ng laro na tinatawag na Prisoner's Dilemma.

Dilemma ng bilanggo Isang pangunahing problema sa teorya ng laro, ang mga manlalaro ay hindi palaging magtutulungan sa isa't isa, kahit na ito ay para sa kanilang pinakamahusay na interes na gawin ito. Ang manlalaro (ang "bilanggo") ay ipinapalagay na i-maximize ang kanyang sariling kabayaran nang walang pakialam sa pakinabang ng iba. Ang kakanyahan ng problema ay binuo nina Meryl Flood at Melvin Drescher noong 1950. Ang pangalan ng dilemma ay ibinigay ng mathematician na si Albert Tucker.

Sa dilemma ng bilanggo, pagtataksil mahigpit na nangingibabaw higit sa pagtutulungan, kaya ang tanging posibleng ekwilibriyo ay ang pagtataksil ng parehong kalahok. Sa madaling salita, kahit anong gawin ng ibang manlalaro, mas mananalo ang lahat kung magtaksil. Dahil sa anumang sitwasyon ay mas kumikita ang pagtataksil kaysa makipagtulungan, lahat ng makatuwirang manlalaro ay pipili ng pagkakanulo.

Habang kumikilos ng indibidwal na makatwiran, magkasama ang mga kalahok sa isang hindi makatwirang desisyon: kung pareho silang magtaksil, makakatanggap sila ng mas maliit na kabayaran sa kabuuan kaysa sa kung sila ay nagtutulungan (ang tanging ekwilibriyo sa larong ito ay hindi hahantong sa Pareto-optimal desisyon, i.e. isang desisyon na hindi maaaring mapabuti nang hindi lumalala ang sitwasyon ng iba pang mga elemento.). Doon nakasalalay ang dilemma.

Sa paulit-ulit na dilemma ng bilanggo, ang laro ay nangyayari nang pana-panahon, at ang bawat manlalaro ay maaaring "parusahan" ang isa dahil sa hindi pakikipagtulungan nang mas maaga. Sa ganoong laro, ang pagtutulungan ay maaaring maging isang balanse, at ang insentibo sa pagtataksil ay maaaring malampasan ng banta ng kaparusahan.

Classic Prisoner's Dilemma

Sa lahat ng sistemang panghukuman, ang parusa para sa banditry (paggawa ng mga krimen bilang bahagi ng isang organisadong grupo) ay mas mabigat kaysa sa parehong mga krimen na ginawa nang nag-iisa (kaya ang alternatibong pangalan - "ang dilemma ng bandido").

Ang klasikong pagbabalangkas ng dilemma ng bilanggo ay:

Dalawang kriminal, A at B, ang nahuli nang magkasabay para sa magkatulad na krimen. May dahilan upang maniwala na kumilos sila sa pagsasabwatan, at ang pulisya, na inihiwalay sila sa isa't isa, ay nag-aalok sa kanila ng parehong pakikitungo: kung ang isa ay tumestigo laban sa isa, at siya ay nananatiling tahimik, kung gayon ang una ay inilabas para sa pagtulong sa pagsisiyasat, at ang pangalawa ay tumatanggap ng pinakamataas na sentensiya na pagkakulong (10 taon) (20 taon). Kung pareho silang tahimik, ang kanilang aksyon ay kakasuhan sa ilalim ng mas magaan na artikulo, at sila ay sinentensiyahan ng 6 na buwan (1 taon). Kung pareho silang tumestigo laban sa isa't isa, makakatanggap sila ng pinakamababang sentensiya na 2 taon (5 taon). Pinipili ng bawat bilanggo kung mananatiling tahimik o tumestigo laban sa isa. Gayunpaman, wala sa kanila ang nakakaalam kung ano mismo ang gagawin ng isa pa. Ano ang mangyayari?

Ang laro ay maaaring katawanin sa anyo ng sumusunod na talahanayan:

Lumilitaw ang dilemma kung ipagpalagay natin na ang dalawa ay nag-aalala lamang sa pagliit ng kanilang sariling termino sa bilangguan.

Isipin natin ang pangangatwiran ng isa sa mga bilanggo. Kung ang iyong kapareha ay tahimik, pagkatapos ay mas mahusay na ipagkanulo siya at lumaya (kung hindi - anim na buwan sa bilangguan). Kung ang kasosyo ay tumestigo, pagkatapos ay mas mahusay na tumestigo din laban sa kanya upang makakuha ng 2 taon (kung hindi man - 10 taon). Ang diskarte na "tumestigo" ay mahigpit na nangingibabaw sa diskarte na "manatiling tahimik". Katulad nito, ang isa pang bilanggo ay dumating sa parehong konklusyon.

Mula sa pananaw ng grupo (ang dalawang bilanggo na ito), pinakamahusay na magtulungan sa isa't isa, manahimik at makakuha ng anim na buwan bawat isa, dahil mababawasan nito ang kabuuang termino ng bilangguan. Ang anumang iba pang solusyon ay hindi gaanong kumikita.

Pangkalahatang anyo

  1. Ang laro ay binubuo ng dalawang manlalaro at isang bangkero. Ang bawat manlalaro ay may hawak na 2 card: ang isa ay nagsasabing "magtulungan", ang isa ay nagsasabing "depekto" (ito ang karaniwang terminolohiya ng laro). Ang bawat manlalaro ay naglalagay ng isang card na nakaharap sa harap ng banker (iyon ay, walang nakakaalam ng desisyon ng iba, kahit na ang pag-alam sa desisyon ng ibang tao ay hindi makakaapekto sa pagsusuri ng dominasyon). Binubuksan ng bangkero ang mga card at ibibigay ang mga panalo.
  2. Kung pipiliin ng dalawa na magtulungan, parehong tatanggap C. Kung pinili ng isa ang "magkanulo", ang isa ay "makipagtulungan" - ang una ay tumatanggap D, pangalawa Sa. Kung parehong pinili ang "pagkanulo", pareho ang tatanggap d.
  3. Ang mga halaga ng mga variable na C, D, c, d ay maaaring maging anumang tanda (sa halimbawa sa itaas, lahat ay mas mababa sa o katumbas ng 0). Ang hindi pagkakapantay-pantay D > C > d > c ay dapat masiyahan para ang laro ay maging Prisoner's Dilemma (PD).
  4. Kung ang laro ay paulit-ulit, iyon ay, nilalaro ng higit sa 1 beses sa isang hilera, ang kabuuang kabayaran mula sa pakikipagtulungan ay dapat na mas malaki kaysa sa kabuuang kabayaran sa isang sitwasyon kung saan ang isa ay nagtataksil at ang isa ay hindi, iyon ay, 2C > D + c .

Ang mga patakarang ito ay itinatag ni Douglas Hofstadter at bumubuo ng kanonikal na paglalarawan ng karaniwang suliranin ng bilanggo.

Katulad ngunit magkaibang laro

Iminungkahi ni Hofstadter na mas madaling maunawaan ng mga tao ang mga problema tulad ng dilemma ng bilanggo kung ipapakita ang mga ito bilang isang hiwalay na proseso ng laro o pangangalakal. Isang halimbawa ay “ pagpapalitan ng mga saradong bag»:

Dalawang tao ang nagkikita at nagpapalitan ng mga saradong bag, na napagtatanto na ang isa sa kanila ay naglalaman ng pera, ang isa ay naglalaman ng mga kalakal. Maaaring igalang ng bawat manlalaro ang deal at ilagay ang napagkasunduan sa bag, o linlangin ang partner sa pamamagitan ng pagbibigay ng walang laman na bag.

Sa larong ito, ang pagdaraya ay palaging ang pinakamahusay na solusyon, na nangangahulugan din na ang mga makatuwirang manlalaro ay hindi kailanman maglalaro ng laro at na walang merkado para sa pangangalakal ng mga closed bag.

Paglalapat ng teorya ng laro upang makagawa ng mga desisyon sa estratehikong pamamahala

Kasama sa mga halimbawa ang mga desisyon tungkol sa pagpapatupad ng isang maprinsipyong patakaran sa pagpepresyo, pagpasok sa mga bagong merkado, pakikipagtulungan at paglikha ng mga joint venture, pagtukoy sa mga pinuno at tagapalabas sa larangan ng inobasyon, patayong pagsasama, atbp. Ang mga prinsipyo ng teorya ng laro sa prinsipyo ay maaaring gamitin para sa lahat ng uri ng mga desisyon kung sila ay naiimpluwensyahan ng iba. mga karakter. Ang mga indibidwal na ito, o mga manlalaro, ay hindi kinakailangang maging mga kakumpitensya sa merkado; ang kanilang tungkulin ay maaaring mga subsupplier, nangungunang mga customer, empleyado ng mga organisasyon, pati na rin ang mga kasamahan sa trabaho.

 Ito ay lalong ipinapayong gumamit ng mga tool sa teorya ng laro kapag may mahalagang dependencies sa pagitan ng mga kalahok sa proseso sa larangan ng mga pagbabayad. Ang sitwasyon na may mga posibleng kakumpitensya ay ipinapakita sa Fig. 2.

 Mga kuwadrante 1 At 2 tukuyin ang isang sitwasyon kung saan ang reaksyon ng mga kakumpitensya ay walang makabuluhang epekto sa mga pagbabayad ng kumpanya. Nangyayari ito sa mga kaso kung saan ang kakumpitensya ay walang motibasyon (field 1 ) o mga kakayahan (field 2 ) gumanti. Samakatuwid, hindi na kailangan ng isang detalyadong pagsusuri ng diskarte ng mga motivated na aksyon ng mga kakumpitensya.

Ang isang katulad na konklusyon ay sumusunod, bagama't para sa ibang dahilan, at para sa sitwasyong makikita ng quadrant 3 . Dito, ang reaksyon ng mga kakumpitensya ay maaaring magkaroon ng isang makabuluhang epekto sa kumpanya, ngunit dahil ang sarili nitong mga aksyon ay hindi makakaapekto sa mga pagbabayad ng isang kakumpitensya, kung gayon ang isa ay hindi dapat matakot sa reaksyon nito. Ang isang halimbawa ay ang mga desisyon na pumasok sa isang angkop na lugar sa merkado: sa ilalim ng ilang mga pangyayari, ang malalaking kakumpitensya ay walang dahilan upang tumugon sa naturang desisyon ng isang maliit na kumpanya.

Tanging ang sitwasyon na ipinapakita sa kuwadrante 4 (ang posibilidad ng mga hakbang sa paghihiganti ng mga kasosyo sa merkado) ay nangangailangan ng paggamit ng mga probisyon ng teorya ng laro. Gayunpaman, ang mga ito ay kinakailangan lamang ngunit hindi sapat na mga kundisyon upang bigyang-katwiran ang paggamit ng isang balangkas ng teorya ng laro upang labanan ang mga kakumpitensya. May mga sitwasyon kung saan ang isang diskarte ay walang alinlangan na mangibabaw sa lahat ng iba pa, anuman ang mga aksyon na gagawin ng kakumpitensya. Kung kukunin natin, halimbawa, ang merkado ng gamot, kadalasang mahalaga para sa isang kumpanya na ang unang mag-anunsyo bagong produkto sa merkado: ang tubo ng "pioneer" ay lumalabas na napakalaki na ang lahat ng iba pang "manlalaro" ay maaari lamang mabilis na paigtingin ang mga aktibidad sa pagbabago.

 Ang isang maliit na halimbawa ng isang "dominant na diskarte" mula sa pananaw ng teorya ng laro ay ang desisyon tungkol sa pagpasok sa isang bagong merkado. Kunin natin ang isang negosyo na kumikilos bilang isang monopolist sa anumang merkado (halimbawa, IBM sa merkado ng personal na computer noong unang bahagi ng 80s). Ang isa pang negosyo, na nagpapatakbo, halimbawa, sa merkado ng mga kagamitan sa peripheral ng computer, ay isinasaalang-alang ang isyu ng pagtagos sa merkado ng personal na computer sa pamamagitan ng muling pagsasaayos ng produksyon nito. Ang isang kumpanya sa labas ay maaaring magpasya na pumasok o hindi pumasok sa merkado. Ang isang monopolistang kumpanya ay maaaring tumugon nang agresibo o palakaibigan sa paglitaw ng isang bagong kakumpitensya. Ang parehong mga kumpanya ay pumasok sa isang dalawang yugto ng laro kung saan ang kumpanyang tagalabas ay gumagawa ng unang hakbang. Ang sitwasyon ng laro na nagpapahiwatig ng mga pagbabayad ay ipinapakita sa anyo ng isang puno sa Fig. 3.

 Ang parehong sitwasyon ng laro ay maaaring ipakita sa normal na anyo (Fig. 4).

Mayroong dalawang estado na nakasaad dito - "entry/friendly reaction" at "non-entry/aggressive reaction". Malinaw, ang pangalawang ekwilibriyo ay hindi mapanghawakan. Mula sa pinalawak na anyo, sumusunod na para sa isang kumpanya na nakapagtatag na ng isang foothold sa merkado, hindi naaangkop na agresibong reaksyon sa paglitaw ng isang bagong kakumpitensya: na may agresibong pag-uugali, ang kasalukuyang monopolist ay tumatanggap ng 1 (pagbabayad), at may palakaibigan. pag-uugali - 3. Alam din ng kumpanyang tagalabas na hindi makatwiran para sa monopolist na simulan ang mga aksyon na alisin ito, at samakatuwid ay nagpasya itong pumasok sa merkado. Ang kumpanyang tagalabas ay hindi sasagutin ang bantang pagkalugi ng (-1).

Katulad makatwirang ekwilibriyo katangian ng isang "bahagyang pinabuting" laro, na sadyang hindi kasama ang mga walang katotohanang galaw. Sa pagsasagawa, ang gayong mga estado ng balanse ay, sa prinsipyo, ay medyo madaling mahanap. Ang mga pagsasaayos ng balanse ay maaaring matukoy gamit ang isang espesyal na algorithm mula sa larangan ng pananaliksik sa pagpapatakbo para sa anumang may hangganang laro. Ang gumagawa ng desisyon ay nagpapatuloy sa mga sumusunod: una, ang pagpili ng "pinakamahusay" na hakbang ay ginawa sa huling yugto laro, pagkatapos ay pipiliin ang "pinakamahusay" na paglipat sa nakaraang yugto, isinasaalang-alang ang pagpili sa huling yugto, at iba pa, hanggang sa maabot ang panimulang node ng puno ng laro.

Paano makikinabang ang mga kumpanya mula sa pagsusuri na nakabatay sa teorya ng laro? Halimbawa, mayroong isang kilalang kaso ng conflict of interest sa pagitan ng IBM at Telex. Kaugnay ng anunsyo ng mga plano sa paghahanda ng huli para sa pagpasok sa merkado, isang pulong ng "krisis" ng pamamahala ng IBM ang ginanap, kung saan nasuri ang mga hakbang na naglalayong pilitin ang bagong kakumpitensya na talikuran ang intensyon nito na tumagos sa bagong merkado. Tila nalaman ng Telex ang mga pangyayaring ito. Ang isang pagsusuri batay sa teorya ng laro ay nagpakita na ang mga banta sa IBM dahil sa mataas na gastos ay walang batayan. Iminumungkahi nito na kapaki-pakinabang para sa mga kumpanya na isaalang-alang ang mga posibleng reaksyon ng kanilang mga kasosyo sa paglalaro. Ang mga hiwalay na kalkulasyon sa ekonomiya, kahit na ang mga batay sa teorya ng paggawa ng desisyon, ay kadalasan, tulad ng inilarawan sa sitwasyon, limitado sa kalikasan. Kaya, maaaring piliin ng isang kumpanyang tagalabas ang "hindi pagpasok" na hakbang kung makumbinsi ito ng isang paunang pagsusuri na ang pagpasok sa merkado ay magdudulot ng agresibong reaksyon mula sa monopolista. Sa kasong ito, alinsunod sa inaasahang pamantayan ng halaga, makatwirang piliin ang paglipat na "hindi interbensyon" na may posibilidad ng isang agresibong tugon na 0.5.

 Ang sumusunod na halimbawa ay nauugnay sa tunggalian ng mga kumpanya sa larangan teknolohiyang pamumuno. Ang panimulang sitwasyon ay kapag ang enterprise 1 dati ay may teknolohikal na kahusayan, ngunit sa kasalukuyan ay may mas kaunting mga mapagkukunang pinansyal upang siyentipikong pananaliksik at pag-unlad (R&D) kaysa sa katunggali nito. Ang parehong mga kumpanya ay dapat magpasya kung susubukan na makamit ang pandaigdigang pangingibabaw sa merkado sa kani-kanilang lugar ng teknolohiya sa pamamagitan ng malalaking pamumuhunan sa kapital. Kung ang parehong mga kakumpitensya ay namuhunan ng malaking halaga ng pera sa negosyo, kung gayon ang mga prospect para sa tagumpay ng negosyo 1 ay magiging mas mahusay, kahit na ito ay magkakaroon ng malaking gastos sa pananalapi (tulad ng enterprise 2 ). Sa Fig. 5 ang sitwasyong ito ay kinakatawan ng mga pagbabayad na may mga negatibong halaga.

Para sa negosyo 1 ito ay pinakamahusay na kung ang enterprise 2 tumangging makipagkumpetensya. Ang kanyang benepisyo sa kasong ito ay magiging 3 (mga pagbabayad). Malamang ang enterprise 2 ay manalo sa kumpetisyon kapag ang enterprise 1 ay tatanggap ng pinababang programa sa pamumuhunan, at ang negosyo 2 - mas malawak. Ang posisyon na ito ay makikita sa kanang itaas na kuwadrante ng matrix.

Ang pagsusuri sa sitwasyon ay nagpapakita na ang ekwilibriyo ay nangyayari sa mataas na gastos sa R&D ng negosyo 2 at mababang negosyo 1 . Sa anumang iba pang senaryo, ang isa sa mga kakumpitensya ay may dahilan upang lumihis mula sa madiskarteng kumbinasyon: halimbawa, para sa isang negosyo 1 mas mainam ang pinababang badyet kung ang negosyo 2 tatanggi na lumahok sa kumpetisyon; sa parehong oras sa enterprise 2 Ito ay kilala na kapag ang mga gastos ng isang kakumpitensya ay mababa, ito ay kumikita para sa kanya na mamuhunan sa pananaliksik at pag-unlad.

Ang isang negosyo na may teknolohikal na kalamangan ay maaaring gumamit ng pagsusuri sa sitwasyon batay sa teorya ng laro upang sa huli ay makamit ang pinakamainam na resulta para sa sarili nito. Sa tulong ng isang tiyak na senyales, dapat itong ipakita na handa itong gumawa ng malalaking paggasta sa pananaliksik at pagpapaunlad. Kung ang naturang signal ay hindi natanggap, pagkatapos ay para sa enterprise 2 ito ay malinaw na ang enterprise 1 pinipili ang opsyon na mura.

Ang pagiging maaasahan ng signal ay dapat mapatunayan ng mga obligasyon ng negosyo. Sa kasong ito, maaaring ito ang desisyon ng negosyo 1 sa pagbili ng mga bagong laboratoryo o pagkuha ng karagdagang tauhan ng pananaliksik.

Mula sa punto ng view ng teorya ng laro, ang mga naturang obligasyon ay katumbas ng pagbabago ng takbo ng laro: ang sitwasyon ng sabay-sabay na paggawa ng desisyon ay pinalitan ng isang sitwasyon ng sunud-sunod na mga galaw. kumpanya 1 matatag na nagpapakita ng intensyon na gumawa ng malalaking paggasta, ang negosyo 2 nirerehistro ang hakbang na ito at wala na siyang dahilan para lumahok sa tunggalian. Ang bagong ekwilibriyo ay sumusunod mula sa senaryo na "hindi pakikilahok ng negosyo 2 " at "mataas na gastos sa pananaliksik at pagpapaunlad ng negosyo 1 ".

 Kasama rin sa mga kilalang lugar ng aplikasyon ng mga pamamaraan ng teorya ng laro diskarte sa pagpepresyo, paglikha ng joint ventures, timing ng bagong product development.

Nagmumula ang mahahalagang kontribusyon sa paggamit ng teorya ng laro gawaing pang-eksperimento. Maraming mga teoretikal na kalkulasyon ang sinusuri sa mga kondisyon ng laboratoryo, at ang mga resultang nakuha ay nagsisilbing impetus para sa mga practitioner. Theoretically, ito ay nilinaw sa ilalim ng kung anong mga kundisyon ito ay ipinapayong para sa dalawang makasariling pag-iisip na mga kasosyo upang makipagtulungan at makamit ang mas mahusay na mga resulta para sa kanilang sarili.

Maaaring gamitin ang kaalamang ito sa pagsasanay sa negosyo upang matulungan ang dalawang kumpanya na makamit ang sitwasyong panalo/panalo. Sa ngayon, mabilis at malinaw na tinutukoy ng mga consultant na sinanay sa paglalaro ang mga pagkakataong maaaring samantalahin ng mga negosyo para makakuha ng matatag at pangmatagalang kontrata sa mga customer, sub-supplier, kasosyo sa pag-unlad, at iba pa.

Mga problema ng praktikal na aplikasyon sa pamamahala

Siyempre, dapat itong ituro na may ilang mga limitasyon sa paggamit ng mga tool sa analytical ng teorya ng laro. Sa mga sumusunod na kaso, magagamit lamang ito kung may nakuhang karagdagang impormasyon.

Una, ito ang kaso kapag ang mga negosyo ay may iba't ibang ideya tungkol sa larong kanilang nilalaro, o kapag hindi sila sapat na alam tungkol sa mga kakayahan ng bawat isa. Halimbawa, maaaring may hindi malinaw na impormasyon tungkol sa mga pagbabayad ng isang kakumpitensya (estruktura ng gastos). Kung ang impormasyon na hindi masyadong kumplikado ay nailalarawan sa pamamagitan ng hindi kumpleto, kung gayon ang isa ay maaaring gumana sa pamamagitan ng paghahambing katulad na mga kaso napapailalim sa ilang mga pagkakaiba.

Pangalawa, Ang teorya ng laro ay mahirap ilapat sa maraming sitwasyon ng ekwilibriyo. Ang problemang ito ay maaaring lumitaw kahit na sa mga simpleng laro na may sabay-sabay na mga madiskarteng desisyon.

pangatlo, Kung ang madiskarteng sitwasyon sa paggawa ng desisyon ay napakakumplikado, kadalasan ay hindi maaaring piliin ng mga manlalaro ang pinakamahusay na mga opsyon para sa kanilang sarili. Madaling isipin ang isang mas kumplikadong sitwasyon sa pagtagos ng merkado kaysa sa tinalakay sa itaas. Halimbawa, ang ilang mga negosyo ay maaaring pumasok sa merkado sa iba't ibang oras, o ang reaksyon ng mga negosyo na tumatakbo na doon ay maaaring mas kumplikado kaysa sa pagiging agresibo o palakaibigan.

Napatunayan na sa eksperimento na kapag lumawak ang laro sa sampu o higit pang mga yugto, hindi na magagamit ng mga manlalaro ang naaangkop na mga algorithm at ipagpatuloy ang laro na may mga diskarte sa equilibrium.

Ang teorya ng laro ay hindi ginagamit nang madalas. Sa kasamaang palad, ang mga totoong sitwasyon sa mundo ay kadalasang napakasalimuot at mabilis na nagbabago na imposibleng tumpak na mahulaan kung paano tutugon ang mga kakumpitensya sa pagbabago ng mga taktika ng kumpanya. Gayunpaman, kapaki-pakinabang ang teorya ng laro pagdating sa pagtukoy sa pinakamahalagang salik na dapat isaalang-alang sa isang mapagkumpitensyang sitwasyon sa paggawa ng desisyon. Mahalaga ang impormasyong ito dahil pinapayagan nito ang pamamahala na isaalang-alang ang mga karagdagang variable o salik na maaaring makaapekto sa sitwasyon, at sa gayon ay madaragdagan ang pagiging epektibo ng desisyon.

Sa konklusyon, dapat itong lalo na bigyang-diin na ang teorya ng laro ay isang napaka-komplikadong larangan ng kaalaman. Kapag hinahawakan ito, dapat kang maging maingat at malinaw na alam ang mga limitasyon ng paggamit nito. Masyadong simpleng mga interpretasyon, pinagtibay man ng kompanya mismo o sa tulong ng mga consultant, ay puno ng mga nakatagong panganib. Dahil sa kanilang pagiging kumplikado, ang pagsusuri sa teorya ng laro at konsultasyon ay inirerekomenda lamang para sa mga partikular na mahahalagang lugar ng problema. Ang karanasan ng mga kumpanya ay nagpapakita na ang paggamit ng naaangkop na mga tool ay mas kanais-nais kapag gumagawa ng isang beses, pangunahing mahalagang binalak na mga madiskarteng desisyon, kabilang ang kapag naghahanda ng malalaking kasunduan sa pakikipagtulungan.

Bibliograpiya

1. Game theory at economic behavior, von Neumann J., Morgenstern O., Science publishing house, 1970

2. Petrosyan L.A., Zenkevich N.A., Semina E.A. Teorya ng laro: Teksbuk. manwal para sa mga unibersidad - M.: Mas mataas. paaralan, Book House "University", 1998

3. Dubina I. N. Mga Batayan ng teorya ng mga larong pang-ekonomiya: aklat-aralin. - M.: KNORUS, 2010

4. Archive ng journal "Mga Problema ng Teorya at Practice ng Pamamahala", Rainer Voelker

5. Teorya ng laro sa pamamahala ng mga sistema ng organisasyon. 2nd edition., Gubko M.V., Novikov D.A. 2005


- J. J. Rousseau. Nangangatuwiran tungkol sa pinagmulan at mga pundasyon ng hindi pagkakapantay-pantay sa pagitan ng mga tao // Treatises / Trans. mula sa Pranses A. Khayutina - M.: Nauka, 1969. - P. 75.

Ipadala ang iyong mabuting gawa sa base ng kaalaman ay simple. Gamitin ang form sa ibaba

Magaling sa site">

Ang mga mag-aaral, nagtapos na mga estudyante, mga batang siyentipiko na gumagamit ng base ng kaalaman sa kanilang pag-aaral at trabaho ay lubos na magpapasalamat sa iyo.

Nai-post sa http://www.allbest.ru/

Federal Communications Agency

Siberian Pambansang Unibersidad Telekomunikasyon at Computer Science

Interregional center para sa muling pagsasanay ng mga espesyalista

Pagsusulit

Disiplina: Institutional Economics

Nakumpleto ni: Lapina E.N.

Pangkat: EBT-52

Pagpipilian:4

Novosibirsk, 2016

PANIMULA

Ang sinumang tao sa buong mundo araw-araw ay nagsasagawa ng ilang mga aksyon, gumagawa ng isang pagpipilian para sa kanyang sarili sa isang bagay. Upang makagawa ng anumang mga aksyon, ang isang tao ay kailangang mag-isip tungkol sa kanilang mga kahihinatnan, piliin ang pinaka tama, makatuwiran sa lahat ng posibleng mga desisyon. Ang pagpili ay dapat gawin batay sa sariling interes o grupo, depende sa kung kanino nalalapat ang desisyon (isang indibidwal o isang grupo, ang organisasyon sa kabuuan).

Ang mga institusyon ay nilikha ng mga tao upang mapanatili ang kaayusan at mabawasan ang kawalan ng katiyakan ng palitan. Nagbibigay sila ng predictability sa pag-uugali ng mga tao. Pinapayagan tayo ng mga institusyon na i-save ang ating mga kakayahan sa pag-iisip, dahil natutunan natin ang mga patakaran, maaari tayong umangkop panlabas na kapaligiran nang hindi sinusubukang unawain at unawain ito. Petrosyan L.A., Zenkevich N.A., Shevkoplyas E.V.: Teorya ng laro: textbook. Publisher: BHV, 2012.-P.18.

Ang mga institusyon ay ang "mga tuntunin ng laro" sa lipunan, o, mas pormal, mga hangganan na gawa ng tao na nag-aayos ng mga relasyon sa pagitan ng mga tao. Labsker L.G., Yashchenko N.A.: Teorya ng laro sa ekonomiya. Workshop na may paglutas ng problema. Pagtuturo. Publisher: Knorus, 2014.-P.21. Lumilitaw ang mga institusyon upang lutasin ang mga problema na nagmumula sa paulit-ulit na pakikipag-ugnayan sa pagitan ng mga tao. Kasabay nito, hindi lamang nila dapat lutasin ang problema, ngunit bawasan din ang mga mapagkukunang ginugol sa paglutas nito.

Ang teorya ng laro ay isang mathematical na pamamaraan para sa pag-aaral ng mga pinakamainam na estratehiya sa mga laro. Ang laro ay isang proseso kung saan lumalahok ang dalawa o higit pang partido, na naglalaban upang mapagtanto ang kanilang mga interes. Ang bawat panig ay may sariling layunin at gumagamit ng ilang diskarte na maaaring humantong sa panalo o pagkatalo - depende sa pag-uugali nito at pag-uugali ng iba pang mga manlalaro. Ang teorya ng laro ay nakakatulong na pumili ng mga pinakakumikitang diskarte, na isinasaalang-alang ang ilang mga kadahilanan:

1. pagsasaalang-alang tungkol sa iba pang kalahok;

2. mapagkukunan ng mga kalahok;

3. inaasahang kilos ng mga kalahok.

Sa teorya ng laro, ipinapalagay na ang mga function ng kabayaran at ang hanay ng mga diskarte na magagamit sa bawat manlalaro ay karaniwang kilala, i.e. Alam ng bawat manlalaro ang kanyang sariling function ng payoff at ang hanay ng mga diskarte sa kanyang pagtatapon, pati na rin ang mga function at diskarte sa pagbabayad ng lahat ng iba pang mga manlalaro, at bumubuo ng kanyang pag-uugali alinsunod sa impormasyong ito.

Ang kaugnayan ng paksa ay nakasalalay sa malawak na hanay ng mga aplikasyon ng teorya ng laro sa pagsasanay (biology, sosyolohiya, matematika, pamamahala, atbp.). Partikular sa ekonomiya - sa mga sandaling hindi sila gumagana teoretikal na batayan mga teorya ng pagpili sa klasikal na teorya ng ekonomiya, na binubuo, halimbawa, sa katotohanan na ang mamimili ay gumagawa ng kanyang pagpili nang makatwiran, siya ay ganap na nakakaalam ng sitwasyon sa isang partikular na merkado at tungkol sa isang partikular na produkto.

KABANATA 1. TEORETIKAL NA PUNDASYON NG TEORYANG LARO

1.1 KONSEPTO NG TEORYANG LARO

Tulad ng nabanggit sa itaas, ang teorya ng laro ay isang sangay ng matematika na nag-aaral ng mga pormal na modelo para sa paggawa ng pinakamainam na mga desisyon sa mga kondisyon ng salungatan. Sa kasong ito, ang salungatan ay nauunawaan bilang isang kababalaghan kung saan ang iba't ibang partido ay kasangkot, na pinagkalooban ng iba't ibang mga interes at pagkakataon upang piliin ang mga aksyon na magagamit sa kanila alinsunod sa mga interes na ito. Ang bawat panig ay may sariling layunin at gumagamit ng ilang diskarte na maaaring humantong sa panalo o pagkatalo - depende sa pag-uugali ng ibang mga manlalaro. Tumutulong ang teorya ng laro na pumili ng pinakamahusay na mga diskarte na isinasaalang-alang ang mga ideya tungkol sa iba pang mga kalahok, kanilang mga mapagkukunan at kanilang mga posibleng aksyon

Ang teorya ng laro ay nagmula sa neoclassical economics. Ang matematikal na aspeto at aplikasyon ng teorya ay unang binalangkas sa klasikong 1944 na aklat nina John von Neumann at Oscar Morgenstern, Game Theory at Economic Behavior.

Ang laro ay isang pinasimple na pormal na modelo ng isang tunay na sitwasyon ng salungatan. Sa matematika, ang pormalisasyon ay nangangahulugan na ang ilang mga patakaran para sa mga aksyon ng mga partido sa panahon ng laro ay binuo: mga opsyon para sa mga aksyon ng mga partido; ang kinalabasan ng laro para sa opsyong ito; ang dami ng impormasyon na mayroon ang bawat partido tungkol sa pag-uugali ng lahat ng iba pang partido.

Ang mga sitwasyon kung saan ang mga interes ng dalawang partido ay nagbanggaan at ang resulta ng anumang operasyon na isinagawa ng isa sa mga partido ay nakasalalay sa mga aksyon ng kabilang partido ay tinatawag na mga sitwasyon ng salungatan.

Ang manlalaro ay isa sa mga partido sa sitwasyon ng laro. Ang diskarte ng manlalaro ay ang kanyang mga panuntunan sa pagkilos sa bawat posibleng sitwasyon ng laro. Ang dominasyon sa teorya ng laro ay isang sitwasyon kung saan ang isa sa mga diskarte ng ilang manlalaro ay nagbibigay mas malaking panalo kaysa sa isa, anuman ang anumang aksyon ng kanyang mga kalaban. Protasov I.D. Teorya ng laro at pananaliksik sa pagpapatakbo: aklat-aralin. allowance. - M.: Helios ARV, 2013.-P.121.

Ang focal point ay ang equilibrium sa laro ng koordinasyon, na pinili ng lahat ng kalahok sa pakikipag-ugnayan batay sa karaniwang kaalaman na tumutulong sa kanila na i-coordinate ang kanilang pinili. Ang konsepto ng isang focal point ay ipinakilala ng laureate Nobel Prize 2005 ng ekonomista na si Thomas Schelling sa isang artikulo noong 1957 na naging ikatlong kabanata ng kanyang sikat na aklat na The Strategy of Conflict (1960).

Kung mayroong mahigpit na nangingibabaw na diskarte para sa isa sa mga manlalaro, gagamitin niya ito sa alinman sa Nash equilibria sa laro. Kung ang lahat ng mga manlalaro ay may mahigpit na nangingibabaw na mga diskarte, ang laro ay may natatanging Nash equilibrium. Gayunpaman, ang ekwilibriyong ito ay hindi nangangahulugang magiging mahusay sa Pareto, i.e. Ang mga resulta ng disequilibrium ay maaaring magbigay sa lahat ng mga manlalaro ng mas malaking kabayaran. Ang isang klasikong halimbawa ng sitwasyong ito ay ang larong Prisoner's Dilemma. Ang Nash equilibrium ay isang hanay ng mga estratehiya (isa para sa bawat manlalaro) na walang manlalaro na may insentibo na lumihis sa kanyang diskarte. Magiging mahusay ang Pareto ang isang sitwasyon kung hindi mapapabuti ng alinmang manlalaro ang posisyon nito nang hindi pinapalala ang ibang manlalaro.

Ito rin ay nagkakahalaga ng pagbanggit sa Stackelberg equilibrium. Ang Stackelberg equilibrium ay isang sitwasyon kung saan wala sa mga manlalaro ang maaaring tumaas ang kanilang kabayaran nang unilaterally, at ang mga desisyon ay unang ginawa ng isang manlalaro at nakikilala ng pangalawang manlalaro. Hindi tulad ng ekwilibriyo ng mga dominanteng estratehiya at ang ekwilibriyong Nash, ang ganitong uri ng ekwilibriyo ay laging umiiral.

Ang teorya ng laro ay maaaring bigyang-kahulugan sa dalawang paraan: matrix at graphic. Paraan ng matrix ay ilarawan sa ibaba, kung saan ang mga sitwasyon na humahantong sa paglitaw ng mga institusyon ay isasaalang-alang.

Halimbawa graphic na larawan Tingnan natin ang sumusunod na sitwasyon, kung saan mayroong isang pastulan para sa pastulan ng mga baka. Ngayon ay tanungin natin ang tanong: sa anong bilang ng mga baka, n, magiging pinakamainam ang paggamit ng pastulan na ito? Alinsunod sa prinsipyo ng marginal optimization, na ipinapalagay ang equation ng marginal cost at marginal revenue, dapat itong sagutin na ang pinakamainam na bilang ng mga baka ay ang bilang ng mga baka kung saan ang halaga karagdagang produkto mula sa pagpapastol ng huling baka, ang VMP, ay magiging katumbas ng halaga ng isang baka, s. Sa ilalim ng mga kundisyon ng pribadong pagmamay-ari ng pastulan na ito, ang prinsipyong ito ay susundin, dahil ang indibidwal na may-ari ay ihahambing ang mga benepisyo at gastos na nauugnay sa bawat karagdagang baka, at maninirahan sa bilang ng mga ito, Ep, kung saan ang posibilidad na makakuha ng positibong ang upa mula sa mga bakang nagpapastol sa pastulan , Rp, ay mauubos, at, nang naaayon, ang maximum ng upa na ito ay maaabot (Larawan 1). Binubuod ito sa equation sa ibaba, kung saan pinalaki ng marginal na prinsipyo ang pagkakaiba sa pagitan ng halaga ng kabuuang produkto, VTP, at kabuuang gastos, ibig sabihin, ang halaga ng isang baka ay di-minuto sa bilang ng mga baka.

VMP (n*) = c maxn VTP (n) - cn (1)

Figure 1. - Graph ng halaga ng maximum at average grazing ng mga baka

Gayunpaman, sa mga kondisyon ng libreng pag-access sa pastulan, ibig sabihin, ang kawalan ng eksklusibong mga karapatan dito, ang marginal optimization na prinsipyo ay hindi susundin at ang bilang ng mga baka sa pastulan ay lalampas sa pinakamainam na halaga, Ep, at aabot sa punto ng pagkakapantay-pantay ng halaga ng karaniwang produkto mula sa pagpapapastol ng baka, VAP, at ang halaga ng baka . Bilang resulta, magkakaroon ng bagong ekwilibriyong bilang ng mga baka sa ilalim ng mga kondisyon ng libreng pag-access, EU. Sa kasong ito, ang positibong upa, Rp, na nilikha ng mga bakang nagpapastol hanggang sa maabot ang kanilang pinakamainam na bilang, Ep, ay masasayang sa karagdagang mga baka at, sa pag-abot sa puntong Ec, ay magiging katumbas ng zero bilang resulta ng akumulasyon ng negatibong upa na katumbas nito sa modulus. Ito ay buod sa mga equation sa ibaba:

VTP (n")/n"=c?VTP (n")-cn"=0;

1.2 PAGKAKAIBA NG MGA SITWASYON AT MGA LUGAR NG BUHAY NG TAO KUNG SAAN ANG TEORYANG LARO AY ANGKOP

Sa buhay, maraming mga halimbawa ng mga pag-aaway sa pagitan ng magkasalungat na panig, na may anyo ng isang salungatan sa dalawang aktibong partido na humahabol sa magkasalungat na interes.

Ang ganitong mga sitwasyon ay lumitaw, halimbawa, pagdating sa pagtitiwala. Ang pagsunod sa mga aksyon ng counterparty sa mga inaasahan ay nagiging lalong mahalaga sa mga sitwasyon kung saan ang panganib ng mga desisyon na ginawa ng isang indibidwal ay tinutukoy ng mga aksyon ng counterparty. Ang mga modelo ng teorya ng laro ay ang pinakamahusay na paglalarawan nito: ang pagpili ng isang manlalaro ng isang partikular na diskarte ay nakasalalay sa mga aksyon ng isa pang manlalaro. Ang pagtitiwala ay "ang pag-asa sa ilang mga aksyon ng iba na nakakaimpluwensya sa pagpili ng indibidwal, kapag ang indibidwal ay dapat magsimulang kumilos bago sila maging mga kilalang aksyon mga nasa paligid mo." Bigyang-diin natin ang koneksyon ng mga transaksyon sa merkado nang may tiwala sa isang depersonalized na anyo (pagtitiwala bilang isang pamantayan na kumokontrol sa mga relasyon sa pagitan ng mga indibidwal), dahil ang bilog ng mga kalahok sa mga transaksyon ay hindi dapat limitado sa mga personal na kakilala. Ang sumusunod na modelo ay tumutulong na i-verify ang pangangailangan para sa pagkakaroon ng tiwala sa isang depersonalized na form upang maisagawa ang pinakasimpleng transaksyon sa merkado gamit ang prepayment (Larawan 2).

Figure 2

Ipagpalagay na ang mamimili ay nakaharap ng maraming nagbebenta at alam mula sa kanyang nakaraang karanasan sa negosyo ang posibilidad ng pandaraya (1 - p). Magkalkula tayo ng halaga p kung saan ang transaksyon ay maganap, ibig sabihin, ang "paunang pagbabayad" ay isang evolutionary stable na diskarte.

EU (magsagawa ng paunang bayad) = 10p - 5(1 - r) = 15p - 5,

EU(huwag gumawa ng advance payment) = 0.15p - -5 > 0, p>1/3.

Sa madaling salita, kung ang antas ng tiwala ng mamimili sa mga nagbebenta ay mas mababa sa 33.3%, ang mga transaksyon na may prepayment sa ilalim ng mga ibinigay na kundisyon ay magiging imposible. Sa madaling salita, ang p = 1/3 ay ang kritikal, pinakamababang kinakailangang antas ng tiwala.

Upang gawing pangkalahatan ang mga resulta, pinapalitan namin ang mga partikular na halaga ng mga panalo ng mamimili (10) at pagkalugi (--5) ng mga simbolo na G at L. Pagkatapos, sa nakaraang istraktura ng laro, ang transaksyon ay magaganap sa

Kung mas mataas ang halaga ng pagkalugi na nauugnay sa kita, mas mataas ang antas ng tiwala sa pagitan ng mga partido sa transaksyon. Inilarawan ni James Coleman ang pag-asa ng pangangailangan para sa tiwala sa mga tuntunin ng transaksyon tulad ng sumusunod (Larawan 3).

Larawan 3

Ang kinakalkula na data sa minimum na kinakailangang antas ng tiwala ay kinumpirma nang empirically. Kaya, ang antas ng depersonalized na tiwala sa mga bansang may maunlad na ekonomiya ng merkado, sinusukat sa pamamagitan ng pagsagot sa tanong na: “Batay sa iyong Personal na karanasan, sa tingin mo ba mapagkakatiwalaan ang mga tao sa paligid mo? ", ay 94% sa Denmark 24, 90 sa Germany, 88 sa Great Britain, 84 sa France, 72 sa hilagang Italy at 65% sa timog. Ang mababang antas ng tiwala sa katimugang Italya, kung saan ang mafia ay tradisyonal na malakas, ay nagpapahiwatig. Ito ay hindi nagkataon na isa sa mga mananaliksik ng mafia, si D. Gambetta, ay nagpapaliwanag nang kritikal sa paglitaw nito. mababang antas nagtitiwala sa katimugang mga rehiyon ng Italya at, samakatuwid, ang pangangailangan para sa isang kapalit para sa tiwala, na nasa anyo ng interbensyon ng isang "third party" na pinagkakatiwalaan ng parehong partido sa transaksyon.

Ang isa pang kapansin-pansing halimbawa ng teorya ng laro ay ang mga kontrata sa pagitan ng isang mamumuhunan at ng estado para sa pagbuo ng mga deposito ng mineral.

Upang ilarawan ang halimbawang ito, kumuha tayo ng isang kontrata para sa pagbebenta at pagbili ng mga upuan, na isinasaalang-alang ang katotohanan na ang pagkakaroon ng mga nakatagong kayamanan sa kanila ay pinag-uusapan. Ipapakita namin ang isang halimbawa na isinasaalang-alang ang katotohanan na sa loob ng balangkas ng teorya ng laro, ang mga kadahilanan na panlabas sa mga intensyon ng mga partido sa kontrata ay isinasaalang-alang sa pamamagitan ng pagpapakilala ng isang ikatlong manlalaro, "kalikasan," sa isang laro na may dalawang kalahok ( Larawan 4).

Larawan 4

Tulad ng mga sumusunod mula sa pagtatanghal ng laro sa pinalawak na anyo, sa halip na apat na resulta, mayroong anim sa laro. At kung ang problema ng pag-asa ng mga panalo ni Ostap sa mga aksyon ng driver ng entablado ay nakahanap ng solusyon nito sa pagkakaroon ng anumang hindi zero na antas ng tiwala ni Ostap, kung gayon ang problema ng pag-asa ng mga panalo ni Ostap sa pagkakaroon ng mga kayamanan sa mga upuan. nananatiling hindi malulutas, na kung saan, nagkataon, ay kinumpirma ng pagtatapos ng nobela.

1.3 MGA POSIBLENG ESTRATEHIYA SA UULIT NA MGA LARO

1. Pinaghalong estratehiya. Kapag paulit-ulit na nahahanap ng mga manlalaro ang kanilang sarili sa isang partikular na sitwasyon ng pagpili, ang kanilang pakikipag-ugnayan ay nagiging mas kumplikado. Kayang-kaya nilang pagsamahin ang mga diskarte upang mapakinabangan ang kanilang pangkalahatang mga panalo. Ipakita natin ito gamit ang isang modelong naglalarawan sa ugnayan sa pagitan Bangko Sentral(Central Bank) at isang ahenteng pang-ekonomiya kaugnay ng patakarang hinggil sa pananalapi na sinusunod ng Bangko Sentral.

Ang Bangko Sentral ay nakatuon sa alinman sa isang mahigpit na patakaran sa pananalapi, sinusubukang panatilihin ang inflation sa isang nakapirming antas (p0), o sa mga emisyon at, dahil dito, ang pagtaas ng rate ng inflation (p1). Sa turn, ang ahente ng ekonomiya ay kumikilos batay sa mga inaasahan sa inflation nito (nagtatakda ng mga presyo para sa mga produkto nito, nagpasya sa pagbili ng mga kalakal at serbisyo, atbp.), na maaaring makumpirma o hindi makumpirma bilang resulta ng patakarang itinataguyod ng ang Bangko Sentral. Kung p1 > re, ang Bangko Sentral ay tumatanggap ng tubo mula sa seigniorage at mula sa inflation tax. Kung pe = p1, pareho ang Bangko Sentral na natalo dahil sa pagbawas sa mga kita mula sa seigniorage, at mga ahenteng pang-ekonomiya na patuloy na nagpapasan ng bigat ng inflation tax. Kung pe = p0, kung gayon ang status quo ay pinananatili at walang talo. Sa wakas, kung pe > p0, ang mga ahenteng pang-ekonomiya lamang ang mawawalan: mga producer - dahil sa pagkawala ng demand para sa mga produkto na naging hindi makatwiran na mas mahal, mga mamimili - dahil sa paglikha ng mga hindi makatwirang reserba.

Sa iminungkahing modelo, sa panahon ng iisang pakikipag-ugnayan, ang mga ahente ay walang nangingibabaw na estratehiya, at walang Nash equilibrium. Kapag ang pakikipag-ugnayan ay paulit-ulit nang maraming beses, at ito mismo ang ganitong uri ng pakikipag-ugnayan na karaniwan para sa mga totoong sitwasyon, ang parehong mga kalahok ay maaaring gumamit ng parehong mga diskarte sa kanilang pagtatapon. Nagbibigay-daan ba ang mga alternatibong diskarte sa isang partikular na pagkakasunud-sunod na mga manlalaro na i-maximize ang kanilang utility, iyon ay, upang makamit ang isang halo-halong diskarte Nash equilibrium: isang resulta kung saan walang manlalaro ang maaaring tumaas ang kanyang kabayaran sa pamamagitan ng unilateral na pagbabago sa kanyang diskarte? Ipagpalagay natin na ang Bangko Sentral ay nagpapatuloy ng mahigpit na patakaran sa pananalapi na may posibilidad na P1 (sa P1% ng mga kaso), at may posibilidad (1 - P1) ang isang patakaran sa inflationary. Pagkatapos, kapag ang isang ahente ng ekonomiya ay pumili ng mga inaasahan na hindi inflationary (pe = p0), ang Bangko Sentral ay maaaring asahan na makatanggap ng pakinabang na katumbas ng

diskarte sa laro ng teorya

EU(CB) = P1 0+,

1 (1 - P1) = 1- -P1

Sa kaso ng inflationary expectations ng economic agent, ang pakinabang ng Central Bank ay

EU(CB) = P10 + (1 - P1)(-2) = 2P1 - 2.

Ngayon, ipagpalagay natin na ang isang ahente ng ekonomiya ay may mga inaasahan na hindi inflationary na may posibilidad na P2 (sa P2% ng mga kaso), at mga inaasahan sa inflationary na may posibilidad (1 - P2). Kaya ang inaasahang utilidad ng Bangko Sentral ay

EU(CB) = Р2(1 - Р1) + (1 - Р2)(2Р1-2) = =ЗР2-ЗР1 Р2+2Р1 - 2 (Fig. 5).

Larawan 5

Magbibigay ng mga katulad na kalkulasyon para sa isang ahente ng ekonomiya

EU (e.a.) = P1(P2- 1) + (1 - P1)(-P2-2) = 2P1P2 + P1- P2-2.

Kung muli nating isusulat ang mga ekspresyong ito sa sumusunod na anyo

EU(CB) = Pl(2-3P2) + ЗР2-2

EU(e.a.)= =P2(2P1-1) +P1-2,

saka madaling makita na kapag

ang mga panalo ng Bangko Sentral ay hindi nakadepende sa sarili nitong patakaran, at kung kailan

ang pakinabang ng ahente ng ekonomiya ay hindi nakasalalay sa kanyang mga inaasahan.

Sa madaling salita, ang Nash equilibrium sa magkahalong mga estratehiya ay ang pagbuo ng mga hindi inflationary na inaasahan ng ahente ng ekonomiya sa 2/3 ng mga kaso at ang pagpapatupad ng mahigpit na patakaran sa pananalapi ng Central Bank sa kalahati ng mga kaso. Ang nahanap na ekwilibriyo ay makakamit sa kondisyon na ang mga ahenteng pang-ekonomiya ay bumubuo ng mga inaasahan sa isang makatwirang paraan, at hindi batay sa mga inaasahan ng inflation sa nakaraang panahon, na nababagay para sa error sa pagtataya ng nakaraang panahon8. Dahil dito, ang mga pagbabago sa patakaran ng Bangko Sentral ay nakakaapekto sa pag-uugali ng mga ahenteng pang-ekonomiya hanggang sa sila ay hindi inaasahan at hindi mahuhulaan. Ang diskarte ng Bangko Sentral na magsagawa ng mahigpit na patakaran sa pananalapi sa 50% ng mga kaso at isang malambot sa 50% ng mga kaso ay ganap na naaayon sa paglikha ng isang kapaligiran na hindi mahuhulaan.

2. Evolutionary-stable na diskarte. Ang isang evolutionarily stable na diskarte ay isang diskarte na kung ito ay ginagamit ng karamihan ng mga indibidwal, kung gayon walang alternatibong diskarte ang maaaring palitan ito sa pamamagitan ng mekanismo ng natural selection, kahit na ang huli ay mas mahusay sa Pareto.

Ang isang uri ng paulit-ulit na laro ay mga sitwasyon kapag ang isang indibidwal ay paulit-ulit na nahahanap ang kanyang sarili sa isang tiyak na sitwasyon na pinili, ngunit ang kanyang katapat ay hindi pare-pareho, at sa bawat panahon ang indibidwal ay nakikipag-ugnayan sa isang bagong katapat. Samakatuwid, ang posibilidad ng isang counterparty na pumili ng isa o isa pang diskarte ay hindi nakasalalay sa pagsasaayos ng pinaghalong diskarte, ngunit sa mga kagustuhan ng bawat isa sa mga counterparty. Sa partikular, ipinapalagay na mula sa kabuuang bilang N mga potensyal na katapat n (n/N%) ang palaging pipili ng diskarte A, at ang m (m/N%) ay palaging pinipili ang diskarte B. Ito ay lumilikha ng mga kinakailangan para sa pagkamit ng bagong uri ng ekwilibriyo, mga ebolusyonaryong matatag na estratehiya. Ang isang evolutionary stable na diskarte (ESS - Evolutionary Stable Strategy) ay nagiging diskarte kung saan kung ang lahat ng miyembro ng isang partikular na populasyon ay gumagamit nito, walang alternatibong diskarte ang makakapagpapalit nito sa pamamagitan ng mekanismo ng natural selection. Kunin natin bilang isang halimbawa pinakasimpleng opsyon mga problema sa koordinasyon: dalawang sasakyan na dumadaan sa makipot na kalsada. Ipinapalagay na sa isang partikular na lugar, ang kaliwa at kanang mga pamantayan ng trapiko ay pantay (o Mga Panuntunan trapiko hindi lang sila palaging gumagana). Ang Car A ay gumagalaw patungo sa ilang sasakyan na kailangan niyang madaanan. Kung ang parehong mga kotse ay lumiko sa kaliwa, nagmamaneho sa kaliwang bahagi ng kalsada sa direksyon ng paglalakbay, pagkatapos ay dumaan sila nang walang problema. Ang parehong bagay ay nangyayari kung ang parehong mga kotse ay dadalhin sa kanan. Kapag ang isang kotse ay lumiko sa kanan, at ang pangalawa - sa kaliwa at kabaligtaran, kung gayon hindi nila magagawang ipasa ang bawat isa (Larawan 6).

Larawan 6

Kaya, alam ng motoristang A ang tinatayang porsyento ng mga motoristang B na sistematikong kumaliwa (P) at ang porsyento ng mga motoristang B na kumanan (1 - P). Ang kundisyon para sa diskarteng "kumuha sa kanan" upang maging evolutionary stable para sa motoristang A ay binabalangkas tulad ng sumusunod: EU(kanan) > EU(kaliwa), o

0P+ 1(1 - P) > 1P+ 0(1 - P),

kung saan nagmula ang R< 1/2. Таким образом, при превышении доли автомобилистов во встречном потоке, принимающих вправо, уровня 50% эволюционно-стабильной стратегией становится «принять вправо» -- сворачивать на правую обочину при каждом разъезде.

Sa pangkalahatan, ang mga kinakailangan para sa isang evolutionary stable na diskarte ay nakasulat bilang mga sumusunod. Ang Strategy I, na ginagamit ng mga katapat na may probability p, ay evolutionary stable para sa player kung at kung matutugunan lamang ang mga sumusunod na kundisyon

EU(I, p) > EU(J, p),

na magkapareho

pU(I, I) + (l -p)U(I,J)>pU(J,I) + (1 - p)U(J,J) (3)

Ano ang sumusunod:

U(I, I)> U(J, I)

U(I, I) = U(J, I)

U(I, J) > U(J, J),

kung saan -- U(I, I) ang kabayaran ng manlalaro kapag pumipili ng diskarte I, kung pipiliin ng katapat ang diskarte I; U(J, I) -- ang kabayaran ng player kapag pumipili ng diskarte J, kung pipiliin ng counterparty ang diskarte I, atbp.

Larawan 7

Maaari mo ring ipakita ang mga kundisyong ito sa graphical na anyo. I-plot natin ang inaasahang utility ng pagpili ng isang diskarte o iba pa sa kahabaan ng vertical axis, at ang proporsyon ng mga indibidwal sa kabuuang populasyon ng mga manlalaro na pumipili ng parehong mga diskarte kasama ang horizontal axis. Pagkatapos ay nakuha namin ang sumusunod na graph (mga halaga na kinuha mula sa modelo ng dalawang sasakyan na dumadaan), na ipinapakita sa Fig. 7.

Ito ay sumusunod mula sa figure na parehong "kumaliwa" at "kumanan" ay may pantay na pagkakataon na maging isang evolutionary stable na diskarte hangga't wala sa mga ito ang sumasaklaw sa higit sa kalahati ng "populasyon" ng mga driver. Kung ang isang diskarte ay lumampas sa limitasyon na ito, pagkatapos ay unti-unti ngunit hindi maiiwasang mapalitan ang isa pang diskarte at sasakupin ang buong populasyon ng mga driver. Ang katotohanan ay na kung ang diskarte ay tumawid sa 50% na marka, ito ay nagiging kumikita para sa sinumang driver na gamitin ito sa mga maniobra, na, sa turn, ay higit na nagpapataas ng pagiging kaakit-akit ng diskarte na ito para sa iba pang mga driver. Sa mahigpit na anyo, ang pahayag na ito ay magiging ganito:

dp/dt = G , G">0 (4)

Ang pangunahing resulta ng pagsusuri ng mga paulit-ulit na laro ay ang pagtaas ng bilang ng mga punto ng ekwilibriyo at ang solusyon sa batayan na ito ng mga problema ng koordinasyon, kooperasyon, pagkakatugma at pagiging patas. Kahit na sa dilemma ng mga bilanggo, ang paglipat sa paulit-ulit na pakikipag-ugnayan ay nagpapahintulot sa amin na makamit ang pinakamainam na resulta ng Pareto ("tanggihan ang pagkakasala"), nang hindi lalampas sa pamantayan ng pagkamakatuwiran at ang pagbabawal sa pagpapalitan ng impormasyon sa pagitan ng mga manlalaro. Ito ang eksaktong kahulugan ng "pangkalahatang teorama": anumang resulta na nababagay sa indibidwal na indibidwal ay maaaring maging equilibrium kapag lumipat sa istraktura ng isang paulit-ulit na laro. Sa sitwasyon ng dilemma ng mga bilanggo, ang resulta ng ekwilibriyo sa ilalim ng ilang mga kundisyon ay maaaring alinman sa isang simpleng diskarte na "hindi kinikilala" o maraming magkakahalo na estratehiya. Kabilang sa pinaghalo at ebolusyonaryong mga estratehiya, napapansin natin ang mga sumusunod: Tit-For-Two-Tats - magsimula sa pagtanggi ng pagkakasala at aminin lamang ang pagkakasala kung ang katapat ay umamin ng pagkakasala sa dalawang nakaraang yugto ng sunud-sunod; Ang DOWING ay isang diskarte na batay sa pag-aakalang ang katapat ay pantay na malamang na gumamit ng mga diskarte na "tanggihan ang pagkakasala" at "aminin" sa pinakadulo simula ng laro. Dagdag pa, ang bawat pagtanggi ng pagkakasala sa bahagi ng katapat ay hinihikayat, at ang bawat pag-amin ay pinarurusahan sa pamamagitan ng pagpili ng diskarte sa "aminin ang pagkakasala" sa susunod na panahon; TESTER - magsimula sa isang pag-amin ng pagkakasala, at kung ang katapat ay umamin din ng pagkakasala, pagkatapos ay tanggihan ang pagkakasala sa susunod na panahon.

KONGKLUSYON

Sa konklusyon, ang sanaysay ay maaaring mahinuha tungkol sa pangangailangang gumamit ng teorya ng laro sa modernong kalagayang pang-ekonomiya.

Sa mga kondisyon ng alternatibo (pagpipilian), kadalasan ay hindi madaling gumawa ng desisyon at pumili ng isa o ibang diskarte. Ang pagsasaliksik sa pagpapatakbo ay nagbibigay-daan, sa pamamagitan ng paggamit ng mga angkop na pamamaraang pangmatematika, na gumawa ng matalinong desisyon tungkol sa pagiging angkop ng isang partikular na diskarte. Ang teorya ng laro, na mayroong isang arsenal ng mga pamamaraan para sa paglutas ng mga laro ng matrix, ay nagbibigay-daan sa iyo upang epektibong malutas ang mga problemang ito gamit ang ilang mga pamamaraan at piliin ang mga pinaka-epektibo mula sa kanila, pati na rin gawing simple. source matrice mga laro.

Ang mga sanaysay ay inilarawan praktikal na gamit Ang mga pangunahing estratehiya ng teorya ng laro at ang mga kaukulang konklusyon ay iginuhit, ang pinaka ginagamit at madalas na ginagamit na mga estratehiya at mga pangunahing konsepto ay pinag-aaralan.

LISTAHAN NG MGA GINAMIT NA SANGGUNIAN

1. Petrosyan L.A., Zenkevich N.A., Shevkoplyas E.V.: Teorya ng laro: textbook. Publisher: BHV, 2012.-212 p.

2. Labsker L.G., Yashchenko N.A.: Teorya ng laro sa ekonomiya. Workshop na may paglutas ng problema. Pagtuturo. Publisher: Knorus, 2014.-125 p.

3. Nalebuff, Dixit: Teorya ng Laro. Art estratehikong pag-iisip sa negosyo at buhay. Publisher: Mann, Ivanov and Ferber, 2015 .- 99 p.

4. Oleynik A.N. Institusyonal na ekonomiya. Teksbuk, Moscow INFRA-M, 2013.-78p.

5. Protasov I.D. Teorya ng laro at pananaliksik sa pagpapatakbo: aklat-aralin. allowance. - M.: Helios ARV, 2013.-100 p.

6. Samarov K.L. Mathematics. Manual na pang-edukasyon at pamamaraan sa ilalim ng seksyong "Mga Elemento ng Teorya ng Laro", LLC "Resolventa", 2011.-211 p.

7. Shikin E.V. Mga pamamaraan sa matematika at mga modelo sa pamamahala: aklat-aralin. manwal para sa mga mag-aaral hal. espesyalista. mga unibersidad - M.: Delo, 2014.-201 p.

Nai-post sa Allbest.ru

...

Mga katulad na dokumento

    Iba't ibang sitwasyon at lugar ng buhay ng tao kung saan naaangkop ang teorya ng laro. Ang pangangailangan na gumamit ng teorya ng laro sa modernong mga kondisyon sa ekonomiya. Pagpapatunay sa pangangailangan ng mga institusyon gamit ang teorya ng laro. Ebolusyonaryong matatag na diskarte.

    course work, idinagdag noong 11/28/2013

    Mga katangian ng kakanyahan ng mga laro - mga sitwasyon kung saan mayroong ilang mga paksa na nakakaalam na ang kanilang mga aksyon ay nakakaimpluwensya sa pag-uugali ng iba pang mga paksa. Mga layunin ng teorya ng laro. Pagbuo ng mga rekomendasyon para sa makatwirang pag-uugali mga manlalaro, na tinutukoy ang pinakamainam na diskarte.

    pagtatanghal, idinagdag noong 03/31/2011

    Teorya ng Heckscher-Ohlin ng internasyonal na kalakalan. Ang factor price equalization theorem ni Samuelson. Ang teorya ng "cycle ng buhay ng produkto". Teorya ni Michael Porter: Teorya mapagkumpitensyang mga kalamangan. Isang eclectic na teorya ng internasyonalisasyon ng produksyon ng serbisyo.

    pagsubok, idinagdag noong 05/12/2009

    Macroeconomics. Teorya ng pagkonsumo. Katwiran ng teorya. Layunin at subjective na mga kadahilanan ng pagkonsumo. Keynesian theory of consumption. Graphic na interpretasyon ng function ng pagkonsumo. Pagbuo ng demand para sa mga produkto at serbisyo.

    pagsubok, idinagdag noong 06/23/2007

    Ang pagkakaiba ng Keynesian at monetarist theories. Panloob na katatagan sa Ekonomiya ng merkado. Impluwensya patakaran sa pananalapi at ang papel ng pera sa ekonomiya. Mga pagbabago sa mga presyo para sa mga kalakal at serbisyo. Pagpapasiya ng bilis ng sirkulasyon ng pera. Ang teorya ng dami ng pera.

    pagsubok, idinagdag noong 01/16/2011

    Ang konsepto ng internasyonal na kalakalan. Klasikal na teorya ng internasyonal na kalakalan. Ang teorya ng comparative advantage. Teorya ng Mercantilist ng internasyonal na kalakalan. Ang teorya ng ganap na kalamangan. Teorya ng Heckscher - Ohlin - Samuelson. Ang teorya ni Leontiev.

    abstract, idinagdag noong 01/16/2008

    Ang paglitaw ng teoryang pang-ekonomiya. Kasaysayan ng ekonomiya bilang isang agham. Paksa at pamamaraan ng teoryang pang-ekonomiya. Ang teoryang pang-ekonomiya ay isang pangunahing empirical na agham, iyon ay, ito ay batay sa mga katotohanan ng totoong buhay. Teorya ng ekonomiya: mga function, pamamaraan ng pananaliksik.

    course work, idinagdag noong 12/16/2003

    Iba't ibang mga teoryang pang-ekonomiya ng mga domestic at dayuhang ekonomista na ipinanganak sa iba't ibang mga makasaysayang panahon, kalamangan, kahinaan ng bawat teorya. Mga yugto ng pag-unlad ng pag-iisip ng ekonomiya ng tao. Mga tampok ng pag-unlad ng teoryang pang-ekonomiya.

    pagsubok, idinagdag noong 12/22/2009

    Ang konsepto ng paggawa, ang kakanyahan at katangian nito, ang papel nito sa pag-unlad ng tao at ang lugar nito sa ekonomiya. Ang lugar ng tao sa modernong teorya ng ekonomiya. Mga sistemang pang-ekonomiya, ang kanilang mga uri at koordinasyon ng pagpili. Paksa at pamamaraan ng pag-aaral ng microeconomics.

    kurso ng mga lektura, idinagdag 02/10/2009

    Tao bilang isang mamimili, prodyuser, tagapamahala sa sistema ugnayang pang-ekonomiya. Paghahambing ng pang-ekonomiya, sikolohikal at sosyolohikal na diskarte sa pag-aaral ng pag-uugali ng tao sa ekonomiya. Pagkakaiba-iba ng mga modelo ng tao sa teoryang pang-ekonomiya.

At cybernetics, lalo na sa interes sa mga intelligent na ahente.

Kwento

Ang mga pinakamainam na solusyon o estratehiya sa mathematical modeling ay iminungkahi noong ika-18 siglo. Ang mga problema sa produksyon at pagpepresyo sa ilalim ng mga kondisyon ng oligopoly, na kalaunan ay naging mga halimbawa ng textbook ng teorya ng laro, ay isinasaalang-alang noong ika-19 na siglo. A. Cournot at J. Bertrand. Sa simula ng ika-20 siglo. Iniharap ni E. Lasker, E. Zermelo, E. Borel ang ideya ng isang matematikal na teorya ng salungatan ng interes.

Ang teorya ng larong matematika ay nagmula sa neoclassical economics. Ang matematikal na aspeto at aplikasyon ng teorya ay unang binalangkas sa klasikong 1944 na aklat nina John von Neumann at Oscar Morgenstern, Game Theory at Economic Behavior. Teorya ng Mga Laro at Pang-ekonomiyang Pag-uugali).

Ang lugar na ito ng matematika ay natagpuan ang ilang pagmuni-muni sa pampublikong kultura. Noong 1998, ang Amerikanong manunulat at mamamahayag na si Sylvia Nazar ay naglathala ng isang libro tungkol sa kapalaran ni John Nash, isang Nobel laureate sa ekonomiya at isang siyentipiko sa larangan ng teorya ng laro; at ang pelikulang "Mind Games" ay ginawa batay sa libro. Ang ilang mga palabas sa telebisyon sa Amerika, gaya ng Friend o Foe, Alias ​​​​o NUMB3RS, ay pana-panahong tumutukoy sa teorya sa kanilang mga yugto.

Ang teorya ng larong matematika ay mabilis na umuunlad, at ang mga dynamic na laro ay isinasaalang-alang. Gayunpaman, ang mathematical apparatus ng teorya ng laro ay mahal. Ginagamit ito para sa mga makatwirang gawain: pulitika, ekonomiya ng mga monopolyo at pamamahagi ng kapangyarihan sa merkado, atbp. Ang isang bilang ng mga sikat na siyentipiko ay naging mga Nobel laureates sa ekonomiya para sa kanilang kontribusyon sa pagbuo ng teorya ng laro, na naglalarawan ng mga prosesong sosyo-ekonomiko. Si J. Nash, salamat sa kanyang pananaliksik sa teorya ng laro, ay naging isa sa mga nangungunang eksperto sa larangan ng Cold War, na nagpapatunay sa laki ng mga problema na tinatalakay ng teorya ng laro.

Presentasyon ng laro

Ang mga laro ay mahigpit na tinukoy na mga bagay sa matematika. Ang laro ay nabuo ng mga manlalaro, isang hanay ng mga diskarte para sa bawat manlalaro at ang indikasyon ng mga panalo, o mga pagbabayad, mga manlalaro para sa bawat kumbinasyon ng mga diskarte. Karamihan sa mga larong kooperatiba ay inilalarawan ng isang katangiang pag-andar, habang para sa iba pang mga uri ang normal o malawak na anyo ay mas madalas na ginagamit. Mga tampok na katangian ng laro bilang isang modelo ng matematika ng sitwasyon:

  1. pagkakaroon ng ilang mga kalahok;
  2. kawalan ng katiyakan sa pag-uugali ng mga kalahok na nauugnay sa pagkakaroon ng ilang mga pagpipilian para sa bawat isa sa kanila;
  3. pagkakaiba (discrepancy) ng mga interes ng mga kalahok;
  4. ang pagkakaugnay ng pag-uugali ng mga kalahok, dahil ang resulta na nakuha ng bawat isa sa kanila ay nakasalalay sa pag-uugali ng lahat ng mga kalahok;
  5. ang pagkakaroon ng mga alituntunin ng pag-uugali na alam ng lahat ng kalahok.

Malawak na anyo

Pangunahing artikulo: Malawak na anyo ng laro

Ang mga laro sa malawak, o pinalawak, na anyo ay kinakatawan bilang isang nakadirekta na puno, kung saan ang bawat vertex ay tumutugma sa sitwasyon kapag pinili ng manlalaro ang kanyang diskarte. Ang bawat manlalaro ay itinalaga ng isang buong antas ng mga vertex. Ang mga pagbabayad ay naitala sa ilalim ng puno, sa ilalim ng bawat isa dulo ng dahon.

Ang larawan sa kaliwa ay isang laro para sa dalawang manlalaro. Nauna ang Manlalaro 1 at pipili ng diskarte F o U. Sinusuri ng Manlalaro 2 ang kanyang posisyon at nagpasiya kung pipiliin ang diskarte A o R. Malamang, pipiliin ng unang manlalaro ang U, at ang pangalawa - A (para sa bawat isa sa kanila ito pinakamainam na estratehiya); pagkatapos ay makakatanggap sila ng 8 at 2 puntos ayon sa pagkakabanggit.

Ang malawak na anyo ay napaka-visual at partikular na kapaki-pakinabang para sa kumakatawan sa mga laro na may higit sa dalawang manlalaro at mga laro na may magkakasunod na galaw. Kung ang mga kalahok ay gumawa ng sabay-sabay na mga galaw, kung gayon ang mga kaukulang vertices ay maaaring konektado sa pamamagitan ng isang tuldok na linya o binalangkas ng isang solidong linya.

Normal na anyo

Manlalaro 2
diskarte 1
Manlalaro 2
diskarte 2
Manlalaro 1
diskarte 1
4 , 3 –1 , –1
Manlalaro 1
diskarte 2
0 , 0 3 , 4
Normal na anyo para sa isang laro na may 2 manlalaro, bawat isa ay may 2 diskarte.

Sa normal o madiskarteng anyo ay inilalarawan ang laro matrix ng pagbabayad. Ang bawat panig (mas tiyak, dimensyon) ng matrix ay isang manlalaro, tinutukoy ng mga hilera ang mga diskarte ng unang manlalaro, at tinutukoy ng mga hanay ang mga diskarte ng pangalawa. Sa intersection ng dalawang diskarte, makikita mo ang mga panalo na matatanggap ng mga manlalaro. Sa halimbawa sa kanan, kung pipiliin ng manlalaro 1 ang unang diskarte, at pipiliin ng manlalaro 2 ang pangalawang diskarte, pagkatapos ay sa intersection makikita natin ang (−1, −1), na nangangahulugan na bilang resulta ng paglipat, parehong natalo ang mga manlalaro. isang puntos.

Ang mga manlalaro ay pumili ng mga diskarte na may pinakamataas na resulta para sa kanilang sarili, ngunit natalo dahil sa kamangmangan sa paglipat ng ibang manlalaro. Karaniwan ang mga laro ay kinakatawan sa normal na anyo kung saan ang mga galaw ay ginawa sabay-sabay, o hindi bababa sa ipinapalagay na ang lahat ng mga manlalaro ay hindi alam kung ano ang ginagawa ng ibang mga kalahok. Mga ganyang laro na may hindi kumpletong impormasyon tatalakayin sa ibaba.

Katangiang pag-andar

Sa mga laro ng kooperatiba na may naililipat na utility, iyon ay, ang posibilidad ng paglilipat ng mga pondo mula sa isang manlalaro patungo sa isa pa, imposibleng ilapat ang konsepto mga indibidwal na pagbabayad. Sa halip, ginagamit ang tinatawag na katangiang function, na tumutukoy sa kabayaran ng bawat koalisyon ng mga manlalaro. Ipinapalagay na ang pakinabang ng walang laman na koalisyon ay zero.

Ang batayan para sa pamamaraang ito ay matatagpuan sa aklat ni von Neumann at Morgenstern. Sa pag-aaral ng normal na anyo para sa mga laro ng koalisyon, nangatuwiran sila na kung ang isang laro na may dalawang panig ay bumubuo ng isang koalisyon C, pagkatapos ay tinututulan ito ng koalisyon N \ C. Para itong laro para sa dalawang manlalaro. Ngunit dahil maraming mga pagpipilian para sa mga posibleng koalisyon (ibig sabihin, 2 N, Saan N- bilang ng mga manlalaro), pagkatapos ay ang mga panalo para sa C magkakaroon ng ilan katangian na dami, depende sa komposisyon ng koalisyon. Pormal, ang isang laro sa form na ito (tinatawag ding laro ng TU) ay kinakatawan ng isang pares (N, v), Saan N- ang hanay ng lahat ng mga manlalaro, at v: 2 N → R ay isang katangiang pag-andar.

Ang form na ito ng representasyon ay maaaring gamitin para sa lahat ng laro, kabilang ang mga walang naililipat na utility. Sa kasalukuyan ay may mga paraan upang i-convert ang anumang laro mula sa normal na anyo patungo sa katangiang anyo, ngunit ang reverse transformation ay hindi posible sa lahat ng pagkakataon.

Paglalapat ng teorya ng laro

Ang teorya ng laro bilang isa sa mga diskarte sa inilapat na matematika ay ginagamit upang pag-aralan ang pag-uugali ng tao at hayop sa iba't ibang sitwasyon. Sa una, ang teorya ng laro ay nagsimulang umunlad sa loob ng balangkas ng agham pang-ekonomiya, na ginagawang posible na maunawaan at ipaliwanag ang pag-uugali ng mga ahente ng ekonomiya sa iba't ibang sitwasyon. Nang maglaon, ang saklaw ng teorya ng laro ay pinalawak sa iba pang mga agham panlipunan; Ang teorya ng laro ay kasalukuyang ginagamit upang ipaliwanag ang pag-uugali ng tao sa agham pampulitika, sosyolohiya at sikolohiya. Ang pagsusuri sa teorya ng laro ay unang ginamit upang ilarawan ang pag-uugali ng hayop ni Ronald Fisher noong 1930s (bagaman kahit si Charles Darwin ay gumamit ng mga ideya sa teorya ng laro nang walang pormal na katwiran). Ang terminong "teorya ng laro" ay hindi lumilitaw sa gawa ni Ronald Fisher. Gayunpaman, ang gawain ay mahalagang isinagawa alinsunod sa pagsusuri ng laro-theoretic. Ang mga pag-unlad na ginawa sa ekonomiya ay inilapat ni John Maynard Smith sa kanyang aklat na Evolution and the Theory of Games. Ang teorya ng laro ay hindi lamang ginagamit upang hulaan at ipaliwanag ang pag-uugali; Ang mga pagtatangka ay ginawa upang gamitin ang teorya ng laro upang bumuo ng mga teorya ng etikal o karaniwang pag-uugali. Ginamit ng mga ekonomista at pilosopo ang teorya ng laro upang mas maunawaan ang mabuting pag-uugali.

Paglalarawan at pagmomodelo

Ang teorya ng laro ay orihinal na ginamit upang ilarawan at gawing modelo ang pag-uugali ng mga populasyon ng tao. Naniniwala ang ilang mananaliksik na sa pamamagitan ng pagtukoy sa equilibrium ng mga angkop na laro, maaari nilang mahulaan ang pag-uugali ng mga populasyon ng tao sa mga sitwasyon ng tunay na paghaharap. Ang diskarte na ito sa teorya ng laro Kamakailan lamang ay binatikos sa ilang kadahilanan. Una, ang mga pagpapalagay na ginagamit sa pagmomolde ay kadalasang nilalabag sa totoong buhay. Maaaring ipagpalagay ng mga mananaliksik na ang mga manlalaro ay pipili ng mga pag-uugali na nagpapalaki sa kanilang kabuuang benepisyo (ang modelo ng ekonomiya ng tao), ngunit sa pagsasagawa ng pag-uugali ng tao ay madalas na hindi nakakatugon sa pagpapalagay na ito. Maraming mga paliwanag para sa hindi pangkaraniwang bagay na ito - hindi makatwiran, simulation ng talakayan, at kahit na iba't ibang motibo ng mga manlalaro (kabilang ang altruism). Ang mga may-akda ng game-theoretic na modelo ay kinokontra ito sa pamamagitan ng pagsasabi na ang kanilang mga pagpapalagay ay katulad ng mga katulad na pagpapalagay sa pisika. Samakatuwid, kahit na ang kanilang mga pagpapalagay ay hindi palaging natutugunan, ang teorya ng laro ay maaaring gamitin bilang isang makatwirang perpektong modelo, katulad ng parehong mga modelo sa pisika. Gayunpaman, ang teorya ng laro ay nakatanggap ng isang bagong alon ng pagpuna kapag ang mga eksperimento ay nagsiwalat na ang mga tao ay hindi sumusunod sa mga diskarte sa ekwilibriyo sa pagsasanay. Halimbawa, sa mga larong "Centipede" at "Dictator", kadalasang hindi ginagamit ng mga kalahok ang profile ng diskarte na bumubuo sa Nash equilibrium. Nagpapatuloy ang debate tungkol sa kahalagahan ng naturang mga eksperimento. Ang isa pang pananaw ay ang Nash equilibrium ay hindi isang hula ng inaasahang pag-uugali, ipinapaliwanag lamang nito kung bakit ang mga populasyon na nasa Nash equilibrium ay nananatili sa ganoong estado. Gayunpaman, nananatiling bukas ang tanong kung paano nakarating ang mga populasyon na ito sa equilibrium ng Nash. Ang ilang mga mananaliksik ay bumaling sa teorya ng ebolusyonaryong laro upang sagutin ang tanong na ito. Ipinapalagay ng mga modelo ng teorya ng ebolusyonaryong laro ang bounded rationality o irrationality ng mga manlalaro. Sa kabila ng pangalan, ang teorya ng ebolusyonaryong laro ay hindi masyadong nababahala sa mga tanong ng natural na pagpili ng biological species. Ang sangay na ito ng teorya ng laro ay nag-aaral ng mga modelo ng biyolohikal at kultural na ebolusyon, pati na rin ang mga modelo ng proseso ng pagkatuto.

Pagsusuri ng normatibo (pagkilala sa pinakamahusay na pag-uugali)

Sa kabilang banda, itinuturing ng maraming mananaliksik ang teorya ng laro bilang isang tool para sa paghula ng pag-uugali, ngunit bilang isang tool para sa pagsusuri ng mga sitwasyon upang matukoy pinakamahusay na pag-uugali para sa isang rasyonal na manlalaro. Dahil ang Nash equilibrium ay nagsasangkot ng mga diskarte na pinakamahusay na tugon sa pag-uugali ng ibang manlalaro, ang paggamit ng konsepto ng Nash equilibrium upang pumili ng pag-uugali ay tila makatwiran. Gayunpaman, ang paggamit na ito ng mga game-theoretic na modelo ay binatikos din. Una, sa ilang mga kaso ay kumikita ang isang manlalaro na pumili ng isang diskarte na hindi bahagi ng ekwilibriyo kung inaasahan niya na ang ibang mga manlalaro ay hindi rin susunod sa mga estratehiya ng ekwilibriyo. Pangalawa, sikat na laro Ang Prisoner's Dilemma ay nagbibigay ng isa pang counterexample. Sa Prisoner's Dilemma, ang paghahangad ng pansariling interes ay nagreresulta sa parehong mga manlalaro na nauuwi sa mas masahol na sitwasyon kaysa kung isinakripisyo nila ang pansariling interes.

Mga uri ng laro

Kooperatiba at hindi kooperatiba

Ang laro ay tinatawag na kooperatiba, o koalisyon, kung ang mga manlalaro ay maaaring magkaisa sa mga grupo, na isagawa ang ilang mga obligasyon sa iba pang mga manlalaro at i-coordinate ang kanilang mga aksyon. Naiiba ito sa mga larong hindi kooperatiba kung saan dapat maglaro ang lahat para sa kanilang sarili. Ang mga larong pang-libangan ay bihirang kooperatiba, ngunit ang gayong mga mekanismo ay hindi karaniwan sa pang-araw-araw na buhay.

Madalas na ipinapalagay na kung bakit naiiba ang mga laro ng kooperatiba ay ang kakayahan ng mga manlalaro na makipag-usap sa isa't isa. Sa pangkalahatan, hindi ito totoo. May mga laro kung saan pinapayagan ang komunikasyon, ngunit ang mga manlalaro ay naghahangad ng mga personal na layunin, at kabaliktaran.

Sa dalawang uri ng laro, ang mga hindi kooperatiba ay naglalarawan ng mga sitwasyon nang detalyado at nagbubunga ng mas tumpak na mga resulta. Isinasaalang-alang ng mga kooperatiba ang proseso ng laro sa kabuuan. Ang mga pagtatangka na pagsamahin ang dalawang diskarte ay nagbunga ng malaking resulta. tinatawag na Programa ni Nash nakahanap na ng mga solusyon sa ilang larong kooperatiba bilang mga sitwasyong ekwilibriyo ng mga larong hindi kooperatiba.

Kasama sa mga hybrid na laro ang mga elemento ng larong kooperatiba at hindi kooperatiba. Halimbawa, ang mga manlalaro ay maaaring bumuo ng mga grupo, ngunit ang laro ay lalaruin sa isang hindi kooperatiba na istilo. Nangangahulugan ito na ang bawat manlalaro ay hahabulin ang mga interes ng kanyang grupo, habang sa parehong oras ay sinusubukan na makamit ang personal na pakinabang.

Symmetrical at asymmetrical

A B
A 1, 2 0, 0
B 0, 0 1, 2
Asymmetrical na laro

Pangunahing artikulo: Symmetrical na laro

Magiging simetriko ang laro kapag pantay-pantay ang mga kaukulang diskarte ng mga manlalaro, ibig sabihin, magkapareho sila ng mga pagbabayad. Sa madaling salita, kung ang mga manlalaro ay maaaring magpalit ng mga lugar at ang kanilang mga panalo para sa parehong mga galaw ay hindi magbabago. Maraming dalawang-player na laro na pinag-aralan ay simetriko. Sa partikular, ito ay: "Prisoner's Dilemma", "Deer Hunt", "Hawks and Doves". Kasama sa mga larong walang simetriko ang "Ultimatum" o "Diktador".

Sa halimbawa sa kanan, ang laro sa unang tingin ay maaaring mukhang simetriko dahil sa magkatulad na mga diskarte, ngunit hindi ito ang kaso - pagkatapos ng lahat, ang kabayaran ng pangalawang manlalaro na may mga profile ng diskarte (A, A) at (B, B) magiging mas malaki kaysa sa una.

Zero-sum at non-zero-sum

Zero sum laro- espesyal na iba't pare-pareho ang sum games, iyon ay, ang mga kung saan hindi maaaring taasan o bawasan ng mga manlalaro ang magagamit na mapagkukunan, o ang pondo ng laro. Sa kasong ito, ang kabuuan ng lahat ng panalo ay katumbas ng kabuuan ng lahat ng pagkatalo para sa anumang paglipat. Tumingin sa kanan - ang mga numero ay kumakatawan sa mga pagbabayad sa mga manlalaro - at ang kanilang kabuuan sa bawat cell ay zero. Kabilang sa mga halimbawa ng mga naturang laro ang poker, kung saan nanalo ang isa sa lahat ng taya ng iba; reversi, kung saan ang mga piraso ng kalaban ay nakunan; o banal pagnanakaw.

Maraming mga laro na pinag-aralan ng mga mathematician, kabilang ang nabanggit na "Prisoner's Dilemma", ay may ibang uri: sa non-zero sum games Ang panalo ng isang manlalaro ay hindi nangangahulugang pagkatalo ng iba, at kabaliktaran. Ang kinalabasan ng naturang laro ay maaaring mas mababa o higit sa zero. Ang ganitong mga laro ay maaaring ma-convert sa zero sum - ito ay ginagawa sa pamamagitan ng pagpapakilala fictitious player, na "nag-aangkop" sa sobra o bumubuo sa kakulangan ng pondo.

Ang isa pang laro na may non-zero sum ay kalakalan, kung saan nakikinabang ang bawat kalahok. Ang isang kilalang halimbawa kung saan ito bumababa ay