Isang halimbawa ng paglutas ng problema ng teorya ng laro sa magkahalong diskarte ng aming serbisyo. Teorya ng Laro: Mga Larong Matrix (Teorya ng Laro: Mga Larong Matrix)

Ang dalawang-taong zero-sum na laro ay tinatawag, kung saan ang bawat isa sa kanila ay may hangganan na hanay ng mga diskarte. Ang mga patakaran ng larong matrix ay tinutukoy ng payoff matrix, na ang mga elemento ay ang mga kabayaran ng unang manlalaro, na siyang mga pagkatalo din ng pangalawang manlalaro.

Larong matrix ay isang antagonistic na laro. Ang unang manlalaro ay tumatanggap ng pinakamataas na garantisadong (hindi nakadepende sa pag-uugali ng pangalawang manlalaro) na katumbas ng presyo ng laro, gayundin, ang pangalawang manlalaro ay nakakamit ang pinakamababang garantisadong pagkawala.

Sa ilalim diskarte ay nauunawaan bilang isang hanay ng mga panuntunan (prinsipyo) na tumutukoy sa pagpili ng isang variant ng mga aksyon para sa bawat personal na galaw ng isang manlalaro, depende sa kasalukuyang sitwasyon.

Ngayon tungkol sa lahat ng bagay sa pagkakasunud-sunod at sa detalye.

Payoff matrix, purong diskarte, presyo ng laro

AT larong matrix natutukoy ang mga tuntunin nito payoff matrix .

Isaalang-alang ang isang laro kung saan mayroong dalawang kalahok: ang unang manlalaro at ang pangalawang manlalaro. Hayaan ang unang manlalaro na magkaroon m purong mga diskarte, at nasa pagtatapon ng pangalawang manlalaro - n puro diskarte. Dahil ang isang laro ay isinasaalang-alang, natural na mayroong panalo at pagkatalo sa larong ito.

AT matrix ng pagbabayad ang mga elemento ay mga numerong nagpapahayag ng mga nadagdag at natalo ng mga manlalaro. Ang mga panalo at pagkatalo ay maaaring ipahayag sa mga puntos, pera o iba pang mga yunit.

Gumawa tayo ng payoff matrix:

Kung pipili ang unang manlalaro i-ika purong diskarte, at ang pangalawang manlalaro j-th purong diskarte, pagkatapos ay ang kabayaran ng unang manlalaro ay aij units, at ang pagkawala ng pangalawang manlalaro ay din aij mga yunit.

Bilang aij + (- a ij ) = 0, kung gayon ang inilarawang laro ay isang zero-sum matrix na laro.

Ang pinakasimpleng halimbawa ng larong matrix ay ang paghagis ng barya. Ang mga patakaran ng laro ay ang mga sumusunod. Ang una at pangalawang manlalaro ay naghahagis ng barya at ang resulta ay mga ulo o buntot. Kung ang mga ulo at ulo o buntot o buntot ay pinagsama sa parehong oras, kung gayon ang unang manlalaro ay mananalo ng isang yunit, at sa ibang mga kaso ay matatalo siya ng isang yunit (ang pangalawang manlalaro ay mananalo ng isang yunit). Ang parehong dalawang diskarte ay nasa pagtatapon ng pangalawang manlalaro. Ang kaukulang payoff matrix ay:

Ang gawain ng teorya ng laro ay upang matukoy ang pagpili ng diskarte ng unang manlalaro, na magagarantiya sa kanya ng pinakamataas na average na pakinabang, pati na rin ang pagpili ng diskarte ng pangalawang manlalaro, na magagarantiya sa kanya ng pinakamataas na average na pagkawala.

Paano pinipili ang isang diskarte sa isang matrix na laro?

Tingnan natin muli ang payoff matrix:

Una, tinutukoy namin ang kabayaran ng unang manlalaro kung gagamit siya i ika purong diskarte. Kung ang unang manlalaro ay gumagamit i-th purong diskarte, pagkatapos ay lohikal na ipagpalagay na ang pangalawang manlalaro ay gagamit ng ganoong purong diskarte, dahil sa kung saan ang kabayaran ng unang manlalaro ay magiging minimal. Sa turn, ang unang manlalaro ay gagamit ng isang purong diskarte na magbibigay sa kanya ng pinakamataas na kabayaran. Batay sa mga kundisyong ito, ang kabayaran ng unang manlalaro, na tinutukoy namin bilang v1 , ay tinatawag na maximum na panalo o mas mababang presyo ng laro .

Sa para sa mga halagang ito, ang unang manlalaro ay dapat magpatuloy bilang mga sumusunod. Mula sa bawat linya, isulat ang halaga ng pinakamababang elemento at piliin ang maximum mula sa kanila. Kaya, ang kabayaran ng unang manlalaro ay ang pinakamataas na pinakamababa. Kaya ang pangalan - maximin win. Ang numero ng linya ng elementong ito ay ang bilang ng purong diskarte na pinili ng unang manlalaro.

Ngayon, alamin natin ang pagkawala ng pangalawang manlalaro kung gagamit siya j-ika na diskarte. Sa kasong ito, ang unang manlalaro ay gumagamit ng kanyang sariling purong diskarte, kung saan ang pagkawala ng pangalawang manlalaro ay magiging maximum. Ang pangalawang manlalaro ay dapat pumili ng isang purong diskarte kung saan ang kanyang pagkatalo ay magiging minimal. Ang pagkawala ng pangalawang manlalaro, na tinutukoy namin bilang v2 , ay tinatawag na minimax na pagkawala o nangungunang presyo ng laro .

Sa paglutas ng mga problema sa presyo ng laro at pagtukoy ng diskarte upang matukoy ang mga halagang ito para sa pangalawang manlalaro, magpatuloy bilang mga sumusunod. Mula sa bawat hanay, isulat ang halaga ng pinakamataas na elemento at piliin ang pinakamababa mula sa kanila. Kaya, ang pagkawala ng pangalawang manlalaro ay magiging pinakamababa sa maximum. Kaya ang pangalan - minimax gain. Ang numero ng column ng elementong ito ay ang bilang ng purong diskarte na pipiliin ng pangalawang manlalaro. Kung ang pangalawang manlalaro ay gumagamit ng "minimax", kung gayon anuman ang pagpipilian ng diskarte ng unang manlalaro, siya ay matatalo sa karamihan v2 mga yunit.

Halimbawa 1

.

Ang pinakamalaking sa pinakamaliit na elemento ng mga hilera ay 2, ito ang mas mababang presyo ng laro, ang unang hilera ay tumutugma dito, samakatuwid, ang maximin na diskarte ng unang manlalaro ay ang una. Ang pinakamaliit sa pinakamalaking elemento ng mga column ay 5, ito ang pinakamataas na presyo ng laro, ang pangalawang column ay tumutugma dito, samakatuwid, ang minimax na diskarte ng pangalawang manlalaro ay ang pangalawa.

Ngayong natutunan na natin kung paano hanapin ang mas mababa at mataas na presyo ng laro, ang maximin at minimax na mga diskarte, oras na para matutunan kung paano pormal na italaga ang mga konseptong ito.

Kaya, ang garantisadong kabayaran ng unang manlalaro ay:

Ang unang manlalaro ay dapat pumili ng isang purong diskarte na magbibigay sa kanya ng maximum ng pinakamababang kabayaran. Ang pakinabang na ito (maximin) ay tinukoy bilang mga sumusunod:

.

Ang unang manlalaro ay gumagamit ng kanyang purong diskarte upang ang pagkawala ng pangalawang manlalaro ay maximum. Ang pagkawala na ito ay tinukoy bilang mga sumusunod:

Ang pangalawang manlalaro ay dapat pumili ng kanyang purong diskarte upang ang kanyang pagkatalo ay minimal. Ang pagkawala na ito (minimax) ay tinukoy bilang mga sumusunod:

.

Isa pang halimbawa mula sa parehong serye.

Halimbawa 2 Nabigyan ng matrix game na may payoff matrix

.

Tukuyin ang maximin na diskarte ng unang manlalaro, ang minimax na diskarte ng pangalawang manlalaro, ang mas mababa at mataas na presyo ng laro.

Desisyon. Sa kanan ng payoff matrix, isinusulat namin ang pinakamaliit na elemento sa mga hilera nito at minarkahan ang maximum ng mga ito, at mula sa ibaba ng matrix - ang pinakamalaking elemento sa mga column at piliin ang pinakamababa sa kanila:

Ang pinakamalaking sa pinakamaliit na elemento ng mga hilera ay 3, ito ang mas mababang presyo ng laro, ang pangalawang hilera ay tumutugma dito, samakatuwid, ang pinakamataas na diskarte ng unang manlalaro ay ang pangalawa. Ang pinakamaliit sa pinakamalaking elemento ng mga column ay 5, ito ang pinakamataas na presyo ng laro, ang unang column ay tumutugma dito, samakatuwid, ang minimax na diskarte ng pangalawang manlalaro ay ang una.

Saddle point sa matrix games

Kung ang itaas at mas mababang presyo ng laro ay pareho, ang matrix na laro ay itinuturing na may saddle point. Ang kabaligtaran ay totoo rin: kung ang isang matrix na laro ay may saddle point, ang itaas at mas mababang mga presyo ng matrix na laro ay pareho. Ang katumbas na elemento ay parehong pinakamaliit sa row at pinakamalaki sa column, at katumbas ng presyo mga laro.

Kaya, kung , kung gayon ay ang pinakamainam na purong diskarte ng unang manlalaro, at ang pinakamainam na purong diskarte ng pangalawang manlalaro. Iyon ay, pantay na mas mababa at mas mataas na mga presyo ng laro ay nakakamit sa parehong pares ng mga diskarte.

Sa kasong ito ang larong matrix ay may solusyon sa mga purong estratehiya .

Halimbawa 3 Nabigyan ng matrix game na may payoff matrix

.

Desisyon. Sa kanan ng payoff matrix, isinusulat namin ang pinakamaliit na elemento sa mga hilera nito at minarkahan ang maximum ng mga ito, at mula sa ibaba ng matrix - ang pinakamalaking elemento sa mga column at piliin ang pinakamababa sa kanila:

Ang mas mababang presyo ng laro ay kapareho ng mas mataas na presyo ng laro. Kaya, ang presyo ng laro ay 5. Iyon ay . Ang presyo ng laro ay katumbas ng halaga ng saddle point. Ang maximin na diskarte ng unang manlalaro ay ang pangalawang purong diskarte, at ang minimax na diskarte ng pangalawang manlalaro ay ang ikatlong purong diskarte. Ang matrix game na ito ay may solusyon sa mga purong diskarte.

Lutasin ang problema ng matrix game sa iyong sarili, at pagkatapos ay tingnan ang solusyon

Halimbawa 4 Nabigyan ng matrix game na may payoff matrix

.

Hanapin ang mas mababa at mataas na presyo ng laro. May saddle point ba ang matrix game na ito?

Matrix laro na may pinakamainam na pinaghalong diskarte

Sa karamihan ng mga kaso, ang larong matrix ay walang saddle point, kaya ang katumbas na larong matrix ay walang mga purong solusyon sa diskarte.

Ngunit mayroon itong solusyon sa pinakamainam na pinaghalong estratehiya. Upang mahanap ang mga ito, dapat ipagpalagay na ang laro ay paulit-ulit nang sapat na beses na, batay sa karanasan, mahulaan ng isa kung aling diskarte ang mas gusto. Samakatuwid, ang desisyon ay nauugnay sa konsepto ng probabilidad at average (pag-asa). Sa pangwakas na solusyon, mayroong parehong analog ng saddle point (iyon ay, ang pagkakapantay-pantay ng mas mababa at mas mataas na presyo ng laro), at isang analog ng mga diskarte na naaayon sa kanila.

Kaya, upang makuha ng unang manlalaro ang pinakamataas na average na pakinabang at para sa pangalawang manlalaro na magkaroon ng pinakamababang average na pagkatalo, ang mga purong diskarte ay dapat gamitin na may tiyak na posibilidad.

Kung ang unang manlalaro ay gumagamit ng mga purong diskarte na may posibilidad , pagkatapos ay ang vector ay tinatawag na pinaghalong diskarte ng unang manlalaro. Sa madaling salita, ito ay isang "halo" ng mga purong estratehiya. Ang kabuuan ng mga probabilidad na ito ay katumbas ng isa:

.

Kung ang pangalawang manlalaro ay gumagamit ng mga purong diskarte na may posibilidad , pagkatapos ay ang vector ay tinatawag na pinaghalong diskarte ng pangalawang manlalaro. Ang kabuuan ng mga probabilidad na ito ay katumbas ng isa:

.

Kung ang unang manlalaro ay gumagamit ng magkahalong diskarte p, at ang pangalawang manlalaro - isang halo-halong diskarte q, pagkatapos ay makatuwiran inaasahang halaga panalo ang unang manlalaro (matalo ang pangalawang manlalaro). Para mahanap ito, kailangan mong i-multiply ang mixed strategy vector ng unang manlalaro (na magiging isang one-row matrix), ang payoff matrix, at ang mixed strategy vector ng pangalawang manlalaro (na magiging one-column matrix):

.

Halimbawa 5 Nabigyan ng matrix game na may payoff matrix

.

Tukuyin ang mathematical na inaasahan ng pakinabang ng unang manlalaro (pagkatalo ng pangalawang manlalaro), kung ang pinaghalong diskarte ng unang manlalaro ay , at ang pinaghalong diskarte ng pangalawang manlalaro ay .

Desisyon. Ayon sa formula para sa mathematical na pag-asa ng pakinabang ng unang manlalaro (pagkatalo ng pangalawang manlalaro), ito ay katumbas ng produkto ng mixed strategy vector ng unang manlalaro, ang payoff matrix, at mixed strategy vector ng pangalawang manlalaro:

Ang unang manlalaro ay tinatawag na isang pinaghalong diskarte na magbibigay sa kanya ng pinakamataas na average na kabayaran kung ang laro ay inuulit ng sapat na bilang ng beses.

Pinakamainam na pinaghalong diskarte Ang pangalawang manlalaro ay tinatawag na isang pinaghalong diskarte na magbibigay sa kanya ng pinakamababang average na pagkatalo kung ang laro ay inuulit ng sapat na bilang ng beses.

Sa pamamagitan ng pagkakatulad sa notasyon ng maximin at minimax sa mga kaso ng mga purong diskarte, ang pinakamainam na pinaghalong mga diskarte ay tinutukoy bilang mga sumusunod (at naka-link sa matematikal na inaasahan, iyon ay, ang average, ng nakuha ng unang manlalaro at pagkatalo ng pangalawang manlalaro):

,

.

Sa kasong ito, para sa function E may saddle point , na nangangahulugang pagkakapantay-pantay.

Upang mahanap ang pinakamainam na pinaghalong diskarte at saddle point, i.e. lutasin ang larong matrix sa magkahalong diskarte , kailangan mong bawasan ang matrix game sa isang linear programming problem, iyon ay, sa isang optimization problem, at lutasin ang kaukulang linear programming problem.

Pagbawas ng isang matrix na laro sa isang linear na problema sa programming

Upang malutas ang isang matrix na laro sa halo-halong mga diskarte, kailangan mong bumuo ng isang tuwid na linya problema sa linear programming at dalawahang gawain nito. Sa dual problem, ang augmented matrix, na nag-iimbak ng coefficients ng mga variable sa constraint system, constant terms, at coefficients ng mga variable sa goal function, ay inilipat. Sa kasong ito, ang minimum ng layunin ng function ng orihinal na problema ay nauugnay sa maximum sa dalawahang problema.

Layunin ang function sa direktang linear na problema sa programming:

.

Ang sistema ng mga hadlang sa direktang problema ng linear programming:

Pag-andar ng layunin sa dalawahang problema:

.

Ang sistema ng mga hadlang sa dalawahang problema:

Tukuyin ang pinakamainam na plano ng direktang linear na problema sa programming

,

at ang pinakamainam na plano ng dalawahang problema ay tinutukoy ng

Mga linear na hugis para sa nauugnay pinakamainam na mga plano magpakilala at ,

at kailangan mong hanapin ang mga ito bilang kabuuan ng kaukulang mga coordinate ng pinakamainam na mga plano.

Alinsunod sa mga kahulugan ng nakaraang seksyon at mga coordinate ng pinakamainam na mga plano, ang mga sumusunod na pinaghalong diskarte ng una at pangalawang manlalaro ay may bisa:

.

Napatunayan iyon ng mga mathematician presyo ng laro ay ipinahayag sa mga tuntunin ng mga linear na anyo ng pinakamainam na mga plano tulad ng sumusunod:

,

iyon ay, ito ay ang kapalit ng mga kabuuan ng mga coordinate ng pinakamainam na mga plano.

Kami, mga practitioner, ay maaari lamang gumamit ng formula na ito upang malutas ang mga laro ng matrix sa magkahalong diskarte. Gaya ng mga formula para sa paghahanap ng pinakamainam na pinaghalong estratehiya ayon sa pagkakabanggit ang una at pangalawang manlalaro:

kung saan ang pangalawang salik ay mga vector. Ang pinakamainam na pinaghalong estratehiya ay mga vectors din, gaya ng natukoy na natin sa nakaraang talata. Samakatuwid, ang pagpaparami ng numero (ang presyo ng laro) ng vector (na may mga coordinate ng pinakamainam na mga plano), nakakakuha din kami ng isang vector.

Halimbawa 6 Nabigyan ng matrix game na may payoff matrix

.

Hanapin ang presyo ng isang laro V at pinakamainam na pinaghalong estratehiya at .

Desisyon. Binubuo namin ang linear programming problem na tumutugma sa matrix game na ito:

Nakukuha namin ang solusyon ng direktang problema:

.

Nakikita namin ang linear na anyo ng pinakamainam na mga plano bilang kabuuan ng mga nahanap na coordinate.

Lecture 11: Teorya ng Laro at Paggawa ng Desisyon

Ang paksa at mga gawain ng teorya ng laro

Ang mga klasikong problema ng pagsusuri ng system ay mga problema sa laro ng paggawa ng desisyon sa ilalim ng panganib at kawalan ng katiyakan.

Parehong ang mga layunin ng operasyon, ang mga kondisyon para sa pagsasagawa ng operasyon, at ang mulat na pagkilos ng mga kalaban o iba pang mga tao kung saan nakasalalay ang tagumpay ng operasyon, ay maaaring hindi tiyak.

Espesyal mga pamamaraan sa matematika idinisenyo upang bigyang-katwiran ang mga desisyon sa ilalim ng panganib at kawalan ng katiyakan. Sa ilang, ang pinakasimpleng mga kaso, ginagawang posible ng mga pamamaraang ito na aktwal na mahanap at piliin ang pinakamainam na solusyon. Sa mas kumplikadong mga kaso, ang mga pamamaraang ito ay nagbibigay ng pantulong na materyal na nagbibigay-daan sa mas malalim na pag-unawa sa mahirap na sitwasyon at suriin ang bawat isa mga posibleng solusyon mula sa iba't ibang punto ng view, at gumawa ng mga pagpapasya batay dito posibleng kahihinatnan. Ang isa sa mga mahalagang kondisyon para sa paggawa ng desisyon sa kasong ito ay ang pagbabawas ng panganib.

Kapag nilulutas ang isang serye mga praktikal na gawain Ang pananaliksik sa pagpapatakbo (kapaligiran, kaligtasan sa buhay, atbp.) ay kailangang suriin ang mga sitwasyon kung saan ang dalawang (o higit pang) naglalabanang partido na naghahabol ng magkaibang layunin ay nagbanggaan, at ang resulta ng anumang aktibidad ng bawat isa sa mga partido ay nakasalalay sa kung aling paraan ng pagkilos ang pipiliin nitong kalaban. Ang mga ganitong sitwasyon ay maaaring tawaging mga sitwasyon ng salungatan.

Ang teorya ng laro ay teoryang matematika mga sitwasyon ng salungatan, sa tulong kung saan posible na bumuo ng mga rekomendasyon sa makatwirang kurso ng pagkilos ng mga kalahok sa salungatan. Upang gawing posible na mathematically pag-aralan ang sitwasyon nang hindi isinasaalang-alang ang pangalawang mga kadahilanan, ang isang pinasimple, schematized na modelo ng sitwasyon ay binuo, na tinatawag na laro. ang laro ay nilalaro ayon sa mahusay na tinukoy na mga patakaran, na nauunawaan bilang isang sistema ng mga kondisyon na kumokontrol sa mga posibleng pagpipilian para sa mga aksyon ng mga manlalaro; ang dami ng impormasyon na mayroon ang bawat partido tungkol sa pag-uugali ng isa; ang kinalabasan ng laro na hahantong sa bawat ibinigay na hanay ng mga galaw.

Ang resulta ng laro (panalo o pagkatalo) ay hindi palaging may quantitative na expression, ngunit kadalasan ay posible, kahit na may kondisyon, na ipahayag ito sa isang numerical na halaga.

Ang isang paglipat ay ang pagpili ng isa sa mga aksyon na ibinigay para sa mga patakaran ng laro at pagpapatupad nito. Ang mga galaw ay nahahati sa personal at random. Ang isang personal na paglipat ay isang malay na pagpili ng manlalaro ng isa sa mga posibleng opsyon para sa aksyon at pagpapatupad nito. Ang isang random na paglipat ay isang pagpipilian mula sa isang bilang ng mga posibilidad, na isinasagawa hindi sa pamamagitan ng desisyon ng player, ngunit sa pamamagitan ng ilang mekanismo ng random na pagpipilian (paghagis ng isang barya, pagpili ng isang card mula sa isang shuffled deck, atbp.). Para sa bawat random na galaw, tinutukoy ng mga panuntunan ng laro ang probability distribution ng mga posibleng resulta. Ang laro ay maaaring binubuo lamang ng kanilang mga personal na galaw, o mga random na galaw lamang, o kumbinasyon ng pareho. Ang susunod na pangunahing konsepto ng teorya ng laro ay ang konsepto ng diskarte. Ang diskarte ay isang sistema ng mga desisyong priori na pinagtibay ng manlalaro (ng "kung-pagkatapos" na uri), na sinusunod niya sa panahon ng laro, na maaaring katawanin bilang isang algorithm at awtomatikong isagawa.

Ang layunin ng teorya ng laro ay bumuo ng mga rekomendasyon para sa makatwirang pag-uugali ng mga manlalaro sa sitwasyon ng tunggalian, ibig sabihin, ang kahulugan ng "pinakamainam na diskarte" para sa bawat isa sa kanila. Ang isang diskarte na pinakamainam sa isang sukat ay maaaring hindi kinakailangang maging pinakamainam sa iba. Ang pagkilala sa mga limitasyong ito, at samakatuwid ay hindi bulag na sumusunod sa mga rekomendasyong nakuha ng mga pamamaraan ng laro, maaari pa ring makatwirang gamitin ang matematikal na kagamitan ng teorya ng laro upang makabuo, kung hindi man eksaktong pinakamainam, at hindi bababa sa isang "katanggap-tanggap" na diskarte.

Mga laro maaaring uriin: ayon sa bilang ng mga manlalaro, ang bilang ng mga diskarte, ang likas na katangian ng pakikipag-ugnayan ng mga manlalaro, ang likas na katangian ng kabayaran, ang bilang ng mga galaw, ang estado ng impormasyon, atbp. .

Depende sa bilang ng mga manlalaro makilala sa pagitan ng mga laro ng dalawa at n manlalaro. Ang una sa kanila ay ang pinaka-pinag-aralan. Ang mga laro ng tatlo o higit pang mga manlalaro ay hindi gaanong pinag-aralan dahil sa mga pangunahing paghihirap na lumitaw at ang mga teknikal na posibilidad na makakuha ng solusyon.

Depende sa bilang ng mga posibleng diskarte, ang mga laro ay nahahati sa " pangwakas"at" walang katapusan».

Ang isang laro ay sinasabing may hangganan kung ang bawat manlalaro ay may hangganan lamang na bilang ng mga diskarte, at walang katapusan kung kahit isa sa mga manlalaro ay may walang katapusang bilang ng mga diskarte.

Sa pamamagitan ng likas na katangian ng pakikipag-ugnayan ang mga laro ay nahahati sa hindi kooperatiba: ang mga manlalaro ay walang karapatang pumasok sa mga kasunduan, bumuo ng mga koalisyon; koalisyon (kooperatiba) - maaaring sumali sa mga koalisyon.

AT mga larong kooperatiba ang mga koalisyon ay paunang natukoy.

Sa likas na katangian ng mga panalo ang mga laro ay nahahati sa: zero-sum na laro (ang kabuuang kapital ng lahat ng manlalaro ay hindi nagbabago, ngunit muling ipinamamahagi sa mga manlalaro; ang kabuuan ng mga kabayaran ng lahat ng manlalaro ay zero) at hindi zero-sum na mga laro.

Sa pamamagitan ng uri ng mga function ng kabayaran Ang mga laro ay nahahati sa: matrix, bimatrix, tuloy-tuloy, matambok, atbp.

matris ang laro ay isang panghuling laro ng dalawang manlalaro na may zero sum, kung saan ang kabayaran ng player 1 ay ibinibigay sa anyo ng isang matrix (ang hilera ng matrix ay tumutugma sa bilang ng inilapat na diskarte ng player 1, ang column ay tumutugma sa ang bilang ng inilapat na diskarte ng player sa intersection ng row at column ng matrix, ang kabayaran ng player 1 ay matatagpuan, na naaayon sa mga inilapat na diskarte ).

Para sa mga larong matrix, napatunayan na ang alinman sa mga ito ay may solusyon at madali itong mahahanap sa pamamagitan ng pagbabawas ng laro sa isang linear na problema sa programming.

Bimatrix ang laro ay isang may hangganang laro ng dalawang manlalaro na may non-zero sum, kung saan ang mga kabayaran ng bawat manlalaro ay ibinibigay ng mga matrice nang hiwalay para sa kaukulang manlalaro (sa bawat matrix, ang hilera ay tumutugma sa diskarte ng manlalaro 1, ang column ay tumutugma sa diskarte ng player 2, sa intersection ng row at column sa unang matrix ay ang kabayaran ng player 1 , sa pangalawang matrix ay ang kabayaran ng player)

Tuloy-tuloy ang isang laro ay isinasaalang-alang kung saan ang payoff function ng bawat manlalaro ay tuloy-tuloy. Ito ay pinatunayan na ang mga laro ng klase na ito ay may mga solusyon, ngunit halos katanggap-tanggap na mga pamamaraan para sa paghahanap ng mga ito ay hindi pa binuo.

Kung ang payoff function ay matambok, kung gayon ang ganitong laro ay tinatawag matambok. Para sa kanila, ang mga katanggap-tanggap na paraan ng solusyon ay binuo, na binubuo sa paghahanap ng isang purong pinakamainam na diskarte (isang tiyak na numero) para sa isang manlalaro at ang mga probabilidad ng paglalapat ng mga purong pinakamainam na diskarte ng isa pang manlalaro. Ang gawaing ito ay medyo madaling lutasin.

Pagre-record ng Matrix Game bilang Payoff Matrix

Isaalang-alang ang isang may hangganang laro kung saan ang unang manlalaro na si A ay may m mga diskarte at ang pangalawa manlalaro B-n estratehiya. Ang ganitong laro ay tinatawag na m×n game. Tukuyin ang mga estratehiya A 1 , A 2 , ..., A m ; at B 1 , B 2 , ..., B n . Ipagpalagay na ang bawat panig ay pumili ng isang tiyak na diskarte: A i o B j . Kung ang laro ay binubuo lamang ng mga personal na galaw, kung gayon ang pagpili ng mga diskarte ay natatanging tumutukoy sa kinalabasan ng laro — ang panalo ng isa sa mga partido a ij . Kung naglalaman ang laro, bilang karagdagan sa mga personal na random na galaw, kung gayon ang kabayaran para sa isang pares ng mga diskarte na A i at B ay isang random na variable na nakasalalay sa mga kinalabasan ng lahat ng mga random na galaw. Sa kasong ito, ang natural na pagtatantya ng inaasahang kabayaran ay ang inaasahang kabayaran, na tinutukoy din ng isang ij .

Ipagpalagay na alam natin ang mga halaga ng isang ij para sa bawat pares ng mga estratehiya. Ang mga halagang ito ay maaaring isulat sa anyo ng isang hugis-parihaba na talahanayan (matrix), ang mga hilera kung saan tumutugma sa mga diskarte A i , at ang mga haligi ay tumutugma sa mga diskarte B j .

Pagkatapos, sa pangkalahatan, ang matrix na laro ay maaaring isulat bilang sumusunod na payoff matrix:

B1 B2 ... B n
A 1 isang 11 isang 12 ... isang 1n
A2 isang 21 isang 22 ... isang 2n
... ... ... ... ...
Isang m isang m1 isang m2 ... amn

mesa - Pangkalahatang anyo payoff matrix ng matrix game

kung saan ang A i ay ang mga pangalan ng mga diskarte ng player 1, ang B j ay ang mga pangalan ng mga diskarte ng player 2, ang a ij ay ang mga kabayaran ng player 1 kapag pinili niya ang i-th na diskarte, at ang player 2 ay pipili ng j-th na diskarte. Dahil ang larong ito ay isang zero-sum game, ang halaga ng kabayaran para sa manlalaro 2 ay kabaligtaran sa tanda ng halaga ng kabayaran para sa manlalaro 1.

Ang konsepto ng mas mababa at mas mataas na presyo ng laro. Solusyon ng laro sa mga purong diskarte

Ang bawat isa sa mga manlalaro ay naglalayong i-maximize ang kanyang kabayaran, na isinasaalang-alang ang pag-uugali ng kalabang manlalaro. Samakatuwid, para sa manlalaro 1, kinakailangan upang matukoy ang pinakamababang halaga ng mga kabayaran sa bawat isa sa mga diskarte, at pagkatapos ay hanapin ang maximum ng mga halagang ito, iyon ay, matukoy ang halaga

V n \u003d max i min j a ij

o hanapin ang pinakamababang halaga para sa bawat isa sa mga hilera ng payoff matrix, at pagkatapos ay tukuyin ang maximum ng mga halagang ito. Ang halaga ng V n ay tinatawag maximin matrice o mas mababang presyo ng laro. Ang diskarte ng manlalaro na tumutugma sa maximin V n ay tinatawag na maximin na diskarte.

Malinaw, kung susundin namin ang diskarte ng maximin, kung gayon para sa anumang pag-uugali ng kalaban ay ginagarantiyahan namin ang isang kabayaran na hindi bababa sa V n. Samakatuwid, ang halaga ng V n ay ang garantisadong minimum na maaari naming ibigay sa aming sarili, na sumusunod sa aming pinaka-maingat na diskarte.

Ang halaga ng nakuha ng manlalaro 1 ay, ayon sa kahulugan ng larong matrix, ang halaga ng pagkawala ng manlalaro. Samakatuwid, para sa manlalaro 2, kinakailangan upang matukoy ang halaga

V sa = min j max i a ij

O hanapin ang maximum na mga halaga para sa bawat isa sa mga column ng payoff matrix, at pagkatapos ay tukuyin ang minimum ng mga halagang ito. Ang halaga ng V sa ay tinatawag minimax matrice, nangungunang presyo ng laro o minimax na kabayaran. Ang diskarte ng kalaban na naaayon sa kabayaran ay tinatawag na kanyang diskarte sa minimax. Sa pamamagitan ng pagsunod sa kanyang pinaka-maingat na diskarte sa minimax, ang kalaban ay ginagarantiyahan na sa anumang kaso siya ay mawawalan ng higit sa V c.

Kung ang mga halaga ng V н at V в ay hindi magkatugma, habang pinapanatili ang mga patakaran ng laro (coefficients a ij) sa mahabang panahon, ang pagpili ng mga diskarte ng bawat isa sa mga manlalaro ay lumalabas na hindi matatag. Nakakakuha lamang ito ng katatagan kapag V n \u003d V sa \u003d V. Sa kasong ito, sinasabi nila na ang laro ay may solusyon sa mga purong estratehiya, at ang mga estratehiya kung saan nakamit ang V ay pinakamainam na purong estratehiya. Ang halagang V ay tinatawag ang netong presyo ng laro .

Halimbawa, sa isang matrix:

B1 B2 B3 B4 Min j
A 1 17 16 15 14 14
A2 11 18 12 13 11
A 3 18 11 13 12 11
Max i 18 18 15 14

Talahanayan — Payoff matrix kung saan mayroong solusyon sa mga purong estratehiya

may solusyon sa purong estratehiya. Sa kasong ito, para sa manlalaro 1, ang pinakamainam na purong diskarte ay magiging diskarte A 1 , at para sa manlalaro 2, diskarte B 4 .

Sa matrix, walang solusyon sa mga purong diskarte, dahil ang mas mababang presyo ng laro ay naabot sa diskarte A 1 at ang halaga nito ay 12, habang ang pinakamataas na presyo ng laro ay naabot sa diskarte B 4 at ang halaga nito ay 13.

B1 B2 B3 B4 Min j
A 1 17 16 15 12 12
A2 11 18 12 13 11
A 3 18 11 13 12 11
Max i 18 18 15 13

Talahanayan - Payoff matrix kung saan walang solusyon sa mga purong estratehiya

Pagbabawas ng pagkakasunud-sunod ng payoff matrix

Ang pagkakasunud-sunod ng payoff matrix (ang bilang ng mga row at column) ay maaaring bawasan sa pamamagitan ng pag-aalis ng dominado at duplicate na mga diskarte.

Ang diskarte na K* ay tinatawag nangingibabaw diskarte K** kung, para sa anumang variant ng pag-uugali ng kalabang manlalaro, ang kaugnayan

isang k*< A k** ,

kung saan ang A k* at A k** ay ang mga halaga ng mga kabayaran kapag ang manlalaro ay pumili ng mga diskarte na K* at K**, ayon sa pagkakabanggit.

Kung ang relasyon

ang diskarte K* ay sinasabing nadoble na may kinalaman sa diskarte K**.

Halimbawa, sa isang matrix na may dominated at duplicate na mga diskarte, ang diskarte A 1 ay nangingibabaw sa diskarte A 2 , ang diskarte B 6 ay dominado sa paggalang sa mga diskarte B 3 , B 4 at B 5 , at ang diskarte B 5 ay duplicate nang may paggalang sa diskarte B 4 .

B1 B2 B3 B4 B5 B6
A 1 1 2 3 4 4 7
A2 7 6 5 4 4 8
A 3 1 8 2 3 3 6
A4 8 1 3 2 2 5

Talahanayan - Payoff Matrix na may Dominado at Duplicate na Istratehiya

Ang mga diskarte na ito ay hindi pipiliin ng mga manlalaro, dahil sila ay malinaw na natatalo at ang pag-alis ng mga diskarte na ito mula sa payoff matrix ay hindi makakaapekto sa pagpapasiya ng mas mababa at mas mataas na mga presyo ng laro na inilarawan ng matrix na ito.

Ang hanay ng mga di-dominado na diskarte na nakuha pagkatapos bawasan ang dimensyon ng payoff matrix ay tinatawag ding Pareto set.

Mga halimbawa ng laro

1. Ang larong "Chicken"

Ang larong "Chicken" ay binubuo sa katotohanan na ang mga manlalaro ay pumasok sa isang pakikipag-ugnayan na humahantong sa pagdudulot ng malubhang pinsala sa bawat isa sa kanila hanggang sa umalis ang isa sa mga manlalaro sa laro. Ang isang halimbawa ng paggamit ng larong ito ay ang pakikipag-ugnayan ng mga sasakyan, halimbawa, ang mga sitwasyon kapag ang dalawang kotse ay papunta sa isa't isa, at ang unang lumiko sa gilid ay itinuturing na isang "mahina" o "manok". Ang kahulugan ng laro ay lumikha ng tensyon na hahantong sa pag-aalis ng manlalaro. Ang sitwasyong ito ay madalas na matatagpuan sa mga tinedyer o agresibong kabataan, bagaman kung minsan ay nagdadala ito ng mas mababang panganib. Ang isa pang gamit ng larong ito ay kapag ang dalawang partidong pampulitika ay nakipag-ugnayan kung saan wala silang mapapala at tanging pagmamataas ang nagpapanatili sa kanila na magkasalungat. Ang mga partido ay mabagal na gumawa ng mga konsesyon hanggang sa maabot nila ang huling punto. Ang nagreresultang sikolohikal na stress ay maaaring humantong sa isa sa mga manlalaro sa maling diskarte ng pag-uugali: kung wala sa mga manlalaro ang magbubunga, kung gayon ang isang banggaan at isang nakamamatay na denouement ay hindi maiiwasan.

Ang payoff matrix para sa laro ay ganito ang hitsura:

ani Wag kang susuko
ani 0, 0 -1, +1
Wag kang susuko +1, -1 -100, -100

2. Ang larong "saranggola at kalapati"

Ang larong saranggola at kalapati ay isang biyolohikal na halimbawa ng isang laro. Sa bersyong ito, dalawang manlalaro na may walang limitasyong mapagkukunan ang pumili ng isa sa dalawang diskarte sa pag-uugali. Ang una (“kalapati”) ay ang pagpapakita ng manlalaro ng kanyang lakas sa pamamagitan ng pananakot sa kalaban, at ang pangalawa (“saranggola”) ay ang pisikal na pag-atake ng manlalaro sa kalaban. Kung pipiliin ng dalawang manlalaro ang diskarte sa saranggola, lalaban sila sa pamamagitan ng pananakit sa isa't isa. Kung pipiliin ng isa sa mga manlalaro ang diskarte na "Saranggola", at ang pangalawang "Lapati", pagkatapos ay tinatalo ng una ang pangalawa. Kung ang parehong mga manlalaro ay kalapati, ang mga kalaban ay nakipagkompromiso, na tumatanggap ng kabayaran na lumalabas na mas mababa kaysa sa kabayaran ng saranggola na tumatalo sa kalapati, tulad ng sumusunod mula sa payoff matrix ng larong ito.

Narito ang V ay ang presyo ng kasunduan, ang C ay ang presyo ng salungatan, at V

Mayroong tatlong Nash equilibrium point sa larong saranggola at kalapati:

  1. Pinipili ng unang manlalaro ang saranggola, at pipiliin ng pangalawang manlalaro ang kalapati.
  2. Ang unang manlalaro ay pipili ng isang kalapati, at ang pangalawa ay isang saranggola.
  3. ang parehong mga manlalaro ay pipili ng magkahalong diskarte kung saan ang "kite" ay pinili na may probability p, at "dove" na may probability na 1-p.

3. Prisoner's Dilemma

Ang dilemma ng bilanggo ay isa sa mga pinakakaraniwang sitwasyon ng salungatan na isinasaalang-alang sa teorya ng laro.

Ang dilemma ng klasikong bilanggo ay ganito: dalawang suspek, A at B, ay nasa magkaibang mga selda. Ang imbestigador, na binisita sila nang paisa-isa, ay nagmumungkahi ng isang pakikitungo sa sumusunod na nilalaman: kung ang isa sa kanila ay tumestigo laban sa isa, at ang pangalawa ay nananatiling tahimik, kung gayon ang unang bilanggo ay palalayain, at ang pangalawa ay masentensiyahan ng 10 taon . Kung mananatiling tahimik ang dalawa, maglilingkod sila ng 6 na buwan. Kung pareho silang magkakanulo sa isa't isa, ang bawat isa ay tatanggap ng 2 taon. Ang bawat isa sa mga bilanggo ay dapat gumawa ng isang desisyon: upang ipagkanulo ang isang kasabwat o manatiling tahimik, hindi alam kung anong desisyon ang ginawa ng isa. Dilemma: anong desisyon ang gagawin ng mga bilanggo?

Ang payoff matrix ng laro:

Sa kasong ito, ang resulta ay batay sa desisyon ng bawat isa sa mga bilanggo. Ang posisyon ng mga manlalaro ay kumplikado sa pamamagitan ng katotohanan na hindi nila alam kung anong desisyon ang ginawa ng iba, at hindi sila nagtitiwala sa isa't isa.

Ang pinakamahusay na diskarte ng mga manlalaro ay ang pakikipagtulungan, kung saan ang dalawa ay tahimik, at tumatanggap ng pinakamataas na kabayaran (mas maliit na termino), ang bawat isa ay magiging mas kaunting panalo.

Suriin natin ang "dilemma ng bilanggo", na ipinapasa para sa kalinawan sa payoff matrix ng canonical form:

Pagtutulungan Pagtanggi na makipagtulungan
Pagtutulungan 3, 3 0, 5
Pagtanggi na makipagtulungan 5, 0 1, 1

Ayon sa matrix na ito, ang halaga ng mutual non-cooperation (S) ay 1 puntos para sa bawat isa sa mga manlalaro, ang halaga ng kooperasyon (R) ay 3 puntos, at ang presyo ng tuksong ipagkanulo ang iba (T) ay 5 puntos . Maaari nating isulat ang sumusunod na hindi pagkakapantay-pantay: T > R > S. Kapag inulit ng maraming beses ang laro, ang pagpili ng kooperasyon ay daig ang tuksong magtaksil at makuha ang pinakamataas na kabayaran: 2 R > T + S.

Nash ekwilibriyo.

Ang Nash equilibrium ay isang sitwasyon kung saan walang manlalaro ang may insentibo na baguhin ang kanyang diskarte dahil sa diskarte ng isa pang manlalaro (isa pang kumpanya), na nagpapahintulot sa mga manlalaro na maabot ang isang solusyon sa kompromiso.

Ang kahulugan ng isang Nash equilibrium at ang pagkakaroon nito ay tinukoy bilang mga sumusunod.

Hayaang ang (S, f) ay isang laro kung saan ang S ay ang hanay ng mga estratehiya at ang f ay ang hanay ng mga kabayaran. Kapag pinipili ng bawat isa sa mga manlalaro na i ∈ (1, ..., n) ang diskarte x i &isin S, kung saan x = (x 1 , ..., x n), pagkatapos ay matatanggap ng player na i ang kabayaran f i (x). Ang kabayaran ay depende sa diskarte na pinili ng lahat ng mga manlalaro. Ang isang diskarte x* ∈ S ay isang Nash equilibrium kung walang paglihis mula rito ng sinumang manlalaro ang nagdudulot sa kanya ng tubo, iyon ay, ang mga sumusunod na hindi pagkakapantay-pantay ay nananatili para sa lahat ng i:

f i (x*) ≥ f i (x i , x* -i)

Halimbawa, ang dilemma game ng bilanggo ay may isang Nash equilibrium, isang sitwasyon kung saan ang parehong mga bilanggo ay nagtataksil sa isa't isa.

Ang pinakamadaling paraan upang matukoy ang Nash equilibrium ay ang paggamit ng payoff matrix, lalo na sa mga kaso kung saan dalawang manlalaro ang lumahok sa laro, na mayroong higit sa dalawang diskarte sa kanilang arsenal. Dahil sa kasong ito ang pormal na pagsusuri ay magiging kumplikado, ginagamit namin mnemonic rule, na kung saan ay ang mga sumusunod: ang cell ng payoff matrix ay isang Nash equilibrium kung ang unang numero sa loob nito ay ang maximum sa lahat ng mga halaga na ipinakita sa mga column, at ang pangalawang numero sa cell ay ang maximum na bilang sa mga lahat ng row.

Halimbawa, ilapat ang panuntunang ito para sa isang 3x3 matrix:

A B C
A 0, 0 25, 40 5, 10
B 40, 25 0, 0 5, 15
C 10, 5 15, 5 10, 10

Nash equilibrium points: (B,A), (A,B) at (C,C). Sa katunayan, para sa cell (B,A), dahil 40 ang pinakamataas na halaga sa unang hanay, 25 ang pinakamataas na halaga sa pangalawang hilera. Para sa cell (A,B), 25 ang pinakamataas na halaga sa pangalawang hanay, 40 ang pinakamataas na halaga sa pangalawang hilera. Ang parehong ay totoo para sa cell (C, C).

Isaalang-alang ang isang halimbawa ng isang laro ng polusyon ( kapaligiran). Dito ang ating bigyang pansin ay isang uri ng mga side effect ng produksyon gaya ng polusyon. Kung ang mga kumpanya ay hindi kailanman nagtanong sa sinuman kung ano ang gagawin, sinuman sa kanila ay mas gugustuhin na lumikha ng polusyon kaysa mag-install ng mga mamahaling panlinis. Kung nagpasya ang anumang kumpanya na bawasan ang mga nakakapinsalang emisyon, kung gayon ang mga gastos, at, dahil dito, ang mga presyo ng mga produkto nito, ay tataas, at bababa ang demand. Posibleng malugi lang ang kumpanyang ito. Nabubuhay sa malupit na mundo ng natural selection, mas gugustuhin ng mga kumpanya na manatili sa isang Nash equilibrium (cell D) kung saan hindi na kailangang gumastos ng pera sa mga wastewater treatment plant at teknolohiya. Walang kumpanya ang makapagdaragdag ng kita sa pamamagitan ng pagbabawas ng polusyon.

Matatag 1
Matatag 2 Mababang polusyon Mataas na antas ng polusyon
Mababang polusyon PERO
100,100
AT
-30,120
Mataas na antas ng polusyon Sa
120,-30
D
100,100

Talahanayan - Payoff matrix ng laro sa polusyon sa kapaligiran.

Sa pagpasok sa larong pang-ekonomiya, ang bawat hindi nakokontrol at nagpapalaki ng tubo na kompanya ng bakal ay magbubunga ng polusyon sa tubig at hangin. Kung ang anumang kumpanya ay sumusubok na linisin ang mga emisyon nito, sa gayon ay mapipilitang itaas ang mga presyo at magkakaroon ng mga pagkalugi. Ang hindi kooperatiba na pag-uugali ay magtatatag ng isang Nash equilibrium sa ilalim ng mataas na outlier na mga kondisyon. Ang gobyerno ay maaaring gumawa ng mga hakbang upang ilipat ang ekwilibriyo sa cell A. Sa posisyong ito, ang polusyon ay magiging bale-wala, ngunit ang mga kita ay mananatiling pareho.

Ang mga laro sa polusyon ay isa sa mga kaso kung saan ang mekanismo ng "invisible hand" ay hindi gumagana. Ito ay isang sitwasyon kung saan ang Nash equilibrium ay hindi epektibo. Minsan nagiging pagbabanta ang mga larong ito na wala sa kontrol at maaaring makialam ang gobyerno. Sa pamamagitan ng pagtatatag ng isang sistema ng mga multa at emission quota, maaaring hikayatin ng gobyerno ang mga kumpanya na pumili ng resulta A, na naaayon sa mababang antas polusyon. Ang mga kumpanya ay eksaktong kapareho ng dati, na may malalaking emisyon, at ang mundo ay nagiging mas malinis.

Isang halimbawa ng paglutas ng larong matrix sa mga purong diskarte

Isaalang-alang natin ang isang halimbawa ng paglutas ng isang matrix na laro sa mga purong diskarte, sa isang tunay na ekonomiya, sa isang sitwasyon kung saan ang dalawang negosyo ay nakikipagpunyagi para sa merkado ng produkto ng rehiyon.

Gawain.

Dalawang negosyo ang gumagawa ng mga produkto at ibinibigay ang mga ito sa rehiyonal na merkado. Sila lang ang mga supplier ng mga produkto sa rehiyon, kaya ganap nilang tinutukoy ang merkado para sa mga produktong ito sa rehiyon.

Ang bawat isa sa mga negosyo ay may kakayahang gumawa ng mga produkto gamit ang isa sa tatlong magkakaibang teknolohiya. Depende sa pagkamagiliw sa kapaligiran ng proseso ng teknolohikal at ang kalidad ng mga produkto na ginawa ng bawat teknolohiya, maaaring itakda ng mga negosyo ang presyo ng isang yunit ng produksyon sa antas ng 10, 6 at 2 na mga yunit ng pananalapi, ayon sa pagkakabanggit. Kasabay nito, ang mga negosyo ay may iba't ibang mga gastos para sa produksyon ng isang yunit ng output.

Talahanayan - Mga gastos sa bawat yunit ng output na ginawa sa mga negosyo ng rehiyon (mga yunit ng pera).

Ang resulta pananaliksik sa marketing ang merkado ng produkto ng rehiyon, ang pag-andar ng demand para sa mga produkto ay natukoy:

Y = 6 - 0.5⋅X,

kung saan ang Y ay ang dami ng mga produkto na bibilhin ng populasyon ng rehiyon (thousand units), at ang X ay ang average na presyo ng mga produkto ng mga negosyo, c.u.

Ang data sa demand para sa mga produkto depende sa mga presyo ng pagbebenta ay ibinibigay sa talahanayan:

Presyo ng pagbebenta 1 unit. mga produkto, m.u.

Average na presyo ng pagbebenta ng 1 unit. mga produkto, m.u.

Demand para sa mga produkto, libong mga yunit

Enterprise 1 Enterprise 2
10 10 10 1
10 6 8 2
10 2 6 3
6 10 8 2
6 6 6 3
6 2 4 4
2 10 6 3
2 6 4 4
2 2 2 5

Talahanayan - Demand para sa mga produkto sa rehiyon, libong mga yunit.

Ang mga halaga ng mga bahagi ng mga produkto ng enterprise 1 na binili ng populasyon ay nakasalalay sa ratio ng mga presyo para sa mga produkto ng enterprise 1 at ang enterprise. Bilang resulta ng pananaliksik sa marketing, ang pag-asa na ito ay itinatag at ang mga halaga ay kinakalkula:

Talahanayan - Ang bahagi ng mga produkto ng enterprise 1 na binili ng populasyon, depende sa ratio ng mga presyo para sa mga produkto

Ayon sa kondisyon ng problema, 2 negosyo lamang ang nagpapatakbo sa rehiyonal na merkado. Samakatuwid, ang bahagi ng mga produkto ng pangalawang negosyo na binili ng populasyon, depende sa ratio ng mga presyo para sa mga produkto, ay maaaring tukuyin bilang isang yunit na binawasan ang bahagi ng unang negosyo.

Ang mga diskarte ng mga negosyo sa problemang ito ay ang kanilang mga desisyon tungkol sa mga teknolohiya ng produksyon. Tinutukoy ng mga desisyong ito ang gastos at presyo ng pagbebenta ng isang yunit ng produksyon. Ang gawain ay dapat tukuyin:

  1. Mayroon bang sitwasyon ng balanse sa problemang ito sa pagpili ng mga teknolohiya ng produksyon ng parehong mga negosyo?
  2. Mayroon bang mga teknolohiya na malinaw na hindi pipiliin ng mga negosyo dahil sa kawalan?
  3. Ilang produkto ang ibebenta sa isang sitwasyong ekwilibriyo? Aling kumpanya ang magwawagi?

Ang solusyon sa problema

  1. Tukuyin natin pang-ekonomiyang kahulugan mga koepisyent ng kabayaran sa payoff matrix ng problema. Ang bawat negosyo ay naglalayong i-maximize ang kita mula sa produksyon ng mga produkto. Ngunit bilang karagdagan, sa kasong ito, ang mga negosyo ay nakikipaglaban para sa merkado para sa mga produkto sa rehiyon. Kasabay nito, ang pakinabang ng isang negosyo ay nangangahulugan ng pagkawala ng isa pa. Ang ganitong problema ay maaaring gawing zero-sum matrix game. Sa kasong ito, ang mga coefficient ng mga nadagdag ay ang pagkakaiba sa pagitan ng mga kita ng enterprise 1 at enterprise 2 mula sa produksyon ng mga produkto. Kung positibo ang pagkakaibang ito, panalo ang enterprise 1, at kung negatibo ito, panalo ang enterprise 2.
  2. Kalkulahin ang mga coefficient ng payoff matrix. Upang gawin ito, kinakailangan upang matukoy ang mga halaga ng kita ng enterprise 1 at enterprise 2 mula sa paggawa ng mga produkto.

Ang kita ng negosyo sa problemang ito ay nakasalalay sa:

  • mula sa presyo at halaga ng produksyon;
  • sa dami ng mga produktong binili ng populasyon ng rehiyon;
  • mula sa bahagi ng mga produktong binili ng populasyon mula sa negosyo.

Kaya, ang mga halaga ng pagkakaiba sa kita ng mga negosyo, na tumutugma sa mga coefficient ng payoff matrix, ay dapat matukoy ng formula:

D = p⋅(S⋅R1 - S⋅C1) - (1 - p)⋅(S⋅R2 - S⋅C2),

kung saan ang D ay ang halaga ng pagkakaiba sa tubo mula sa produksyon ng mga produkto ng enterprise 1 at enterprise

p ay ang bahagi ng mga produkto ng enterprise 1 na binili ng populasyon ng rehiyon;

Ang S ay ang bilang ng mga produktong binibili ng populasyon ng rehiyon;

Ang R1 at R2 ay ang mga presyo ng pagbebenta ng isang yunit ng produksyon ng mga negosyo 1 at

Ang C1 at C2 ay ang kabuuang halaga ng isang yunit ng produksyon na ginawa sa mga negosyo 1 at

Kalkulahin natin ang isa sa mga koepisyent ng payoff matrix.

Hayaan, halimbawa, ang enterprise 1 ay magpasya sa paggawa ng mga produkto alinsunod sa teknolohiya III, at enterprise 2 - alinsunod sa teknolohiya II. Tapos yung selling price ng unit. ang mga produkto para sa enterprise 1 ay magiging CU 2. sa halaga ng yunit. mga produkto CU 1.5 Para sa Enterprise 2, ang presyo ng pagbebenta ng isang unit. ang produksyon ay magiging CU 6. sa halagang CU 4.

Ang bilang ng mga produkto na bibilhin ng populasyon ng rehiyon sa average na presyo na 4 cu ay 4 na libong mga yunit. (Talahanayan 1). Ang bahagi ng mga produkto na bibilhin ng populasyon mula sa enterprise 1 ay magiging 0.85, at mula sa enterprise 2 - 0.15 (Talahanayan 1.3). Kalkulahin ang payoff matrix coefficient a 32 gamit ang formula:

isang 32 \u003d 0.85⋅ (4⋅2 - 4 × 1.5) - 0.15⋅ (4⋅6 - 4⋅4) \u003d 0.5 libong mga yunit.

kung saan ang i=3 ay ang numero ng teknolohiya ng unang enterprise, at ang j=2 ay ang numero ng teknolohiya ng pangalawang enterprise.

Katulad nito, kinakalkula namin ang lahat ng mga coefficient ng payoff matrix. Sa payoff matrix, ang mga diskarte A 1 - A 3 - ay kumakatawan sa mga desisyon sa mga teknolohiya ng produksyon ng enterprise 1, mga diskarte B 1 - B 3 - mga desisyon sa mga teknolohiya ng produksyon ng enterprise 2, mga ratio ng kabayaran - ang pagkakaiba sa mga kita sa pagitan ng enterprise 1 at enterprise

B1 B2 B3 Min j
A 1 0,17 0,62 0,24 0,17
A2 0,3 -1,5 -0,8 -1
A 3 0,9 0,5 0,4 0,4
Max i 3 0,62 0,4

Talahanayan - Payoff matrix sa larong "Pakikibaka ng dalawang negosyo".

Walang nangingibabaw o duplicate na mga diskarte sa matrix na ito. Nangangahulugan ito na para sa parehong mga negosyo ay walang malinaw na hindi kumikitang mga teknolohiya sa produksyon. Tukuyin natin ang pinakamababang elemento ng mga hilera ng matrix. Para sa enterprise 1, ang bawat isa sa mga elementong ito ay may halaga ng pinakamababang garantisadong kabayaran kapag pumipili ng naaangkop na diskarte. Ang pinakamababang elemento ng matrix ayon sa mga hilera ay may mga sumusunod na halaga: 0.17, -1.5, 0.4.

Tukuyin natin ang pinakamataas na elemento ng mga column ng matrix. Para sa enterprise 2, ang bawat isa sa mga elementong ito ay mayroon ding halaga ng pinakamababang garantisadong kabayaran kapag pumipili ng naaangkop na diskarte. Ang pinakamataas na elemento ng matrix ayon sa mga column ay may mga sumusunod na halaga: 3, 0.62, 0.4.

Ang mas mababang presyo ng laro sa matrix ay 0.4. Ang pinakamataas na presyo ng laro ay katumbas din ng 0.4. Kaya, ang mas mababa at mas mataas na presyo ng laro sa matrix ay pareho. Nangangahulugan ito na mayroong isang teknolohiya ng produksyon na pinakamainam para sa parehong mga negosyo sa ilalim ng mga kondisyon ng gawaing ito. Ang teknolohiyang ito ay III, na tumutugma sa mga istratehiya A 3 enterprise 1 at B 3 enterprises Ang mga estratehiya A 3 at B 3 ay purong pinakamainam na estratehiya sa problemang ito.

Ang halaga ng pagkakaiba sa pagitan ng mga kita ng enterprise 1 at enterprise 2 kapag pumipili ng net optimal na diskarte ay positibo. Nangangahulugan ito na ang enterprise 1 ang mananalo sa larong ito. Ang Enterprise 1 ay makakakuha ng CU 0.4 thousand. Kasabay nito, 5 libong mga yunit ang ibebenta sa merkado. mga produkto (ang mga benta ay katumbas ng demand para sa mga produkto, talahanayan 1). Ang parehong mga negosyo ay magtatakda ng presyo sa bawat yunit ng output sa CU 2. Sa kasong ito, para sa unang negosyo, ang buong halaga ng isang yunit ng produksyon ay magiging CU 1.5, at para sa pangalawa - CU 1. Makikinabang lamang ang Enterprise 1 dahil sa mataas na bahagi ng mga produkto na bibilhin ng populasyon mula dito.

Pamantayan ng Desisyon

Tinutukoy ng tagagawa ng desisyon ang pinaka kumikitang diskarte depende sa target na setting, na ipinapatupad niya sa proseso ng paglutas ng problema. Tinutukoy ng gumagawa ng desisyon ang resulta ng paglutas ng problema sa pamamagitan ng isa sa pamantayan ng desisyon. Upang makarating sa isang hindi malabo at, kung maaari, ang pinaka-kapaki-pakinabang na solusyon, ito ay kinakailangan upang ipakilala ang isang pagsusuri (target) function. Kasabay nito, ang bawat diskarte sa paggawa ng desisyon (A i) ay itinalaga ng ilang resulta W i, na nagpapakilala sa lahat ng kahihinatnan ng desisyong ito. Mula sa hanay ng mga resulta sa paggawa ng desisyon, pinipili ng DM ang elementong W, na ang pinakamahusay na paraan sumasalamin sa motibasyon ng kanyang pag-uugali.

Depende sa mga kondisyon panlabas na kapaligiran at ang antas ng pagiging informative ng gumagawa ng desisyon, ang sumusunod na pag-uuri ng mga gawain sa paggawa ng desisyon ay ginawa:

  • nanganganib;
  • sa mga kondisyon ng kawalan ng katiyakan;
  • sa mga kondisyon ng salungatan o oposisyon (aktibong kalaban).

Paggawa ng desisyon sa ilalim ng panganib.

1. Pamantayan ng inaasahang halaga.

Ang paggamit ng inaasahang pamantayan ng halaga ay dahil sa pagnanais na i-maximize ang inaasahang tubo (o mabawasan ang inaasahang gastos). Ang paggamit ng mga inaasahang halaga ay nagpapahiwatig ng posibilidad na malutas ang parehong problema nang maraming beses hanggang sa makuha ang sapat na tumpak na mga formula ng pagkalkula. Sa matematika, ganito ang hitsura: hayaan ang X - random na halaga may mathematical expectation na MX at variance DX. Kung ang x 1 , x 2 , ..., x n ay mga halaga ng isang random na variable (r.v.) X, kung gayon ang arithmetic mean ng kanilang (sample mean) na mga halaga x^=(x 1 +x 2 +.. Ang .+x n)/ n ay may pagkakaiba ng DX/n. Kaya, kapag n→∞ DX/n→∞ at X→MX.

Sa madaling salita, na may sapat na malaking sample size, ang pagkakaiba sa pagitan ng arithmetic mean at ang mathematical expectation ay nagiging zero (ang tinatawag na limit theorem of probability theory). Samakatuwid, ang paggamit ng inaasahang pamantayan ng halaga ay wasto lamang sa kaso kung kailan ang parehong solusyon ay kailangang ilapat nang sapat na maraming beses. Totoo rin ang kabaligtaran: ang oryentasyon sa pag-asa ay hahantong sa mga maling resulta para sa mga pagpapasya na kailangang gawin nang ilang beses.

Halimbawa 1. Kinakailangang gumawa ng desisyon tungkol sa kung kailan kinakailangan na magsagawa ng preventive maintenance ng PC upang mabawasan ang mga pagkalugi dahil sa isang malfunction. Kung masyadong madalas ang pag-aayos, ang mga gastos sa pagpapanatili ay magiging mataas na may kaunting pagkawala dahil sa hindi sinasadyang pagkasira.

Dahil imposibleng mahulaan nang maaga kung kailan magaganap ang isang malfunction, kinakailangan upang mahanap ang posibilidad na mabibigo ang PC sa tagal ng panahon t. Ito ang elemento ng panganib.

Sa matematika, ganito ang hitsura: ang isang PC ay isa-isang kinukumpuni kung ito ay huminto dahil sa isang pagkasira. Pagkatapos ng T time interval, ang preventive maintenance ng lahat ng n PC ay isinasagawa. Ito ay kinakailangan upang matukoy ang pinakamainam na halaga ng m, na nagpapaliit sa kabuuang halaga ng pag-aayos ng mga sirang PC at pagsasagawa ng preventive maintenance sa bawat isang agwat ng oras.

Hayaan ang p t ay ang posibilidad ng pagkabigo ng isang PC sa oras t, at n t ay isang random na variable, katumbas ng bilang lahat ng nabigong PC sa parehong sandali. Hayaan ang karagdagang C 1 - ang gastos ng pag-aayos ng isang sira PC at C 2 - ang gastos ng preventive maintenance ng isang makina.

Ang paggamit ng inaasahang pamantayan ng halaga sa kasong ito ay makatwiran kung ang mga PC ay pinapatakbo sa mahabang panahon. Sa kasong ito, ang mga inaasahang gastos para sa isang agwat ay magiging

OZ = (C 1 ∑M(n t)+C 1 n)/T,

kung saan ang M(n t) ay ang mathematical na inaasahan ng bilang ng mga nabigong PC sa oras t. Dahil ang n t ay may binomial distribution na may mga parameter (n, p t), kung gayon M(n t) = np t . Sa gayon

OZ \u003d n (C 1 ∑p t + C 2) / T.

Ang mga kinakailangang kondisyon ng pinakamainam na T * ay may anyo:

OZ (T * -1) ≥ OZ (T *),

OZ (T * +1) ≥ OZ (T *).

Samakatuwid, simula sa maliit na halaga ng T, kalkulahin ang OZ(

T) hanggang sa ang mga kinakailangang kondisyon ng pinakamainam ay nasiyahan.

Hayaan ang C 1 = 100; C 2 = 10; n = 50. Ang mga p t value ay:

T p t ∑р t OZ(T)
1 0.05 0 50(100⋅0+10)/1=500
2 0.07 0.05 375
3 0.10 0.12 366.7
4 0.13 02 400
5 0.18 0.35 450

T * →3, OZ(T *)→366.7

Samakatuwid, ang preventive maintenance ay dapat gawin sa pamamagitan ng T * =3 time interval.

Criterion "inaasahang halaga - pagkakaiba-iba".

Maaaring baguhin ang inaasahang pamantayan ng halaga upang mailapat ito sa mga sitwasyong bihirang mangyari.

Kung x - s. sa. na may variance DX, kung gayon ang arithmetic mean x^ ay may variance DX/n, kung saan ang n ay ang bilang ng mga termino sa x^. Samakatuwid, kung bumababa ang DX at tumataas ang posibilidad na ang x^ ay malapit sa MX. Samakatuwid, ipinapayong ipakilala ang isang pamantayan kung saan ang pag-maximize ng inaasahang halaga ng tubo ay pinagsama sa pagliit ng pagkakaiba-iba nito.

Halimbawa 2. Ilapat natin ang criterion na "inaasahang halaga - pagkakaiba-iba" halimbawa 1. Upang gawin ito, kailangan mong hanapin ang pagkakaiba-iba ng mga gastos para sa isang agwat ng oras, i.e. pagpapakalat

s T \u003d (C 1 ∑n t + C 2 n) / T

kasi n t , t = (1, T-1) ay r.v., at ang s T ay r.v din. S.v. n t ay may binomial distribution na may M(n t) = np t at D(n t) = np t (1–p t). Kaya naman,

D(s T) = D((C 1 ∑n t +C 2 n)/T) = (C 1 /T) 2 D(∑n t) =

= (C 1 /T) 2 ∑Dn t = (C 1 /T) 2 ∑np t (1-p t) = (C 1 /T) 2 (∑p t - ∑p t 2 ),

kung saan C 2 n = const.

Mula sa halimbawa 1 ito ay sumusunod na

M(s T) = M(s(T)).

Samakatuwid, ang nais na pamantayan ay ang pinakamababa sa expression

M(s(T)) + hanggang D(s T).

Magkomento. Ang pare-parehong "k" ay maaaring ituring bilang isang antas pag-iwas sa panganib, dahil Tinutukoy ng "k" ang "degree of possibility" ng dispersion D(s T) kaugnay ng inaasahan sa matematika. Halimbawa, kung ang isang negosyante ay partikular na sensitibo sa malalaking negatibong paglihis ng mga kita pababa mula sa M(s(T)), maaari niyang piliin ang "k" na mas malaki kaysa sa 1. Nagbibigay ito ng higit na timbang sa pagkakaiba at humahantong sa isang solusyon na binabawasan ang posibilidad ng malaking pagkalugi sa kita.

Para sa k=1 nakukuha natin ang problema

M(s(T))+D(s(T)) = n ( (C 1 /T+C 1 2 /T 2)∑p t - C 1 2 /T 2 ∑p t 2 + C 2 /T )

Gamit ang data mula sa halimbawa 1, maaari mong gawin ang sumusunod na talahanayan

T pt p t 2 ∑p t ∑p t 2 M(s(T))+D(s(T))
1 0,05 0,0025 0 0 500.00
2 0,07 0,0049 0,05 0,0025 6312,50
3 0,10 0,0100 0,12 0,0074 6622,22
4 0,13 0,0169 0,2 0,0174 6731,25
5 0,18 0,0324 0,35 0,0343 6764,00

Ipinapakita ng talahanayan na ang preventive maintenance ay dapat gawin sa bawat interval T * =1.

3. Paglilimita sa pamantayan

Ang limitasyong pamantayan ay hindi nagbibigay pinakamainam na solusyon pag-maximize, halimbawa, kita o pagliit ng mga gastos. Sa halip, umaangkop ito sa kahulugan katanggap-tanggap paraan ng pagkilos.

Halimbawa 3. Ipagpalagay na ang halaga ng demand x bawat yunit ng oras (intensity of demand) para sa ilang produkto ay ibinibigay ng tuluy-tuloy na distribution function f(x). Kung ang mga stock ay maliit sa paunang sandali, maaaring may kakulangan ng mga kalakal sa hinaharap. Kung hindi, sa pagtatapos ng panahong sinusuri, maaaring napakalaki ng mga stock ng mga hindi nabentang produkto. Sa parehong mga kaso, ang mga pagkalugi ay posible.

kasi napakahirap matukoy ang mga pagkalugi mula sa isang kakulangan, maaaring itakda ng gumagawa ng desisyon ang kinakailangang antas ng mga stock sa paraang ang halaga inaasahan depisit ay hindi lalampas sa A 1 mga yunit, at ang halaga inaasahan ang surplus ay hindi lalampas sa A 2 units. Sa madaling salita, hayaang ako ang nais na antas ng imbentaryo. Pagkatapos

inaasahang depisit = ∫(x-I)f(x)dx ≤ A 1 ,

inaasahang surplus = ∫(I-x)f(x)dx ≤ A 2 .

Sa pamamagitan ng arbitraryong pagpili ng A 1 at A 2, ang mga kundisyong ito ay maaaring magkasalungat. Sa kasong ito, ang isa sa mga hadlang ay dapat na maluwag upang matiyak ang pagiging matanggap.

Hayaan, halimbawa,

f(x) = 20/x 2 , 10≤x≤20,

f(x) = 0, x≤10 at x≥20.

∫(x-I)f(x)dx = ∫(x-I)(20/x 2)dx = 20(ln(20/I) + I/20 – 1)

∫(I-x)f(x)dx = ∫(I-x)(20/x 2)dx = 20(ln(10/I) + I/10 – 1)

Ang paggamit ng pamantayan sa antas ng paglilimita ay humahantong sa mga hindi pagkakapantay-pantay

ln(I) - I/20 ≥ ln(20) - A 1 /20 - 1 = 1.996 - A 1/20

ln(I) - I/10 ≥ ln(10) - A 2 /20 - 1 = 1.302 - A 2/20

Ang mga halaga ng limitasyon na A 1 at A 2 ay dapat mapili upang ang parehong mga hindi pagkakapantay-pantay ay humawak ng hindi bababa sa isang halaga ng I.

Halimbawa, kung A 1 = 2 at A 2 = 4, ang mga hindi pagkakapantay-pantay ay nagiging

ln(I) - I/20 ≥ 1.896

ln(I) - I/10 ≥ 1.102

Ang halaga ng I ay dapat nasa pagitan ng 10 at 20, dahil nasa loob ng mga limitasyong ito na humihiling ng mga pagbabago. Ipinapakita ng talahanayan na ang parehong mga kondisyon ay nasiyahan para sa I, mula sa pagitan (13.17)

ako 10 11 12 13 14 15 16 17 18 19 20
ln(I) - I/20 1,8 1,84 1,88 1,91 1,94 1,96 1,97 1,98 1,99 1,99 1,99
ln(I) - I/10 1,3 19 18 16 14 11 1,17 1,13 1,09 1,04 0,99

Ang alinman sa mga halagang ito ay nakakatugon sa mga kondisyon ng problema.

Paggawa ng desisyon sa ilalim ng kawalan ng katiyakan

Ipagpalagay natin na ang gumagawa ng desisyon ay hindi kinakaharap makatwiran kaaway.

Ang data na kailangan upang makagawa ng desisyon sa ilalim ng kawalan ng katiyakan ay karaniwang ibinibigay sa anyo ng isang matrix, ang mga hilera nito ay tumutugma sa mga posibleng aksyon, at ang mga column sa mga posibleng estado ng system.

Hayaan, halimbawa, kinakailangan na gumawa ng isang produkto mula sa ilang materyal, ang tibay nito ay hindi matukoy sa mga katanggap-tanggap na gastos. Ang mga load ay ipinapalagay na kilala. Kinakailangang magpasya kung anong mga sukat ang dapat magkaroon ng produkto mula sa materyal na ito.

Ang mga pagpipilian sa solusyon ay:

E 1 - ang pagpili ng mga sukat para sa mga kadahilanan ng maximum na tibay;

E m - ang pagpili ng mga sukat para sa mga kadahilanan ng pinakamababang tibay;

E ako ay mga intermediate na solusyon.

Ang mga kundisyon na dapat isaalang-alang ay:

F 1 - mga kondisyon na tinitiyak ang maximum na tibay;

F n - mga kondisyon na nagbibigay ng min tibay;

F i - mga intermediate na kondisyon.

Sa ilalim ng resulta ng desisyon e ij = e(E i ; F j) dito natin mauunawaan ang pagtatantya na naaayon sa opsyon E i at ang mga kondisyon F j at nailalarawan ang tubo, utilidad o pagiging maaasahan. Kadalasan ay tatawagin natin ang gayong resulta kapakinabangan ng desisyon.

Pagkatapos ay ang pamilya (matrix) ng mga solusyon ||e ij || mukhang:

F1 F2 ... F n
E 1 e 11 e 12 ... e 1n
E 2 e 21 e 22 ... e 2n
... ... ... ... ...
E m e m1 e m2 ... e mn

Upang makarating sa isang hindi malabo at, kung maaari, ang pinaka-kapaki-pakinabang na solusyon, ito ay kinakailangan upang ipakilala ang isang pagsusuri (target) function. Sa kasong ito, ang decision matrix ||e ij || nabawasan sa isang column. Ang bawat opsyon E i ay itinalaga, samakatuwid, ilang resulta e ir , na nagpapakilala, sa pangkalahatan, ang lahat ng mga kahihinatnan ng desisyong ito. Ang ganitong resulta ay higit pang ilalarawan ng parehong simbolo na e ir .

Klasikong pamantayan ng desisyon

1. Minimax na pamantayan.

Ang panuntunan para sa pagpili ng solusyon alinsunod sa minimax criterion (MM-criterion) ay maaaring bigyang-kahulugan bilang mga sumusunod:

ang decision matrix ay may palaman ng isa pang column ng pinakamaliit na resulta e ir ng bawat row. Ito ay kinakailangan upang piliin ang mga pagpipilian sa mga linya ng kung saan ay pinakamataas na halaga e ir ng column na ito.

Pinili sa gayon. ang mga opsyon ay ganap na nag-aalis ng panganib. Nangangahulugan ito na hindi maaaring harapin ng gumagawa ng desisyon ang isang mas masamang resulta kaysa sa kanyang tina-target. Ginagawang posible ng property na ito na isaalang-alang ang kriterya ng MM bilang isa sa mga pangunahing.

Ang paggamit ng MM-criterion ay makatwiran kung ang sitwasyon kung saan ginawa ang desisyon ay ang mga sumusunod:

  1. Walang nalalaman tungkol sa posibilidad ng paglitaw ng mga panlabas na estado F j;
  2. Kailangang umasa sa hitsura ng iba't ibang panlabas na estado F j ;
  3. Ang solusyon ay ipinatupad nang isang beses lamang;
  4. Ang anumang panganib ay dapat na hindi kasama.

2. Bayes-Laplace criterion.

Hayaan q i tukuyin ang posibilidad ng paglitaw ng panlabas na estado F j .

Ang kaukulang panuntunan sa pagpili ay maaaring bigyang-kahulugan bilang mga sumusunod:

ang decision matrix ay dinagdagan ng isa pang column na naglalaman ng mathematical expectation ng mga value ng bawat isa sa mga row. Pinili ang mga opsyong iyon, sa mga linya kung saan mayroong pinakamalaking halaga e ir ng column na ito.

Ipinapalagay na ang sitwasyon kung saan ginawa ang desisyon ay nailalarawan sa mga sumusunod na pangyayari:

  1. Ang mga posibilidad ng paglitaw ng estado F j ay kilala at hindi nakasalalay sa oras.
  2. Ang solusyon ay natanto (theoretically) walang hanggan maraming beses.
  3. Para sa isang maliit na bilang ng mga pagpapatupad ng solusyon, pinapayagan ang ilang panganib.

Kapag sapat na sa malaking bilang mga pagpapatupad, ang average na halaga ay unti-unting nagpapatatag. Samakatuwid, sa ganap na (walang katapusan) na pagpapatupad, ang anumang panganib ay halos hindi kasama.

yun. Ang Bayes-Laplace criterion (B-L-criterion) ay mas optimistiko kaysa sa minimax criterion, gayunpaman, ito ay nagpapahiwatig ng higit na kamalayan at medyo mahabang pagpapatupad.

3. Ang pamantayan ng Savage.

a ij:= max i (e ij) - e ij

e ir:= max i (a ij) = max j (max i (e ij) - e ij)

Ang halaga ng isang ij ay maaaring bigyang-kahulugan bilang ang pinakamataas na karagdagang pakinabang, na makakamit kung, sa estado F j, sa halip na variant E i, isa pang variant, pinakamainam para sa panlabas na estadong ito, ang pipiliin. Ang halaga ng isang ij ay maaari ding bigyang kahulugan bilang mga pagkalugi (mga parusa) na nagmumula sa estado F j kapag pinapalitan ang pinakamainam na variant para dito ng variant na E i . Sa huling kaso, ang e ir ay ang pinakamataas na posibleng (sa lahat ng panlabas na estado F j , j = (1,n)) pagkalugi sa kaso ng pagpili ng variant E i .

Ang panuntunan sa pagpili na tumutugma sa pamantayan ng Savage ay binibigyang-kahulugan na ngayon bilang sumusunod:

  1. Ang bawat elemento ng decision matrix ||e ij || ay ibinabawas mula sa pinakamalaking resulta max(e ij) ng kaukulang column.
  2. Ang mga pagkakaiba ng ij ay bumubuo ng isang matrix ng mga nalalabi ||e ij ||. Ang matrix na ito ay na-update na may pinakamalaking pagkakaiba sa column e ir . Piliin ang mga opsyong iyon sa mga hilera kung saan ang pinakamaliit na halaga para sa column na ito.

Ang mga kinakailangan para sa sitwasyon kung saan ginawa ang desisyon ay tumutugma sa kinakailangan para sa pamantayan ng MM.

4. Halimbawa at konklusyon.

Mula sa mga kinakailangan para sa isinasaalang-alang na pamantayan, nagiging malinaw na, dahil sa kanilang mahigpit na panimulang posisyon, ang mga ito ay naaangkop lamang para sa mga idealized na praktikal na solusyon. Sa kaso kung saan ang masyadong malakas na idealization ay posible, iba't ibang pamantayan ay maaaring ilapat nang sabay-sabay. Pagkatapos nito, sa ilang mga opsyon, pipiliin ng gumagawa ng desisyon ang pangwakas na desisyon sa pamamagitan ng volitional method. Ang diskarte na ito ay nagpapahintulot, una, upang mas mahusay na tumagos sa lahat ng mga panloob na koneksyon ng problema sa paggawa ng desisyon at, pangalawa, nagpapahina sa impluwensya ng subjective na kadahilanan.

Halimbawa. Sa panahon ng pagpapatakbo ng computer, kinakailangan na pana-panahong suspindihin ang pagproseso ng impormasyon at suriin ang computer para sa pagkakaroon ng mga virus dito. Ang pagsususpinde sa pagproseso ng impormasyon ay humahantong sa ilang mga gastos sa ekonomiya. Kung ang virus ay hindi natukoy sa oras, ang ilan sa impormasyon ay maaaring mawala, na hahantong sa mas malaking pagkalugi.

Ang mga pagpipilian sa solusyon ay:

E 1 - buong tseke;

E 2 - pinakamababang tseke;

E 3 - pagtanggi na suriin.

Ang computer ay maaaring nasa mga sumusunod na estado:

F 1 - wala ang virus;

F 2 - mayroong isang virus, ngunit wala itong oras upang masira ang impormasyon;

F 3 - may mga file na kailangang ibalik.

Ang mga resulta, kabilang ang mga gastos sa paghahanap para sa virus at pag-aalis nito, pati na rin ang mga gastos na nauugnay sa pagpapanumbalik ng impormasyon, ay ganito ang hitsura:

F1 F2 F3 MM-criterion pamantayan B-L
e ir = min j (e ij) max i (e ir) e ir = ∑e ij max i (e ir)
E 1 -20,0 -20 -25,0 -25,0 -25,0 -22,33
E 2 -14,0 -23,0 -31,0 -31,0 -22,67
E 3 0 -24.0 -40.0 -40.0 -21.33 -21.33

Ayon sa MM-criterion, isang buong pagsusuri ang dapat isagawa. Ang Bayes-Laplace criterion, sa pag-aakalang lahat ng estado ng makina ay pare-pareho ang posibilidad.

F1 F2 F3 Ang pamantayan ng Savage
e ir = min j (a ij) min j (e ir)
E 1 +20,0 0 0 +20,0
E 2 +14,0 +1,0 +6,0 +14,0 +14,0
E 3 0 +2,0 +15,0 +15,0

Ang halimbawa ay espesyal na pinili upang ang bawat pamantayan ay nag-aalok ng isang bagong solusyon. Ang kawalan ng katiyakan ng estado kung saan nakita ng tseke ang computer ay nagiging isang kalabuan kung aling pamantayan ang dapat sundin.

Dahil ang iba't ibang pamantayan ay nauugnay sa iba't ibang kondisyon, kung saan ang isang desisyon ay ginawa, ang pinakamahusay na paraan para sa isang paghahambing na pagtatasa ng mga rekomendasyon ng ilang mga pamantayan ay upang makakuha ng Karagdagang impormasyon tungkol sa sitwasyon mismo. Sa partikular, kung ang desisyon na ginawa ay tumutukoy sa daan-daang mga makina na may parehong mga parameter, pagkatapos ay inirerekomenda na ilapat ang Bayes-Laplace criterion. Kung ang bilang ng mga makina ay hindi malaki, mas mahusay na gamitin ang pamantayan ng minimax o Savage.

Hinangong pamantayan.

1. Hurwitz criterion.

Sinusubukang kunin ang pinaka balanseng posisyon, iminungkahi ni Hurwitz ang isang function ng pagsusuri na nasa pagitan ng punto ng view ng matinding optimismo at matinding pesimismo:

max i (e ir) = ( C⋅min j (e ij) + (1-C)⋅max j (e ij) ),

kung saan ang C ay ang weight factor.

Ang panuntunan sa pagpili ayon sa pamantayan ng Hurwitz ay nabuo tulad ng sumusunod:

decision matrix ||e ij || may padded na may column na naglalaman ng weighted average ng pinakamaliit at pinakamalaking resulta para sa bawat row. Tanging ang mga opsyon na iyon ang pinili, sa mga hilera kung saan mayroong pinakamalalaking elemento e e ir ng column na ito.

Sa C=1, ang Hurwitz criterion ay nagiging MM criterion. Sa C = 0, ito ay nagiging pamantayang "gambler".

max i (e ir) = max i (max j (e ij)),

mga. kinukuha namin ang punto ng view ng isang sugarol na tumataya na ang pinakamagandang pagkakataon ay "huhulog".

Sa mga teknikal na aplikasyon, mahirap piliin ang weight factor C, dahil mahirap makahanap ng quantitative na katangian para sa mga bahagi ng optimismo at pessimism na naroroon kapag gumagawa ng desisyon. Samakatuwid, madalas na C: \u003d 1/2.

Ang Hurwitz criterion ay inilapat kapag:

  1. walang nalalaman tungkol sa mga posibilidad ng paglitaw ng estado F j;
  2. na may hitsura ng estado F j ay dapat isaalang-alang;
  3. maliit na bilang lamang ng mga solusyon ang ipinatupad;
  4. pinapayagan ang ilang panganib.

2. Ang pamantayang Hodge–Lehmann.

Ang pamantayang ito ay sabay na umaasa sa MM-criterion at Bayes-Laplace na pamantayan. Gamit ang parameter n, ang antas ng kumpiyansa sa ginamit na mga pamamahagi ng posibilidad ay ipinahayag. Kung ang kumpiyansa ay mataas, kung gayon ang Bayes-Laplace criterion ay nangingibabaw, kung hindi, ang MM criterion, i.e. Naghahanap kami ng

max i (e ir) = max i (v⋅∑e ij ⋅q i + (1-v) min j (e ir)), 0 ≤ n ≤ 1.

Ang panuntunan sa pagpili na naaayon sa pamantayan ng Hodge-Lehman ay nabuo tulad ng sumusunod:

decision matrix ||e ij || ay kinukumpleto ng isang column na binubuo ng mga weighted average (na may weight v≡const) na mga inaasahan sa matematika at ang pinakamaliit na resulta ng bawat row (*). Ang mga solusyong iyon ay pinili sa mga hilera kung saan ang pinakamalaking halaga ng column na ito.

Sa v = 1, ang Hodge-Lehman criterion ay nagiging Bayes-Laplace criterion, at sa v = 0 ito ay nagiging minimax.

Ang pagpili ng v ay subjective dahil ang antas ng pagiging maaasahan ng anumang function ng pamamahagi ay isang madilim na bagay.

Upang mailapat ang pamantayan ng Hodge-Lehman, kanais-nais na ang sitwasyon kung saan ginawa ang desisyon ay nakakatugon sa mga sumusunod na katangian:

  1. ang mga posibilidad ng paglitaw ng estado F j ay hindi alam, ngunit ang ilang mga pagpapalagay tungkol sa pamamahagi ng posibilidad ay posible;
  2. ang tinanggap na solusyon ay theoretically admits infinitely maraming mga pagpapatupad;
  3. para sa maliliit na bilang ng pagpapatupad, pinapayagan ang ilang panganib.

3. Ang pamantayan ni Germeier.

Ang pamantayang ito ay nakatuon sa dami ng pagkalugi, i.e. sa mga negatibong halaga ng lahat e ij . Kung saan

max i (e ir) = max i (min j (e ij)q j) .

kasi sa mga gawaing pang-ekonomiya, pangunahin nilang nakikitungo sa mga presyo at gastos, ang kondisyon e e ij<0 обычно выполняется. В случае же, когда среди величин e ij встречаются и положительные значения, можно перейти к строго отрицательным значениям с помощью преобразования e ij -a при подходящем образом подобранном a>0. Sa kasong ito, ang pinakamainam na solusyon ay nakasalalay sa a.

Ang panuntunan sa pagpili ayon sa pamantayan ng Germeier ay nabuo tulad ng sumusunod:

decision matrix ||e ij || nilagyan ng isa pang column na naglalaman ng bawat row hindi bababa sa produkto ang resulta nito sa probabilidad ng kaukulang estado F j . Pinili ang mga opsyong iyon sa mga row kung saan matatagpuan ang pinakamalaking value e e ij ng column na ito.

Sa isang kahulugan, ang pamantayan ng Germeier ay nagsa-generalize ng pamantayan ng MM: sa kaso ng isang pare-parehong pamamahagi q j = 1/n, j=(1,n), sila ay nagiging magkapareho.

Ang mga kondisyon para sa pagiging angkop nito ay:

  1. na may hitsura ng ilang mga estado, hiwalay o sa kumbinasyon, ito ay kinakailangan upang magbilang;
  2. pinapayagan ang ilang panganib;
  3. ang solusyon ay maaaring ipatupad ng isa o higit pang beses.

Kung ang pagpapaandar ng pamamahagi ay hindi masyadong mapagkakatiwalaan, at ang mga numero ng pagsasakatuparan ay maliit, kung gayon, sa pagsunod sa pamantayang Germeier, ang isa ay nakakakuha, sa pangkalahatan, ng isang hindi makatwirang malaking panganib.

4. Pinagsamang Bayes-Laplace at minimax na pagsubok.

Ang pagnanais na makakuha ng pamantayan na mas mahusay na umangkop sa umiiral na sitwasyon kaysa sa lahat ng isinasaalang-alang sa ngayon ay humantong sa pagbuo ng tinatawag na composite criteria. Bilang halimbawa, isaalang-alang ang isang criterion na nakuha sa pamamagitan ng pagsasama-sama ng Bayes-Laplace at minimax criteria (BL(MM)-criterion).

Ang panuntunan sa pagpili para sa pamantayang ito ay binabalangkas tulad ng sumusunod:

decision matrix ||e ij || idinagdag ng tatlo pang column. Sa una sa kanila, ang mga inaasahan sa matematika ng bawat isa sa mga hilera ay nakasulat, sa pangalawa - ang pagkakaiba sa pagitan ng halaga ng sanggunian

e i 0 j 0 = max i (max j (e ij))

at ang pinakamaliit na halaga

ang kaukulang linya. Ang ikatlong column ay naglalaman ng mga pagkakaiba sa pagitan ng pinakamalaking halaga

bawat row at ang pinakamalaking value max j (e i 0 j) ng row na naglalaman ng value e i 0 j 0 . Pinili ang mga opsyong iyon, ang mga hilera kung saan (napapailalim sa mga sumusunod na ratio sa pagitan ng mga elemento ng pangalawa at pangatlong column) ang nagbibigay ng pinakamataas na inaasahan sa matematika. Ibig sabihin, ang kaukulang halaga

e i 0 j 0 - max j (e ij)

mula sa ikalawang hanay ay dapat na katumbas o katumbas ng ilang paunang natukoy na antas ng panganib E idagdag. Ang halaga sa ikatlong column ay dapat na mas malaki kaysa sa halaga sa pangalawang column.

Ang paggamit ng pamantayang ito ay dahil sa mga sumusunod na tampok ng sitwasyon kung saan ginawa ang desisyon:

  1. ang mga posibilidad ng paglitaw ng mga estadong F j ay hindi alam, ngunit mayroong ilang priori na impormasyon na pabor sa ilang partikular na pamamahagi;
  2. kinakailangang magbilang sa hitsura ng iba't ibang mga estado, kapwa nang paisa-isa at pinagsama;
  3. pinapayagan ang limitadong panganib;
  4. ang desisyon na ginawa ay ipinatupad ng isang beses o paulit-ulit.

Ang BL(MM) -criterion ay angkop na angkop para sa pagbuo ng mga praktikal na solusyon, pangunahin sa larangan ng teknolohiya, at maaaring ituring na lubos na maaasahan. Gayunpaman, ang ibinigay na mga hangganan ng panganib E ay nagdaragdag at, nang naaayon, ang mga pagtatantya ng panganib na E i ay hindi isinasaalang-alang ang alinman sa bilang ng aplikasyon ng solusyon, o iba pang katulad na impormasyon. Ang impluwensya ng subjective na kadahilanan, kahit na humina, ay hindi ganap na ibinukod.

max j (e ij)-max j (e i 0 j)≥E i

mahalaga sa mga kasong iyon kung saan ang solusyon ay ipinatupad lamang ng isang beses o isang maliit na bilang ng mga beses. Sa ilalim ng mga kundisyong ito, hindi sapat na tumuon sa panganib na nauugnay lamang sa hindi kanais-nais na mga panlabas na kondisyon at mga average na halaga. Dahil dito, gayunpaman, maaari kang magdusa ng ilang pagkalugi sa matagumpay panlabas na estado. Sa malalaking numero mga pagpapatupad, ang kundisyong ito ay tumigil sa pagiging napakahalaga. Pinapayagan pa nito ang mga makatwirang alternatibo. Gayunpaman, walang malinaw na quantitative indications kung saan ang kundisyong ito ay dapat tanggalin.

5. Ang pamantayan ng mga gawa.

max i (e ir):= max i (∏e ij)

Ang panuntunan sa pagpili sa kasong ito ay binabalangkas tulad ng sumusunod:

Desisyon matrix ||e ij || ay nilagyan ng bagong column na naglalaman ng mga produkto ng lahat ng resulta ng bawat row. Ang mga pagpipiliang iyon ay pinili, sa mga linya kung saan mayroong pinakamalaking mga halaga ng hanay na ito.

Ang paglalapat ng pamantayang ito ay dahil sa mga sumusunod na pangyayari:

  1. ang mga posibilidad ng paglitaw ng estado F j ay hindi alam;
  2. na may hitsura ng bawat isa sa mga estado F j hiwalay ay dapat isaalang-alang;
  3. ang criterion ay naaangkop din para sa isang maliit na bilang ng mga pagpapatupad ng solusyon;
  4. pinapayagan ang ilang panganib.

Ang pamantayan ng produkto ay pangunahing iniangkop para sa mga kaso kung saan ang lahat ng e ij ay positibo. Kung nilabag ang kondisyon ng pagiging positibo, dapat gawin ang ilang shift e ij +a na may pare-parehong a>|min ij (e ij)|. Ang resulta ay natural na nakasalalay sa a. Sa pagsasagawa, madalas

a:= |min ij (e ij)|+1.

Kung walang pare-parehong makikilala bilang makabuluhan, kung gayon ang criterion ng mga produkto ay hindi naaangkop.

Halimbawa.

Isaalang-alang ang parehong halimbawa tulad ng dati (tingnan sa itaas).

Ang pagtatayo ng pinakamainam na solusyon para sa matrix ng mga desisyon tungkol sa mga tseke ayon sa pamantayan ng Hurwitz ay may form (sa С=0, sa 10 3):

||e ij || С⋅min j (e ij) (1-С)⋅max j (e ij) e ir max i (e ir)
-20,0 -22,0 -25,0 -12,5 -10.0 -22,5
-14,0 -23.0 -31.0 -15,5 -7.0 -22,5
0 -24.0 -40.0 -20.0 0 -20.0 -20.0

Sa halimbawang ito, ang solusyon ay may turning point na may kinalaman sa weight factor C: hanggang C = 0.57, E 3 ang napili bilang pinakamainam, at sa malalaking halaga, E 1 .

Application ng Hodge-Lehman test (q=0.33, v=0, at 103):

∑e ij ⋅q j minj(eij) v⋅∑e ij ⋅q j (1-v)⋅∑e ij ⋅q j e ir max i (e ir)
-22,33 -25,0 -11,17 -12,5 -23,67 -23,67
-22,67 -31,0 -11,34 -15,5 -26,84
-21,33 -40,0 -10,67 -20,0 -30,76

Inirerekomenda ng Hodge-Lehman test ang opsyon E 1 (buong check) - tulad ng MM test. Ang pagbabago ng inirerekomendang variant ay nangyayari lamang sa v=0.94. Samakatuwid, ang pare-parehong pamamahagi ng mga estado ng makina na isinasaalang-alang ay dapat kilalanin na may napakataas na posibilidad upang ito ay mapili ng isang mas malaking inaasahan sa matematika. Ang bilang ng mga pagpapatupad ng solusyon ay palaging nananatiling arbitrary.

Ang Germeier criterion sa q j = 0.33 ay nagbibigay ng sumusunod na resulta (sa 10 3):

||e ij || ||e ij q j || e ir = min j (e ij q j) max i (e ir)
-20,0 -22,0 -25,0 -6,67 -7,33 -8,33 -8,33 -8,33
-14,0 -23,0 -31,.0 -4,67 -7,67 -10,33 -10,33
0 -24,0 -40,0 0 -8,0 -13,33 -13,33

Ang Opsyon E 1 ay pinili bilang pinakamainam. Ang paghahambing ng mga variant na gumagamit ng halaga ng e ir ay nagpapakita na ang paraan ng paggana ng pagsubok sa Germeier ay mas nababaluktot kaysa sa pagsusulit sa MM.

Sa talahanayan sa ibaba, ang solusyon ay pinili alinsunod sa BL(MM)-criterion na may q 1 =q 2 =q 3 =1/2 (data sa 10 3).

||e ij || ∑e ij q j e i 0 j 0 - min j (e ij) max j (e ij) max j (e ij) - max j (e i 0 j)
-20,0 -22,0 -25,0 -23,33 0 -20,0 0
-14,0 -23,0 -31,0 -22,67 +6,0 -14,0 +6,0
0 -24,0 -40,0 -21,33 +15,0 0 +20,0

Ang Opsyon E 3 (pagtanggi na suriin) ay tinatanggap lamang ng pamantayang ito kapag ang panganib ay lumalapit sa E posible = 15⋅10 3 . Kung hindi, ang E 1 ay pinakamainam. Sa maraming problemang teknikal at pang-ekonomiya, ang matitiis na panganib ay mas mababa, kadalasan ay maliit na porsyento lamang ng Kabuuang gastos. AT katulad na mga kaso ay maaaring maging lalong mahalaga kung ang hindi tumpak na halaga ng pamamahagi ng posibilidad ay hindi masyadong makakaapekto. Kung sa parehong oras ito ay naging imposible upang maitaguyod ang matitiis na panganib E karagdagang nang maaga, anuman ang ginawang desisyon, kung gayon ang pagkalkula ng inaasahang panganib E posible ay makakatulong. Pagkatapos ay magiging posible na isaalang-alang kung ang naturang panganib ay makatwiran. Ang ganitong pananaliksik ay kadalasang binibigyan ng mas madali.

Ang mga resulta ng paglalapat ng criterion ng produkto para sa a = 41⋅10 3 at a = 200⋅10 3 ay:

a ||eij + a|| e ir = ∏ j e ij max i e ir
41 +21 +19 +16 6384 6384
+27 +18 +10 4860
+41 +17 +1 697
200 +180 +178 +175 5607
+186 +177 +169 5563
+200 +176 +160 5632 5632

Ang kundisyon e ij > 0 ay hindi magagawa para sa matrix na ito. Samakatuwid, sa mga elemento ng matrix ay idinagdag (ayon sa panlabas na arbitrariness) una a = 41⋅10 3 , at pagkatapos ay a = 200⋅10 3 .

Para sa а = 41⋅10 3 variant Е 1 ay pinakamainam, at para sa а = 200⋅10 3 — variant Е 3 , upang ang dependence ng pinakamainam na variant sa а ay kitang-kita.

  • Pinaghalong diskarte ng manlalaro. Hanapin ang pinaghalong diskarte ng mga manlalaro.
  • Pagmomodelo ng Circuit sa Game Theory. Ang negosyo ay may pagkakataon na nakapag-iisa na planuhin ang dami ng output ng mga pana-panahong produkto P 1, P 2, P 3.
  • Paglutas ng isang matrix na laro gamit ang isang graphical na pamamaraan

    Paglutas ng Matrix Game Gamit ang Linear Programming Methods

    1. Larong matrix. Gamit ang simplex method. Nakita namin ang garantisadong kabayaran na tinutukoy ng mas mababang presyo ng laro a = max(a i) = 2, na nagpapahiwatig ng pinakamataas na purong diskarte A 1 .
    2. Isang halimbawa ng paglutas ng isang matrix na laro sa pamamagitan ng linear programming. Lutasin ang larong matrix gamit ang linear programming.

    Bigyan graphic na representasyon, bawasan sa normal na anyo at hanapin ang eksaktong solusyon ng positional na laro na may sumusunod na function ng payoff:
    Ang Manlalaro A ay gumagawa ng unang hakbang: pumili siya ng isang numerong x mula sa isang set ng dalawang numero.
    Ang Player B ay gumagawa ng 2nd move: hindi alam ang tungkol sa pagpili ng player A sa 1st move, pipiliin niya ang numero y mula sa set ng dalawang numero.
    Ang Manlalaro A ay gumagawa ng ika-3 galaw: pipili siya ng isang numerong z mula sa isang hanay ng dalawang numero, alam ang mga halaga ng y na pinili ng manlalarong B sa ika-2 galaw, ngunit hindi naaalala ang kanyang sariling pagpili ng x sa unang paglipat.

    Mga larong may kalikasan

    1. istatistikal na laro
      Ang isang negosyong pang-agrikultura ay maaaring magbenta ng ilang mga produkto:
      A1) kaagad pagkatapos ng paglilinis;
      A2) sa mga buwan ng taglamig;
      A3) sa mga buwan ng tagsibol.
      Ang kita ay nakasalalay sa presyo ng pagbebenta sa isang takdang panahon, mga gastos sa imbakan at posibleng pagkalugi. Ang halaga ng kita na kinakalkula para sa iba't ibang estado-mga ratio ng kita at gastos (S1, S2 at S3), sa buong panahon ng pagpapatupad, ay ipinakita sa anyo ng isang matrix (milyong rubles)
    2. Ang kumpanya ay gumagawa ng mga damit at nababagay, ang pagbebenta nito ay depende sa estado ng panahon. Ang gastos ng kumpanya sa Abril-Mayo bawat yunit ng output ay ...
    3. Solusyon sa problema tungkol sa stocks ng raw materials. Para sa isang tiyak na tagal ng panahon sa negosyo, ang pagkonsumo ng mga hilaw na materyales, depende sa kalidad nito, ay 1, 2, 3, at 4.
    4. Mga diskarte sa matinding pessimism, extreme optimism, at optimism-pessimism

    Mga larong Bimatrix

    Decision tree sa teorya ng laro (halimbawa ng paglutas ng problema).

    tingnan din ang isang koleksyon ng mga solusyon sa teorya ng laro (solusyon ng mga larong matrix), karaniwang mga problema sa EMM (linear programming, teorya ng laro).

    Mayroong tatlong kumpanya ng TV na tumatakbo sa lungsod: ABC, CBS at NBC. Maaaring simulan ng mga kumpanyang ito ang kanilang programa sa balita sa gabi sa 6:30 o 7:00. Mas gusto ng 60% ng mga manonood na manood ng balita sa gabi sa 6.30, at 40% - sa 7.00. Ang pinakasikat na programa ng balita sa gabi ng kumpanya ABC, ang balitang inihanda ng kumpanya ay ang hindi gaanong sikat NBC. Ang bahagi ng mga manonood ng mga programa ng balita sa gabi ay ipinakita sa talahanayan (NBC, СBS, АВС)

    ABC: 6.30

    NAraw

    SWS

    ABC: 7.00

    NBSa

    SWS

    Hanapin ang pinakamahusay na mga diskarte para sa mga kumpanya sa pamamagitan ng timing ng mga programa ng balita

    Pahiwatig ng Solusyon: Ang laro ay may nangingibabaw na diskarte

    Mula sa sikat na American blog na Cracked.

    Ang teorya ng laro ay nababahala sa pag-aaral ng mga paraan upang gawin ang pinakamahusay na hakbang at, bilang isang resulta, makakuha ng mas maraming pera hangga't maaari. mas malaking piraso nanalong pie sa pamamagitan ng pagpuputol ng ilan sa mga ito mula sa ibang mga manlalaro. Ito ay nagtuturo sa iyo na pag-aralan ang maraming mga kadahilanan at gumuhit ng lohikal na timbang na mga konklusyon. Sa tingin ko dapat itong pag-aralan pagkatapos ng mga numero at bago ang alpabeto. Dahil lang sa napakaraming tao ang gumagawa ng mahahalagang desisyon batay sa intuwisyon, mga lihim na propesiya, pagkakahanay ng mga bituin at iba pa. Maingat kong pinag-aralan ang teorya ng laro, at ngayon gusto kong sabihin sa iyo ang tungkol sa mga pangunahing kaalaman nito. Marahil ito ay magdaragdag ng sentido komun sa iyong buhay.

    1. Dilemma ng bilanggo

    Inaresto sina Berto at Robert dahil sa pagnanakaw sa bangko matapos mabigong gumamit ng ninakaw na sasakyan para makatakas. Hindi mapapatunayan ng pulisya na sila ang nagnakaw sa bangko, ngunit nahuli silang nakasakay sa isang ninakaw na kotse. Dinala sila sa iba't ibang silid at bawat isa ay inalok ng deal: ibigay ang isang kasabwat at ipadala siya sa bilangguan ng 10 taon, at palayain ang sarili. Ngunit kung pareho silang magkakanulo sa isa't isa, ang bawat isa ay tatanggap ng 7 taon. Kung walang magsasabi ng kahit ano, pagkatapos ay pareho silang uupo sa loob ng 2 taon para lamang sa pagnanakaw ng kotse.

    Lumalabas na kung tahimik si Berto, ngunit pinagtaksilan siya ni Robert, nakulong si Berto ng 10 taon, at nakalaya si Robert.

    Ang bawat bilanggo ay isang manlalaro, at ang pakinabang ng bawat isa ay maaaring ilarawan bilang isang "pormula" (kung ano ang kanilang parehong nakukuha, kung ano ang iba pa). Halimbawa, kung tatamaan kita, magiging ganito ang winning scheme ko (I get a rough win, you are in a lot of pain). Dahil ang bawat bilanggo ay may dalawang pagpipilian, maaari naming ipakita ang mga resulta sa isang talahanayan.

    Praktikal na Aplikasyon: Spotting Sociopaths

    Dito makikita natin ang pangunahing aplikasyon ng teorya ng laro: pagkilala sa mga sociopath na iniisip lamang ang tungkol sa kanilang sarili. Ang tunay na teorya ng laro ay isang makapangyarihang tool sa pagsusuri, at ang amateurism ay kadalasang nagsisilbing pulang bandila, na ang ulo ay nagtataksil sa isang taong walang dangal. Iniisip ng mga intuitive na tao na mas mabuting maging pangit dahil magreresulta ito sa mas maikling sentensiya ng pagkakulong anuman ang gawin ng ibang manlalaro. Sa teknikal, ito ay tama, ngunit kung ikaw ay isang taong maikli ang paningin na naglalagay ng mga numero nang mas mataas buhay ng tao. Ito ang dahilan kung bakit ang teorya ng laro ay napakapopular sa pananalapi.

    Ang totoong problema sa Prisoner's Dilemma ay hindi nito pinapansin ang data. Halimbawa, hindi nito isinasaalang-alang ang posibilidad na makipagkita ka sa mga kaibigan, kamag-anak, o kahit na mga pinagkakautangan ng taong inilagay mo sa bilangguan sa loob ng 10 taon.

    Higit sa lahat, lahat ng sangkot sa Prisoner's Dilemma ay kumikilos na parang hindi pa nila ito narinig.

    At ang pinakamagandang hakbang ay ang manatiling tahimik, at makalipas ang dalawang taon, kasama ang mabuting kaibigan gumamit ng pera ng bayan.

    2. Dominant na diskarte

    Ito ay isang sitwasyon kung saan nagbibigay ang iyong mga aksyon pinakamalaking panalo, anuman ang kilos ng kalaban. Anuman ang mangyari, ginawa mo ang lahat ng tama. Iyon ang dahilan kung bakit naniniwala ang maraming tao sa Prisoner's Dilemma na ang pagkakanulo ay humahantong sa "pinakamahusay" na kahihinatnan anuman ang gawin ng ibang tao, at ang kamangmangan ng realidad na likas sa pamamaraang ito ay ginagawang napakasimple ng lahat.

    Karamihan sa mga larong nilalaro namin ay walang mahigpit na nangingibabaw na mga diskarte dahil ang mga ito ay kakila-kilabot kung hindi. Isipin na palagi mong gagawin ang parehong bagay. Walang dominanteng diskarte sa larong rock-paper-gunting. Ngunit kung nakikipaglaro ka sa isang taong nakasuot ng guwantes sa oven at maaari lamang magpakita ng bato o papel, magkakaroon ka ng nangingibabaw na diskarte: papel. Babalutan ng papel mo ang kanyang bato o magreresulta sa pagkakatali at hindi ka matatalo dahil hindi makapagpakita ng gunting ang iyong kalaban. Ngayon na mayroon kang isang nangingibabaw na diskarte, kakailanganin ng isang hangal na subukan ang anumang bagay.

    3. Labanan ng mga kasarian

    Mas kawili-wili ang mga laro kapag wala silang mahigpit na nangingibabaw na diskarte. Halimbawa, ang labanan ng mga kasarian. Nagde-date sina Anjali at Borislav ngunit hindi makapagpasya sa pagitan ng ballet at boxing. Gustung-gusto ni Anjali ang boksing dahil gusto niyang makita ang pagdaloy ng dugo sa tuwa ng sumisigaw na pulutong ng mga manonood na sa tingin nila ay sibilisado lamang dahil binayaran nila ang sira ng ulo ng isang tao.

    Nais ni Borislav na manood ng ballet dahil naiintindihan niya na ang mga ballerina ay dumaan sa maraming pinsala at ang pinakamahirap na pagsasanay, alam na ang isang pinsala ay maaaring wakasan ang lahat. Mga mananayaw ng ballet - pinakamahusay na mga atleta nasa lupa. Maaaring sipain ka ng isang ballerina sa ulo, ngunit hinding-hindi niya ito gagawin, dahil ang kanyang binti ay mas mahalaga kaysa sa iyong mukha.

    Ang bawat isa sa kanila ay gustong pumunta sa kanilang paboritong aktibidad, ngunit hindi nila gustong mag-enjoy dito nang mag-isa, kaya narito ang kanilang winning scheme: ang pinakamataas na halaga ay gawin kung ano ang kanilang tinatamasa, pinakamaliit na halaga- para lamang makasama ang ibang tao, at zero - upang mapag-isa.

    Ang ilang mga tao ay nagmumungkahi ng matigas ang ulo na pagbabalanse sa bingit ng digmaan: kung gagawin mo ang gusto mo, anuman ang mangyari, ang ibang tao ay dapat sumunod sa iyong pinili o mawala ang lahat. Gaya ng sinabi ko na, Ang pinasimpleng teorya ng laro ay mahusay sa pagtukoy ng mga tanga.

    Praktikal na Paglalapat: Iwasan ang Matalim na Sulok

    Siyempre, ang diskarte na ito ay mayroon ding mga makabuluhang disbentaha. Una sa lahat, kung tinatrato mo ang iyong mga ka-date na parang "labanan ng mga kasarian", hindi ito gagana. Maghiwalay kayo para matagpuan ng bawat isa sa inyo ang taong gusto niya. At ang pangalawang problema ay na sa sitwasyong ito, ang mga kalahok ay hindi sigurado sa kanilang sarili na hindi nila ito magagawa.

    Ang isang tunay na panalong diskarte para sa lahat ay gawin ang gusto nila, at pagkatapos, o sa susunod na araw, kapag sila ay libre, pumunta nang magkasama sa isang cafe. O kahalili sa pagitan ng boxing at ballet hanggang sa mabago ang mundo ng entertainment at maimbento ang boxing ballet.

    4. Nash ekwilibriyo

    Ang Nash equilibrium ay isang hanay ng mga galaw kung saan walang gustong gumawa ng ibang bagay pagkatapos ng katotohanan. At kung magagawa natin ito, papalitan ng teorya ng laro ang lahat ng pilosopikal, relihiyon, at pinansiyal na sistema sa planeta, dahil "ang pagnanais na hindi masunog" ay naging isang mas malakas na puwersa sa pagmamaneho para sa sangkatauhan kaysa sa apoy.

    Hatiin natin ang $100 nang mabilis. Ikaw at ako ang magpapasya kung ilan sa daang hinihingi natin at sabay na iaanunsyo ang mga halaga. Kung ang ating kabuuan ay mas mababa sa isang daan, lahat ay nakukuha ang kanilang nais. Kung ang kabuuan higit sa isang daan, ang humiling ng pinakamababang halaga ay nakakakuha ng nais na halaga, at higit pa taong sakim kinukuha ang natitira. Kung hihingi kami ng parehong halaga, bawat isa ay makakakuha ng $50. Magkano ang itatanong mo? Paano mo hahatiin ang pera? Mayroon lamang isang panalong galaw.

    Ang $51 na kinakailangan ay magbibigay sa iyo ng pinakamataas na halaga anuman ang pipiliin ng iyong kalaban. Kung humingi siya ng higit pa, makakatanggap ka ng $51. Kung humingi siya ng $50 o $51, makakakuha ka ng $50. At kung hihingi siya ng mas mababa sa $50, makakakuha ka ng $51. Sa anumang kaso, walang ibang opsyon na magdadala sa iyo mas maraming pera kaysa sa isang ito. Ang Nash equilibrium ay isang sitwasyon kung saan pareho tayong pumili ng $51.

    Praktikal na Paglalapat: Mag-isip muna

    Ito ang buong punto ng teorya ng laro. Hindi mo kailangang manalo, lalo pa saktan ang ibang mga manlalaro, ngunit kailangan mong gawin ang pinakamahusay na hakbang para sa iyong sarili, anuman ang inilaan ng iba para sa iyo. At mas mabuti kung ang hakbang na ito ay kapaki-pakinabang para sa iba pang mga manlalaro. Ito ay isang uri ng matematika na maaaring magbago ng lipunan.

    Ang isang kawili-wiling variant ng ideyang ito ay ang pag-inom, na maaaring tawaging Nash Equilibrium na may pag-asa sa oras. Kapag nakainom ka ng sapat, wala kang pakialam sa kilos ng ibang tao, kahit na ano pa ang gawin nila, pero kinabukasan, talagang nagsisisi ka na hindi mo ginawa ang iba.

    5. Ang larong sikmura

    Ang Manlalaro 1 at Manlalaro 2 ay lumahok sa paghagis. Ang bawat manlalaro ay sabay-sabay na pumipili ng mga ulo o buntot. Kung tama ang hula nila, makukuha ng Manlalaro 1 ang sentimos ng Manlalaro 2. Kung hindi, ang Manlalaro 2 ay makakakuha ng barya ng Manlalaro 1.

    Simple lang ang winning matrix...

    …pinakamainam na diskarte: ganap na maglaro nang random. Ito ay mas mahirap kaysa sa iyong iniisip, dahil ang pagpili ay dapat na ganap na random. Kung may kagustuhan ka sa ulo o buntot, magagamit ito ng kalaban para kunin ang iyong pera.

    Syempre, ang problema talaga dito ay mas maganda kung maghagis na lang sila ng tig-iisang sentimo. Bilang resulta, ang kanilang mga kita ay magiging pareho, at ang nagresultang trauma ay maaaring makatulong sa mga kapus-palad na mga taong ito na makaramdam ng isang bagay maliban sa kakila-kilabot na pagkabagot. Pagkatapos ng lahat, ito pinakamasamang laro kailanman umiiral. At ito ang perpektong modelo para sa isang penalty shootout.

    Praktikal na Aplikasyon: Parusa

    Sa football, hockey at marami pang ibang laro, ang dagdag na oras ay isang penalty shootout. At sila ay magiging mas kawili-wili kung sila ay batay sa kung gaano karaming beses ang mga manlalaro buong anyo maaaring gumawa ng isang "gulong" dahil iyon ay maaaring maging isang indikasyon ng kanilang pisikal na kakayahan at magiging masaya na panoorin. Ang mga goalkeeper ay hindi malinaw na matukoy ang paggalaw ng bola o pak sa pinakadulo simula ng kanilang paggalaw, dahil, sa kasamaang-palad, ang mga robot ay hindi pa rin nakikilahok sa ating sports. Ang goalkeeper ay dapat pumili ng kaliwa o kanang direksyon at umaasa na ang kanyang pagpili ay magkakasabay sa pagpili ng kalaban na sumipa sa layunin. Ito ay may pagkakatulad sa laro ng barya.

    Tandaan, gayunpaman, na ito ay hindi isang perpektong halimbawa ng pagkakahawig ng mga ulo at buntot, dahil kahit na may tamang direksyon, ang goalkeeper ay maaaring hindi mahuli ang bola, at ang umaatake ay maaaring makaligtaan ang layunin.

    Kaya ano ang aming konklusyon ayon sa teorya ng laro? Ang mga laro ng bola ay dapat magtapos sa paraang "multi-ball", kung saan ang dagdag na bola/pak ay ibinibigay sa mga manlalaro nang isa-isa bawat minuto, hanggang sa magkabilang panig ay magkaroon ng isang tiyak na resulta na nagpapahiwatig ng tunay na kakayahan ng mga manlalaro, at hindi isang pasikat na pagkakataon.

    Pagkatapos ng lahat, ang teorya ng laro ay dapat gamitin upang gawing mas matalino ang laro. At iyon ay nangangahulugan na mas mahusay.

    Daria Zolotykh 09.02.2015

    Nagustuhan ang post?
    Support Factrum, i-click ang: