Ano ang pinakamainam na mekanismo para sa paghahanap ng solusyon sa ekwilibriyo. Mekanismo ng Equilibrium sa Market

Ang mga pinakamainam na estratehiya sa teorya ng mga salungatan ay ang mga estratehiyang naghahatid sa mga manlalaro sa matatag na equilibria, i.e. ilang mga sitwasyon na nagbibigay-kasiyahan sa lahat ng mga manlalaro.

Ang pinakamainam ng isang solusyon sa teorya ng laro ay batay sa konsepto sitwasyon ng ekwilibriyo:

1) hindi kumikita ang sinuman sa mga manlalaro na lumihis mula sa sitwasyon ng ekwilibriyo kung ang lahat ng iba ay mananatili dito,

2) ang kahulugan ng ekwilibriyo - na may paulit-ulit na pag-uulit ng laro, ang mga manlalaro ay makakarating sa isang sitwasyon ng ekwilibriyo, na magsisimula ng laro sa anumang madiskarteng sitwasyon.

Sa bawat pakikipag-ugnayan, maaaring umiral ang mga sumusunod na uri ng equilibria:

1. punto ng balanse sa maingat na mga estratehiya . Tinutukoy ng mga diskarte na nagbibigay sa mga manlalaro ng garantisadong resulta;

2. punto ng balanse sa mga dominanteng estratehiya .

Dominant na diskarte ay isang plano ng aksyon na nagbibigay sa kalahok ng pinakamataas na pakinabang, anuman ang mga aksyon ng ibang kalahok. Samakatuwid, ang ekwilibriyo ng mga dominanteng estratehiya ay ang intersection ng mga dominanteng estratehiya ng parehong kalahok sa laro.

Kung ang pinakamainam na diskarte ng mga manlalaro ay nangingibabaw sa lahat ng iba pa nilang mga diskarte, kung gayon ang laro ay may equilibrium sa mga nangingibabaw na estratehiya. Sa dilemma game ng bilanggo, ang Nash equilibrium set ng mga diskarte ay magiging ("aminin - aminin"). Bukod dito, mahalagang tandaan na para sa parehong manlalaro A at manlalaro B "kilalanin" ay ang nangingibabaw na diskarte, habang ang "hindi kinikilala" ay dominado;

3. punto ng balanse Nash . Nash ekwilibriyo ay isang uri ng desisyon ng isang laro ng dalawa o higit pang mga manlalaro, kung saan walang kalahok ang maaaring tumaas ang kabayaran sa pamamagitan ng pagbabago ng kanyang desisyon nang unilaterally, kapag hindi binago ng ibang mga kalahok ang kanilang desisyon.

Sabihin natin ang laro n mga mukha sa normal na anyo, kung saan ang hanay ng mga purong estratehiya at ang hanay ng mga kabayaran.

Kapag ang bawat manlalaro ay pumili ng isang diskarte sa profile ng mga diskarte, ang manlalaro ay makakatanggap ng isang kabayaran. Bukod dito, ang kabayaran ay nakasalalay sa buong profile ng mga diskarte: hindi lamang sa diskarte na pinili ng manlalaro mismo, kundi pati na rin sa mga diskarte ng ibang tao. Ang profile ng diskarte ay isang Nash equilibrium kung ang pagbabago sa diskarte nito ay hindi kapaki-pakinabang sa sinumang manlalaro, iyon ay, sa sinumang

Ang isang laro ay maaaring magkaroon ng Nash equilibrium sa parehong dalisay at halo-halong diskarte.

Pinatunayan iyon ni Nash kung papayagan pinaghalong estratehiya, pagkatapos sa bawat laro n ang mga manlalaro ay magkakaroon ng kahit isang Nash equilibrium.

Sa isang sitwasyon ng Nash equilibrium, ang diskarte ng bawat manlalaro ay nagbibigay sa kanya ng pinakamahusay na tugon sa mga diskarte ng iba pang mga manlalaro;

4. Balanse Stackelberg. Modelo ng Stackelberg– game-theoretic na modelo ng isang oligopolistikong merkado sa pagkakaroon ng kawalaan ng simetrya ng impormasyon. Sa modelong ito, ang pag-uugali ng mga kumpanya ay inilalarawan ng isang dynamic na laro na may kumpletong perpektong impormasyon, kung saan ang pag-uugali ng mga kumpanya ay ginagaya gamit ang static laro na may kumpletong impormasyon. Ang pangunahing tampok ng laro ay ang pagkakaroon ng isang nangungunang kumpanya, na unang nagtatakda ng dami ng output ng mga kalakal, at ang iba pang mga kumpanya ay ginagabayan sa kanilang mga kalkulasyon nito. Mga pangunahing kinakailangan ng laro:

Ang industriya ay gumagawa ng isang homogenous na produkto: ang mga pagkakaiba sa mga produkto ng iba't ibang mga kumpanya ay bale-wala, na nangangahulugan na ang mamimili, kapag pumipili kung aling kumpanya ang bibilhin, ay nakatuon lamang sa presyo;

Ang industriya ay may maliit na bilang ng mga kumpanya.

ang mga kumpanya ay nagtatakda ng dami ng mga produktong ginawa, at ang presyo para dito ay tinutukoy batay sa demand;

Mayroong tinatawag na pinunong kumpanya, sa dami ng produksyon kung saan ginagabayan ang ibang mga kumpanya.

Kaya, ang modelo ng Stackelberg ay ginagamit upang mahanap ang pinakamainam na solusyon sa mga dynamic na laro at tumutugma sa pinakamataas na kabayaran ng mga manlalaro, batay sa mga kondisyon pagkatapos ng pagpili na ginawa ng isa o higit pang mga manlalaro. Ekwilibriyo ng Stackelberg.- isang sitwasyon kung saan wala sa mga manlalaro ang maaaring tumaas nang unilateral ang kanilang mga panalo, at ang mga pagpapasya ay unang ginawa ng isang manlalaro at nakilala ng pangalawang manlalaro. Sa dilemma na laro ng bilanggo, ang Stackelberg equilibrium ay maaabot sa parisukat (1; 1) - "aminin ang pagkakasala" ng parehong mga kriminal;

5. Pareto optimality- tulad ng isang estado ng system, kung saan ang halaga ng bawat partikular na criterion na naglalarawan sa estado ng system ay hindi maaaring mapabuti nang hindi lumalala ang posisyon ng iba pang mga manlalaro.

Sinasabi ng Prinsipyo ng Pareto: “Anumang pagbabago na hindi nagdudulot ng pagkawala, ngunit nakikinabang sa ilang tao (sa kanilang sariling pagtatantya), ay isang pagpapabuti.” Kaya, kinikilala ang karapatan sa lahat ng pagbabago na hindi nagdudulot ng karagdagang pinsala sa sinuman.

Ang set ng system states na Pareto optimal ay tinatawag na "Pareto set", "the set of alternatives optimal in the sense of Pareto", o ang "set of optimal alternatives".

Ang isang sitwasyon kung saan nakamit ang kahusayan ng Pareto ay isang sitwasyon kung saan ang lahat ng mga benepisyo mula sa palitan ay naubos na.

Ang Pareto efficiency ay isa sa mga pangunahing konsepto para sa modernong ekonomiya. Batay sa konseptong ito, ang una at pangalawang pangunahing teorema ng kapakanan ay itinayo.

Isa sa mga aplikasyon ng Pareto optimality ay ang Pareto distribution ng resources (labor and capital) sa international economic integration, i.e. pang-ekonomiyang unyon ng dalawa o higit pang estado. Kapansin-pansin, ang pamamahagi ng Pareto bago at pagkatapos ng internasyonal na pagsasama-sama ng ekonomiya ay sapat na inilarawan sa matematika (Dalimov R.T., 2008). Ipinakita ng pagsusuri na ang idinagdag na halaga ng mga sektor at ang kita ng mga mapagkukunan ng paggawa ay gumagalaw sa magkasalungat na direksyon alinsunod sa kilalang heat conduction equation, katulad ng isang gas o likido sa kalawakan, na ginagawang posible na ilapat ang pamamaraan ng pagsusuri na ginamit. sa pisika na may kaugnayan sa mga problemang pang-ekonomiya ng paglipat ng mga parameter ng ekonomiya.

Pareto pinakamabuting kalagayan nagsasaad na ang kapakanan ng lipunan ay umaabot sa pinakamataas nito, at ang distribusyon ng mga pinagkukunang-yaman ay nagiging pinakamainam kung anumang pagbabago sa distribusyon na ito ay magpapalala sa kapakanan ng hindi bababa sa isang paksa ng sistemang pang-ekonomiya.

Pareto-optimal na estado ng merkado- isang sitwasyon kung saan imposibleng mapabuti ang posisyon ng sinumang kalahok sa proseso ng ekonomiya nang hindi sabay na binabawasan ang kagalingan ng hindi bababa sa isa sa iba.

Ayon sa Pareto criterion (criterion for the growth of social welfare), ang paggalaw patungo sa pinakamabuting kalagayan ay posible lamang sa gayong pamamahagi ng mga mapagkukunan na nagpapataas ng kapakanan ng hindi bababa sa isang tao nang hindi nakakapinsala sa sinuman.

Sitwasyon S* ay sinasabing nangingibabaw na sitwasyon ng Pareto S kung:

para sa sinumang manlalaro ang kanyang kabayaran sa S<=S*

· mayroong kahit isang manlalaro kung kanino ang kanyang kabayaran sa sitwasyong S*>S

Sa problemang "dilemma ng mga bilanggo", ang Pareto equilibrium, kapag imposibleng mapabuti ang posisyon ng sinuman sa mga manlalaro nang hindi lumalala ang posisyon ng iba, ay tumutugma sa sitwasyon ng parisukat (2; 2).

Isipin mo halimbawa 1.

Paksa 4. Teorya ng laro at pagmomodelo ng interaksyon.

1. Pangunahing konsepto ng teorya ng laro.

2. Mga uri ng ekwilibriyo: Nash equilibrium, Stekelberg, Pareto-optimal equilibrium, equilibrium ng mga dominanteng estratehiya.

3. Mga pangunahing modelo ng teorya ng laro.

Pangunahing konsepto ng teorya ng laro.

Ang paggamit ng mga pamamaraan sa matematika, na kinabibilangan ng teorya ng laro, sa pagsusuri ng mga prosesong pang-ekonomiya ay ginagawang posible upang matukoy ang gayong mga uso, mga relasyon na nananatiling nakatago kapag gumagamit ng iba pang mga pamamaraan, at kahit na makakuha ng mga hindi inaasahang resulta.

Tandaan na ang teorya ng laro ay isa sa mga pinakabatang disiplina sa matematika. Ang paglitaw nito bilang isang independiyenteng sangay ng matematika ay iniugnay sa kalagitnaan ng 1950s, nang ang kilalang monograp nina F. Neumann at O. Morgenstern na "The Theory of Games and Economic Behavior" ay nai-publish. Ang mga pinagmulan ng teorya ng laro na nauugnay sa gawain ni E. Porel (1921)."

Sa ngayon, ang teorya ng laro ay naging isang buong matematikal na direksyon, mayaman sa mga kawili-wiling resulta at pagkakaroon ng malaking bilang ng mga praktikal na rekomendasyon at aplikasyon.

Isaalang-alang natin ang mga pangunahing pagpapalagay at konsepto ng modelo ng laro ng interpersonal na pakikipag-ugnayan.

1. Ang bilang ng mga nakikipag-ugnayang indibidwal ay dalawa. Ang mga indibidwal ay tinatawag na mga manlalaro. Ang konsepto ng isang manlalaro ay nagbibigay-daan sa isa na magmodelo ng mga panlipunang tungkulin ng isang indibidwal: nagbebenta, bumibili, asawa, asawa, atbp. Ang laro ay isang pinasimpleng representasyon ng mga pakikipag-ugnayan ng dalawang indibidwal na may magkaiba o magkatulad na tungkulin sa lipunan, halimbawa, mamimili - nagbebenta, nagbebenta - nagbebenta, atbp.

2. Ang bawat indibidwal ay may nakapirming hanay ng mga pag-uugali, o mga alternatibo. Maaaring hindi pareho ang bilang ng mga opsyon sa pag-uugali para sa iba't ibang manlalaro.

3. Ang interpersonal na pakikipag-ugnayan ay itinuturing na maisasakatuparan kung ang parehong mga manlalaro ay sabay na pumili ng mga opsyon para sa kanilang pag-uugali at kumilos ayon sa kanila. Ang isang solong pagkilos ng interpersonal na pakikipag-ugnayan ay tinatawag na kurso ng laro. Ang tagal ng pagkilos ng pakikipag-ugnayan ay ipinapalagay na zero.

4. Ang kurso ng laro ay ibinibigay ng dalawang integer - ang napiling numero ng opsyon sa pag-uugali (move) ng unang manlalaro at ang napiling numero ng opsyon sa pag-uugali (move) ng pangalawang manlalaro. Ang maximum na posibleng bilang ng iba't ibang galaw sa laro ay katumbas ng produkto ng kabuuang bilang ng mga galaw ng unang manlalaro at ang kabuuang bilang ng mga galaw ng pangalawang manlalaro.

5. Ang bawat pakikipag-ugnayan ng mga indibidwal, o ang kurso ng laro, ay tumatanggap ng serial number nito: 1, 2, 3, atbp. Ang konsepto ng "game move" (isang pares ng mga numero) at "game move number" (solong numero) ay hindi dapat malito. Ipinapalagay na ang mga pakikipag-ugnayan ay nangyayari nang regular sa mga regular na pagitan, kaya ang bilang ng pagliko ng laro ay nagpapahiwatig ng haba ng yugto ng panahon kung kailan nakikipag-ugnayan ang mga indibidwal na ito sa isa't isa.

6. Ang bawat manlalaro ay nagsusumikap na makamit ang pinakamataas na halaga ng ilang target na indicator, na tinatawag na utility, o payoff. Kaya, ang manlalaro ay may mga katangian ng isang "ekonomikong tao". Ang kabayaran ng manlalaro ay maaaring maging positibo o negatibo. Ang negatibong panalo ay tinatawag ding pagkatalo.

7. Ang bawat galaw ng laro (isang pares ng mga alternatibong pinili ng mga manlalaro) ay tumutugma sa isang natatanging pares ng mga kabayaran ng mga manlalaro. Ang pagtitiwala sa mga kabayaran ng mga manlalaro sa mga galaw na kanilang pinili ay inilalarawan ng game matrix, o ang payoff matrix. Ang mga hilera ng matrix na ito ay tumutugma sa mga alternatibo (move) ng unang manlalaro, at ang mga column ay tumutugma sa mga alternatibo (move) ng pangalawang manlalaro. Ang mga elemento ng game matrix ay mga pares ng mga kabayaran na naaayon sa kaukulang row at column (mga galaw ng mga manlalaro). Ang kabayaran ng unang manlalaro (ang unang numero sa cell ng matrix ng laro) ay nakasalalay hindi lamang sa kanyang paglipat (numero ng hilera), kundi pati na rin sa paglipat ng pangalawang manlalaro (numero ng hanay). Samakatuwid, bago ang pagpapatupad ng pakikipag-ugnayan, ang indibidwal ay hindi alam ang eksaktong halaga ng kanyang pakinabang. Sa madaling salita, ang pagpili ng pag-uugali ng manlalaro ay isinasagawa sa ilalim ng mga kondisyon ng kawalan ng katiyakan, ibig sabihin, ang manlalaro ay may mga katangian ng isang "institusyonal na tao".

8. Ang diskarte ng isang manlalaro ay isang nakagawiang stereotype ng pag-uugali na sinusunod ng isang manlalaro kapag pumipili ng alternatibong pag-uugali para sa isang tiyak na tagal ng panahon. Ang diskarte ng manlalaro ay ibinibigay ng mga probabilities (o frequency) ng pagpili ng lahat ng posibleng pag-uugali. Sa madaling salita, ang diskarte ng manlalaro ay isang vector na ang bilang ng mga coordinate ay katumbas ng kabuuang bilang ng mga posibleng alternatibo, at ang i-th coordinate ay katumbas ng probabilidad (frequency) ng pagpili ng i-th na alternatibo. Malinaw na ang kabuuan ng mga halaga ng lahat ng mga coordinate ng isang naibigay na vector ay katumbas ng isa.

Kung ang player sa panahon ng isinasaalang-alang na tagal ng panahon ay pumili lamang ng isang variant ng pag-uugali, ang diskarte ng manlalaro ay tinatawag malinis.

Ang lahat ng mga coordinate ng katumbas na purong vector ng diskarte ay katumbas ng zero, maliban sa isa, na katumbas ng isa.

Isang diskarte na hindi dalisay ang tawag magkakahalo.

Sa kasong ito, ang vector ng diskarte ng manlalaro ay may hindi bababa sa dalawang non-zero na coordinate. Tumutugon sila sa mga aktibong pag-uugali. Ang isang manlalaro na sumusunod sa isang halo-halong diskarte ay nagpapalit-palit ng mga aktibong pag-uugali alinsunod sa ibinigay na mga probabilidad (mga frequency) na pinili. Sa mga sumusunod, para sa pagiging simple ng presentasyon ng materyal, ipagpalagay namin na ang manlalaro ay palaging sumusunod sa ilang purong diskarte, ibig sabihin, sa isinasaalang-alang na tagal ng panahon, palagi niyang pinipili ang tanging variant ng pag-uugali mula sa isang ibinigay na hanay ng mga alternatibo.

Ang isang institusyonal na tao ay nailalarawan sa pamamagitan ng pagkakaiba-iba ng kanyang pag-uugali, na nakasalalay sa kanyang panloob na estado, karanasan sa buhay, panlabas na kapaligiran sa lipunan, atbp. Sa balangkas ng isang diskarte sa laro sa pag-aaral ng mga institusyon, ang pag-aari na ito ng isang institusyonal na tao ay ipinahayag sa ang posibilidad na baguhin ng isang manlalaro ang kanyang diskarte. Kung sa mga istratehiya ng manlalaro ay palaging mayroong isang layunin na pinakamahusay, kung gayon palagi niyang susundin ito, at ang pagbabago ng diskarte ay magiging walang kabuluhan. Ngunit sa totoong buhay, karaniwang isinasaalang-alang ng isang tao ang ilang mga diskarte sa pag-uugali. Imposibleng iisa ang pinakamahusay sa kanila nang may layunin. Ang modelo ng laro ng mga interpersonal na pakikipag-ugnayan ay nagbibigay-daan sa amin upang galugarin ang tampok na ito ng pag-uugali ng institusyonal, dahil saklaw nito ang ilang mga diskarte sa pag-uugali na hindi nagbubukod sa isa't isa at nagpapakita ng iba't ibang aspeto ng pag-uugali ng isang institusyonal na tao. Tingnan natin ang mga pag-uugaling ito.

matris ng laro

Unang manlalaro	Pangalawang manlalaro

	6; 15	2; 13	3; 11
	1; 10	5; 14	4; 12
	4; 12	4; 13	3; 13

Makilala pakikiisa at hindi solido mga diskarte sa pag-uugali. Ang una ay pinaka-karaniwang para sa "institusyonal na tao", at ang huli - para sa "pang-ekonomiyang tao".

hindi solido Ang mga diskarte sa pag-uugali ay nailalarawan sa pamamagitan ng katotohanan na ang isang indibidwal ay pumili ng isang variant ng kanyang pag-uugali nang nakapag-iisa, habang hindi niya isinasaalang-alang ang pag-uugali ng isa pang indibidwal, o, batay sa kanyang karanasan, nagmumungkahi ng isang posibleng variant ng kanyang pag-uugali .

Ang mga pangunahing uri ng hindi pagkakaisa na pag-uugali ay kinabibilangan ng mga sumusunod: hindi makatwiran, ingat, pag-optimize, lihis at makabago.

1) Hindi makatwiran na pag-uugali. Tukuyin ang dalawang diskarte ng unang manlalaro bilang A at B, ayon sa pagkakabanggit. Ang Diskarte A ay tinatawag na nangingibabaw kaugnay ng diskarte B kung, para sa anumang galaw ng pangalawang manlalaro, ang kabayaran ng unang manlalaro, na tumutugma sa diskarte A, ay mas malaki kaysa sa kanyang kabayaran, na tumutugma sa diskarte B. Kaya, ang diskarte B ay mas masahol pa kaugnay ng diskarte A.

Kung ang diskarte A ay palaging malayang mapipili ng manlalaro, kung gayon ang diskarte B ay hindi dapat pipiliin. Kung, gayunpaman, ang diskarte B ay pinili ng unang manlalaro, kung gayon ang kanyang pag-uugali sa kasong ito ay tinatawag na hindi makatwiran. Upang matukoy ang hindi makatwirang pag-uugali ng isang manlalaro, sapat na upang pag-aralan ang matrix ng kanyang mga kabayaran: ang payoff matrix ng isa pang manlalaro ay hindi ginagamit sa kasong ito.

Tandaan na ang terminong "hindi makatwiran na pag-uugali" ay hiniram mula sa neoclassical na teorya. Nangangahulugan lamang ito na ang pagpili ng diskarteng ito ay malinaw na hindi ang pinakamahusay sa isang sitwasyon kung saan ang parehong mga manlalaro ay nasa isang magkasalungat na paghaharap, na karaniwan para sa isang "matang ekonomiko". Ngunit para sa isang "institusyonal na tao" na pumapasok sa interpersonal na pakikipag-ugnayan sa ibang tao, ang hindi makatwirang pag-uugali ay hindi lamang posible, ngunit maaaring maging ang pinaka-makatwirang opsyon sa pag-uugali. Isang halimbawa nito ay ang larong Prisoner's Dilemma.

2) Maingat na Pag-uugali. Ang "institutional na tao", hindi katulad ng "ekonomikong tao", ay hindi ganap na makatwiran, ibig sabihin, hindi niya palaging pinipili ang pinakamahusay na pag-uugali na nagpapalaki ng kita. Ang limitadong rasyonalidad ng "institusyonal na tao" ay ipinahayag sa kanyang kawalan ng kakayahang pumili ng pinakamahusay na pagpipilian ng pag-uugali dahil sa malaking bilang ng mga kahalili, ang kumplikadong algorithm para sa pagtukoy ng pinakamainam na alternatibo, ang limitadong oras para sa paggawa ng desisyon, atbp. Kasabay nito, ang paniwala ng bounded rationality ay nagmumungkahi na, dahil sa lahat ng mga kumplikadong pagpili, ang isang tao ay maaaring pumili ng isang makatwirang magandang alternatibo.

Sa diskarte ng laro sa pag-aaral ng mga institusyon, ang limitadong rasyonalidad ng indibidwal ay inilalarawan ng maingat na pag-uugali ng manlalaro.

Diskarte sa pag-iingat- ito ay diskarte ng manlalaro na ginagarantiyahan siya ng isang tiyak na halaga ng kabayaran, anuman ang pagpipilian (paglipat) ng ibang manlalaro. Ang maingat na diskarte ay tinatawag ding maximin dahil kinakalkula ito sa pamamagitan ng paghahanap ng pinakamataas na halaga mula sa ilang pinakamababang halaga.

Ang maingat na diskarte ng unang manlalaro ay tinukoy bilang mga sumusunod. Sa bawat hilera ng matrix ng kanyang mga kabayaran, ang pinakamababang elemento ay matatagpuan, at pagkatapos ay ang maximum, o maximin ng unang manlalaro, ay pinili mula sa naturang pinakamababang elemento. Ang linya ng matrix ng laro, kung saan matatagpuan ang maximin ng unang manlalaro, ay tumutugma sa kanyang maingat na diskarte. Ang maingat na diskarte ng pangalawang manlalaro ay nakuha nang katulad. Sa bawat column ng matrix ng mga kabayaran nito, ang pinakamababang elemento ay matatagpuan, at pagkatapos ay ang pinakamataas na elemento ay tinutukoy mula sa naturang pinakamababang elemento. Ang column ng game matrix, kung saan matatagpuan ang maximin ng pangalawang manlalaro, ay tumutugma sa kanyang maingat na diskarte. Ang bawat manlalaro ay maaaring magkaroon ng ilang maingat na diskarte, ngunit lahat sila ay may parehong halaga maximin (maximum na minimum na diskarte), o isang garantisadong panalo. Ang mga maingat na diskarte ay umiiral sa anumang matrix na laro. Upang matukoy ang maingat na diskarte ng isang manlalaro, sapat na upang pag-aralan ang kanyang payoff matrix, habang ang payoff matrix ng isa pang manlalaro ay hindi ginagamit. Ang tampok na ito ay karaniwan sa hindi makatwiran at maingat na pag-uugali.

3) Pag-optimize ng Gawi. Sa kasanayan sa negosyo, madalas na lumitaw ang mga sitwasyon kapag ang mga ahente sa ekonomiya (halimbawa, isang nagbebenta at isang regular na mamimili) sa kurso ng pangmatagalang pakikipag-ugnayan sa isa't isa ay nakahanap ng mga diskarte sa pag-uugali na angkop sa parehong partido, at samakatuwid ay ginagamit ng "mga manlalaro" para sa isang mahabang panahon. Sa diskarte ng laro sa pag-aaral ng mga institusyon, ang inilarawan na sitwasyon ay namodelo gamit ang konsepto ng mga estratehiya ng ekwilibriyo. Ang isang pares ng naturang mga diskarte ay nailalarawan sa pamamagitan ng sumusunod na katangian: kung ang unang manlalaro ay lumihis mula sa kanyang equilibrium na diskarte (pumili ng iba pa), at ang pangalawa ay patuloy na sumusunod sa kanyang equilibrium na diskarte, kung gayon ang unang manlalaro ay makakaranas ng pinsala sa anyo ng isang pagbaba sa kabayaran. Ang isang cell ng game matrix na matatagpuan sa intersection ng isang row at isang column na tumutugma sa isang pares ng equilibrium strategies ay tinatawag na equilibrium point. Ang matrix ng laro ay maaaring magkaroon ng ilang equilibrium point, o maaaring wala ito sa lahat.

Ang pag-uugali ng isang manlalaro na sumusunod sa isang equilibrium na diskarte ay tinatawag na pag-optimize ( minimum na pag-uugali o minimum-maximum na diskarte).

Iba ito sa pag-maximize ng pag-uugali. Una, ang equilibrium payoff ng player ay hindi ang maximum ng lahat ng posibleng payoffs. Ito ay hindi tumutugma sa global maximum, ngunit sa lokal na pinakamabuting kalagayan. Kaya, ang global maximum ng isang function na ibinigay sa isang numerical interval ay lumampas sa bawat lokal na maximum nito. Pangalawa, ang pagsunod sa equilibrium na diskarte ng isang manlalaro ay nangangailangan ng pagkamit ng lokal na maximum sa kanya lamang kung ang equilibrium na diskarte ay pinananatili ng ibang manlalaro. Kung ang pangalawang manlalaro ay lumihis mula sa ekwilibriyong diskarte, kung gayon ang karagdagang paggamit ng ekwilibriyong diskarte ng unang manlalaro ay hindi magbibigay sa kanya ng isang maximizing na epekto.

Ang mga diskarte sa balanse ay tinutukoy ayon sa sumusunod na panuntunan: ang isang cell ng game matrix ay itinuturing na equilibrium kung ang kabayaran ng unang manlalaro na naaayon dito ay ang pinakamataas sa hanay, at ang kabayaran ng pangalawang manlalaro na naaayon dito ay ang maximum sa row. Kaya, sa algorithm para sa paghahanap ng mga diskarte sa equilibrium, ang mga payoff matrice ng parehong mga manlalaro ay ginagamit, at hindi isa sa mga ito, tulad ng sa mga kaso ng hindi makatwiran at maingat na pag-uugali.

4) Palihis na pag-uugali. Ang institusyonalisasyon ng isang diskarte sa balanse bilang isang pangunahing pamantayan ng pag-uugali ay nangyayari bilang isang resulta ng paglalahat ng isang tao sa kanyang karanasan sa interpersonal na pakikipag-ugnayan, kabilang ang karanasan ng lihis na pag-uugali. Ang kamalayan ng isang tao sa mga negatibong kahihinatnan ng naturang pag-uugali, batay sa pagpili ng mga alternatibong hindi balanse, ay ang mapagpasyang argumento kapag pumipili ng isang diskarte sa pag-optimize ng pag-uugali. Kaya, ang lihis na pag-uugali ay nagsisilbing isang mahalagang bahagi ng karanasan sa buhay ng "institusyonal na tao", na kumikilos bilang isang empirical na katwiran para sa pag-optimize ng pag-uugali. Ang karanasan ng lihis na pag-uugali ay nagbibigay sa isang tao ng kumpiyansa na ang ibang kalahok sa laro ay palaging susunod sa diskarte sa ekwilibriyo. Kaya, ang ganitong karanasan ay nagsisilbing patunay ng pagiging makatwiran ng pag-uugali ng ibang manlalaro at ang predictability ng mga pakikipag-ugnayan sa hinaharap sa kanya.

5) Makabagong pag-uugali. Sa itaas, ang lihis na pag-uugali ay isinasaalang-alang, ang pangunahing layunin kung saan ay ang empirical na pagpapatunay at pagsasama-sama ng paunang diskarte sa ekwilibriyo. Gayunpaman, ang layunin ng paglihis mula sa ekwilibriyong diskarte ay maaaring sa panimula ay naiiba. Ang makabagong pag-uugali ay isang sistematikong paglihis mula sa karaniwang istratehiya ng ekwilibriyo upang makahanap ng isa pang estado ng balanse na mas kapaki-pakinabang para sa manlalaro ng innovator.

Sa loob ng balangkas ng modelo ng laro ng interpersonal na pakikipag-ugnayan, ang layunin ng makabagong pag-uugali ay maaaring makamit kung ang matrix ng laro ay may ibang punto ng equilibrium kung saan ang kabayaran ng innovator na manlalaro ay mas malaki kaysa sa paunang estado ng balanse. Kung walang ganoong punto, ang makabagong pag-uugali ay malamang na mapapahamak sa kabiguan, at ang innovator na manlalaro ay babalik sa orihinal na diskarte sa equilibrium. Kasabay nito, ang kanyang mga pagkalugi mula sa makabagong eksperimento ay magiging katumbas ng kabuuang epekto ng paglihis para sa buong panahon ng eksperimento.

Sa totoong buhay, ang mga nakikipag-ugnayan na indibidwal ay madalas na sumasang-ayon na sundin ang ilang mga diskarte sa pag-uugali sa hinaharap. Sa kasong ito, ang pag-uugali ng mga manlalaro ay tinatawag pakikiisa.

Ang mga pangunahing dahilan para sa pag-uugali ng pagkakaisa:

a) ang kakayahang kumita ng solidaryong pag-uugali para sa parehong mga manlalaro. Sa loob ng balangkas ng modelo ng laro ng pakikipag-ugnayan, ang sitwasyong ito ay inilalarawan ng isang game matrix, sa isang cell kung saan ang mga kabayaran ng parehong mga manlalaro ay maximum, ngunit sa parehong oras ito ay hindi equilibrium at hindi tumutugma sa isang pares ng maingat. diskarte ng mga manlalaro. Ang mga diskarte na nauugnay sa cell na ito ay malamang na hindi pipiliin ng mga manlalaro na nagpapatupad ng mga hindi solidong pattern ng pag-uugali. Ngunit kung ang mga manlalaro ay sumang-ayon sa pagpili ng naaangkop na mga diskarte sa pagkakaisa, pagkatapos ay magiging hindi kapaki-pakinabang para sa kanila na labagin ang kasunduan, at ito ay awtomatikong isasagawa;

b) ang etikal na pag-uugali ng pagkakaisa ay kadalasang nagsisilbing isang "panloob" na mekanismo upang matiyak ang pagsunod sa kasunduan. Ang moral na halaga sa anyo ng panlipunang pagkondena na ang isang indibidwal ay makakamit kung siya ay lalabag sa kasunduan ay maaaring mas mahalaga sa kanya kaysa sa pakinabang na nakamit nito. Ang etikal na kadahilanan ay gumaganap ng isang mahalagang papel sa pag-uugali ng isang "institusyonal na tao", ngunit hindi ito aktwal na isinasaalang-alang sa modelo ng laro ng interpersonal na pakikipag-ugnayan;

c) pamimilit sa pag-uugali ng pagkakaisa ay nagsisilbing isang "panlabas" na mekanismo upang matiyak ang pagsunod sa kasunduan. Ang kadahilanang ito ng pag-uugali ng institusyon ay hindi rin sapat na nakikita sa modelo ng laro ng mga pakikipag-ugnayan.

Mga uri ng ekwilibriyo: Nash equilibrium, Stekelberg, Pareto-optimal equilibrium, equilibrium ng mga dominanteng estratehiya.

Sa bawat pakikipag-ugnayan, maaaring mayroong iba't ibang uri ng ekwilibriyo: ang nangingibabaw na ekwilibriyo ng diskarte, ang ekwilibriyo ng Nash, ang ekwilibriyo ng Stackelberg, at ang ekwilibriyo ng Pareto. Ang nangingibabaw na diskarte ay isang plano ng aksyon na nagbibigay sa kalahok ng maximum na utility, anuman ang mga aksyon ng ibang kalahok. Alinsunod dito, ang ekwilibriyo ng mga dominanteng estratehiya ay ang intersection ng mga dominanteng estratehiya ng parehong kalahok sa laro. Ang Nash equilibrium ay isang sitwasyon kung saan ang diskarte ng bawat manlalaro ay ang pinakamahusay na tugon sa mga aksyon ng ibang manlalaro. Sa madaling salita, ang equilibrium na ito ay nagbibigay sa player ng maximum na utility depende sa mga aksyon ng ibang player. Ang Stackelberg equilibrium ay nangyayari kapag may time lag sa paggawa ng desisyon ng mga kalahok sa laro: ang isa sa kanila ay gumagawa ng mga desisyon, alam na kung paano kumilos ang iba. Kaya, ang Stackelberg equilibrium ay tumutugma sa pinakamataas na pakinabang ng mga manlalaro sa ilalim ng mga kondisyon ng hindi sabay-sabay na paggawa ng desisyon ng mga ito. Hindi tulad ng nangingibabaw na ekwilibriyo ng diskarte at ang balanse ng Nash, palaging umiiral ang ganitong uri ng ekwilibriyo. Sa wakas, ang Pareto equilibrium ay umiiral sa ilalim ng kondisyon na hindi posible na taasan ang utility ng parehong mga manlalaro sa parehong oras. Isaalang-alang natin sa isa sa mga halimbawa ang teknolohiya ng paghahanap para sa equilibria ng lahat ng apat na uri.

Dominant na diskarte- tulad ng isang plano ng aksyon na nagbibigay sa kalahok ng maximum na utility, anuman ang mga aksyon ng ibang kalahok.

Nash ekwilibriyo- isang sitwasyon kung saan wala sa mga manlalaro ang maaaring tumaas nang unilateral ang kanilang mga panalo sa pamamagitan ng pagbabago ng kanilang plano sa pagkilos.

Ekwilibriyo ng Stackelberg- isang sitwasyon kung saan wala sa mga manlalaro ang maaaring tumaas nang unilateral ang kanilang mga panalo, at ang mga pagpapasya ay unang ginawa ng isang manlalaro at nakilala ng pangalawang manlalaro.

Paretto equilibrium- isang sitwasyon kung saan imposibleng mapabuti ang posisyon ng isa sa mga manlalaro nang hindi lumalala ang posisyon ng isa at hindi binabawasan ang kabuuang bayad ng mga manlalaro.

Hayaang subukan ng firm A na sirain ang monopolyo ng firm B sa produksyon ng isang partikular na produkto. Ang kumpanya A ay nagpasiya kung papasok sa merkado, at ang kumpanya B ay nagpasiya kung babawasan ang output kung sakaling ang A ay nagpasya pa ring pumasok. Sa kaso ng hindi nabagong output sa firm B, ang parehong kumpanya ay natalo, ngunit kung nagpasya ang firm B na bawasan ang output, pagkatapos ay "ibinabahagi" nito ang tubo nito sa A.

Ekwilibriyo ng mga dominanteng estratehiya. Inihahambing ng Firm A ang kabayaran nito sa ilalim ng parehong mga senaryo (-3 at 0 kung magpasya ang B na magsimula ng digmaan sa presyo) at (4 at 0 kung magpasya ang B na bawasan ang output). Wala siyang diskarte na nagsisiguro ng pinakamataas na pakinabang anuman ang mga aksyon ni B: 0 > -3 => "huwag pumasok sa merkado" kung ang B ay umalis sa output sa parehong antas, 4 > 0 => "pumasok" kung B binabawasan ang output (tingnan ang . solid arrow). Kahit na ang firm A ay walang dominanteng diskarte, ang B ay mayroon. Interesado itong bawasan ang output anuman ang mga aksyon ni A (4 > -2, 10 = 10, tingnan ang mga tuldok na arrow). Samakatuwid, walang ekwilibriyo ng mga dominanteng estratehiya.

Nash ekwilibriyo. Ang pinakamahusay na tugon ng Firm A sa desisyon ng firm B na panatilihing pareho ang output ay hindi ang pagpasok, ngunit sa isang desisyon na bawasan ang output ay ang pagpasok. Ang pinakamahusay na tugon ng Firm B sa desisyon ng firm A na pumasok sa merkado ay upang bawasan ang output; kung magpasya ang firm B na huwag pumasok, ang parehong mga diskarte ay katumbas. Samakatuwid, ang dalawang Nash equilibria (A, A2) ay nasa mga punto (4, 4) at (0, 10) - Ang A ay pumapasok at ang B ay binabawasan ang output, o ang A ay hindi pumasok at ang B ay hindi nagbabawas ng output. Napakadaling i-verify ito, dahil sa mga puntong ito wala sa mga kalahok ang interesadong baguhin ang kanilang diskarte.

Ekwilibriyo ng Stackelberg. Ipagpalagay na ang firm A ang unang gumawa ng desisyon. Kung pipiliin nitong pumasok sa merkado, sa huli ay mapupunta ito sa punto (4, 4): ang pagpili ng firm B ay hindi malabo sa sitwasyong ito, 4 > -2. Kung nagpasya itong pigilin ang pagpasok sa merkado, ang resulta ay dalawang puntos (0, 10): pinapayagan ng mga kagustuhan ng firm B ang parehong mga pagpipilian. Sa pag-alam nito, pinalaki ng firm A ang kabayaran nito sa mga puntos (4, 4) at (0, 10) sa pamamagitan ng paghahambing ng 4 at 0. Ang mga kagustuhan ay may iisang halaga, at ang unang Stackelberg equilibrium StA ay nasa punto (4, 4). Katulad nito, ang Stackelberg equilibrium StB, kapag ang Firm B ang gumawa ng unang desisyon, ay nasa (0, 10).

Pareto ekwilibriyo. Upang matukoy ang pinakamainam na Pareto, dapat nating ulitin ang lahat ng apat na resulta ng laro nang sunud-sunod, na sinasagot ang tanong na: "Ang paglipat ba sa anumang iba pang resulta ng laro ay nagbibigay ng pagtaas sa utility nang sabay-sabay para sa parehong mga kalahok?" Halimbawa, mula sa kinalabasan (-3, -2) maaari tayong pumunta sa anumang iba pang resulta sa pamamagitan ng pagtupad sa tinukoy na kundisyon. Mula lamang sa kinalabasan (4, 4) hindi tayo makaka-move on nang hindi binabawasan ang utility ng alinman sa mga manlalaro, ito ang magiging Pareto equilibrium, R.

Paglalapat ng prinsipyo ng mga posibleng displacements

Ang prinsipyo ng posibleng mga displacement ay napaka-epektibo sa pag-aaral ng ekwilibriyo ng mga flat na mekanismo, i.e. tulad, ang mga link kung saan gumagalaw sa mga eroplano na kahanay sa ilang nakapirming eroplano. Pinasimple, maaari nating ipagpalagay na ang lahat ng mga punto at mga link nito ay gumagalaw sa kahabaan ng eroplano ng pagguhit mismo.

Isinasaalang-alang na ang lahat ng mga koneksyon ng mga link ng mekanismo, pati na rin ang mga panlabas na koneksyon, ay perpekto, ibinubukod namin mula sa pagsasaalang-alang ang kanilang mga reaksyon. Tinutukoy nito ang mga pakinabang ng prinsipyo ng posibleng mga displacement kumpara sa mga pamamaraan ng geometric statics (balance equation).

Ang pagpapabaya sa alitan, hanapin ang ugnayan sa pagitan ng mga puwersa P at Q, kung saan ang mekanismo ng crank-slider ay magiging equilibrium kung ang puwersa ay patayo OA(Larawan 2.8).

Ang pagkakaroon ng kaalaman sa mekanismo ng posibleng paggalaw, at katumbas ng zero ang kabuuan ng gawain ng mga pwersa P at Q sa displacement na ito, nakukuha natin

P× dS B - Q×dS A = 0,

saan dS A at dS B– mga module ng posibleng mga displacement ng mga puntos PERO at AT.

gumagalaw dS A patayo OA, dS B nakadirekta sa isang tuwid na linya OB. Upang matukoy ang relasyon sa pagitan ng dS B at dS A hanapin ang MCC ng link AB.Namamalagi ito sa intersection ng mga patayo at sa mga direksyon ng posibleng mga displacement ng mga punto PERO at AT. Ang mga paggalaw na ito ay nasa parehong pagdepende sa bilis ng mga puntos PERO at AT, ibig sabihin.

Sa pamamagitan ng pagpapasok ng notasyon ng mga anggulo j at y, mula sa sinus theorem na aming nakita

Pag-asa sa pagitan ng mga posibleng paggalaw dS A at dS B maaaring matukoy gamit ang point velocity projection theorem A at B direkta AB. Ang teorama na ito ay maaaring isulat:

dS A cos = dS B× maaliwalas,

Ang itinuturing na problema ay maaaring malutas gamit ang mga pamamaraan ng matibay na estatika ng katawan. Upang gawin ito, kailangan mong bumuo ng mga equation ng equilibrium para sa bawat link ng mekanismo (crank OA, connecting rod AB, crawler AT); sa kasong ito, ang isa ay kailangang isaalang-alang ang hindi kilalang mga reaksyon ng mga bono (mga reaksyon sa mga bisagra PERO at AT at ang reaksyon ng mga gabay kung saan gumagalaw ang slider).

Kapag nilutas ang mga problema ng ganitong uri, ang bentahe ng prinsipyo ng posibleng mga displacement ay halata; ginagawang posible ng pamamaraang ito na ibukod ang hindi kilalang mga reaksyon ng bono mula sa pagsasaalang-alang, dahil ang mga reaksyong ito ay hindi kasama sa kondisyon ng ekwilibriyo ng sistema, na ipinahayag ng prinsipyo ng mga posibleng displacement.

2.6. Paglalapat ng prinsipyo ng mga posibleng displacements

sa kahulugan ng mga reaksyon ng bono

Ang mga puwersa ng reaksyon ay hindi lumilitaw sa pagbabalangkas ng prinsipyo ng posibleng mga displacement. Gayunpaman, ang prinsipyo ng posibleng mga displacement ay maaaring epektibong mailapat upang matukoy ang mga puwersang ito, at kung mas kumplikado ang disenyo, mas malaki ang bentahe ng prinsipyo ng mga posibleng displacement kumpara sa mga pamamaraan na ginamit sa geometric statics (pagguhit at paglutas ng mga equation ng equilibrium) .

Ang mga static na istruktura (mga istruktura) ay may zero na antas ng kadaliang kumilos, i.e. ay nasa balanse dahil sa pagkakaroon ng panlabas at panloob na mga relasyon. Ang koneksyon sa anyo ng isang matibay na attachment, na ipinataw sa katawan, ay naglilimita sa alinman sa mga paggalaw nito, samakatuwid, ang reaksyon ay kinakatawan sa anyo ng dalawang bahagi na nakadirekta kasama ang mga coordinate axes at isang reaktibong sandali. Ang hinged-fixed na suporta ay naglilimita sa paggalaw ng katawan sa dalawang magkaparehong patayo na direksyon, ang reaksyon nito ay kinakatawan bilang dalawang bahagi kasama ang mga coordinate axes.

Ang paglalapat ng prinsipyo ng pagpapalaya mula sa mga bono, maaaring itapon ng isa ang isang solong bono na naglilimita sa paggalaw ng katawan sa isang direksyon, na pinapalitan ito ng puwersa ng reaksyon.

Sa mga kaso kung saan pinipigilan ng pagpigil ang katawan mula sa paggalaw sa ilang direksyon (nakapirming suporta sa bisagra, matibay na pagkakabit), ito ay pinalitan ng isa pang uri ng pagpilit na nagpapahintulot sa paggalaw sa direksyon ng reaksyon na gusto nating matukoy.

Upang matukoy ang reaktibong sandali sa isang matibay na attachment, ito ay pinalitan ng isang nakapirming hinged na suporta at ang nais na reaktibong sandali (Larawan 2.9).

Upang matukoy ang pahalang o patayong bahagi ng reaksyon ng isang matibay na pag-embed, ito ay pinalitan ng isang koneksyon ng uri ng baras sa mga gabay at ang nais na reaksyon (Larawan 2.10, 2.11).

Sa ganitong paraan, ang mga reaksyon ng lahat ng mga bono ay maaaring sunud-sunod na matukoy. Sa kasong ito, sa bawat oras na ang koneksyon na ang reaksyon ay dapat matukoy ay itinapon, at ang mekanikal na sistema ay tumatanggap ng isang antas ng kalayaan.

Sa mga kaso kung saan pinipigilan ng koneksyon ang katawan mula sa paglipat sa ilang mga direksyon (nakapirming hinged na suporta, matibay na attachment), hindi ito ganap na itinatapon, ngunit pinalitan lamang ng isang mas simple. Kung paano ito ginagawa ay ipinapakita sa Fig. 2.12.

Magpapakita kami ng mga opsyon para sa pagpapalit ng hinged-fixed na suporta kapag tinutukoy ang mga reaksyon nito.

Isaalang-alang ang mga halimbawa ng pagtukoy sa mga reaksyon ng suporta ng composite
mga istruktura.

Pagsasama-sama ng mga linya ng supply at demand sa isang solong graph, nakakakuha kami ng isang graphical na representasyon ng equilibrium sa mga coordinate P, Q(Larawan 2.6). Ang punto ng intersection ng mga linya ay may mga coordinate (P * , Q*), saan R* - punto ng balanse presyo, Q*- ekwilibriyong dami ng produksyon at pagkonsumo.

Ekwilibriyo sa pamilihan- ito ay isang estado ng pamilihan kung saan, para sa isang partikular na antas ng presyo, ang quantity demanded ay katumbas ng quantity supplied.

Lamang sa punto ng balanse E ang merkado ay balanse, wala sa mga ahente sa merkado ang may mga insentibo upang baguhin ang sitwasyon. Nangangahulugan ito na ang market equilibrium ay may ari-arian Pagpapanatili - sa kaganapan ng isang di-equilibrium na estado, ang mga ahente sa merkado ay naudyukan na ibalik ang merkado sa ekwilibriyo. Upang patunayan ang katatagan, karaniwang ginagamit ang lohika ng L. Walras o A. Marshall.

Ayon kay L. Walras, sa masyadong mataas na presyo, mayroong labis na suplay - labis na produksyon (segment A-B sa fig. 2.6i), ang naturang pamilihan ay tinatawag merkado ng mamimili dahil ang mamimili ay may pagkakataon na humingi ng pagbawas sa presyo kapag nagtatapos ng mga transaksyon. Sa ganitong sitwasyon, una sa lahat, ang nagbebenta ay hindi interesado, na napipilitang bawasan ang mga presyo at bawasan ang mga volume ng produksyon. Habang bumababa ang presyo, tumataas ang quantity demanded A-B lumiliit hanggang sa maging equilibrium point E.

Sa mababang presyo, mayroong labis na demand - isang kakulangan (segment CFna Fig. 2.6a), bubuo merkado ng nagbebenta. Napipilitan ang bumibili

Kung ang isang mamimili ay nagbabawas ng pagkonsumo at labis na nagbabayad para sa isang kakaunting produkto, habang ang presyo ay tumataas, ang dami ng ibinibigay, at ang kakapusan ay lumiliit hanggang sa balanse ang merkado.

Ayon kay A. Marshall (Fig. 2.66), para sa maliliit na volume ng produksyon, ang presyo ng demand ay lumampas sa presyo ng nagbebenta, para sa malalaking volume - vice versa. Sa anumang kaso, ang sitwasyon ng kawalan ng timbang ay nagpapasigla ng pagbabago sa presyo o dami ng supply at demand patungo sa ekwilibriyo. Punto ng balanse (a) ayon kay Walras - kinokontrol ng presyo ang kawalan ng balanse ng supply at demand, (b) ayon kay Marshall - ang mga presyo ng bumibili at nagbebenta ay balanse sa pamamagitan ng pagbabago sa mga volume.

kanin. 2.6. Pagtatatag ng ekwilibriyo sa pamilihan: c) ayon kay L. Walras; b) ayon kay A. Marshall

Ang pagbabago sa demand o supply sa merkado ay humahantong sa pagbabago sa ekwilibriyo (Larawan 2.7). Kung, halimbawa, tumaas ang demand sa merkado, lumilipat ang linya ng demand sa kanan, pagkatapos ay ang presyo ng ekwilibriyo at pagtaas ng volume. Kung bumaba ang supply sa merkado, ang linya ng supply ay lumilipat sa kaliwa, na nagreresulta sa pagtaas ng presyo at pagbaba ng volume.

Ang modelo ng merkado na ito ay static, dahil ang oras ay hindi lilitaw dito.

"Spider" na modelo

Bilang isang halimbawa ng isang dynamic na modelo ng market equilibrium, ipinakita namin ang pinakasimpleng modelo ng "sapot ng gagamba". Ipagpalagay na ang quantity demanded ay depende sa antas ng presyo ng kasalukuyang panahon t, at ang dami ng supply - mula sa mga presyo ng nakaraang panahon t-1:

Q d i = Q d i (P t) , Q s i = Q s i (P t -1) ,

kung saan ang t = 0.1….T ay ang discrete value ng yugto ng panahon.

kanin. 2.7. Pagbabago sa ekwilibriyo ng pamilihan:

a) dahil sa pagtaas ng demand; b) dahil sa pagbaba

mga mungkahi

Presyo sa pamilihan P t maaaring hindi tumugma sa presyo ng ekwilibriyo R*, at mayroong tatlong posibleng dynamics P t(Larawan 2.8).

Ang variant ng development trajectory sa modelong ito ay depende sa ratio ng mga slope ng mga linya ng supply at demand.

kanin. 2.8. "Spider" na modelo ng ekwilibriyo sa pamilihan:

a) bumababa ang paglihis mula sa ekwilibriyo; 5) paglihis

tumataas mula sa ekwilibriyo (ang modelong "sakuna"); c) pamilihan

umiikot sa paligid ng punto ng ekwilibriyo, ngunit ang ekwilibriyo

Sa isang antagonistic na laro, natural na isaalang-alang ang pinakamainam na resulta kung saan hindi kapaki-pakinabang para sa sinuman sa mga manlalaro na lumihis mula dito. Ang ganitong resulta (x*,y*) ay tinatawag na sitwasyong ekwilibriyo, at ang prinsipyo ng optimality batay sa paghahanap ng sitwasyong ekwilibriyo ay tinatawag na prinsipyo ng ekwilibriyo.

Kahulugan. Sa isang matrix na laro na may matrix ng mga sukat, ang kinalabasan ay sitwasyon ng ekwilibriyo o isang saddle point kung

Sa isang saddle point, ang isang elemento ng matrix ay parehong minimum sa row nito at ang maximum sa column nito. Sa laro mula sa halimbawa, elemento 2 isang 33 ay isang saddle point. Ang pinakamainam sa larong ito ay ang ikatlong diskarte para sa parehong mga manlalaro. Kung ang unang manlalaro ay lumihis mula sa ikatlong diskarte, pagkatapos ay magsisimula siyang manalo ng mas mababa sa isang 33. Kung ang pangalawang manlalaro ay lumihis mula sa ikatlong diskarte, pagkatapos ay magsisimula siyang mawalan ng higit sa isang 33. Kaya, para sa parehong mga manlalaro, walang mas mahusay kaysa sa patuloy na manatili sa ikatlong diskarte.

Ang prinsipyo ng pinakamainam na pag-uugali: kung mayroong isang saddle point sa isang matrix game, kung gayon ang pinakamainam na diskarte ay ang pagpili na naaayon sa saddle point. Ano ang mangyayari kung mayroong higit sa isang saddle point sa laro?

Teorama. Hayaan dalawang arbitrary na saddle point sa isang matrix game. Pagkatapos:

Patunay. Mula sa kahulugan ng sitwasyon ng ekwilibriyo, mayroon tayong:

Palitan natin sa kaliwang bahagi ng hindi pagkakapantay-pantay (2.8) , at sa kanan - , sa kaliwang bahagi ng hindi pagkakapantay-pantay (2.9) - , sa kanan - . Pagkatapos makuha namin:

Saan nagmula ang pagkakapantay-pantay:

Ito ay sumusunod mula sa theorem na ang payoff function ay tumatagal ng parehong halaga sa lahat ng sitwasyon ng equilibrium. Kaya naman tinawag ang numero sa halaga ng laro. At ang mga diskarte na naaayon sa alinman sa mga saddle point ay tinatawag pinakamainam na estratehiya mga manlalaro 1 at 2, ayon sa pagkakabanggit. Sa bisa ng (2.7), lahat ng pinakamainam na diskarte ng manlalaro ay mapapalitan.

Ang pinakamainam ng pag-uugali ng mga manlalaro ay hindi magbabago kung ang hanay ng mga diskarte sa laro ay mananatiling pareho, at ang payoff function ay pinarami ng isang positibong pare-pareho (o isang pare-parehong numero ay idinagdag dito).

Teorama. Para umiral ang saddle point (i*,j*) sa matrix game, kinakailangan at sapat na ang maximin ay katumbas ng minimax:

(2.10)

Patunay. Kailangan. Kung ang (i*,j*) ay isang saddle point, kung gayon, ayon sa (2.6):

(2.11)

Gayunpaman, mayroon kaming:

(2.12)

Mula sa (2.11) at (2.12) nakukuha natin:

(2.13)

Sa parehong pagtatalo, nakarating tayo sa pagkakapantay-pantay:

kaya,

Sa kabilang banda, ang reverse inequality (2.5) ay palaging nasisiyahan, kaya ang (2.10) ay totoo.

Kasapatan. Hayaan ang (2.10) ay totoo. Patunayan natin ang pagkakaroon ng saddle point. Meron kami:

Ayon sa pagkakapantay-pantay (2.10), ang hindi pagkakapantay-pantay (2.15) at (2.16) ay nagiging pagkakapantay-pantay. Pagkatapos nito, mayroon kaming:

Napatunayan na ang theorem. Sa kahabaan ng paraan, napatunayan na ang kabuuang halaga ng maximin at minimax ay katumbas ng presyo ng laro .

Pagpapalawak ng Mixed Game

Isaalang-alang ang isang matrix game G. Kung mayroong isang ekwilibriyong sitwasyon dito, kung gayon ang minimax ay katumbas ng maximin. Bukod dito, ang bawat isa sa mga manlalaro ay maaaring sabihin sa iba pang impormasyon ng manlalaro tungkol sa kanyang pinakamainam na diskarte. Ang kanyang kalaban ay hindi makakakuha ng anumang karagdagang benepisyo mula sa impormasyong ito. Ngayon ipagpalagay na walang sitwasyong ekwilibriyo sa larong G. Pagkatapos:

Sa kasong ito, ang mga diskarte sa minimax at maximin ay hindi matatag. Ang mga manlalaro ay maaaring magkaroon ng mga insentibo upang lumihis mula sa kanilang maingat na mga diskarte na may kaugnayan sa posibilidad na makakuha ng higit na kabayaran, ngunit pati na rin ang panganib na matalo, iyon ay, makakuha ng kabayaran na mas mababa kaysa kapag gumagamit ng isang maingat na diskarte. Kapag gumagamit ng mga mapanganib na diskarte, ang paglilipat ng impormasyon tungkol sa mga ito sa kalaban ay may masamang kahihinatnan: ang manlalaro ay awtomatikong tumatanggap ng mas maliit na kabayaran kaysa kapag gumagamit ng isang maingat na diskarte.

Halimbawa 3. Hayaang magmukhang ganito ang matrix ng laro:

Para sa naturang matrix , i.e. equilibrium ay wala. Ang maingat na diskarte ng mga manlalaro ay i*=1, j*=2. Hayaang sundin ng manlalaro 2 ang diskarte j*=2, at ang manlalaro 1 ay pumili ng diskarte i=2. pagkatapos ay ang huli ay makakatanggap ng isang kabayaran ng 3, na kung saan ay dalawang mga yunit ng higit pa kaysa sa maximin. Kung, gayunpaman, ang manlalaro 2 ay hulaan ang tungkol sa mga plano ng manlalaro 1, babaguhin niya ang kanyang diskarte sa j=1, at pagkatapos ay ang una ay makakatanggap ng kabayarang 0, iyon ay, mas mababa sa kanyang maximin. Ang katulad na pangangatwiran ay maaaring isagawa para sa pangalawang manlalaro. Sa pangkalahatan, maaari nating tapusin na ang paggamit ng isang adventurous na diskarte sa isang hiwalay na laro ng laro ay maaaring magdala ng isang resulta na mas malaki kaysa sa garantisadong, ngunit ang paggamit nito ay nauugnay sa panganib. Ang tanong ay lumitaw, posible bang pagsamahin ang isang maaasahang maingat na diskarte sa isang adventurous sa paraang mapataas ang iyong average na kabayaran? Sa esensya, ang tanong ay kung paano hatiin ang kabayaran (2.17) sa pagitan ng mga manlalaro?

Lumalabas na ang isang makatwirang solusyon ay ang paggamit ng pinaghalong diskarte, iyon ay, isang random na pagpili ng mga purong diskarte. Tandaan mo yan ang diskarte ng player 1 ay tinatawag na mixed, kung ang pagpili ng i-th row ay ginawa niya na may ilang posibilidad p i . Ang ganitong diskarte ay maaaring makilala sa pamamahagi ng posibilidad sa maraming linya. Ipagpalagay na ang unang manlalaro ay may mga purong diskarte at ang pangalawang manlalaro ay may mga purong diskarte. Pagkatapos ang kanilang mga pinaghalong diskarte ay mga probability vectors:

(2.18)

Isaalang-alang ang dalawang posibleng magkahalong diskarte para sa unang manlalaro sa Halimbawa 3: . Ang mga diskarte na ito ay naiiba sa mga pamamahagi ng posibilidad sa pagitan ng mga purong diskarte. Kung sa unang kaso ang mga hilera ng matrix ay pinili ng manlalaro na may pantay na posibilidad, pagkatapos ay sa pangalawang kaso - na may iba't ibang mga. Kapag pinag-uusapan natin ang tungkol sa isang halo-halong diskarte, ang ibig nating sabihin ay ang random na pagpipilian ay hindi isang "random" na pagpipilian, ngunit isang pagpipilian batay sa pagpapatakbo ng isang random na mekanismo na nagbibigay ng probability distribution na kailangan namin. Kaya para sa pagpapatupad ng una sa mga pinaghalong estratehiya, ang isang coin toss ay angkop na angkop. Pinipili ng manlalaro ang unang linya o ang pangalawa, depende sa kung paano nahuhulog ang barya. Sa karaniwan, parehong madalas na pipiliin ng manlalaro ang unang hilera at ang pangalawang hilera, ngunit ang pagpili sa isang partikular na pag-ulit ng laro ay hindi napapailalim sa anumang nakapirming panuntunan at may pinakamataas na antas ng pagiging lihim: bago ang pagpapatupad ng random na mekanismo , ito ay hindi kilala kahit sa pinakaunang manlalaro. Upang ipatupad ang pangalawang pinaghalong diskarte, ang mekanismo ng pagguhit ay angkop na angkop. Ang manlalaro ay kumukuha ng pitong magkaparehong piraso ng papel, minarkahan ang tatlo sa kanila ng isang krus, at itinapon ang mga ito sa sumbrero. Pagkatapos, nang random, kinuha niya ang isa sa kanila. Ayon sa classical probability theory, bubunutin niya ang isang pirasong papel na may krus na may posibilidad na 3/7, at isang malinis na piraso ng papel na may posibilidad na 4/7. Ang gayong mekanismo ng pagbubunot ay may kakayahang matanto ang anumang mga makatwirang probabilidad.

Hayaang sumunod ang mga manlalaro sa magkahalong estratehiya (2.18). Pagkatapos ang kabayaran ng unang manlalaro sa isang pag-ulit ng laro ay isang random na variable: v(X,Y). Dahil ang mga manlalaro ay pumipili ng mga estratehiya nang nakapag-iisa sa isa't isa, kung gayon, ayon sa probability multiplication theorem, ang posibilidad ng pagpili ng isang resulta (i, j) na may panalo ay katumbas ng produkto ng mga probabilidad . Pagkatapos ang batas ng pamamahagi ng random variable v(X,Y) ibinigay ng sumusunod na talahanayan

Ngayon hayaan ang laro na maglaro nang walang katapusan. Pagkatapos ang average na kabayaran sa naturang laro ay katumbas ng mathematical na inaasahan ng halaga v(X,Y).

(2.19)

Para sa isang may hangganan ngunit sapat na malaking bilang ng mga pag-ulit ng laro, ang average na kabayaran ay bahagyang mag-iiba mula sa halaga (2.19).

Halimbawa 4. Kalkulahin ang average na kabayaran (2.19) para sa laro mula sa halimbawa 3 kapag ginamit ng mga manlalaro ang mga sumusunod na diskarte: . Ang payoff matrix at ang probability matrix ay ang mga sumusunod:

Hanapin natin ang average:

Kaya, ang average na kabayaran (2.20) ay intermediate sa pagitan ng maximin at minimax.

Dahil para sa anumang pares ng magkahalong diskarte X at Y posible na kalkulahin ang average na halaga ng laro, kung gayon ang problema sa paghahanap ng pinakamainam na diskarte ay lumitaw. Natural na magsimula sa pamamagitan ng paggalugad ng mga maingat na estratehiya. Ang maingat na diskarte ng unang manlalaro ay nagbibigay sa kanya ng isang maximin. Ang maingat na diskarte ng pangalawang manlalaro ay hindi nagpapahintulot sa una na manalo ng higit sa minimax. Ang pinakamahalagang resulta sa teorya ng mga laro na may magkasalungat na interes ay maaaring isaalang-alang ang mga sumusunod:

Teorama. Ang bawat laro ng matrix ay may equilibrium na sitwasyon sa magkahalong diskarte. Ang patunay ng teorama na ito ay hindi madali. Ito ay tinanggal sa kursong ito.

Mga kahihinatnan: Ang pagkakaroon ng sitwasyon ng equilibrium ay nangangahulugan na ang maximin ay katumbas ng minimax, at samakatuwid ang anumang laro ng matrix ay may presyo. Ang pinakamainam na diskarte para sa unang manlalaro ay ang maximin na diskarte. Ang pinakamainam na diskarte ng pangalawa ay minimax. Dahil ang problema sa paghahanap ng pinakamainam na mga diskarte ay nalutas na, sinasabi namin na ang anumang laro ng matrix nalulusaw sa isang hanay ng mga pinaghalong estratehiya.

Solusyon ng laro 2x2

Halimbawa 5. Lutasin ang laro. Hindi mahirap i-verify na walang saddle point. Tukuyin ang pinakamainam na diskarte ng unang manlalaro (x, 1-x) ay isang column vector, ngunit para sa kaginhawahan isinusulat namin ito bilang isang string. Tukuyin ang pinakamainam na diskarte ng pangalawang manlalaro (y,1-y).

Ang kabayaran ng unang manlalaro ay isang random na variable na may sumusunod na pamamahagi:

v(x,y)	2	-1	-4	7
p	xy	x(1-y)	(1x)y	(1-x)(1-y)

Nahanap namin ang average na kabayaran para sa pag-ulit ng unang manlalaro - ang mathematical na inaasahan ng isang random na variable v(x,y):

Ibahin natin ang ekspresyong ito:

Ang pag-asa sa matematika na ito ay binubuo ng isang pare-pareho (5/7) at isang variable na bahagi: 14(x-11/14)(y-8/14). Kung ang halaga y iba sa 8/14, kung gayon ang unang manlalaro ay palaging makakapili X sa paraang gawing positibo ang variable na bahagi, pinapataas ang iyong mga panalo. Kung ang halaga X iba sa 11/14, kung gayon ang pangalawang manlalaro ay palaging makakapili y upang gawing negatibo ang variable na bahagi, na binabawasan ang kabayaran ng unang manlalaro. Kaya, ang saddle point ay tinukoy ng mga pagkakapantay-pantay: x*=11/14, y*=8/14.

2.5 Paglutas ng laro

Ang isang halimbawa ay magpapakita kung paano lutasin ang mga naturang laro.

Halimbawa 6. Lutasin ang laro . Tinitiyak namin na walang saddle point. Tukuyin ang pinaghalong diskarte ng unang manlalaro X=(x, 1-x) ay isang column vector, ngunit para sa kaginhawahan isinusulat namin ito bilang isang string.

Hayaang ilapat ng unang manlalaro ang diskarte X, at ang pangalawa - ang kanyang j-th purong diskarte. Ipahiwatig natin ang average na kabayaran ng unang manlalaro sa sitwasyong ito bilang . Meron kami:

Iguhit natin ang mga graph ng mga function (2.21) sa segment .

Ang ordinate ng isang punto na matatagpuan sa alinman sa mga segment ng linya ay tumutugma sa kabayaran ng unang manlalaro sa isang sitwasyon kung saan gumagamit siya ng magkahalong diskarte (x,(1-x)), at ang pangalawang manlalaro ang kaukulang purong diskarte. Ang garantisadong resulta ng unang manlalaro ay ang mas mababang sobre ng pamilya ng mga linya (sirang ABC). Ang pinakamataas na punto ng sirang linyang ito (puntong B) ay ang pinakamataas na garantisadong resulta ng manlalaro 1. Ang abscissa ng punto B ay tumutugma sa pinakamainam na diskarte ng unang manlalaro.

Dahil ang nais na punto B ay ang intersection ng mga linya at, kung gayon ang abscissa nito ay matatagpuan bilang isang solusyon sa equation:

Kaya, ang pinakamainam na pinaghalong diskarte ng unang manlalaro ay (5/9, 4/9). Ang ordinate ng point B ay ang presyo ng laro. Ito ay katumbas ng:

(2.22)

Tandaan na ang linya na tumutugma sa pangalawang diskarte ng pangalawang manlalaro ay pumasa sa itaas ng punto B. Nangangahulugan ito na kung ang unang manlalaro ay naglalapat ng kanyang pinakamainam na diskarte, at ang manlalaro 2 ay gumagamit ng pangalawa, ang pagkawala ng pangalawang manlalaro ay tataas kumpara sa paglalapat ng mga diskarte 1 o 3. Kaya, ang pangalawang diskarte ay hindi dapat lumahok sa pinakamainam na diskarte ng pangalawang manlalaro. Ang pinakamainam na diskarte para sa player 2 ay dapat na: . Ang mga purong diskarte 1 at 3 ng pangalawang manlalaro na may mga nonzero na bahagi sa pinakamainam na diskarte ay karaniwang tinatawag makabuluhan. Strategy 2 ang tawag hindi gaanong mahalaga. Mula sa figure sa itaas, pati na rin mula sa pagkakapantay-pantay (2.22), makikita na kapag inilapat ng unang manlalaro ang kanyang pinakamainam na diskarte, ang kabayaran ng pangalawang manlalaro ay hindi nakasalalay sa kung alin sa kanyang mahahalagang estratehiya ang kanyang ginagamit. Maaari rin niyang ilapat ang anumang pinaghalong diskarte na binubuo ng mahahalagang (sa partikular, pinakamainam), hindi rin magbabago ang kabayaran sa kasong ito. Ang isang ganap na kahalintulad na pahayag ay totoo rin para sa kabaligtaran na kaso. Kung ang pangalawang manlalaro ay gumagamit ng kanyang pinakamainam na diskarte, kung gayon ang kabayaran ng unang manlalaro ay hindi nakasalalay sa kung alin sa kanyang mga mahahalagang diskarte ang kanyang ginagamit at katumbas ng halaga ng laro. Gamit ang pahayag na ito, nakita namin ang pinakamainam na diskarte para sa pangalawang manlalaro.