Ang isang matrix ng mga ipinares na coefficient ng ugnayan ay ibinigay.

Upang matukoy ang antas ng pag-asa sa pagitan ng ilang mga tagapagpahiwatig, maraming coefficient ng ugnayan ang ginagamit. Pagkatapos ay ibubuod ang mga ito sa isang hiwalay na talahanayan, na tinatawag na correlation matrix. Ang mga pangalan ng mga row at column ng naturang matrix ay ang mga pangalan ng mga parameter na ang pagtitiwala sa isa't isa ay itinatag. Ang mga kaukulang coefficient ng ugnayan ay matatagpuan sa intersection ng mga row at column. Alamin natin kung paano ka makakagawa ng katulad na pagkalkula gamit ang mga tool sa Excel.

Nakaugalian na matukoy ang antas ng ugnayan sa pagitan ng iba't ibang mga tagapagpahiwatig tulad ng sumusunod, depende sa koepisyent ng ugnayan:

  • 0 - 0.3 - walang koneksyon;
  • 0.3 - 0.5 - mahinang koneksyon;
  • 0.5 - 0.7 - average na koneksyon;
  • 0.7 - 0.9 - mataas;
  • 0.9 - 1 - napakalakas.

Kung ang koepisyent ng ugnayan ay negatibo, nangangahulugan ito na ang relasyon ng mga parameter ay kabaligtaran.

Upang mag-compile ng correlation matrix sa Excel, isang tool ang ginagamit, kasama sa package "Pagsusuri sa datos". Yan ang tawag dun - "Kaugnayan". Alamin natin kung paano ito magagamit sa pagkalkula ng mga indicator maramihang ugnayan.

Hakbang 1: I-activate ang Analysis Pack

Dapat itong sabihin kaagad na ang default na pakete "Pagsusuri sa datos" may kapansanan. Samakatuwid, bago magpatuloy sa pamamaraan para sa direktang pagkalkula ng mga coefficient ng ugnayan, kailangan mong i-activate ito. Sa kasamaang palad, hindi alam ng bawat gumagamit kung paano ito gawin. Kaya naman, tututukan natin ang isyung ito.


Pagkatapos ng tinukoy na aksyon, ang tool package "Pagsusuri sa datos" ay isaaktibo.

Stage 2: pagkalkula ng koepisyent

Ngayon ay maaari kang pumunta nang direkta sa pagkalkula maramihang koepisyent mga ugnayan. Kalkulahin natin ang multiple correlation coefficient ng mga salik na ito gamit ang halimbawa ng talahanayan ng mga indicator ng labor productivity, capital-labor ratio at power-to-weight ratio sa iba't ibang negosyo.


Stage 3: pagsusuri ng resulta

Ngayon, alamin natin kung paano maunawaan ang resulta na nakuha natin sa proseso ng pagproseso ng data ng tool "Kaugnayan" sa Excel program.

Tulad ng nakikita natin mula sa talahanayan, ang koepisyent ng ugnayan ng ratio ng kapital-paggawa (Hanay 2) at ratio ng kapangyarihan-sa-timbang ( Hanay 1) ay 0.92, na tumutugma sa isang napakalakas na relasyon. Sa pagitan ng produktibidad ng paggawa ( Hanay 3) at ratio ng kapangyarihan-sa-timbang ( Hanay 1) ang tagapagpahiwatig na ito ay katumbas ng 0.72, na isang mataas na antas ng pagtitiwala. Koepisyent ng ugnayan sa pagitan ng produktibidad ng paggawa ( Hanay 3) at ratio ng kapital-paggawa ( Hanay 2) ay katumbas ng 0.88, na tumutugma din sa isang mataas na antas ng pag-asa. Kaya, maaari nating sabihin na ang relasyon sa pagitan ng lahat ng pinag-aralan na mga kadahilanan ay maaaring masubaybayan nang medyo malakas.

Tulad ng nakikita mo, ang pakete "Pagsusuri sa datos" sa Excel ay isang napaka-maginhawa at medyo madaling gamitin na tool para sa pagtukoy ng maramihang koepisyent ng ugnayan. Maaari rin itong gamitin upang kalkulahin ang karaniwang ugnayan sa pagitan ng dalawang salik.

Z 1 (t)

Z 2 (t)

t

y(t)

Z 1 (t)

Z 2 (t)

t

y(t)

Ang pangunahing gawain kapag pumipili ng mga kadahilanan na kasama sa modelo ng ugnayan ay isama sa pagsusuri ang lahat ng mga pangunahing kadahilanan na nakakaapekto sa antas ng hindi pangkaraniwang bagay na pinag-aaralan. Gayunpaman, hindi ipinapayong ipasok ang isang malaking bilang ng mga kadahilanan sa modelo; mas tama na pumili lamang ng isang medyo maliit na bilang ng mga pangunahing kadahilanan na maaaring may kaugnayan sa napiling tagapagpahiwatig ng pagganap.

Magagawa ito gamit ang tinatawag na two-stage selection. Alinsunod dito, ang lahat ng paunang napiling mga kadahilanan ay kasama sa modelo. Pagkatapos sa kanila, sa batayan ng isang espesyal quantification at dagdag na pagsusuri ng husay, natutukoy ang mga hindi gaanong nakakaimpluwensyang mga salik, na unti-unting itinatapon hanggang sa may mga patungkol sa kung saan maaari itong maipangatuwiran na ang magagamit na istatistikal na materyal ay naaayon sa hypothesis ng kanilang magkasanib na makabuluhang epekto sa dependent variable na may napiling anyo ng relasyon .

Ang pagpili ng dalawang yugto ay nakatanggap ng pinakakumpletong pagpapahayag nito sa pamamaraan ng tinatawag na multi-stage regression analysis, kung saan ang pag-aalis ng mga hindi gaanong kahalagahan ay nangyayari batay sa kanilang mga tagapagpahiwatig ng kahalagahan, lalo na, batay sa halaga ng t f - ang kinakalkula na halaga ng pamantayan ng Mag-aaral.

Kalkulahin ang t f ayon sa nakitang pares na coefficient ng ugnayan at ihambing ang mga ito sa t kritikal para sa 5% na antas ng kabuluhan (two-sided) at 18 degrees ng kalayaan (ν = n-2).

kung saan ang r ay ang halaga ng coefficient ng ugnayan ng pares;

n – bilang ng mga obserbasyon (n=20)

Kapag inihambing ang t f para sa bawat koepisyent sa t kr = 2,101 nakuha namin na ang mga nahanap na coefficient ay kinikilala bilang makabuluhan, dahil t f > t cr.

t f para sa r yx 1 = 2, 5599 ;

t f para sa r yx 2 = 7,064206 ;

t f para sa r yx 3 = 2,40218 ;

t f para sa r x1 x 2 = 4,338906 ;

t f para sa r x1 x 3 = 15,35065;

t f para sa r x2 x 3 = 4,749981

Kapag pumipili ng mga salik na kasama sa pagsusuri, napapailalim sila sa mga partikular na kinakailangan. Una sa lahat, ang mga tagapagpahiwatig na nagpapahayag ng mga salik na ito ay dapat na quantifiable.

Ang mga salik na kasama sa modelo ay hindi dapat nasa isang functional o malapit na kaugnayan sa isa't isa. Ang pagkakaroon ng naturang mga bono ay nailalarawan sa pamamagitan ng multicollinearity.

Ang multicollinearity ay nagpapahiwatig na ang ilang mga kadahilanan ay nagpapakita ng parehong bahagi ng kababalaghan na pinag-aaralan. Samakatuwid, ang kanilang sabay-sabay na pagsasama sa modelo ay hindi praktikal, dahil duplicate nila ang isa't isa sa isang tiyak na lawak. Kung walang mga espesyal na pagpapalagay na nagsasalita pabor sa isa sa mga salik na ito, ang kagustuhan ay dapat ibigay sa isa sa mga ito, na kung saan ay nailalarawan sa pamamagitan ng isang malaking koepisyent ng pares (o bahagyang) ugnayan.

Ito ay pinaniniwalaan na ang limitasyon ng halaga ay ang halaga ng koepisyent ng ugnayan sa pagitan ng dalawang salik, katumbas ng 0.8.

Ang multicollinearity ay karaniwang humahantong sa pagkabulok ng matrix ng mga variable at, dahil dito, sa katotohanan na ang pangunahing determinant ay bumababa sa halaga nito at, sa limitasyon, ay nagiging malapit sa zero. Ang mga pagtatantya ng mga coefficient ng regression equation ay lubos na nakadepende sa katumpakan ng paghahanap ng paunang data at mabilis na nagbabago ang kanilang mga halaga kapag nagbago ang bilang ng mga obserbasyon.

1. MAGBUO NG MATRIX NG COEFFICIENTS NG PAIR CORRELATION.

Upang gawin ito, kinakalkula namin ang mga coefficient ng ugnayan ng pares gamit ang formula:

Ang mga kinakailangang kalkulasyon ay ipinakita sa Talahanayan 9.

-

ang ugnayan sa pagitan ng kita ng negosyo Y at ang dami ng mga pamumuhunan sa kapital X 1 ay mahina at direkta;

-

halos walang koneksyon sa pagitan ng kita ng enterprise Y at fixed production asset X 2;

-

ang koneksyon sa pagitan ng dami ng mga pamumuhunan sa kapital X 1 at mga fixed production asset X 2 ay malapit at direkta;

Talahanayan 9

Pantulong na talahanayan para sa pagkalkula ng mga coefficient ng ugnayan ng pares

t Y X1 X2

(y-yavg)*
(x1-x1sr)

(y-yavg)*
(x2-x2sr)

(х1-х1ср)*
(x2-x2sr)

1998 3,0 1,1 0,4 0,0196 0,0484 0,0841 0,0308 0,0406 0,0638
1999 2,9 1,1 0,4 0,0576 0,0484 0,0841 0,0528 0,0696 0,0638
2000 3,0 1,2 0,7 0,0196 0,0144 1E-04 0,0168 -0,0014 -0,0012
2001 3,1 1,4 0,9 0,0016 0,0064 0,0441 -0,0032 -0,0084 0,0168
2002 3,2 1,4 0,9 0,0036 0,0064 0,0441 0,0048 0,0126 0,0168
2003 2,8 1,4 0,8 0,1156 0,0064 0,0121 -0,0272 -0,0374 0,0088
2004 2,9 1,3 0,8 0,0576 0,0004 0,0121 0,0048 -0,0264 -0,0022
2005 3,4 1,6 1,1 0,0676 0,0784 0,1681 0,0728 0,1066 0,1148
2006 3,5 1,3 0,4 0,1296 0,0004 0,0841 -0,0072 -0,1044 0,0058
2007 3,6 1,4 0,5 0,2116 0,0064 0,0361 0,0368 -0,0874 -0,0152
Σ 31,4 13,2 6,9 0,684 0,216 0,569 0,182 -0,036 0,272
Avg. 3,14 1,32 0,69

Gayundin, ang matrix ng mga pares na coefficient ng ugnayan ay matatagpuan sa kapaligiran ng Excel gamit ang DATA ANALYSIS add-in, ang CORRELATION tool.

Ang matrix ng mga coefficient ng ugnayan ng pares ay:

Y X1 X2
Y 1
X1 0,4735 1
X2 -0,0577 0,7759 1

Ang matrix ng mga paired correlation coefficients ay nagpapakita na ang epektibong attribute y (kita) ay may mahinang koneksyon sa dami ng capital investments x 1, at halos walang koneksyon sa laki ng OPF. Ang ugnayan sa pagitan ng mga kadahilanan sa modelo ay tinatantya bilang malapit, na nagpapahiwatig ng kanilang linear dependence, multicollinearity.

2. MAGBUO NG LINEAR MULTIPLE REGRESSION MODEL

Hahanapin natin ang mga parameter ng modelo gamit ang paraan ng least squares. Upang gawin ito, bumubuo kami ng isang sistema ng mga normal na equation.

Ang mga kalkulasyon ay ipinakita sa talahanayan 10.

Lutasin natin ang sistema ng mga equation gamit ang paraan ng Cramer:

Talahanayan 10

Mga pantulong na kalkulasyon para sa paghahanap ng mga parameter ng isang linear na modelo maramihang pagbabalik

y
3,0 1,1 0,4 1,21 0,44 0,16 3,3 1,2
2,9 1,1 0,4 1,21 0,44 0,16 3,19 1,16
3,0 1,2 0,7 1,44 0,84 0,49 3,6 2,1
3,1 1,4 0,9 1,96 1,26 0,81 4,34 2,79
3,2 1,4 0,9 1,96 1,26 0,81 4,48 2,88
2,8 1,4 0,8 1,96 1,12 0,64 3,92 2,24
2,9 1,3 0,8 1,69 1,04 0,64 3,77 2,32
3,4 1,6 1,1 2,56 1,76 1,21 5,44 3,74
3,5 1,3 0,4 1,69 0,52 0,16 4,55 1,4
3,6 1,4 0,5 1,96 0,7 0,25 5,04 1,8
31,4 13,2 6,9 17,64 9,38 5,33 41,63 21,63

Ang linear na modelo ng maramihang regression ay may anyo:

Kung ang dami ng mga pamumuhunan sa kapital ay nadagdagan ng 1 milyong rubles, kung gayon ang kita ng kumpanya ay tataas ng isang average ng 2.317 milyong rubles. na may mga nakapirming laki ng mga fixed production asset.

Kung ang pangunahing mga asset ng produksyon ay nadagdagan ng 1 milyong rubles, ang kita ng kumpanya ay bababa ng isang average ng 1.171 milyong rubles. na may parehong halaga ng pamumuhunan.

3. KINUKULANG NAMIN:

koepisyent ng pagpapasiya:

Ang 67.82% ng pagbabago sa kita ng kumpanya ay dahil sa pagbabago sa dami ng mga pamumuhunan sa kapital at mga fixed production asset, ng 32.18% - ang impluwensya ng mga salik na hindi kasama sa modelo.

F - Pamantayan ng Fisher

Suriin natin ang kahalagahan ng equation

Ang tabular na halaga ng F ay isang pamantayan sa antas ng kahalagahan na α = 0.05 at ang bilang ng mga antas ng kalayaan d.f. 1 = k = 2 (bilang ng mga salik), bilang ng antas ng kalayaan d.f. 2 \u003d (n - k - 1) \u003d (10 - 2 - 1) \u003d 7 ay magiging 4.74.

Dahil ang F calc. = 7.375 > F tab. = 4.74, kung gayon ang regression equation sa kabuuan ay maituturing na makabuluhang istatistika.

Ang mga kalkuladong indicator ay makikita sa Excel environment gamit ang DATA ANALYSIS add-in, ang REGRESSION tool.


Talahanayan 11

Mga pantulong na kalkulasyon para sa paghahanap ng average kamag-anak na pagkakamali mga pagtatantya

y PERO
3,0 1,1 0,4 2,97 0,03 0,010
2,9 1,1 0,4 2,97 -0,07 0,024
3,0 1,2 0,7 2,85 0,15 0,050
3,1 1,4 0,9 3,08 0,02 0,007
3,2 1,4 0,9 3,08 0,12 0,038
2,8 1,4 0,8 3,20 -0,40 0,142
2,9 1,3 0,8 2,96 -0,06 0,022
3,4 1,6 1,1 3,31 0,09 0,027
3,5 1,3 0,4 3,43 0,07 0,019
3,6 1,4 0,5 3,55 0,05 0,014
0,353

average na relatibong error sa pagtatantya

Sa karaniwan, ang mga kinakalkula na halaga ay naiiba mula sa aktwal na mga halaga ng 3.53%. Ang error ay maliit, ang modelo ay maaaring ituring na tumpak.

4. Bumuo ng power model ng multiple regression

Upang mabuo ang modelong ito, kinukuha namin ang logarithm ng magkabilang panig ng pagkakapantay-pantay

lg y = lg a + β 1 ∙ lg x 1 + β 2 ∙ lg x 2 .

Gawin natin ang pagbabago Y = lg y, A = lg a, X 1 = lg x 1 , X 2 = lg x 2 .

Pagkatapos ang Y = A + β 1 ∙ X 1 + β 2 ∙ X 2 ay isang linear two-factor regression model. Maaaring mag-apply ang MNC.

Ang mga kalkulasyon ay ipinakita sa talahanayan 12.

Talahanayan 12

Mga pantulong na kalkulasyon para sa paghahanap ng mga parameter ng power model ng multiple regression

y lg y
3,0 1,1 0,4 0,041 -0,398 0,477 0,002 -0,016 0,020 0,158 -0,190
2,9 1,1 0,4 0,041 -0,398 0,462 0,002 -0,016 0,019 0,158 -0,184
3,0 1,2 0,7 0,079 -0,155 0,477 0,006 -0,012 0,038 0,024 -0,074
3,1 1,4 0,9 0,146 -0,046 0,491 0,021 -0,007 0,072 0,002 -0,022
3,2 1,4 0,9 0,146 -0,046 0,505 0,021 -0,007 0,074 0,002 -0,023
2,8 1,4 0,8 0,146 -0,097 0,447 0,021 -0,014 0,065 0,009 -0,043
2,9 1,3 0,8 0,114 -0,097 0,462 0,013 -0,011 0,053 0,009 -0,045
3,4 1,6 1,1 0,204 0,041 0,531 0,042 0,008 0,108 0,002 0,022
3,5 1,3 0,4 0,114 -0,398 0,544 0,013 -0,045 0,062 0,158 -0,217
3,6 1,4 0,5 0,146 -0,301 0,556 0,021 -0,044 0,081 0,091 -0,167
31,4 13,2 6,9 1,178 -1,894 4,955 0,163 -0,165 0,592 0,614 -0,943

Nilulutas namin ang sistema ng mga equation gamit ang paraan ng Cramer.

Ang power model ng multiple regression ay may anyo:

AT function ng kapangyarihan ang mga coefficient sa mga salik ay ang mga coefficients ng elasticity. Ang koepisyent ng pagkalastiko ay nagpapakita kung gaano karaming porsyento ang halaga ng epektibong katangiang y ay magbabago sa karaniwan kung ang isa sa mga kadahilanan ay tumaas ng 1% na ang halaga ng iba pang mga kadahilanan ay hindi nagbabago.

Kung ang dami ng mga pamumuhunan sa kapital ay nadagdagan ng 1%, ang kita ng kumpanya ay tataas ng average na 0.897% na may parehong laki ng mga fixed production asset.

Kung ang mga fixed production asset ay tataas ng 1%, ang kita ng kumpanya ay bababa ng 0.226% na may hindi nabagong capital investments.

5. KINUKULANG NAMIN:

maramihang koepisyent ng ugnayan:

Ang koneksyon sa pagitan ng kita ng negosyo at ang dami ng mga pamumuhunan sa kapital at mga fixed production asset ay malapit na.

Talahanayan 13

Mga pantulong na kalkulasyon para sa paghahanap ng koepisyent ng maramihang ugnayan, ang koepisyent ng pagpapasiya, ang average na kamag-anak na error ng approximation ng power model ng multiple regression

Y

(Y-Y calc.) 2

A
3,0 1,1 0,4 2,978 0,000 0,020 0,007
2,9 1,1 0,4 2,978 0,006 0,058 0,027
3,0 1,2 0,7 2,838 0,026 0,020 0,054
3,1 1,4 0,9 3,079 0,000 0,002 0,007
3,2 1,4 0,9 3,079 0,015 0,004 0,038
2,8 1,4 0,8 3,162 0,131 0,116 0,129
2,9 1,3 0,8 2,959 0,003 0,058 0,020
3,4 1,6 1,1 3,317 0,007 0,068 0,024
3,5 1,3 0,4 3,460 0,002 0,130 0,012
3,6 1,4 0,5 3,516 0,007 0,212 0,023
31,4 13,2 6,9 0,198 0,684 0,342

koepisyent ng pagpapasiya:

71.06% ng pagbabago sa kita ng kumpanya sa power-law model ay dahil sa pagbabago sa dami ng capital investments at fixed production asset, ng 28.94% - ang impluwensya ng mga salik na hindi kasama sa modelo.

F - Pamantayan ng Fisher

Suriin natin ang kahalagahan ng equation

Ang tabular na halaga ng F ay isang pamantayan sa antas ng kahalagahan na α = 0.05 at ang bilang ng mga antas ng kalayaan d.f. 1 = k = 2, bilang ng mga antas ng kalayaan d.f. 2 \u003d (n - k - 1) \u003d (10 - 2 - 1) \u003d 7 ay magiging 4.74.

Dahil ang F calc. = 8.592 > F tab. = 4.74, kung gayon ang power regression equation sa kabuuan ay maituturing na makabuluhang istatistika.

Imposible ang landing, kung saan ang pagkonsumo ng gasolina ay mas mababa. Kumuha ng pinakamainam na programa ng kontrol kapag walang kontrol hanggang sa ilang oras t1 u*=0, at simula sa t=t1, ang kontrol ay katumbas ng pinakamataas na halaga nito u*=umax, na tumutugma sa pinakamababang pagkonsumo ng gasolina. 6.) Lutasin ang canonical system ng mga equation, isinasaalang-alang ito para sa mga kaso kung saan at kontrolin ...

Sa compilation ng mathematical models. Kung ang isang modelo ng matematika ay isang diagnosis ng isang sakit, kung gayon ang isang algorithm ay isang paraan ng paggamot. Ang mga sumusunod na pangunahing yugto ng pagsasaliksik sa pagpapatakbo ay maaaring makilala: pagmamasid sa kababalaghan at pagkolekta ng paunang data; pagbabalangkas ng problema; pagbuo ng isang modelo ng matematika; pagkalkula ng modelo; pagsubok sa modelo at pagsusuri sa output data. Kung hindi kasiya-siya ang resulta...

Ang mga konstruksyon ng matematika sa pamamagitan ng pagkakatulad na may nagpapakita sa isang patag na pagtatantya ng isang longitudinal-scalar electromagnetic wave na may electric - (28) at magnetic (29) in-phase na mga bahagi. Matematikal na modelo Ang irrotational electrodynamics ay nailalarawan sa pamamagitan ng scalar-vector na istraktura ng mga equation nito. Ang mga pangunahing equation ng irrotational electrodynamics ay ibinubuod sa Talahanayan 1. Talahanayan 1, ...

1. Kalkulahin ang matrix ng mga ipinares na coefficient ng ugnayan; pag-aralan ang higpit at direksyon ng relasyon ng nagresultang tampok Y sa bawat isa sa mga kadahilanan. X; tantiyahin istatistikal na kahalagahan mga coefficient ng ugnayan r(Y,X i); piliin ang pinaka-kaalaman na kadahilanan.

2. Bumuo ng isang ipinares na modelo ng regression na may pinakamaraming kadahilanan; magbigay ng pang-ekonomiyang interpretasyon ng regression coefficient.

3. Suriin ang kalidad ng modelo gamit ang average na kamag-anak na error ng approximation, ang koepisyent ng determinasyon at F - Fisher's criterion (kunin ang antas ng kahalagahan α = 0.05).

4. May posibilidad ng kumpiyansa γ=80% upang mahulaan ang average na halaga ng indicator Y(Ang mga halaga ng pagtataya ng mga kadahilanan ay ibinibigay sa Appendix 6). Ipakita ang aktwal na graphically at mga halaga ng modelo Y, mga resulta ng hula.

5. Gamit ang paraan ng pagsasama, bumuo ng dalawang-factor na mga modelo, na pinapanatili ang pinaka-kaalaman na kadahilanan sa mga ito; bumuo ng isang three-factor model na may kumpletong listahan mga kadahilanan.

6. Piliin ang pinakamahusay sa mga binuong maramihang mga modelo. Magbigay ng pang-ekonomiyang interpretasyon ng mga coefficient nito.

7. Suriin ang kahalagahan ng multiple regression coefficients gamit t–Pagsusulit ng mag-aaral (tanggapin ang antas ng kahalagahan α=0.05). Napabuti ba ang kalidad ng maramihang modelo kumpara sa pares na modelo?

8. Tayahin ang impluwensya ng mga salik sa resulta gamit ang elasticity coefficients, beta at delta coefficients.

Gawain 2. Pagmomodelo ng one-dimensional na time series

Ipinapakita ng Appendix 7 ang serye ng oras Y(t) socio-economic indicator para sa Teritoryo ng Altai para sa panahon mula 2000 hanggang 2011. Kinakailangang pag-aralan ang dynamics ng indicator na naaayon sa variant ng gawain.

Pagpipilian Pagtatalaga, pangalan, yunit ng pagsukat ng tagapagpahiwatig
Y1 Average na paggasta ng consumer per capita (bawat buwan), kuskusin.
Y2 Ang mga emisyon ng mga pollutant sa hangin sa atmospera, libong tonelada
Y3 Average na mga presyo sa pangalawang merkado ng pabahay (sa katapusan ng taon, para sa metro kwadrado kabuuang lugar), kuskusin
Y4 Dami mga bayad na serbisyo per capita, kuskusin
Y5 Average na taunang bilang ng mga taong nagtatrabaho sa ekonomiya, libong tao
Y6 Bilang ng sarili mga sasakyan bawat 1000 tao (sa katapusan ng taon), mga piraso
Y7 Average na per capita cash na kita (bawat buwan), kuskusin
Y8 Index ng presyo ng consumer (Disyembre hanggang Disyembre ng nakaraang taon), %
Y9 Mga pamumuhunan sa mga fixed asset (sa aktwal na presyo), milyong rubles
Y10 turnover tingi per capita (sa aktwal na mga presyo), kuskusin


Order sa trabaho

1. Bumuo ng isang linear na modelo ng serye ng oras, na ang mga parameter ay tinatantya ng pinakamaliit na mga parisukat. Ipaliwanag ang kahulugan ng regression coefficient.

2. Tayahin ang kasapatan ng itinayong modelo gamit ang mga katangian ng randomness, pagsasarili, at pagsunod ng natitirang bahagi sa normal na batas sa pamamahagi.

3. Suriin ang katumpakan ng modelo batay sa paggamit ng average na error sa pagtatantya ng kamag-anak.

4. Upang isagawa ang pagtataya ng itinuturing na tagapagpahiwatig para sa susunod na taon (kalkulahin ang agwat ng pagtataya sa antas ng kumpiyansa 70%).

5. Ipakita sa graphically ang aktwal na mga halaga ng indicator, ang mga resulta ng pagmomodelo at pagtataya.

6. Kalkulahin ang mga parameter ng logarithmic, polynomial (polynomial ng 2nd degree), power, exponential at hyperbolic trend. Batay graphic na larawan at ang halaga ng index ng pagpapasiya, piliin ang pinaka-angkop na uri ng trend.

7. Sa tulong ng pinakamahusay na non-linear na modelo, upang isagawa ang point forecasting ng itinuturing na indicator para sa susunod na taon. Ihambing ang resulta na nakuha sa predictive confidence interval na binuo gamit ang linear na modelo.

HALIMBAWA

Mga nagawa kontrol sa trabaho

Gawain 1

Ang kumpanya ay nagbebenta ng mga ginamit na kotse. Ang mga pangalan ng mga indicator at paunang data para sa econometric modeling ay ipinakita sa talahanayan:

Presyo ng pagsasakatuparan, libo c.u. ( Y) Ang presyo ng bagong kotse, thousand c.u. ( X1) Buhay ng serbisyo, taon ( X2) Kaliwang kamay na drive - 1, kanang kamay na drive - 0, ( X3)
8,33 13,99 3,8
10,40 19,05 2,4
10,60 17,36 4,5
16,58 25,00 3,5
20,94 25,45 3,0
19,13 31,81 3,5
13,88 22,53 3,0
8,80 16,24 5,0
13,89 16,54 2,0
11,03 19,04 4,5
14,88 22,61 4,6
20,43 27,56 4,0
14,80 22,51 3,3
26,05 31,75 2,3

Kailangan:

1. Kalkulahin ang matrix ng mga ipinares na coefficient ng ugnayan; pag-aralan ang higpit at direksyon ng relasyon ng nagresultang tampok na Y sa bawat isa sa mga kadahilanan X; suriin ang statistical significance ng correlation coefficients r(Y, X i); piliin ang pinaka-kaalaman na kadahilanan.

Paggamit ng Excel (Data / Data Analysis / CORRELATION):

Kumuha tayo ng isang matrix ng mga pares na coefficient ng ugnayan sa pagitan ng lahat ng magagamit na mga variable:

Sa X1 X2 X3
Sa
X1 0,910987
X2 -0,4156 -0,2603
X3 0,190785 0,221927 -0,30308

Suriin natin ang mga koepisyent ng ugnayan sa pagitan ng nagresultang tampok Y at bawat isa sa mga kadahilanan X j:

> 0, samakatuwid, sa pagitan ng mga variable Y at X 1 mayroong direktang ugnayan: kung mas mataas ang presyo ng isang bagong kotse, mas mataas ang presyo ng pagbebenta.

> 0.7 - malapit na ang pagtitiwala na ito.

< 0, значит, между переменными Y at X 2 naobserbahan

kabaligtaran na ugnayan: ang presyo ng pagbebenta ay mas mababa para sa auto-

mga mobile phone na may mahabang buhay ng serbisyo.

– ang pag-asa na ito ay katamtaman, mas malapit sa mahina.

> 0, kaya sa pagitan ng mga variable Y at X Ang 3 ay nagpapakita ng direktang ugnayan: ang presyo ng pagbebenta ay mas mataas para sa mga left-hand drive na kotse.

< 0,4 – эта зависимость слабая.

Upang suriin ang kahalagahan ng mga natagpuang koepisyent ng ugnayan, ginagamit namin ang pagsusulit ng Mag-aaral.

Para sa bawat koepisyent ng ugnayan magcompute t-mga istatistika sa pamamagitan ng formula at ilagay ang mga resulta ng pagkalkula sa isang karagdagang column ng talahanayan ng ugnayan:

Sa X1 X2 X3 t-istatistika
Sa
X1 0,910987 7,651524603
X2 -0,4156 -0,2603 1,582847988
X3 0,190785 0,221927 -0,30308 0,673265587

Ayon sa talahanayan kritikal na mga punto Mga pamamahagi ng mag-aaral sa antas ng kahalagahan at ang bilang ng mga antas ng kalayaan na ating tinukoy kritikal na halaga(Appendix 1, o STEUDRESPOINT function).Y at buhay ng serbisyo X 2 ay maaasahan.

< , следовательно, коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой реализации Y at posisyon ng manibela X 3 ay maaasahan.

Kaya, ang pinakamalapit at pinaka makabuluhang relasyon ay sinusunod sa pagitan ng presyo ng pagbebenta Y at ang presyo ng isang bagong kotse X isa ; salik X 1 ang pinaka-kaalaman.

Ang koepisyent ng ugnayan ay sumasalamin sa antas ng ugnayan sa pagitan ng dalawang tagapagpahiwatig. Palaging tumatagal ng isang halaga mula -1 hanggang 1. Kung ang koepisyent ay matatagpuan malapit sa 0, pagkatapos ay sinasabi nila na walang koneksyon sa pagitan ng mga variable.

Kung ang halaga ay malapit sa isa (mula sa 0.9, halimbawa), mayroong isang malakas na direktang ugnayan sa pagitan ng mga naobserbahang bagay. Kung ang koepisyent ay malapit sa iba pang matinding punto ng hanay (-1), kung gayon mayroong isang malakas na kabaligtaran na ugnayan sa pagitan ng mga variable. Kapag ang halaga ay nasa pagitan ng 0 hanggang 1 o 0 hanggang -1, kung gayon nag-uusap kami tungkol sa mahinang koneksyon (direkta o baligtad). Ang relasyon na ito ay karaniwang hindi isinasaalang-alang: ito ay isinasaalang-alang na ito ay hindi umiiral.

Pagkalkula ng koepisyent ng ugnayan sa Excel

Isaalang-alang, halimbawa, ang mga pamamaraan para sa pagkalkula ng koepisyent ng ugnayan, mga tampok ng direkta at kabaligtaran na relasyon sa pagitan ng mga variable.

Mga halaga ng mga tagapagpahiwatig x at y:

Ang Y ay ang malayang variable, ang x ay ang dependent variable. Ito ay kinakailangan upang mahanap ang lakas (malakas / mahina) at ang direksyon (pasulong / pabalik) ng relasyon sa pagitan nila. Ang formula para sa correlation coefficient ay ganito:


Upang gawing simple ang pag-unawa nito, hahati-hatiin natin ito sa ilang simpleng elemento.

Mayroong isang malakas na direktang ugnayan sa pagitan ng mga variable.

Ang built-in na CORREL function ay umiiwas sa mga kumplikadong kalkulasyon. Kalkulahin natin ang coefficient ng correlation ng pares sa Excel gamit ito. Tinatawag namin ang master of functions. Nahanap namin ang kailangan namin. Ang mga argumento ng function ay isang hanay ng mga halaga ng y at isang hanay ng mga halaga ng x:

Ipakita natin ang mga halaga ng mga variable sa tsart:


Mayroong isang malakas na relasyon sa pagitan ng y at x, dahil Ang mga linya ay tumatakbo halos parallel sa bawat isa. Direkta ang relasyon: pagtaas ng y - pagtaas ng x, pagbaba ng y - pagbaba ng x.



Matrix ng Pairwise Correlation Coefficients sa Excel

Ang correlation matrix ay isang table, sa intersection ng mga row at column kung saan mayroong mga correlation coefficient sa pagitan ng mga kaukulang halaga. Makatuwirang itayo ito para sa ilang mga variable.

Ang matrix ng correlation coefficients sa Excel ay binuo gamit ang "Correlation" tool mula sa "Data Analysis" package.


Ang isang malakas na direktang relasyon ay natagpuan sa pagitan ng mga halaga ng y at x1. Mayroong malakas na feedback sa pagitan ng x1 at x2. Halos walang koneksyon sa mga halaga sa haligi ng x3.