Ano ang kakanyahan ng pamantayan ng Fisher. Fisher's test at Fisher's quotient para sa isang multiple regression equation

)

Pagkalkula ng criterion φ*

1. Tukuyin ang mga halaga ng katangian na magiging pamantayan para sa paghahati ng mga paksa sa mga "may epekto" at sa mga "walang epekto". Kung ang katangian ay binibilang, gamitin ang λ criterion upang mahanap ang pinakamainam na split point.

2. Gumuhit ng talahanayan na may apat na cell (kasingkahulugan: apat na patlang) ng dalawang column at dalawang row. Ang unang column ay "may epekto"; ang pangalawang hanay ay "walang epekto"; unang linya mula sa itaas - 1 pangkat (sample); ang pangalawang linya - 2 pangkat (sample).

4. Bilangin ang bilang ng mga paksa sa unang sample na may "walang epekto", at ilagay ang numerong ito sa kanang itaas na cell ng talahanayan. Kalkulahin ang kabuuan ng dalawang nangungunang mga cell. Dapat itong tumugma sa bilang ng mga paksa sa unang pangkat.

6. Bilangin ang bilang ng mga paksa sa pangalawang sample na may "walang epekto", at ilagay ang numerong ito sa kanang ibabang cell ng talahanayan. Kalkulahin ang kabuuan ng dalawang ilalim na mga cell. Dapat itong tumugma sa bilang ng mga paksa sa pangalawang pangkat (sample).

7. Tukuyin ang porsyento ng mga paksa na "may epekto" sa pamamagitan ng pagtukoy sa kanilang bilang kabuuan mga paksa sa pangkat na ito (sample). Itala ang mga nagresultang porsyento sa kaliwang itaas at kaliwang ibabang mga cell ng talahanayan sa mga panaklong, ayon sa pagkakabanggit, upang hindi malito ang mga ito sa mga ganap na halaga.

8. Suriin kung ang isa sa mga katugmang porsyento ay katumbas ng zero. Kung ito ang kaso, subukang baguhin ito sa pamamagitan ng paglipat ng split point ng mga grupo sa isang gilid o sa isa pa. Kung ito ay imposible o hindi kanais-nais, itapon ang φ* criterion at gamitin ang χ2 criterion.

9. Tukuyin ayon sa Talahanayan. XII Appendix 1 ang mga halaga ng mga anggulo φ para sa bawat isa sa mga inihambing na porsyento.

kung saan: φ1 - ang anggulo na tumutugma sa mas malaking porsyento;

φ2 - anggulo na naaayon sa isang mas maliit na porsyento;

N1 - bilang ng mga obserbasyon sa sample 1;

N2 - bilang ng mga obserbasyon sa sample 2.

11. Ihambing ang nakuhang halaga φ* sa mga kritikal na halaga: φ* ≤1.64 (p<0,05) и φ* ≤2,31 (р<0,01).

Kung φ*emp ≤φ*cr. Ang H0 ay tinanggihan.

Kung kinakailangan, tukuyin ang eksaktong antas ng kahalagahan ng nakuhang φ*emp ayon sa Talahanayan. XIII Apendise 1.

Ang pamamaraang ito ay inilarawan sa maraming mga manwal (Plokhinsky N.A., 1970; Gubler E.V., 1978; Ivanter E.V., Korosov A.V., 1992, atbp.) Ang paglalarawang ito ay batay sa bersyon ng pamamaraan na binuo at ipinakita ng E.V. Gubler.

Layunin ng criterion φ*

Ang pagsusulit ni Fisher ay idinisenyo upang ihambing ang dalawang sample ayon sa dalas ng paglitaw ng isang epekto (tagapagpahiwatig) ng interes sa mananaliksik. Kung mas malaki ito, mas maaasahan ang mga pagkakaiba.

Paglalarawan ng criterion

Sinusuri ng criterion ang pagiging maaasahan ng mga pagkakaiba sa pagitan ng mga porsyentong iyon ng dalawang sample kung saan nakarehistro ang epekto (tagapagpahiwatig) ng interes sa amin. Sa matalinghagang pagsasalita, ikinukumpara namin ang 2 pinakamahusay na piraso na pinutol mula sa 2 pie sa isa't isa at nagpapasya kung alin ang talagang mas malaki.

Ang kakanyahan ng pagbabagong angular ng Fisher ay ang conversion ng mga porsyento sa mga gitnang anggulo, na sinusukat sa mga radian. Ang isang mas malaking porsyento ay tumutugma sa isang mas malaking anggulo φ, at isang mas maliit na porsyento ay tumutugma sa isang mas maliit na anggulo, ngunit ang mga relasyon dito ay hindi linear:

kung saan ang P ay isang porsyento na ipinahayag sa mga fraction ng isang yunit (tingnan ang Fig. 5.1).

Sa pagtaas ng pagkakaiba sa pagitan ng mga anggulo φ 1 at φ 2 at isang pagtaas sa bilang ng mga sample, ang halaga ng criterion ay tumataas. Kung mas malaki ang halaga ng φ*, mas malamang na makabuluhan ang mga pagkakaiba.

Hypotheses

H 0 : Bahagi ng mga tao, na nagpapakita ng epekto sa ilalim ng pag-aaral, sa sample 1 na hindi hihigit sa sample 2.

H 1 : Ang proporsyon ng mga taong nagpapakita ng epekto sa ilalim ng pag-aaral ay mas malaki sa sample 1 kaysa sa sample 2.

Graphical na representasyon ng isang criterion φ*

Ang paraan ng pagbabagong angular ay medyo mas abstract kaysa sa iba pang pamantayan.

Ang formula na sinusunod ni E. V. Gubler kapag kinakalkula ang mga halaga ng φ ay ipinapalagay na ang 100% ay ang anggulo φ=3.142, iyon ay, ang bilugan na halaga π=3.14159... Ito ay nagpapahintulot sa amin na kumatawan sa mga inihambing na sample sa anyo ng dalawang kalahating bilog, na ang bawat isa ay sumisimbolo sa 100% ng bilang ng kanilang sample. Ang mga porsyento ng mga paksang may "epekto" ay ipapakita bilang mga sektor na nabuo ng mga gitnang anggulo φ. Sa Fig. Ang Figure 5.2 ay nagpapakita ng dalawang kalahating bilog na naglalarawan ng Halimbawa 1. Sa unang sample, 60% ng mga paksa ang nalutas ang problema. Ang porsyentong ito ay tumutugma sa anggulo φ=1.772. Sa pangalawang sample, 40% ng mga paksa ang nalutas ang problema. Ang porsyentong ito ay tumutugma sa anggulo φ =1.369.

Ginagawang posible ng φ* criterion na matukoy kung ang isa sa mga anggulo ay higit na mataas sa istatistika kaysa sa isa para sa mga ibinigay na laki ng sample.

Mga paghihigpit sa pamantayan φ*

1. Wala sa mga pinaghahambing na bahagi ang dapat na katumbas ng zero. Sa pormal na paraan, walang mga hadlang sa aplikasyon ng φ method sa mga kaso kung saan ang proporsyon ng mga obserbasyon sa isa sa mga sample ay 0. Gayunpaman, sa mga kasong ito, ang resulta ay maaaring hindi makatwiran na mataas (Gubler E.V., 1978, p. 86) .

2. Tuktok walang limitasyon sa φ criterion - ang mga sample ay maaaring basta-basta malaki.

Ibaba ang limitasyon ay 2 obserbasyon sa isa sa mga sample. Gayunpaman, ang mga sumusunod na ratio sa laki ng dalawang sample ay dapat sundin:

a) kung mayroon lamang 2 obserbasyon sa isang sample, ang pangalawa ay dapat magkaroon ng hindi bababa sa 30:

b) kung ang isa sa mga sample ay may 3 obserbasyon lamang, ang pangalawa ay dapat magkaroon ng hindi bababa sa 7:

c) kung ang isa sa mga sample ay may 4 na obserbasyon lamang, ang pangalawa ay dapat magkaroon ng hindi bababa sa 5:

d) san 1 , n 2 ≥ 5 anumang paghahambing ay posible.

Sa prinsipyo, posible ring ihambing ang mga sample na hindi nakakatugon sa kundisyong ito, halimbawa, sa kaugnayann 1 =2, n 2 = 15, ngunit sa mga kasong ito ay hindi posibleng makakita ng mga makabuluhang pagkakaiba.

Ang φ* criterion ay walang ibang paghihigpit.

Tingnan natin ang ilang mga halimbawa upang ilarawan ang mga posibilidadpamantayan φ*.

Halimbawa 1: paghahambing ng mga sample ayon sa isang katangiang tinutukoy ng husay.

Halimbawa 2: paghahambing ng mga sample ayon sa isang quantitatively measured attribute.

Halimbawa 3: paghahambing ng mga sample sa mga tuntunin ng antas at pamamahagi ng isang tampok.

Halimbawa 4: gamit ang φ* criterion kasama ng criterionX Kolmogorov-Smirnov upang makamit ang pinakatumpak na resulta.

Halimbawa 1 - paghahambing ng mga sample ayon sa isang katangiang tinutukoy ng husay

Sa paggamit na ito ng pagsusulit, inihahambing namin ang porsyento ng mga paksa sa isang sample na nailalarawan ng ilang kalidad sa porsyento ng mga paksa sa isa pang sample na nailalarawan sa parehong kalidad.

Ipagpalagay na interesado tayo kung ang dalawang grupo ng mga mag-aaral ay naiiba sa kanilang tagumpay sa paglutas ng isang bagong pang-eksperimentong problema. Sa unang grupo ng 20 katao, 12 tao ang nakayanan ito, at sa pangalawang sample ng 25 tao - 10. Sa unang kaso, ang porsyento ng mga taong nalutas ang problema ay magiging 12/20 100% = 60%, at sa pangalawang 10/25 100% = 40%. Malaki ba ang pagkakaiba ng mga porsyentong ito sa datan 1 atn 2 ?

Tila na "sa pamamagitan ng mata" ay matutukoy na ang 60% ay mas mataas kaysa sa 40%. Gayunpaman, ang mga pagkakaibang ito ay totoon 1 , n 2 hindi mapagkakatiwalaan.

Tignan natin. Dahil interesado kami sa katotohanan ng paglutas ng problema, isasaalang-alang namin ang tagumpay sa paglutas ng pang-eksperimentong problema bilang isang "epekto", at ang pagkabigo sa paglutas nito bilang kawalan ng epekto.

Bumuo tayo ng mga hypotheses.

H 0 : Bahagi ng mga taonakayanan ang gawain, sa unang pangkat ay hindi hihigit sa pangalawang pangkat.

H 1 : Ang proporsyon ng mga taong nakayanan ang gawain sa unang pangkat ay mas malaki kaysa sa pangalawang pangkat.

Ngayon, buuin natin ang tinatawag na four-cell o four-field table, na talagang isang talahanayan ng mga empirical frequency para sa dalawang value ng katangian: "may epekto" - "walang epekto".

Talahanayan 5.1

Isang apat na cell na talahanayan para sa pagkalkula ng pamantayan kapag naghahambing ng dalawang pangkat ng mga paksa sa pamamagitan ng porsyento ng mga nakalutas sa problema.

Mga grupo

"May epekto": nalutas ang gawain

"Walang epekto": hindi nalutas ang problema

Sums

Dami

mga paksa ng pagsusulit

% ibahagi

Dami

mga paksa ng pagsusulit

% bahagi

1 pangkat

(60%)

(40%)

2 pangkat

(40%)

(60%)

Sums

Sa isang apat na cell na talahanayan, bilang panuntunan, ang mga column na "May epekto" at "Walang epekto" ay minarkahan sa itaas, at ang mga hilera na "Group 1" at "Group 2" ay nasa kaliwa. Sa katunayan, ang mga patlang (mga cell) A at B lamang ang lumahok sa mga paghahambing, iyon ay, mga porsyento sa column na "May epekto."

Ayon sa Talahanayan.XIIAng Appendix 1 ay tumutukoy sa mga halaga ng φ na tumutugma sa mga porsyento sa bawat isa sa mga pangkat.

Ngayon kalkulahin natin ang empirical na halaga ng φ* gamit ang formula:

saan φ 1 - ang anggulo na katumbas ng mas malaking % share;

φ 2 - ang anggulo na katumbas ng mas maliit na % share;

n 1 - bilang ng mga obserbasyon sa sample 1;

n 2 - ang bilang ng mga obserbasyon sa sample 2.

Sa kasong ito:

Ayon sa Talahanayan.XIIITinutukoy ng Appendix 1 kung anong antas ng kahalagahan ang tumutugma sa φ* emp=1,34:

p=0.09

Posible rin na magtatag ng mga kritikal na halaga ng φ* na naaayon sa mga antas ng istatistikal na kahalagahan na tinatanggap sa sikolohiya:

Bumuo tayo ng "axis of significance".

Ang nakuhang empirical value φ* ay nasa zone of insignificance.

Sagot: H 0 tinanggap. Ang proporsyon ng mga taong nakakumpleto ng gawainsaang unang pangkat ay hindi hihigit sa pangalawang pangkat.

Maaari lamang makiramay ang isa sa isang mananaliksik na isinasaalang-alang ang mga makabuluhang pagkakaiba na 20% at kahit 10% nang hindi sinusuri ang kanilang pagiging maaasahan gamit ang φ* criterion. Sa kasong ito, halimbawa, ang mga pagkakaiba lamang ng hindi bababa sa 24.3% ang magiging makabuluhan.

Mukhang kapag naghahambing ng dalawang sample ayon sa ilang kwalitatibong pamantayan, ang φ criterion ay maaaring magalit sa atin sa halip na pasayahin tayo. Ang tila makabuluhan, mula sa istatistikal na pananaw, ay maaaring hindi ganoon.

Higit pang mga pagkakataon upang pasayahin ang mananaliksik na lilitaw sa pamantayan ng Fisher kapag inihambing namin ang dalawang sample ayon sa mga katangiang nasusukat sa dami at maaaring mag-iba ang "epekto.

Halimbawa 2 - paghahambing ng dalawang sample ayon sa isang quantitatively measured attribute

Sa variant na ito ng paggamit ng criterion, ikinukumpara namin ang porsyento ng mga paksa sa isang sample na nakakamit ng isang partikular na antas ng value ng feature sa porsyento ng mga subject na nakakamit ang antas na ito sa isa pang sample.

Sa isang pag-aaral ni G. A. Tlegenova (1990), sa 70 kabataang lalaki na nag-aaral sa mga vocational school na may edad 14 hanggang 16, 10 subject na may mataas na marka sa Aggressiveness scale at 11 subject na may mababang score sa Aggression scale ang napili batay sa resulta ng isang survey gamit ang Freiburg Personality Questionnaire. Kinakailangang matukoy kung ang mga grupo ng agresibo at hindi agresibong mga kabataang lalaki ay naiiba sa mga tuntunin ng distansya na kusang pinili nila sa pakikipag-usap sa isang kapwa mag-aaral. Ang data ng G. A. Tlegenova ay ipinakita sa Talahanayan. 5.2. Makikita na ang mga agresibong binata ay mas madalas na pumili ng layo na 50cm o mas kaunti pa, habang ang mga hindi agresibong kabataan ay mas malamang na pumili ng mga distansyang higit sa 50 cm.

Ngayon ay maaari nating isaalang-alang ang isang distansya na 50 cm bilang kritikal at isaalang-alang na kung ang distansya na pinili ng paksa ay mas mababa sa o katumbas ng 50 cm, kung gayon mayroong isang "epekto", at kung ang napiling distansya ay higit sa 50 cm, kung gayon walang epekto. Nakikita namin na sa grupo ng mga agresibong kabataang lalaki, ang epekto ay sinusunod sa 7 sa 10, ibig sabihin, sa 70% ng mga kaso, at sa grupo ng mga hindi agresibong kabataang lalaki, sa 2 sa 11, ibig sabihin, sa 18.2 % ng mga kaso. Ang mga porsyentong ito ay maihahambing gamit ang φ* na pamamaraan upang maitatag ang bisa ng mga pagkakaiba sa pagitan ng mga ito.

Talahanayan 5.2

Mga tagapagpahiwatig ng distansya (sa cm) na pinili ng mga agresibo at hindi agresibong kabataang lalaki sa pakikipag-usap sa kapwa mag-aaral (ayon kay G.A. Tlegenova, 1990)

Pangkat 1: mga lalaki na may matataas na marka sa sukat ng AggressivenessFPI- R (n 1 =10)

Pangkat 2: mga batang lalaki na may mababang marka sa sukat ng AggressivenessFPI- R (n 2 =11)

d(c m )

% bahagi

d(c M )

% bahagi

"Meron

Epekto"

d≤50 cm

18,2%

"Hindi

epekto"

d>50 cm

80 QO

81,8%

Sums

100%

100%

Katamtaman

5b:o

77.3

Bumuo tayo ng mga hypotheses.

H 0 d 50 see, wala nang mas aggressive boys sa grupo kaysa sa grupo ng non-aggressive boys.

H 1 : Proporsyon ng mga taong pumili ng distansyad50 cm, sa grupo ng mga agresibong lalaki na higit pa kaysa sa grupo ng mga hindi agresibong lalaki. Ngayon, buuin natin ang tinatawag na four-cell table.

Talahanayan 53

Isang four-cell table para sa pagkalkula ng φ* criterion kapag naghahambing ng mga grupo ng agresibo (nf=10) at mga hindi agresibong lalaki (n2=11)

Mga grupo

"May epekto": d≤50

"Walang epekto." d>50

Sums

Bilang ng mga paksa ng pagsusulit

(% bahagi)

Bilang ng mga paksa ng pagsusulit

(% bahagi)

Pangkat 1 - mga agresibong lalaki

(70%)

(30%)

Pangkat 2 - mga hindi agresibong lalaki

(180%)

(81,8%)

Sum

Ayon sa Talahanayan.XIIAng Appendix 1 ay tumutukoy sa mga halaga ng φ na tumutugma sa porsyento ng "epekto" sa bawat isa sa mga pangkat.

Ang nakuhang empirical value φ* ay nasa zone of significance.

Sagot: H 0 tinanggihan. tinanggapH 1 . Ang proporsyon ng mga taong pumili ng distansya sa isang pag-uusap na mas mababa sa o katumbas ng 50 cm ay mas malaki sa grupo ng mga agresibong lalaki kaysa sa grupo ng mga hindi agresibong lalaki.

Batay sa resultang nakuha, mahihinuha natin na ang mas agresibong mga lalaki ay mas madalas na pumili ng distansiyang mas mababa sa kalahating metro, habang ang mga hindi agresibong lalaki ay mas madalas na pumili ng distansiyang higit sa kalahating metro. Nakikita namin na ang mga agresibong binata ay aktwal na nakikipag-usap sa hangganan ng intimate (0-46 cm) at mga personal na zone (mula sa 46 cm). Naaalala namin, gayunpaman, na ang matalik na distansya sa pagitan ng mga kasosyo ay ang prerogative hindi lamang ng malapit na mabuting relasyon, ngunitatkamay-sa-kamay na labanan (HallE. T., 1959).

Halimbawa 3 - paghahambing ng mga sample sa mga tuntunin ng antas at pamamahagi ng isang tampok.

Sa variant na ito ng paggamit ng pagsubok, maaari muna nating suriin kung ang mga pangkat ay naiiba sa antas ng anumang katangian, at pagkatapos ay ihambing ang mga distribusyon ng katangian sa dalawang sample. Ang ganitong gawain ay maaaring may kaugnayan sa pagsusuri ng mga pagkakaiba sa mga saklaw o anyo ng pamamahagi ng mga pagtatantya na nakuha ng mga paksa gamit ang ilang bagong pamamaraan.

Sa pag-aaral ng R. T. Chirkina (1995), ginamit ang isang palatanungan sa unang pagkakataon, na naglalayong tukuyin ang isang ugali na paalisin ang mga katotohanan, pangalan, intensyon at paraan ng pagkilos mula sa memorya, dahil sa personal, pamilya at propesyonal na mga kumplikado. Ang palatanungan ay nilikha kasama ang pakikilahok ng E. V. Sidorenko batay sa mga materyales ng aklat 3. Freud "Psychopathology ng pang-araw-araw na buhay". Ang isang sample ng 50 mga mag-aaral ng Pedagogical Institute, walang asawa, walang mga anak, na may edad na 17 hanggang 20 taong gulang, ay sinuri gamit ang talatanungan na ito, pati na rin ang diskarteng Menester-Corzini upang matukoy ang intensity ng pakiramdam ng sariling kakulangan,o"inferiority complex"ManasterG. J., CorsiniR. J., 1982).

Ang mga resulta ng survey ay ipinakita sa Talahanayan. 5.4.

Maaari bang ipagtanggol na mayroong anumang makabuluhang ugnayan sa pagitan ng tagapagpahiwatig ng enerhiya ng pag-aalis, na nasuri gamit ang talatanungan, at ang mga tagapagpahiwatig ng intensity, ang pakiramdam ng sariling kakulangan?

Talahanayan 5.4

Mga tagapagpahiwatig ng tindi ng pakiramdam ng sariling kakulangan sa mga grupo ng mga mag-aaral na may mataas na (nj=18) at mababang (n2=24) displacement energy

Pangkat 1: displacement energy mula 19 hanggang 31 puntos (n 1 =181

Pangkat 2: displacement energy mula 7 hanggang 13 puntos (n 2 =24)

0; 0; 0; 0; 0

20; 20

30; 30; 30; 30; 30; 30; 30

50; 50

60; 60

0; 0

5; 5; 5; 5

10; 10; 10; 10; 10; 10

15; 15

20; 20; 20; 20

30; 30; 30; 30; 30; 30

Sums

Katamtaman

26,11

15,42

Sa kabila ng katotohanan na ang average na halaga sa pangkat na may mas masiglang pag-aalis ay mas mataas, 5 zero na mga halaga ay sinusunod din dito. Kung ihahambing natin ang mga histogram ng pamamahagi ng mga pagtatantya sa dalawang sample, pagkatapos ay makikita ang isang kapansin-pansing kaibahan sa pagitan nila (Larawan 5.3).

Upang ihambing ang dalawang distribusyon, maaari naming ilapat ang pamantayanχ 2 o pamantayanλ , ngunit para dito kailangan nating palakihin ang mga digit, at bilang karagdagan, sa parehong mga samplen <30.

Ang φ* criterion ay magbibigay-daan sa amin na suriin ang epekto ng pagkakaiba sa pagitan ng dalawang distribusyon na naobserbahan sa graph, kung sumasang-ayon kaming isaalang-alang na mayroong "epekto" kung ang tagapagpahiwatig ng pakiramdam ng kakulangan ay tumatagal ng alinman sa napakababa (0) o, sa kabaligtaran, napakataas na halaga (S30) at na mayroong "walang epekto" kung ang marka ng kakulangan ay nasa gitnang hanay, sa pagitan ng 5 at 25.

Bumuo tayo ng mga hypotheses.

H 0 : Ang matinding halaga ng insufficiency index (alinman sa 0 o 30 o higit pa) sa pangkat na may mas matinding panunupil ay hindi mas karaniwan kaysa sa pangkat na may hindi gaanong masiglang panunupil.

H 1 : Ang mga matinding halaga ng index ng kakulangan (alinman sa 0 o 30 o higit pa) sa pangkat na may mas matinding panunupil ay mas karaniwan kaysa sa pangkat na may hindi gaanong masiglang panunupil.

Gumawa tayo ng four-cell table, na maginhawa para sa karagdagang pagkalkula ng φ* criterion.

Talahanayan 5.5

Four-cell table para sa pagkalkula ng φ* criterion kapag inihahambing ang mga pangkat na may mas mataas at mas mababang displacement energy ayon sa ratio ng insufficiency indicators

Mga grupo

"Mabisa": ang marka ng kakulangan ay 0 o >30

"Walang epekto": marka ng kakulangan mula 5 hanggang 25

Sums

(88,9%)

(11,1%)

(33,3%)

(66,7%)

Sums

Ayon sa Talahanayan.XIIAppendix 1, tinutukoy namin ang mga halaga ng φ na naaayon sa mga inihambing na porsyento:

Kalkulahin natin ang empirical value ng φ*:

Mga kritikal na halaga ng φ* para sa alinmann 1 , n 2 , gaya ng naaalala natin mula sa nakaraang halimbawa, ay:

Tab.XIIIAng Appendix 1 ay nagpapahintulot sa amin na mas tumpak na matukoy ang antas ng kahalagahan ng resultang nakuha: p<0,001.

Sagot: H 0 tinanggihan. tinanggapH 1 . Ang matinding halaga ng insufficiency index (alinman sa 0 o 30 o higit pa) sa pangkat na may mas mataas na displacement energy ay mas karaniwan kaysa sa pangkat na may mas mababang displacement energy.

Kaya, ang mga paksa na may mas mataas na enerhiya ng panunupil ay maaaring magkaroon ng parehong napakataas (30 o higit pa) at napakababa (zero) na mga tagapagpahiwatig ng pakiramdam ng kanilang sariling kakulangan. Maaaring ipagpalagay na pinipigilan nila ang kanilang kawalang-kasiyahan at ang pangangailangan para sa tagumpay sa buhay. Ang mga pagpapalagay na ito ay nangangailangan ng karagdagang pag-verify.

Ang resulta na nakuha, anuman ang interpretasyon nito, ay nagpapatunay sa posibilidad ng φ* criterion sa pagtatasa ng mga pagkakaiba sa anyo ng pamamahagi ng katangian sa dalawang sample.

Mayroong 50 tao sa orihinal na sample, ngunit 8 sa kanila ay hindi kasama sa pagsasaalang-alang bilang may average na marka sa anergy of displacement indicator (14-15). Ang mga tagapagpahiwatig ng intensity ng pakiramdam ng kakulangan ay karaniwan din: 6 na halaga ng 20 puntos at 2 halaga ng 25 puntos.

Ang makapangyarihang mga posibilidad ng φ* criterion ay makikita sa pamamagitan ng pagkumpirma ng isang ganap na naiibang hypothesis kapag sinusuri ang mga materyales ng halimbawang ito. Maaari nating patunayan, halimbawa, na sa isang pangkat na may mas mataas na enerhiya ng panunupil, ang tagapagpahiwatig ng kakulangan ay mas mataas pa rin, sa kabila ng kabalintunaan ng pamamahagi nito sa pangkat na ito.

Bumuo tayo ng mga bagong hypotheses.

H 0 Ang pinakamataas na halaga ng insufficiency index (30 o higit pa) sa pangkat na may mas mataas na displacement energy ay matatagpuan nang hindi mas madalas kaysa sa grupo na may mas mababang displacement energy.

H 1 : Ang pinakamataas na halaga ng insufficiency index (30 o higit pa) sa pangkat na may mas mataas na displacement energy ay mas karaniwan kaysa sa grupo na may mas mababang displacement energy. Bumuo tayo ng four-field table gamit ang data sa Table. 5.4.

Talahanayan 5.6

Four-cell table para sa pagkalkula ng φ* criterion kapag inihahambing ang mga pangkat na may mas mataas at mas mababang displacement energy ayon sa antas ng deficiency index

Mga grupo

"May epekto"* ang tagapagpahiwatig ng kakulangan ay mas malaki sa o katumbas ng 30

"Walang epekto": Mas mababa ang marka ng kakulangan 30

Sums

Pangkat 1 - na may mas mataas na enerhiya sa pag-aalis

(61,1%)

(38.9%)

Pangkat 2 - na may mas mababang displacement energy

(25.0%)

(75.0%)

Sums

Ayon sa Talahanayan.XIIITinutukoy ng Appendix 1 na ang resultang ito ay tumutugma sa antas ng kahalagahan na p=0.008.

Sagot: Ngunit ito ay tinanggihan. tinanggaphj: Ang pinakamataas na rate ng pagkabigo (30 o higit pang mga puntos) sa grupoSana may mas mataas na displacement energy ay mas karaniwan kaysa sa pangkat na may mas mababang displacement energy (p=0.008).

Kaya, napatunayan namin iyonsapangkatSaAng mas masiglang pag-aalis ay pinangungunahan ng mga matinding halaga ng tagapagpahiwatig ng kakulangan, at ang katotohanan na ang tagapagpahiwatig na ito ay mas malaki kaysa sa mga halaga nitoumabotsa partikular na grupong ito.

Ngayon ay maaari nating subukang patunayan na sa pangkat na may mas mataas na enerhiya sa pag-aalis, mas karaniwan din ang mas mababang mga halaga ng index ng kakulangan, sa kabila ng katotohanan na ang average na halagasa mas marami ang grupong ito (26.11 kumpara sa 15.42 sa grupoSa mas kaunting displacement).

Bumuo tayo ng mga hypotheses.

H 0 : Pinakamababang marka ng malnutrisyon (nil) sa grupoSa ang mas malaking displacement energy ay matatagpuan nang hindi mas madalas kaysa sa grupoSa mas mababang displacement energy.

H 1 : Ang pinakamababang antas ng malnutrisyon (wala) ay nangyayarisa grupong may mas mataas na displacement energy nang mas madalas kaysa sa grupoSa hindi gaanong masiglang pag-aalis. Ipangkat natin ang data sa isang bagong talahanayan na may apat na cell.

Talahanayan 5.7

Isang four-cell table para sa paghahambing ng mga grupo na may iba't ibang displacement energies sa mga tuntunin ng dalas ng mga zero value ng deficiency index

Mga grupo

"May epekto": ang tagapagpahiwatig ng kakulangan ay 0

"Walang epekto" pagkabigo

ang exponent ay hindi 0

Sums

Pangkat 1 - na may mas mataas na enerhiya sa pag-aalis

(27,8%)

(72,2%)

1 pangkat - na may mas mababang enerhiya sa pag-aalis

(8,3%)

(91,7%)

Sums

Tinutukoy namin ang mga halaga ng φ at kinakalkula ang halaga ng φ*:

Sagot: H 0 tinanggihan. Ang pinakamababang mga marka ng kakulangan (nil) sa pangkat na may mas mataas na displacement energy ay mas karaniwan kaysa sa pangkat na may mas mababang displacement energy (p<0,05).

Sa kabuuan, ang mga resulta na nakuha ay maaaring ituring bilang katibayan ng isang bahagyang pagkakataon ng mga konsepto ng complex nina Z. Freud at A. Adler.

Mahalaga na sa pagitan ng tagapagpahiwatig ng enerhiya ng pag-aalis at ang tagapagpahiwatig ng intensity ng pakiramdam ng sariling kakulangan, sa buong sample, isang positibong linear correlation ang nakuha (p = +0.491, p<0,01). Как мы можем убедиться, применение критерия φ* позволяет проникнуть в более тонкие и содержательно значимые соотношения между этими двумя показателями.

Halimbawa 4 - gamit ang φ* criterion kasama ng criterion λ Kolmogorov-Smirnov upang makamit ang maximum tumpakresulta

Kung ang mga sample ay inihambing ayon sa ilang mga tagapagpahiwatig na sinusukat sa dami, ang problema ay lumitaw sa pagtukoy sa punto ng pamamahagi na maaaring magamit bilang isang kritikal kapag hinahati ang lahat ng mga paksa sa mga "may epekto" at sa mga "walang epekto".

Sa prinsipyo, ang punto kung saan hahatiin natin ang grupo sa mga subgroup, kung saan may epekto at walang epekto, ay maaaring piliin nang arbitraryo. Maaari kaming maging interesado sa anumang epekto, at samakatuwid maaari naming hatiin ang parehong mga sample sa dalawang bahagi sa anumang punto, hangga't ito ay may katuturan.

Upang ma-maximize ang kapangyarihan ng pagsubok na φ*, gayunpaman, kinakailangang piliin ang punto kung saan ang mga pagkakaiba sa pagitan ng dalawang pinaghahambing na grupo ay pinakamalaki. Sa pinakatumpak, magagawa natin ito gamit ang criterion calculation algorithmλ , na nagbibigay-daan sa iyong mahanap ang punto ng maximum na pagkakaiba sa pagitan ng dalawang sample.

Posibilidad ng pagsasama-sama ng pamantayan φ* atλ inilarawan ni E.V. Gubler (1978, pp. 85-88). Subukan nating gamitin ang paraang ito sa paglutas ng sumusunod na problema.

Sa pinagsamang pag-aaral ni M.A. Kurochkina, E.V. Sidorenko at Yu.A. Churakova (1992) sa UK, ang mga English general practitioner ay sinuri sa dalawang kategorya: a) mga doktor na sumuporta sa repormang medikal at ginawa na ang kanilang mga operasyon sa mga organisasyong sumusuporta sa pondo na may sariling badyet; b) mga doktor, na ang mga pagtanggap ay wala pa ring sariling mga pondo at ganap na ibinibigay ng badyet ng estado. Ang mga talatanungan ay ipinadala sa isang sample ng 200 mga doktor, kinatawan ng pangkalahatang populasyon ng mga doktor sa Ingles sa mga tuntunin ng representasyon ng mga taong may iba't ibang kasarian, edad, tagal ng serbisyo at lugar ng trabaho - sa malalaking lungsod o sa mga probinsya.

Ang mga sagot sa questionnaire ay ipinadala ng 78 mga doktor, 50 sa kanila ay nagtatrabaho sa mga reception na may pondo at 28 sa mga reception na walang pondo. Ang bawat isa sa mga doktor ay kailangang hulaan kung ano ang magiging bahagi ng mga pagtanggap na may mga pondo sa susunod na taon, 1993. 70 doktor lamang sa 78 na nagpadala ng mga sagot ang sumagot sa tanong na ito. Ang pamamahagi ng kanilang mga pagtataya ay ipinakita sa Talahanayan. 5.8 nang hiwalay para sa isang grupo ng mga doktor na may pondo at isang grupo ng mga doktor na walang pondo.

Magkaiba ba ang mga hula ng mga doktor na may pondo at mga doktor na walang pondo?

Talahanayan 5.8

Pamamahagi ng mga Prediksyon ng mga Pangkalahatang Praktisiyon tungkol sa Bahagi ng Pagtanggap sa mga Pondo noong 1993

Inaasahang bahagi

mga silid sa pagtanggap na may mga pondo

mga doktor na may pondo (n 1 =45)

mga doktor na walang pondo (n 2 =25)

Sums

1. 0 hanggang 20%

4

5

9

2. 21 hanggang 40%

15

At

26

3. 41 hanggang 60%

18

5

23

4. 61 hanggang 80%

7

4

At

5. 81 hanggang 100%

1

0

1

Sums

45

25

70

Tukuyin natin ang punto ng pinakamataas na pagkakaiba sa pagitan ng dalawang distribusyon ng mga sagot ayon sa Algorithm 15 mula sa talata 4.3 (tingnan ang Talahanayan 5.9).

Talahanayan 5.9

Pagkalkula ng maximum na pagkakaiba ng mga naipon na frequency sa mga pamamahagi ng mga pagtataya ng mga doktor ng dalawang grupo

Tinatayang proporsyon ng mga pamilyang kinakapatid na may mga pondo (%)

Empirical frequency para sa pagpili ng isang ibinigay na kategorya ng tugon

Mga Empirikal na Dalas

Cumulative Empirical Frequencies

Pagkakaiba (d)

mga doktor na may pundasyon(n 1 =45)

mga doktor na walang pondo (n 2 =25)

f* eh 1

f* a2

f* e1

f* a1

1. 0 hanggang 20%

2. 21 hanggang 40%

3. 41 hanggang 60%

4. 61 hanggang 80%

5. 81 hanggang 100%

4

15

18

7

1

5

11

5

4

0

0,089 0,333 0,400 0,156 0,022

0,200 0,440 0,200 0,160 0

0,089 0,422 0,822 0,978 1,000

0,200

0,640

0,840

1,000

1,000

0111

0,218 0,018 0,022

0

Ang pinakamataas na pagkakaiba na natagpuan sa pagitan ng dalawang naipon na empirical frequency ay0,218.

Ang pagkakaibang ito ay naipon sa pangalawang kategorya ng forecast. Subukan nating gamitin ang upper bound ng kategoryang ito bilang criterion para sa paghahati ng parehong sample sa isang subgroup kung saan may effect at subgroup kung saan walang effect. Ipagpalagay namin na may "epekto" kung hinuhulaan ng doktor na ito mula 41 hanggang 100% ng mga reception room na may mga pondo sa1993 taon, at na walang "epekto" kung hinuhulaan ng isang doktor ang 0 hanggang 40% ng mga operasyon na may pondo sa1993 taon. Pinagsasama namin ang mga kategorya ng pagtataya 1 at 2 sa isang banda, at ang mga kategorya ng pagtataya 3, 4 at 5 sa kabilang banda. Ang resultang pamamahagi ng mga pagtataya ay ipinakita sa Talahanayan. 5.10.

Talahanayan 5.10

Pamamahagi ng mga pagtataya para sa mga doktor na may pondo at mga doktor na walang pondo

Inaasahang bahagi ng mga foster home na may mga pondo (%1

Empirical frequency para sa pagpili ng isang ibinigay na kategorya ng forecast

Sums

mga doktor na may pundasyon(n 1 =45)

mga doktor na walang pondo(n 2 =25)

1. mula 0 hanggang 40%

19

16

35

2. mula 41 hanggang 100%

26

9

35

Sums

45

25

70

Magagamit natin ang resultang talahanayan (Talahanayan 5.10) sa pamamagitan ng pagsubok ng iba't ibang hypotheses sa pamamagitan ng paghahambing ng alinman sa dalawa sa mga cell nito. Natatandaan natin na ito ang tinatawag na four-cell, o four-field, table.

Sa kasong ito, interesado kami kung ang mga manggagamot na mayroon nang pondo ay talagang hinuhulaan ang isang mas malaking paggalaw sa hinaharap kaysa sa mga manggagamot na walang mga pondo. Samakatuwid, may kondisyon kaming naniniwala na mayroong "epekto" kapag ang forecast ay nahulog sa kategorya mula 41 hanggang 100%. Upang gawing simple ang mga kalkulasyon, kailangan na nating paikutin ang talahanayan ng 90 °, paikutin ito nang sunud-sunod. Maaari mo ring gawin ito nang literal sa pamamagitan ng pagpihit ng aklat kasama ang mesa. Ngayon ay maaari na tayong pumunta sa worksheet para sa pagkalkula ng criterion φ* - Fisher's angular transformation.

mesa 5.11

Four-cell table para sa pagkalkula ng Fisher's φ* test para matukoy ang mga pagkakaiba sa mga hula ng dalawang grupo ng mga general practitioner

Grupo

May epekto - pagtataya mula 41 hanggang 100%

Walang epekto - pagtataya mula 0 hanggang 40%

Kabuuan

akogrupo - mga doktor na kumuha ng pondo

26 (57.8%)

19 (42.2%)

45

IIgrupo - mga doktor na hindi kumuha ng pondo

9 (36.0%)

16 (64.0%)

25

Kabuuan

35

35

70

Bumuo tayo ng mga hypotheses.

H 0 : Porsiyento ng mga taohinuhulaan ang pamamahagi ng mga pondo sa pamamagitan ng 41%-100% ng lahat ng mga medikal na pagtanggap, sa grupo ng mga doktor na may mga pondo, walang higit pa kaysa sa grupo ng mga doktor na walang pondo.

H 1 : Ang proporsyon ng mga taong hinuhulaan ang pamamahagi ng mga pondo sa pamamagitan ng 41%-100% ng lahat ng mga pagtanggap sa grupo ng mga doktor na may mga pondo ay mas malaki kaysa sa grupo ng mga doktor na walang pondo.

Tinutukoy namin ang mga halaga ng φ 1 at φ 2 ayon sa talahanayanXIIAppendix 1. Tandaan na φ 1 ay palaging anggulo na tumutugma sa mas malaking porsyento.

Ngayon, alamin natin ang empirical na halaga ng criterion φ*:

Ayon sa Talahanayan.XIIITinutukoy ng Appendix 1 kung anong antas ng kahalagahan ang katumbas ng halagang ito: p=0.039.

Ayon sa parehong talahanayan sa Appendix 1, maaaring matukoy ng isa ang mga kritikal na halaga ng criterion φ*:

Sagot: Ngunit tinanggihan (p=0.039). Porsiyento ng mga taong hinuhulaan ang pamamahagi ng mga pondo sa41-100 % sa lahat ng mga receptionist, sa grupo ng mga doktor na kumuha ng pondo, ay lumampas sa bahaging ito sa grupo ng mga doktor na hindi kumuha ng pondo.

Sa madaling salita, ang mga doktor na nagtatrabaho na sa kanilang mga operasyon sa isang hiwalay na badyet ay hinuhulaan na ang pagsasanay na ito ay magiging mas laganap sa taong ito kaysa sa mga doktor na hindi pa sumang-ayon na lumipat sa isang hiwalay na badyet. Ang mga interpretasyon ng resultang ito ay maraming pinahahalagahan. Halimbawa, maaaring ipagpalagay na ang mga doktor ng bawat isa sa mga grupo ay hindi sinasadyang isaalang-alang ang kanilang pag-uugali na mas karaniwan. Maaari rin itong mangahulugan na ang mga manggagamot na lumipat na sa isang self-supporting budget ay may posibilidad na palakihin ang saklaw ng kilusang ito, dahil kailangan nilang bigyang-katwiran ang kanilang desisyon. Ang mga nahayag na pagkakaiba ay maaari ding mangahulugan ng isang bagay na ganap na lampas sa saklaw ng mga tanong na ibinibigay sa pag-aaral. Halimbawa, na ang aktibidad ng mga doktor na nagtatrabaho sa isang independiyenteng badyet ay nag-aambag sa pagpapatalas ng mga pagkakaiba sa mga posisyon ng parehong grupo. Napaka-aktibo nila noong pumayag silang kunin ang mga pondo, napaka-aktibo nila kapag nahirapan silang sagutin ang mail questionnaire; mas aktibo sila kapag hinuhulaan nilang magiging mas aktibo ang ibang mga doktor sa pagtanggap ng mga pondo.

Sa isang paraan o iba pa, makatitiyak tayo na ang antas ng mga istatistikal na pagkakaiba na natagpuan ay ang pinakamataas na posible para sa totoong data na ito. Naitatag namin sa tulong ng criterionλ ang punto ng pinakamataas na pagkakaiba sa pagitan ng dalawang distribusyon, at sa puntong ito na ang mga sample ay nahahati sa dalawang bahagi.

Iyong marka.

Ang pamantayan ni Fisher

Ginagamit ang criterion ni Fisher upang subukan ang hypothesis tungkol sa pagkakapantay-pantay ng mga pagkakaiba-iba ng dalawang pangkalahatang populasyon na ibinahagi ayon sa normal na batas. Ito ay isang parametric criterion.

Ang Fisher's F-test ay tinatawag na variance ratio, dahil ito ay nabuo bilang ratio ng dalawang kumpara na walang pinapanigan na mga pagtatantya ng mga pagkakaiba.

Hayaang makakuha ng dalawang sample bilang resulta ng mga obserbasyon. Batay sa kanila, ang mga pagkakaiba-iba at pagkakaroon at antas ng kalayaan. Ipagpalagay namin na ang unang sample ay kinuha mula sa pangkalahatang populasyon na may pagkakaiba , at ang pangalawa - mula sa pangkalahatang populasyon na may pagkakaiba . Ang null hypothesis ay iniharap tungkol sa pagkakapantay-pantay ng dalawang variances, i.e. H0:
o . Upang tanggihan ang hypothesis na ito, kinakailangan upang patunayan ang kahalagahan ng pagkakaiba sa isang naibigay na antas ng kahalagahan.
.

Ang halaga ng pamantayan ay kinakalkula ng formula:

Malinaw, kung ang mga pagkakaiba ay pantay, ang halaga ng criterion ay magiging katumbas ng isa. Sa ibang mga kaso, ito ay magiging mas malaki (mas mababa) kaysa sa isa.

Ang pamantayan ay may pamamahagi ng Fisher
. Ang Fisher's test ay isang two-tailed test, at ang null hypothesis
tinanggihan sa pabor ng alternatibo
kung . Dito kung saan
ay ang mga volume ng una at pangalawang sample, ayon sa pagkakabanggit.

Ang sistema ng STATISTICA ay nagpapatupad ng one-tailed Fisher test, i.e. gaya ng nakasanayan kunin ang maximum na pagpapakalat. Sa kasong ito, ang null hypothesis ay tinanggihan pabor sa kahalili kung .

Halimbawa

Hayaang itakda ang gawain upang ihambing ang bisa ng pagsasanay ng dalawang grupo ng mga mag-aaral. Ang antas ng pag-unlad ay nagpapakilala sa antas ng pamamahala ng proseso ng pag-aaral, at ang pagpapakalat ay nagpapakilala sa kalidad ng pamamahala ng pag-aaral, ang antas ng organisasyon ng proseso ng pag-aaral. Ang parehong mga tagapagpahiwatig ay independyente at sa pangkalahatan ay dapat isaalang-alang nang magkasama. Ang antas ng pag-unlad (mathematical expectation) ng bawat pangkat ng mga mag-aaral ay nailalarawan sa arithmetic mean at , at ang kalidad ay nailalarawan sa pamamagitan ng kaukulang sample na mga pagkakaiba-iba ng mga pagtatantya: at . Kapag tinatasa ang antas ng kasalukuyang pagganap, lumabas na pareho ito para sa parehong mga mag-aaral: == 4.0. Mga sample na pagkakaiba-iba:
at
. Ang bilang ng mga antas ng kalayaan na tumutugma sa mga pagtatantya na ito:
at
. Samakatuwid, upang magtatag ng mga pagkakaiba sa pagiging epektibo ng pagsasanay, maaari nating gamitin ang katatagan ng pagganap sa akademiko, i.e. subukan natin ang hypothesis.

Compute
(Ang numerator ay dapat magkaroon ng malaking pagkakaiba), . Ayon sa mga talahanayan ( STATISTICSProbabilitypamamahagicalculator) nakita namin ang , na mas mababa sa kinakalkula, samakatuwid, ang null hypothesis ay dapat tanggihan pabor sa alternatibo . Maaaring hindi masiyahan ang konklusyong ito sa mananaliksik, dahil interesado siya sa tunay na halaga ng ratio
(lagi kaming may malaking pagkakaiba sa numerator). Kapag sinusuri ang isang panig na pamantayan, nakukuha namin ang , na mas mababa kaysa sa halagang kinakalkula sa itaas. Kaya, ang null hypothesis ay dapat tanggihan pabor sa alternatibo.

Fisher's test sa STATISTICA program sa Windows environment

Para sa isang halimbawa ng pagsubok ng hypothesis (pamantayan ng Fisher), gumagamit kami ng (lumikha) ng file na may dalawang variable (fisher.sta):

kanin. 1. Talahanayan na may dalawang malayang variable

Upang subukan ang hypothesis, ito ay kinakailangan sa mga pangunahing istatistika ( BasicMga istatistikaatmga mesa) piliin ang pagsusulit ng Mag-aaral para sa mga malayang variable. ( t-test, independyente, ayon sa mga variable).

kanin. 2. Pagsubok ng parametric hypotheses

Pagkatapos pumili ng mga variable at pagpindot sa key Buod ang mga halaga ng standard deviations at Fisher's test ay kinakalkula. Bilang karagdagan, ang antas ng kahalagahan ay tinutukoy p, kung saan ang pagkakaiba ay hindi gaanong mahalaga.

kanin. 3. Mga resulta ng pagsubok sa hypothesis (F-test)

Gamit Probabilitycalculator at sa pamamagitan ng pagtatakda ng halaga ng mga parameter, maaari mong i-plot ang pamamahagi ng Fisher na may marka ng kinakalkulang halaga.

kanin. 4. Lugar ng pagtanggap (pagtanggi) ng hypothesis (F-criterion)

Mga pinagmumulan.

    Pagsubok ng mga hypotheses tungkol sa relasyon ng dalawang pagkakaiba

URL: /tryphonov3/terms3/testdi.htm

    Lecture 6. :8080/resources/math/mop/lections/lection_6.htm

    F - Pamantayan ng Fisher

URL: /home/portal/applications/Multivariatadvisor/F-Fisheer/F-Fisheer.htm

    Teorya at praktika ng probabilistiko at istatistikal na pananaliksik.

URL: /active/referats/read/doc-3663-1.html

    F - Pamantayan ng Fisher

Upang paghambingin ang dalawang populasyong karaniwang ipinamamahagi na walang pagkakaiba sa sample na paraan, ngunit may pagkakaiba sa mga pagkakaiba, gamitin Ang pamantayan ni Fisher. Ang aktwal na criterion ay kinakalkula ng formula:

kung saan ang numerator ay ang mas malaking halaga ng sample variance, at ang denominator ay ang mas maliit na halaga. Upang ipahiwatig ang kahalagahan ng mga pagkakaiba sa pagitan ng mga sample, ginagamit namin ANG BATAYANG PRINSIPYO pagsubok ng statistical hypotheses. Mga kritikal na puntos para sa
ay nakapaloob sa talahanayan. Ang null hypothesis ay tinanggihan kung ang aktwal na halaga
lalampas o katumbas ng kritikal (karaniwang) halaga
ang halagang ito para sa tinatanggap na antas ng kahalagahan at bilang ng mga antas ng kalayaan k 1 = n malaki -1 ; k 2 = n mas mababa -1 .

Halimbawa: kapag pinag-aaralan ang epekto ng isang partikular na gamot sa rate ng pagtubo ng binhi, natuklasan na sa eksperimentong batch ng mga buto at kontrol, pareho ang average na rate ng pagtubo, ngunit may pagkakaiba sa dispersion.
=1250,
=417. Ang mga sample na laki ay pareho at katumbas ng 20.

=2.12. Samakatuwid, ang null hypothesis ay tinanggihan.

pag-asa sa ugnayan. Koepisyent ng ugnayan at mga katangian nito. Mga equation ng regression.

ISANG GAWAIN Ang pagsusuri ng ugnayan ay binabawasan sa:

    Pagtatatag ng direksyon at anyo ng komunikasyon sa pagitan ng mga palatandaan;

    sinusukat ang higpit nito.

functional ang isa-sa-isang relasyon sa pagitan ng mga variable ay tinatawag kapag ang isang tiyak na halaga ng isang (independiyenteng) variable X , na tinatawag na argumento, ay tumutugma sa isang tiyak na halaga ng isa pang (umaasa) na variable sa tinatawag na function. ( Halimbawa: pagtitiwala sa bilis ng isang kemikal na reaksyon sa temperatura; pag-asa ng puwersa ng pagkahumaling sa masa ng mga naaakit na katawan at ang distansya sa pagitan nila).

ugnayan ang isang relasyon sa pagitan ng mga variable ng isang istatistikal na kalikasan ay tinatawag, kapag ang isang tiyak na halaga ng isang tampok (itinuturing bilang isang independiyenteng variable) ay tumutugma sa isang buong serye ng mga numerical na halaga ng isa pang tampok. ( Halimbawa: relasyon sa pagitan ng ani at pag-ulan; sa pagitan ng taas at timbang, atbp.).

Patlang ng ugnayan ay isang hanay ng mga puntos na ang mga coordinate ay katumbas ng nakuhang eksperimentong mga pares ng mga variable na halaga X at sa .

Sa pamamagitan ng anyo ng patlang ng ugnayan, maaaring hatulan ng isa ang pagkakaroon o kawalan ng isang koneksyon at ang uri nito.



Ang koneksyon ay tinatawag positibo kung ang pagtaas ng isang variable ay nagpapataas ng isa pang variable.

Ang koneksyon ay tinatawag negatibo kapag ang pagtaas sa isang variable ay bumababa sa isa pang variable.

Ang koneksyon ay tinatawag linear , kung maaari itong ilarawan nang analitikal bilang
.

Ang isang tagapagpahiwatig ng higpit ng koneksyon ay koepisyent ng ugnayan . Ang empirical correlation coefficient ay ibinibigay ng:

Ang koepisyent ng ugnayan ay nasa hanay mula sa -1 dati 1 at nailalarawan ang antas ng pagkakalapit sa pagitan ng mga dami x at y . Kung ang:


Ang pag-asa sa ugnayan sa pagitan ng mga tampok ay maaaring ilarawan sa iba't ibang paraan. Sa partikular, ang anumang anyo ng koneksyon ay maaaring ipahayag sa pamamagitan ng isang pangkalahatang equation
. Uri ng equation
at
tinawag regression . Direktang regression equation sa sa X sa pangkalahatan ay maaaring isulat sa anyo

Direktang regression equation X sa sa sa pangkalahatan ay mukhang

Ang pinaka-malamang na mga halaga ng mga coefficient a at sa, Sa at d maaaring kalkulahin, halimbawa, gamit ang least squares method.

Sa halimbawang ito, isaalang-alang natin kung paano tinatantya ang pagiging maaasahan ng nakuhang regression equation. Ang parehong pagsubok ay ginagamit upang subukan ang hypothesis na ang mga coefficient ng regression ay parehong zero, a=0 , b=0 . Sa madaling salita, ang kakanyahan ng mga kalkulasyon ay upang sagutin ang tanong: maaari ba itong magamit para sa karagdagang pagsusuri at pagtataya?

Gamitin ang t-test na ito upang matukoy ang pagkakatulad o pagkakaiba sa pagitan ng mga pagkakaiba sa dalawang sample.


Kaya, ang layunin ng pagsusuri ay upang makakuha ng ilang pagtatantya, sa tulong kung saan posible na igiit na, sa isang tiyak na antas ng α, ang resultang equation ng regression ay maaasahan sa istatistika. Para dito ginagamit ang coefficient of determination R 2.
Ang kahalagahan ng modelo ng regression ay sinusuri gamit ang Fisher's F-test, ang kinakalkula na halaga ay matatagpuan bilang ratio ng pagkakaiba-iba ng paunang serye ng mga obserbasyon ng indicator sa ilalim ng pag-aaral at ang walang pinapanigan na pagtatantya ng pagkakaiba ng natitirang sequence para sa modelong ito.
Kung ang kinakalkula na halaga na may k 1 =(m) at k 2 =(n-m-1) na antas ng kalayaan ay mas malaki kaysa sa halaga ng tabular sa isang partikular na antas ng kahalagahan, kung gayon ang modelo ay itinuturing na makabuluhan.

kung saan ang m ay ang bilang ng mga kadahilanan sa modelo.
Ang pagtatasa ng istatistikal na kahalagahan ng ipinares na linear regression ay isinasagawa ayon sa sumusunod na algorithm:
1. Isang null hypothesis ang iniharap na ang equation sa kabuuan ay hindi gaanong mahalaga ayon sa istatistika: H 0: R 2 =0 sa antas ng kahalagahan α.
2. Susunod, tukuyin ang aktwal na halaga ng F-criterion:


kung saan ang m=1 para sa pairwise regression.
3. Ang halaga ng talahanayan ay tinutukoy mula sa mga talahanayan ng pamamahagi ng Fisher para sa isang naibigay na antas ng kahalagahan, na isinasaalang-alang na ang bilang ng mga antas ng kalayaan para sa kabuuang kabuuan ng mga parisukat (mas malaking pagkakaiba) ay 1 at ang bilang ng mga antas ng kalayaan para sa natitirang kabuuan ng mga parisukat (mas mababang pagkakaiba) sa linear regression ay n-2 (o sa pamamagitan ng Excel function na FDISP(probability, 1, n-2)).
Ang F table ay ang pinakamataas na posibleng halaga ng criterion sa ilalim ng impluwensya ng mga random na salik para sa mga partikular na antas ng kalayaan at antas ng kahalagahan α. Significance level α - ang posibilidad na tanggihan ang tamang hypothesis, sa kondisyon na ito ay totoo. Karaniwan ang α ay kinukuha na katumbas ng 0.05 o 0.01.
4. Kung ang aktwal na halaga ng F-criterion ay mas mababa sa halaga ng talahanayan, pagkatapos ay sinasabi nila na walang dahilan upang tanggihan ang null hypothesis.
Kung hindi, ang null hypothesis ay tinatanggihan at ang alternatibong hypothesis tungkol sa istatistikal na kahalagahan ng equation sa kabuuan ay tinatanggap na may posibilidad (1-α).
Table value ng criterion na may degree of freedom k 1 =1 at k 2 =48, F table = 4

mga konklusyon: Dahil ang aktwal na halaga ng F > F table, ang koepisyent ng determinasyon ay makabuluhan ayon sa istatistika ( ang nahanap na pagtatantya ng equation ng regression ay maaasahan sa istatistika) .

Pagsusuri ng pagkakaiba-iba

.

Mga tagapagpahiwatig ng kalidad ng equation ng regression

Halimbawa. Batay sa isang kabuuang 25 na negosyo sa kalakalan, ang ugnayan sa pagitan ng mga palatandaan ay pinag-aralan: X - ang presyo ng mga kalakal A, libong rubles; Y - kita ng isang negosyo sa kalakalan, milyong rubles. Kapag sinusuri ang modelo ng regression, ang mga sumusunod na intermediate na resulta ay nakuha: ∑(y i -y x) 2 = 46000; ∑(y i -y sr) 2 = 138000. Anong tagapagpahiwatig ng ugnayan ang maaaring matukoy mula sa mga datos na ito? Kalkulahin ang halaga ng tagapagpahiwatig na ito, batay sa resulta at paggamit Fisher F-test gumawa ng konklusyon tungkol sa kalidad ng modelo ng regression.
Solusyon. Batay sa mga datos na ito, maaaring matukoy ang isang empirical na ugnayan: , kung saan ∑(y cf -y x) 2 = ∑(y i -y cf) 2 - ∑(y i -y x) 2 = 138000 - 46000 = 92,000.
η 2 = 92000/138000 = 0.67, η = 0.816 (0.7< η < 0.9 - связь между X и Y высокая).

Fisher F-test: n = 25, m = 1.
R 2 \u003d 1 - 46000 / 138000 \u003d 0.67, F \u003d 0.67 / (1-0.67)x (25 - 1 - 1) \u003d 46. F table (1; 23) \u003d 4.
Dahil ang aktwal na halaga ng F > Ftabl, ang nahanap na pagtatantya ng equation ng regression ay maaasahan sa istatistika.

Tanong: Anong istatistika ang ginagamit upang subukan ang kahalagahan ng isang modelo ng regression?
Sagot: Para sa kahalagahan ng buong modelo sa kabuuan, F-statistics (Fisher's criterion) ang ginagamit.