Talahanayan ng koepisyent ng ugnayan ng Spearman. Koepisyent ng ugnayan ng Spearman

Sa mga kaso kung saan ang mga sukat ng pinag-aralan na mga katangian ay isinasagawa sa isang sukat ng pagkakasunud-sunod, o ang anyo ng relasyon ay naiiba mula sa isang linear, ang pag-aaral ng relasyon sa pagitan ng dalawang random na mga variable ay isinasagawa gamit ang mga koepisyent ng ugnayan ng ranggo. Isaalang-alang ang koepisyent ugnayan ng ranggo Spearman. Kapag kinakalkula ito, kinakailangan na ranggo (pagkasunud-sunod) ang mga pagpipilian sa sample. Ang ranggo ay ang pagpapangkat ng pang-eksperimentong data sa isang tiyak na pagkakasunud-sunod, pataas man o pababa.

Ang operasyon ng pagraranggo ay isinasagawa ayon sa sumusunod na algorithm:

1. Ang isang mas mababang halaga ay itinalaga ng isang mas mababang ranggo. Ang pinakamataas na halaga ay itinalaga ng isang ranggo na naaayon sa bilang ng mga nararanggo na halaga. Ang pinakamaliit na halaga ay itinalaga ng ranggo na katumbas ng 1. Halimbawa, kung n=7, kung gayon pinakamataas na halaga ay makakatanggap ng ranggo bilang 7, maliban sa ibinigay sa pangalawang panuntunan.

2. Kung ang ilang mga halaga ay pantay-pantay, kung gayon sila ay itinalaga ng isang ranggo, na siyang average ng mga ranggo na sana ay natanggap nila kung sila ay hindi pantay. Bilang halimbawa, isaalang-alang ang isang pataas na sample na binubuo ng 7 elemento: 22, 23, 25, 25, 25, 28, 30. Ang mga halagang 22 at 23 ay nangyayari nang isang beses, kaya ang kanilang mga ranggo ay ayon sa pagkakabanggit ay katumbas ng R22=1, at R23 =2 . Ang halagang 25 ay nangyayari nang 3 beses. Kung ang mga halagang ito ay hindi naulit, ang kanilang mga ranggo ay magiging katumbas ng 3, 4, 5. Samakatuwid, ang kanilang ranggo na R25 ay katumbas ng arithmetic mean ng 3, 4 at 5: . Ang mga halaga 28 at 30 ay hindi umuulit, kaya ang kanilang mga ranggo ay ayon sa pagkakabanggit R28=6 at R30=7. Sa wakas, mayroon kaming sumusunod na sulat:

3. Ang kabuuang halaga ng mga ranggo ay dapat tumugma sa kinakalkula, na tinutukoy ng formula:

kung saan n - kabuuan ranggo na mga halaga.

Ang pagkakaiba sa pagitan ng aktwal at nakalkulang mga halaga ng mga ranggo ay magsasaad ng error na ginawa sa pagkalkula ng mga ranggo o sa kanilang pagbubuod. Sa kasong ito, kailangan mong hanapin at ayusin ang error.

Ang rank correlation coefficient ng Spearman ay isang paraan na nagbibigay-daan sa iyong matukoy ang lakas at direksyon ng ugnayan sa pagitan ng dalawang feature o dalawang feature hierarchy. Ang paggamit ng rank correlation coefficient ay may bilang ng mga limitasyon:

a) Ang inaasahang ugnayan ay dapat na monotoniko.
b) Ang dami ng bawat isa sa mga sample ay dapat na mas malaki kaysa sa o katumbas ng 5. Upang matukoy ang pinakamataas na limitasyon ng sample, ang mga talahanayan ng mga kritikal na halaga ay ginagamit (Talahanayan 3 ng Appendix). Ang maximum na halaga ng n sa talahanayan ay 40.
c) Sa panahon ng pagsusuri, malamang na ang isang malaking bilang ng magkatulad na ranggo ay magaganap. Sa kasong ito, kailangang gumawa ng pagbabago. Ang pinaka-kanais-nais na kaso ay kapag ang parehong pinag-aralan na mga sample ay kumakatawan sa dalawang pagkakasunud-sunod ng mga hindi tugmang halaga.

Para sa pagsusuri ng ugnayan Ang mananaliksik ay dapat magkaroon ng dalawang sample na maaaring mai-rank, halimbawa:

- dalawang palatandaan na sinusukat sa parehong pangkat ng mga paksa;
- dalawang indibidwal na hierarchy ng katangian na natukoy sa dalawang paksa para sa parehong hanay ng mga katangian;
- dalawang pangkat na hierarchy ng mga katangian;
- indibidwal at pangkat na mga hierarchy ng mga palatandaan.

Sinisimulan namin ang pagkalkula sa pagraranggo ng mga pinag-aralan na tagapagpahiwatig nang hiwalay para sa bawat isa sa mga palatandaan.

Suriin natin ang isang kaso na may dalawang tampok na sinusukat sa parehong pangkat ng mga paksa. Una, ang mga indibidwal na halaga ay niraranggo ayon sa unang katangian na nakuha ng iba't ibang mga paksa, at pagkatapos ay ang mga indibidwal na halaga ayon sa pangalawang katangian. Kung ang mas mababang mga ranggo ng isang tagapagpahiwatig ay tumutugma sa mas mababang mga ranggo ng isa pang tagapagpahiwatig, at ang mas mataas na mga ranggo ng isang tagapagpahiwatig ay tumutugma sa mas mataas na mga ranggo ng isa pang tagapagpahiwatig, kung gayon ang dalawang mga tampok ay positibong nauugnay. Kung ang mas mataas na ranggo ng isang tagapagpahiwatig ay tumutugma sa mas mababang ranggo ng isa pang tagapagpahiwatig, kung gayon ang dalawang palatandaan ay negatibong nauugnay. Upang mahanap ang rs, tinutukoy namin ang mga pagkakaiba sa pagitan ng mga ranggo (d) para sa bawat paksa. Kung mas maliit ang pagkakaiba sa pagitan ng mga ranggo, mas malapit ang rank correlation coefficient rs sa "+1". Kung walang relasyon, kung gayon walang magiging sulat sa pagitan nila, kaya ang rs ay magiging malapit sa zero. Kung mas malaki ang pagkakaiba sa pagitan ng mga ranggo ng mga paksa sa dalawang variable, mas malapit sa "-1" ang magiging halaga ng coefficient rs. Kaya, ang koepisyent ng ugnayan ng ranggo ng Spearman ay isang sukatan ng anumang monotonikong relasyon sa pagitan ng dalawang katangiang pinag-aaralan.

Isaalang-alang ang kaso na may dalawang indibidwal na hierarchy ng tampok na tinukoy sa dalawang paksa para sa parehong hanay ng mga tampok. Sa sitwasyong ito, ang mga indibidwal na halaga na nakuha ng bawat isa sa dalawang paksa ayon sa isang tiyak na hanay ng mga tampok ay niraranggo. Ang tampok na may pinakamababang halaga ay dapat italaga sa unang ranggo; ang katangian na may mas mataas na halaga - ang pangalawang ranggo, atbp. Dapat gawin ang pangangalaga upang matiyak na ang lahat ng mga katangian ay sinusukat sa parehong mga yunit. Halimbawa, imposibleng mag-ranggo ng mga tagapagpahiwatig kung ang mga ito ay ipinahayag sa iba't ibang "presyo" na mga punto, dahil imposibleng matukoy kung alin sa mga kadahilanan ang kukuha ng unang lugar sa kalubhaan hanggang ang lahat ng mga halaga ay dinadala sa isang solong sukat. Kung ang mga feature na may mababang rank sa isa sa mga subject ay may mababang rank din sa isa, at vice versa, ang mga indibidwal na hierarchy ay positibong nauugnay.

Sa kaso ng dalawang pangkat na hierarchy ng mga tampok, ang average na mga halaga ng pangkat na nakuha sa dalawang pangkat ng mga paksa ay niraranggo ayon sa parehong hanay ng mga tampok para sa mga pinag-aralan na grupo. Susunod, sinusunod namin ang algorithm na ibinigay sa mga nakaraang kaso.

Suriin natin ang kaso sa indibidwal at pangkat na hierarchy ng mga tampok. Nagsisimula sila sa hiwalay na pagraranggo ng mga indibidwal na halaga ng paksa at ang ibig sabihin ng mga halaga ng pangkat ayon sa parehong hanay ng mga tampok na nakuha, maliban sa paksa na hindi nakikilahok sa hierarchy ng mean group, dahil ang kanyang indibidwal ihahambing dito ang hierarchy. Ginagawang posible ng ugnayan ng ranggo na masuri ang antas ng pagkakapare-pareho sa pagitan ng indibidwal at pangkat na hierarchy ng mga tampok.

Isaalang-alang natin kung paano natutukoy ang kahalagahan ng koepisyent ng ugnayan sa mga kasong nakalista sa itaas. Sa kaso ng dalawang feature, matutukoy ito sa laki ng sample. Sa kaso ng dalawang indibidwal na hierarchy ng tampok, ang kahalagahan ay depende sa bilang ng mga tampok na kasama sa hierarchy. Sa huling dalawang kaso, ang kahalagahan ay tinutukoy ng bilang ng mga katangiang pinag-aralan, at hindi sa laki ng mga grupo. Kaya, ang kahalagahan ng rs sa lahat ng mga kaso ay tinutukoy ng bilang ng mga ranggo na halaga n.

Kapag sinusuri istatistikal na kahalagahan Gumagamit ang rs ng mga talahanayan ng mga kritikal na halaga ng koepisyent ng ugnayan ng ranggo na pinagsama-sama para sa iba't ibang bilang ng mga ranggo na halaga at iba't ibang antas kahalagahan. Kung ang ganap na halaga ng rs ay umabot sa isang kritikal na halaga o lumampas dito, kung gayon ang ugnayan ay makabuluhan.

Kapag isinasaalang-alang ang unang opsyon (isang kaso na may dalawang tampok na sinusukat sa parehong pangkat ng mga paksa), posible ang mga sumusunod na hypotheses.

H0: Ang ugnayan sa pagitan ng mga variable na x at y ay hindi naiiba sa zero.

H1: Ang ugnayan sa pagitan ng mga variable na x at y ay makabuluhang naiiba mula sa zero.

Kung gagawin natin ang alinman sa tatlong natitirang mga kaso, kailangan nating maglagay ng isa pang pares ng mga hypotheses:

H0: Ang ugnayan sa pagitan ng x at y hierarchies ay nonzero.

H1: Ang ugnayan sa pagitan ng x at y hierarchies ay makabuluhang naiiba mula sa zero.

Ang pagkakasunod-sunod ng mga aksyon sa pagkalkula ng Spearman rank correlation coefficient rs ay ang mga sumusunod.

- Tukuyin kung aling dalawang feature o dalawang feature hierarchy ang lalahok sa pagtutugma bilang mga variable na x at y.
- I-ranggo ang mga halaga ng variable x, na nagtatalaga ng ranggo ng 1 ang pinakamaliit na halaga, ayon sa mga panuntunan sa pagraranggo. Ilagay ang mga ranggo sa unang hanay ng talahanayan sa pagkakasunud-sunod ng mga bilang ng mga paksa o mga palatandaan.
- Ranggo ang mga halaga ng variable y. Ilagay ang mga ranggo sa ikalawang hanay ng talahanayan sa pagkakasunud-sunod ng mga bilang ng mga paksa o mga palatandaan.
- Kalkulahin ang mga pagkakaiba d sa pagitan ng mga ranggo x at y para sa bawat hilera ng talahanayan. Ang mga resulta ay inilalagay sa susunod na hanay ng talahanayan.
- Kalkulahin ang mga parisukat na pagkakaiba (d2). Ilagay ang mga nakuhang halaga sa ikaapat na hanay ng talahanayan.
- Kalkulahin ang kabuuan ng mga parisukat ng mga pagkakaiba? d2.
- Kung magkakaroon ng parehong mga ranggo, kalkulahin ang mga pagwawasto:

kung saan ang tx ay ang dami ng bawat pangkat ng pantay na ranggo sa sample x;

Ang ty ay ang laki ng bawat pangkat ng pantay na ranggo sa sample y.

Kalkulahin ang rank correlation coefficient depende sa presensya o kawalan ng magkatulad na ranggo. Sa kawalan ng magkaparehong mga ranggo, ang ranggo ng koepisyent ng ugnayan rs ay kinakalkula gamit ang formula:

Sa pagkakaroon ng parehong mga ranggo, ang koepisyent ng ugnayan ng ranggo rs ay kinakalkula gamit ang formula:

saan?d2 ay ang kabuuan ng mga parisukat na pagkakaiba sa pagitan ng mga ranggo;

Tx at Ty - mga pagwawasto para sa parehong mga ranggo;

n ay ang bilang ng mga paksa o tampok na lumahok sa pagraranggo.

Tukuyin ayon sa talahanayan 3 ng Apendiks kritikal na halaga rs, para sa isang naibigay na bilang ng mga paksa n. Ang isang makabuluhang pagkakaiba mula sa zero ng koepisyent ng ugnayan ay mapapansin kung ang rs ay hindi bababa sa kritikal na halaga.

Ang ugnayan ng ranggo ni Spearman(kaugnayan sa ranggo). Ang ugnayan ng ranggo ng Spearman ay ang pinakasimpleng paraan upang matukoy ang antas ng pagkakaugnay sa pagitan ng mga salik. Ang pangalan ng pamamaraan ay nagpapahiwatig na ang relasyon ay tinutukoy sa pagitan ng mga ranggo, iyon ay, ang serye ng mga nakuhang dami ng mga halaga, na niraranggo sa pababang o pagtaas ng pagkakasunud-sunod. Dapat itong isipin na, una, ang ugnayan ng ranggo ay hindi inirerekomenda kung ang koneksyon ng mga pares ay mas mababa sa apat at higit sa dalawampu; pangalawa, ang rank correlation ay nagpapahintulot sa iyo na matukoy ang relasyon sa ibang kaso, kung ang halaga ay semi-quantitative, iyon ay, wala silang pagpapahayag ng numero, sumasalamin sa isang malinaw na pagkakasunud-sunod ng mga dami na ito; pangatlo, ipinapayong gumamit ng rank correlation sa mga kaso kung saan ito ay sapat upang makakuha ng tinatayang data. Isang halimbawa ng pagkalkula ng rank correlation coefficient para matukoy ang tanong: sukatin ang questionnaire X at Y na magkatulad mga personal na katangian mga paksa ng pagsusulit. Sa tulong ng dalawang talatanungan (X at Y), na nangangailangan ng mga alternatibong sagot na "oo" o "hindi", ang mga pangunahing resulta ay nakuha - ang mga sagot ng 15 na paksa (N = 10). Ang mga resulta ay ipinakita bilang kabuuan ng mga sumasang-ayon na sagot nang hiwalay para sa Palatanungan X at Palatanungan B. Ang mga resultang ito ay buod sa Talahanayan 1. 5.19.

Talahanayan 5.19. Tabulasyon ng mga pangunahing resulta para kalkulahin ang koepisyent ng ugnayan ng ranggo ng Spearman (p) *

Pagsusuri ng summary correlation matrix. Paraan ng correlation pleiades.

Halimbawa. Sa mesa. Ipinapakita ng 6.18 ang interpretasyon ng labing-isang variable na sinusuri ayon sa pamamaraang Wechsler. Ang data ay nakuha sa isang homogenous na sample ng edad 18 hanggang 25 (n = 800).

Bago ang stratification, ipinapayong i-ranggo ang correlation matrix. Para dito sa orihinal na matris kalkulahin ang mga average na halaga ng mga koepisyent ng ugnayan ng bawat variable sa lahat ng iba pa.

Pagkatapos ay ayon sa talahanayan. 5.20 matukoy katanggap-tanggap na mga antas stratification ng correlation matrix para sa ibinigay antas ng kumpiyansa 0.95 at n - dami

Talahanayan 6.20. Pataas na correlation matrix

Mga variable	1	2	3	4	gagawin	0	7	8	0	10	11	M (rij)	Ranggo
1	1	0,637	0,488	0,623	0,282	0,647	0,371	0,485	0,371	0,365	0,336	0,454	1
2		1	0,810	0,557	0,291	0,508	0,173	0,486	0,371	0,273	0,273	0,363	4
3			1	0,346	0,291	0,406	0,360	0,818	0,346	0,291	0,282	0,336	7
4				1	0,273	0,572	0,318	0,442	0,310	0,318	0,291	0,414	3
5					1	0,354	0,254	0,216	0,236	0,207	0,149	0,264	11
6						1	0,365	0,405	0,336	0,345	0,282	0,430	2
7							1	0,310	0,388	0,264	0,266	0,310	9
8								1	0,897	0,363	0,388	0,363	5
9									1	0,388	0,430	0,846	6
10										1	0,336	0,310	8
11											1	0,300	10

Mga pagtatalaga: 1 - pangkalahatang kamalayan; 2 - konseptwalidad; 3 - pagkaasikaso; 4 - vdatnist K generalization; b - direktang pagsasaulo (sa mga numero) 6 - antas ng pag-unlad sariling wika; 7 - bilis ng pag-master ng mga kasanayan sa sensorimotor (coding sa pamamagitan ng mga simbolo); 8 - pagmamasid; 9 - mga kakayahang kombinatorial (para sa pagsusuri at synthesis); 10 - kakayahang ayusin ang mga bahagi sa isang makabuluhang kabuuan; 11 - kakayahan sa heuristic synthesis; M (rij) - ang average na halaga ng mga coefficient ng ugnayan ng variable kasama ang natitirang mga variable ng pagmamasid (sa aming kaso n = 800): r (0) - ang halaga ng zero "Cutting" plane - ang minimum na makabuluhang absolute halaga ng koepisyent ng ugnayan (n - 120, r (0) = 0.236, n = 40, r(0) = 0.407) | Δr | - tinatanggap na hakbang sa paghihiwalay (n = 40, | Δr | = 0.558) c - tinatanggap na bilang ng mga antas ng paghihiwalay (n = 40, s = 1; n = 120, s = 2); Ang r(1), r(2), ..., r(9) ay ang absolute value ng cutting plane (n=40, r(1)=0.965).

Para sa n = 800, nakita namin ang halaga ng rtype at ang mga hangganan ri, pagkatapos kung saan ang Stratifying ranged ang correlation matrix, highlight ang correlation pleiades sa loob ng mga layer, o paghiwalayin ang mga bahagi ng correlation matrix, pagguhit ng mga unyon ng correlation pleiades para sa ang mga nakapatong na layer (Larawan 5.5).

Ang isang makabuluhang pagsusuri ng mga nakuhang pleiades ay lumampas sa mga limitasyon ng mga istatistika ng matematika. Dapat pansinin ang dalawang pormal na tagapagpahiwatig na tumutulong sa makabuluhang interpretasyon ng Pleiades. Ang isang makabuluhang tagapagpahiwatig ay ang antas ng isang vertex, iyon ay, ang bilang ng mga gilid na katabi ng vertex. Variable na may ang pinakamalaking bilang ang mga gilid ay ang "core" ng kalawakan at maaari itong ituring bilang isang tagapagpahiwatig ng iba pang mga variable ng kalawakan na ito. Ang isa pang makabuluhang tagapagpahiwatig ay ang density ng komunikasyon. Ang isang variable ay maaaring may mas kaunting mga koneksyon sa isang kalawakan, ngunit mas malapit, at mas maraming koneksyon sa isa pang kalawakan, ngunit hindi gaanong malapit.

Mga hula at pagtatantya. Ang equation na y = b1x + b0 ay tinatawag pangkalahatang equation tuwid. Ito ay nagpapahiwatig na ang mga pares ng mga puntos (x, y), na

kanin. 5.5. Correlation Pleiades na Nakuha sa pamamagitan ng Matrix Splitting

nakahiga sa isang tuwid na linya, konektado sa paraang para sa anumang halaga ng x, ang halaga sa ipinares dito ay makikita sa pamamagitan ng pagpaparami ng x sa ilang numero b1 pagdaragdag ng pangalawa, ang numerong b0 sa produktong ito.

Ang regression coefficient ay nagpapahintulot sa iyo na matukoy ang antas ng pagbabago sa investigative factor kapag ang causal factor ay nagbabago ng isang unit. Ang mga ganap na halaga ay nagpapakita ng kaugnayan sa pagitan ng mga variable na kadahilanan sa pamamagitan ng kanilang mga ganap na halaga. Ang regression coefficient ay kinakalkula ng formula:

Pagpaplano at pagsusuri ng mga eksperimento. Ang pagpaplano at pagsusuri ng mga eksperimento ay ang ikatlong mahalagang sangay paraang istatistikal, na idinisenyo upang hanapin at subukan ang mga ugnayang sanhi sa pagitan ng mga variable.

Upang pag-aralan ang multifactorial dependencies sa kamakailang mga panahon Ang mga pamamaraan ng pagpaplano ng matematika ng eksperimento ay lalong ginagamit.

Ang posibilidad ng sabay-sabay na pagkakaiba-iba ng lahat ng mga kadahilanan ay nagbibigay-daan sa: a) upang mabawasan ang bilang ng mga eksperimento;

b) bawasan ang pang-eksperimentong error sa pinakamababa;

c) gawing simple ang pagproseso ng natanggap na data;

d) magbigay ng kalinawan at kadalian ng paghahambing ng mga resulta.

Ang bawat salik ay maaaring makakuha ng katumbas na bilang ng iba't ibang mga halaga, na tinatawag na mga antas at nagsasaad ng -1, 0 at 1. Tinutukoy ng isang nakapirming hanay ng mga antas ng salik ang mga kondisyon ng isa sa mga posibleng eksperimento.

Ang kabuuan ng lahat ng posibleng kumbinasyon ay kinakalkula ng formula:

Ang isang kumpletong factorial na eksperimento ay isang eksperimento kung saan ang lahat ng posibleng kumbinasyon ng mga antas ng factor ay ipinatupad. Ang buong factorial na mga eksperimento ay maaaring magkaroon ng pag-aari ng orthogonality. Sa orthogonal na pagpaplano, ang mga salik sa eksperimento ay walang kaugnayan, ang mga coefficient ng regression na kinakalkula bilang resulta ay independiyenteng tinutukoy ng bawat isa.

Ang isang mahalagang bentahe ng pamamaraan ng pagpaplano ng matematika ng isang eksperimento ay ang versatility at pagiging angkop nito sa maraming lugar ng pananaliksik.

Isaalang-alang natin ang isang halimbawa ng paghahambing ng impluwensya ng ilang mga kadahilanan sa pagbuo ng antas ng mental na stress sa mga color TV controllers.

Ang eksperimento ay batay sa orthogonal na Plano 2 tatlo (tatlong salik ang nagbabago sa dalawang antas).

Ang eksperimento ay isinagawa na may kumpletong bahagi 2 +3 na may tatlong beses na pag-uulit.

Ang orthogonal na pagpaplano ay batay sa pagbuo ng isang regression equation. Para sa tatlong kadahilanan, ganito ang hitsura:

Kasama sa pagproseso ng mga resulta sa halimbawang ito ang:

a) pagtatayo ng isang orthogonal plan 2 +3 table para sa pagkalkula;

b) pagkalkula ng mga coefficient ng regression;

c) suriin ang kanilang kahalagahan;

d) interpretasyon ng natanggap na data.

Para sa mga coefficient ng regression ng nabanggit na equation, kinakailangang ilagay ang N = 2 3 = 8 na mga opsyon upang masuri ang kahalagahan ng mga coefficient, kung saan ang bilang ng mga pag-uulit K ay 3.

Nag-compile ng isang experiment planning matrix ang hitsura.

Maikling teorya

Ang rank correlation ay isang paraan ng pagsusuri ng ugnayan na sumasalamin sa mga ratio ng mga variable na pinagsunod-sunod sa pataas na pagkakasunud-sunod ng kanilang halaga.

Ang mga ranggo ay ang mga ordinal na bilang ng mga yunit ng populasyon sa isang ranggo na serye. Kung niraranggo natin ang set ayon sa dalawang katangian, ang ugnayan sa pagitan ng pinag-aaralan, kung gayon ang kumpletong pagkakaisa ng mga ranggo ay nangangahulugang ang pinakamalapit na direktang koneksyon, at ang kumpletong kabaligtaran ng mga ranggo - ang pinakamalapit na feedback. Kinakailangang i-ranggo ang parehong mga tampok sa parehong pagkakasunud-sunod: alinman mula sa mas mababa hanggang sa mas mataas na mga halaga ng tampok, o kabaliktaran.

Para sa mga praktikal na layunin, ang paggamit ng rank correlation ay lubos na kapaki-pakinabang. Halimbawa, kung ang isang mataas na ranggo na ugnayan ay itinatag sa pagitan ng dalawang katangian ng kalidad ng mga produkto, kung gayon sapat na upang kontrolin ang mga produkto para lamang sa isa sa mga katangian, na nagpapababa sa gastos at nagpapabilis ng kontrol.

Ang koepisyent ng ugnayan ng ranggo, na iminungkahi ni K. Spearman, ay tumutukoy sa mga di-parametric na tagapagpahiwatig ng ugnayan sa pagitan ng mga variable na sinusukat sa isang sukat ng ranggo. Kapag kinakalkula ang koepisyent na ito, walang mga pagpapalagay na kinakailangan tungkol sa likas na katangian ng pamamahagi ng mga tampok sa pangkalahatang populasyon. Tinutukoy ng koepisyent na ito ang antas ng higpit ng koneksyon ng mga ordinal na tampok, na sa kasong ito ay kumakatawan sa mga ranggo ng mga inihambing na halaga.

Ang halaga ng koepisyent ng ugnayan ng Spearman ay nasa hanay ng +1 at -1. Maaari itong maging positibo o negatibo, na nagpapakilala sa direksyon ng ugnayan sa pagitan ng dalawang tampok na sinusukat sa sukat ng ranggo.

Ang koepisyent ng ugnayan ng ranggo ng Spearman ay kinakalkula ng formula:

Pagkakaiba sa pagitan ng mga ranggo sa dalawang variable

– bilang ng magkatugmang pares

Ang unang hakbang sa pagkalkula ng koepisyent ng ugnayan ng ranggo ay ang pagraranggo ng serye ng mga variable. Ang pamamaraan ng pagraranggo ay nagsisimula sa pag-aayos ng mga variable sa pataas na pagkakasunud-sunod ng kanilang mga halaga. Ang iba't ibang mga halaga ay itinalagang mga ranggo na tinutukoy natural na mga numero. Kung mayroong ilang mga variable ng pantay na halaga, sila ay itinalaga ng isang average na ranggo.

Ang bentahe ng koepisyent ng ugnayan ng ranggo ng Spearman ay posible na mag-ranggo ayon sa mga tampok na hindi maipahayag ayon sa numero: posible na mag-ranggo ng mga kandidato para sa isang tiyak na posisyon sa pamamagitan ng antas ng propesyonal, sa pamamagitan ng kakayahang manguna sa isang koponan, sa pamamagitan ng personal na kagandahan, atbp. Sa mga pagsusuri ng eksperto, posibleng i-ranggo ang mga pagtatasa ng iba't ibang eksperto at hanapin ang kanilang mga ugnayan sa isa't isa, upang hindi isama sa pagsasaalang-alang ang mga pagsusuri ng eksperto na mahina nauugnay sa mga pagtatasa ng iba pang mga eksperto. Ginagamit ang rank correlation coefficient ng Spearman upang masuri ang katatagan ng trend ng dinamika. Ang kawalan ng koepisyent ng ugnayan ng ranggo ay ang ganap na magkakaibang mga pagkakaiba sa mga halaga ng tampok ay maaaring tumutugma sa parehong mga pagkakaiba sa ranggo (sa kaso ng dami ng mga tampok). Samakatuwid, para sa huli, ang ugnayan ng mga ranggo ay dapat isaalang-alang na isang tinatayang sukatan ng higpit ng koneksyon, na may mas kaunting nilalaman ng impormasyon kaysa sa koepisyent ng ugnayan ng mga numerical na halaga ng mga tampok.

Halimbawa ng solusyon sa problema

Ang gawain

Ang isang survey ng random na piniling 10 mag-aaral na nakatira sa isang dormitoryo ng unibersidad ay nagpapakita ng kaugnayan sa pagitan ng average na marka batay sa mga resulta ng nakaraang session at ang bilang ng mga oras bawat linggo na ginugol ng mag-aaral sa sariling pag-aaral.

Tukuyin ang higpit ng koneksyon gamit ang Spearman rank correlation coefficient.

Kung may mga kahirapan sa paglutas ng mga problema, ang site ng site ay nagbibigay ng online na tulong sa mga mag-aaral sa mga istatistika na may mga pagsusulit sa bahay o pagsusulit.

Ang solusyon sa problema

Kalkulahin natin ang koepisyent ng ugnayan ng mga ranggo.

№

Ranging

Paghahambing ng Ranggo

Pagkakaiba ng Ranggo

4.7

3.1

-2

4.4

3.6

-2

3.8

3.7

-3

3.7

3.8

4.2

3.9

-3

4.3

3.6

4.2

4.3

3.1

4.4

3.9

4.7

Sum

Koepisyent ng ugnayan ng ranggo ng Spearman:

Ang pagpapalit ng mga numerical na halaga, nakukuha namin:

Konklusyon sa problema

Ang kaugnayan sa pagitan ng average na marka batay sa mga resulta ng nakaraang session at ang bilang ng mga oras bawat linggo na ginugol ng mag-aaral sa pag-aaral sa sarili, katamtamang higpit.

Kung ang mga deadline para sa paghahatid kontrol sa trabaho nauubusan, sa site maaari kang palaging mag-order ng isang mabilis na solusyon sa mga problema sa mga istatistika.

Katamtaman ang halaga ng paglutas ng control work ay 700 - 1200 rubles (ngunit hindi bababa sa 300 rubles para sa buong order). Ang presyo ay malakas na naiimpluwensyahan ng madaliang pagdedesisyon (mula sa mga araw hanggang ilang oras). Ang halaga ng online na tulong sa pagsusulit / pagsubok - mula sa 1000 rubles. para sa solusyon sa tiket.

Maaari mong tanungin ang lahat ng mga katanungan tungkol sa gastos nang direkta sa chat, pagkatapos i-drop ang kondisyon ng mga gawain at ipaalam sa iyo ang mga deadline para sa paglutas nito. Ang oras ng pagtugon ay ilang minuto.

Mga halimbawa ng mga kaugnay na gawain

Koepisyent ng Fechner
Ibinigay maikling teorya at isang halimbawa ng paglutas ng problema ng pagkalkula ng koepisyent ng ugnayan ng mga palatandaan ng Fechner ay isinasaalang-alang.

Mutual contingency coefficients ng Chuprov at Pearson
Ang pahina ay naglalaman ng impormasyon sa mga pamamaraan para sa pag-aaral ng ugnayan sa pagitan ng mga katangian ng husay gamit ang mga coefficient ng magkaparehong contingency ng Chuprov at Pearson.

Ang calculator sa ibaba ay kinakalkula ang Spearman rank correlation coefficient sa pagitan ng dalawang random na variable. Ang teoretikal na bahagi, upang hindi magambala mula sa calculator, ay tradisyonal na inilalagay sa ilalim nito.

idagdag import_export mode_edit tanggalin

Mga pagbabago sa mga random na variable

	arrow_pataasarrow_pababa X	arrow_pataasarrow_pababa Y
			mode_edit

Laki ng pahina: 5 10 20 50 100 chevron_left chevron_right

Mga pagbabago sa mga random na variable

Mag-import ng data Error sa pag-import

Maaari mong gamitin ang isa sa mga character na ito upang paghiwalayin ang mga field: Tab, ";" o "," Halimbawa: -50.5;-50.5

I-import Bumalik Kanselahin

Ang paraan para sa pagkalkula ng Spearman rank correlation coefficient ay talagang inilarawan nang napakasimple. Ito ang parehong koepisyent ng ugnayan ng Pearson, kinakalkula lamang hindi para sa mga resulta ng pagsukat mismo mga random na variable, at para sa kanila mga halaga ng ranggo.

Yan ay,

Ito ay nananatiling lamang upang malaman kung ano ang mga halaga ng pagraranggo at kung bakit kailangan ang lahat ng ito.

Kung ang mga elemento ng variational series ay nakaayos sa pataas o pababang pagkakasunud-sunod, kung gayon ranggo element ang magiging numero nito sa order na seryeng ito.

Halimbawa, sabihin nating mayroon tayong serye ng variation (17,26,5,14,21). Pagbukud-bukurin ang mga elemento nito sa pababang pagkakasunud-sunod (26,21,17,14,5). Ang 26 ay may ranggo 1, ang 21 ay may ranggo 2, at iba pa. Ang serye ng pagkakaiba-iba ng mga halaga ng ranggo ay magiging ganito (3,1,5,4,2).

Iyon ay, kapag kinakalkula ang koepisyent ng Spearman, ang inisyal serye ng pagkakaiba-iba ay na-convert sa mga serye ng pagkakaiba-iba ng mga halaga ng ranggo, pagkatapos kung saan ang Pearson formula ay inilapat sa kanila.

Mayroong isang subtlety - ang ranggo ng mga paulit-ulit na halaga ay kinuha bilang average ng mga ranggo. Iyon ay, para sa serye (17, 15, 14, 15), ang serye ng mga halaga ng ranggo ay magmumukhang (1, 2.5, 4, 2.5), dahil ang unang elemento na katumbas ng 15 ay may ranggo na 2, at ang pangalawa - isang ranggo ng 3, at .

Kung walang mga umuulit na halaga, iyon ay, ang lahat ng mga halaga ng serye ng pagraranggo ay mga numero mula sa hanay mula 1 hanggang n, ang formula ng Pearson ay maaaring gawing simple sa

Well, sa pamamagitan ng paraan, ang formula na ito ay madalas na ibinibigay bilang isang formula para sa pagkalkula ng koepisyent ng Spearman.

Ano ang kakanyahan ng paglipat mula sa mga halaga mismo sa kanilang mga halaga ng ranggo?
At ang punto ay na sa pamamagitan ng pagsusuri sa ugnayan ng mga halaga ng ranggo, maitatag ng isa kung gaano kahusay ang pag-asa ng dalawang variable ay inilarawan ng isang monotonikong function.

Ang tanda ng koepisyent ay nagpapahiwatig ng direksyon ng relasyon sa pagitan ng mga variable. Kung ang tanda ay positibo, kung gayon ang mga halaga ng Y ay may posibilidad na tumaas habang tumataas ang mga halaga ng X; kung negatibo ang sign, ang mga halaga ng Y ay may posibilidad na bumaba habang tumataas ang mga halaga ng X. Kung ang koepisyent ay 0, kung gayon walang trend. Kung ang koepisyent ay katumbas ng 1 o -1, kung gayon ang relasyon sa pagitan ng X at Y ay may anyo monotonikong pag-andar- iyon ay, sa isang pagtaas sa X, Y din ay tumataas, o vice versa, na may isang pagtaas sa X, Y ay bumababa.

Iyon ay, hindi katulad ng koepisyent ng ugnayan ng Pearson, na maaaring magbunyag lamang ng isang linear na pagdepende ng isang variable sa isa pa, ang koepisyent ng ugnayan ng Spearman ay maaaring magbunyag ng isang monotonic na pagdepende, kung saan ang isang direktang linear na relasyon ay hindi ipinahayag.

Hayaan akong ipaliwanag sa isang halimbawa. Ipagpalagay natin na sinusuri natin ang function na y=10/x.
Mayroon kaming mga sumusunod na resulta ng pagsukat ng X at Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Para sa mga datos na ito, ang koepisyent ng ugnayan ng Pearson ay -0.4686, iyon ay, mahina o wala ang relasyon. Ngunit ang koepisyent ng ugnayan ng Spearman ay mahigpit na katumbas ng -1, na, kumbaga, ay nagpapahiwatig sa mananaliksik na ang Y ay may mahigpit na negatibong monotonikong pagdepende sa X.

Ang Pearson correlation ay isang sukatan ng linear na relasyon sa pagitan ng dalawang variable. Binibigyang-daan ka nitong matukoy kung gaano proporsyonal ang pagkakaiba-iba ng dalawang variable. Kung ang mga variable ay proporsyonal sa isa't isa, kung gayon ang graphical na relasyon sa pagitan ng mga ito ay maaaring katawanin bilang isang tuwid na linya na may positibo (direktang proporsyon) o negatibo (kabaligtaran na proporsyon) na slope.

Sa pagsasagawa, ang relasyon sa pagitan ng dalawang variable, kung mayroon man, ay probabilistic at graphical na mukhang isang ellipsoidal scatter cloud. Ang ellipsoid na ito, gayunpaman, ay maaaring katawanin (tinatayang) bilang isang tuwid na linya, o isang linya ng regression. Ang linya ng regression ay isang tuwid na linya na binuo ng pamamaraan hindi bababa sa mga parisukat: ang kabuuan ng mga squared na distansya (kinakalkula kasama ang y-axis) mula sa bawat punto ng scatter plot hanggang sa tuwid na linya ay ang pinakamababa

Espesyal na kahulugan upang matantya ang katumpakan ng hula ay may pagkakaiba-iba ng mga pagtatantya ng dependent variable. Sa esensya, ang pagkakaiba ng mga pagtatantya ng dependent variable Y ay bahagi ng kabuuang pagkakaiba nito na dahil sa impluwensya ng independent variable X. Sa madaling salita, ang ratio ng variance ng mga pagtatantya ng dependent variable sa tunay na variance nito ay katumbas ng parisukat ng koepisyent ng ugnayan.

Ang parisukat ng koepisyent ng ugnayan ng umaasa at independiyenteng mga variable ay kumakatawan sa proporsyon ng pagkakaiba-iba ng umaasa na baryabol dahil sa impluwensya ng malayang baryabol, at tinatawag na koepisyent ng pagpapasiya. Ang coefficient of determination, samakatuwid, ay nagpapakita ng lawak kung saan ang pagkakaiba-iba ng isang variable ay dahil (natukoy) sa pamamagitan ng impluwensya ng isa pang variable.

Ang determination coefficient ay may mahalagang kalamangan sa correlation coefficient. Ang ugnayan __________ ay hindi isang linear function ng relasyon sa pagitan ng dalawang variable. Samakatuwid, ang arithmetic mean ng correlation coefficients para sa ilang sample ay hindi tumutugma sa correlation na kinakalkula kaagad para sa lahat ng subject mula sa mga sample na ito (i.e., ang correlation coefficient ay hindi additive). Sa kabaligtaran, ang koepisyent ng pagpapasiya ay sumasalamin sa relasyon nang linear at, samakatuwid, ay additive: maaari itong i-average sa ilang mga sample.

Karagdagang impormasyon tungkol sa lakas ng relasyon ay nagbibigay ng halaga ng correlation coefficient squared - ang coefficient of determination: ito ang bahagi ng variance ng isang variable na maaaring ipaliwanag sa pamamagitan ng impluwensya ng isa pang variable. Sa kaibahan sa koepisyent ng ugnayan, ang koepisyent ng pagpapasiya ay tumataas nang linear na may pagtaas sa lakas ng koneksyon.

Spearman at τ-Kendall correlation coefficients (ranggo correlations)

Kung ang parehong mga variable sa pagitan ng kung saan ang relasyon ay pinag-aaralan ay ipinakita sa isang ordinal na sukat, o ang isa sa mga ito ay nasa isang ordinal na sukat at ang isa ay nasa isang sukatan ng sukatan, pagkatapos ay ilapat mga koepisyent ng ranggo mga ugnayan: Spearman o τ-Kendell. Ang parehong coefficient ay nangangailangan ng paunang pagraranggo ng parehong mga variable para sa kanilang aplikasyon.

Ang rank correlation coefficient ng Spearman ay nonparametric na pamamaraan, na ginagamit para sa layunin ng istatistikal na pag-aaral ng kaugnayan sa pagitan ng mga phenomena. Sa kasong ito, ang aktwal na antas ng paralelismo sa pagitan ng dalawa dami na serye ng mga pinag-aralan na mga palatandaan at isang pagtatasa ng higpit ng itinatag na koneksyon ay ibinibigay gamit ang isang quantitatively expressed coefficient.

Kung ang mga miyembro ng isang pangkat ay unang niraranggo ng variable na x at pagkatapos ay ng variable na y, kung gayon ang ugnayan sa pagitan ng mga variable na x at y ay maaaring makuha sa pamamagitan lamang ng pagkalkula ng koepisyent ng Pearson para sa dalawang serye ng ranggo. Sa kondisyon na walang mga link sa mga ranggo (ibig sabihin, walang paulit-ulit na mga ranggo) para sa alinmang variable, ang formula para sa Pearson ay maaaring makabuluhang pasimplehin sa computation at ma-convert sa formula na kilala bilang Spearman.

Ang kapangyarihan ng koepisyent ng ugnayan ng ranggo ng Spearman ay medyo mas mababa sa kapangyarihan ng koepisyent ng ugnayan ng parametric.

Maipapayo na gamitin ang koepisyent ng ugnayan ng ranggo sa pagkakaroon ng isang maliit na bilang ng mga obserbasyon. Ang pamamaraang ito ay maaaring gamitin hindi lamang para sa quantitatively expressed data, kundi pati na rin sa mga kaso kung saan ang mga naitala na halaga ay tinutukoy ng mga mapaglarawang tampok na may iba't ibang intensity.

Ang koepisyent ng ugnayan ng ranggo ng Spearman na may malaking bilang ng magkaparehong mga ranggo para sa isa o pareho sa mga inihambing na variable ay nagbibigay ng mga magaspang na halaga. Sa isip, ang parehong magkakaugnay na serye ay dapat na dalawang pagkakasunud-sunod ng mga hindi tugmang halaga.

Ang isang kahalili sa ugnayan ng Spearman para sa mga ranggo ay ang ugnayang τ-Kendall. Ang ugnayan na iminungkahi ni M. Kendall ay batay sa ideya na ang direksyon ng koneksyon ay maaaring hatulan sa pamamagitan ng paghahambing ng mga paksa sa mga pares: kung ang isang pares ng mga paksa ay may pagbabago sa x na tumutugma sa direksyon na may pagbabago sa y, kung gayon ito ay nagpapahiwatig ng isang positibong relasyon, kung hindi tumutugma - isang bagay tungkol sa isang negatibong relasyon.