Paano makalkula ang ugnayan sa Excel. Maramihang koepisyent ng ugnayan sa Excel (Excel)

Ang Pearson correlation test ay isang paraan ng parametric statistics na nagpapahintulot sa iyo na matukoy ang presensya o kawalan ng isang linear na relasyon sa pagitan ng dalawa. mga tagapagpahiwatig ng dami, pati na rin ang pagtatasa ng higpit at istatistikal na kahalagahan nito. Sa madaling salita, ang Pearson correlation test ay nagpapahintulot sa iyo na matukoy kung mayroong isang linear na relasyon sa pagitan ng mga pagbabago sa mga halaga ng dalawang variable. Sa mga istatistikal na kalkulasyon at mga hinuha, ang koepisyent ng ugnayan ay karaniwang tinutukoy bilang r xy o Rxy.

1. Kasaysayan ng pagbuo ng pamantayan ng ugnayan

Ang Pearson correlation test ay binuo ng isang pangkat ng mga British scientist na pinamumunuan ni Karl Pearson(1857-1936) noong 90s ng ika-19 na siglo, upang gawing simple ang pagsusuri ng covariance ng dalawang random na variable. Bilang karagdagan kay Karl Pearson, nagtrabaho din ang mga tao sa pamantayan ng ugnayan ng Pearson Francis Edgeworth At Raphael Weldon.

2. Para saan ang Pearson correlation test ang ginagamit?

Ang Pearson correlation test ay nagpapahintulot sa iyo na matukoy ang lapit (o lakas) ng ugnayan sa pagitan ng dalawang indicator na sinusukat sa isang quantitative scale. Gamit ang mga karagdagang kalkulasyon, matutukoy mo rin kung gaano kahalaga sa istatistika ang natukoy na relasyon.

Halimbawa, gamit ang Pearson correlation criterion, masasagot mo ang tanong kung mayroong koneksyon sa pagitan ng temperatura ng katawan at ng nilalaman ng mga leukocytes sa dugo sa panahon ng mga impeksyon sa talamak na respiratory, sa pagitan ng taas at bigat ng pasyente, sa pagitan ng nilalaman ng Inuming Tubig fluoride at ang saklaw ng mga karies ng ngipin sa populasyon.

3. Mga kundisyon at limitasyon para sa paglalapat ng Pearson chi-square test

  1. Ang mga maihahambing na tagapagpahiwatig ay dapat masukat sa quantitative scale(halimbawa, tibok ng puso, temperatura ng katawan, bilang ng puting selula ng dugo bawat 1 ml ng dugo, systolic na presyon ng dugo).
  2. Gamit ang Pearson correlation test, maaari lamang nating matukoy presensya at lakas ng linear na relasyon sa pagitan ng dami. Ang iba pang mga katangian ng relasyon, kabilang ang direksyon (direkta o baligtad), ang likas na katangian ng mga pagbabago (rectilinear o curvilinear), pati na rin ang pagkakaroon ng pag-asa ng isang variable sa isa pa, ay tinutukoy gamit ang pagsusuri ng regression.
  3. Ang bilang ng mga inihambing na dami ay dapat na katumbas ng dalawa. Sa kaso ng pag-aaral ng relasyon ng tatlo o higit pang mga parameter, dapat mong gamitin ang pamamaraan factor analysis.
  4. Ang Pearson correlation test ay parametric, at samakatuwid ang kundisyon para sa paggamit nito ay normal na pamamahagi inihambing ang mga variable. Kung kinakailangan na magsagawa ng pagsusuri ng ugnayan ng mga tagapagpahiwatig na ang distribusyon ay naiiba sa normal, kabilang ang mga sinusukat sa ordinal na sukat, dapat gamitin ang koepisyent ng ugnayan ng ranggo ng Spearman.
  5. Ang mga konsepto ng pag-asa at ugnayan ay dapat na malinaw na nakikilala. Ang pag-asa ng mga dami ay tumutukoy sa pagkakaroon ng isang ugnayan sa pagitan nila, ngunit hindi sa kabaligtaran.

Halimbawa, ang taas ng isang bata ay depende sa kanyang edad, iyon ay, ano nakatatandang bata, mas mataas ito. Kung kukuha tayo ng dalawang bata na magkaibang edad, kung gayon na may mataas na antas ng posibilidad na ang paglaki ng mas matandang bata ay mas malaki kaysa sa mas bata. Ang kababalaghang ito ay tinatawag pagkagumon, na nagpapahiwatig ng sanhi-at-bunga na relasyon sa pagitan ng mga tagapagpahiwatig. Siyempre, sa pagitan nila ay mayroon din koneksyon ng ugnayan, ibig sabihin ang mga pagbabago sa isang indicator ay sinamahan ng mga pagbabago sa isa pang indicator.

Sa ibang sitwasyon, isaalang-alang ang kaugnayan sa pagitan ng taas ng bata at tibok ng puso (HR). Tulad ng nalalaman, ang parehong mga halagang ito ay direktang nakasalalay sa edad, kaya sa karamihan ng mga kaso, ang mga bata na mas mataas (at samakatuwid ay mas matanda) ay magkakaroon ng mas mababang mga halaga ng rate ng puso. Yan ay, koneksyon ng ugnayan ay oobserbahan at maaaring magkaroon ng medyo mataas na crowding. Gayunpaman, kung kukunin natin ang mga bata parehong edad, Ngunit iba't ibang taas, kung gayon, malamang, ang kanilang rate ng puso ay hindi gaanong magkakaiba, at samakatuwid ay maaari nating tapusin iyon pagsasarili Ang rate ng puso mula sa taas.

Ang halimbawa sa itaas ay nagpapakita kung gaano kahalaga ang pagkilala sa pagitan ng mga pangunahing konsepto sa mga istatistika. mga komunikasyon At dependencies mga tagapagpahiwatig para sa pagguhit ng tamang konklusyon.

4. Paano makalkula ang koepisyent ng ugnayan ng Pearson?

Ang Pearson correlation coefficient ay kinakalkula gamit ang sumusunod na formula:

5. Paano bigyang-kahulugan ang halaga ng koepisyent ng ugnayan ng Pearson?

Ang mga halaga ng koepisyent ng ugnayan ng Pearson ay binibigyang kahulugan batay sa kanilang mga ganap na halaga. Ang mga posibleng halaga ng koepisyent ng ugnayan ay nag-iiba mula 0 hanggang ±1. Kung mas malaki ang absolute value ng r xy, mas mataas ang closeness ng relasyon sa pagitan ng dalawang quantity. r xy = 0 ay nagpapahiwatig ng kumpletong kakulangan ng komunikasyon. r xy = 1 – nagpapahiwatig ng pagkakaroon ng ganap (functional) na koneksyon. Kung ang halaga ng criterion ng ugnayan ng Pearson ay lumalabas na higit sa 1 o mas mababa sa -1, nagkaroon ng error sa mga kalkulasyon.

Upang masuri ang higpit, o lakas, ng isang ugnayan, karaniwang tinatanggap na pamantayan ang karaniwang ginagamit, ayon sa kung saan ang mga ganap na halaga ng r xy< 0.3 свидетельствуют о mahina koneksyon, mga halaga ng r xy mula 0.3 hanggang 0.7 - tungkol sa koneksyon karaniwan higpit, mga halaga ng r xy > 0.7 - o malakas mga komunikasyon.

Ang isang mas tumpak na pagtatantya ng lakas ng ugnayan ay maaaring makuha kung gagamitin mo Chaddock table:

Grade istatistikal na kahalagahan Ang correlation coefficient r xy ay isinasagawa gamit ang t-test, na kinakalkula gamit ang sumusunod na formula:

Ang resultang t r halaga ay inihambing sa kritikal na halaga sa isang tiyak na antas ng kahalagahan at bilang ng mga antas ng kalayaan n-2. Kung lumampas ang t r sa t krit, bubuuin ang isang konklusyon tungkol sa istatistikal na kahalagahan ng natukoy na ugnayan.

6. Halimbawa ng pagkalkula ng Pearson correlation coefficient

Ang layunin ng pag-aaral ay upang matukoy, matukoy ang pagiging malapit at istatistikal na kahalagahan ng ugnayan sa pagitan ng dalawang quantitative indicator: ang antas ng testosterone sa dugo (X) at ang porsyento masa ng kalamnan sa katawan (Y). Ang paunang data para sa isang sample na binubuo ng 5 paksa (n = 5) ay ibinubuod sa talahanayan.

SA siyentipikong pananaliksik Kadalasan mayroong pangangailangan na makahanap ng koneksyon sa pagitan ng kinalabasan at mga variable ng kadahilanan (ang ani ng isang pananim at ang dami ng pag-ulan, ang taas at bigat ng isang tao sa magkakatulad na grupo ayon sa kasarian at edad, pulso at temperatura ng katawan, atbp.) .

Ang pangalawa ay mga palatandaan na nag-aambag sa mga pagbabago sa mga nauugnay sa kanila (ang una).

Ang konsepto ng pagsusuri ng ugnayan

Marami Batay sa nabanggit, masasabi natin na ang pagsusuri ng ugnayan ay isang paraan na ginagamit upang subukan ang hypothesis tungkol sa istatistikal na kahalagahan ng dalawa o higit pang mga variable kung ang mananaliksik ay maaaring masukat ang mga ito, ngunit hindi ito babaguhin.

Mayroong iba pang mga kahulugan ng konsepto na pinag-uusapan. Ang pagsusuri ng ugnayan ay isang paraan ng pagproseso na kinabibilangan ng pag-aaral ng mga koepisyent ng ugnayan sa pagitan ng mga variable. Sa kasong ito, ang mga coefficient ng ugnayan sa pagitan ng isang pares o maraming mga pares ng mga katangian ay inihahambing upang magtatag ng mga istatistikal na relasyon sa pagitan nila. Ang pagtatasa ng ugnayan ay isang pamamaraan para sa pag-aaral ng istatistikal na pag-asa sa pagitan ng mga random na variable na may opsyonal na presensya ng isang mahigpit na katangian ng pagganap, kung saan ang dinamika ng isa random variable humahantong sa dynamics inaasahan sa matematika isa pa.

Ang konsepto ng maling ugnayan

Kapag nagsasagawa ng pagtatasa ng ugnayan, kinakailangang isaalang-alang na maaari itong isagawa na may kaugnayan sa anumang hanay ng mga katangian, kadalasang walang katotohanan na may kaugnayan sa bawat isa. Minsan wala silang causal connection sa isa't isa.

Sa kasong ito, pinag-uusapan nila ang isang maling ugnayan.

Mga problema sa pagsusuri ng ugnayan

Batay sa mga kahulugan sa itaas, maaari nating bumalangkas ang mga sumusunod na gawain ng inilarawang pamamaraan: kumuha ng impormasyon tungkol sa isa sa mga hinahangad na variable gamit ang isa pa; tukuyin ang lapit ng ugnayan sa pagitan ng mga pinag-aralan na baryabol.

Ang pagsusuri ng ugnayan ay kinabibilangan ng pagtukoy sa kaugnayan sa pagitan ng mga katangiang pinag-aaralan, at samakatuwid ang mga gawain ng pagsusuri ng ugnayan ay maaaring dagdagan ng mga sumusunod:

  • pagkilala sa mga salik na nakakaimpluwensya pinakamalaking impluwensya sa isang epektibong tanda;
  • pagkakakilanlan ng mga hindi pa natuklasang dahilan ng mga koneksyon;
  • pagbuo ng isang modelo ng ugnayan kasama ang parametric analysis nito;
  • pag-aaral ng kahalagahan ng mga parameter ng komunikasyon at ang kanilang pagtatasa ng pagitan.

Relasyon sa pagitan ng pagsusuri ng ugnayan at pagbabalik

Ang paraan ng pagsusuri ng ugnayan ay kadalasang hindi limitado sa paghahanap ng lapit ng ugnayan sa pagitan ng mga pinag-aralan na dami. Minsan ito ay pupunan ng pagsasama-sama ng mga equation ng regression, na nakuha gamit ang pagsusuri ng parehong pangalan, at na kumakatawan sa isang paglalarawan ng pag-asa sa ugnayan sa pagitan ng resulta at kadahilanan (factor) na katangian (mga tampok). Ang pamamaraang ito, kasama ang pagsusuri na isinasaalang-alang, ay bumubuo ng pamamaraan

Mga kondisyon para sa paggamit ng pamamaraan

Ang mga mabisang salik ay nakasalalay sa isa hanggang sa ilang salik. Maaaring gamitin ang paraan ng pagsusuri ng ugnayan kung mayroon malaking bilang ng mga obserbasyon tungkol sa halaga ng mga mabisa at mga tagapagpahiwatig ng salik (mga kadahilanan), habang ang mga pinag-aralan na mga salik ay dapat na dami at makikita sa mga tiyak na mapagkukunan. Ang una ay maaaring matukoy ng normal na batas - sa kasong ito, ang resulta ng pagsusuri ng ugnayan ay ang mga coefficient ng ugnayan ng Pearson, o, kung ang mga katangian ay hindi sumusunod sa batas na ito, ang koepisyent ay ginagamit ugnayan ng ranggo Spearman.

Mga panuntunan para sa pagpili ng mga salik sa pagsusuri ng ugnayan

Kapag inilalapat ang pamamaraang ito, kinakailangan upang matukoy ang mga salik na nakakaimpluwensya sa mga tagapagpahiwatig ng pagganap. Pinili ang mga ito na isinasaalang-alang ang katotohanan na dapat mayroong sanhi-at-epekto na mga relasyon sa pagitan ng mga tagapagpahiwatig. Sa kaso ng paglikha ng isang multifactor correlation model, ang mga may malaking epekto sa resultang indicator ay pinipili, habang mas mainam na huwag isama ang mga interdependent factor na may pares na coefficient ng correlation na higit sa 0.85 sa correlation model, gayundin ang mga iyon. kung saan ang relasyon sa resultang parameter ay hindi linear o functional na character.

Ipinapakita ang mga resulta

Ang mga resulta ng pagsusuri ng ugnayan ay maaaring ipakita sa teksto at mga graphic na anyo. Sa unang kaso sila ay ipinakita bilang isang koepisyent ng ugnayan, sa pangalawa - sa anyo ng isang scatter diagram.

Kung walang ugnayan sa pagitan ng mga parameter, ang mga punto sa diagram ay matatagpuan sa chaotically, ang average na antas ng koneksyon ay nailalarawan sa pamamagitan ng sa mas malaking lawak pagkakasunud-sunod at nailalarawan sa pamamagitan ng higit pa o hindi gaanong pare-parehong distansya ng mga markang marka mula sa median. Ang isang malakas na koneksyon ay malamang na tuwid at sa r=1 ang tuldok na plot ay isang patag na linya. Ang reverse correlation ay naiiba sa direksyon ng graph mula sa kaliwang itaas hanggang sa kanang ibaba, direktang ugnayan - mula sa kaliwang ibaba hanggang sa kanang sulok sa itaas.

3D na representasyon ng isang scatter plot

Bilang karagdagan sa tradisyonal na representasyon ng 2D scatter plot, ginagamit na ngayon ang isang 3D display grapikal na presentasyon pagsusuri ng ugnayan.

Ginagamit din ang scatterplot matrix, na nagpapakita ng lahat ng nakapares na plot sa isang figure sa isang matrix na format. Para sa n variable, ang matrix ay naglalaman ng n row at n column. Ang tsart na matatagpuan sa intersection ng i-th row at ang j-th column ay isang plot ng mga variable na Xi versus Xj. Kaya, ang bawat row at column ay isang dimensyon, ang isang solong cell ay nagpapakita ng scatterplot ng dalawang dimensyon.

Pagtatasa ng higpit ng koneksyon

Ang lapit ng koneksyon ng ugnayan ay tinutukoy ng koepisyent ng ugnayan (r): malakas - r = ±0.7 hanggang ±1, medium - r = ±0.3 hanggang ±0.699, mahina - r = 0 hanggang ±0.299. Ang pag-uuri na ito ay hindi mahigpit. Ang figure ay nagpapakita ng isang bahagyang naiibang diagram.

Isang halimbawa ng paggamit ng paraan ng pagsusuri ng ugnayan

Isang kawili-wiling pag-aaral ang isinagawa sa UK. Ito ay nakatuon sa koneksyon sa pagitan ng paninigarilyo at kanser sa baga, at isinagawa sa pamamagitan ng pagsusuri ng ugnayan. Ang pagmamasid na ito ay ipinakita sa ibaba.

Paunang data para sa pagsusuri ng ugnayan

Propesyonal na grupo

mortalidad

Mga magsasaka, kagubatan at mangingisda

Mga minero at manggagawa sa quarry

Mga tagagawa ng gas, coke at mga kemikal

Mga tagagawa ng salamin at keramika

Mga manggagawa ng furnace, forges, foundries at rolling mill

Mga manggagawa sa elektrikal at elektroniko

Engineering at mga kaugnay na propesyon

Mga industriyang gawa sa kahoy

Mga manggagawa sa balat

Mga manggagawa sa tela

Mga tagagawa ng damit para sa trabaho

Mga manggagawa sa industriya ng pagkain, inumin at tabako

Mga Tagagawa ng Papel at Print

Mga tagagawa ng iba pang mga produkto

Mga tagabuo

Mga pintor at dekorador

Mga driver ng mga nakatigil na makina, crane, atbp.

Mga manggagawang hindi kasama sa ibang lugar

Mga manggagawa sa transportasyon at komunikasyon

Warehouse workers, storekeepers, packers at filling machine workers

Mga manggagawa sa opisina

Mga nagbebenta

Mga manggagawa sa sports at libangan

Mga tagapangasiwa at tagapamahala

Mga propesyonal, mga manggagawang teknikal at mga artista

Sinimulan namin ang pagsusuri ng ugnayan. Mas mainam na simulan ang solusyon para sa kalinawan graphic na pamamaraan, kung saan gagawa tayo ng scatter diagram.

Nagpapakita ito ng direktang koneksyon. Gayunpaman, mahirap gumawa ng hindi malabo na konklusyon batay sa graphical na pamamaraan lamang. Samakatuwid, patuloy kaming magsasagawa ng pagsusuri ng ugnayan. Ang isang halimbawa ng pagkalkula ng koepisyent ng ugnayan ay ipinakita sa ibaba.

Gamit ang software (MS Excel ay ilalarawan sa ibaba bilang isang halimbawa), tinutukoy namin ang koepisyent ng ugnayan, na 0.716, na nangangahulugang isang malakas na koneksyon sa pagitan ng mga parameter na pinag-aaralan. Tukuyin natin ang istatistikal na pagiging maaasahan ng nakuhang halaga gamit ang kaukulang talahanayan, kung saan kailangan nating ibawas ang 2 mula sa 25 na pares ng mga halaga, bilang isang resulta nakakakuha tayo ng 23 at gamit ang linyang ito sa talahanayan ay nakita natin ang r kritikal para sa p = 0.01 (mula noong ang mga ito ay medikal na data, isang mas mahigpit na pag-asa, sa ibang mga kaso p=0.05 ay sapat), na 0.51 para sa pagsusuri ng ugnayan na ito. Ipinakita ng halimbawa na ang kinakalkula na r ay mas malaki kaysa sa kritikal na r, at ang halaga ng koepisyent ng ugnayan ay itinuturing na maaasahan sa istatistika.

Paggamit ng software kapag nagsasagawa ng pagsusuri ng ugnayan

Ang inilarawang uri ng pagpoproseso ng istatistikal na data ay maaaring isagawa gamit ang software, sa partikular, ang MS Excel. Kasama sa ugnayan ang pagkalkula ng mga sumusunod na parameter gamit ang mga function:

1. Ang correlation coefficient ay tinutukoy gamit ang CORREL function (array1; array2). Array1,2 - cell ng agwat ng mga halaga ng mga variable na resulta at kadahilanan.

Ang linear correlation coefficient ay tinatawag ding Pearson correlation coefficient, at samakatuwid, simula sa Excel 2007, maaari mong gamitin ang function na may parehong mga arrays.

Ang graphical na pagpapakita ng pagsusuri ng ugnayan sa Excel ay ginagawa gamit ang panel na "Mga Tsart" na may pagpipiliang "Scatter Plot".

Pagkatapos tukuyin ang paunang data, nakakakuha kami ng isang graph.

2. Pagtataya sa kahalagahan ng pairwise correlation coefficient gamit ang Student's t-test. Ang kinakalkula na halaga ng t-criterion ay inihambing sa tabulated (kritikal) na halaga ng tagapagpahiwatig na ito mula sa kaukulang talahanayan ng mga halaga ng parameter na isinasaalang-alang, na isinasaalang-alang ang tinukoy na antas ng kahalagahan at ang bilang ng mga antas ng kalayaan. Ang pagtatantya na ito ay isinasagawa gamit ang function na STUDISCOVER(probability; degrees_of_freedom).

3. Matrix ng mga coefficient ng ugnayan ng pares. Isinasagawa ang pagsusuri gamit ang tool sa Pagsusuri ng Data, kung saan napili ang Kaugnayan. Ang pagtatasa ng istatistika ng mga coefficient ng ugnayan ng pares ay isinasagawa sa pamamagitan ng paghahambing ng ganap na halaga nito sa naka-tabulate (kritikal) na halaga. Kapag ang kinakalkula na pairwise correlation coefficient ay lumampas sa kritikal, maaari nating sabihin, na isinasaalang-alang ang ibinigay na antas ng posibilidad, na ang null hypothesis tungkol sa kahalagahan ng linear na relasyon ay hindi tinatanggihan.

Sa wakas

Ang paggamit ng paraan ng pagsusuri ng ugnayan sa siyentipikong pananaliksik ay nagpapahintulot sa amin na matukoy ang ugnayan sa pagitan iba't ibang salik at mga tagapagpahiwatig ng pagganap. Kinakailangang isaalang-alang na ang isang mataas na koepisyent ng ugnayan ay maaaring makuha mula sa isang walang katotohanan na pares o hanay ng data, at samakatuwid ganitong klase Ang pagsusuri ay dapat isagawa sa isang sapat na malaking hanay ng data.

Matapos makuha ang kinakalkula na halaga ng r, ipinapayong ihambing ito sa kritikal na r upang kumpirmahin ang pagiging maaasahan ng istatistika ng isang tiyak na halaga. Ang pagsusuri ng ugnayan ay maaaring isagawa nang manu-mano gamit ang mga formula, o gamit ang software, sa partikular na MS Excel. Dito maaari ka ring bumuo ng isang scatter diagram para sa layunin ng biswal na kumakatawan sa relasyon sa pagitan ng pinag-aralan na mga kadahilanan ng pagsusuri ng ugnayan at ang resultang katangian.

Koepisyent ng ugnayan (o linear coefficient ugnayan) ay tinutukoy bilang "r" (sa mga bihirang kaso bilang "ρ") at nagpapakilala linear na ugnayan(iyon ay, isang relasyon na ibinibigay ng ilang halaga at direksyon) ng dalawa o higit pang mga variable. Ang halaga ng koepisyent ay nasa pagitan ng -1 at +1, ibig sabihin, ang ugnayan ay maaaring parehong positibo at negatibo. Kung ang koepisyent ng ugnayan ay -1, mayroong perpektong negatibong ugnayan; kung ang koepisyent ng ugnayan ay +1, mayroong perpektong positibong ugnayan. Sa ibang mga kaso, mayroong positibong ugnayan, negatibong ugnayan, o walang ugnayan sa pagitan ng dalawang variable. Maaaring manu-manong kalkulahin ang koepisyent ng ugnayan, gamit ang mga libreng online na calculator, o gamit ang isang mahusay na graphing calculator.

Mga hakbang

Manu-manong pagkalkula ng koepisyent ng ugnayan

    Mangolekta ng data. Bago mo simulan ang pagkalkula ng koepisyent ng ugnayan, pag-aralan ang ibinigay na pares ng mga numero. Mas mainam na isulat ang mga ito sa isang talahanayan na maaaring ilagay nang patayo o pahalang. Lagyan ng label ang bawat row o column bilang "x" at "y".

    • Halimbawa, ang apat na pares ng mga halaga (mga numero) ng mga variable na "x" at "y" ay ibinigay. Maaari kang lumikha ng sumusunod na talahanayan:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Kalkulahin ang arithmetic mean ng "x". Upang gawin ito, idagdag ang lahat ng mga halaga ng "x", at pagkatapos ay hatiin ang resultang resulta sa bilang ng mga halaga.

    • Sa aming halimbawa, apat na halaga ng variable na "x" ang ibinigay. Upang kalkulahin ang arithmetic mean ng "x", idagdag ang mga halagang ito, at pagkatapos ay hatiin ang kabuuan sa 4. Ang mga kalkulasyon ay isusulat nang ganito:
    • μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
    • μ x = 12 / 4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. Hanapin ang arithmetic mean na "y". Upang gawin ito, sundin ang mga katulad na hakbang, iyon ay, idagdag ang lahat ng mga halaga ng "y", at pagkatapos ay hatiin ang kabuuan sa bilang ng mga halaga.

    • Sa aming halimbawa, apat na halaga ng variable na "y" ang ibinigay. Idagdag ang mga halagang ito, at pagkatapos ay hatiin ang kabuuan sa 4. Ang mga kalkulasyon ay isusulat nang ganito:
    • μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
    • μ y = 16 / 4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\displaystyle \mu _(y)=4)
  3. Kalkulahin ang karaniwang paglihis ng "x". Pagkatapos kalkulahin ang average na mga halaga ng "x" at "y", hanapin standard deviations mga variable na ito. Ang standard deviation ay kinakalkula gamit ang sumusunod na formula:

    • σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2)))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • σ x = 1, 83 (\displaystyle \sigma _(x)=1,83)
  4. Kalkulahin ang karaniwang paglihis ng "y". Sundin ang mga hakbang na inilarawan sa nakaraang hakbang. Gumamit ng parehong formula, ngunit palitan ang mga halaga ng "y" dito.

    • Sa aming halimbawa, ang mga kalkulasyon ay isusulat tulad nito:
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2)))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ y = 2.58 (\displaystyle \sigma _(y)=2.58)
  5. Isulat ang pangunahing pormula para sa pagkalkula ng koepisyent ng ugnayan. Kasama sa formula na ito ang ibig sabihin, standard deviations, at numero (n) na mga pares ng mga numero para sa parehong variable. Ang koepisyent ng ugnayan ay tinutukoy bilang "r" (sa mga bihirang kaso bilang "ρ"). Gumagamit ang artikulong ito ng formula upang kalkulahin ang koepisyent ng ugnayan ng Pearson.

    • Dito at sa iba pang mga mapagkukunan, ang mga dami ay maaaring italaga sa ibang paraan. Halimbawa, ang ilang mga formula ay naglalaman ng "ρ" at "σ", habang ang iba ay naglalaman ng "r" at "s". Ang ilang mga aklat-aralin ay nagbibigay ng iba pang mga formula, ngunit ang mga ito ay mga analogue sa matematika ng formula sa itaas.
  6. Nakalkula mo ang mga paraan at karaniwang mga paglihis ng parehong mga variable, kaya maaari mong gamitin ang formula upang kalkulahin ang koepisyent ng ugnayan. Alalahanin na ang "n" ay ang bilang ng mga pares ng mga halaga para sa parehong mga variable. Ang mga halaga ng iba pang mga dami ay kinakalkula nang mas maaga.

    • Sa aming halimbawa, ang mga kalkulasyon ay isusulat tulad nito:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\kanan) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\kanan))
    • ρ = (1 3) ∗ (\displaystyle \rho =\kaliwa((\frac (1)(3))\kanan)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1.83))\kanan)*\kaliwa((\frac (1-4)(2.58))\kanan)+\kaliwa((\frac (2-3)(1.83))\kanan) *\kaliwa((\ frac (3-4)(2.58))\kanan))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1.83))\kanan)*\kaliwa((\frac (5-4)(2.58))\kanan)+\kaliwa((\frac (5-3)(1.83))\ kanan)*\kaliwa( (\frac (7-4)(2.58))\kanan))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6 +1+1+6)(4,721))\kanan))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\kanan)*2.965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2.965)(3))\kanan))
    • ρ = 0.988 (\displaystyle \rho =0.988)
  7. Pag-aralan ang resulta. Sa aming halimbawa, ang correlation coefficient ay 0.988. Ang halagang ito sa ilang paraan ay nagpapakilala sa hanay ng mga pares ng numero. Bigyang-pansin ang sign at magnitude ng halaga.

    • Dahil positibo ang halaga ng koepisyent ng ugnayan, mayroong positibong ugnayan sa pagitan ng mga variable na "x" at "y". Iyon ay, habang ang halaga ng "x" ay tumataas, ang halaga ng "y" ay tumataas din.
    • Dahil ang halaga ng koepisyent ng ugnayan ay napakalapit sa +1, ang mga halaga ng mga variable na "x" at "y" ay lubos na magkakaugnay. Kung mag-plot ka ng mga punto sa coordinate plane, sila ay matatagpuan malapit sa isang tiyak na tuwid na linya.

    Paggamit ng mga online na calculator upang kalkulahin ang koepisyent ng ugnayan

    1. Maghanap ng calculator sa Internet upang makalkula ang koepisyent ng ugnayan. Ang koepisyent na ito ay madalas na kinakalkula sa mga istatistika. Kung mayroong maraming mga pares ng mga numero, halos imposible na kalkulahin ang koepisyent ng ugnayan nang manu-mano. Samakatuwid, mayroong mga online na calculator para sa pagkalkula ng koepisyent ng ugnayan. Sa isang search engine, ilagay ang "correlation coefficient calculator" (nang walang mga panipi).

    2. Ipasok ang data. Pakisuri ang mga tagubilin sa website upang matiyak na naipasok mo nang tama ang data (mga pares ng numero). Napakahalaga na ipasok ang naaangkop na mga pares ng mga numero; kung hindi, makakakuha ka ng hindi tamang resulta. Tandaan na ang iba't ibang mga website ay may iba't ibang mga format ng pagpasok ng data.

      • Halimbawa, sa website na http://ncalculators.com/statistics/correlation-coefficient-calculator.htm ang mga halaga ng mga variable na "x" at "y" ay ipinasok sa dalawang pahalang na linya. Ang mga halaga ay pinaghihiwalay ng mga kuwit. Iyon ay, sa aming halimbawa, ang mga halaga ng "x" ay ipinasok tulad nito: 1,2,4,5, at ang mga halaga ng "y" tulad nito: 1,3,5,7.
      • Sa isa pang site, http://www.alcula.com/calculators/statistics/correlation-coefficient/, ang data ay ipinasok patayo; sa kasong ito, huwag malito ang mga katumbas na pares ng mga numero.
    3. Kalkulahin ang koepisyent ng ugnayan. Pagkatapos ipasok ang data, i-click lamang ang "Kalkulahin", "Kalkulahin" o katulad na pindutan upang makuha ang resulta.

      Gamit ang isang graphing calculator

      1. Ipasok ang data. Kumuha ng graphing calculator, pumunta sa statistical mode at piliin ang Edit command.

        • Ang iba't ibang mga calculator ay nangangailangan ng iba't ibang mga keystroke upang pinindot. Tinatalakay ng artikulong ito ang Texas Instruments TI-86 calculator.
        • Para lumipat sa statistical calculation mode, pindutin ang – Stat (sa itaas ng “+” key). Pagkatapos ay pindutin ang F2 - I-edit.
      2. Tanggalin ang nakaraang na-save na data. Karamihan sa mga calculator ay nag-iimbak ng mga istatistika na iyong ipinasok hanggang sa i-clear mo ang mga ito. Upang maiwasang malito ang lumang data sa bagong data, tanggalin muna ang anumang nakaimbak na impormasyon.

        • Gamitin ang mga arrow key upang ilipat ang cursor at i-highlight ang heading na "xStat". Pagkatapos ay pindutin ang Clear at Enter para tanggalin ang lahat ng value na ipinasok sa column ng xStat.
        • Gamitin ang mga arrow key upang i-highlight ang "yStat" na heading. Pagkatapos ay pindutin ang Clear at Enter para i-clear ang lahat ng value na ipinasok sa column ng yStat.
      3. Ipasok ang paunang data. Gamitin ang mga arrow key upang ilipat ang cursor sa unang cell sa ilalim ng heading na "xStat". Ipasok ang unang halaga at pindutin ang Enter. Ang “xStat (1) = __” ay ipapakita sa ibaba ng screen, kung saan lalabas ang inilagay na value sa halip na isang espasyo. Pagkatapos mong pindutin ang Enter, ang inilagay na halaga ay lilitaw sa talahanayan at ang cursor ay lilipat sa susunod na linya; ipapakita nito ang "xStat (2) = __" sa ibaba ng screen.

        • Ipasok ang lahat ng mga halaga para sa variable na "x".
        • Pagkatapos ipasok ang lahat ng mga halaga para sa x variable, gamitin ang mga arrow key upang lumipat sa column ng yStat at ipasok ang mga halaga para sa y variable.
        • Kapag naipasok na ang lahat ng pares ng mga numero, pindutin ang Exit para i-clear ang screen at lumabas sa statistical calculation mode.
      4. Kalkulahin ang koepisyent ng ugnayan. Inilalarawan nito kung gaano kalapit ang data sa isang tiyak na linya. Mabilis na matutukoy ng isang graphing calculator ang naaangkop na linya at makalkula ang koepisyent ng ugnayan.

        • I-click ang Stat – Calc. Sa TI-86 kailangan mong pindutin ang – –.
        • Piliin ang Linear Regression function ( Linear regression). Sa TI-86, pindutin ang , na may label na "LinR". Ipapakita ng screen ang linyang "LinR_" na may kumikislap na cursor.
        • Ngayon ipasok ang mga pangalan ng dalawang variable: xStat at yStat.
          • Sa TI-86, buksan ang listahan ng mga pangalan; Upang gawin ito, pindutin ang – – .
          • Ang ilalim na linya ng screen ay magpapakita ng mga magagamit na variable. Piliin (malamang na kailangan mong pindutin ang F1 o F2 upang gawin ito), maglagay ng kuwit, at pagkatapos ay piliin ang .
          • Pindutin ang Enter upang iproseso ang ipinasok na data.
      5. Pag-aralan ang iyong mga resulta. Sa pamamagitan ng pagpindot sa Enter, ang sumusunod na impormasyon ay ipapakita sa screen:

        • y = a + b x (\displaystyle y=a+bx): Ito ay isang function na naglalarawan ng isang tuwid na linya. Pakitandaan na ang function ay hindi nakasulat sa karaniwang anyo (y = kh + b).
        • a = (\displaystyle a=). Ito ang "y" coordinate ng punto kung saan ang linya ay nag-intersect sa Y axis.
        • b = (\displaystyle b=). Ito dalisdis tuwid.
        • corr = (\displaystyle (\text(corr))=). Ito ang koepisyent ng ugnayan.
        • n = (\displaystyle n=). Ito ang bilang ng mga pares ng mga numero na ginamit sa mga kalkulasyon.

Ang koepisyent ng ugnayan ay sumasalamin sa antas ng ugnayan sa pagitan ng dalawang tagapagpahiwatig. Ito ay palaging tumatagal ng isang halaga mula -1 hanggang 1. Kung ang koepisyent ay matatagpuan sa paligid ng 0, pagkatapos ay walang koneksyon sa pagitan ng mga variable.

Kung ang halaga ay malapit sa isa (mula sa 0.9, halimbawa), mayroong isang malakas na direktang ugnayan sa pagitan ng mga naobserbahang bagay. Kung ang koepisyent ay malapit sa isa pa matinding punto saklaw (-1), pagkatapos ay mayroong isang malakas na kabaligtaran na ugnayan sa pagitan ng mga variable. Kapag ang halaga ay nasa pagitan ng 0 at 1 o 0 at -1, kung gayon pinag-uusapan natin tungkol sa mahinang pagkabit (direkta o baligtad). Ang relasyon na ito ay karaniwang hindi isinasaalang-alang: pinaniniwalaan na hindi ito umiiral.

Pagkalkula ng koepisyent ng ugnayan sa Excel

Tingnan natin ang isang halimbawa ng mga pamamaraan para sa pagkalkula ng koepisyent ng ugnayan, mga tampok ng direkta at kabaligtaran na mga relasyon sa pagitan ng mga variable.

Mga halaga ng mga tagapagpahiwatig x at y:

Ang Y ay isang independent variable, ang x ay isang dependent variable. Kinakailangang hanapin ang lakas (malakas/mahina) at direksyon (pasulong/baligtad) ng koneksyon sa pagitan nila. Ang formula ng correlation coefficient ay ganito:


Para mas madaling maunawaan, hatiin natin ito sa ilang simpleng elemento.

Ang isang malakas na direktang relasyon ay tinutukoy sa pagitan ng mga variable.

Ang built-in na CORREL function ay umiiwas sa mga kumplikadong kalkulasyon. Kalkulahin natin ang coefficient ng correlation ng pares sa Excel gamit ito. Tawagan ang function wizard. Nahanap namin ang tama. Ang mga argumento ng function ay isang hanay ng mga halaga ng y at isang hanay ng mga halaga ng x:

Ipakita natin ang mga halaga ng mga variable sa graph:


Ang isang malakas na koneksyon sa pagitan ng y at x ay nakikita, dahil ang mga linya ay tumatakbo halos parallel sa bawat isa. Direkta ang relasyon: y tumataas - x tumataas, y bumababa - x bumababa.



Ipares ang correlation coefficient matrix sa Excel

Ang correlation matrix ay isang table sa intersection ng mga row at column kung saan matatagpuan ang correlation coefficients sa pagitan ng mga kaukulang halaga. Makatuwirang itayo ito para sa ilang mga variable.

Ang matrix ng correlation coefficients sa Excel ay binuo gamit ang tool na "Correlation" mula sa package na "Data Analysis".


Ang isang malakas na direktang relasyon ay natagpuan sa pagitan ng mga halaga ng y at x1. Mayroong malakas na feedback sa pagitan ng x1 at x2. Halos walang koneksyon sa mga halaga sa column x3.

Sa koneksyon ng ugnayan ang parehong halaga ng isang katangian ay tumutugma sa iba't ibang mga halaga ng isa pa. Halimbawa: mayroong isang ugnayan sa pagitan ng taas at timbang, sa pagitan ng saklaw ng mga malignant na neoplasma at edad, atbp.

Mayroong 2 mga pamamaraan para sa pagkalkula ng koepisyent ng ugnayan: ang paraan ng mga parisukat (Pearson), ang paraan ng mga ranggo (Spearman).

Ang pinakatumpak ay ang paraan ng mga parisukat (Pearson), kung saan ang koepisyent ng ugnayan ay tinutukoy ng formula: , kung saan

Ang r xy ay ang koepisyent ng ugnayan sa pagitan ng istatistikal na serye X at Y.

d x ay ang paglihis ng bawat isa sa mga numero ng istatistikal na serye X mula sa arithmetic mean nito.

d y ay ang paglihis ng bawat isa sa mga numero ng istatistikal na serye Y mula sa arithmetic mean nito.

Depende sa lakas ng koneksyon at direksyon nito, ang correlation coefficient ay maaaring mula 0 hanggang 1 (-1). Ang isang koepisyent ng ugnayan na 0 ay nagpapahiwatig ng kumpletong kakulangan ng koneksyon. Kung mas malapit ang antas ng koepisyent ng ugnayan sa 1 o (-1), mas malaki at mas malapit ang direkta o feedback na sinusukat nito. Kapag ang correlation coefficient ay katumbas ng 1 o (-1), ang koneksyon ay kumpleto at gumagana.

Scheme para sa pagtatasa ng lakas ng correlation gamit ang correlation coefficient

Ang lakas ng koneksyon

Ang halaga ng koepisyent ng ugnayan kung magagamit

direktang koneksyon (+)

feedback (-)

Walang koneksyon

Ang koneksyon ay maliit (mahina)

mula 0 hanggang +0.29

mula 0 hanggang –0.29

Average ng koneksyon (katamtaman)

mula +0.3 hanggang +0.69

mula –0.3 hanggang –0.69

Malaki ang koneksyon (malakas)

mula +0.7 hanggang +0.99

mula –0.7 hanggang –0.99

Buong komunikasyon

(functional)

Upang kalkulahin ang koepisyent ng ugnayan gamit ang parisukat na paraan, isang talahanayan ng 7 mga haligi ay pinagsama-sama. Tingnan natin ang proseso ng pagkalkula gamit ang isang halimbawa:

TUKUYIN ANG LAKAS AT KALIKASAN NG KONEKSIYON SA PAGITAN

Oras na-

ness

goiter

(V y )

d x = V xM x

d y = V yM y

d x d y

d x 2

d y 2

Σ -1345 ,0

Σ 13996 ,0

Σ 313 , 47

1. Tukuyin ang karaniwang nilalaman ng iodine sa tubig (sa mg/l).

mg/l

2. Tukuyin ang average na saklaw ng goiter sa %.

3. Tukuyin ang paglihis ng bawat V x mula sa M x, i.e. dx.

201–138=63; 178–138=40, atbp.

4. Katulad nito, tinutukoy namin ang paglihis ng bawat V y mula sa M y, i.e. d y.

0.2–3.8=-3.6; 0.6–38=-3.2, atbp.

5. Tukuyin ang mga produkto ng mga deviations. Binubuo namin ang nagresultang produkto at nakukuha.

6. Namin parisukat d x at sum up ang mga resulta, makuha namin.

7. Katulad nito, parisukat namin ang d y, sum up ang mga resulta, nakukuha namin

8. Sa wakas, pinapalitan namin ang lahat ng natanggap na halaga sa formula:

Upang malutas ang isyu ng pagiging maaasahan ng koepisyent ng ugnayan, tukuyin ito average na error ayon sa formula:

(Kung ang bilang ng mga obserbasyon ay mas mababa sa 30, kung gayon ang denominator ay n–1).

Sa ating halimbawa

Ang halaga ng correlation coefficient ay itinuturing na maaasahan kung ito ay hindi bababa sa 3 beses na mas mataas kaysa sa average na error nito.

Sa ating halimbawa

Kaya, ang koepisyent ng ugnayan ay hindi maaasahan, na nangangailangan ng pagtaas sa bilang ng mga obserbasyon.

Ang koepisyent ng ugnayan ay maaaring matukoy sa isang bahagyang hindi gaanong tumpak, ngunit mas madaling paraan - ang paraan ng mga ranggo (Spearman).

Paraan ng Spearman: P=1-(6∑d 2 /n-(n 2 -1))

gumawa ng dalawang hilera ng magkapares na maihahambing na mga tampok, na itinatalaga ang una at pangalawang hilera x at y, ayon sa pagkakabanggit. Sa kasong ito, ipakita ang unang hilera ng katangian sa pababang o pataas na pagkakasunud-sunod, at ilagay ang mga numerong halaga ng pangalawang hilera sa tapat ng mga halaga ng unang hilera kung saan sila tumutugma.

palitan ang halaga ng katangian sa bawat isa sa pinaghahambing na serye ng serial number (ranggo). Ang mga ranggo, o mga numero, ay nagpapahiwatig ng mga lugar ng mga tagapagpahiwatig (mga halaga) ng una at ikalawang hanay. Sa kasong ito, ang mga ranggo ay dapat na italaga sa mga numerical na halaga ng pangalawang katangian sa parehong pagkakasunud-sunod tulad ng pinagtibay noong itinalaga ang mga ito sa mga halaga ng unang katangian. Sa magkatulad na mga halaga ng isang katangian sa isang serye, ang mga ranggo ay dapat matukoy bilang ang average na numero mula sa kabuuan ng mga ordinal na numero ng mga halagang ito

tukuyin ang pagkakaiba ng ranggo sa pagitan ng x at y (d): d = x - y

parisukat ang resultang pagkakaiba ng ranggo (d 2)

makuha ang kabuuan ng mga parisukat ng pagkakaiba (Σ d 2) at palitan ang mga resultang halaga sa formula:

Halimbawa: Gamit ang paraan ng ranggo, itatag ang direksyon at lakas ng ugnayan sa pagitan ng mga taon ng karanasan sa trabaho at ang dalas ng mga pinsala kung nakuha ang sumusunod na data:

Katwiran para sa pagpili ng pamamaraan: Upang malutas ang problema, tanging ang paraan ng ugnayan ng ranggo ang maaaring piliin, dahil Ang unang hilera ng katangian na "karanasan sa trabaho sa mga taon" ay may mga bukas na pagpipilian (karanasan sa trabaho hanggang 1 taon at 7 o higit pang mga taon), na hindi pinapayagan ang paggamit ng isang mas tumpak na paraan - ang paraan ng mga parisukat - upang magtatag ng isang koneksyon sa pagitan ng mga inihambing na katangian.

Solusyon. Ang pagkakasunud-sunod ng mga kalkulasyon ay ipinakita sa teksto, ang mga resulta ay ipinakita sa talahanayan. 2.

talahanayan 2

Karanasan sa trabaho sa mga taon

Bilang ng mga pinsala

Ordinal na numero (ranggo)

Pagkakaiba ng ranggo

Squared na pagkakaiba ng mga ranggo

d(x-y)

d 2

Ang bawat isa sa mga hilera ng magkapares na katangian ay itinalaga ng "x" at "y" (mga hanay 1-2).

Ang halaga ng bawat tampok ay pinapalitan ng isang ranggo (ordinal) na numero. Ang pagkakasunud-sunod ng pamamahagi ng mga ranggo sa row na "x" ay ang mga sumusunod: ang minimum na halaga ng attribute (karanasan hanggang 1 taon) ay itinalaga ang serial number na "1", ang mga kasunod na variant ng parehong hilera ng attribute, ayon sa pagkakabanggit, sa pagtaas ng pagkakasunod-sunod, ika-2, ika-3, ika-4 at ika-5 na serial number - mga ranggo (tingnan ang hanay 3). Ang isang katulad na pagkakasunud-sunod ay sinusunod kapag namamahagi ng mga ranggo sa pangalawang katangian na "y" (hanay 4). Sa mga kaso kung saan mayroong ilang mga opsyon ng pantay na laki (halimbawa, sa karaniwang problema ito ay 12 at 12 pinsala sa bawat 100 manggagawa na may karanasan ng 3-4 na taon at 5-6 na taon, ang serial number ay itinalaga ng average na numero mula sa kabuuan ng kanilang mga serial number. Ang mga data na ito sa bilang ng mga pinsala (12 pinsala) kapag ang ranking ay dapat sumakop sa 2 at 3 lugar, kaya ang average na bilang ng mga ito ay (2 + 3) / 2 = 2.5. Kaya, ang bilang ng mga pinsalang “12” at “12” (attribute ) dapat ipamahagi ang parehong mga numero ng ranggo - “2.5” (column 4).

Tukuyin ang pagkakaiba ng ranggo d = (x - y) - (column 5)

Kuwadrado ang pagkakaiba ng ranggo (d 2) at makuha ang kabuuan ng mga parisukat ng pagkakaiba sa ranggo Σ d 2 (kolumna 6).

Kalkulahin ang rank correlation coefficient gamit ang formula:

kung saan ang n ay ang bilang ng mga pares ng mga opsyon na inihahambing sa row na "x" at sa row na "y"