Paano gumawa ng ugnayan sa excel. Isang halimbawa ng pagkalkula ng ugnayan, pagbuo ng linear regression at pagsubok sa hypothesis ng pag-asa ng dalawang RV ng aming serbisyo

TRABAHO SA LABORATORY

PAGSUSURI NG CORELASYON SAEXCEL

1.1 Pagsusuri ng ugnayan sa MS Excel

Ang pagsusuri ng ugnayan ay binubuo sa pagtukoy sa antas ng koneksyon sa pagitan ng dalawang random na variable X at Y. Ang koepisyent ng ugnayan ay ginagamit bilang sukatan ng naturang koneksyon. Ang koepisyent ng ugnayan ay tinatantya mula sa isang sample ng volume n ng mga kaugnay na pares ng mga obserbasyon (x i, y i) mula sa pinagsamang pangkalahatang populasyon X at Y. Upang masuri ang antas ng ugnayan sa pagitan ng X at Y na sinusukat sa dami ng mga kaliskis, ginagamit namin linear correlation coefficient(Pearson's coefficient), sa pag-aakalang ang mga sample na X at Y ay ipinamamahagi ayon sa normal na batas.

Ang koepisyent ng ugnayan ay nag-iiba mula -1 (mahigpit na inverse linear na relasyon) hanggang 1 (mahigpit na direktang proporsyonal na relasyon). Sa halagang 0, walang linear na relasyon sa pagitan ng dalawang sample.

Pangkalahatang pag-uuri ng mga ugnayan (ayon kay Ivanter E.V., Korosov A.V., 1992):

Mayroong ilang mga uri ng mga coefficient ng ugnayan, depende sa mga variable na X at Y, na maaaring masukat sa iba't ibang mga sukat. Ang katotohanang ito ang tumutukoy sa pagpili ng naaangkop na koepisyent ng ugnayan (tingnan ang Talahanayan 13):

Sa MS Excel, ang isang espesyal na function ay ginagamit upang kalkulahin ang ipinares na linear correlation coefficients CORREL(array1; array2),

mga paksa ng pagsusulit

kung saan ang array1 ay isang sanggunian sa hanay ng mga cell ng unang seleksyon (X);

Halimbawa 1: 10 mga mag-aaral ay binigyan ng mga pagsusulit para sa visual-figurative at verbal na pag-iisip. Ang average na oras para sa paglutas ng mga gawain sa pagsubok ay sinusukat sa mga segundo. Interesado ang mananaliksik sa tanong na: may kaugnayan ba sa pagitan ng oras ng paglutas ng mga problemang ito? Variable X - tumutukoy sa average na oras ng paglutas ng visual-figurative, at variable Y - ang average na oras ng paglutas ng mga verbal na gawain ng mga pagsusulit.

R Solusyon: Upang matukoy ang antas ng relasyon, una sa lahat, kinakailangan na magpasok ng data sa talahanayan ng MS Excel (tingnan ang Talahanayan, Fig. 1). Pagkatapos ay kinakalkula ang halaga ng koepisyent ng ugnayan. Upang gawin ito, ilagay ang cursor sa cell C1. Sa toolbar, i-click ang Insert Function (fx) na button.

Sa lalabas na dialog ng Function Wizard, pumili ng kategorya Istatistika at function CORREL, pagkatapos ay i-click ang OK. Gamitin ang mouse pointer upang ipasok ang sample na hanay ng data X sa array1 field (A1:A10). Sa array2 field, ilagay ang sample na hanay ng data Y (B1:B10). I-click ang OK. Sa cell C1, lalabas ang value ng correlation coefficient - 0.54119. Susunod, kailangan mong tingnan ang ganap na bilang ng koepisyent ng ugnayan at matukoy ang uri ng relasyon (malapit, mahina, daluyan, atbp.)

kanin. 1. Mga resulta ng pagkalkula ng koepisyent ng ugnayan

Kaya, ang koneksyon sa pagitan ng oras ng paglutas ng visual-figurative at verbal na mga gawain ng pagsubok ay hindi napatunayan.

Ehersisyo 1. Ang data ay magagamit para sa 20 agricultural holdings. Hanapin koepisyent ng ugnayan sa pagitan ng mga ani ng mga pananim na butil at ang kalidad ng lupa at tasahin ang kahalagahan nito. Ang data ay ibinigay sa talahanayan.

Talahanayan 2. Pagdepende ng ani ng palay sa kalidad ng lupa

numero ng bahay

Kalidad ng lupa, marka

Produktibo, c/ha


Gawain 2. Tukuyin kung may kaugnayan sa pagitan ng oras ng pagpapatakbo ng isang sports fitness machine (libong oras) at ang halaga ng pagkumpuni nito (libong rubles):

Oras ng pagpapatakbo ng simulator (libong oras)

Gastos sa pag-aayos (libong rubles)

1.2 Maramihang Kaugnayan sa MS Excel

Sa malalaking numero mga obserbasyon, kapag ang mga koepisyent ng ugnayan ay kailangang sunud-sunod na kalkulahin para sa ilang mga sample, para sa kaginhawahan, ang mga resultang coefficient ay ibinubuod sa mga talahanayan na tinatawag na mga matrice ng ugnayan.

Correlation matrix ay isang parisukat na talahanayan kung saan sa intersection ng kaukulang mga hilera at mga haligi ay ang koepisyent ng ugnayan sa pagitan ng mga kaukulang parameter.

Sa MS Excel, ang pamamaraan ay ginagamit upang kalkulahin ang mga matrice ng ugnayan ugnayan mula sa pakete Pagsusuri sa datos. Ginagawang posible ng pamamaraan na makakuha ng correlation matrix na naglalaman ng correlation coefficient sa pagitan ng iba't ibang parameter.

Upang ipatupad ang pamamaraan, dapat mong:

1. run command Serbisyo - Pagsusuri datos;

2. sa listahang lalabas Mga Tool sa Pagsusuri piliin ang hilera Kaugnayan at pindutin ang pindutan OK;

3. Sa dialog box na lalabas, tukuyin pagitan ng input, ibig sabihin, maglagay ng link sa mga cell na naglalaman ng nasuri na data. Ang input interval ay dapat maglaman ng hindi bababa sa dalawang column.

4. seksyon pagpapangkat itakda ang switch ayon sa ipinasok na data (sa pamamagitan ng mga hanay o sa pamamagitan ng mga hilera);

5. tukuyin araw ng pahinga pagitan, ibig sabihin, maglagay ng reference sa cell, simula kung saan ipapakita ang mga resulta ng pagsusuri. Awtomatikong matutukoy ang laki ng hanay ng output, at may ipapakitang mensahe sa screen kung maaaring mag-overlap ang hanay ng output sa source data. Push button OK.

Ang isang correlation matrix ay ipapakita sa hanay ng output, kung saan sa intersection ng bawat row at column ay mayroong correlation coefficient sa pagitan ng mga kaukulang parameter. Ang mga cell sa output range na may parehong row at column coordinates ay naglalaman ng value 1 dahil ang bawat column sa input range ay ganap na nauugnay sa sarili nito

Halimbawa 2 Ang buwanang data ay magagamit para sa mga obserbasyon ng lagay ng panahon at mga pagbisita sa mga museo at parke (tingnan ang Talahanayan 3). Ito ay kinakailangan upang matukoy kung mayroong isang relasyon sa pagitan ng estado ng panahon at ang pagdalo ng mga museo at mga parke.

Talahanayan 3. Mga resulta ng mga obserbasyon

Bilang ng mga malinaw na araw

Bilang ng mga bisita sa museo

Bilang ng mga bisita sa parke

Desisyon. Upang magsagawa ng pagsusuri ng ugnayan, ilagay ang paunang data sa hanay na A1:G3 (Larawan 2). Tapos sa menu Serbisyo piliin ang item Pagsusuri datos at pagkatapos ay idagdag ang linya Kaugnayan. Sa lalabas na dialog box, ipasok pagitan ng input(A2:C7). Tukuyin na ang data ay isinasaalang-alang ng mga column. Tukuyin ang hanay ng output (E1) at pindutin ang pindutan OK.

Sa fig. 33 makikita na ang ugnayan sa pagitan ng mga kondisyon ng panahon at pagdalo sa museo ay -0.92, at sa pagitan ng mga kondisyon ng panahon at pagdalo sa parke - 0.97, sa pagitan ng pagdalo sa parke at museo - 0.92.

Kaya, bilang isang resulta ng pagsusuri, ang mga dependency ay ipinahayag: isang malakas na kabaligtaran na linear na relasyon sa pagitan ng pagdalo sa museo at ang bilang ng maaraw na araw at isang halos linear (napakalakas na direktang) relasyon sa pagitan ng pagdalo sa parke at mga kondisyon ng panahon. Mayroong isang malakas na kabaligtaran na ugnayan sa pagitan ng pagdalo sa museo at parke.

kanin. 2. Mga resulta ng pagkalkula ng correlation matrix mula sa halimbawa 2

Gawain 3. 10 mga tagapamahala ay nasuri ayon sa pamamaraan ng mga pagtatasa ng eksperto sa mga sikolohikal na katangian ng personalidad ng pinuno. Sinuri ng 15 eksperto ang bawat sikolohikal na katangian ayon sa limang-puntong sistema (tingnan ang Talahanayan 4). Ang psychologist ay interesado sa tanong kung ano ang kaugnayan ng mga katangiang ito ng pinuno sa bawat isa.

Talahanayan 4. Resulta ng pag-aaral

Paksa p/p

taktika

pagiging tumpak

pagiging kritikal

Sa artikulong ngayon, pag-uusapan natin kung paano maiuugnay ang mga variable sa isa't isa. Sa tulong ng ugnayan, matutukoy natin kung may kaugnayan ang una at ikalawang baryabol. Umaasa ako na makita mo ang araling ito na kapana-panabik gaya ng mga nauna!

Sinusukat ng ugnayan ang lakas at direksyon ng relasyon sa pagitan ng x at y. Ipinapakita ng figure Iba't ibang uri mga ugnayan sa anyo ng mga scatter plot ng mga nakaayos na pares (x, y). Karaniwang inilalagay ang x sa pahalang na axis at y sa patayo.

Ang graph A ay isang halimbawa ng isang positibong linear correlation: habang ang x ay tumataas, ang y ay tumataas din, at linearly. Ang Plot B ay nagpapakita sa amin ng isang halimbawa ng isang negatibong linear na ugnayan kung saan habang ang x ay tumataas, ang y ay bumababa nang linear. Sa graph C, wala kaming nakikitang ugnayan sa pagitan ng x at y. Ang mga variable na ito ay hindi nakakaapekto sa bawat isa sa anumang paraan.

Panghuli, ang plot D ay isang halimbawa ng mga non-linear na relasyon sa pagitan ng mga variable. Habang tumataas ang x, bumababa muna ang y, pagkatapos ay nagbabago ng direksyon at tumataas.

Ang natitirang bahagi ng artikulo ay nakatuon sa mga linear na relasyon sa pagitan ng umaasa at independiyenteng mga variable.

Koepisyent ng ugnayan

Ang koepisyent ng ugnayan, r, ay nagbibigay sa atin ng parehong lakas at direksyon ng ugnayan sa pagitan ng mga independyente at umaasa na mga variable. Ang mga r value ay nasa pagitan ng -1.0 at +1.0. Kapag positibo ang r, positibo ang relasyon sa pagitan ng x at y (plot A sa figure), at kapag negatibo ang r, negatibo rin ang relasyon (plot B). Ang correlation coefficient na malapit sa zero ay nagpapahiwatig na walang graph C sa pagitan ng x at y.

Ang lakas ng koneksyon sa pagitan ng x at y ay tinutukoy ng proximity ng correlation coefficient sa - 1.0 o + - 1.0. Pag-aralan ang sumusunod na pigura.

Ang Plot A ay nagpapakita ng perpektong positibong ugnayan sa pagitan ng x at y sa r = + 1.0. Ang Plot B ay isang perpektong negatibong ugnayan sa pagitan ng x at y sa r = -1.0. Ang mga Plot C at D ay mga halimbawa ng mas mahihinang ugnayan sa pagitan ng dependent at independent variable.

Ang koepisyent ng ugnayan, r, ay tumutukoy sa parehong lakas at direksyon ng relasyon sa pagitan ng umaasa at independiyenteng mga variable. Ang mga halaga ng r ay mula -1.0 (malakas na negatibong asosasyon) hanggang +1.0 (malakas na positibong asosasyon). Para sa r=0, walang relasyon sa pagitan ng x at y.

Maaari nating kalkulahin ang aktwal na koepisyent ng ugnayan gamit ang sumusunod na equation:

Well well! Alam kong ang equation na ito ay mukhang isang kahila-hilakbot na paghalu-halong mga simbolo, ngunit bago tayo mag-panic, ilapat natin ang halimbawa ng grado ng pagsusulit dito. Sabihin nating gusto kong tukuyin kung may kaugnayan sa pagitan ng bilang ng mga oras na ginugugol ng isang mag-aaral sa pag-aaral ng mga istatistika at ang marka ng huling pagsusulit. Ang talahanayan sa ibaba ay makakatulong sa amin na hatiin ang equation na ito sa ilang simpleng kalkulasyon at gawing mas madaling pamahalaan ang mga ito.

Gaya ng nakikita mo, mayroong napakalakas na positibong ugnayan sa pagitan ng bilang ng mga oras na ginugol sa pag-aaral ng isang paksa at grado sa pagsusulit. Matutuwa ang mga guro na malaman ang tungkol dito.

Ano ang pakinabang ng pagtatatag ng ugnayan sa pagitan ng magkatulad na mga variable? Mahusay na tanong. Kung may nakitang koneksyon, maaari naming hulaan ang mga marka ng pagsusulit batay sa isang tiyak na bilang ng mga oras na ginugol sa pag-aaral ng paksa. Sa madaling salita, mas malakas ang relasyon, mas magiging tumpak ang ating hula.

Paggamit ng Excel para Kalkulahin ang Mga Coefficient ng Correlation

Sigurado ako na pagkatapos tingnan ang mga kakila-kilabot na kalkulasyon ng mga koepisyent ng ugnayan, makakaranas ka ng tunay na kagalakan kapag nalaman mo iyon Excel program magagawa ang lahat ng gawaing ito para sa iyo gamit ang CORREL function na may mga sumusunod na feature:

CORREL(array 1; array 2),

array 1 = hanay ng data para sa unang variable,

array 2 = hanay ng data para sa pangalawang variable.

Halimbawa, ipinapakita ng figure ang function na CORREL na ginamit sa pagkalkula ng koepisyent ng ugnayan para sa halimbawa ng grado ng pagsusulit.

Koepisyent ng ugnayan (o linear coefficient ugnayan) ay tinutukoy bilang "r" (sa mga bihirang kaso bilang "ρ") at nagpapakilala linear na ugnayan(iyon ay, isang relasyon na ibinibigay ng ilang halaga at direksyon) ng dalawa o higit pang mga variable. Ang halaga ng koepisyent ay nasa pagitan ng -1 at +1, iyon ay, ang ugnayan ay maaaring parehong positibo at negatibo. Kung ang koepisyent ng ugnayan ay -1, mayroong perpektong negatibong ugnayan; kung ang koepisyent ng ugnayan ay +1, mayroong perpektong positibong ugnayan. Sa ibang mga kaso, mayroong positibong ugnayan, negatibong ugnayan, o walang ugnayan sa pagitan ng dalawang variable. Maaaring manu-manong kalkulahin ang koepisyent ng ugnayan, na may mga libreng online na calculator, o may mahusay na graphing calculator.

Mga hakbang

Manu-manong pagkalkula ng koepisyent ng ugnayan

    Mangalap ng datos. Bago mo simulan ang pagkalkula ng koepisyent ng ugnayan, suriin ang ibinigay na pares ng mga numero. Mas mainam na isulat ang mga ito sa isang talahanayan na maaaring ayusin nang patayo o pahalang. Lagyan ng label ang bawat row o column bilang "x" at "y".

    • Halimbawa, binigyan ng apat na pares ng mga halaga (mga numero) ng mga variable na "x" at "y". Maaari kang lumikha ng sumusunod na talahanayan:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Kalkulahin ang arithmetic mean na "x". Upang gawin ito, idagdag ang lahat ng mga halaga ng "x", at pagkatapos ay hatiin ang resulta sa bilang ng mga halaga.

    • Sa aming halimbawa, binibigyan kami ng apat na halaga para sa variable na "x". Upang kalkulahin ang arithmetic mean na "x", idagdag ang mga halagang ito, at pagkatapos ay hatiin ang kabuuan sa 4. Ang mga kalkulasyon ay isusulat tulad ng sumusunod:
    • μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
    • μ x = 12 / 4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. Hanapin ang arithmetic mean na "y". Upang gawin ito, sundin ang parehong mga hakbang, iyon ay, idagdag ang lahat ng mga halaga ng "y", at pagkatapos ay hatiin ang kabuuan sa bilang ng mga halaga.

    • Sa aming halimbawa, binibigyan kami ng apat na halaga para sa variable na "y". Idagdag ang mga halagang ito, at pagkatapos ay hatiin ang kabuuan sa 4. Ang mga kalkulasyon ay isusulat tulad ng sumusunod:
    • μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
    • μ y = 16 / 4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\displaystyle \mu _(y)=4)
  3. Kalkulahin ang karaniwang paglihis ng "x". Pagkatapos kalkulahin ang mga average ng "x" at "y", hanapin standard deviations mga variable na ito. Ang karaniwang paglihis ay kinakalkula gamit ang sumusunod na formula:

    • σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • σ x = 1 , 83 (\displaystyle \sigma _(x)=1.83)
  4. Kalkulahin ang karaniwang paglihis na "y". Sundin ang mga hakbang sa nakaraang hakbang. Gumamit ng parehong formula, ngunit palitan ang mga "y" na halaga dito.

    • Sa aming halimbawa, ang mga kalkulasyon ay isusulat tulad ng sumusunod:
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ y = 2 , 58 (\displaystyle \sigma _(y)=2.58)
  5. Isulat ang pangunahing pormula para sa pagkalkula ng koepisyent ng ugnayan. Kasama sa formula na ito ang ibig sabihin, karaniwang mga paglihis, at ang bilang (n) ng mga pares ng mga numero ng parehong mga variable. Ang koepisyent ng ugnayan ay tinutukoy bilang "r" (sa mga bihirang kaso, bilang "ρ"). Ginagamit ng artikulong ito ang formula upang kalkulahin ang koepisyent ng ugnayan ng Pearson.

    • Dito at sa iba pang mga mapagkukunan, ang mga dami ay maaaring tukuyin sa iba't ibang paraan. Halimbawa, ang ilang mga formula ay may "ρ" at "σ", habang ang iba ay may "r" at "s". Ang ilang mga aklat-aralin ay nagbibigay ng iba pang mga pormula, ngunit ang mga ito ay ang katumbas sa matematika ng formula sa itaas.
  6. Nakalkula mo ang mga paraan at karaniwang mga paglihis ng parehong mga variable, kaya maaari mong gamitin ang formula upang kalkulahin ang koepisyent ng ugnayan. Alalahanin na ang "n" ay ang bilang ng mga pares ng mga halaga ng parehong mga variable. Ang halaga ng iba pang mga dami ay nakalkula na dati.

    • Sa aming halimbawa, ang mga kalkulasyon ay isusulat tulad ng sumusunod:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\kanan) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\kanan))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\kanan)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1.83))\kanan)*\kaliwa((\frac (1-4)(2.58))\kanan)+\kaliwa((\frac (2-3)(1.83))\kanan) *\kaliwa((\ frac (3-4)(2,58))\kanan))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1.83))\kanan)*\kaliwa((\frac (5-4)(2.58))\kanan)+\kaliwa((\frac (5-3)(1.83))\ kanan)*\kaliwa( (\frac (7-4)(2,58))\kanan))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6 +1+1+6)(4,721))\kanan))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\kanan)*2.965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
    • ρ = 0 . 988 (\displaystyle \rho =0.988)
  7. Pag-aralan ang resulta. Sa aming halimbawa, ang koepisyent ng ugnayan ay 0.988. Ang halagang ito sa ilang paraan ay nagpapakilala sa isang ibinigay na hanay ng mga pares ng mga numero. Bigyang-pansin ang sign at magnitude ng halaga.

    • Dahil positibo ang halaga ng koepisyent ng ugnayan, mayroong positibong ugnayan sa pagitan ng mga variable na "x" at "y". Ibig sabihin, kapag tumaas ang halaga ng "x", tumataas din ang halaga ng "y".
    • Dahil ang halaga ng koepisyent ng ugnayan ay napakalapit sa +1, ang mga halaga ng mga variable na x at y ay lubos na nakakaugnay. Kung maglalagay ka ng mga punto sa coordinate plane, sila ay matatagpuan malapit sa ilang tuwid na linya.

    Paggamit ng mga Online Calculator para Kalkulahin ang Correlation Coefficient

    1. Maghanap ng calculator sa Internet upang kalkulahin ang koepisyent ng ugnayan. Ang koepisyent na ito ay madalas na kinakalkula sa mga istatistika. Kung mayroong maraming mga pares ng mga numero, halos imposibleng kalkulahin nang manu-mano ang koepisyent ng ugnayan. Samakatuwid, mayroong mga online na calculator para sa pagkalkula ng koepisyent ng ugnayan. Sa search engine, ilagay ang "correlation coefficient calculator" (nang walang mga panipi).

    2. Ipasok ang data. Basahin ang mga tagubilin sa site upang maipasok nang tama ang data (mga pares ng mga numero). Napakahalaga na ipasok ang naaangkop na mga pares ng mga numero; kung hindi, makakakuha ka ng maling resulta. Tandaan na ang iba't ibang mga website ay may iba't ibang mga format ng pagpasok ng data.

      • Halimbawa, sa site na http://ncalculators.com/statistics/correlation-coefficient-calculator.htm, ang mga halaga ng mga variable na "x" at "y" ay ipinasok sa dalawang pahalang na linya. Ang mga halaga ay pinaghihiwalay ng mga kuwit. Iyon ay, sa aming halimbawa, ang mga halaga ng "x" ay ipinasok tulad nito: 1,2,4,5, at ang mga halaga ng "y" ay ganito: 1,3,5,7.
      • Sa isa pang site, http://www.alcula.com/calculators/statistics/correlation-coefficient/ , ang data ay ipinasok patayo; sa kasong ito, huwag malito ang mga katumbas na pares ng mga numero.
    3. Kalkulahin ang koepisyent ng ugnayan. Pagkatapos ipasok ang data, i-click lamang ang "Kalkulahin", "Kalkulahin" o katulad na pindutan upang makuha ang resulta.

      Paggamit ng Graphing Calculator

      1. Ipasok ang data. Kumuha ng graphing calculator, lumipat sa statistical calculation mode at piliin ang Edit command.

        • Sa iba't ibang mga calculator, kailangan mong pindutin ang iba't ibang mga key. Nakatuon ang artikulong ito sa Texas Instruments TI-86 calculator.
        • Upang lumipat sa mode ng pagkalkula ng istatistika, pindutin ang - Stat (sa itaas ng "+" key). Pagkatapos ay pindutin ang F2 - I-edit (I-edit).
      2. Tanggalin ang nakaraang na-save na data. Pinapanatili ng karamihan sa mga calculator ang iyong inilagay na istatistika hanggang sa i-clear mo ang mga ito. Upang maiwasang malito ang lumang data sa bagong data, tanggalin muna ang anumang nakaimbak na impormasyon.

        • Gamitin ang mga arrow key upang ilipat ang cursor at i-highlight ang "xStat" na heading. Pagkatapos ay pindutin ang Clear at Enter para i-clear ang lahat ng value na ipinasok sa column ng xStat.
        • Gamitin ang mga arrow key upang i-highlight ang heading na "yStat". Pagkatapos ay pindutin ang Clear at Enter para i-clear ang lahat ng value na ipinasok sa column na yStat.
      3. Ipasok ang paunang data. Gamitin ang mga arrow key upang ilipat ang cursor sa unang cell sa ilalim ng heading na "xStat". Ipasok ang unang halaga at pindutin ang Enter. Sa ibaba ng screen, ang "xStat (1) = __" ay ipapakita, na may inilagay na value sa halip na isang espasyo. Pagkatapos mong pindutin ang Enter, ang inilagay na halaga ay lilitaw sa talahanayan, at ang cursor ay lilipat sa susunod na linya; ipapakita nito ang "xStat(2) = __" sa ibaba ng screen.

        • Ipasok ang lahat ng mga halaga ng variable na "x".
        • Kapag nailagay mo na ang lahat ng value para sa x variable, gamitin ang mga arrow key para mag-navigate sa column na yStat at ilagay ang mga value para sa y variable.
        • Pagkatapos ipasok ang lahat ng pares ng mga numero, pindutin ang Exit para i-clear ang screen at lumabas sa aggregation mode.
      4. Kalkulahin ang koepisyent ng ugnayan. Inilalarawan nito kung gaano kalapit ang data sa ilang tuwid na linya. Mabilis na matutukoy ng graphing calculator ang naaangkop na tuwid na linya at kalkulahin ang koepisyent ng ugnayan.

        • I-click ang Stat (Statistics) - Calc (Calculations). Sa TI-86, pindutin ang - - .
        • Piliin ang function na "Linear Regression". Sa TI-86, pindutin ang , na may label na "LinR". Ang linyang "LinR _" ay ipapakita sa screen na may kumikislap na cursor.
        • Ngayon ipasok ang mga pangalan ng dalawang variable: xStat at yStat.
          • Sa TI-86, buksan ang listahan ng mga pangalan; para gawin itong pindutin ang – – .
          • Ang mga magagamit na variable ay ipinapakita sa ilalim na linya ng screen. Piliin (malamang sa pamamagitan ng pagpindot sa F1 o F2), maglagay ng kuwit, at pagkatapos ay piliin ang .
          • Pindutin ang Enter upang iproseso ang ipinasok na data.
      5. Pag-aralan ang mga resulta. Sa pamamagitan ng pagpindot sa Enter, ang sumusunod na impormasyon ay ipapakita sa screen:

        • y = a + b x (\displaystyle y=a+bx): ay isang function na naglalarawan ng isang tuwid na linya. Tandaan na ang function ay hindi nakasulat sa karaniwang anyo (y = kx + b).
        • a = (\displaystyle a=). Ito ang y-coordinate ng punto kung saan ang linya ay bumalandra sa y-axis.
        • b = (\displaystyle b=). Ito ay dalisdis tuwid.
        • corr = (\displaystyle (\text(corr))=). Ito ang koepisyent ng ugnayan.
        • n = (\displaystyle n=). Ito ang bilang ng mga pares ng mga numero na ginamit sa pagkalkula.

Na may ugnayan ang parehong halaga ng isang katangian ay tumutugma sa iba't ibang mga halaga ng isa pa. Halimbawa: mayroong isang ugnayan sa pagitan ng taas at timbang, sa pagitan ng saklaw ng mga malignant na neoplasma at edad, atbp.

Mayroong 2 mga pamamaraan para sa pagkalkula ng koepisyent ng ugnayan: ang paraan ng mga parisukat (Pearson), ang paraan ng mga ranggo (Spearman).

Ang pinakatumpak ay ang paraan ng mga parisukat (Pearson), kung saan ang koepisyent ng ugnayan ay tinutukoy ng formula: , kung saan

Ang r xy ay ang koepisyent ng ugnayan sa pagitan ng istatistikal na serye X at Y.

d x ay ang paglihis ng bawat isa sa mga numero ng istatistikal na serye X mula sa arithmetic mean nito.

d y ay ang paglihis ng bawat isa sa mga numero ng istatistikal na serye Y mula sa arithmetic mean nito.

Depende sa lakas ng koneksyon at direksyon nito, ang correlation coefficient ay maaaring mula 0 hanggang 1 (-1). Ang isang koepisyent ng ugnayan na 0 ay nagpapahiwatig ng kumpletong kakulangan ng koneksyon. Kung mas malapit ang antas ng koepisyent ng ugnayan sa 1 o (-1), mas malaki, ayon sa pagkakabanggit, mas malapit ang direkta o feedback na sinusukat nito. Sa isang koepisyent ng ugnayan na katumbas ng 1 o (-1), ang koneksyon ay kumpleto, gumagana.

Scheme para sa pagtatantya ng lakas ng ugnayan sa pamamagitan ng koepisyent ng ugnayan

Lakas ng koneksyon

Ang halaga ng koepisyent ng ugnayan, kung magagamit

direktang koneksyon (+)

feedback (-)

Walang koneksyon

Ang komunikasyon ay maliit (mahina)

mula 0 hanggang +0.29

0 hanggang -0.29

Average ng komunikasyon (katamtaman)

+0.3 hanggang +0.69

-0.3 hanggang -0.69

Malaki ang komunikasyon (malakas)

+0.7 hanggang +0.99

-0.7 hanggang -0.99

Kumpleto na ang komunikasyon

(functional)

Upang kalkulahin ang koepisyent ng ugnayan gamit ang paraan ng mga parisukat, isang talahanayan ng 7 mga haligi ay pinagsama-sama. Suriin natin ang proseso ng pagkalkula gamit ang isang halimbawa:

TUKUYIN ANG LAKAS AT KALIKASAN NG RELASYON SA PAGITAN

Oras na-

ness

goiter

(V y )

d x= V xM x

d y= V yM y

d x d y

d x 2

d y 2

Σ -1345 ,0

Σ 13996 ,0

Σ 313 , 47

1. Tukuyin ang average na nilalaman ng yodo sa tubig (sa mg / l).

mg/l

2. Tukuyin ang average na saklaw ng goiter sa%.

3. Tukuyin ang paglihis ng bawat V x mula sa M x, i.e. d x .

201–138=63; 178–138=40 atbp.

4. Katulad nito, tinutukoy namin ang paglihis ng bawat V y mula sa M y, i.e. d

0.2–3.8=-3.6; 0.6–38=-3.2 atbp.

5. Tinutukoy namin ang mga produkto ng mga deviations. Ang resultang produkto ay summed up at nakuha.

6. Namin parisukat d x at ibuod ang mga resulta, makuha namin.

7. Katulad nito, parisukat namin ang d y, ibuod ang mga resulta, nakukuha namin

8. Sa wakas, pinapalitan namin ang lahat ng halagang natanggap sa formula:

Upang malutas ang isyu ng pagiging maaasahan ng koepisyent ng ugnayan, tinutukoy ito karaniwang error ayon sa formula:

(Kung ang bilang ng mga obserbasyon ay mas mababa sa 30, kung gayon ang denominator ay n-1).

Sa ating halimbawa

Ang halaga ng koepisyent ng ugnayan ay itinuturing na maaasahan kung ito ay hindi bababa sa 3 beses na mas mataas kaysa sa average na error nito.

Sa ating halimbawa

Kaya, ang koepisyent ng ugnayan ay hindi maaasahan, na ginagawang kinakailangan upang madagdagan ang bilang ng mga obserbasyon.

Ang koepisyent ng ugnayan ay maaaring matukoy sa isang medyo hindi gaanong tumpak, ngunit mas madaling paraan, ang paraan ng ranggo (Spearman).

Paraan ng Spearman: P=1-(6∑d 2 /n-(n 2 -1))

gumawa ng dalawang row ng pinagpares na pinaghahambing na mga feature, na nagtalaga ng una at pangalawang row, ayon sa pagkakabanggit, x at y. Kasabay nito, ipakita ang unang hilera ng katangian sa pababang o pataas na pagkakasunud-sunod, at ilagay ang mga numerical na halaga ng pangalawang hilera sa tapat ng mga halaga ng unang hilera kung saan sila tumutugma.

dapat mapalitan ng serial number (ranggo) ang halaga ng feature sa bawat kumpara na row. Ang mga ranggo, o mga numero, ay nagpapahiwatig ng mga lugar ng mga tagapagpahiwatig (mga halaga) ng una at ikalawang hanay. Kasabay nito, ang mga ranggo ay dapat na italaga sa mga numerical na halaga ng pangalawang tampok sa parehong pagkakasunud-sunod na pinagtibay kapag namamahagi ng kanilang mga halaga sa mga halaga ng unang tampok. Sa parehong mga halaga ng katangian sa serye, ang mga ranggo ay dapat na matukoy bilang ang average na numero mula sa kabuuan ng mga ordinal na numero ng mga halagang ito

tukuyin ang pagkakaiba sa mga ranggo sa pagitan ng x at y (d): d = x - y

parisukat ang resultang pagkakaiba ng ranggo (d 2)

makuha ang kabuuan ng mga parisukat ng pagkakaiba (Σ d 2) at palitan ang nakuha na mga halaga sa formula:

Halimbawa: gamit ang paraan ng ranggo upang maitaguyod ang direksyon at lakas ng ugnayan sa pagitan ng haba ng serbisyo sa mga taon at ang dalas ng mga pinsala, kung ang mga sumusunod na data ay nakuha:

Rationale para sa pagpili ng paraan: upang malutas ang problema, ang paraan lamang ang maaaring piliin ugnayan ng ranggo, dahil ang unang hilera ng katangiang "karanasan sa trabaho sa mga taon" ay may mga bukas na opsyon (karanasan sa trabaho hanggang 1 taon at 7 o higit pang mga taon), na hindi pinapayagan ang paggamit ng isang mas tumpak na paraan - ang paraan ng mga parisukat - upang magtatag ng isang relasyon sa pagitan ng pinaghahambing na mga katangian.

Desisyon. Ang pagkakasunud-sunod ng mga kalkulasyon ay inilarawan sa teksto, ang mga resulta ay ipinakita sa Talahanayan. 2.

talahanayan 2

Karanasan sa trabaho sa mga taon

Bilang ng mga pinsala

Ordinal na numero (ranggo)

Pagkakaiba ng Ranggo

rank difference squared

d(x-y)

d 2

Ang bawat isa sa mga hilera ng ipinares na mga palatandaan ay tinutukoy ng "x" at ng "y" (mga hanay 1-2).

Ang halaga ng bawat isa sa mga palatandaan ay pinalitan ng isang ranggo (serial) na numero. Ang pagkakasunud-sunod ng pamamahagi ng mga ranggo sa seryeng "x" ay ang mga sumusunod: ang pinakamababang halaga ng katangian (karanasan hanggang 1 taon) ay itinalaga ang serial number na "1", ang mga kasunod na variant ng parehong serye ng katangian, ayon sa pagkakabanggit , sa pagtaas ng pagkakasunud-sunod ng ika-2, ika-3, ika-4 at ika-5 na serial number - mga ranggo (tingnan ang hanay 3). Ang isang katulad na pagkakasunud-sunod ay sinusunod kapag namamahagi ng mga ranggo sa pangalawang tampok na "y" (hanay 4). Sa mga kaso kung saan mayroong ilang mga variant ng parehong laki (halimbawa, sa karaniwang gawain, ito ay 12 at 12 na pinsala sa bawat 100 manggagawa na may karanasan ng 3-4 na taon at 5-6 na taon), ang serial number ay ipinahiwatig ng ang average na numero mula sa kabuuan ng kanilang mga serial number. Ang data na ito sa bilang ng mga pinsala (12 pinsala) sa ranking ay dapat sumakop sa 2 at 3 lugar, kaya ang average na bilang ng mga ito ay (2 + 3) / 2 = 2.5. ) dapat ipamahagi ang parehong mga numero ng ranggo - "2.5" (hanay 4).

Tukuyin ang pagkakaiba sa mga ranggo d = (x - y) - (column 5)

Pag-squaring ng pagkakaiba sa mga ranggo (d 2) at pagkuha ng kabuuan ng mga parisukat ng pagkakaiba sa mga ranggo Σ d 2 (kolumna 6).

Kalkulahin ang rank correlation coefficient gamit ang formula:

kung saan ang n ay ang bilang ng mga magkatugmang pares ng mga opsyon sa row "x" at row "y"