Kahulugan ng notasyon sa pagsusuri ng pagkakaiba. Pagsusuri ng pagkakaiba-iba

Pagsusuri ng pagkakaiba-iba(mula sa Latin na Dispersio - dispersion / sa English Analysis Of Variance - ANOVA) ay ginagamit upang pag-aralan ang impluwensya ng isa o higit pang qualitative variable (factors) sa isang umaasa na quantitative variable (tugon).

Ang pagsusuri ng pagkakaiba-iba ay batay sa pagpapalagay na ang ilang mga variable ay maaaring ituring bilang mga sanhi (mga kadahilanan, mga independiyenteng variable): , at iba pa bilang mga kahihinatnan (mga umaasa na variable). Ang mga independiyenteng variable ay tinatawag na mga adjustable factor kung minsan dahil sa eksperimento ang mananaliksik ay may pagkakataon na pag-iba-ibahin ang mga ito at pag-aralan ang resultang resulta.

pangunahing layunin pagsusuri ng pagkakaiba-iba(ANOVA) ay ang pag-aaral ng kahalagahan ng mga pagkakaiba sa pagitan ng mga paraan sa pamamagitan ng paghahambing (pagsusuri) ng mga pagkakaiba. Ang paghahati sa kabuuang pagkakaiba sa maraming pinagmulan ay nagbibigay-daan sa isa na ihambing ang pagkakaiba dahil sa pagkakaiba sa pagitan ng pangkat sa pagkakaiba dahil sa pagkakaiba-iba sa loob ng pangkat. Kung totoo ang null hypothesis (tungkol sa pagkakapantay-pantay ng mga paraan sa ilang grupo ng mga obserbasyon na pinili mula sa pangkalahatang populasyon), ang pagtatantya ng pagkakaiba-iba na nauugnay sa pagkakaiba-iba ng intragroup ay dapat na malapit sa pagtatantya ng pagkakaiba-iba ng intergroup. Kung inihahambing mo lamang ang ibig sabihin ng dalawang sample, ang pagsusuri ng variance ay magbibigay ng parehong resulta bilang isang regular na independiyenteng sample t-test (kung naghahambing ka ng dalawang independiyenteng grupo ng mga bagay o obserbasyon) o isang dependent-sample t-test ( kung naghahambing ka ng dalawang variable sa pareho at parehong hanay ng mga bagay o obserbasyon).

Ang kakanyahan ng pagsusuri ng pagkakaiba-iba ay nakasalalay sa paghahati ng kabuuang pagkakaiba ng katangiang pinag-aaralan sa magkakahiwalay na bahagi dahil sa impluwensya ng mga tiyak na salik, at pagsubok ng mga hypotheses tungkol sa kahalagahan ng impluwensya ng mga salik na ito sa katangiang pinag-aaralan. Sa pamamagitan ng paghahambing ng mga bahagi ng dispersion sa isa't isa gamit ang Fisher F-test, posibleng matukoy kung anong proporsyon ng kabuuang pagkakaiba-iba ng nagresultang katangian ay dahil sa pagkilos ng mga adjustable na kadahilanan.

Ang pinagmumulan ng materyal para sa pagsusuri ng pagkakaiba-iba ay ang data ng pag-aaral ng tatlo o higit pang mga sample: , na maaaring magkapareho o hindi pantay sa bilang, parehong konektado at hindi nakakonekta. Ayon sa bilang ng mga natukoy na adjustable na kadahilanan, ang pagsusuri ng pagkakaiba ay maaaring isang salik(kasabay nito, pinag-aaralan ang impluwensya ng isang salik sa mga resulta ng eksperimento), dalawang salik(kapag pinag-aaralan ang impluwensya ng dalawang salik) at multifactorial(nagbibigay-daan sa iyong suriin hindi lamang ang impluwensya ng bawat isa sa mga salik nang hiwalay, kundi pati na rin ang kanilang pakikipag-ugnayan).

Ang pagsusuri ng pagkakaiba ay kabilang sa pangkat ng mga parametric na pamamaraan at samakatuwid ay dapat lamang itong gamitin kapag napatunayang normal ang distribusyon.

Ang pagsusuri ng pagkakaiba ay ginagamit kung ang dependent variable ay sinusukat sa isang sukatan ng mga ratios, interval, o order, at ang mga nakakaimpluwensyang variable ay non-numeric (name scale).

Mga halimbawa ng gawain

Sa mga problema na nalutas sa pamamagitan ng pagsusuri ng pagkakaiba-iba, mayroong isang tugon ng isang numerical na kalikasan, na apektado ng ilang mga variable na may isang nominal na kalikasan. Halimbawa, ilang uri ng rasyon sa pagpapataba ng mga hayop o dalawang paraan ng pag-iingat sa kanila, atbp.

Halimbawa 1: Sa loob ng linggo, maraming kiosk ng parmasya ang gumana sa tatlong magkakaibang lokasyon. Sa hinaharap, isa lang ang maiiwan natin. Kinakailangang matukoy kung may makabuluhang pagkakaiba sa istatistika sa pagitan ng mga dami ng benta ng mga gamot sa mga kiosk. Kung oo, pipiliin namin ang kiosk na may pinakamataas na average na pang-araw-araw na dami ng benta. Kung ang pagkakaiba sa dami ng mga benta ay lumabas na hindi gaanong mahalaga sa istatistika, kung gayon ang iba pang mga tagapagpahiwatig ay dapat na maging batayan para sa pagpili ng isang kiosk.

Halimbawa 2: Paghahambing ng mga kaibahan ng paraan ng pangkat. Ang pitong political affiliation ay inayos mula sa sobrang liberal hanggang sa sobrang konserbatibo, at ang linear contrast ay ginagamit upang subukan kung mayroong non-zero upward trend sa group means—i.e., kung mayroong makabuluhang linear na pagtaas sa mean age kapag isinasaalang-alang ang mga grupong inorder sa ang direksyon mula liberal hanggang konserbatibo.

Halimbawa 3: Dalawang-daan na pagsusuri ng pagkakaiba. Ang bilang ng mga benta ng produkto, bilang karagdagan sa laki ng tindahan, ay kadalasang apektado ng lokasyon ng mga istante na may produkto. Ang halimbawang ito ay naglalaman ng mga lingguhang numero ng benta na nailalarawan sa pamamagitan ng apat na layout ng istante at tatlong laki ng tindahan. Ang mga resulta ng pagsusuri ay nagpapakita na ang parehong mga kadahilanan - ang lokasyon ng mga istante na may mga kalakal at ang laki ng tindahan - ay nakakaapekto sa bilang ng mga benta, ngunit ang kanilang pakikipag-ugnayan ay hindi makabuluhan.

Halimbawa 4: Univariate ANOVA: Randomized two-treatment full block na disenyo. Ang impluwensya ng lahat ng posibleng kumbinasyon ng tatlong taba at tatlong dough ripper sa pagluluto ng tinapay ay sinisiyasat. Apat na sample ng harina na kinuha mula sa apat na magkakaibang pinagmumulan ang nagsilbing block factor. Kailangang matukoy ang kahalagahan ng pakikipag-ugnayan ng fat-ripper. Pagkatapos nito, upang matukoy ang iba't ibang mga pagpipilian para sa pagpili ng mga kaibahan, na nagbibigay-daan sa iyo upang malaman kung aling mga kumbinasyon ng mga antas ng mga kadahilanan ang naiiba.

Halimbawa 5: Modelo ng isang hierarchical (nested) na plano na may magkakahalong epekto. Ang impluwensya ng apat na random na napiling mga ulo na naka-mount sa isang tool ng makina sa pagpapapangit ng mga manufactured glass cathode holder ay pinag-aralan. (Ang mga ulo ay itinayo sa makina, kaya ang parehong ulo ay hindi maaaring gamitin sa iba't ibang mga makina.) Ang epekto ng ulo ay itinuturing bilang isang random na kadahilanan. Ipinapakita ng mga istatistika ng ANOVA na walang makabuluhang pagkakaiba sa pagitan ng mga makina, ngunit may mga indikasyon na maaaring magkaiba ang mga ulo. Ang pagkakaiba sa pagitan ng lahat ng mga makina ay hindi makabuluhan, ngunit para sa dalawa sa kanila ang pagkakaiba sa pagitan ng mga uri ng ulo ay makabuluhan.

Halimbawa 6: Univariate ang paulit-ulit na pagsusuri sa pagsukat gamit ang split-plot plan. Isinagawa ang eksperimentong ito upang matukoy ang epekto ng rating ng pagkabalisa ng isang indibidwal sa pagganap ng pagsusulit sa apat na magkakasunod na pagtatangka. Inayos ang data upang maituring ang mga ito bilang mga pangkat ng mga subset ng buong set ng data ("ang buong plot"). Ang epekto ng pagkabalisa ay hindi makabuluhan, habang ang epekto ng pagsubok ay makabuluhan.

Listahan ng mga pamamaraan

  • Mga modelo ng factorial na eksperimento. Mga halimbawa: mga salik na nakakaapekto sa tagumpay ng paglutas ng mga problema sa matematika; mga kadahilanan na nakakaimpluwensya sa dami ng mga benta.

Ang data ay binubuo ng ilang serye ng mga obserbasyon (pagproseso), na itinuturing bilang mga pagsasakatuparan ng mga independiyenteng sample. Ang paunang hypothesis ay walang pagkakaiba sa mga paggamot, i.e. ipinapalagay na ang lahat ng mga obserbasyon ay maaaring ituring bilang isang sample mula sa kabuuang populasyon:

  • One-factor parametric model: Ang pamamaraan ni Scheffe.
  • One-factor non-parametric model [Lagutin M.B., 237]: Kruskal-Wallis test [Hollender M., Wolf D.A., 131], Jonkheer's test [Lagutin M.B., 245].
  • Pangkalahatang kaso ng isang modelo na may pare-parehong mga kadahilanan, ang teorama ni Cochran [Afifi A., Eisen S., 234].

Ang data ay dalawang beses na paulit-ulit na mga obserbasyon:

  • Dalawang-factor na non-parametric na modelo: Friedman's criterion [Lapach, 203], Page's criterion [Lagutin M.B., 263]. Mga halimbawa: paghahambing ng pagiging epektibo ng mga pamamaraan ng produksyon, mga kasanayan sa agrikultura.
  • Dalawang-factor na nonparametric na modelo para sa hindi kumpletong data

Kwento

Saan nagmula ang pangalan pagsusuri ng pagkakaiba-iba? Maaaring mukhang kakaiba na ang pamamaraan para sa paghahambing ng mga paraan ay tinatawag na pagsusuri ng pagkakaiba-iba. Sa katunayan, ito ay dahil sa katotohanan na kapag sinusuri ang istatistikal na kahalagahan ng pagkakaiba sa pagitan ng mga paraan ng dalawa (o ilan) na mga grupo, aktwal nating inihahambing ang (pagsusuri) ng mga pagkakaiba-iba ng sample. Ang pangunahing konsepto ng pagsusuri ng pagkakaiba ay iminungkahi Fisher noong 1920. Marahil ang isang mas natural na termino ay ang kabuuan ng pagsusuri ng mga parisukat o pagsusuri ng pagkakaiba-iba, ngunit dahil sa tradisyon, ang terminong pagsusuri ng pagkakaiba ay ginagamit. Sa una, ang pagsusuri ng pagkakaiba ay binuo upang iproseso ang data na nakuha sa kurso ng mga espesyal na idinisenyong mga eksperimento, at itinuturing na ang tanging paraan na wastong nag-explore ng mga ugnayang sanhi. Ang pamamaraan ay ginamit upang suriin ang mga eksperimento sa produksyon ng pananim. Nang maglaon, naging malinaw ang pangkalahatang pang-agham na kahalagahan ng pagsusuri sa pagpapakalat para sa mga eksperimento sa sikolohiya, pedagogy, gamot, atbp.

Panitikan

  1. Sheff G. Pagsusuri ng pagpapakalat. - M., 1980.
  2. Ahrens H. Leiter Yu. Multivariate analysis ng variance.
  3. Kobzar A.I. Inilapat na mga istatistika ng matematika. - M.: Fizmatlit, 2006.
  4. Lapach S. N., Chubenko A. V., Babich P. N. Mga istatistika sa agham at negosyo. - Kyiv: Morion, 2002.
  5. Lagutin M. B. Mga istatistika ng visual na matematika. Sa dalawang volume. - M.: P-center, 2003.
  6. Afifi A., Eisen S. Pagsusuri ng istatistika: Isang nakakompyuter na diskarte.
  7. Hollender M., Wolf D.A. Mga Pamamaraang Nonparametric mga istatistika.

Mga link

  • Pagsusuri ng Variance - StatSoft e-textbook.

5.1. Ano ang pagsusuri ng pagkakaiba-iba?

Ang pagsusuri ng pagkakaiba ay binuo noong 1920s ng English mathematician at geneticist na si Ronald Fisher. Ayon sa isang survey sa mga siyentipiko, na nalaman kung sino ang pinaka-impluwensyahan ang biology ng ika-20 siglo, si Sir Fisher ang nanalo ng kampeonato (para sa kanyang mga serbisyo ay ginawaran siya ng isang kabalyero - isa sa pinakamataas na pagkakaiba sa Great Britain); sa bagay na ito, si Fisher ay maihahambing kay Charles Darwin, na pinakamalaking impluwensya biology noong ika-19 na siglo.

Ang dispersion analysis (Analis of variance) ay isa na ngayong hiwalay na sangay ng mga istatistika. Ito ay batay sa katotohanang natuklasan ni Fisher na ang sukatan ng pagkakaiba-iba ng dami na pinag-aaralan ay maaaring mabulok sa mga bahagi na tumutugma sa mga salik na nakakaimpluwensya sa dami na ito at mga random na paglihis.

Upang maunawaan ang kakanyahan ng pagsusuri ng pagkakaiba-iba, gagawa kami ng parehong uri ng mga kalkulasyon nang dalawang beses: "manu-mano" (na may calculator) at gamit ang programang Statistika. Upang gawing simple ang aming gawain, hindi kami gagana sa mga resulta ng isang tunay na paglalarawan ng pagkakaiba-iba ng mga berdeng palaka, ngunit sa isang kathang-isip na halimbawa na may kinalaman sa paghahambing ng mga babae at lalaki sa mga tao. Isaalang-alang ang pagkakaiba-iba ng taas ng 12 matanda: 7 babae at 5 lalaki.

Talahanayan 5.1.1. One-Way ANOVA Halimbawa: Data ng Kasarian at Taas para sa 12 Tao

Magsagawa tayo ng one-way analysis ng variance: ikumpara natin kung malaki ang pagkakaiba ng mga lalaki at babae sa istatistikal o hindi sa nailalarawan na grupo sa mga tuntunin ng taas.

5.2. Subukan para sa normal na pamamahagi

Ang karagdagang pangangatwiran ay batay sa katotohanan na ang distribusyon sa itinuturing na sample ay normal o malapit sa normal. Kung ang distribusyon ay malayo sa normal, ang pagkakaiba (variance) ay hindi isang sapat na sukatan ng pagkakaiba-iba nito. Gayunpaman, ang pagsusuri ng pagkakaiba ay medyo lumalaban sa mga paglihis ng distribusyon mula sa normalidad.

Ang pagsubok sa mga data na ito para sa normalidad ay maaaring gawin sa dalawang magkaibang paraan. Una: Statistics / Basic Statistics/Tables / Descriptive statistics / Normality tab. Sa tab Normalidad maaari mong piliin kung aling mga normal na pagsubok sa pamamahagi ang gagamitin. Kapag nag-click ka sa pindutan ng Mga talahanayan ng dalas, lilitaw ang talahanayan ng dalas, at ang mga pindutan ng Histograms - isang histogram. Ipapakita ng talahanayan at bar graph ang mga resulta ng iba't ibang pagsubok.

Ang pangalawang paraan ay nauugnay sa paggamit ng naaangkop na mga posibilidad kapag gumagawa ng mga histogram. Sa dialog ng pagbuo ng histogram (Grafs / Histograms...), piliin ang tab na Advanced. Sa ibabang bahagi nito ay mayroong bloke ng Statistics. Tandaan ito Shapiro-Wilk t est at Kolmogorov-Smirnov test, tulad ng ipinapakita sa figure.

kanin. 5.2.1. Mga pagsusulit sa istatistika para sa normal na distribusyon sa dialog ng pagbuo ng histogram

Tulad ng makikita mula sa histogram, ang pamamahagi ng paglago sa aming sample ay naiiba mula sa normal (sa gitna - "pagkabigo").


kanin. 5.2.2. Naka-plot ang histogram gamit ang mga parameter na tinukoy sa nakaraang figure

Ang ikatlong linya sa pamagat ng graph ay nagpapahiwatig ng mga parameter ng normal na distribusyon, na pinakamalapit sa naobserbahang distribusyon. Ang pangkalahatang ibig sabihin ay 173, ang pangkalahatang karaniwang paglihis ay 10.4. Ang inset sa ibaba ng graph ay nagpapakita ng mga resulta ng mga pagsubok para sa normalidad. Ang D ay ang Kolmogorov-Smirnov test at ang SW-W ay ang Shapiro-Wilk test. Tulad ng makikita, para sa lahat ng mga pagsubok na ginamit, ang mga pagkakaiba sa distribusyon ng paglago mula sa normal na distribusyon ay naging hindi gaanong mahalaga sa istatistika ( p sa lahat ng kaso na higit sa 0.05).

Kaya, pormal na pagsasalita, ang mga pagsubok para sa pagsang-ayon ng pamamahagi sa normal ay hindi "nagbawal" sa amin sa paggamit parametric na pamamaraan batay sa pagpapalagay ng isang normal na distribusyon. Tulad ng nabanggit na, ang pagsusuri ng pagkakaiba ay medyo lumalaban sa mga paglihis mula sa normalidad, kaya ginagamit pa rin namin ito.

5.3. One-Way ANOVA: Mga Manu-manong Pagkalkula

Upang makilala ang pagkakaiba-iba ng taas ng mga tao sa halimbawa sa itaas, kinakalkula namin ang kabuuan ng mga parisukat na paglihis (sa Ingles ito ay tinutukoy bilang SS , Sum of Squares o ) mga indibidwal na halaga mula sa mean: . Ang average na halaga para sa taas sa halimbawa sa itaas ay 173 sentimetro. Batay sa mga ito,

SS = (186–173) 2 + (169–173) 2 + (166–173) 2 + (188–173) 2 + (172–173) 2 + (179–173) 2 + (165–173) 2 + (174–173) 2 + (163–173) 2 + (162–173) 2 + (162–173) 2 + (190–173) 2 ;

SS = 132 + 42 + 72 + 152 + 12 + 62 + 82 + 12 + 102 + 112 + 112 + 172;

SS = 169 + 16 + 49 + 225 + 1 + 36 + 64 + 1 + 100 + 121 + 121 + 289 = 1192.

Ang resultang halaga (1192) ay isang sukatan ng pagkakaiba-iba ng buong set ng data. Gayunpaman, binubuo sila ng dalawang grupo, para sa bawat isa ay posible na maglaan ng sarili nitong average. Sa ibinigay na data, ang average na taas ng kababaihan ay 168 cm, at lalaki - 180 cm.

Kalkulahin ang kabuuan ng mga squared deviations para sa mga babae:

SS f = (169–168) 2 + (166–168) 2 + (172–168) 2 + (179–168) 2 + (163–168) 2 + (162–168) 2 ;

SS f = 12 + 22 + 42 + 112 + 32 + 52 + 62 = 1 + 4 + 16 + 121 + 9 + 25 + 36 = 212.

Kinakalkula din namin ang kabuuan ng mga squared deviations para sa mga lalaki:

SS m = (186–180) 2 + (188–180) 2 + (174–180) 2 + (162–180) 2 + (190–180) 2 ;

SS m = 62 + 82 + 62 + 182 + 102 = 36 + 64 + 36 + 324 + 100 = 560.

Ano ang nakasalalay sa halaga sa ilalim ng pag-aaral alinsunod sa lohika ng pagsusuri ng pagkakaiba?

Dalawang kalkuladong dami, SS f at SS m , nailalarawan ang pagkakaiba-iba ng intragroup, na sa pagsusuri ng pagkakaiba-iba ay karaniwang tinatawag na "error". Ang pinagmulan ng pangalang ito ay konektado sa sumusunod na lohika.

Ano ang tumutukoy sa taas ng isang tao sa halimbawang ito? Una sa lahat, mula sa karaniwang taas ng mga tao sa pangkalahatan, anuman ang kanilang kasarian. Pangalawa, mula sa sahig. Kung ang mga tao ng isang kasarian (lalaki) ay mas matangkad kaysa sa isa (babae), ito ay maaaring katawanin bilang karagdagan sa "unibersal" na average ng ilang halaga, ang epekto ng kasarian. Sa wakas, ang mga tao ng parehong kasarian ay nagkakaiba sa taas dahil sa mga indibidwal na pagkakaiba. Sa loob ng isang modelo na naglalarawan sa taas bilang ang kabuuan ng ibig sabihin ng tao kasama ang isang pagsasaayos ng kasarian, ang mga indibidwal na pagkakaiba ay hindi maipaliwanag at maaaring makita bilang isang "pagkakamali".

Kaya, alinsunod sa lohika ng pagsusuri ng pagkakaiba-iba, ang halaga sa ilalim ng pag-aaral ay tinutukoy bilang mga sumusunod: , saan xij - i-th value ng pinag-aralan na dami sa j-th value ng pinag-aralan na salik; - pangkalahatang average; Fj - ang impluwensya ng j-th na halaga ng pinag-aralan na kadahilanan; - "error", ang kontribusyon ng indibidwalidad ng bagay na tinutukoy ng halagaxij .

Intergroup kabuuan ng mga parisukat

Kaya, SS pagkakamali = SS f + SS m = 212 + 560 = 772. Sa halagang ito, inilarawan namin ang pagkakaiba-iba ng intragroup (kapag naghihiwalay ang mga grupo ayon sa kasarian). Ngunit mayroon ding pangalawang bahagi ng pagkakaiba-iba - intergroup, na tatawagin natinEpekto ng SS (dahil pinag-uusapan natin ang epekto ng paghahati ng hanay ng mga bagay na isinasaalang-alang sa mga babae at lalaki).

Ang ibig sabihin ng bawat pangkat ay naiiba sa pangkalahatang mean. Kapag kinakalkula ang kontribusyon ng pagkakaibang ito sa pangkalahatang sukatan ng pagkakaiba-iba, dapat nating i-multiply ang pagkakaiba sa pagitan ng pangkat at kabuuang mean sa bilang ng mga bagay sa bawat pangkat.

Epekto ng SS = = 7x(168-173) 2 + 5x(180-173) 2 = 7x52 + 5x72 = 7x25 + 5x49 = 175 + 245 = 420.

Narito ang prinsipyo ng pagiging matatag ng kabuuan ng mga parisukat, na natuklasan ni Fisher, ay nagpakita mismo: SS = SS effect + SS error , ibig sabihin. para sa halimbawang ito, 1192 = 440 + 722.

Mga gitnang parisukat

Ang paghahambing sa aming halimbawa ng intergroup at intragroup na mga kabuuan ng mga parisukat, makikita natin na ang una ay nauugnay sa pagkakaiba-iba ng dalawang grupo, at ang pangalawa - 12 na mga halaga sa 2 grupo. Bilang ng antas ng kalayaan ( df ) para sa ilang parameter ay maaaring tukuyin bilang pagkakaiba sa pagitan ng bilang ng mga bagay sa pangkat at ang bilang ng mga dependency (mga equation) na nagkokonekta sa mga halagang ito.

Sa ating halimbawa epekto ng df = 2–1 = 1, a df error = 12–2 = 10.

Maaari nating hatiin ang mga kabuuan ng mga parisukat sa bilang ng kanilang mga antas ng kalayaan upang makuha ang ibig sabihin ng mga parisukat ( MS , Paraan ng mga parisukat). Kapag nagawa na natin ito, maitatag natin iyon MS - walang iba kundi ang mga pagkakaiba-iba ("dispersions", ang resulta ng paghahati ng kabuuan ng mga parisukat sa bilang ng mga antas ng kalayaan). Pagkatapos ng pagtuklas na ito, mauunawaan natin ang istraktura ng talahanayan ng ANOVA. Para sa aming halimbawa, magiging ganito ang hitsura.

Epekto

Pagkakamali

Epekto ng MS at Mga error sa MS ay mga pagtatantya ng mga pagkakaiba-iba ng intergroup at intragroup, at, samakatuwid, maihahambing ang mga ito ayon sa criterionF (Snedecor's criterion, pinangalanang Fischer), na idinisenyo upang ihambing ang mga variant. Ang criterion na ito ay simpleng quotient ng paghahati ng mas malaking pagkakaiba sa mas maliit. Sa aming kaso, ito ay 420 / 77.2 = 5.440.

Pagpapasiya ng istatistikal na kahalagahan ng Fisher test ayon sa mga talahanayan

Kung tutukuyin natin ang istatistikal na kahalagahan ng epekto nang manu-mano, gamit ang mga talahanayan, kakailanganin nating ihambing ang nakuhang halaga ng pamantayan. F na may kritikal, na tumutugma sa isang tiyak na antas ng istatistikal na kahalagahan para sa mga ibinigay na antas ng kalayaan.


kanin. 5.3.1. Fragment ng talahanayan na may mga kritikal na halaga ng criterion F

Tulad ng makikita mo, para sa antas ng istatistikal na kahalagahan p=0.05, ang kritikal na halaga ng criterionF ay 4.96. Nangangahulugan ito na sa aming halimbawa, ang epekto ng pinag-aralan na kasarian ay naitala na may antas ng istatistikal na kahalagahan na 0.05.

Ang resulta na nakuha ay maaaring bigyang-kahulugan bilang mga sumusunod. Ang posibilidad ng null hypothesis, ayon sa kung saan ang average na taas ng mga babae at lalaki ay pareho, at ang naitala na pagkakaiba sa kanilang taas ay dahil sa randomness sa pagbuo ng mga sample, ay mas mababa sa 5%. Nangangahulugan ito na dapat nating piliin ang alternatibong hypothesis na ang average na taas ng babae at lalaki ay magkaiba.

5.4. One-way na pagsusuri ng pagkakaiba-iba ( ANOVA) sa Statistica package

Sa mga kaso kung saan ang mga kalkulasyon ay hindi ginawa nang manu-mano, ngunit sa tulong ng naaangkop na mga programa (halimbawa, ang Statistica package), ang halaga p awtomatikong tinutukoy. Ito ay makikita na ito ay medyo mas mataas kaysa sa kritikal na halaga.

Upang pag-aralan ang halimbawang tinatalakay gamit ang pinakasimpleng bersyon ng pagsusuri ng variance, kailangan mong patakbuhin ang Statistics / ANOVA procedure para sa file na may kaukulang data at piliin ang One-way ANOVA na opsyon (one-way ANOVA) sa Uri ng window ng pagsusuri, at ang pagpipiliang dialog ng Quick specs sa window ng Paraan ng Pagtutukoy .


kanin. 5.4.1. Dialog General ANOVA/MANOVA (ANOVA)

Sa mabilis na dialog na window na bubukas, sa field na Mga Variable, kailangan mong tukuyin ang mga column na naglalaman ng data na pinag-aaralan namin ang variability (Listahan ng depende sa variable; sa aming kaso, ang column ng Paglago), pati na rin ang column na naglalaman ng mga value ​​na hinahati ang pinag-aralan na halaga sa mga pangkat (Catigorical predictor ( factor); sa aming kaso, ang Sex column). Sa pagsusuri na ito, sa kaibahan sa multivariate analysis isang salik lamang ang maaaring isaalang-alang.


kanin. 5.4.2. One-Way ANOVA Dialog (One-Way Analysis of Variance)

Sa window ng Factor codes, dapat mong tukuyin ang mga halaga ng salik na isinasaalang-alang na kailangang iproseso sa panahon ng pagsusuring ito. Ang lahat ng magagamit na mga halaga ay maaaring matingnan gamit ang pindutan ng Zoom; kung, tulad ng sa aming halimbawa, kailangan mong isaalang-alang ang lahat ng mga halaga ng kadahilanan (at para sa kasarian sa aming halimbawa ay dalawa lamang sa kanila), maaari mong i-click ang pindutang Lahat. Kapag naitakda na ang mga column sa pagpoproseso at mga factor code, maaari mong i-click ang OK na buton at pumunta sa window ng mabilisang pagsusuri para sa mga resulta: Mga Resulta ng ANOVA 1, sa tab na Mabilis.

kanin. 5.4.3. Ang Quick Tab ng ANOVA Results Window

Binibigyang-daan ka ng All effects/Graph na button na makita kung paano naghahambing ang mga average ng dalawang grupo. Sa itaas ng graph, ang bilang ng mga antas ng kalayaan ay ipinahiwatig, pati na rin ang mga halaga ng F at p para sa kadahilanan na isinasaalang-alang.


kanin. 5.4.4. Graphical na pagpapakita ng mga resulta ng pagsusuri ng pagkakaiba

Binibigyang-daan ka ng All effects button na makakuha ng ANOVA table na katulad ng inilarawan sa itaas (na may ilang makabuluhang pagkakaiba).


kanin. 5.4.5. Talahanayan na may mga resulta ng pagsusuri ng pagkakaiba-iba (ihambing sa isang katulad na talahanayan na nakuha "manu-mano")

Ang ilalim na linya ng talahanayan ay nagpapakita ng kabuuan ng mga parisukat, ang bilang ng mga antas ng kalayaan, at ang ibig sabihin ng mga parisukat para sa error (sa loob ng pangkat na pagkakaiba-iba). Sa linya sa itaas - magkatulad na mga tagapagpahiwatig para sa pinag-aralan na kadahilanan (sa kasong ito, ang tanda ng Kasarian), pati na rin ang pamantayan F (ang ratio ng mean squares ng effect sa mean squares ng error), at ang antas ng statistical significance nito. Ang katotohanan na ang epekto ng salik na isinasaalang-alang ay naging makabuluhan sa istatistika ay ipinapakita ng pulang pag-highlight.

At ang unang linya ay nagpapakita ng data sa indicator na "Intercept". Ito ang table row ay isang misteryo sa mga user na sumasali sa Statistica package sa ika-6 o mas bagong bersyon nito. Ang halaga ng Intercept ay malamang na nauugnay sa pagpapalawak ng kabuuan ng mga parisukat ng lahat ng mga halaga ng data (i.e. 1862 + 1692 … = 360340). Ang halaga ng criterion F na ipinahiwatig para dito ay nakuha sa pamamagitan ng paghahati MS Intercept / MS Error = 353220 / 77.2 = 4575.389 at natural na nagbibigay ng napakababang halaga p . Kapansin-pansin, sa Statistica-5 ang halagang ito ay hindi kinakalkula sa lahat, at ang mga manwal para sa paggamit ng mga susunod na bersyon ng pakete ay hindi nagkomento sa pagpapakilala nito sa anumang paraan. Marahil ang pinakamagandang bagay na magagawa ng isang Statistica-6 at mamaya na biologist ay ang basta-basta huwag pansinin ang Intercept row sa ANOVA table.

5.5. ANOVA at pamantayan ng Mag-aaral at Fisher: alin ang mas mahusay?

Gaya ng nakikita mo, ang data na aming ikinumpara gamit ang one-way analysis ng variance, maaari rin naming suriin gamit ang Student's and Fisher's tests. Ihambing natin ang dalawang pamamaraang ito. Upang gawin ito, kinakalkula namin ang pagkakaiba sa taas ng mga kalalakihan at kababaihan gamit ang mga pamantayang ito. Para magawa ito, kailangan nating sundin ang landas na Statistics / Basic Statistics / t-test, independent, ayon sa mga grupo. Naturally, Dependent variable ay ang Growth variable, at Grouping variable ay Sex variable.


kanin. 5.5.1. Paghahambing ng data na naproseso gamit ang ANOVA, ayon sa pamantayan ng Mag-aaral at Fisher

Tulad ng nakikita mo, ang resulta ay kapareho ng kapag gumagamit ng ANOVA. p = 0.041874 sa parehong mga kaso, tulad ng ipinapakita sa fig. 5.4.5 at ipinapakita sa Fig. 5.5.2 (tingnan para sa iyong sarili!).


kanin. 5.5.2. Ang mga resulta ng pagsusuri (detalyadong interpretasyon ng talahanayan ng mga resulta - sa talata sa pamantayan ng Mag-aaral)

Mahalagang bigyang-diin na bagama't ang criterion F mula sa isang mathematical point of view sa pagsusuri na isinasaalang-alang ayon sa pamantayan ng Student at Fisher ay pareho sa ANOVA (at nagpapahayag ng ratio ng pagkakaiba), ang kahulugan nito sa mga resulta ng Ang pagsusuri na kinakatawan ng huling talahanayan ay ganap na naiiba. Kapag naghahambing ayon sa pamantayan ng Mag-aaral at Fisher, ang paghahambing ng mga mean na halaga ng mga sample ay isinasagawa ayon sa pamantayan ng Mag-aaral, at ang paghahambing ng kanilang pagkakaiba-iba ay isinasagawa ayon sa pamantayan ng Fisher. Sa mga resulta ng pagsusuri, hindi ang variance mismo ang ipinapakita, ngunit ang square root nito - ang standard deviation.

Sa kabaligtaran, sa ANOVA, ang pagsubok ni Fisher ay ginagamit upang ihambing ang mga paraan ng iba't ibang mga sample (tulad ng aming tinalakay, ito ay ginagawa sa pamamagitan ng paghahati sa kabuuan ng mga parisukat sa mga bahagi at paghahambing ng average na kabuuan ng mga parisukat na tumutugma sa pagkakaiba-iba ng inter-at intra-grupo) .

Gayunpaman, ang pagkakaiba sa itaas ay may kinalaman sa pagtatanghal ng mga resulta ng isang istatistikal na pag-aaral kaysa sa kakanyahan nito. Gaya ng itinuturo ni Glantz (1999, p. 99), halimbawa, ang paghahambing ng mga grupo sa pamamagitan ng pagsusulit ng Mag-aaral ay maaaring ituring bilang isang espesyal na kaso ng pagsusuri ng pagkakaiba para sa dalawang sample.

Kaya, ang paghahambing ng mga sample ayon sa mga pagsusulit ng Mag-aaral at Fisher ay may isang mahalagang bentahe sa pagsusuri ng pagkakaiba-iba: maaari itong maghambing ng mga sample sa mga tuntunin ng kanilang pagkakaiba-iba. Ngunit ang mga pakinabang ng ANOVA ay makabuluhan pa rin. Kabilang sa mga ito, halimbawa, ay ang posibilidad ng sabay-sabay na paghahambing ng ilang mga sample.

DISPERSION ANALYSIS

sa mathematical statistics - isang istatistikal na paraan na idinisenyo upang matukoy ang impluwensya ng mga indibidwal na salik sa resulta ng isang eksperimento, gayundin para sa kasunod na pagpaplano ng mga katulad na eksperimento. Sa simula D. at. ay iminungkahi ni R. Fisher na iproseso ang mga resulta ng agronomic. mga eksperimento upang matukoy ang mga kondisyon kung saan ang nasubok na uri ng pananim ay nagbibigay ng pinakamataas na ani. Mga modernong aplikasyon ng D. at. sumasaklaw sa isang malawak na hanay ng mga problema ng ekonomiya, sosyolohiya, biology at teknolohiya at karaniwang binibigyang kahulugan sa mga tuntunin ng istatistika. sistematikong mga teorya ng pagtuklas. mga pagkakaiba sa pagitan ng mga resulta ng mga direktang pagsukat na isinagawa sa ilalim ng mga ito o iba pang nagbabagong kondisyon.

Kung ang mga halaga ng hindi kilalang mga constant ay 1 , ... , aI masusukat gamit ang iba't ibang paraan o mga instrumento sa pagsukat M 1,..., M J , at sa bawat kaso ay sistematiko. pagkakamali b ij maaaring, sa pangkalahatan, ay depende pareho sa piniling paraan mj, at mula sa hindi kilalang nasusukat na halaga a i, kung gayon ang mga resulta ng naturang mga sukat ay mga kabuuan ng form

kung saan ang K ay ang bilang ng mga independiyenteng sukat ng hindi kilalang dami a i paraan M j , a sa ijk- random na error k-ika mga sukat ng magnitude a i paraan Mj(assuming lahat y ijk- independiyenteng magkaparehong ipinamamahagi na mga random na variable na may zero mathematical. inaasahan: E sa ijk=0). Tulad ng isang linear two-factor scheme D. at.; ang una ay ang tunay na halaga ng sinusukat na halaga, ang pangalawa ay ang paraan ng pagsukat, at sa kasong ito, para sa bawat posibleng kumbinasyon ng mga halaga ng una at pangalawang kadahilanan, ang parehong bilang ng mga independiyenteng pagsukat ay isinasagawa ( ang palagay na ito ay hindi makabuluhan para sa mga layunin ng D. a. at ipinakilala dito lamang para sa kapakanan ng pagiging simple ng presentasyon) .

Ang isang halimbawa ng ganoong sitwasyon ay maaaring mga kumpetisyon sa palakasan ng mga atleta ng I, kung saan tinasa ang kasanayan J mga hukom, at ang bawat kalahok ng kumpetisyon ay si Kraz (may K "mga pagtatangka"). Sa kasong ito a i- ang tunay na halaga ng tagapagpahiwatig ng kakayahan ng atleta na may numero ako, bij- sistematiko error sa marka ng kasanayan i-ika-atleta bilang hukom na may numerong j, xijk- ibinigay na rating j-ika judge sa -th athlete pagkatapos ng huli k-ika mga pagtatangka, at y ijk- ang kaukulang random . Ito ay tipikal para sa tinatawag na. subjective na pagsusuri ng kalidad ng ilang mga bagay, na isinasagawa ng isang pangkat ng mga independiyenteng eksperto. Ang isa pang halimbawa ay ang mga istatistika. pag-aaral ng ani ng isang agricultural crop depende sa isa sa J varieties ng lupa at J na pamamaraan ng pagproseso nito, at para sa bawat iba't g ng lupa at bawat paraan ng pagproseso na may bilang na J, k independiyenteng mga eksperimento ay isinasagawa (sa halimbawang ito b ij- ang tunay na halaga ng ani para sa i-th varieties ng lupa na may j-th na paraan ng pagproseso, xijk ay ang kaukulang eksperimento na sinusunod na ani sa k-ika karanasan, at y ijk- ang random na error nito na nagmumula dahil sa ilang random na dahilan; para sa magnitude a i, pagkatapos ay sa agronomic mga eksperimento, makatuwirang isaalang-alang ang mga ito na katumbas ng zero).

Ilagay natin c ij =a i +b ij , bumitaw kasama si i*, na may *j at may ** - mga resulta ng pag-average kasama si ij ayon sa kaukulang mga indeks, i.e.

Hayaan, bilang karagdagan, a =c** , b i=kasama ko-kasama si **, g j = kasama si *j-c ** at d ij=kasama si ij-kasama ko-kasama si *j+ c ** . Ideya D. a. batay sa malinaw na pagkakakilanlan

Kung ang simbolo ( c ij) italaga ang mga sukat IJ, nakuha mula sa matrix ||с ij|| ng order IXJ sa tulong ng ilang pre-fixed na paraan ng pag-order ng mga elemento nito, pagkatapos (1) ay maaaring isulat bilang isang pagkakapantay-pantay kung saan ang lahat ng mga vectors ay may IJ, at a ij=a,b ij=b i,g ij=g j. Dahil ang apat na vector sa kanang bahagi ng (2) ay orthogonal, kung gayon a ij=a - ang pinakamahusay na approximation ng function c ij mula sa mga argumento i at j pare-parehong halaga [sa kahulugan ng pinakamababang kabuuan ng mga squared deviations ]. Sa parehong kahulugan a ij+b ij=a+b i- ang pinakamahusay c ij function depende lamang sa i, a ij+g ij=a+g j- pinakamahusay na pagtatantya c ij function depende lamang sa j, a a ij+b ij+g ij=a+b i+g j- pinakamahusay na pagtatantya c ij ang kabuuan ng mga function, kung saan ang isa (halimbawa, a+b i) ay nakasalalay lamang sa r, at ang isa ay nakasalalay lamang sa j. Ang katotohanang ito, na itinatag ni R. Fischer (tingnan ) noong 1918, sa kalaunan ay nagsilbi bilang batayan para sa teorya ng quadratic approximations ng mga function.

Sa halimbawa ng kompetisyong pampalakasan, d ij nagpapahayag ng "interaksyon" ng i-th athlete at ang j-th judge (ang positibong halaga ng ginamit ay nangangahulugang "paghusga", ibig sabihin, isang sistematikong overestimation ng pagtatasa ng kasanayan ng i-th judge sa i-th athlete, at isang negatibong halaga ng ginamit ay nangangahulugang " zaguzhivanie", ibig sabihin, isang sistematikong pagbaba sa marka). Ang pagkakapantay-pantay ng lahat ng second-hand hanggang zero ay isang kinakailangang kinakailangan, na dapat iharap sa gawain ng isang pangkat ng mga eksperto. Sa kaso ng agronomic mga eksperimento, ang naturang pagkakapantay-pantay ay itinuturing bilang isang hypothesis na mabe-verify batay sa mga resulta ng mga eksperimento, dahil ang pangunahing layunin dito ay upang mahanap ang mga naturang halaga i at j, kung saan ang function (1) ay umabot sa pinakamataas na halaga nito. Kung tama ang hypothesis na ito, kung gayon

at, samakatuwid, ang pagkilala sa pinakamahusay na "lupa" at "paglilinang" ay maaaring isagawa nang hiwalay, na humahantong sa isang makabuluhang pagbawas sa bilang ng mga eksperimento (halimbawa, posible na subukan ang lahat ng I varieties ng "lupa" na may anumang isang paraan ng paglilinang at matukoy pinakamahusay na grado, at pagkatapos ay subukan ang lahat sa iba't ibang ito J mga paraan upang "iproseso" at hanapin ang pinakamahusay na paraan; kabuuan ang mga eksperimento na may mga pag-uulit ay magiging katumbas ng (I + J) K) . Kung ang hypothesis (lahat d ij=0) ay hindi tama, pagkatapos ay upang matukoy ang max c ij ang "buong plano" na inilarawan sa itaas ay kailangan, na nangangailangan, na may K na pag-uulit, IJK mga eksperimento.

Sa sitwasyon ng mga kumpetisyon sa palakasan, ang tungkuling g ij=g j maaaring bigyang-kahulugan bilang isang sistematiko pinapayagan ang error j-th judge para sa lahat ng mga atleta. Sa huli g j- paglalarawan ng "kahigpitan" o "liberalismo" ng j-th judge. Sa isip, gusto naming lahat ng g j ay zero, ngunit sa totoong mga kundisyon ay kailangang tiisin ang pagkakaroon ng mga di-zero na halaga ng g j at isaalang-alang ang pangyayaring ito kapag nagbubuod ng mga resulta ng pagsusuri (halimbawa, posibleng kunin ang mga hindi pagkakasunud-sunod ng mga tunay na halaga a + b bilang batayan para sa paghahambing ng mga kasanayan ng mga atleta 1 +g j, ..., a+b ako+g j, at ang mga resulta lamang ng pag-order ng mga numerong ito ayon sa kanilang halaga, dahil para sa lahat ng j=1, . . . , J ang mga naturang pag-order ay magiging pareho). Panghuli, ang kabuuan ng dalawang natitirang function a ij+b ij=a+b i nakasalalay lamang sa i at samakatuwid ay maaaring gamitin upang makilala ang kakayahan ng i-th na atleta. Gayunpaman, dapat tandaan dito na, samakatuwid, ang pag-order ng lahat ng mga atleta sa pamamagitan ng mga halaga a+b i(o sa pamamagitan ng a++ b i+g j para sa bawat nakapirming j) ay maaaring hindi tumugma sa pag-order ayon sa mga halaga a i. Sa praktikal na pagproseso ng mga pagtatasa ng eksperto, ang pangyayaring ito ay kailangang pabayaan, dahil ang nabanggit na kumpletong plano ng mga eksperimento ay hindi nagpapahintulot sa isa na magsuri nang hiwalay. a i at b i*. Kaya a+b i=a i + b i* nailalarawan hindi lamang ang kasanayan i ika-atleta, ngunit gayundin, sa isang paraan o iba pa, mga eksperto sa kasanayang ito. Samakatuwid, halimbawa, ang mga resulta ng mga pansariling pagsusuri ng eksperto na isinagawa sa magkaibang panahon(sa partikular, ilang Mga Larong Olimpiko), ay halos hindi maihahambing. Sa kaso ng agronomic mga eksperimento, ang gayong mga paghihirap ay hindi lumitaw, dahil lahat a i=0 at samakatuwid ay a+b i=b i*.

Mga tunay na halaga ng mga function a, b i,g i at d ij ay hindi kilala at ipinahayag sa mga tuntunin ng hindi kilalang mga function c ij . Samakatuwid, ang unang yugto ng D. a. ay upang mahanap ang mga istatistika. mga pagtatantya para sa c ij batay sa mga obserbasyon xijk.Walang kinikilingan at may pinakamababang pagkakaiba para sa c ij ay ipinahayag ng pormula

Dahil a, b i,g j at d ij ay mga linear na function ng matrix elements ||c ij||, pagkatapos ay ang walang pinapanigan na mga linear na pagtatantya para sa mga function na ito, na may pinakamababang pagkakaiba, ay nakukuha sa pamamagitan ng pagpapalit sa mga argumentong c ij kaukulang pagtatantya, c ij , ibig sabihin, bukod dito, mga random na vector at tinukoy sa parehong paraan tulad ng ipinakilala sa itaas (a ij), (b ij), (g ij). at (d ij) ay may pag-aari ng orthogonality, na nangangahulugan na ang mga ito ay hindi magkakaugnay na mga random na vector (sa madaling salita, anumang dalawang bahagi na kabilang sa magkaibang mga vector ay may zero na ugnayan). Bilang karagdagan, anumang uri

hindi nauugnay sa alinman sa mga sangkap ang mga ito apat na vector. Isaalang-alang ang limang koleksyon ng mga random na variable (x ijk ), (x ijk-xij* ),Bilang

kung gayon ang mga pagkakaiba ay empirical. Ang mga distribusyon na naaayon sa ipinahiwatig na mga populasyon ay ipinahayag ng mga formula

Ang mga empirikal na ito ang mga pagkakaiba-iba ay mga kabuuan ng mga parisukat ng mga random na variable, alinman sa dalawa ay hindi magkakaugnay, hangga't nabibilang sila sa magkaibang mga kabuuan; habang may paggalang sa lahat y ijk ang pagkakakilanlan

nagpapaliwanag sa pinagmulan ng katagang “D. a.” “Hayaan at hayaan

sa kasong ito

kung saan ang s 2 ay ang pagkakaiba-iba ng mga random na error y ijk.

Sa batayan ng mga formula na ito, ang pangalawang yugto ng D. a. ay itinayo, na nakatuon sa pagbubunyag ng impluwensya ng una at pangalawang kadahilanan sa mga resulta ng eksperimento (sa mga eksperimento sa agronomic, ang unang kadahilanan ay ang uri ng "lupa" , ang pangalawa ay ang paraan ng "paglilinang"). Halimbawa, kung kinakailangan na subukan ang hypothesis ng kawalan ng "interaksyon" ng mga salik, na ipinahayag ng pagkakapantay-pantay, makatwirang kalkulahin ang ratio ng pagpapakalat. s 2 3 /s 2 0 = F 3 . Kung ang ratio na ito ay makabuluhang naiiba mula sa pagkakaisa, ang nasubok na hypothesis ay tinanggihan. Katulad nito, ang relasyon s 2 2 / s 2 0 \u003d F 2, na dapat ding ihambing sa pagkakaisa; kung kasabay nito ay kilala na sa halip na F2 ipinapayong ihambing sa ratio ng yunit

Katulad nito, maaari kang bumuo ng mga istatistika na nagbibigay-daan sa iyo upang makagawa ng isang konklusyon tungkol sa bisa o kamalian ng hypothesis

Ang eksaktong kahulugan ng konsepto ng isang makabuluhang pagkakaiba sa pagitan ng mga ratio na ito mula sa pagkakaisa ay maaari lamang matukoy na isinasaalang-alang ang batas ng pamamahagi ng mga random na error. y ijk . Sa D. a. ang pinaka lubusang pinag-aralan na sitwasyon, kung saan lahat y ijk ipinamahagi nang normal. Sa kasong ito, ay independiyenteng random vectors, at ay mga independiyenteng random na variable, at

ang mga ratios ay sumusunod sa mga di-central na chi-square distribution na may fm antas ng kalayaan at hindi sentralidad na mga parameter l t, m=0, 1, 2, 3, kung saan

Kung ang parameter na hindi sentro ay zero, kung gayon ang hindi sentral na chi-square ay pareho sa normal na pamamahagi ng chi-square. Samakatuwid, kung ang hypothesis l 3 =0 ang ratio ay sumusunod sa F-distribution (distribution of the dispersion ratio) na may mga parameter na f 3 at f 0 . Hayaang x ang numero para sa kung aling kaganapan (F 3 >x) ay katumbas ng isang ibinigay na halaga ng e, na tinatawag na antas ng kahalagahan (mga talahanayan ng function x= x(e; f 3 , f 0) ay makukuha sa karamihan ng mga aklat-aralin sa matematika. istatistika). Ang pamantayan para sa pagsubok ng hypothesis l 3 =0 ay ang panuntunan, ayon sa kung saan ang hypothesis na ito ay tinanggihan kung ang naobserbahang halaga F3 lumampas sa x; kung hindi, ang hypothesis ay itinuturing na pare-pareho sa mga resulta ng mga obserbasyon. Katulad nito, ang mga pamantayan ay binuo batay sa mga istatistika F2 at F*2.

Mga karagdagang yugto ng D. at. makabuluhang nakasalalay hindi lamang sa tunay na nilalaman ng isang partikular na problema, kundi pati na rin sa mga resulta ng pagsusuri sa istatistika. pagsubok ng hypothesis sa ikalawang hakbang. Halimbawa, sa mga kondisyon ng agronomic. mga eksperimento, ang bisa ng hypothesis l 3 \u003d 0, tulad ng ipinahiwatig sa itaas, ay nagbibigay-daan sa iyo na mas matipid na magplano ng katulad na karagdagang mga eksperimento (kung, bilang karagdagan sa hypothesis l 3 \u003d 0, ang hypothesis l 2 \u003d 0 ay totoo din , nangangahulugan ito na ang ani ay nakasalalay lamang sa iba't ibang "lupa", at samakatuwid, sa karagdagang mga eksperimento, maaari mong gamitin ang pamamaraan ng isang-factor D. a.); kung ang hypothesis l 3 =0 ay tinanggihan, pagkatapos ay makatwirang suriin kung mayroong isang hindi nabilang na ikatlong kadahilanan sa problemang ito? Kung ang mga uri ng "lupa" at ang mga pamamaraan ng "pagproseso" nito ay iba-iba hindi sa parehong lugar, ngunit sa iba't ibang mga heograpikal na lugar. zone, kung gayon ang gayong kadahilanan ay maaaring maging klimatiko. o heograpikal. kundisyon, at ang "pagproseso" ng mga obserbasyon ay mangangailangan ng paggamit ng tatlong salik na D. a.

Sa kaso ng mga pagtatasa ng eksperto, ang istatistikal na nakumpirma na bisa ng hypothesis l 3 = 0 ay nagbibigay ng isang batayan para sa pag-order ng mga pinaghambing na bagay (halimbawa, mga atleta) sa pamamagitan ng mga halaga ng mga dami i=l, . .. , ako.

Kung ang hypothesis l 3 =0 ay tinanggihan (sa problema ng mga kumpetisyon sa palakasan, nangangahulugan ito ng istatistikal na pagtuklas ng "interaksyon" ng ilang mga atleta at hukom), pagkatapos ay natural na subukang muling kalkulahin ang lahat ng mga resulta, na dati ay hindi kasama sa pagsasaalang-alang xijk na may ganitong mga pares ng mga indeks ( ako, j), kung saan ang mga ganap na halaga ng istatistika. grado d ij lumampas sa ilang paunang natukoy pinahihintulutang antas. Nangangahulugan ito na mula sa matrix ||xij* || ang ilang mga elemento ay tinatanggal, na nangangahulugan na ang plano ng D. a. nagiging hindi kumpleto.

Mga modelo ng makabagong D. at. sumasaklaw sa malawak na hanay ng mga tunay na eksperimentong disenyo (hal. hindi kumpletong disenyo ng disenyo, na may random o hindi random na napiling mga elemento xij*). Ang istatistikal na data na naaayon sa mga scheme na ito ang mga konklusyon ay nasa maraming kaso sa ilalim ng pag-unlad. Sa partikular, kasing aga ng (sa pamamagitan ng 1978) ang mga problema kung saan ang mga resulta ng mga obserbasyon xijk=cij +yijk ay hindi pantay na ipinamamahagi mga random na variable; Ang isang mas mahirap na problema ay lumitaw sa kaso ng pag-asa ng mga dami x ijk . Hindi alam na mga problema sa pagpili ng kadahilanan (kahit na sa linear na kaso). Ang kakanyahan ng problemang ito ay ang mga sumusunod: hayaan s=s(at, v)- bumitaw u=u(z, w)at u=u(z, w) - anumang linear function ng mga variable r at w. Pag-aayos ng mga halaga z 1, . .., z ako at w1 , . . ., w J , ito ay posible para sa bawat ibinigay na pagpipilian ng mga linear function u u . tukuyin c ij pormula at bumuo ng D. a. ang mga dami na ito ayon sa mga resulta ng mga nauugnay na obserbasyon xijk. Ang problema ay upang mahanap ang mga linear na function na u at u , na tumutugma sa pinakamababang halaga ng kabuuan ng mga parisukat

kung saan (pinapalagay na ang function c( at, v) ay hindi kilala). Sa mga tuntunin ng D. at. Ang problemang ito ay bumaba sa mga istatistika. paghahanap ng ganitong mga kadahilanan z=z(ikaw, v)at w-w(ikaw, v), to-the Crimea ay tumutugma sa "hindi bababa sa pakikipag-ugnayan".

Lit.: Fisher R. A., Mga pamamaraan ng istatistika para sa mga manggagawa sa pananaliksik, Edinburgh, 1925; Scheffe G., Pagsusuri sa pagpapakalat, trans. mula sa English, M., 1963; Khald A., Matematika na may mga teknikal na aplikasyon, trans. mula sa English, M., 1956; Snedecor J. U., Mga pamamaraan ng istatistika sa aplikasyon sa pagsasaliksik sa agrikultura at biology, trans. mula sa English, M., 1961.

L. N. Higit pa.


Mathematical encyclopedia. - M.: Soviet Encyclopedia. I. M. Vinogradov. 1977-1985.

Tingnan kung ano ang "VARIAN ANALYSIS" sa ibang mga diksyunaryo:

    Isang pamamaraan sa mga istatistika ng matematika na naglalayong maghanap ng mga dependency sa data na pang-eksperimento sa pamamagitan ng pagsusuri sa kahalagahan ng mga pagkakaiba sa mga halaga ng ibig sabihin. Ang pagtatalaga ng ANOVA ay matatagpuan din sa panitikan (mula sa English ANalysis Ng ... ... Wikipedia

    - (pagsusuri ng pagkakaiba) Paraan ng istatistika, batay sa pagkabulok ng kabuuang pagkakaiba-iba (variance) ng isang katangian ng populasyon sa mga bahagi na nauugnay sa iba pang mga katangian, at natitirang variation (natirang variation). SA…… Diksyonaryo ng ekonomiya

    Isa sa mga pamamaraan ng mga istatistika ng matematika na ginagamit upang pag-aralan ang mga resulta ng mga obserbasyon na nakasalalay sa iba't ibang sabay-sabay na kumikilos na mga kadahilanan, na, bilang isang patakaran, ay hindi nagpapahiram sa kanilang sarili sa mga dami. paglalarawan. Isaalang-alang natin ang pinakasimpleng problema ng D. a. Hayaan … Pisikal na Encyclopedia

    Pagsusuri ng pagkakaiba-iba- isang seksyon ng mga istatistika ng matematika na nakatuon sa mga pamamaraan para sa pagtukoy ng impluwensya ng mga indibidwal na kadahilanan sa resulta ng isang eksperimento (pisikal, pang-industriya, pang-ekonomiyang eksperimento). Oo. lumitaw bilang isang paraan ng pagproseso ng mga resulta ... ... Diksyunaryong Pang-ekonomiya at Matematika

    pagsusuri ng pagkakaiba-iba- - pagsusuri ng pagkakaiba Isang seksyon ng mga istatistika ng matematika na nakatuon sa mga pamamaraan para sa pagtukoy ng impluwensya ng mga indibidwal na salik sa resulta ng isang eksperimento (pisikal, pang-industriya, ... ... Handbook ng Teknikal na Tagasalin

Lahat ng tao ay likas na naghahanap ng kaalaman. (Aristotle. Metaphysics)

Pagsusuri ng pagkakaiba-iba

Panimulang pangkalahatang-ideya

Sa seksyong ito, susuriin natin ang mga pangunahing pamamaraan, pagpapalagay, at terminolohiya ng ANOVA.

Tandaan na sa panitikang Ingles, ang pagsusuri ng pagkakaiba-iba ay karaniwang tinatawag na pagsusuri ng pagkakaiba-iba. Samakatuwid, para sa kaiklian, sa ibaba minsan ay gagamitin natin ang termino ANOVA (An alysis o f va ugnayan) para sa kumbensyonal na ANOVA at ang termino MANOVA para sa multivariate analysis ng variance. Sa seksyong ito, sunud-sunod nating isasaalang-alang ang mga pangunahing ideya ng pagsusuri ng pagkakaiba-iba ( ANOVA), pagsusuri ng covariance ( ANCOVA), multivariate analysis ng variance ( MANOVA) at multivariate covariance analysis ( MANCOVA). Pagkatapos ng maikling talakayan ng mga merito ng contrast analysis at post hoc test, tingnan natin ang mga pagpapalagay kung saan nakabatay ang mga pamamaraan ng ANOVA. Sa pagtatapos ng seksyong ito, ang mga bentahe ng multivariate na diskarte para sa paulit-ulit na pagsusuri ng mga panukala ay ipinaliwanag sa tradisyonal na one-dimensional na diskarte.

Mga Pangunahing Ideya

Ang layunin ng pagsusuri ng pagkakaiba-iba. Ang pangunahing layunin ng pagsusuri ng pagkakaiba-iba ay pag-aralan ang kahalagahan ng pagkakaiba sa pagitan ng mga paraan. Kabanata (Kabanata 8) ay nagbibigay ng maikling panimula sa pagsusuri sa kahalagahang istatistika. Kung inihahambing mo lamang ang paraan ng dalawang sample, ang pagsusuri ng pagkakaiba ay magbibigay ng parehong resulta gaya ng normal na pagsusuri. t- criterion para sa mga independiyenteng sample (kung ang dalawang independiyenteng grupo ng mga bagay o obserbasyon ay inihambing), o t- criterion para sa mga umaasa na sample (kung ang dalawang variable ay inihambing sa parehong hanay ng mga bagay o obserbasyon). Kung hindi ka pamilyar sa mga pamantayang ito, inirerekomenda namin na sumangguni ka sa panimulang pangkalahatang-ideya ng kabanata (Kabanata 9).

Saan nagmula ang pangalan Pagsusuri ng pagkakaiba-iba? Maaaring mukhang kakaiba na ang pamamaraan para sa paghahambing ng mga paraan ay tinatawag na pagsusuri ng pagkakaiba-iba. Sa katunayan, ito ay dahil sa katotohanan na kapag sinusuri natin ang istatistikal na kahalagahan ng pagkakaiba sa pagitan ng mga paraan, talagang sinusuri natin ang mga pagkakaiba-iba.

Paghahati sa kabuuan ng mga parisukat

Para sa sample na laki ng n, ang sample na variance ay kinakalkula bilang ang kabuuan ng mga squared deviations mula sa sample mean na hinati ng n-1 (sample size minus one). Kaya, para sa isang nakapirming laki ng sample n, ang pagkakaiba ay isang function ng kabuuan ng mga parisukat (mga deviations), na tinutukoy, para sa kaiklian, SS(mula sa English Sum of Squares - Sum of Squares). Ang pagsusuri ng pagkakaiba ay batay sa paghahati (o paghahati) ng pagkakaiba sa mga bahagi. Isaalang-alang ang sumusunod na dataset:

Ang paraan ng dalawang grupo ay makabuluhang naiiba (2 at 6, ayon sa pagkakabanggit). Kabuuan ng mga squared deviations sa loob ng bawat pangkat ay 2. Pagsasama-sama ng mga ito, makakakuha tayo ng 4. Kung uulitin natin ngayon ang mga kalkulasyong ito hindi kasama group membership, ibig sabihin, kung kalkulahin natin SS batay sa pinagsamang mean ng dalawang sample, makakakuha tayo ng 28. Sa madaling salita, ang pagkakaiba-iba (kabuuan ng mga parisukat) batay sa pagkakaiba-iba sa loob ng grupo ay nagreresulta sa mas maliit na mga halaga kaysa kapag kinakalkula batay sa kabuuang pagkakaiba-iba (na may kaugnayan sa pangkalahatang ibig sabihin). Ang dahilan nito ay malinaw na ang makabuluhang pagkakaiba sa pagitan ng mga paraan, at ang pagkakaiba sa pagitan ng mga paraan ay nagpapaliwanag ng umiiral na pagkakaiba sa pagitan ng mga kabuuan ng mga parisukat. Sa katunayan, kung gagamitin natin ang modyul Pagsusuri ng pagkakaiba-iba, ang mga sumusunod na resulta ay makukuha:

Tulad ng makikita mula sa talahanayan, ang kabuuang kabuuan ng mga parisukat SS=28 nahahati sa kabuuan ng mga parisukat dahil sa intragroup pagkakaiba-iba ( 2+2=4 ; tingnan ang pangalawang hilera ng talahanayan) at ang kabuuan ng mga parisukat dahil sa pagkakaiba sa mga halaga ng ibig sabihin. (28-(2+2)=24; tingnan ang unang linya ng talahanayan).

SS mga pagkakamali atSS epekto. Pagkakaiba-iba sa loob ng pangkat ( SS) ay karaniwang tinatawag na pagkakaiba mga pagkakamali. Nangangahulugan ito na kadalasan ay hindi ito mahulaan o maipaliwanag kapag ang isang eksperimento ay isinasagawa. Sa kabila, SS epekto(o pagkakaiba-iba ng intergroup) ay maaaring ipaliwanag sa pamamagitan ng pagkakaiba sa pagitan ng mga paraan sa mga pinag-aralan na grupo. Sa madaling salita, kabilang sa isang tiyak na grupo nagpapaliwanag pagkakaiba-iba ng intergroup, dahil alam natin na ang mga grupong ito ay may iba't ibang paraan.

Pagsusuri ng kahalagahan. Ang mga pangunahing ideya ng pagsubok para sa istatistikal na kahalagahan ay tinalakay sa kabanata Mga konsepto ng elementarya ng istatistika(Kabanata 8). Ipinapaliwanag ng parehong kabanata ang mga dahilan kung bakit ginagamit ng maraming pagsubok ang ratio ng ipinaliwanag at hindi maipaliwanag na pagkakaiba. Ang isang halimbawa ng paggamit na ito ay ang pagsusuri ng pagkakaiba mismo. Ang pagsusuri sa kahalagahan sa ANOVA ay batay sa paghahambing ng pagkakaiba dahil sa pagkakaiba-iba sa pagitan ng pangkat (tinatawag na ibig sabihin ng square effect o MSEpekto) at pagpapakalat dahil sa pagkalat sa loob ng grupo (tinatawag na ibig sabihin ng square error o MSpagkakamali). Kung ang null hypothesis ay totoo (pagkakapantay-pantay ng mga paraan sa dalawang populasyon), maaari nating asahan ang isang medyo maliit na pagkakaiba sa sample na paraan dahil sa random na pagkakaiba-iba. Samakatuwid, sa ilalim ng null hypothesis, ang pagkakaiba-iba ng intragroup ay halos magkakasabay sa kabuuang pagkakaiba na nakalkula nang hindi isinasaalang-alang ang pagiging miyembro ng grupo. Ang mga nagreresultang pagkakaiba-iba sa loob ng pangkat ay maaaring ihambing gamit F- pagsubok na nagsusuri kung ang ratio ng mga pagkakaiba ay higit na malaki kaysa sa 1. Sa halimbawa sa itaas, F- Ang pagsubok ay nagpapakita na ang pagkakaiba sa pagitan ng mga paraan ay makabuluhang istatistika.

Pangunahing lohika ng ANOVA. Summing up, maaari nating sabihin na ang layunin ng pagsusuri ng pagkakaiba-iba ay upang subukan ang istatistikal na kahalagahan ng pagkakaiba sa pagitan ng mga paraan (para sa mga grupo o mga variable). Ang pagsusuring ito ay isinasagawa gamit ang pagsusuri ng pagkakaiba, i.e. sa pamamagitan ng paghahati sa kabuuang pagkakaiba (variation) sa mga bahagi, ang isa ay dahil sa isang random na error (iyon ay, intragroup variability), at ang pangalawa ay nauugnay sa pagkakaiba sa mga average na halaga. Ang huling bahagi ng pagkakaiba ay pagkatapos ay ginagamit upang pag-aralan ang istatistikal na kahalagahan ng pagkakaiba sa pagitan ng mga paraan. Kung makabuluhan ang pagkakaibang ito, tatanggihan ang null hypothesis at tinatanggap ang alternatibong hypothesis na mayroong pagkakaiba sa pagitan ng paraan.

Dependent at independent variable. Ang mga variable na ang mga halaga ay natutukoy sa pamamagitan ng mga sukat sa panahon ng isang eksperimento (halimbawa, isang marka na nakapuntos sa isang pagsusulit) ay tinatawag na umaasa mga variable. Ang mga variable na maaaring manipulahin sa isang eksperimento (halimbawa, mga pamamaraan ng pagsasanay o iba pang pamantayan na nagpapahintulot sa iyo na hatiin ang mga obserbasyon sa mga grupo) ay tinatawag mga kadahilanan o malaya mga variable. Ang mga konseptong ito ay inilalarawan nang mas detalyado sa kabanata Mga konsepto ng elementarya ng istatistika(Kabanata 8).

Multivariate analysis ng variance

Sa itaas simpleng halimbawa maaari mong agad na kalkulahin ang t-test para sa mga independiyenteng sample gamit ang naaangkop na opsyon sa module Mga pangunahing istatistika at talahanayan. Ang mga resulta na nakuha, siyempre, ay nag-tutugma sa mga resulta ng pagsusuri ng pagkakaiba-iba. Gayunpaman, ang pagsusuri ng pagkakaiba-iba ay naglalaman ng nababaluktot at makapangyarihang mga teknikal na tool na maaaring magamit para sa mas kumplikadong pag-aaral.

Maraming mga kadahilanan. Ang mundo ay likas na kumplikado at multidimensional. Ang mga sitwasyon kung saan ang ilang kababalaghan ay ganap na inilalarawan ng isang variable ay napakabihirang. Halimbawa, kung sinusubukan nating matutunan kung paano palaguin ang malalaking kamatis, dapat nating isaalang-alang ang mga salik na nauugnay sa genetic na istraktura ng mga halaman, uri ng lupa, liwanag, temperatura, atbp. Kaya, kapag nagsasagawa ng isang tipikal na eksperimento, kailangan mong harapin ang isang malaking bilang ng mga kadahilanan. Ang pangunahing dahilan kung bakit ang paggamit ng ANOVA ay mas mainam kaysa sa paulit-ulit na paghahambing ng dalawang sample sa magkaibang antas ng mga salik na gumagamit t- criterion ay ang pagsusuri ng pagkakaiba ay higit pa mabisa at, para sa maliliit na sample, mas nagbibigay-kaalaman.

Pamamahala ng salik. Ipagpalagay natin na sa halimbawa ng two-sample analysis na tinalakay sa itaas, nagdagdag tayo ng isa pang salik, halimbawa, Sahig- Kasarian. Hayaang ang bawat pangkat ay binubuo ng 3 lalaki at 3 babae. Ang disenyo ng eksperimentong ito ay maaaring ipakita sa anyo ng 2 by 2 table:

Eksperimento. Pangkat 1 Eksperimento. Pangkat 2
Lalaki2 6
3 7
1 5
Ang karaniwan2 6
Babae4 8
5 9
3 7
Ang karaniwan4 8

Bago gawin ang mga kalkulasyon, makikita mo na sa halimbawang ito ang kabuuang pagkakaiba ay may hindi bababa sa tatlong pinagmumulan:

(1) random na error (sa loob ng pagkakaiba-iba ng grupo),

(2) pagkakaiba-iba na nauugnay sa pagiging kasapi sa eksperimental na grupo, at

(3) pagkakaiba-iba dahil sa kasarian ng mga naobserbahang bagay.

(Tandaan na may isa pang posibleng pinagmumulan ng pagkakaiba-iba - interaksyon ng mga salik, na tatalakayin natin mamaya). Ano ang mangyayari kung hindi natin isasama palapagkasarian bilang salik sa pagsusuri at kalkulahin ang karaniwan t-pamantayan? Kung kalkulahin natin ang mga kabuuan ng mga parisukat, hindi papansinin sahig -kasarian(ibig sabihin, pagsasama-sama ng mga bagay ng iba't ibang kasarian sa isang pangkat kapag kinakalkula ang pagkakaiba-iba sa loob ng pangkat, habang kinukuha ang kabuuan ng mga parisukat para sa bawat pangkat na katumbas ng SS=10, at ang kabuuang kabuuan ng mga parisukat SS= 10+10 = 20), pagkatapos ay makakakuha tayo ng mas malaking halaga ng intragroup dispersion kaysa sa mas tumpak na pagsusuri na may karagdagang paghahati sa mga subgroup ayon sa semi- kasarian(sa kasong ito, ang ibig sabihin ng intragroup ay magiging katumbas ng 2, at ang kabuuang intragroup na kabuuan ng mga parisukat ay magiging katumbas ng SS = 2+2+2+2 = 8). Ang pagkakaibang ito ay dahil sa ang katunayan na ang ibig sabihin ng halaga para sa mga lalaki - mga lalaki mas mababa sa average para sa babae -babae, at ang pagkakaibang ito sa ibig sabihin ay nagpapataas ng kabuuang pagkakaiba-iba sa loob ng grupo kung hindi isasaalang-alang ang kasarian. Ang pagkontrol sa pagkakaiba-iba ng error ay nagpapataas ng sensitivity (kapangyarihan) ng pagsubok.

Ang halimbawang ito ay nagpapakita ng isa pang bentahe ng pagsusuri ng pagkakaiba kaysa sa kumbensyonal na pagsusuri. t-criterion para sa dalawang sample. Ang pagsusuri ng pagkakaiba ay nagpapahintulot sa iyo na pag-aralan ang bawat kadahilanan sa pamamagitan ng pagkontrol sa mga halaga ng iba pang mga kadahilanan. Ito, sa katunayan, ang pangunahing dahilan para sa mas malaking istatistikal na kapangyarihan nito (kailangan ang mas maliliit na laki ng sample upang makakuha ng makabuluhang mga resulta). Para sa kadahilanang ito, ang pagsusuri ng pagkakaiba-iba, kahit na sa maliliit na sample, ay nagbibigay ng istatistika ng mas makabuluhang mga resulta kaysa sa isang simple. t- pamantayan.

Mga epekto sa pakikipag-ugnayan

May isa pang bentahe ng paggamit ng ANOVA kaysa sa maginoo na pagsusuri. t- criterion: ang pagsusuri ng pagkakaiba ay nagbibigay-daan sa iyo na makita pakikipag-ugnayan sa pagitan ng mga kadahilanan at samakatuwid ay nagbibigay-daan sa mas kumplikadong mga modelo na pag-aralan. Upang ilarawan, isaalang-alang ang isa pang halimbawa.

Pangunahing epekto, pairwise (two-factor) na pakikipag-ugnayan. Ipagpalagay natin na mayroong dalawang grupo ng mga mag-aaral, at sa sikolohikal na paraan ang mga mag-aaral ng unang pangkat ay nakatutok sa pagtupad ng mga nakatalagang gawain at mas may layunin kaysa sa mga mag-aaral ng pangalawang pangkat, na binubuo ng mga mas tamad na mag-aaral. Hatiin natin ang bawat grupo nang sapalaran sa kalahati at mag-alok sa kalahati ng bawat grupo ng isang mahirap na gawain, at ang isa ay madali. Pagkatapos nito, sinusukat namin kung gaano kahirap ang mga mag-aaral sa mga gawaing ito. Ang mga average para sa (fictitious) na pag-aaral na ito ay ipinapakita sa talahanayan:

Anong konklusyon ang maaaring makuha mula sa mga resultang ito? Posible bang mahinuha na: (1) mas nagsusumikap ang mga mag-aaral sa isang mahirap na gawain; (2) mas masipag ba ang mga motivated na estudyante kaysa sa mga tamad? Wala sa mga pahayag na ito ang sumasalamin sa kakanyahan ng sistematikong katangian ng mga average na ibinigay sa talahanayan. Kung pinag-aaralan ang mga resulta, mas tamang sabihin na ang mga motivated na mag-aaral lamang ang nagsusumikap sa mga kumplikadong gawain, habang ang mga tamad na mag-aaral lamang ang nagsusumikap sa mga madaling gawain. Sa madaling salita, ang katangian ng mga mag-aaral at ang pagiging kumplikado ng gawain nakikipag-ugnayan ang bawat isa ay nakakaapekto sa dami ng pagsisikap na kinakailangan. Iyan ay isang halimbawa interaksyon ng magkapares sa pagitan ng kalikasan ng mga mag-aaral at sa pagiging kumplikado ng gawain. Tandaan na ang mga pahayag 1 at 2 ay naglalarawan pangunahing epekto.

Mga pakikipag-ugnayan ng mas mataas na mga order. Bagama't medyo madaling ipaliwanag ang mga pairwise na pakikipag-ugnayan, mas mahirap ipaliwanag ang mga mas mataas na pagkakasunud-sunod na pakikipag-ugnayan. Isipin natin na sa halimbawang isinasaalang-alang sa itaas, isa pang salik ang ipinakilala palapag -Kasarian at nakuha namin ang sumusunod na talahanayan ng mga average:

Anong mga konklusyon ang maaari na ngayong makuha mula sa mga resultang nakuha? Pinapadali ng mga mean plot na bigyang-kahulugan ang mga kumplikadong epekto. Ang pagsusuri ng variance module ay nagbibigay-daan sa iyo na bumuo ng mga graph na ito sa halos isang click.

Ang larawan sa mga graph sa ibaba ay kumakatawan sa three-way na interaksyon na pinag-aaralan.

Sa pagtingin sa mga graph, masasabi natin na mayroong pakikipag-ugnayan sa pagitan ng kalikasan at kahirapan ng pagsusulit para sa mga kababaihan: ang mga motivated na kababaihan ay nagsusumikap sa isang mahirap na gawain kaysa sa isang madaling gawain. Sa mga lalaki, ang parehong pakikipag-ugnayan ay baligtad. Makikita na ang paglalarawan ng interaksyon sa pagitan ng mga salik ay nagiging mas nakalilito.

Pangkalahatang paraan ng paglalarawan ng mga pakikipag-ugnayan. Sa pangkalahatang kaso, ang pakikipag-ugnayan sa pagitan ng mga salik ay inilarawan bilang isang pagbabago sa isang epekto sa ilalim ng impluwensya ng isa pa. Sa halimbawang tinalakay sa itaas, ang dalawang-factor na interaksyon ay maaaring ilarawan bilang isang pagbabago sa pangunahing epekto ng salik na nagpapakilala sa pagiging kumplikado ng gawain, sa ilalim ng impluwensya ng salik na naglalarawan sa katangian ng mag-aaral. Para sa pakikipag-ugnayan ng tatlong salik mula sa nakaraang talata, masasabi nating ang pakikipag-ugnayan ng dalawang salik (ang pagiging kumplikado ng gawain at ang katangian ng mag-aaral) ay nagbabago sa ilalim ng impluwensya ng kasarianKasarian. Kung ang pakikipag-ugnayan ng apat na salik ay pinag-aralan, masasabi nating ang pakikipag-ugnayan ng tatlong salik ay nagbabago sa ilalim ng impluwensya ng ikaapat na salik, i.e. may iba't ibang uri ng interaksyon sa iba't ibang antas ng ikaapat na salik. Ito ay lumabas na sa maraming mga lugar ang pakikipag-ugnayan ng lima o higit pang mga kadahilanan ay hindi karaniwan.

Mga kumplikadong plano

Mga plano sa intergroup at intragroup (mga plano sa pagsukat)

Kapag naghahambing ng dalawang magkaibang grupo, karaniwang ginagamit ng isa t- criterion para sa mga independiyenteng sample (mula sa module Mga pangunahing istatistika at talahanayan). Kapag ang dalawang variable ay inihambing sa parehong hanay ng mga bagay (obserbasyon), ito ay ginagamit t-criterion para sa mga umaasa na sample. Para sa pagsusuri ng pagkakaiba, mahalaga din kung ang mga sample ay nakasalalay o hindi. Kung may mga paulit-ulit na pagsukat ng parehong mga variable (sa ilalim ng magkakaibang kundisyon o sa iba't ibang oras) para sa parehong mga bagay, pagkatapos ay sinasabi nila tungkol sa presensya kadahilanan ng paulit-ulit na pagsukat(tinatawag din isang kadahilanan sa intragroup dahil ang kabuuan ng mga parisukat sa loob ng pangkat ay kinakalkula upang suriin ang kahalagahan nito). Kung ang iba't ibang grupo ng mga bagay ay inihambing (halimbawa, mga lalaki at babae, tatlong mga strain ng bakterya, atbp.), Kung gayon ang pagkakaiba sa pagitan ng mga grupo ay inilarawan salik ng intergroup. Ang mga pamamaraan para sa pagkalkula ng pamantayan ng kahalagahan para sa dalawang uri ng mga salik na inilarawan ay magkaiba, ngunit ang kanilang pangkalahatang lohika at interpretasyon ay pareho.

Inter- at intra-grupo na mga plano. Sa maraming mga kaso, ang eksperimento ay nangangailangan ng pagsasama ng parehong salik sa pagitan ng pangkat at isang paulit-ulit na kadahilanan ng pagsukat sa disenyo. Halimbawa, ang mga kasanayan sa matematika ng mga mag-aaral na babae at lalaki ay sinusukat (kung saan sahig -Kasarian-intergroup factor) sa simula at sa pagtatapos ng semestre. Ang dalawang dimensyon ng mga kasanayan ng bawat mag-aaral ay bumubuo sa salik sa loob ng pangkat (paulit-ulit na salik sa pagsukat). Ang interpretasyon ng mga pangunahing epekto at pakikipag-ugnayan para sa mga salik sa pagitan ng pangkat at paulit-ulit na pagsukat ay pareho, at ang parehong uri ng mga salik ay malinaw na maaaring makipag-ugnayan sa isa't isa (halimbawa, ang mga kababaihan ay nakakakuha ng mga kasanayan sa panahon ng semestre, at ang mga lalaki ay nawawala ang mga ito).

Mga hindi kumpleto (nested) na plano

Sa maraming mga kaso, ang epekto ng pakikipag-ugnayan ay maaaring mapabayaan. Nangyayari ito alinman kapag alam na walang epekto sa pakikipag-ugnayan sa populasyon, o kapag ang pagpapatupad ng buo factorial imposible ang plano. Halimbawa, pinag-aaralan ang epekto ng apat na fuel additives sa pagkonsumo ng gasolina. Apat na kotse at apat na driver ang napili. Puno factorial ang eksperimento ay nangangailangan na ang bawat kumbinasyon: suplemento, driver, kotse, ay lumabas nang kahit isang beses. Nangangailangan ito ng hindi bababa sa 4 x 4 x 4 = 64 na pangkat ng pagsubok, na masyadong nakakaubos ng oras. Bilang karagdagan, halos walang anumang pakikipag-ugnayan sa pagitan ng driver at ng fuel additive. Sa pag-iisip na ito, maaari mong gamitin ang plano mga parisukat sa latin, na naglalaman lamang ng 16 na grupo ng mga pagsubok (apat na additives ang itinalaga ng mga titik A, B, C at D):

Ang mga parisukat sa Latin ay inilalarawan sa karamihan ng mga aklat na pang-eksperimentong disenyo (hal. Hays, 1988; Lindman, 1974; Milliken at Johnson, 1984; Winer, 1962) at hindi tatalakayin nang detalyado dito. Tandaan na ang mga parisukat sa Latin ay hindinpuno na mga plano na hindi kasama ang lahat ng kumbinasyon ng mga antas ng kadahilanan. Halimbawa, ang driver 1 ay nagmamaneho ng kotse 1 gamit ang additive A lamang, ang driver 3 ay nagmamaneho ng kotse 1 na may additive C lamang. Factor levels mga additives ( A, B, C at D) na naka-nest sa mga cell ng talahanayan sasakyan x driver - parang mga itlog sa pugad. Ang mnemonic rule na ito ay kapaki-pakinabang para sa pag-unawa sa kalikasan nested o nested mga plano. Module Pagsusuri ng pagkakaiba-iba nagbibigay mga simpleng paraan pagsusuri ng mga plano ng ganitong uri.

Pagsusuri ng covariance

Pangunahing ideya

Sa kabanata Mga Pangunahing Ideya ang ideya ng pagkontrol sa mga kadahilanan ay napag-usapan sa madaling sabi at kung paano ang pagsasama ng mga additive na kadahilanan ay maaaring mabawasan ang kabuuan ng mga squared error at mapataas ang istatistikal na kapangyarihan ng disenyo. Ang lahat ng ito ay maaaring palawigin sa mga variable na may tuluy-tuloy na hanay ng mga halaga. Kapag ang naturang tuluy-tuloy na mga variable ay kasama bilang mga kadahilanan sa disenyo, ang mga ito ay tinatawag covariates.

Nakapirming covariates

Ipagpalagay na inihahambing natin ang mga kasanayan sa matematika ng dalawang grupo ng mga mag-aaral na itinuro mula sa dalawang magkaibang aklat-aralin. Ipagpalagay din natin na mayroon tayong intelligence quotient (IQ) data para sa bawat estudyante. Maaari naming ipagpalagay na ang IQ ay nauugnay sa mga kasanayan sa matematika at gamitin ang impormasyong ito. Para sa bawat isa sa dalawang grupo ng mga mag-aaral, ang koepisyent ng ugnayan sa pagitan ng IQ at mga kasanayan sa matematika ay maaaring kalkulahin. Gamit ang koepisyent ng ugnayan na ito, posible na makilala sa pagitan ng bahagi ng pagkakaiba-iba sa mga pangkat na ipinaliwanag sa pamamagitan ng impluwensya ng IQ at ang hindi maipaliwanag na bahagi ng pagkakaiba-iba (tingnan din ang Mga konsepto ng elementarya ng istatistika(kabanata 8) at Mga pangunahing istatistika at talahanayan(Kabanata 9)). Ang natitirang bahagi ng pagkakaiba ay ginagamit sa pagsusuri bilang pagkakaiba ng error. Kung mayroong isang ugnayan sa pagitan ng IQ at mga kasanayan sa matematika, kung gayon ang mga pagkakaiba-iba ng error ay maaaring makabuluhang bawasan. SS/(n-1) .

Epekto ng covariates saF- pamantayan. F- sinusuri ng criterion ang istatistikal na kahalagahan ng pagkakaiba sa pagitan ng mga mean na halaga sa mga grupo, habang ang ratio ng pagkakaiba-iba ng intergroup ay kinakalkula ( MSepekto) sa pagkakaiba-iba ng error ( MSpagkakamali) . Kung ang MSpagkakamali bumababa, halimbawa, kapag isinasaalang-alang ang IQ factor, ang halaga F nadadagdagan.

Maraming covariates. Ang pangangatwiran na ginamit sa itaas para sa isang solong covariate (IQ) ay madaling umaabot sa maraming covariate. Halimbawa, bilang karagdagan sa IQ, maaari mong isama ang pagsukat ng motibasyon, spatial na pag-iisip, atbp. Sa halip na ang karaniwang koepisyent ng ugnayan, isang maramihang koepisyent ng ugnayan ang ginagamit.

Kapag ang halagaF -nababawasan ang pamantayan. Minsan ang pagpapakilala ng mga covariates sa disenyo ng eksperimento ay nagpapababa sa halaga F- pamantayan . Karaniwang ipinapahiwatig nito na ang mga covariate ay nakakaugnay hindi lamang sa dependent variable (gaya ng mga kasanayan sa matematika), kundi pati na rin sa mga salik (tulad ng iba't ibang mga aklat-aralin). Ipagpalagay na ang IQ ay sinusukat sa katapusan ng semestre, pagkatapos ng dalawang grupo ng mga mag-aaral na gumugol ng halos isang taon sa pag-aaral ng dalawang magkaibang aklat-aralin. Bagama't random na hinati ang mga mag-aaral sa mga grupo, maaaring lumabas na napakalaki ng pagkakaiba sa mga aklat-aralin na ang parehong mga kasanayan sa IQ at matematika sa iba't ibang grupo ay mag-iiba nang malaki. Sa kasong ito, hindi lamang binabawasan ng mga covariates ang pagkakaiba-iba ng error, kundi pati na rin ang pagkakaiba-iba sa pagitan ng pangkat. Sa madaling salita, pagkatapos makontrol ang pagkakaiba sa IQ sa pagitan ng mga grupo, ang pagkakaiba sa mga kasanayan sa matematika ay hindi na magiging makabuluhan. Maaari itong sabihin kung hindi man. Matapos "alisin" ang impluwensya ng IQ, ang impluwensya ng aklat-aralin sa pagbuo ng mga kasanayan sa matematika ay hindi sinasadyang ibinukod.

Inayos ang mga average. Kapag naapektuhan ng covariate ang salik sa pagitan ng pangkat, dapat kalkulahin ng isa adjusted average, ibig sabihin. ganoong paraan, na nakukuha pagkatapos alisin ang lahat ng mga pagtatantya ng mga covariates.

Pakikipag-ugnayan sa pagitan ng mga covariates at mga kadahilanan. Tulad ng mga pakikipag-ugnayan sa pagitan ng mga kadahilanan ay ginalugad, ang mga pakikipag-ugnayan sa pagitan ng mga covariate at sa pagitan ng mga pangkat ng mga kadahilanan ay maaaring tuklasin. Ipagpalagay na ang isa sa mga aklat-aralin ay angkop lalo na para sa matatalinong estudyante. Ang pangalawang aklat-aralin ay nakakainip para sa matatalinong estudyante, at ang parehong aklat-aralin ay mahirap para sa hindi gaanong matalinong mga mag-aaral. Bilang resulta, mayroong isang positibong ugnayan sa pagitan ng IQ at mga resulta ng pagkatuto sa unang grupo (mas matalinong mga mag-aaral, mas mahusay na mga resulta) at zero o maliit na negatibong ugnayan sa pangalawang grupo (mas matalino ang mag-aaral, mas maliit ang posibilidad na makakuha ng mga kasanayan sa matematika. mula sa pangalawang aklat-aralin). Sa ilang mga pag-aaral, ang sitwasyong ito ay tinalakay bilang isang halimbawa ng paglabag sa mga pagpapalagay ng pagsusuri ng covariance. Gayunpaman, dahil ang module ng Analysis of Variance ay gumagamit ng mga pinakakaraniwang paraan ng pagsusuri ng covariance, posible, sa partikular, upang masuri ang istatistikal na kahalagahan ng interaksyon sa pagitan ng mga salik at covariates.

Variable covariates

Habang ang mga nakapirming covariate ay madalas na tinatalakay sa mga aklat-aralin, ang mga variable na covariate ay hindi gaanong madalas na binabanggit. Karaniwan, kapag nagsasagawa ng mga eksperimento na may paulit-ulit na mga sukat, kami ay interesado sa mga pagkakaiba sa mga sukat ng parehong dami sa iba't ibang mga punto ng oras. Ibig sabihin, interesado kami sa kahalagahan ng mga pagkakaibang ito. Kung ang isang covariate na pagsukat ay isinasagawa kasabay ng mga dependent variable measurements, ang ugnayan sa pagitan ng covariate at ng dependent variable ay maaaring kalkulahin.

Halimbawa, maaari kang mag-aral ng interes sa matematika at mga kasanayan sa matematika sa simula at sa katapusan ng semestre. Magiging kagiliw-giliw na suriin kung ang mga pagbabago sa interes sa matematika ay nauugnay sa mga pagbabago sa mga kasanayan sa matematika.

Module Pagsusuri ng pagkakaiba-iba sa STATISTICS awtomatikong tinatasa ang istatistikal na kahalagahan ng mga pagbabago sa covariates sa mga planong iyon, kung saan posible.

Mga Multivariate na Disenyo: Multivariate ANOVA at Covariance Analysis

Mga plano ng intergroup

Ang lahat ng mga halimbawang isinasaalang-alang nang mas maaga ay nagsasama lamang ng isang dependent variable. Kapag mayroong ilang mga umaasang variable sa parehong oras, ang pagiging kumplikado lamang ng mga kalkulasyon ay tumataas, at ang nilalaman at mga pangunahing prinsipyo ay hindi nagbabago.

Halimbawa, ang isang pag-aaral ay isinasagawa sa dalawang magkaibang aklat-aralin. Kasabay nito, pinag-aaralan ang tagumpay ng mga mag-aaral sa pag-aaral ng pisika at matematika. Sa kasong ito, mayroong dalawang umaasang variable at kailangan mong malaman kung paano nakakaapekto ang dalawang magkaibang aklat-aralin sa kanila nang sabay-sabay. Upang gawin ito, maaari mong gamitin ang multivariate analysis of variance (MANOVA). Sa halip na isang one-dimensional F criterion, multidimensional F pagsubok (Wilks l-test) batay sa paghahambing ng error covariance matrix at intergroup covariance matrix.

Kung ang mga umaasang variable ay nakakaugnay sa isa't isa, kung gayon ang ugnayang ito ay dapat isaalang-alang kapag kinakalkula ang pagsubok ng kahalagahan. Malinaw, kung ang parehong pagsukat ay paulit-ulit nang dalawang beses, kung gayon walang bago ang maaaring makuha sa kasong ito. Kung ang isang dimensyon na nauugnay dito ay idinagdag sa isang umiiral na dimensyon, kung gayon ang ilang bagong impormasyon ay makukuha, ngunit ang bagong variable ay naglalaman ng kalabisan na impormasyon, na makikita sa covariance sa pagitan ng mga variable.

Interpretasyon ng mga resulta. Kung ang pangkalahatang multivariate criterion ay makabuluhan, maaari nating tapusin na ang kaukulang epekto (hal. uri ng aklat-aralin) ay makabuluhan. Gayunpaman, lumitaw ang mga sumusunod na katanungan. Nakakaapekto ba ang uri ng aklat-aralin sa pagpapabuti ng mga kasanayan lamang sa matematika, mga pisikal na kasanayan lamang, o pareho ng mga ito. Sa katunayan, pagkatapos makakuha ng makabuluhang multivariate na pamantayan, para sa isang pangunahing epekto o pakikipag-ugnayan, isang-dimensional F pamantayan. Sa madaling salita, ang mga umaasang variable na nag-aambag sa kahalagahan ng multivariate na pagsubok ay hiwalay na sinusuri.

Mga plano na may paulit-ulit na mga sukat

Kung ang mga kasanayan sa matematika at pisikal ng mga mag-aaral ay sinusukat sa simula ng semestre at sa pagtatapos, kung gayon ang mga ito ay paulit-ulit na mga sukat. Ang pag-aaral ng criterion of significance sa naturang mga plano ay isang lohikal na pag-unlad ng one-dimensional na kaso. Tandaan na ang mga multivariate na pamamaraan ng ANOVA ay karaniwang ginagamit din upang siyasatin ang kahalagahan ng univariate na paulit-ulit na mga salik sa pagsukat na mayroong higit sa dalawang antas. Ang mga kaukulang aplikasyon ay tatalakayin mamaya sa bahaging ito.

Pagsusuma ng mga variable na halaga at multivariate na pagsusuri ng pagkakaiba-iba

Kahit na ang mga karanasang user ng univariate at multivariate ANOVA ay kadalasang nalilito kapag nakakuha sila ng iba't ibang resulta kapag nag-apply ng multivariate ANOVA sa, halimbawa, tatlong variable, at kapag naglalapat ng univariate ANOVA sa kabuuan ng tatlong variable na ito bilang isang variable.

Idea pagbubuod Ang mga variable ay ang bawat variable ay naglalaman ng ilang totoong variable, na sinisiyasat, pati na rin ang isang random na error sa pagsukat. Samakatuwid, kapag ina-average ang mga halaga ng mga variable, ang error sa pagsukat ay magiging mas malapit sa 0 para sa lahat ng mga sukat at ang mga average na halaga ay magiging mas maaasahan. Sa katunayan, sa kasong ito, ang paglalapat ng ANOVA sa kabuuan ng mga variable ay makatwiran at isang makapangyarihang pamamaraan. Gayunpaman, kung ang mga umaasa na variable ay multivariate sa kalikasan, ang pagbubuod ng mga halaga ng mga variable ay hindi naaangkop.

Halimbawa, hayaan ang mga umaasang variable na binubuo ng apat na sukat tagumpay sa lipunan. Ang bawat tagapagpahiwatig ay nagpapakita ng ganap na independiyenteng bahagi ng aktibidad ng tao (halimbawa, propesyonal na tagumpay, tagumpay sa negosyo, kapakanan ng pamilya, atbp.). Ang pagdaragdag ng mga variable na ito ay tulad ng pagdaragdag ng isang mansanas at isang orange. Ang kabuuan ng mga variable na ito ay hindi magiging isang angkop na univariate na sukat. Samakatuwid, ang naturang data ay dapat ituring bilang mga multidimensional na tagapagpahiwatig sa multivariate analysis ng variance.

Pagsusuri ng contrast at mga post hoc na pagsusulit

Bakit inihahambing ang mga indibidwal na hanay ng paraan?

Karaniwan ang mga hypotheses tungkol sa pang-eksperimentong data ay binuo hindi lamang sa mga tuntunin ng mga pangunahing epekto o pakikipag-ugnayan. Ang isang halimbawa ay ang sumusunod na hypothesis: ang isang partikular na aklat-aralin ay nagpapabuti ng mga kasanayan sa matematika sa mga lalaking mag-aaral lamang, habang ang isa pang aklat-aralin ay halos pantay na epektibo para sa parehong kasarian, ngunit hindi gaanong epektibo para sa mga lalaki. Maaaring hulaan na ang pagganap ng aklat-aralin ay nakikipag-ugnayan sa kasarian ng mag-aaral. Gayunpaman, naaangkop din ang hulang ito kalikasan pakikipag-ugnayan. Ang isang makabuluhang pagkakaiba sa pagitan ng mga kasarian ay inaasahan para sa mga mag-aaral sa isang libro, at halos walang kasarian na mga resulta para sa mga mag-aaral sa kabilang libro. Ang ganitong uri ng hypothesis ay karaniwang ginalugad gamit ang contrast analysis.

Pagsusuri ng Contrast

Sa madaling salita, ang pagsusuri ng kaibahan ay nagpapahintulot sa amin na suriin ang istatistikal na kahalagahan ng ilang mga linear na kumbinasyon ng mga kumplikadong epekto. Ang pagsusuri ng contrast ay ang pangunahing at kailangang-kailangan na elemento ng anumang kumplikadong plano ng ANOVA. Module Pagsusuri ng pagkakaiba-iba ay may iba't ibang mga kakayahan sa pagsusuri ng kaibahan na nagbibigay-daan sa iyong pumili at suriin ang anumang uri ng paghahambing ng mga average.

isang posterior paghahambing

Minsan, bilang resulta ng pagproseso ng isang eksperimento, may natuklasang hindi inaasahang epekto. Bagama't sa karamihan ng mga kaso ay maipapaliwanag ng isang malikhaing mananaliksik ang anumang resulta, hindi ito nagbibigay ng mga pagkakataon para sa karagdagang pagsusuri at pagtatantya para sa hula. Ang problemang ito ay isa sa mga kung saan pamantayan sa post hoc, iyon ay, pamantayan na hindi ginagamit isang priori mga hypotheses. Upang ilarawan, isaalang-alang ang sumusunod na eksperimento. Ipagpalagay na ang 100 card ay naglalaman ng mga numero mula 1 hanggang 10. Ang pag-drop sa lahat ng mga card na ito sa header, random kaming pumili ng 20 beses 5 card, at kinakalkula ang average na halaga para sa bawat sample (ang average ng mga numerong nakasulat sa mga card). Maaari ba nating asahan na mayroong dalawang sample na ang ibig sabihin ay malaki ang pagkakaiba? Ito ay lubos na kapani-paniwala! Sa pamamagitan ng pagpili ng dalawang sample na may maximum at minimum na mean, makakakuha ang isa ng pagkakaiba sa mga paraan na ibang-iba sa pagkakaiba sa mga paraan, halimbawa, ng unang dalawang sample. Maaaring imbestigahan ang pagkakaibang ito, halimbawa, gamit ang contrast analysis. Nang walang pagpunta sa mga detalye, mayroong ilang mga tinatawag na isang posterior pamantayan na eksaktong nakabatay sa unang senaryo (kumukuha ng matinding average mula sa 20 sample), ibig sabihin, ang mga pamantayang ito ay nakabatay sa pagpili ng pinaka-iba't ibang paraan upang ihambing ang lahat ng paraan sa disenyo. Ang mga pamantayang ito ay inilapat upang hindi makakuha ng isang artipisyal na epekto na nagkataon lamang, halimbawa, upang makahanap ng isang makabuluhang pagkakaiba sa pagitan ng mga paraan kapag wala. Module Pagsusuri ng pagkakaiba-iba nag-aalok ng malawak na hanay ng naturang pamantayan. Kapag ang mga hindi inaasahang resulta ay nakatagpo sa isang eksperimento na kinasasangkutan ng maraming grupo, ang isang posterior mga pamamaraan para sa pagsusuri sa istatistikal na kahalagahan ng mga resultang nakuha.

Kabuuan ng mga parisukat na uri I, II, III at IV

Multivariate regression at pagsusuri ng variance

Mayroong malapit na kaugnayan sa pagitan ng paraan ng multivariate regression at pagsusuri ng variance (pagsusuri ng mga pagkakaiba-iba). Sa parehong mga pamamaraan, pinag-aaralan ang isang linear na modelo. Sa madaling salita, halos lahat ng mga eksperimentong disenyo ay maaaring tuklasin gamit ang multivariate regression. Isaalang-alang ang sumusunod na simpleng cross-group 2 x 2 na plano.

DV A B AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Ang mga Column A at B ay naglalaman ng mga code na nagpapakilala sa mga antas ng mga salik A at B, ang column na AxB ay naglalaman ng produkto ng dalawang column A at B. Masusuri natin ang data na ito gamit ang multivariate regression. Variable DV tinukoy bilang isang dependent variable, mga variable mula sa A dati AxB bilang mga independiyenteng variable. Ang pag-aaral ng kahalagahan para sa mga coefficient ng regression ay magkakasabay sa mga kalkulasyon sa pagsusuri ng pagkakaiba-iba ng kahalagahan ng mga pangunahing epekto ng mga kadahilanan A at B at epekto ng interaksyon AxB.

Di-balanse at Balanseng mga Plano

Kapag kinakalkula ang correlation matrix para sa lahat ng mga variable, halimbawa, para sa data na inilalarawan sa itaas, makikita na ang mga pangunahing epekto ng mga kadahilanan A at B at epekto ng interaksyon AxB walang kaugnayan. Ang katangian ng mga epekto na ito ay tinatawag ding orthogonality. Sinasabi nila na ang mga epekto A at B - orthogonal o malaya mula sa isa't isa. Kung ang lahat ng mga epekto sa plano ay orthogonal sa isa't isa, tulad ng sa halimbawa sa itaas, kung gayon ang plano ay sinasabing balanse.

Ang mga balanseng plano ay may "magandang ari-arian." Ang mga kalkulasyon sa pagsusuri ng naturang mga plano ay napakasimple. Ang lahat ng mga kalkulasyon ay binabawasan sa pagkalkula ng ugnayan sa pagitan ng mga epekto at umaasa na mga variable. Dahil ang mga epekto ay orthogonal, bahagyang mga ugnayan (tulad ng buo multidimensional regressions) ay hindi kinakalkula. Gayunpaman, sa totoong buhay ang mga plano ay hindi palaging balanse.

Isaalang-alang ang totoong data na may hindi pantay na bilang ng mga obserbasyon sa mga cell.

Salik A Salik B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Kung i-encode natin ang data na ito tulad ng nasa itaas at kalkulahin ang correlation matrix para sa lahat ng mga variable, lumalabas na ang mga salik ng disenyo ay nakakaugnay sa bawat isa. Ang mga kadahilanan sa plano ay hindi na orthogonal at ang mga ganitong plano ay tinatawag na hindi balanse. Tandaan na sa halimbawang ito, ang ugnayan sa pagitan ng mga salik ay ganap na nauugnay sa pagkakaiba sa mga frequency ng 1 at -1 sa mga column ng data matrix. Sa madaling salita, ang mga pang-eksperimentong disenyo na may hindi pantay na dami ng cell (mas tiyak, hindi katimbang na dami) ay magiging hindi balanse, na nangangahulugan na ang mga pangunahing epekto at mga pakikipag-ugnayan ay maghahalo. Sa kasong ito, upang makalkula ang istatistikal na kahalagahan ng mga epekto, kailangan mong ganap na kalkulahin ang multivariate regression. Mayroong ilang mga diskarte dito.

Kabuuan ng mga parisukat na uri I, II, III at IV

Kabuuan ng uri ng mga parisukatakoatIII. Upang pag-aralan ang kahalagahan ng bawat kadahilanan sa isang multivariate na modelo, maaaring kalkulahin ng isa ang bahagyang ugnayan ng bawat kadahilanan, sa kondisyon na ang lahat ng iba pang mga kadahilanan ay isinasaalang-alang na sa modelo. Maaari mo ring ipasok ang mga salik sa modelo sa sunud-sunod na paraan, na inaayos ang lahat ng mga salik na naipasok na sa modelo at binabalewala ang lahat ng iba pang salik. Sa pangkalahatan, ito ang pagkakaiba sa pagitan ng uri III at uriako kabuuan ng mga parisukat (ang terminolohiyang ito ay ipinakilala sa SAS, tingnan ang halimbawa SAS, 1982; ang isang detalyadong talakayan ay matatagpuan din sa Searle, 1987, p. 461; Woodward, Bonett, at Brecht, 1990, p. 216; o Milliken at Johnson, 1984, p. 138).

Kabuuan ng uri ng mga parisukatII. Ang susunod na "intermediate" na diskarte sa pagbuo ng modelo ay: upang makontrol ang lahat ng mga pangunahing epekto sa pag-aaral ng kahalagahan ng isang solong pangunahing epekto; sa kontrol ng lahat ng pangunahing epekto at lahat ng magkapares na pakikipag-ugnayan, kapag ang kahalagahan ng isang solong pares na pakikipag-ugnayan ay napagmasdan; sa pagkontrol sa lahat ng pangunahing epekto ng lahat ng magkapares na pakikipag-ugnayan at lahat ng pakikipag-ugnayan ng tatlong salik; sa pag-aaral ng hiwalay na interaksyon ng tatlong salik, atbp. Ang mga kabuuan ng mga parisukat para sa mga epekto na kinakalkula sa ganitong paraan ay tinatawag uriII kabuuan ng mga parisukat. Kaya, uriII kinokontrol ng mga kabuuan ng mga parisukat ang lahat ng mga epekto ng parehong pagkakasunud-sunod at mas mababa, na binabalewala ang lahat ng mga epekto ng isang mas mataas na pagkakasunud-sunod.

Kabuuan ng uri ng mga parisukatIV. Sa wakas, para sa ilang mga espesyal na plano na may nawawalang mga cell (hindi kumpletong mga plano), posibleng kalkulahin ang tinatawag na uri IV kabuuan ng mga parisukat. Ang pamamaraang ito ay tatalakayin sa ibang pagkakataon kaugnay ng mga hindi kumpletong plano (mga planong may nawawalang mga cell).

Interpretasyon ng sum-of-squares na haka-haka ng mga uri I, II, at III

kabuuan ng mga parisukat uriIII pinakamadaling bigyang kahulugan. Alalahanin na ang mga kabuuan ng mga parisukat uriIII suriin ang mga epekto pagkatapos makontrol ang lahat ng iba pang epekto. Halimbawa, pagkatapos makahanap ng makabuluhang istatistika uriIII epekto para sa kadahilanan A sa modyul Pagsusuri ng pagkakaiba-iba, maaari nating sabihin na mayroong isang solong makabuluhang epekto ng kadahilanan A, pagkatapos ipakilala ang lahat ng iba pang epekto (mga salik) at bigyang-kahulugan ang epektong ito nang naaayon. Marahil sa 99% ng lahat ng mga aplikasyon ng pagsusuri ng pagkakaiba, ang ganitong uri ng pamantayan ay interesado sa mananaliksik. Ang ganitong uri ng kabuuan ng mga parisukat ay karaniwang kinukuwenta sa module Pagsusuri ng pagkakaiba-iba bilang default, hindi alintana kung napili ang opsyon Diskarte sa Pagbabalik o hindi (mga karaniwang pagdulog na pinagtibay sa modyul Pagsusuri ng pagkakaiba-iba tinalakay sa ibaba).

Mga makabuluhang epekto na nakuha gamit ang mga kabuuan ng mga parisukat uri o uriII ang mga kabuuan ng mga parisukat ay hindi madaling bigyang-kahulugan. Ang mga ito ay pinakamahusay na binibigyang kahulugan sa konteksto ng stepwise multivariate regression. Kung gumagamit ng kabuuan ng mga parisukat uriako ang pangunahing epekto ng kadahilanan B ay makabuluhan (pagkatapos ng pagsasama ng kadahilanan A sa modelo, ngunit bago idagdag ang pakikipag-ugnayan sa pagitan ng A at B), maaari itong tapusin na mayroong isang makabuluhang pangunahing epekto ng kadahilanan B, sa kondisyon na walang interaksyon sa pagitan ng mga salik A at B. (Kung sa paggamit ng pamantayan uriIII, ang kadahilanan B ay naging makabuluhan din, pagkatapos ay maaari nating tapusin na mayroong isang makabuluhang pangunahing epekto ng kadahilanan B, pagkatapos na ipakilala ang lahat ng iba pang mga kadahilanan at ang kanilang mga pakikipag-ugnayan sa modelo).

Sa mga tuntunin ng marginal na paraan ng hypothesis uriako at uriII kadalasan ay walang simpleng interpretasyon. Sa mga kasong ito, sinasabing hindi mabibigyang-kahulugan ng isa ang kahalagahan ng mga epekto sa pamamagitan lamang ng pagsasaalang-alang sa marginal na paraan. sa halip iniharap p Ang ibig sabihin ng mga halaga ay nauugnay sa isang kumplikadong hypothesis na pinagsasama ang mga paraan at laki ng sample. Halimbawa, uriII ang mga hypotheses para sa factor A sa simpleng 2 x 2 na halimbawa ng disenyo na tinalakay kanina ay (tingnan ang Woodward, Bonett, at Brecht, 1990, p. 219):

nij- bilang ng mga obserbasyon sa isang cell

uij- average na halaga sa isang cell

n. j- marginal average

Nang walang mga detalye (para sa higit pang mga detalye tingnan ang Milliken at Johnson, 1984, kabanata 10), malinaw na ang mga ito ay hindi simpleng hypotheses at sa karamihan ng mga kaso wala sa mga ito ang partikular na interes sa mananaliksik. Gayunpaman, may mga kaso kung saan ang mga hypotheses uriako maaaring may interes.

Ang default na computational approach sa module Pagsusuri ng pagkakaiba-iba

Default kung ang opsyon ay hindi naka-check Diskarte sa Pagbabalik, modyul Pagsusuri ng pagkakaiba-iba gamit modelo ng cell average. Katangian ng modelong ito na ang mga kabuuan ng mga parisukat para sa iba't ibang mga epekto ay kinakalkula para sa mga linear na kumbinasyon ng mga paraan ng cell. Sa isang buong factorial na eksperimento, nagreresulta ito sa mga kabuuan ng mga parisukat na kapareho ng mga kabuuan ng mga parisukat na tinalakay kanina bilang uri III. Gayunpaman, sa pagpipilian Naka-iskedyul na Paghahambing(sa bintana Pagsusuri ng mga resulta ng pagkakaiba), ang user ay maaaring mag-hypothesize tungkol sa anumang linear na kumbinasyon ng weighted o unweighted cell means. Kaya, ang gumagamit ay maaaring subukan hindi lamang hypotheses uriIII, ngunit ang mga hypotheses ng anumang uri (kabilang ang uriIV). Ang pangkalahatang diskarte na ito ay partikular na kapaki-pakinabang kapag sinusuri ang mga disenyo na may nawawalang mga cell (tinatawag na mga hindi kumpletong disenyo).

Para sa buong factorial na disenyo, ang diskarte na ito ay kapaki-pakinabang din kapag gusto ng isa na pag-aralan ang weighted marginal na paraan. Halimbawa, ipagpalagay na sa simpleng 2 x 2 na disenyo na isinasaalang-alang nang mas maaga, gusto naming ihambing ang natimbang (sa mga tuntunin ng mga antas ng kadahilanan) B) marginal average para sa factor A. Ito ay kapaki-pakinabang kapag ang pamamahagi ng mga obserbasyon sa mga cell ay hindi inihanda ng eksperimento, ngunit binuo nang random, at ang randomness na ito ay makikita sa pamamahagi ng bilang ng mga obserbasyon ayon sa mga antas ng factor B sa pinagsama-samang .

Halimbawa, mayroong isang kadahilanan - ang edad ng mga balo. Ang isang posibleng sample ng mga sumasagot ay nahahati sa dalawang grupo: mas bata sa 40 at mas matanda sa 40 (factor B). Ang pangalawang salik (factor A) sa plano ay kung ang mga balo ay nakatanggap o hindi ng panlipunang suporta mula sa ilang ahensya (habang ang ilang mga balo ay random na pinili, ang iba ay nagsilbing mga kontrol). Sa kasong ito, ang distribusyon ng edad ng mga balo sa sample ay nagpapakita ng aktwal na distribusyon ng edad ng mga balo sa populasyon. Pagtatasa ng pagiging epektibo ng social support group para sa mga balo lahat ng edad ay tumutugma sa weighted average para sa dalawang pangkat ng edad (na may mga timbang na tumutugma sa bilang ng mga obserbasyon sa grupo).

Naka-iskedyul na Paghahambing

Tandaan na ang kabuuan ng mga inilagay na contrast ratio ay hindi kinakailangang katumbas ng 0 (zero). Sa halip, ang programa ay awtomatikong gagawa ng mga pagsasaayos upang ang mga kaukulang hypotheses ay hindi maghalo sa pangkalahatang average.

Upang mailarawan ito, bumalik tayo sa simpleng 2 x 2 na plano na tinalakay kanina. Alalahanin na ang mga bilang ng cell ng hindi balanseng disenyo na ito ay -1, 2, 3, at 1. Sabihin nating gusto nating paghambingin ang mga weighted marginal average para sa factor A (natimbang ng dalas ng mga antas ng factor B). Maaari kang maglagay ng mga contrast ratio:

Tandaan na ang mga coefficient na ito ay hindi nagdaragdag ng hanggang 0. Itatakda ng programa ang mga coefficient upang magdagdag sila ng hanggang 0, habang pinapanatili ang kanilang mga kamag-anak na halaga, ibig sabihin.:

1/3 2/3 -3/4 -1/4

Ihahambing ng mga contrast na ito ang mga weighted average para sa factor A.

Hypotheses tungkol sa pangunahing ibig sabihin. Ang hypothesis na ang unweighted principal mean ay 0 ay maaaring tuklasin gamit ang mga coefficient:

Ang hypothesis na ang weighted principal mean ay 0 ay nasubok sa:

Sa anumang kaso ay itinatama ng programa ang mga contrast ratio.

Pagsusuri ng mga plano na may nawawalang mga cell (mga hindi kumpletong plano)

Ang mga factorial na disenyo na naglalaman ng mga walang laman na cell (pagproseso ng mga kumbinasyon ng mga cell kung saan walang mga obserbasyon) ay tinatawag na hindi kumpleto. Sa ganitong mga disenyo, ang ilang mga kadahilanan ay karaniwang hindi orthogonal at ang ilang mga pakikipag-ugnayan ay hindi maaaring kalkulahin. Sa pangkalahatan, walang mas mahusay na paraan para sa pagsusuri ng mga naturang plano.

Diskarte sa Pagbabalik

Sa ilang mas lumang mga programa na nakabatay sa pagsusuri ng mga disenyo ng ANOVA gamit ang multivariate regression, ang mga salik sa mga hindi kumpletong disenyo ay itinakda bilang default sa karaniwang paraan (parang kumpleto ang plano). Pagkatapos ay isang multivariate pagsusuri ng regression para sa mga kathang-isip na naka-encode na mga salik na ito. Sa kasamaang palad, ang pamamaraang ito ay humahantong sa mga resulta na napakahirap, kung hindi imposible, upang bigyang-kahulugan dahil hindi malinaw kung paano ang bawat epekto ay nag-aambag sa linear na kumbinasyon ng mga paraan. Isaalang-alang ang sumusunod na simpleng halimbawa.

Salik A Salik B
B1 B2
A1 3 4, 5
A2 6, 6, 7 Nakaligtaan

Kung multivariate regression ng form Dependent variable = Constant + Factor A + Factor B, pagkatapos ay ang hypothesis tungkol sa kahalagahan ng mga kadahilanan A at B sa mga tuntunin ng mga linear na kumbinasyon ng mga paraan ay ganito ang hitsura:

Factor A: Cell A1,B1 = Cell A2,B1

Factor B: Cell A1,B1 = Cell A1,B2

Ang kasong ito ay simple. Sa mas kumplikadong mga plano, imposibleng aktwal na matukoy kung ano ang eksaktong susuriin.

Ang ibig sabihin ng mga cell, pagsusuri ng diskarte sa pagkakaiba-iba , type IV hypotheses

Ang isang diskarte na inirerekomenda sa literatura at tila mas mainam ay ang pag-aaral ng makabuluhan (sa mga tuntunin ng mga gawain sa pananaliksik) isang priori hypotheses tungkol sa mga paraan na naobserbahan sa mga cell ng plano. Ang isang detalyadong talakayan tungkol sa pamamaraang ito ay matatagpuan sa Dodge (1985), Heiberger (1989), Milliken at Johnson (1984), Searle (1987), o Woodward, Bonett, at Brecht (1990). Ang mga kabuuan ng mga parisukat na nauugnay sa mga hypotheses tungkol sa isang linear na kumbinasyon ng mga paraan sa mga hindi kumpletong disenyo, na nagsisiyasat sa mga pagtatantya ng bahagi ng mga epekto, ay tinatawag ding mga kabuuan ng mga parisukat. IV.

Awtomatikong pagbuo ng mga uri ng hypothesesIV. Kapag ang mga multivariate na disenyo ay may kumplikadong nawawalang pattern ng cell, kanais-nais na tukuyin ang mga orthogonal (independent) na hypotheses na ang pagsisiyasat ay katumbas ng pagsisiyasat ng mga pangunahing epekto o pakikipag-ugnayan. Ang mga diskarte sa algorithm (computational) (batay sa pseudo-inverse design matrix) ay binuo upang makabuo ng naaangkop na mga timbang para sa mga naturang paghahambing. Sa kasamaang palad, ang mga huling hypotheses ay hindi natutukoy nang kakaiba. Siyempre, nakasalalay ang mga ito sa pagkakasunud-sunod kung saan tinukoy ang mga epekto at bihirang madaling bigyang-kahulugan. Samakatuwid, inirerekumenda na maingat na pag-aralan ang likas na katangian ng nawawalang mga cell, pagkatapos ay magbalangkas ng mga hypotheses uriIV, na pinaka-kaugnay sa mga layunin ng pag-aaral. Pagkatapos ay galugarin ang mga hypotheses na ito gamit ang opsyon Naka-iskedyul na Paghahambing sa bintana resulta. Ang pinakamadaling paraan upang tukuyin ang mga paghahambing sa kasong ito ay upang mangailangan ng pagpapakilala ng isang vector ng mga kaibahan para sa lahat ng mga kadahilanan magkasama sa bintana Mga naka-iskedyul na paghahambing. Matapos tawagan ang dialog box Naka-iskedyul na Paghahambing lahat ng grupo ng kasalukuyang plano ay ipapakita at ang mga tinanggal ay mamarkahan.

Nilaktawan ang mga Cell at Tiyak na Pagsusuri ng Epekto

Mayroong ilang mga uri ng mga plano kung saan ang lokasyon ng mga nawawalang mga cell ay hindi random, ngunit maingat na binalak, na nagbibigay-daan sa isang simpleng pagsusuri ng mga pangunahing epekto nang hindi naaapektuhan ang iba pang mga epekto. Halimbawa, kapag hindi available ang kinakailangang bilang ng mga cell sa isang plano, madalas na ginagamit ang mga plano. mga parisukat na latin upang matantya ang mga pangunahing epekto ng ilang mga kadahilanan na may isang malaking bilang mga antas. Halimbawa, ang 4 x 4 x 4 x 4 factorial na disenyo ay nangangailangan ng 256 na cell. Sa parehong oras, maaari mong gamitin Griyego-Latin square upang tantiyahin ang mga pangunahing epekto, na mayroong 16 na selula lamang sa plano (chap. Pagpaplano ng eksperimento, Volume IV, ay naglalaman ng isang detalyadong paglalarawan ng naturang mga plano). Ang mga hindi kumpletong disenyo kung saan ang mga pangunahing epekto (at ilang mga pakikipag-ugnayan) ay maaaring matantya gamit ang mga simpleng linear na kumbinasyon ng mga paraan ay tinatawag balanseng hindi kumpletong mga plano.

Sa mga balanseng disenyo, ang karaniwang (default) na paraan ng pagbuo ng mga contrast (mga timbang) para sa mga pangunahing epekto at mga pakikipag-ugnayan ay gagawa ng isang pagsusuri sa talahanayan ng pagkakaiba-iba kung saan ang mga kabuuan ng mga parisukat para sa kaukulang mga epekto ay hindi maghahalo sa isa't isa. Pagpipilian Mga Tukoy na Epekto bintana resulta bubuo ng mga nawawalang contrast sa pamamagitan ng pagsusulat ng zero sa mga nawawalang cell ng plano. Kaagad pagkatapos na hiniling ang opsyon Mga Tukoy na Epekto para sa isang user na nag-aaral ng ilang hypothesis, lumilitaw ang isang talaan ng mga resulta kasama ang mga aktwal na timbang. Tandaan na sa isang balanseng disenyo, ang mga kabuuan ng mga parisukat ng kani-kanilang mga epekto ay kinukuwenta lamang kung ang mga epektong iyon ay orthogonal (independyente) sa lahat ng iba pang pangunahing epekto at pakikipag-ugnayan. Kung hindi, gamitin ang opsyon Naka-iskedyul na Paghahambing upang tuklasin ang makabuluhang paghahambing sa pagitan ng mga paraan.

Mga Nawawalang Cell at Pinagsamang Error Effects/Miyembro

Kung opsyon Diskarte ng regression sa launch panel ng module Pagsusuri ng pagkakaiba-iba ay hindi pinili, ang modelo ng mga average ng cell ay gagamitin kapag kinakalkula ang kabuuan ng mga parisukat para sa mga epekto (default na setting). Kung ang disenyo ay hindi balanse, pagkatapos ay kapag pinagsasama ang mga di-orthogonal na epekto (tingnan ang talakayan sa itaas ng opsyon Nawawalang mga cell at tiyak na epekto) ang isa ay maaaring makakuha ng kabuuan ng mga parisukat na binubuo ng mga di-orthogonal (o magkakapatong) na bahagi. Ang mga resultang nakuha sa ganitong paraan ay kadalasang hindi nabibigyang-kahulugan. Samakatuwid, ang isa ay dapat na maging maingat kapag pumipili at nagpapatupad ng mga kumplikadong hindi kumpletong pang-eksperimentong disenyo.

Maraming mga libro na may mga detalyadong talakayan ng iba't ibang uri ng mga plano. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken at Johnson, 1984; Searle, 1987; Woodward at Bonett, 1990), ngunit ang ganitong uri ng impormasyon ay nasa labas ng saklaw ng aklat na ito. Gayunpaman, mamaya sa seksyong ito ipapakita namin ang pagsusuri iba't ibang uri mga plano.

Mga Epekto ng Paglabag sa Mga Assumption at Assumption

Paglihis mula sa pagpapalagay ng mga normal na distribusyon

Ipagpalagay na ang dependent variable ay sinusukat sa isang numerical scale. Ipagpalagay din natin na ang dependent variable ay may normal na distribusyon sa loob ng bawat pangkat. Pagsusuri ng pagkakaiba-iba naglalaman ng malawak na hanay ng mga graph at istatistika upang patunayan ang pagpapalagay na ito.

Mga epekto ng paglabag. Sa pangkalahatan F ang criterion ay lubhang lumalaban sa paglihis mula sa normalidad (tingnan ang Lindman, 1974 para sa mga detalyadong resulta). Kung ang kurtosis ay mas malaki kaysa sa 0, kung gayon ang halaga ng istatistika F maaaring maging napakaliit. Ang null hypothesis ay tinatanggap, bagaman maaaring hindi ito totoo. Ang sitwasyon ay nababaligtad kapag ang kurtosis ay mas mababa sa 0. Ang skewness ng distribusyon ay karaniwang may maliit na epekto sa F mga istatistika. Kung ang bilang ng mga obserbasyon sa isang cell ay sapat na malaki, kung gayon ang paglihis mula sa normalidad ay hindi mahalaga dahil sa Central limit theorem, ayon sa kung saan, ang distribusyon ng average na halaga ay malapit sa normal, anuman ang paunang distribusyon. Detalyadong talakayan ng pagpapanatili F ang mga istatistika ay matatagpuan sa Box at Anderson (1955), o Lindman (1974).

homogeneity ng dispersion

Mga pagpapalagay. Ipinapalagay na ang mga pagkakaiba-iba ng iba't ibang grupo ng plano ay pareho. Ang pagpapalagay na ito ay tinatawag na pagpapalagay homogeneity ng dispersion. Alalahanin na sa simula ng seksyong ito, kapag inilalarawan ang pagkalkula ng kabuuan ng mga squared error, nagsagawa kami ng pagsusuma sa loob ng bawat pangkat. Kung ang mga pagkakaiba sa dalawang pangkat ay magkaiba sa isa't isa, kung gayon ang pagdaragdag sa mga ito ay hindi masyadong natural at hindi nagbibigay ng pagtatantya ng kabuuang pagkakaiba sa loob ng pangkat (dahil sa kasong ito ay walang pangkalahatang pagkakaiba). Module Pagsusuri ng pagpapakalat -ANOVA/MANOVA naglalaman ng isang malaking hanay ng mga istatistikal na pamantayan para sa pagtukoy ng paglihis mula sa mga pagpapalagay ng homogeneity ng pagkakaiba.

Mga epekto ng paglabag. Lindman (1974, p. 33) ay nagpapakita na F ang criterion ay medyo matatag na may paggalang sa paglabag sa mga pagpapalagay ng homogeneity ng pagkakaiba-iba ( heterogeneity pagpapakalat, tingnan din ang Box, 1954a, 1954b; Hsu, 1938).

Espesyal na kaso: ugnayan ng mga paraan at pagkakaiba. May mga pagkakataon na F ang mga istatistika ay maaari iligaw. Nangyayari ito kapag ang ibig sabihin ng mga halaga sa mga cell ng disenyo ay nauugnay sa pagkakaiba-iba. Module Pagsusuri ng pagkakaiba-iba ay nagbibigay-daan sa iyo na bumuo ng mga scatterplot ng pagkakaiba o karaniwang paglihis kumpara sa mga paraan upang matukoy ang gayong ugnayan. Ang dahilan kung bakit mapanganib ang naturang ugnayan ay ang mga sumusunod. Isipin natin na mayroong 8 mga cell sa plano, 7 sa mga ito ay may halos parehong average, at sa isang cell ang average ay mas malaki kaysa sa iba. Pagkatapos F ang pagsusulit ay maaaring makakita ng makabuluhang epekto sa istatistika. Ngunit ipagpalagay na sa isang cell na may malaking mean na halaga at ang pagkakaiba ay mas malaki kaysa sa iba, i.e. nakadepende ang mean at variance sa mga cell (mas malaki ang mean, mas malaki ang variance). Sa kasong ito, hindi mapagkakatiwalaan ang malaking mean, dahil maaaring sanhi ito ng malaking pagkakaiba sa data. Gayunpaman F mga istatistika batay sa nagkakaisa Ang pagkakaiba-iba sa loob ng mga cell ay kukuha ng malaking mean, bagama't ang pamantayang batay sa pagkakaiba-iba sa bawat cell ay hindi isasaalang-alang ang lahat ng mga pagkakaiba sa mga paraan upang maging makabuluhan.

Ang likas na katangian ng data (malaking mean at malaking pagkakaiba) ay madalas na nakatagpo kapag may mga outlier na obserbasyon. Ang isa o dalawang outlier na obserbasyon ay malakas na nagbabago ng mean at lubos na nagpapataas ng pagkakaiba.

Homogeneity ng variance at covariance

Mga pagpapalagay. Sa mga multivariate na disenyo, na may multivariate dependent measures, ang homogeneity ng variance assumptions na inilarawan kanina ay nalalapat din. Gayunpaman, dahil may mga multivariate dependent variable, kinakailangan din na ang kanilang mga cross-correlations (covariances) ay magkapareho sa lahat ng plan cell. Module Pagsusuri ng pagkakaiba-iba mga alok iba't ibang paraan pagsubok sa mga pagpapalagay na ito.

Mga epekto ng paglabag. Multidimensional na analog F- criterion - λ-test ng Wilks. Walang gaanong nalalaman tungkol sa katatagan (katatagan) ng Wilks λ-test na may paggalang sa paglabag sa mga pagpapalagay sa itaas. Gayunpaman, dahil ang interpretasyon ng mga resulta ng module Pagsusuri ng pagkakaiba-iba ay karaniwang batay sa kahalagahan ng mga univariate na epekto (pagkatapos na maitaguyod ang kahalagahan ng karaniwang pamantayan), ang pagtalakay sa katatagan ay pangunahin nang may kinalaman sa univariate na pagsusuri ng pagkakaiba. Samakatuwid, ang kahalagahan ng isang-dimensional na epekto ay dapat na maingat na suriin.

Espesyal na kaso: pagsusuri ng covariance. Ang mga partikular na matinding paglabag sa homogeneity ng variance/covariance ay maaaring mangyari kapag ang mga covariate ay kasama sa disenyo. Sa partikular, kung ang ugnayan sa pagitan ng mga covariate at dependent na mga panukala ay iba sa iba't ibang mga cell ng disenyo, maaaring sundin ang maling interpretasyon ng mga resulta. Dapat alalahanin na sa pagsusuri ng covariance, sa esensya, ang isang pagsusuri ng regression ay isinasagawa sa loob ng bawat cell upang ihiwalay ang bahaging iyon ng pagkakaiba na tumutugma sa covariate. Ipinapalagay ng homogeneity ng variance/covariance assumption na ang pagsusuri ng regression na ito ay isinasagawa sa ilalim ng sumusunod na hadlang: lahat ng regression equation (slope) para sa lahat ng mga cell ay pareho. Kung hindi ito nilayon, maaaring mangyari ang malalaking error. Module Pagsusuri ng pagkakaiba-iba ay may ilang mga espesyal na pamantayan upang subukan ang pagpapalagay na ito. Maaaring ipinapayong gamitin ang mga pamantayang ito upang matiyak na ang mga equation ng regression para sa iba't ibang mga cell ay halos pareho.

Sphericity at complex symmetry: mga dahilan para sa paggamit ng multivariate repeated measures approach sa pagsusuri ng variance

Sa mga disenyong naglalaman ng paulit-ulit na mga salik sa pagsukat na may higit sa dalawang antas, ang aplikasyon ng univariate analysis ng variance ay nangangailangan ng mga karagdagang pagpapalagay: kumplikadong symmetry assumptions at sphericity assumptions. Ang mga pagpapalagay na ito ay bihirang matugunan (tingnan sa ibaba). Samakatuwid, sa mga nagdaang taon, ang multivariate analysis ng variance ay nakakuha ng katanyagan sa naturang mga plano (ang parehong mga diskarte ay pinagsama sa module Pagsusuri ng pagkakaiba-iba).

Kumplikadong symmetry assumption Ang kumplikadong symmetry assumption ay ang mga pagkakaiba-iba (kabuuan sa loob ng pangkat) at mga covariance (ayon sa pangkat) para sa iba't ibang paulit-ulit na mga sukat ay pare-pareho (pareho). Ito ay sapat na kundisyon para maging wasto ang isang univariate na paulit-ulit na mga panukalang F test (i.e., ang mga naiulat na F-values ​​​​ay, sa karaniwan, ay pare-pareho sa F-distribution). Gayunpaman, sa kasong ito ang kundisyong ito ay hindi kinakailangan.

Pagpapalagay ng sphericity. Ang pagpapalagay ng sphericity ay isang kinakailangan at sapat na kondisyon para mabigyang-katwiran ang F-criterion. Binubuo ito sa katotohanan na sa loob ng mga grupo ang lahat ng mga obserbasyon ay independyente at pantay na ipinamamahagi. Ang likas na katangian ng mga pagpapalagay na ito, pati na rin ang epekto ng kanilang mga paglabag, ay karaniwang hindi mahusay na inilarawan sa mga aklat sa pagsusuri ng pagkakaiba - ang isang ito ay ilalarawan sa mga sumusunod na talata. Ipapakita rin nito na ang mga resulta ng univariate na diskarte ay maaaring magkaiba sa mga resulta ng multivariate na diskarte at ipaliwanag kung ano ang ibig sabihin nito.

Ang pangangailangan para sa kalayaan ng mga hypotheses. Ang pangkalahatang paraan upang pag-aralan ang data sa pagsusuri ng pagkakaiba ay akma sa modelo. Kung, tungkol sa modelong naaayon sa data, mayroong ilan isang priori hypotheses, pagkatapos ay hatiin ang pagkakaiba upang subukan ang mga hypotheses na ito (pamantayan para sa mga pangunahing epekto, mga pakikipag-ugnayan). Mula sa isang computational point of view, ang diskarte na ito ay bumubuo ng ilang hanay ng mga contrast (set ng mga paghahambing ng mga paraan sa disenyo). Gayunpaman, kung ang mga kaibahan ay hindi independyente sa isa't isa, ang paghahati ng mga pagkakaiba ay nagiging walang kabuluhan. Halimbawa, kung dalawang contrast A at B ay magkapareho at ang kaukulang bahagi ay pinili mula sa pagkakaiba, pagkatapos ang parehong bahagi ay pinili nang dalawang beses. Halimbawa, hangal at walang kabuluhan ang pag-iisa ng dalawang hypotheses: "ang mean sa cell 1 ay mas mataas kaysa sa mean sa cell 2" at "ang mean sa cell 1 ay mas mataas kaysa sa mean sa cell 2". Kaya ang mga hypotheses ay dapat na independyente o orthogonal.

Mga independiyenteng hypotheses sa paulit-ulit na mga sukat. Pangkalahatang algorithm na ipinatupad sa module Pagsusuri ng pagkakaiba-iba, ay susubukan na bumuo ng mga independiyenteng (orthogonal) na kaibahan para sa bawat epekto. Para sa paulit-ulit na kadahilanan ng pagsukat, ang mga kaibahang ito ay nagbubunga ng maraming hypotheses tungkol sa pagkakaiba sa pagitan ng mga antas ng itinuturing na salik. Gayunpaman, kung ang mga pagkakaibang ito ay magkakaugnay sa loob ng mga grupo, kung gayon ang mga resultang kaibahan ay hindi na independyente. Halimbawa, sa pagsasanay kung saan ang mga mag-aaral ay sinusukat ng tatlong beses sa isang semestre, maaaring mangyari na ang mga pagbabago sa pagitan ng 1st at 2nd dimensyon ay negatibong nauugnay sa pagbabago sa pagitan ng 2nd at 3rd dimensyon ng mga paksa. Ang mga nakabisado na ang karamihan sa materyal sa pagitan ng 1st at 2nd dimensyon ay nakakabisado ng mas maliit na bahagi sa panahong lumipas sa pagitan ng 2nd at 3rd dimensyon. Sa katunayan, para sa karamihan ng mga kaso kung saan ginagamit ang pagsusuri ng pagkakaiba-iba sa mga paulit-ulit na pagsukat, maaaring ipagpalagay na ang mga pagbabago sa mga antas ay nakakaugnay sa mga paksa. Gayunpaman, kapag nangyari ito, ang mga kumplikadong symmetry at sphericity na mga pagpapalagay ay hindi natutugunan at ang mga independiyenteng kaibahan ay hindi maaaring makalkula.

Ang epekto ng mga paglabag at mga paraan upang maitama ang mga ito. Kapag hindi natugunan ang mga kumplikadong symmetry o sphericity na pagpapalagay, ang pagsusuri ng pagkakaiba ay maaaring magbunga ng mga maling resulta. Bago ang mga multivariate na pamamaraan ay sapat na binuo, ilang mga pagpapalagay ang ginawa upang mabayaran ang mga paglabag sa mga pagpapalagay na ito. (Tingnan, halimbawa, Greenhouse & Geisser, 1959 at Huynh & Feldt, 1970). Ang mga paraang ito ay malawak na ginagamit ngayon (kaya naman ang mga ito ay ipinakita sa modyul Pagsusuri ng pagkakaiba-iba).

Multivariate analysis ng variance approach sa paulit-ulit na mga panukala. Sa pangkalahatan, ang mga problema ng kumplikadong simetrya at sphericity ay tumutukoy sa katotohanan na ang mga hanay ng mga kaibahan na kasama sa pag-aaral ng mga epekto ng paulit-ulit na mga kadahilanan sa pagsukat (na may higit sa 2 antas) ay hindi independyente sa bawat isa. Gayunpaman, hindi nila kailangang maging independyente kung sila ay ginagamit. multidimensional isang criterion para sa sabay-sabay na pagsubok sa istatistikal na kahalagahan ng dalawa o higit pang mga paulit-ulit na pagsukat sa mga kaibahan ng kadahilanan. Ito ang dahilan kung bakit ang multivariate na pagsusuri ng mga paraan ng pagkakaiba-iba ay lalong ginagamit upang subukan ang kahalagahan ng univariate na paulit-ulit na mga salik sa pagsukat na may higit sa 2 antas. Ang diskarte na ito ay malawakang ginagamit dahil sa pangkalahatan ay hindi nangangailangan ng pagpapalagay ng kumplikadong simetrya at ang pagpapalagay ng sphericity.

Mga kaso kung saan hindi magagamit ang multivariate analysis ng variance approach. May mga halimbawa (mga plano) kapag hindi mailapat ang multivariate analysis ng variance approach. Ang mga ito ay karaniwang mga kaso kung saan mayroong isang maliit na bilang ng mga paksa sa disenyo at maraming mga antas sa paulit-ulit na kadahilanan ng pagsukat. Pagkatapos ay maaaring masyadong kakaunti ang mga obserbasyon para magsagawa ng multivariate analysis. Halimbawa, kung mayroong 12 entity, p = 4 paulit-ulit na mga sukat na kadahilanan, at ang bawat kadahilanan ay may k = 3 mga antas. Pagkatapos ang pakikipag-ugnayan ng 4 na mga kadahilanan ay "gagastos" (k-1)P = 2 4 = 16 antas ng kalayaan. Gayunpaman, mayroon lamang 12 na paksa, kaya hindi maaaring gawin ang isang multivariate na pagsubok sa halimbawang ito. Module Pagsusuri ng pagkakaiba-iba ay independiyenteng tuklasin ang mga obserbasyon na ito at kakalkulahin lamang ang isang-dimensional na pamantayan.

Mga pagkakaiba sa univariate at multivariate na resulta. Kung ang pag-aaral ay may kasamang malaking bilang ng mga paulit-ulit na hakbang, maaaring may mga kaso kung saan ang univariate repeated measures approach ng ANOVA ay nagbubunga ng mga resulta na ibang-iba sa mga nakuha gamit ang multivariate approach. Nangangahulugan ito na ang mga pagkakaiba sa pagitan ng mga antas ng kani-kanilang paulit-ulit na mga panukala ay magkakaugnay sa mga paksa. Minsan ang katotohanang ito ay may ilang independiyenteng interes.

Multivariate analysis ng variance at structural modeling ng mga equation

Sa mga nakalipas na taon, naging popular ang structural equation modeling bilang alternatibo sa multivariate dispersion analysis (tingnan, halimbawa, Bagozzi at Yi, 1989; Bagozzi, Yi, at Singh, 1991; Cole, Maxwell, Arvey, at Salas, 1993). Ang diskarte na ito ay nagpapahintulot sa iyo na subukan ang mga hypotheses hindi lamang tungkol sa mga paraan sa iba't ibang mga grupo, kundi pati na rin tungkol sa mga matrice ng ugnayan ng mga umaasa na variable. Halimbawa, maaari mong i-relax ang mga pagpapalagay tungkol sa homogeneity ng variance at covariance at tahasang isama ang mga error sa modelo para sa bawat pangkat ng variance at covariance. Module STATISTICSPagmomodelo ng Structural Equation (SEPATH) (tingnan ang Volume III) ay nagbibigay-daan para sa naturang pagsusuri.

Ang paggamit ng mga istatistika sa talang ito ay ipapakita kasama ng isang cross-cutting na halimbawa. Sabihin nating isa kang production manager sa Perfect Parachute. Ang mga parasyut ay ginawa mula sa mga sintetikong hibla na ibinibigay ng apat na magkakaibang mga supplier. Ang isa sa mga pangunahing katangian ng isang parasyut ay ang lakas nito. Kailangan mong tiyakin na ang lahat ng mga hibla na ibinigay ay may parehong lakas. Upang masagot ang tanong na ito, kinakailangan na magdisenyo ng isang eksperimento kung saan ang lakas ng mga parasyut na hinabi mula sa mga sintetikong hibla mula sa iba't ibang mga supplier ay sinusukat. Ang impormasyong nakuha sa panahon ng eksperimentong ito ay tutukuyin kung aling supplier ang nagbibigay ng pinakamatibay na mga parasyut.

Maraming mga application ang nauugnay sa mga eksperimento kung saan isinasaalang-alang ang ilang grupo o antas ng isang salik. Ang ilang salik, gaya ng temperatura ng pagpapaputok ng ceramic, ay maaaring magkaroon ng maraming antas ng numero (ibig sabihin, 300°, 350°, 400° at 450°). Ang iba pang mga kadahilanan, tulad ng lokasyon ng mga kalakal sa isang supermarket, ay maaaring may mga kategoryang antas (hal., unang supplier, pangalawang supplier, ikatlong supplier, ikaapat na supplier). Ang mga univariate na eksperimento kung saan ang mga pang-eksperimentong unit ay random na itinalaga sa mga pangkat o mga antas ng kadahilanan ay tinatawag na ganap na randomized.

PaggamitF-pamantayan para sa pagsusuri ng mga pagkakaiba sa pagitan ng ilang mga inaasahan sa matematika

Kung ang mga numerical na sukat ng isang salik sa mga pangkat ay tuloy-tuloy at ang ilang karagdagang kundisyon ay natutugunan, pagsusuri ng pagkakaiba (ANOVA - An alysis o f Va riance). Ang pagsusuri ng pagkakaiba-iba gamit ang ganap na randomized na mga disenyo ay tinatawag na one-way ANOVA. Sa isang kahulugan, ang terminong pagsusuri ng pagkakaiba-iba ay nakaliligaw dahil inihahambing nito ang mga pagkakaiba sa pagitan ng mga mean na halaga ng mga pangkat, hindi sa pagitan ng mga pagkakaiba. Gayunpaman, ang paghahambing ng mga inaasahan sa matematika ay isinasagawa nang tumpak sa batayan ng pagsusuri ng pagkakaiba-iba ng data. Sa pamamaraan ng ANOVA, ang kabuuang pagkakaiba-iba ng mga resulta ng pagsukat ay nahahati sa intergroup at intragroup (Fig. 1). Ang pagkakaiba-iba ng intragroup ay ipinaliwanag sa pamamagitan ng pang-eksperimentong error, habang ang pagkakaiba-iba ng intergroup ay ipinaliwanag sa pamamagitan ng mga epekto ng mga kundisyong pang-eksperimento. Simbolo kasama nagsasaad ng bilang ng mga pangkat.

kanin. 1. Paghihiwalay ng Variation sa isang Ganap na Randomized na Eksperimento

Mag-download ng tala sa o format, mga halimbawa sa format

Kunwari na lang kasama ang mga pangkat ay nakuha mula sa mga independyenteng populasyon na may normal na distribusyon at parehong pagkakaiba. Ang null hypothesis ay ang mga inaasahan sa matematika ng mga populasyon ay pareho: H 0: μ 1 = μ 2 = ... = μ s. Ang alternatibong hypothesis ay nagsasaad na hindi lahat ng mga inaasahan sa matematika ay pareho: H 1: hindi lahat ng μ j ay pareho j= 1, 2, …, s).

Sa fig. 2 ay nagpapakita ng tunay na null hypothesis tungkol sa matematikal na mga inaasahan ng limang pinaghahambing na grupo, sa kondisyon na ang pangkalahatang populasyon ay may normal na distribusyon at parehong pagkakaiba. Ang limang populasyon na nauugnay sa iba't ibang antas ng salik ay magkapareho. Samakatuwid, ang mga ito ay nakapatong sa isa't isa, na may parehong matematikal na inaasahan, pagkakaiba-iba at anyo.

kanin. 2. Limang populasyon ang may parehong matematikal na inaasahan: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

Sa kabilang banda, ipagpalagay na sa katunayan ang null hypothesis ay mali, at ang ikaapat na antas ay may pinakamalaking inaasahan sa matematika, ang unang antas ay may bahagyang mas mababang inaasahan sa matematika, at ang natitirang mga antas ay may pareho at mas maliit na mga inaasahan sa matematika (Fig. 3). Tandaan na, maliban sa mean na halaga, lahat ng limang populasyon ay magkapareho (ibig sabihin, may parehong pagkakaiba-iba at hugis).

kanin. 3. Ang epekto ng mga kundisyong pang-eksperimento ay sinusunod: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

Kapag sinusuri ang hypothesis ng pagkakapantay-pantay ng mga inaasahan sa matematika ng ilang pangkalahatang populasyon, ang kabuuang variation ay nahahati sa dalawang bahagi: intergroup variation, dahil sa mga pagkakaiba sa pagitan ng mga grupo, at intragroup variation, dahil sa mga pagkakaiba sa pagitan ng mga elementong kabilang sa parehong grupo. Ang kabuuang variation ay ipinahayag bilang kabuuang kabuuan ng mga parisukat (SST - kabuuan ng kabuuang mga parisukat). Dahil ang null hypothesis ay ang inaasahan ng lahat kasama ang mga grupo ay pantay sa isa't isa, ang kabuuang pagkakaiba ay katumbas ng kabuuan ng mga parisukat na pagkakaiba sa pagitan ng mga indibidwal na obserbasyon at ang kabuuang mean (mean ng mga average) na kinakalkula para sa lahat ng mga sample. Buong pagkakaiba-iba:

saan - pangkalahatang average, Xij - i-babantayan mo j-ika-grupo o antas, nj- bilang ng mga obserbasyon sa j-ika-grupo, n- kabuuang bilang ng mga obserbasyon sa lahat ng grupo (i.e. n = n 1 + n 2 + … + nc), kasama- bilang ng mga pinag-aralan na grupo o antas.

Pag-iiba-iba ng pangkat, karaniwang tinatawag na kabuuan ng mga parisukat sa mga pangkat (SSA), ay katumbas ng kabuuan ng mga parisukat na pagkakaiba sa pagitan ng sample mean ng bawat pangkat j at pangkalahatang average pinarami ng volume ng kaukulang pangkat nj:

saan kasama- ang bilang ng mga pangkat o antas na pinag-aralan, nj- bilang ng mga obserbasyon sa j-ika-grupo, j- ibig sabihin j-ika-grupo, - pangkalahatang average.

Pagkakaiba-iba sa loob ng grupo, karaniwang tinatawag na sum of squares withing groups (SSW), ay katumbas ng kabuuan ng mga squared na pagkakaiba sa pagitan ng mga elemento ng bawat pangkat at ng sample mean ng pangkat na ito j:

saan Xij - i-ika elemento j-ika-grupo, j- ibig sabihin j-ika-grupo.

Kasi pinagkukumpara sila kasama mga antas ng kadahilanan, ang intergroup na kabuuan ng mga parisukat ay mayroon s - 1 antas ng kalayaan. Ang bawat isa sa kasama may mga antas nj – 1 antas ng kalayaan, kaya ang kabuuan ng intragroup ng mga parisukat ay mayroon n- kasama antas ng kalayaan, at

Bilang karagdagan, ang kabuuang kabuuan ng mga parisukat ay may n – 1 antas ng kalayaan, dahil sa bawat pagmamasid Xij kumpara sa pangkalahatang average na kinakalkula sa lahat n mga obserbasyon. Kung ang bawat isa sa mga kabuuan na ito ay hinati sa katumbas na bilang ng mga antas ng kalayaan, tatlong uri ng pagpapakalat ang lilitaw: intergroup(mean square among - MSA), intragroup(mean square sa loob - MSW) at kumpleto(mean square total - MST):

Sa kabila ng katotohanan na ang pangunahing layunin ng pagsusuri ng pagkakaiba-iba ay upang ihambing ang mga inaasahan sa matematika kasama grupo upang ipakita ang epekto ng mga pang-eksperimentong kondisyon, ang pangalan nito ay dahil sa ang katunayan na ang pangunahing tool ay ang pagsusuri ng mga pagkakaiba-iba ng iba't ibang uri. Kung ang null hypothesis ay totoo, at sa pagitan ng mga inaasahang halaga kasama mga pangkat na walang makabuluhang pagkakaiba, lahat ng tatlong pagkakaiba - MSA, MSW at MST - ay mga pagtatantya ng pagkakaiba σ2 likas sa nasuri na datos. Kaya upang subukan ang null hypothesis H 0: μ 1 = μ 2 = ... = μ s at alternatibong hypothesis H 1: hindi lahat ng μ j ay pareho j = 1, 2, …, kasama), kinakailangan upang kalkulahin ang mga istatistika F-criterion, na ang ratio ng dalawang variances, MSA at MSW. pagsusulit F-mga istatistika sa univariate na pagsusuri ng pagkakaiba

Mga istatistika F-susunod ang pamantayan F- pamamahagi kasama ang s - 1 antas ng kalayaan sa numerator MSA at n - kasama antas ng kalayaan sa denominator MSW. Para sa isang naibigay na antas ng kahalagahan α, ang null hypothesis ay tinatanggihan kung ang nakalkula F FU likas F- pamamahagi kasama ang s - 1 n - kasama antas ng kalayaan sa denominator. Kaya, tulad ng ipinapakita sa fig. 4, ang panuntunan ng desisyon ay nabuo bilang mga sumusunod: null hypothesis H 0 tinanggihan kung F > FU; kung hindi, hindi ito tinatanggihan.

kanin. 4. Kritikal na lugar ng pagsusuri ng pagkakaiba kapag sinusubukan ang isang hypothesis H 0

Kung ang null hypothesis H 0 ay totoo, computed F-statistics ay malapit sa 1, dahil ang numerator at denominator nito ay mga pagtatantya ng parehong halaga - ang variance σ 2 na likas sa nasuri na data. Kung ang null hypothesis H 0 ay mali (at mayroong isang makabuluhang pagkakaiba sa pagitan ng mga halaga ng inaasahan ng iba't ibang mga grupo), na nakalkula F-Ang istatistika ay magiging mas malaki kaysa sa isa, dahil ang numerator nito, ang MSA, bilang karagdagan sa natural na pagkakaiba-iba ng data, ay tinatantya ang epekto ng mga pang-eksperimentong kundisyon o ang pagkakaiba sa pagitan ng mga pangkat, habang ang denominator na MSW ay tinatantya lamang ang natural na pagkakaiba-iba ng data. Kaya, ang pamamaraan ng ANOVA ay F ay isang pagsubok kung saan, sa isang naibigay na antas ng kahalagahan α, ang null hypothesis ay tinatanggihan kung ang kinakalkula F- ang mga istatistika ay mas malaki kaysa sa itaas na kritikal na halaga FU likas F- pamamahagi kasama ang s - 1 antas ng kalayaan sa numerator at n - kasama antas ng kalayaan sa denominator, tulad ng ipinapakita sa Fig. 4.

Upang ilarawan ang one-way na pagsusuri ng pagkakaiba, bumalik tayo sa senaryo na nakabalangkas sa simula ng tala. Ang layunin ng eksperimento ay upang matukoy kung ang mga parasyut na hinabi mula sa mga sintetikong hibla na nakuha mula sa iba't ibang mga supplier ay may parehong lakas. Bawat grupo ay may limang parachute na hinabi. Ang mga grupo ay hinati ayon sa supplier - Supplier 1, Supplier 2, Supplier 3 at Supplier 4. Ang lakas ng mga parasyut ay sinusukat gamit ang isang espesyal na aparato na sumusubok sa tela para sa pagkapunit sa magkabilang panig. Ang puwersa na kinakailangan upang masira ang isang parasyut ay sinusukat sa isang espesyal na sukat. Kung mas mataas ang puwersa ng pagsira, mas malakas ang parasyut. Pinapayagan ng Excel ang pagsusuri F-Mga istatistika sa isang pag-click. Dumaan sa menu DataPagsusuri sa datos, at piliin ang linya One-way na pagsusuri ng pagkakaiba, punan ang binuksan na window (Larawan 5). Ang mga resulta ng eksperimento (lakas ng puwang), ilang mapaglarawang istatistika, at ang mga resulta ng isang one-way na pagsusuri ng pagkakaiba ay ipinapakita sa Fig. 6.

kanin. 5. Bintana One-Way ANOVA Analysis Package excel

kanin. Fig. 6. Mga tagapagpahiwatig ng lakas ng mga parachute na hinabi mula sa mga sintetikong hibla na nakuha mula sa iba't ibang mga supplier, mga deskriptibong istatistika at mga resulta ng one-way na pagsusuri ng pagkakaiba-iba

Ang pagsusuri ng Figure 6 ay nagpapakita na mayroong ilang pagkakaiba sa pagitan ng sample na paraan. Ang average na lakas ng mga hibla na nakuha mula sa unang tagapagtustos ay 19.52, mula sa pangalawa - 24.26, mula sa pangatlo - 22.84 at mula sa ikaapat - 21.16. Ang pagkakaiba ba na ito ay makabuluhan sa istatistika? Ang pamamahagi ng rupture force ay ipinapakita sa scatter diagram (Larawan 7). Ito ay malinaw na nagpapakita ng mga pagkakaiba sa pagitan ng mga grupo at sa loob ng mga ito. Kung mas malaki ang volume ng bawat pangkat, maaari silang masuri gamit ang stem at leaf plot, box plot, o normal na distribution plot.

kanin. 7. Strength spread diagram ng mga parachute na hinabi mula sa synthetic fibers na nakuha mula sa apat na supplier

Ang null hypothesis ay nagsasaad na walang makabuluhang pagkakaiba sa pagitan ng mga halaga ng mean strength: H 0: μ 1 = μ 2 = μ 3 = μ 4. Ang isang alternatibong hypothesis ay mayroong hindi bababa sa isang supplier na ang average na lakas ng fiber ay naiiba sa iba: H 1: hindi lahat ng μ j ay pareho ( j = 1, 2, …, kasama).

Pangkalahatang Average (Tingnan ang Larawan 6) = AVERAGE(D12:D15) = 21.945; upang matukoy, maaari mo ring i-average ang lahat ng 20 orihinal na numero: \u003d AVERAGE (A3: D7). Kinakalkula ang mga halaga ng pagkakaiba-iba Pakete ng pagsusuri at makikita sa talahanayan Pagsusuri ng pagkakaiba-iba(tingnan ang Fig. 6): SSA = 63.286, SSW = 97.504, SST = 160.790 (tingnan ang column SS mga mesa Pagsusuri ng pagkakaiba-iba figure 6). Ang mga average ay kinakalkula sa pamamagitan ng paghahati sa mga kabuuan ng mga parisukat sa naaangkop na bilang ng mga antas ng kalayaan. Sa abot ng kasama= 4, at n= 20, nakuha namin ang mga sumusunod na halaga ng mga antas ng kalayaan; para sa SSA: s - 1= 3; para sa SSW: n–c= 16; para sa SST: n - 1= 19 (tingnan ang column df). Kaya: MSA = SSA / ( c - 1)= 21.095; MSW=SSW/( n–c) = 6.094; MST = SST / ( n - 1) = 8.463 (tingnan ang column MS). F-statistics = MSA / MSW = 3.462 (tingnan ang column F).

Mataas na kritikal na halaga FU, katangian para sa F-distribusyon, ay tinutukoy ng formula = F. OBR (0.95; 3; 16) = 3.239. Mga parameter ng function =F.OBR(): α = 0.05, ang numerator ay may tatlong degree ng kalayaan, at ang denominator ay 16. Kaya, ang kinakalkula F-statistic na katumbas ng 3.462 ay lumampas sa itaas na kritikal na halaga FU= 3.239, ang null hypothesis ay tinanggihan (Larawan 8).

kanin. 8. Kritikal na lugar ng pagsusuri ng pagkakaiba-iba sa antas ng kahalagahan na 0.05 kung ang numerator ay may tatlong antas ng kalayaan at ang denominator ay -16

R-halaga, ibig sabihin. ang posibilidad na sa ilalim ng isang tunay na null hypothesis F- mga istatistika na hindi bababa sa 3.46, katumbas ng 0.041 o 4.1% (tingnan ang column p-halaga mga mesa Pagsusuri ng pagkakaiba-iba figure 6). Dahil ang halagang ito ay hindi lalampas sa antas ng kahalagahan α = 5%, ang null hypothesis ay tinatanggihan. At saka, R-value ay nagpapahiwatig na ang posibilidad na makahanap ng tulad o isang malaking pagkakaiba sa pagitan ng mga inaasahan sa matematika ng mga pangkalahatang populasyon, sa kondisyon na sila ay aktwal na pareho, ay 4.1%.

Kaya. Mayroong pagkakaiba sa pagitan ng apat na sample na paraan. Ang null hypothesis ay ang lahat ng mga inaasahan sa matematika ng apat na populasyon ay pantay. Sa ilalim ng mga kundisyong ito, ang isang sukatan ng kabuuang pagkakaiba-iba (i.e. kabuuang pagkakaiba-iba ng SST) ng lakas ng lahat ng mga parasyut ay kinakalkula sa pamamagitan ng pagbubuod ng mga parisukat na pagkakaiba sa pagitan ng bawat pagmamasid. Xij at pangkalahatang average . Pagkatapos ang kabuuang pagkakaiba-iba ay nahahati sa dalawang bahagi (tingnan ang Fig. 1). Ang unang bahagi ay ang pagkakaiba-iba ng intergroup sa SSA at ang pangalawang bahagi ay ang pagkakaiba-iba ng intragroup sa SSW.

Ano ang nagpapaliwanag sa pagkakaiba-iba ng data? Sa madaling salita, bakit hindi pareho ang lahat ng mga obserbasyon? Ang isang dahilan ay ang iba't ibang mga kumpanya ay nagbibigay ng mga hibla na may iba't ibang lakas. Ito ay bahagyang nagpapaliwanag kung bakit ang mga grupo ay may iba't ibang inaasahang halaga: mas malakas ang epekto ng mga pang-eksperimentong kundisyon, mas malaki ang pagkakaiba sa pagitan ng mga mean na halaga ng mga pangkat. Ang isa pang dahilan para sa pagkakaiba-iba ng data ay ang natural na pagkakaiba-iba ng anumang proseso, sa kasong ito ang paggawa ng mga parasyut. Kahit na ang lahat ng mga hibla ay binili mula sa parehong supplier, ang kanilang lakas ay hindi magiging pareho, lahat ng iba pang mga bagay ay pantay. Dahil lumilitaw ang epektong ito sa bawat isa sa mga pangkat, tinatawag itong variation sa loob ng grupo.

Ang mga pagkakaiba sa pagitan ng sample na paraan ay tinatawag na intergroup variation ng SSA. Ang bahagi ng pagkakaiba-iba ng intragroup, tulad ng nabanggit na, ay ipinaliwanag sa pamamagitan ng katotohanan na nabibilang ang data iba't ibang grupo. Gayunpaman, kahit na ang mga pangkat ay eksaktong pareho (ibig sabihin, ang null hypothesis ay magiging totoo), magkakaroon pa rin ng pagkakaiba-iba ng intergroup. Ang dahilan nito ay nakasalalay sa likas na pagkakaiba-iba ng proseso ng paggawa ng parasyut. Dahil magkaiba ang mga sample, magkaiba ang ibig sabihin ng sample nila sa isa't isa. Samakatuwid, kung totoo ang null hypothesis, ang pagkakaiba-iba sa pagitan ng pangkat at sa loob ng pangkat ay mga pagtatantya ng pagkakaiba-iba ng populasyon. Kung mali ang null hypothesis, mas malaki ang hypothesis sa pagitan ng grupo. Ito ang katotohanang ito ang pinagbabatayan F-pamantayan para sa paghahambing ng mga pagkakaiba sa pagitan ng mga inaasahan sa matematika ng ilang grupo.

Pagkatapos magsagawa ng one-way ANOVA at makahanap ng makabuluhang pagkakaiba sa pagitan ng mga kumpanya, nananatiling hindi alam kung aling supplier ang makabuluhang naiiba sa iba. Alam lang natin na ang mga inaasahan sa matematika ng mga populasyon ay hindi pantay. Sa madaling salita, hindi bababa sa isa sa mga inaasahan sa matematika ay malaki ang pagkakaiba sa iba. Upang matukoy kung aling provider ang naiiba sa iba, maaari mong gamitin Tukey procedure, na gumagamit ng pairwise na paghahambing sa pagitan ng mga provider. Ang pamamaraang ito ay binuo ni John Tukey. Kasunod nito, siya at si C. Cramer ay nakapag-iisa na binago ang pamamaraang ito para sa mga sitwasyon kung saan ang mga laki ng sample ay naiiba sa bawat isa.

Maramihang paghahambing: Tukey-Kramer procedure

Sa aming senaryo, ginamit ang one-way analysis ng pagkakaiba-iba upang ihambing ang lakas ng mga parasyut. Ang pagkakaroon ng nahanap na makabuluhang pagkakaiba sa pagitan ng mga inaasahan sa matematika ng apat na grupo, kinakailangan upang matukoy kung aling mga grupo ang naiiba sa bawat isa. Bagama't mayroong ilang mga paraan upang malutas ang problemang ito, ilalarawan lamang namin ang pamamaraan ng paghahambing ng maramihang Tukey-Kramer. Ang pamamaraang ito ay isang halimbawa ng mga pamamaraan ng paghahambing ng post hoc, dahil ang hypothesis na susuriin ay nabuo pagkatapos ng pagsusuri ng data. Ang Tukey-Kramer procedure ay nagbibigay-daan sa iyo na sabay na ihambing ang lahat ng mga pares ng mga grupo. Sa unang yugto, ang mga pagkakaiba ay kinakalkula Xj – Xj, saan j ≠j, sa pagitan ng mga inaasahan sa matematika s(s – 1)/2 mga grupo. Kritikal na Span Ang pamamaraan ng Tukey-Kramer ay kinakalkula ng formula:

saan Q U- ang itaas na kritikal na halaga ng pamamahagi ng hanay ng estudyante, na mayroong kasama antas ng kalayaan sa numerator at n - kasama antas ng kalayaan sa denominator.

Kung ang mga laki ng sample ay hindi pareho, ang kritikal na hanay ay kinakalkula para sa bawat pares ng mga inaasahan sa matematika nang hiwalay. Sa huling hakbang bawat isa sa s(s – 1)/2 ang mga pares ng mga inaasahan sa matematika ay inihambing sa kaukulang hanay ng kritikal. Ang mga elemento ng isang pares ay itinuturing na makabuluhang naiiba kung ang modulus ng pagkakaiba | Xj – Xj| sa pagitan ng mga ito ay lumampas sa kritikal na hanay.

Ilapat natin ang Tukey-Cramer procedure sa problema ng lakas ng mga parasyut. Dahil ang kumpanya ng parachute ay may apat na supplier, 4(4 – 1)/2 = 6 na pares ng mga supplier ang dapat masuri (Figure 9).

kanin. 9. Pairwise na paghahambing ng sample na paraan

Dahil ang lahat ng mga grupo ay may parehong volume (i.e. lahat nj = nj), sapat na upang kalkulahin ang isang kritikal na hanay lamang. Upang gawin ito, ayon sa talahanayan ANOVA(Larawan 6) tinutukoy namin ang halaga ng MSW = 6.094. Pagkatapos ay makikita natin ang halaga Q U sa α = 0.05, kasama= 4 (bilang ng mga antas ng kalayaan sa numerator) at n- kasama= 20 – 4 = 16 (ang bilang ng mga antas ng kalayaan sa denominator). Sa kasamaang palad, hindi ko nakita ang kaukulang function sa Excel, kaya ginamit ko ang talahanayan (Larawan 10).

kanin. 10. Kritikal na halaga ng hanay ng estudyante Q U

Nakukuha namin:

Dahil 4.74 > 4.47 lamang (tingnan ang ibabang talahanayan sa Figure 9), isang makabuluhang pagkakaiba sa istatistika ang umiiral sa pagitan ng una at pangalawang supplier. Ang lahat ng iba pang mga pares ay may sample na paraan, na hindi nagpapahintulot sa amin na pag-usapan ang kanilang pagkakaiba. Dahil dito, ang average na lakas ng mga parachute na hinabi mula sa mga hibla na binili mula sa unang supplier ay makabuluhang mas mababa kaysa sa pangalawang.

Mga kinakailangang kondisyon para sa one-way na pagsusuri ng pagkakaiba-iba

Kapag nilulutas ang problema ng lakas ng mga parasyut, hindi namin nasuri kung natutugunan ang mga kondisyon kung saan magagamit ng isa ang isang kadahilanan F-pamantayan. Paano mo malalaman kung maaari kang mag-apply ng single-factor F-kriterya sa pagsusuri ng mga tiyak na pang-eksperimentong datos? Nag-iisang salik F Ang -test ay mailalapat lamang kung ang tatlong pangunahing pagpapalagay ay natutugunan: ang pang-eksperimentong data ay dapat na random at independyente, may normal na distribusyon, at ang kanilang mga pagkakaiba-iba ay dapat na pareho.

Ang unang hula ay randomness at data independence- dapat palaging gawin, dahil ang kawastuhan ng anumang eksperimento ay nakasalalay sa randomness ng pagpili at / o ang proseso ng randomization. Upang maiwasan ang pagbaluktot ng mga resulta, kinakailangan na kunin ang data mula sa kasama mga populasyon nang random at independyente sa bawat isa. Katulad nito, ang data ay dapat na random na ibinahagi sa ibabaw kasama mga antas ng kadahilanan ng interes sa amin (mga eksperimentong grupo). Ang paglabag sa mga kundisyong ito ay maaaring seryosong papangitin ang mga resulta ng pagsusuri ng pagkakaiba.

Ang pangalawang hula ay pagiging normal- nangangahulugan na ang data ay kinukuha mula sa mga normal na distributed na populasyon. Tungkol naman sa t-criterion, one-way analysis ng variance batay sa F-ang pamantayan ay medyo hindi sensitibo sa paglabag sa kundisyong ito. Kung ang distribusyon ay hindi masyadong malayo sa normal, ang antas ng kahalagahan F-kaunti ang pagbabago ng pamantayan, lalo na kung sapat ang laki ng sample. Kung ang kondisyon ng normal na pamamahagi ay malubhang nilabag, dapat itong ilapat.

Ang pangatlong hula ay pagkakapareho ng pagpapakalat- nangangahulugan na ang mga pagkakaiba-iba ng bawat pangkalahatang populasyon ay pantay-pantay sa bawat isa (i.e. σ 1 2 = σ 2 2 = … = σ j 2). Ang pagpapalagay na ito ay nagpapahintulot sa isa na magpasya kung ihihiwalay o isasama ang mga pagkakaiba-iba sa loob ng pangkat. Kung ang mga volume ng mga grupo ay pareho, ang kondisyon ng homogeneity ng pagkakaiba ay may maliit na epekto sa mga konklusyon na nakuha gamit ang F-pamantayan. Gayunpaman, kung ang mga sukat ng sample ay hindi pareho, ang paglabag sa kondisyon ng pagkakapantay-pantay ng mga pagkakaiba-iba ay maaaring seryosong papangitin ang mga resulta ng pagsusuri ng pagkakaiba-iba. Kaya, dapat magsikap ang isang tao upang matiyak na ang mga laki ng sample ay pareho. Ang isa sa mga pamamaraan para sa pagsuri sa palagay tungkol sa homogeneity ng variance ay ang criterion Levenay inilarawan sa ibaba.

Kung, sa lahat ng tatlong kondisyon, ang pagkakapareho lamang ng kondisyon ng pagpapakalat ay nilabag, isang pamamaraan na kahalintulad sa t-criterion gamit ang hiwalay na pagkakaiba (tingnan ang mga detalye). Gayunpaman, kung ang mga pagpapalagay ng normal na distribusyon at homogeneity ng variance ay nilabag sa parehong oras, ito ay kinakailangan upang gawing normal ang data at bawasan ang mga pagkakaiba sa pagitan ng mga pagkakaiba o maglapat ng isang nonparametric na pamamaraan.

Ang pamantayan ni Leveney para sa pagsuri sa homogeneity ng pagkakaiba-iba

Sa kabila ng katotohanan na F- ang pamantayan ay medyo lumalaban sa mga paglabag sa kondisyon ng pagkakapantay-pantay ng mga pagkakaiba-iba sa mga grupo, ang isang matinding paglabag sa pagpapalagay na ito ay makabuluhang nakakaapekto sa antas ng kahalagahan at kapangyarihan ng pamantayan. Marahil ang isa sa pinakamakapangyarihan ay ang criterion Levenay. Upang suriin ang pagkakapantay-pantay ng mga pagkakaiba-iba kasama pangkalahatang populasyon, susuriin natin ang mga sumusunod na hypotheses:

H 0: σ 1 2 = σ 2 2 = ... = σj 2

H 1: Hindi lahat σ j 2 ay pareho ( j = 1, 2, …, kasama)

Ang binagong pagsubok sa Leveney ay batay sa pagsasabing kung ang pagkakaiba-iba sa mga grupo ay pareho, ang pagsusuri ng pagkakaiba-iba ng mga ganap na halaga ng mga pagkakaiba sa pagitan ng mga obserbasyon at mga median ng grupo ay maaaring mailapat upang subukan ang null hypothesis ng pagkakapantay-pantay ng mga pagkakaiba-iba. Kaya, dapat mo munang kalkulahin ang mga ganap na halaga ng mga pagkakaiba sa pagitan ng mga obserbasyon at mga median sa bawat pangkat, at pagkatapos ay magsagawa ng isang one-way na pagsusuri ng pagkakaiba-iba sa nakuha na ganap na mga halaga ng mga pagkakaiba. Upang ilarawan ang pamantayan ng Levenay, bumalik tayo sa senaryo na nakabalangkas sa simula ng tala. Gamit ang data na ipinakita sa Fig. 6, magsasagawa kami ng isang katulad na pagsusuri, ngunit may paggalang sa mga module ng mga pagkakaiba sa paunang data at median para sa bawat sample nang hiwalay (Fig. 11).