Mga hanay ng pagkakaiba-iba. average na mga halaga

Ang hanay ng mga halaga ng parameter na pinag-aralan sa isang naibigay na eksperimento o pagmamasid, na niraranggo ayon sa magnitude (pagtaas o pagbaba) ay tinatawag na serye ng variation.

Ipagpalagay natin na sinukat natin ang presyon ng dugo ng sampung pasyente upang makakuha ng mas mataas na threshold ng BP: systolic pressure, i.e. isang numero lang.

Isipin na ang isang serye ng mga obserbasyon (populasyon ng istatistika) ng arterial systolic pressure sa 10 obserbasyon ay may sumusunod na anyo (Talahanayan 1):

Talahanayan 1

Mga bahagi serye ng pagkakaiba-iba ay tinatawag na mga pagpipilian. Ang mga variant ay kumakatawan sa numerical na halaga ng katangiang pinag-aaralan.

Ang pagbuo ng isang variational series mula sa isang istatistikal na hanay ng mga obserbasyon ay ang unang hakbang lamang tungo sa pag-unawa sa mga tampok ng buong set. Susunod, kinakailangan upang matukoy ang average na antas ng pinag-aralan na quantitative trait (ang average na antas ng protina ng dugo, average na timbang mga pasyente, average na oras sa simula ng kawalan ng pakiramdam, atbp.)

Ang average na antas ay sinusukat gamit ang pamantayan na tinatawag na mga average. Average na halaga - generalizing katangiang numero qualitatively homogenous na mga halaga, na nagpapakilala sa pamamagitan ng isang numero ng buong istatistikal na populasyon ayon sa isang katangian. Ang average na halaga ay nagpapahayag ng pangkalahatan na katangian ng isang katangian sa isang naibigay na hanay ng mga obserbasyon.

May tatlong uri ng mga average na karaniwang ginagamit: mode (), median () at average halaga ng aritmetika ().

Upang tukuyin ang anuman katamtamang laki kinakailangang gamitin ang mga resulta ng mga indibidwal na obserbasyon, isulat ang mga ito sa anyo ng serye ng pagkakaiba-iba (Talahanayan 2).

Fashion- ang halaga na pinakamadalas na nangyayari sa isang serye ng mga obserbasyon. Sa aming halimbawa, mode = 120. Kung walang mga paulit-ulit na halaga sa serye ng pagkakaiba-iba, pagkatapos ay sinasabi nila na walang mode. Kung ang ilang mga halaga ay paulit-ulit sa parehong bilang ng beses, kung gayon ang pinakamaliit sa kanila ay kinuha bilang mode.

Median- ang halaga na naghahati sa distribusyon sa dalawang magkapantay na bahagi, ang sentral o median na halaga ng isang serye ng mga obserbasyon na inayos sa pataas o pababang pagkakasunod-sunod. Kaya, kung mayroong 5 mga halaga sa serye ng variational, kung gayon ang median nito ay katumbas ng ikatlong miyembro ng serye ng variational, kung mayroong kahit na bilang ng mga miyembro sa serye, kung gayon ang median ay ang arithmetic mean ng dalawa nito. sentral na obserbasyon, i.e. kung mayroong 10 obserbasyon sa serye, kung gayon ang median ay katumbas ng arithmetic mean ng 5 at 6 na obserbasyon. Sa ating halimbawa.

Tandaan mahalagang katangian mga mode at median: ang kanilang mga magnitude ay hindi apektado ng mga numerical na halaga ng mga sukdulan.

Ang ibig sabihin ng aritmetika kinakalkula ng formula:

saan ang naobserbahang halaga sa -ika na obserbasyon, at ang bilang ng mga obserbasyon. Para sa aming kaso.

Ang arithmetic mean ay may tatlong katangian:

Ang gitna ay sumasakop sa gitnang posisyon sa serye ng variation. Sa isang mahigpit na simetriko na hilera.

Ang average ay isang pangkalahatang halaga at mga random na pagbabagu-bago, ang mga pagkakaiba sa indibidwal na data ay hindi nakikita sa likod ng average. Sinasalamin nito ang tipikal na katangian ng buong populasyon.

Ang kabuuan ng mga paglihis ng lahat ng variant mula sa mean ay katumbas ng zero: . Ang paglihis ng variant mula sa mean ay ipinahiwatig.

Ang serye ng variation ay binubuo ng mga variant at ang kanilang mga kaukulang frequency. Sa sampung halaga na nakuha, ang bilang na 120 ay nakatagpo ng 6 na beses, 115 - 3 beses, 125 - 1 beses. Dalas () - ang ganap na bilang ng mga indibidwal na opsyon sa populasyon, na nagsasaad kung gaano karaming beses nangyayari ang opsyong ito sa serye ng variation.

Ang serye ng variation ay maaaring simple (mga frequency = 1) o pinaikli ang pangkat, 3-5 na opsyon bawat isa. Ang isang simpleng serye ay ginagamit sa isang maliit na bilang ng mga obserbasyon (), nakapangkat - kasama malalaking numero mga obserbasyon().

Serye ng pamamahagi ng istatistika- ito ay isang maayos na pamamahagi ng mga yunit ng populasyon sa mga pangkat ayon sa isang tiyak na iba't ibang katangian.
Depende sa katangiang pinagbabatayan ng pagbuo ng isang serye ng pamamahagi, mayroong katangian at serye ng pamamahagi ng variation.

Ang pagkakaroon ng isang karaniwang tampok ay ang batayan para sa pagbuo ng isang istatistikal na populasyon, na mga resulta ng isang paglalarawan o pagsukat karaniwang mga tampok mga bagay sa pananaliksik.

Ang paksa ng pag-aaral sa istatistika ay nagbabago (nag-iiba-iba) ng mga tampok o mga tampok na istatistika.

Mga uri ng mga tampok na istatistika.

Ang serye ng pamamahagi ay tinatawag na serye ng katangian. binuo sa kalidad ng mga batayan. Attributive- ito ay isang palatandaan na may pangalan (halimbawa, isang propesyon: isang mananahi, guro, atbp.).
Nakaugalian na ayusin ang serye ng pamamahagi sa anyo ng mga talahanayan. Sa mesa. Ang 2.8 ay nagpapakita ng isang attribute series ng distribution.
Talahanayan 2.8 - Pamamahagi ng mga uri ng legal na tulong na ibinigay ng mga abogado sa mga mamamayan ng isa sa mga rehiyon ng Russian Federation.

Serye ng pagkakaiba-iba ay mga tampok na halaga (o mga hanay ng mga halaga) at ang kanilang mga frequency.
Ang mga serye ng pagkakaiba-iba ay serye ng pamamahagi binuo sa isang quantitative na batayan. Ang anumang variational series ay binubuo ng dalawang elemento: mga variant at frequency.
Ang mga variant ay mga indibidwal na halaga ng isang feature na kinukuha nito sa isang serye ng variation.
Ang mga frequency ay ang mga bilang ng mga indibidwal na variant o bawat pangkat ng serye ng variation, i.e. ito ay mga numerong nagpapakita kung gaano kadalas nangyayari ang ilang mga opsyon sa isang serye ng pamamahagi. Tinutukoy ng kabuuan ng lahat ng mga frequency ang laki ng buong populasyon, ang dami nito.
Ang mga frequency ay tinatawag na mga frequency, na ipinahayag sa mga fraction ng isang yunit o bilang isang porsyento ng kabuuan. Alinsunod dito, ang kabuuan ng mga frequency ay katumbas ng 1 o 100%. Nagbibigay-daan sa amin ang variational series na suriin ang anyo ng batas sa pamamahagi batay sa aktwal na data.

Depende sa likas na katangian ng pagkakaiba-iba ng katangian, mayroong discrete at interval variation series.
Ang isang halimbawa ng isang discrete variational series ay ibinigay sa Table. 2.9.
Talahanayan 2.9 - Pamamahagi ng mga pamilya ayon sa bilang ng mga silid na inookupahan sa mga indibidwal na apartment noong 1989 sa Russian Federation.

Ang unang column ng talahanayan ay nagpapakita ng mga variant ng isang discrete variational series, ang pangalawang column ay naglalaman ng mga frequency ng variational series, at ang ikatlong column ay naglalaman ng frequency indicator.

Serye ng pagkakaiba-iba

AT populasyon ilang quantitative trait ang sinisiyasat. Ang isang sample ng volume ay random na kinuha mula dito n, ibig sabihin, ang bilang ng mga elemento sa sample ay n. Sa unang yugto ng pagproseso ng istatistika, sumasaklaw mga sample, i.e. pag-order ng numero x 1 , x 2 , …, x n Paakyat. Ang bawat naobserbahang halaga x i tinawag opsyon. Dalas m i ay ang bilang ng mga obserbasyon ng halaga x i sa sample. Relatibong dalas (dalas) w i ay ang frequency ratio m i sa laki ng sample n: .
Kapag nag-aaral ng variational series, ginagamit din ang mga konsepto ng cumulative frequency at cumulative frequency. Hayaan x ilang numero. Pagkatapos ang bilang ng mga pagpipilian , na ang mga halaga ay mas mababa x, ay tinatawag na accumulated frequency: para sa x i n ay tinatawag na accumulated frequency w i max .
Ang isang katangian ay tinatawag na discretely variable kung ang mga indibidwal na halaga nito (mga variant) ay naiiba sa isa't isa sa ilang tiyak na halaga (karaniwan ay isang integer). Ang isang variational series ng naturang feature ay tinatawag na discrete variational series.

Talahanayan 1. Pangkalahatang view ng discrete variational series ng mga frequency

Mga halaga ng tampokx i x 1 x2 x n
Mga frequencym i m 1 m2 m n

Ang isang katangian ay tinatawag na patuloy na nag-iiba-iba kung ang mga halaga nito ay naiiba sa bawat isa sa pamamagitan ng isang maliit na halaga, i.e. ang tanda ay maaaring tumagal ng anumang halaga sa isang tiyak na agwat. Ang tuluy-tuloy na serye ng pagkakaiba-iba para sa gayong katangian ay tinatawag na serye ng pagitan.

Talahanayan 2. Pangkalahatang view ng pagkakaiba-iba ng pagitan ng serye ng mga frequency

Talahanayan 3. Mga graphic na larawan ng serye ng variation

hileraPolygon o histogramEmpirical distribution function
discrete
pagitan
Sa pagtingin sa mga resulta ng mga obserbasyon, natutukoy kung gaano karaming mga halaga ng mga pagpipilian ang nahulog sa bawat tiyak na agwat. Ipinapalagay na ang bawat pagitan ay kabilang sa isa sa mga dulo nito: alinman sa lahat ng mga kaso ang kaliwa (mas madalas), o sa lahat ng mga kaso ang kanan, at ang mga frequency o frequency ay nagpapakita ng bilang ng mga opsyon na nakapaloob sa ipinahiwatig na mga hangganan. Mga Pagkakaiba a i – a i +1 ay tinatawag na mga partial interval. Upang pasimplehin ang mga kasunod na kalkulasyon, ang serye ng pagkakaiba-iba ng pagitan ay maaaring palitan ng isang may kondisyon na discrete. Sa kasong ito, ang ibig sabihin ng halaga i-th interval ay kinuha bilang isang opsyon x i, at ang kaukulang dalas ng pagitan m i- para sa dalas ng agwat na ito.
Para sa graphic na representasyon ng variational series, kadalasang ginagamit ang polygon, histogram, cumulative curve at empirical distribution function.

Sa mesa. 2.3 (Pagpapangkat ng populasyon ng Russia ayon sa laki ng average per capita income noong Abril 1994) serye ng pagkakaiba-iba ng pagitan.
Maginhawang suriin ang serye ng pamamahagi gamit ang isang graphical na representasyon, na nagpapahintulot din sa isa na hatulan ang hugis ng pamamahagi. Ang isang visual na representasyon ng katangian ng pagbabago sa mga frequency ng variational series ay ibinibigay ng polygon at histogram.
Ginagamit ang polygon kapag nagpapakita ng discrete variational series.
Ilarawan natin, halimbawa, ang graphical na pamamahagi ng stock ng pabahay ayon sa uri ng mga apartment (Talahanayan 2.10).
Talahanayan 2.10 - Pamamahagi ng stock ng pabahay ng urban area ayon sa uri ng mga apartment (conditional figures).


kanin. Polygon ng pamamahagi ng pabahay


Sa y-axis, hindi lamang ang mga halaga ng mga frequency, kundi pati na rin ang mga frequency ng serye ng pagkakaiba-iba ay maaaring i-plot.
Ang histogram ay kinuha upang ipakita ang serye ng pagkakaiba-iba ng pagitan. Kapag bumubuo ng isang histogram, ang mga halaga ng mga pagitan ay naka-plot sa abscissa axis, at ang mga frequency ay inilalarawan ng mga parihaba na binuo sa kaukulang mga agwat. Ang taas ng mga haligi sa kaso ng pantay na mga pagitan ay dapat na proporsyonal sa mga frequency. Ang histogram ay isang graph kung saan ang isang serye ay ipinapakita bilang mga bar na katabi ng bawat isa.
Ilarawan natin nang grapiko ang serye ng pamamahagi ng pagitan na ibinigay sa Talahanayan. 2.11.
Talahanayan 2.11 - Pamamahagi ng mga pamilya ayon sa laki ng tirahan bawat tao (conditional figures).
N p / p Mga grupo ng mga pamilya ayon sa laki ng tirahan bawat tao Bilang ng mga pamilya na may partikular na laki ng tirahan Naipon na bilang ng mga pamilya
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
KABUUAN 115 ----


kanin. 2.2. Histogram ng pamamahagi ng mga pamilya ayon sa laki ng living space bawat tao


Gamit ang data ng naipon na serye (Talahanayan 2.11), bumuo kami pinagsama-samang pamamahagi.


kanin. 2.3. Ang pinagsama-samang pamamahagi ng mga pamilya ayon sa laki ng tirahan bawat tao


Ang representasyon ng isang variational series sa anyo ng isang cumulate ay lalong epektibo para sa variational series, ang mga frequency nito ay ipinahayag bilang mga fraction o porsyento ng kabuuan ng mga frequency ng serye.
Kung babaguhin natin ang mga axes sa graphic na representasyon ng variational series sa anyo ng isang cumulate, pagkatapos ay makukuha natin ogivu. Sa fig. 2.4 ay nagpapakita ng ogive na binuo batay sa data sa Talahanayan. 2.11.
Ang isang histogram ay maaaring ma-convert sa isang polygon ng pamamahagi sa pamamagitan ng paghahanap ng mga midpoint ng mga gilid ng mga parihaba at pagkatapos ay ikonekta ang mga puntong ito sa mga tuwid na linya. Ang resultang polygon ng pamamahagi ay ipinapakita sa fig. 2.2 tuldok na linya.
Kapag gumagawa ng isang histogram ng pamamahagi ng isang variational series na may hindi pantay na mga agwat, kasama ang ordinate axis, hindi ang mga frequency ay naka-plot, ngunit ang density ng pamamahagi ng tampok sa kaukulang mga agwat.
Ang density ng pamamahagi ay ang dalas na kinakalkula sa bawat lapad ng pagitan ng yunit, i.e. kung gaano karaming mga yunit sa bawat pangkat ang bawat halaga ng pagitan ng yunit. Ang isang halimbawa ng pagkalkula ng density ng pamamahagi ay ipinakita sa Talahanayan. 2.12.
Talahanayan 2.12 - Pamamahagi ng mga negosyo ayon sa bilang ng mga empleyado (ang mga numero ay may kondisyon)
N p / p Mga grupo ng mga negosyo ayon sa bilang ng mga empleyado, pers. Bilang ng mga negosyo Laki ng pagitan, pers. Densidad ng pamamahagi
PERO 1 2 3=1/2
1 hanggang sa 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
KABUUAN 147 ---- ----

Para sa isang graphical na representasyon ng variation series ay maaari ding gamitin pinagsama-samang kurba. Sa tulong ng cumulate (ang curve ng mga sums), isang serye ng mga naipon na frequency ay ipinapakita. Natutukoy ang mga naipon na frequency sa pamamagitan ng sunud-sunod na pagbubuod ng mga frequency ayon sa mga grupo at ipinapakita kung gaano karaming mga unit ng populasyon ang may mga feature na value na hindi hihigit sa isinasaalang-alang na halaga.


kanin. 2.4. Ogiva distribution ng mga pamilya ayon sa laki ng living space bawat tao

Kapag binubuo ang pinagsama-samang serye ng pagkakaiba-iba ng pagitan, ang mga variant ng serye ay naka-plot sa kahabaan ng abscissa axis, at ang mga naipon na frequency sa kahabaan ng ordinate axis.

Serye ng pagkakaiba-iba - isang serye kung saan inihahambing ang mga ito (sa pataas o pababang pagkakasunud-sunod) mga pagpipilian at kani-kanilang mga mga frequency

Ang mga variant ay hiwalay na quantitative expression ng isang katangian. Itinalaga gamit ang isang Latin na titik V . Ang klasikal na pag-unawa sa terminong "variant" ay ipinapalagay na ang bawat natatanging halaga ng isang tampok ay tinatawag na isang variant, anuman ang bilang ng mga pag-uulit.

Halimbawa, sa isang variational na serye ng mga indicator ng systolic blood pressure na sinusukat sa sampung pasyente:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

6 na halaga lamang ang mga opsyon:

110, 120, 130, 140, 160, 170.

Ang dalas ay isang numerong nagsasaad kung gaano karaming beses inuulit ang isang opsyon. Tinutukoy ng isang Latin na titik P . Ang kabuuan ng lahat ng mga frequency (na, siyempre, ay katumbas ng bilang ng lahat ng pinag-aralan) ay tinutukoy bilang n.

    Sa aming halimbawa, ang mga frequency ay kukuha sa mga sumusunod na halaga:
  • para sa variant na 110 frequency P = 1 (nagaganap ang value 110 sa isang pasyente),
  • para sa variant na 120 frequency P = 2 (nagaganap ang value 120 sa dalawang pasyente),
  • para sa variant na 130 frequency P = 3 (nagaganap ang value 130 sa tatlong pasyente),
  • para sa variant na 140 frequency P = 2 (nagaganap ang value 140 sa dalawang pasyente),
  • para sa variant na 160 frequency P = 1 (nagaganap ang value 160 sa isang pasyente),
  • para sa variant na 170 frequency P = 1 (nagaganap ang value 170 sa isang pasyente),

Mga uri ng serye ng variation:

  1. simple lang- ito ay isang serye kung saan ang bawat opsyon ay nangyayari nang isang beses lamang (lahat ng mga frequency ay katumbas ng 1);
  2. sinuspinde- isang serye kung saan ang isa o higit pang mga opsyon ay nangyayari nang paulit-ulit.

Ginagamit ang serye ng variation upang ilarawan ang malalaking hanay ng mga numero; sa form na ito kung saan unang ipinakita ang nakolektang data ng karamihan sa mga medikal na pag-aaral. Upang makilala ang serye ng pagkakaiba-iba, ang mga espesyal na tagapagpahiwatig ay kinakalkula, kabilang ang mga average na halaga, mga tagapagpahiwatig ng pagkakaiba-iba (ang tinatawag na pagpapakalat), mga tagapagpahiwatig ng pagiging kinatawan ng sample na data.

Mga tagapagpahiwatig ng serye ng pagkakaiba-iba

1) Ang arithmetic mean ay isang generalizing indicator na nagpapakilala sa laki ng pinag-aralan na katangian. Ang ibig sabihin ng arithmetic ay tinutukoy bilang M , ay ang pinakakaraniwang uri ng average. Ang ibig sabihin ng aritmetika ay kinakalkula bilang ratio ng kabuuan ng mga halaga ng mga tagapagpahiwatig ng lahat ng mga yunit ng pagmamasid sa bilang ng lahat ng napagmasdan. Ang paraan para sa pagkalkula ng arithmetic mean ay naiiba para sa isang simple at may timbang na serye ng variation.

Formula para sa pagkalkula simpleng ibig sabihin ng aritmetika:

Formula para sa pagkalkula weighted arithmetic mean:

M = Σ(V * P)/ n

​ 2) Mode - isa pang average na halaga ng serye ng variation, na tumutugma sa pinakamadalas na paulit-ulit na variant. O, upang ilagay ito sa ibang paraan, ito ang opsyon na tumutugma sa pinakamataas na dalas. Itinalaga bilang Mo . Ang mode ay kinakalkula lamang para sa may timbang na serye, dahil sa simpleng serye wala sa mga opsyon ang nauulit at lahat ng frequency ay katumbas ng isa.

Halimbawa, sa variation series ng mga halaga ng heart rate:

80, 84, 84, 86, 86, 86, 90, 94;

ang halaga ng mode ay 86, dahil ang variant na ito ay nangyayari nang 3 beses, samakatuwid ang dalas nito ay ang pinakamataas.

3) Median - ang halaga ng pagpipilian, hinahati ang serye ng pagkakaiba-iba sa kalahati: sa magkabilang panig nito ay may pantay na bilang ng mga pagpipilian. Ang median, pati na rin ang arithmetic mean at mode, ay tumutukoy sa mga average na halaga. Itinalaga bilang Ako

4) Standard deviation (kasingkahulugan: standard deviation, sigma deviation, sigma) - isang sukatan ng pagkakaiba-iba ng serye ng variation. Ito ay isang mahalagang tagapagpahiwatig na pinagsasama ang lahat ng mga kaso ng paglihis ng isang variant mula sa mean. Sa katunayan, sinasagot nito ang tanong: gaano kalayo at gaano kadalas kumakalat ang mga opsyon mula sa ibig sabihin ng aritmetika. Tinutukoy ng isang liham na Griyego σ ("sigma").

Kapag ang laki ng populasyon ay higit sa 30 yunit, ang karaniwang paglihis ay kinakalkula gamit ang sumusunod na formula:

Para sa maliliit na populasyon - 30 mga yunit ng pagmamasid o mas kaunti - ang karaniwang paglihis ay kinakalkula gamit ang ibang formula:

Serye ng pagkakaiba-iba ay isang serye ng mga numerong halaga ng isang tampok.

Ang mga pangunahing katangian ng serye ng pagkakaiba-iba: v - variant, p - ang dalas ng paglitaw nito.

Mga uri ng serye ng variation:

    ayon sa dalas ng paglitaw ng mga variant: simple - ang variant ay nangyayari nang isang beses, may timbang - ang variant ay nangyayari ng dalawa o higit pang beses;

    mga opsyon ayon sa lokasyon: niraranggo - ang mga opsyon ay nakaayos sa pababang at pataas na pagkakasunud-sunod, walang ranggo - ang mga opsyon ay nakasulat sa walang partikular na pagkakasunud-sunod;

    sa pamamagitan ng pagpapangkat ng opsyon sa mga pangkat: pinagsama - ang mga opsyon ay pinagsama sa mga grupo, hindi nakagrupo - ang mga opsyon ay hindi nakagrupo;

    sa pamamagitan ng mga pagpipilian sa halaga: tuloy-tuloy - ang mga pagpipilian ay ipinahayag bilang isang integer at isang fractional na numero, discrete - ang mga pagpipilian ay ipinahayag bilang isang integer, kumplikado - ang mga pagpipilian ay kinakatawan ng isang kamag-anak o average na halaga.

Ang isang variational na serye ay pinagsama-sama at iginuhit upang makalkula ang mga average na halaga.

Form ng notasyon ng serye ng pagkakaiba-iba:

8. Average na mga halaga, uri, paraan ng pagkalkula, aplikasyon sa pangangalagang pangkalusugan

Average na mga halaga- ang kabuuang pangkalahatang katangian ng quantitative na katangian. Paglalapat ng mga average:

1. Upang makilala ang organisasyon ng gawain ng mga institusyong medikal at suriin ang kanilang mga aktibidad:

a) sa polyclinic: mga tagapagpahiwatig ng workload ng mga doktor, ang average na bilang ng mga pagbisita, ang average na bilang ng mga residente sa lugar;

b) sa isang ospital: average na bilang ng mga araw ng kama bawat taon; average na tagal ng pananatili sa ospital;

c) sa sentro ng kalinisan, epidemiology at pampublikong kalusugan: average na lugar (o kubiko na kapasidad) bawat 1 tao, average na mga pamantayan sa nutrisyon (protina, taba, carbohydrates, bitamina, mineral salts, calories), sanitary norms at standards, atbp.;

2. Upang makilala ang pisikal na pag-unlad (ang pangunahing anthropometric na katangian ng morphological at functional);

3. Upang matukoy ang mga medikal at physiological na mga parameter ng katawan sa normal at pathological na mga kondisyon sa mga klinikal at eksperimentong pag-aaral.

4. Sa espesyal na siyentipikong pananaliksik.

Ang pagkakaiba sa pagitan ng mga average na halaga at tagapagpahiwatig:

1. Ang mga koepisyent ay nagpapakilala sa isang alternatibong tampok na nangyayari lamang sa ilang bahagi ng pangkat ng istatistika, na maaaring mangyari o hindi.

Sinasaklaw ng mga average na halaga ang mga palatandaang likas sa lahat ng miyembro ng pangkat, ngunit sa iba't ibang antas (timbang, taas, mga araw ng paggamot sa ospital).

2. Ginagamit ang mga coefficient upang sukatin ang mga katangiang husay. Ang mga average na halaga ay para sa iba't ibang quantitative na katangian.

Mga uri ng average:

    arithmetic mean, ang mga katangian nito - standard deviation at average error

    mode at median. Fashion (Mo)- tumutugma sa halaga ng katangian na kadalasang matatagpuan sa populasyon na ito. Median (Ako)- ang halaga ng katangian, na sumasakop sa median na halaga sa populasyon na ito. Hinahati nito ang serye sa 2 pantay na bahagi ayon sa bilang ng mga obserbasyon. Arithmetic mean value (M)- hindi tulad ng mode at median, umaasa ito sa lahat ng mga obserbasyon na ginawa, samakatuwid ito ay isang mahalagang katangian para sa buong pamamahagi.

    iba pang uri ng average na ginagamit sa mga espesyal na pag-aaral: root mean square, cubic, harmonic, geometric, progressive.

Ang ibig sabihin ng aritmetika nailalarawan ang average na antas ng istatistikal na populasyon.

Para sa isang simpleng serye kung saan

∑v – opsyon sa kabuuan,

n ay ang bilang ng mga obserbasyon.

para sa isang may timbang na serye, kung saan

Ang ∑vr ay ang kabuuan ng mga produkto ng bawat opsyon at ang dalas ng paglitaw nito

n ay ang bilang ng mga obserbasyon.

Karaniwang lihis Ang arithmetic mean o sigma (σ) ay nagpapakilala sa pagkakaiba-iba ng tampok

- para sa isang simpleng hilera

Σd 2 - ang kabuuan ng mga parisukat ng pagkakaiba sa pagitan ng arithmetic mean at bawat opsyon (d = │M-V│)

n ay ang bilang ng mga obserbasyon

- para sa timbang na serye

∑d 2 p ay ang kabuuan ng mga produkto ng mga parisukat ng pagkakaiba sa pagitan ng arithmetic mean at bawat opsyon at ang dalas ng paglitaw nito,

n ay ang bilang ng mga obserbasyon.

Ang antas ng pagkakaiba-iba ay maaaring hatulan sa pamamagitan ng halaga ng koepisyent ng pagkakaiba-iba
. Higit sa 20% - malakas na pagkakaiba-iba, 10-20% - katamtamang pagkakaiba-iba, mas mababa sa 10% - mahinang pagkakaiba-iba.

Kung ang isang sigma (M ± 1σ) ay idinagdag at ibinawas mula sa arithmetic mean, kung gayon sa isang normal na distribusyon, hindi bababa sa 68.3% ng lahat ng mga variant (obserbasyon) ay nasa loob ng mga limitasyong ito, na itinuturing na pamantayan para sa hindi pangkaraniwang bagay na pinag-aaralan. . Kung k 2 ± 2σ, 95.5% ng lahat ng obserbasyon ay nasa loob ng mga limitasyong ito, at kung k M ± 3σ, 99.7% ng lahat ng obserbasyon ay nasa loob ng mga limitasyong ito. Kaya, ang standard deviation ay isang standard deviation na nagpapahintulot sa isa na mahulaan ang posibilidad ng paglitaw ng naturang halaga ng pinag-aralan na katangian na nasa loob ng tinukoy na mga limitasyon.

Average na error ng arithmetic mean o pagkakamali sa pagiging kinatawan. Para sa simple, may timbang na serye at ayon sa panuntunan ng mga sandali:

.

Upang makalkula ang average na mga halaga, kinakailangan: ang homogeneity ng materyal, isang sapat na bilang ng mga obserbasyon. Kung ang bilang ng mga obserbasyon ay mas mababa sa 30, ang n-1 ay ginagamit sa mga formula para sa pagkalkula ng σ at m.

Kapag sinusuri ang resulta na nakuha sa laki ng average na error, ginagamit ang isang koepisyent ng kumpiyansa, na ginagawang posible upang matukoy ang posibilidad ng isang tamang sagot, iyon ay, ipinapahiwatig nito na ang nagresultang error sa sample ay hindi lalampas sa aktwal na error. ginawa bilang resulta ng patuloy na pagmamasid. Dahil dito, na may pagtaas sa posibilidad ng kumpiyansa, ang lapad ng agwat ng kumpiyansa ay tumataas, na, naman, ay nagdaragdag ng kumpiyansa ng paghatol, ang suporta ng resulta na nakuha.

Ang mga hilera na binuo ayon sa dami, ay tinatawag pagkakaiba-iba.

Ang serye ng pamamahagi ay binubuo ng mga pagpipilian(characteristic values) at mga frequency(bilang ng mga pangkat). Ang mga frequency na ipinahayag bilang mga kamag-anak na halaga (mga pagbabahagi, mga porsyento) ay tinatawag mga frequency. Ang kabuuan ng lahat ng mga frequency ay tinatawag na dami ng serye ng pamamahagi.

Ayon sa uri, ang serye ng pamamahagi ay nahahati sa discrete(binuo sa mga hindi tuluy-tuloy na halaga ng tampok) at pagitan(itinayo sa tuluy-tuloy na mga halaga ng tampok).

Serye ng pagkakaiba-iba kumakatawan sa dalawang hanay (o mga hilera); ang isa ay nagbibigay ng mga indibidwal na halaga ng variable na katangian, na tinatawag na mga variant at tinutukoy ng X; at sa iba pa - ganap na mga numero na nagpapakita kung gaano karaming beses (gaano kadalas) nangyayari ang bawat opsyon. Ang mga tagapagpahiwatig ng pangalawang hanay ay tinatawag na mga frequency at conventionally ay tinutukoy ng f. Muli, tandaan namin na sa pangalawang hanay, ang mga kamag-anak na tagapagpahiwatig na nagpapakilala sa bahagi ng dalas ng mga indibidwal na variant sa kabuuang dami ng mga frequency ay maaari ding gamitin. Ang mga kamag-anak na tagapagpahiwatig na ito ay tinatawag na mga frequency at karaniwang tinutukoy ng ω Ang kabuuan ng lahat ng mga frequency sa kasong ito ay katumbas ng isa. Gayunpaman, ang mga frequency ay maaari ding ipahayag bilang isang porsyento, at pagkatapos ay ang kabuuan ng lahat ng mga frequency ay nagbibigay ng 100%.

Kung ang mga variant ng variational series ay ipinahayag bilang discrete value, kung gayon ang naturang variational series ay tinatawag na discrete.

Para sa tuluy-tuloy na mga tampok, ang mga serye ng pagkakaiba-iba ay itinayo bilang pagitan, iyon ay, ang mga halaga ng katangian sa kanila ay ipinahayag "mula sa ... hanggang ...". Sa kasong ito, ang pinakamababang halaga ng katangian sa naturang pagitan ay tinatawag na mas mababang limitasyon ng agwat, at ang maximum - ang pinakamataas na limitasyon.

Ang interval variational series ay binuo din para sa mga discrete na feature na nag-iiba-iba sa malawak na hanay. Ang serye ng pagitan ay maaaring pantay at hindi pantay mga pagitan.

Isaalang-alang kung paano natutukoy ang halaga ng pantay na pagitan. Ipakilala natin ang sumusunod na notasyon:

i- halaga ng pagitan;

- ang pinakamataas na halaga ng katangian para sa mga yunit ng populasyon;

- ang pinakamababang halaga ng katangian para sa mga yunit ng populasyon;

n- ang bilang ng mga inilaan na pangkat.

kung kilala ang n.

Kung ang bilang ng mga inilalaang grupo ay mahirap matukoy nang maaga, kung gayon ang pormula na iminungkahi ni Sturgess noong 1926 ay maaaring irekomenda upang kalkulahin ang pinakamainam na laki ng agwat na may sapat na laki ng populasyon:

n = 1+ 3.322 log N, kung saan ang N ay ang bilang ng mga nasa populasyon.

Ang halaga ng hindi pantay na agwat ay tinutukoy sa bawat indibidwal na kaso, na isinasaalang-alang ang mga katangian ng bagay ng pag-aaral.

Ang istatistikal na pamamahagi ng sample tawagan ang listahan ng mga opsyon at ang kanilang kaukulang frequency (o relative frequency).

Ang istatistikal na pamamahagi ng sample ay maaaring tukuyin sa anyo ng isang talahanayan, sa unang hanay kung saan mayroong mga pagpipilian, at sa pangalawa - ang mga frequency na naaayon sa mga pagpipiliang ito. ni, o mga relatibong frequency Pi .

Statistical distribution ng sample

Ang serye ng pagitan ay tinatawag na serye ng pagkakaiba-iba kung saan ang mga halaga ng mga tampok na pinagbabatayan ng kanilang pagbuo ay ipinahayag sa loob ng ilang mga limitasyon (mga agwat). Ang mga frequency sa kasong ito ay hindi tumutukoy sa mga indibidwal na halaga ng katangian, ngunit sa buong agwat.

Binubuo ang serye ng pamamahagi ng pagitan ayon sa tuluy-tuloy na dami ng mga katangian, gayundin ayon sa mga discrete na katangian, na nag-iiba-iba sa loob ng makabuluhang saklaw.

Ang serye ng pagitan ay maaaring katawanin ng istatistikal na pamamahagi ng sample, na nagpapahiwatig ng mga agwat at ang kanilang mga kaukulang frequency. Sa kasong ito, ang kabuuan ng mga frequency ng variant na nahulog sa agwat na ito ay kinukuha bilang dalas ng agwat.

Kapag pinapangkat ayon sa dami ng tuluy-tuloy na mga tampok, mahalagang matukoy ang laki ng agwat.

Bilang karagdagan sa sample mean at sample variance, ginagamit din ang iba pang mga katangian ng serye ng variation.

Fashion pangalanan ang variant na may pinakamataas na frequency.