Variational na serye ng pamamahagi. Serye ng pagkakaiba-iba at mga katangian nito

Ang hanay ng mga halaga ng parameter na pinag-aralan sa isang partikular na eksperimento o pagmamasid, na niraranggo ayon sa magnitude (pagtaas o pagbaba) ay tinatawag na serye ng variation.

Ipagpalagay natin na sinukat natin ang presyon ng dugo ng sampung pasyente upang makakuha ng mas mataas na threshold ng BP: systolic pressure, i.e. isang numero lang.

Isipin na ang isang serye ng mga obserbasyon (populasyon ng istatistika) ng arterial systolic pressure sa 10 obserbasyon ay may sumusunod na anyo (Talahanayan 1):

Talahanayan 1

Ang mga bahagi ng isang variational series ay tinatawag na mga variant. Kinakatawan ng mga variant ang numerical value ng katangiang pinag-aaralan.

Ang pagbuo ng isang variational series mula sa isang istatistikal na hanay ng mga obserbasyon ay ang unang hakbang lamang tungo sa pag-unawa sa mga tampok ng buong set. Susunod, kinakailangan upang matukoy ang average na antas ng pinag-aralan na quantitative trait (ang average na antas ng protina ng dugo, average na timbang mga pasyente, average na oras sa simula ng kawalan ng pakiramdam, atbp.)

Ang average na antas ay sinusukat gamit ang pamantayan na tinatawag na mga average. Average na halaga - generalizing numerical na katangian qualitatively homogenous values, characterizing by one number ang buong statistical population ayon sa isang attribute. Ang average na halaga ay nagpapahayag ng pangkalahatan na katangian ng isang katangian sa isang naibigay na hanay ng mga obserbasyon.

Mayroong tatlong uri ng mga average na karaniwang ginagamit: mode (), median () at arithmetic mean ().

Upang matukoy ang anumang average na halaga, kinakailangang gamitin ang mga resulta ng mga indibidwal na obserbasyon, isulat ang mga ito sa anyo ng isang serye ng pagkakaiba-iba (Talahanayan 2).

Fashion- ang halaga na pinakamadalas na nangyayari sa isang serye ng mga obserbasyon. Sa aming halimbawa, mode = 120. Kung walang mga paulit-ulit na halaga sa serye ng pagkakaiba-iba, pagkatapos ay sinasabi nila na walang mode. Kung ang ilang mga halaga ay paulit-ulit sa parehong bilang ng beses, kung gayon ang pinakamaliit sa kanila ay kinuha bilang mode.

Median- ang halaga na naghahati sa distribusyon sa dalawang pantay na bahagi, ang sentral o median na halaga ng isang serye ng mga obserbasyon na inayos sa pataas o pababang pagkakasunud-sunod. Kaya, kung mayroong 5 mga halaga sa serye ng variational, kung gayon ang median nito ay katumbas ng ikatlong miyembro ng serye ng variational, kung mayroong kahit na bilang ng mga miyembro sa serye, kung gayon ang median ay ang arithmetic mean ng dalawa nito. sentral na mga obserbasyon, i.e. kung mayroong 10 obserbasyon sa serye, ang median ay katumbas ng arithmetic mean ng 5 at 6 na obserbasyon. Sa ating halimbawa.

Tandaan mahalagang katangian mga mode at median: ang kanilang mga magnitude ay hindi apektado ng mga numerical na halaga ng mga sukdulan.

Ang ibig sabihin ng aritmetika kinakalkula ng formula:

saan ang naobserbahang halaga sa -th na obserbasyon, at ang bilang ng mga obserbasyon. Para sa aming kaso.

Ang arithmetic mean ay may tatlong katangian:

Ang gitna ay sumasakop sa gitnang posisyon sa serye ng variation. Sa isang mahigpit na simetriko na hilera.

Ang average ay isang pangkalahatang halaga at mga random na pagbabagu-bago, ang mga pagkakaiba sa indibidwal na data ay hindi nakikita sa likod ng average. Sinasalamin nito ang tipikal na katangian ng buong populasyon.

Ang kabuuan ng mga paglihis ng lahat ng variant mula sa mean ay katumbas ng zero: . Ang paglihis ng variant mula sa mean ay ipinahiwatig.

Ang serye ng variation ay binubuo ng mga variant at ang kanilang mga kaukulang frequency. Sa sampung halaga na nakuha, ang bilang na 120 ay nakatagpo ng 6 na beses, 115 - 3 beses, 125 - 1 beses. Dalas () - ang ganap na bilang ng mga indibidwal na opsyon sa populasyon, na nagsasaad kung gaano karaming beses nangyayari ang opsyong ito sa serye ng variation.

Ang serye ng variation ay maaaring simple (frequencies = 1) o pinaikli ang pangkat, 3-5 na opsyon bawat isa. Ang isang simpleng serye ay ginagamit na may isang maliit na bilang ng mga obserbasyon (), nakapangkat - sa malalaking numero mga obserbasyon().

Serye ng pagkakaiba-iba: kahulugan, mga uri, pangunahing katangian. Paraan ng pagkalkula
fashion, median, arithmetic mean sa medikal at istatistikal na pag-aaral
(Ipakita sa isang kondisyonal na halimbawa).

Ang isang variational series ay isang serye ng mga numerical na halaga ng katangian na pinag-aaralan, na naiiba sa bawat isa sa kanilang magnitude at nakaayos sa isang tiyak na pagkakasunud-sunod (sa pataas o pababang pagkakasunud-sunod). Ang bawat numerical value ng serye ay tinatawag na variant (V), at ang mga numerong nagpapakita kung gaano kadalas nangyayari ito o ang variant na iyon sa komposisyon ang seryeng ito, ay tinatawag na frequency (p).

Ang kabuuang bilang ng mga kaso ng mga obserbasyon, kung saan binubuo ang serye ng variation, ay tinutukoy ng titik n. Ang pagkakaiba sa kahulugan ng mga pinag-aralan na katangian ay tinatawag na baryasyon. Kung ang variable sign ay walang quantitative measure, ang variation ay tinatawag na qualitative, at ang distribution series ay tinatawag na attributive (halimbawa, distribution ayon sa resulta ng sakit, health status, atbp.).

Kung ang isang variable na sign ay may quantitative expression, ang naturang variation ay tinatawag na quantitative, at ang distribution series ay tinatawag na variational.

Ang mga serye ng variational ay nahahati sa discontinuous at tuluy-tuloy - ayon sa likas na katangian ng quantitative trait, simple at weighted - ayon sa dalas ng paglitaw ng variant.

Sa isang simpleng variational series, ang bawat variant ay nangyayari nang isang beses lamang (p=1), sa isang weighted, ang parehong variant ay nangyayari nang ilang beses (p>1). Ang mga halimbawa ng naturang serye ay tatalakayin mamaya sa teksto. Kung ang quantitative attribute ay tuluy-tuloy, i.e. sa pagitan ng mga integer na halaga ay may mga intermediate na fractional na halaga, ang variational series ay tinatawag na tuloy-tuloy.

Halimbawa: 10.0 - 11.9

14.0 - 15.9, atbp.

Kung ang quantitative sign ay hindi nagpapatuloy, i.e. ang mga indibidwal na halaga nito (mga opsyon) ay naiiba sa bawat isa sa pamamagitan ng isang integer at walang mga intermediate fractional na halaga, ang serye ng variation ay tinatawag na discontinuous o discrete.

Gamit ang data mula sa nakaraang halimbawa tungkol sa rate ng puso

para sa 21 mag-aaral, bubuo kami ng serye ng variation (Talahanayan 1).

Talahanayan 1

Pamamahagi ng mga medikal na estudyante ayon sa pulso (bpm)

Kaya, upang makabuo ng isang variational series ay nangangahulugan ng pag-systematize, pag-streamline ng mga umiiral na numerical values ​​(mga opsyon), i.e. ayusin sa isang tiyak na pagkakasunud-sunod (sa pataas o pababang pagkakasunud-sunod) sa kanilang kaukulang mga frequency. Sa halimbawang isinasaalang-alang, ang mga opsyon ay inayos sa pataas na pagkakasunud-sunod at ipinahayag bilang mga discontinuous (discrete) integer, ang bawat opsyon ay nangyayari nang maraming beses, i.e. kami ay nakikitungo sa isang may timbang, hindi tuloy-tuloy o discrete variational series.

Bilang isang patakaran, kung ang bilang ng mga obserbasyon sa istatistikal na populasyon na aming pinag-aaralan ay hindi lalampas sa 30, kung gayon ito ay sapat na upang ayusin ang lahat ng mga halaga ng katangian sa ilalim ng pag-aaral sa isang variational na serye sa pagtaas ng pagkakasunud-sunod, tulad ng sa Talahanayan. 1, o sa pababang pagkakasunud-sunod.

Sa sa malaking bilang mga obserbasyon (n>30), ang bilang ng mga nagaganap na variant ay maaaring napakalaki, sa kasong ito ang isang interval o pinagsama-samang serye ng variational ay pinagsama-sama, kung saan, upang gawing simple ang kasunod na pagproseso at linawin ang likas na katangian ng pamamahagi, ang mga variant ay pinagsama sa mga grupo .

Karaniwan ang bilang ng mga opsyon ng grupo ay mula 8 hanggang 15.

Dapat mayroong hindi bababa sa 5 sa kanila, dahil. kung hindi, ito ay magiging masyadong magaspang, labis na pagpapalaki, na nakakasira malaking larawan pagkakaiba-iba at lubos na nakakaapekto sa katumpakan ng mga average na halaga. Kapag ang bilang ng mga pagpipilian sa pangkat ay higit sa 20-25, ang katumpakan ng pagkalkula ng mga average na halaga ay tataas, ngunit ang mga tampok ng pagkakaiba-iba ng katangian ay makabuluhang nabaluktot at ang pagproseso ng matematika ay nagiging mas kumplikado.

Kapag nag-compile ng isang pinagsama-samang serye, kinakailangang isaalang-alang

− dapat ilagay ang mga variant na grupo sa isang tiyak na pagkakasunud-sunod (pataas o pababa);

- ang mga pagitan sa mga variant na grupo ay dapat na pareho;

− ang mga halaga ng mga hangganan ng mga pagitan ay hindi dapat magkasabay, dahil hindi magiging malinaw kung aling mga grupo ang iuugnay ang mga indibidwal na opsyon;

- kinakailangang isaalang-alang ang mga katangian ng husay ng nakolektang materyal kapag nagtatakda ng mga limitasyon ng mga agwat (halimbawa, kapag pinag-aaralan ang bigat ng mga matatanda, ang isang pagitan ng 3-4 kg ay katanggap-tanggap, at para sa mga bata sa mga unang buwan ng buhay hindi ito dapat lumagpas sa 100 g.)

Bumuo tayo ng pinagsama-samang (interval) na serye na nagpapakita ng data sa rate ng pulso (bilang ng mga beats bawat minuto) para sa 55 mga medikal na estudyante bago ang pagsusulit: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Upang bumuo ng isang nakapangkat na serye, kailangan mo:

1. Tukuyin ang halaga ng pagitan;

2. Tukuyin ang gitna, simula at wakas ng mga pangkat ng variant ng serye ng variation.

● Ang halaga ng agwat (i) ay tinutukoy ng bilang ng mga inaasahang pangkat (r), ang bilang nito ay nakatakda depende sa bilang ng mga obserbasyon (n) ayon sa isang espesyal na talahanayan

Bilang ng mga pangkat depende sa bilang ng mga obserbasyon:

Sa aming kaso, para sa 55 mga mag-aaral, posible na bumuo ng mula 8 hanggang 10 mga grupo.

Ang halaga ng pagitan (i) ay tinutukoy ng sumusunod na formula -

i = Vmax-Vmin/r

Sa aming halimbawa, ang halaga ng pagitan ay 82-58/8= 3.

Kung ang halaga ng pagitan ay isang fractional na numero, ang resulta ay dapat na i-round up sa isang integer.

Mayroong ilang mga uri ng mga average:

ibig sabihin ng aritmetika,

● geometric na ibig sabihin,

ibig sabihin maharmonya,

root ibig sabihin ng square,

● katamtamang progresibo,

● panggitna

AT medikal na istatistika ang pinakakaraniwang ginagamit ay mga arithmetic average.

Ang arithmetic mean (M) ay isang pangkalahatang halaga na tumutukoy sa karaniwang halaga na katangian ng buong populasyon. Ang mga pangunahing pamamaraan para sa pagkalkula ng M ay: ang arithmetic mean method at ang paraan ng mga sandali (conditional deviations).

Ang arithmetic mean method ay ginagamit upang kalkulahin ang simpleng arithmetic mean at ang weighted arithmetic mean. Ang pagpili ng paraan para sa pagkalkula ng arithmetic mean value ay depende sa uri ng variation series. Sa kaso ng isang simpleng variational series, kung saan ang bawat variant ay nangyayari nang isang beses, ang simpleng arithmetic mean ay tinutukoy ng formula:

kung saan: М – arithmetic mean value;

Ang V ay ang halaga ng variable na tampok (mga opsyon);

Σ - nagpapahiwatig ng aksyon - pagbubuod;

n ay ang kabuuang bilang ng mga obserbasyon.

Ang isang halimbawa ng pagkalkula ng arithmetic mean ay simple. Respiratory rate (bilang ng mga paghinga bawat minuto) sa 9 na lalaki na may edad na 35: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Upang matukoy ang average na antas ng respiratory rate sa mga lalaking may edad na 35, kinakailangan:

1. Bumuo ng variational series, na inilalagay ang lahat ng opsyon sa pataas o pababang pagkakasunod-sunod. Nakakuha kami ng simpleng variational series, dahil isang beses lang nangyayari ang mga variant value.

M = ∑V/n = 171/9 = 19 na paghinga bawat minuto

Konklusyon. Ang rate ng paghinga sa mga lalaking may edad na 35 ay nasa average na 19 na paghinga bawat minuto.

Kung ang mga indibidwal na halaga ng isang variant ay paulit-ulit, hindi na kailangang isulat ang bawat variant sa isang linya; ito ay sapat na upang ilista ang mga laki ng variant na naganap (V) at sa tabi upang ipahiwatig ang bilang ng kanilang mga pag-uulit (p ). tulad ng isang variational series, kung saan ang mga opsyon ay, kumbaga, tinimbang ayon sa bilang ng mga frequency na naaayon sa kanila, ay tinatawag na weighted variational series, at ang kinakalkula na average na halaga ay ang arithmetic weighted average.

Ang arithmetic weighted average ay tinutukoy ng formula: M= ∑Vp/n

kung saan ang n ay ang bilang ng mga obserbasyon, katumbas ng kabuuan mga frequency - Σr.

Isang halimbawa ng pagkalkula ng arithmetic weighted average.

Ang tagal ng kapansanan (sa mga araw) sa 35 mga pasyente na may acute respiratory disease (ARI) na ginagamot ng isang lokal na doktor sa unang quarter ng kasalukuyang taon ay: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 araw.

Ang pamamaraan para sa pagtukoy ng average na tagal ng kapansanan sa mga pasyente na may talamak na impeksyon sa paghinga ay ang mga sumusunod:

1. Bumuo tayo ng isang weighted variational series, dahil Ang mga indibidwal na halaga ng variant ay paulit-ulit nang maraming beses. Upang gawin ito, maaari mong ayusin ang lahat ng mga pagpipilian sa pataas o pababang pagkakasunud-sunod sa kanilang mga kaukulang frequency.

Sa aming kaso, ang mga pagpipilian ay nasa pataas na pagkakasunud-sunod.

2. Kalkulahin ang arithmetic weighted average gamit ang formula: M = ∑Vp/n = 233/35 = 6.7 araw

Pamamahagi ng mga pasyente na may acute respiratory infection ayon sa tagal ng kapansanan:

Tagal ng kawalan ng kakayahan para sa trabaho (V) Bilang ng mga pasyente (p) vp
∑p = n = 35 ∑Vp = 233

Konklusyon. Ang tagal ng kapansanan sa mga pasyente na may acute respiratory disease ay may average na 6.7 araw.

Ang Mode (Mo) ay ang pinakakaraniwang variant sa serye ng variation. Para sa pamamahagi na ipinakita sa talahanayan, ang mode ay tumutugma sa variant na katumbas ng 10, ito ay nangyayari nang mas madalas kaysa sa iba - 6 na beses.

Pamamahagi ng mga pasyente ayon sa haba ng pananatili sa kama sa ospital (sa mga araw)

V
p

Minsan mahirap matukoy ang eksaktong halaga ng mode, dahil maaaring mayroong ilang mga obserbasyon sa data na pinag-aaralan na nangyayari "pinaka madalas".

Ang Median (Me) ay isang non-parametric indicator na naghahati sa serye ng variation sa dalawang pantay na kalahati: ang parehong bilang ng mga opsyon ay matatagpuan sa magkabilang panig ng median.

Halimbawa, para sa distribusyon na ipinapakita sa talahanayan, ang median ay 10 dahil sa magkabilang panig ng halagang ito ay matatagpuan sa ika-14 na opsyon, i.e. ang numero 10 ay sumasakop sa isang sentral na posisyon sa seryeng ito at ang median nito.

Dahil ang bilang ng mga obserbasyon sa halimbawang ito ay pantay (n=34), ang median ay maaaring matukoy tulad ng sumusunod:

Ako = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Nangangahulugan ito na ang gitna ng serye ay nahuhulog sa ikalabimpitong opsyon, na tumutugma sa median na 10. Para sa distribusyon na ipinakita sa talahanayan, ang arithmetic mean ay:

M = ∑Vp/n = 334/34 = 10.1

Kaya, para sa 34 na obserbasyon mula sa Talahanayan. 8, nakuha namin ang: Mo=10, Me=10, ang arithmetic mean (M) ay 10.1. Sa aming halimbawa, ang lahat ng tatlong mga tagapagpahiwatig ay naging pantay o malapit sa isa't isa, kahit na sila ay ganap na naiiba.

Ang arithmetic mean ay ang resultang kabuuan ng lahat ng mga impluwensya; lahat ng mga variant, nang walang pagbubukod, ay nakikibahagi sa pagbuo nito, kabilang ang mga extreme, kadalasang hindi tipikal para sa isang partikular na phenomenon o set.

Ang mode at median, sa kaibahan sa arithmetic mean, ay hindi nakasalalay sa halaga ng lahat ng mga indibidwal na halaga ng variable na katangian (ang mga halaga ng matinding variant at ang antas ng pagkakalat ng serye). Ang arithmetic mean ay nagpapakilala sa buong masa ng mga obserbasyon, ang mode at median ay nagpapakilala sa bulk

Serye ng pagkakaiba-iba - ito ay isang istatistikal na serye na nagpapakita ng distribusyon ng phenomenon na pinag-aaralan ayon sa halaga ng anumang quantitative trait. Halimbawa, ang mga pasyente ayon sa edad, tagal ng paggamot, mga bagong silang ayon sa timbang, atbp.

Pagpipilian - mga indibidwal na halaga ng katangian kung saan isinasagawa ang pagpapangkat (natukoy V ) .

Dalas- isang numerong nagsasaad kung gaano kadalas nangyayari ang isa o ibang variant (natukoy P ) . Ipinapakita ang kabuuan ng lahat ng frequency kabuuang bilang obserbasyon at ipinapahiwatig n . Ang pagkakaiba sa pagitan ng pinakamalaki at pinakamaliit na variant ng serye ng variation ay tinatawag saklaw o amplitude .

Makilala serye ng pagkakaiba-iba:

1. Discontinuous (discrete) at tuloy-tuloy.

Ang serye ay itinuturing na tuloy-tuloy kung ang pagpapangkat na katangian ay maaaring ipahayag sa mga fractional na halaga (timbang, taas, atbp.), hindi natuloy kung ang pagpapangkat na katangian ay ipinahayag lamang bilang isang integer (mga araw ng kapansanan, bilang ng mga tibok ng puso, atbp.).

2. Simple at may timbang.

Ang isang simpleng variational series ay isang serye kung saan ang quantitative value ng isang variable na attribute ay nangyayari nang isang beses. Sa isang weighted variational series, ang mga quantitative value ng isang iba't ibang katangian ay inuulit na may isang tiyak na dalas.

3. Pinagsama-sama (interval) at ungrouped.

Ang isang nakagrupong serye ay may mga opsyon na pinagsama sa mga pangkat na pinag-iisa ang mga ito sa laki sa loob ng isang partikular na agwat. Sa isang hindi nakagrupong serye, ang bawat indibidwal na variant ay tumutugma sa isang tiyak na dalas.

4. Kahit at kakaiba.

Sa kahit na variational series, ang kabuuan ng mga frequency o ang kabuuang bilang ng mga obserbasyon ay ipinahayag bilang even number, sa odd variational series, bilang isang odd na numero.

5. Symmetrical at asymmetrical.

Sa isang simetriko na variation series, lahat ng uri ng average ay nagtutugma o napakalapit (mode, median, arithmetic mean).

Depende sa likas na katangian ng mga phenomena na pinag-aaralan, sa mga partikular na gawain at layunin ng istatistikal na pag-aaral, pati na rin sa nilalaman ng pinagmumulan ng materyal, sa sanitary statistics ang mga sumusunod na uri ng average ay ginagamit:

mga katamtamang istruktura (mode, median);

ibig sabihin ng aritmetika;

average na maharmonya;

geometric na ibig sabihin;

katamtamang progresibo.

Fashion (M tungkol sa ) - ang halaga ng variable na katangian, na mas karaniwan sa pinag-aralan na populasyon, i.e. opsyon na tumutugma sa pinakamataas na dalas. Direkta itong matatagpuan sa pamamagitan ng istraktura ng serye ng variation, nang hindi gumagamit ng anumang mga kalkulasyon. Ito ay karaniwang isang halaga na napakalapit sa arithmetic mean at napakakombenyente sa pagsasanay.

Median (M e ) - paghahati ng serye ng variation (na-rank, ibig sabihin, ang mga halaga ng opsyon ay nakaayos sa pataas o pababang pagkakasunud-sunod) sa dalawang pantay na kalahati. Ang median ay kinakalkula gamit ang tinatawag na kakaibang serye, na nakukuha sa pamamagitan ng sunud-sunod na pagbubuod ng mga frequency. Kung ang kabuuan ng mga frequency ay tumutugma sa isang even na numero, kung gayon ang median ay kumbensyonal na kinukuha bilang arithmetic mean ng dalawang average na halaga.

Ang mode at median ay inilalapat sa kaso ng isang bukas na populasyon, i.e. kapag ang pinakamalaki o pinakamaliit na opsyon ay walang eksaktong quantitative na katangian (halimbawa, wala pang 15 taong gulang, 50 at mas matanda, atbp.). Sa kasong ito, hindi maaaring kalkulahin ang arithmetic mean (parametric na katangian).

Katamtaman ako aritmetika - ang pinakakaraniwang halaga. Ang ibig sabihin ng arithmetic ay karaniwang tinutukoy ng M.

Matukoy ang pagkakaiba sa pagitan ng simpleng arithmetic mean at weighted mean.

simpleng ibig sabihin ng aritmetika kinakalkula:

— sa mga pagkakataong ang kabuuan ay kinakatawan ng isang simpleng listahan ng kaalaman ng isang katangian para sa bawat yunit;

— kung hindi matukoy ang bilang ng mga pag-uulit ng bawat variant;

— kung ang mga bilang ng mga pag-uulit ng bawat variant ay malapit sa isa't isa.

Ang simpleng arithmetic mean ay kinakalkula ng formula:

kung saan ang V - mga indibidwal na halaga ng katangian; n ay ang bilang ng mga indibidwal na halaga;
- tanda ng pagbubuod.

Kaya, ang simpleng average ay ang ratio ng kabuuan ng variant sa bilang ng mga obserbasyon.

Halimbawa: tukuyin ang average na haba ng pananatili sa kama para sa 10 pasyente na may pulmonya:

16 araw - 1 pasyente; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

araw ng kama.

Arithmetic weighted average ay kinakalkula sa mga kaso kung saan ang mga indibidwal na halaga ng katangian ay paulit-ulit. Maaari itong kalkulahin sa dalawang paraan:

1. Direkta (arithmetic mean o direct method) ayon sa formula:

,

kung saan ang P ay ang dalas (bilang ng mga kaso) ng mga obserbasyon ng bawat opsyon.

Kaya, ang weighted arithmetic mean ay ang ratio ng kabuuan ng mga produkto ng variant sa pamamagitan ng dalas sa bilang ng mga obserbasyon.

2. Sa pamamagitan ng pagkalkula ng mga deviations mula sa conditional average (ayon sa paraan ng mga sandali).

Ang batayan para sa pagkalkula ng weighted arithmetic mean ay:

— nakapangkat na materyal ayon sa mga variant ng isang quantitative trait;

— lahat ng mga opsyon ay dapat ayusin sa pataas o pababang pagkakasunud-sunod ng value ng katangian (ranked series).

Upang makalkula sa pamamagitan ng paraan ng mga sandali, ang paunang kinakailangan ay ang parehong laki ng lahat ng mga agwat.

Ayon sa paraan ng mga sandali, ang arithmetic mean ay kinakalkula ng formula:

,

kung saan ang M o ang conditional average, na kadalasang kinukuha bilang value ng feature na tumutugma sa pinakamataas na frequency, i.e. na mas madalas na inuulit (Mode).

i - halaga ng pagitan.

a - conditional deviation mula sa mga kondisyon ng average, na isang sunud-sunod na serye ng mga numero (1, 2, atbp.) na may + sign para sa isang malaking conditional average na opsyon at may - (-1, -2, atbp.) mag-sign para sa isang opsyon, na mas mababa sa average. Ang conditional deviation mula sa variant na kinuha bilang conditional average ay 0.

P - mga frequency.

- kabuuang bilang ng mga obserbasyon o n.

Halimbawa: direktang tukuyin ang average na taas ng 8 taong gulang na batang lalaki (talahanayan 1).

Talahanayan 1

Taas sa cm

Boys P

Sentral

opsyon V

Ang gitnang variant, ang gitna ng agwat, ay tinukoy bilang ang semi-sum ng mga paunang halaga ng dalawang katabing grupo:

;
atbp.

Nakukuha ang produkto ng VP sa pamamagitan ng pagpaparami ng mga sentral na variant sa mga frequency
;
atbp. Pagkatapos ang mga resultang produkto ay idinagdag at makuha
, na hinahati sa bilang ng mga obserbasyon (100) at nakuha ang weighted arithmetic mean.

cm.

Malulutas namin ang parehong problema gamit ang paraan ng mga sandali, kung saan ang sumusunod na talahanayan 2 ay pinagsama-sama:

Talahanayan 2

Taas sa cm (V)

Boys P

n=100

Kinukuha namin ang 122 bilang M o, dahil sa 100 obserbasyon, 33 katao ang may taas na 122 cm. Nahanap namin ang mga conditional deviations (a) mula sa conditional average alinsunod sa itaas. Pagkatapos ay nakuha namin ang produkto ng mga conditional deviations sa pamamagitan ng mga frequency (aP) at ibubuod ang nakuha na mga halaga (
). Ang resulta ay magiging 17. Sa wakas, pinapalitan namin ang data sa formula:

Kapag nag-aaral ng isang variable na katangian, ang isa ay hindi dapat limitado lamang sa pagkalkula ng mga average na halaga. Kinakailangan din na kalkulahin ang mga tagapagpahiwatig na nagpapakilala sa antas ng pagkakaiba-iba ng mga pinag-aralan na tampok. Ang halaga ng isa o ibang quantitative attribute ay hindi pareho para sa lahat ng unit ng istatistikal na populasyon.

Ang katangian ng serye ng pagkakaiba-iba ay ang average karaniwang lihis (), na nagpapakita ng scatter (scattering) ng mga pinag-aralan na feature na may kaugnayan sa arithmetic mean, i.e. nailalarawan ang pagbabagu-bago ng serye ng variation. Maaari itong matukoy nang direkta sa pamamagitan ng formula:

Ang standard deviation ay katumbas ng square root ng kabuuan ng mga produkto ng squared deviations ng bawat opsyon mula sa arithmetic mean (V–M) 2 sa mga frequency nito na hinati sa kabuuan ng mga frequency (
).

Halimbawa ng pagkalkula: tukuyin ang average na bilang ng mga dahong may sakit na inilabas sa klinika bawat araw (talahanayan 3).

Talahanayan 3

Bilang ng mga araw ng sakit

mga sheet na ibinigay

doktor bawat araw (V)

Bilang ng mga doktor (P)

;

Sa denominator, kapag ang bilang ng mga obserbasyon ay mas mababa sa 30, ito ay kinakailangan mula sa
kumuha ng unit.

Kung ang serye ay pinagsama-sama sa pantay na agwat, ang karaniwang paglihis ay maaaring matukoy sa pamamagitan ng paraan ng mga sandali:

,

kung saan ang i ay ang halaga ng pagitan;

- conditional deviation mula sa conditional average;

P - variant ng dalas ng kaukulang mga agwat;

ay ang kabuuang bilang ng mga obserbasyon.

Halimbawa ng pagkalkula : Tukuyin ang average na tagal ng pananatili ng mga pasyente sa isang therapeutic bed (ayon sa paraan ng mga sandali) (talahanayan 4):

Talahanayan 4

Bilang ng mga araw

pananatili sa kama (V)

may sakit (P)

;

Natuklasan ng Belgian statistician na si A. Quetelet na ang mga variation ng mass phenomena ay sumusunod sa error distribution law, na natuklasan halos sabay-sabay ni K. Gauss at P. Laplace. Ang kurba na kumakatawan sa distribusyon na ito ay may hugis ng isang kampana. Ayon sa normal na batas sa pamamahagi, ang pagkakaiba-iba ng mga indibidwal na halaga ng katangian ay nasa loob
, na sumasaklaw sa 99.73% ng lahat ng unit sa populasyon.

Kinakalkula na kung idaragdag at ibawas mo ang 2 sa arithmetic mean , pagkatapos ay 95.45% ng lahat ng miyembro ng serye ng variation ay nasa loob ng mga nakuhang halaga, at, sa wakas, kung idaragdag at ibawas natin ang 1 sa arithmetic mean , pagkatapos ay 68.27% ng lahat ng miyembro ng variational series na ito ay nasa loob ng mga nakuhang halaga. Sa gamot na may magnitude
1nauugnay sa konsepto ng pamantayan. Ang deviation mula sa arithmetic mean ay mas malaki sa 1 , ngunit mas mababa sa 2 ay subnormal at ang deviation ay mas malaki sa 2 abnormal (sa itaas o mas mababa sa normal).

Sa sanitary statistics, ang tatlong-sigma na panuntunan ay ginagamit sa pag-aaral ng pisikal na pag-unlad, pagtatasa ng mga aktibidad ng mga institusyon ng pangangalagang pangkalusugan, at pagtatasa ng pampublikong kalusugan. Ang parehong panuntunan ay malawakang inilalapat sa Pambansang ekonomiya sa pagtatakda ng mga pamantayan.

Kaya, ang karaniwang paglihis ay nagsisilbi sa:

— mga sukat ng dispersion ng isang variational series;

— mga katangian ng antas ng pagkakaiba-iba ng mga katangian, na tinutukoy ng koepisyent ng pagkakaiba-iba:

Kung ang koepisyent ng pagkakaiba-iba ay higit sa 20% - malakas na pagkakaiba-iba, mula 20 hanggang 10% - katamtaman, mas mababa sa 10% - mahinang pagkakaiba-iba ng mga character. Ang koepisyent ng pagkakaiba-iba ay, sa isang tiyak na lawak, isang pamantayan para sa pagiging maaasahan ng arithmetic mean.

Tawagan natin ang iba't ibang sample value mga pagpipilian isang serye ng mga halaga at nagsasaad: X 1 , X 2, …. Una sa lahat, gumawa tayo sumasaklaw mga pagpipilian, i.e. ayusin ang mga ito sa pataas o pababang pagkakasunud-sunod. Para sa bawat pagpipilian, ang sariling timbang ay ipinahiwatig, i.e. isang numero na nagpapakilala sa kontribusyon ng opsyong ito sa kabuuang populasyon. Ang mga frequency o frequency ay nagsisilbing mga timbang.

Dalas n i opsyon x i tinatawag na numero na nagpapakita kung gaano karaming beses nangyayari ang opsyong ito sa itinuturing na sample na populasyon.

Dalas o relatibong dalas w i opsyon x i tinatawag ang isang numero na katumbas ng ratio ng frequency ng isang variant sa kabuuan ng mga frequency ng lahat ng variant. Ipinapakita ng dalas kung anong bahagi ng mga unit ng sample na populasyon ang may ibinigay na variant.

Ang pagkakasunud-sunod ng mga opsyon na may katumbas na mga timbang (mga frequency o frequency), na nakasulat sa pataas (o pababang) na pagkakasunud-sunod, ay tinatawag na pagkakaiba-iba serye.

Ang variational series ay discrete at interval.

Para sa isang discrete variational series, ang mga point value ng attribute ay tinukoy, para sa interval series, ang attribute values ​​ay tinukoy sa anyo ng mga interval. Maaaring ipakita ng serye ng variation ang distribusyon ng mga frequency o mga kamag-anak na frequency (mga frequency), depende sa kung anong halaga ang ipinahiwatig para sa bawat opsyon - dalas o dalas.

Discrete variation series ng frequency distribution mukhang:

Ang mga frequency ay matatagpuan sa pamamagitan ng formula , i = 1, 2, …, m.

w 1 +w 2 + … + w m = 1.

Halimbawa 4.1. Para sa isang naibigay na hanay ng mga numero

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

bumuo ng discrete variational series ng frequency at frequency distribution.

Solusyon . Ang dami ng populasyon ay n= 10. Ang discrete frequency distribution series ay may anyo

Ang serye ng pagitan ay may katulad na anyo ng pag-record.

Interval variation series ng frequency distribution ay nakasulat bilang:

Ang kabuuan ng lahat ng mga frequency ay kabuuang bilang mga obserbasyon, i.e. kabuuang volume: n = n 1 +n 2 + … + n m .

Interval variation series ng distribution ng relative frequency (frequencies) mukhang:

Ang dalas ay matatagpuan sa pamamagitan ng formula , i = 1, 2, …, m.

Ang kabuuan ng lahat ng mga frequency ay katumbas ng isa: w 1 +w 2 + … + w m = 1.

Kadalasan sa pagsasanay, ginagamit ang mga serye ng pagitan. Kung mayroong maraming data ng sample na istatistika at ang kanilang mga halaga ay naiiba sa bawat isa sa pamamagitan ng isang maliit na halaga, kung gayon discrete na serye dahil ang mga datos na ito ay magiging mahirap at hindi maginhawa para sa karagdagang pananaliksik. Sa kasong ito, ginagamit ang pagpapangkat ng data, i.e. ang agwat na naglalaman ng lahat ng mga halaga ng katangian ay nahahati sa ilang mga bahagyang agwat at, nang makalkula ang dalas para sa bawat agwat, ang isang serye ng agwat ay nakuha. Isulat natin nang mas detalyado ang pamamaraan para sa pagbuo ng isang serye ng agwat, sa pag-aakalang ang mga haba ng mga bahagyang agwat ay magiging pareho.

2.2 Pagbuo ng isang serye ng pagitan

Upang bumuo ng isang serye ng pagitan, kailangan mo:

Tukuyin ang bilang ng mga pagitan;

Tukuyin ang haba ng mga pagitan;

Tukuyin ang lokasyon ng mga pagitan sa axis.

Para sa pagtukoy bilang ng mga pagitan k Mayroong formula ng Sturges, ayon sa kung saan

,

saan n- ang dami ng kabuuan.

Halimbawa, kung mayroong 100 mga halaga ng katangian (variant), pagkatapos ay inirerekomenda na kunin ang bilang ng mga agwat na katumbas ng mga agwat upang makabuo ng isang serye ng agwat.

Gayunpaman, kadalasan sa pagsasanay ang bilang ng mga agwat ay pinili ng mananaliksik mismo, isinasaalang-alang na ang bilang na ito ay hindi dapat masyadong malaki, upang ang serye ay hindi masalimuot, ngunit hindi rin masyadong maliit, upang hindi mawala ang ilang mga katangian ng pamamahagi.

Haba ng agwat h ay tinutukoy ng sumusunod na formula:

,

saan x max at x min ang pinakamalaki at pinakamarami maliit na halaga mga pagpipilian.

ang halaga tinawag sa malaking sukat hilera.

Upang mabuo ang mga agwat sa kanilang sarili, nagpapatuloy sila sa iba't ibang paraan. Isa sa pinaka mga simpleng paraan ay ang mga sumusunod. Ang halaga ay kinuha bilang simula ng unang agwat
. Pagkatapos ang natitirang bahagi ng mga hangganan ng mga pagitan ay matatagpuan sa pamamagitan ng formula. Malinaw, ang pagtatapos ng huling pagitan a Dapat matugunan ng m+1 ang kundisyon

Matapos matagpuan ang lahat ng mga hangganan ng mga agwat, ang mga frequency (o mga frequency) ng mga agwat na ito ay tinutukoy. Upang malutas ang problemang ito, tinitingnan nila ang lahat ng mga opsyon at tinutukoy ang bilang ng mga opsyon na nahuhulog sa isang partikular na agwat. Isasaalang-alang namin ang kumpletong pagbuo ng isang serye ng pagitan gamit ang isang halimbawa.

Halimbawa 4.2. Para sa mga sumusunod na istatistika, na nakasulat sa pataas na pagkakasunud-sunod, bumuo ng isang serye ng pagitan na may bilang ng mga pagitan na katumbas ng 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Solusyon. Kabuuan n=50 variant value.

Ang bilang ng mga agwat ay tinukoy sa kondisyon ng problema, i.e. k=5.

Ang haba ng mga pagitan ay
.

Tukuyin natin ang mga hangganan ng mga pagitan:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

Upang matukoy ang dalas ng mga agwat, binibilang namin ang bilang ng mga opsyon na nahuhulog sa agwat na ito. Halimbawa, ang mga opsyon 11, 12, 12, 14, 14, 15 ay nahuhulog sa unang pagitan mula 2.5 hanggang 19.5. Ang kanilang numero ay 6, samakatuwid, ang dalas ng unang pagitan ay n 1=6. Ang dalas ng unang pagitan ay . Ang mga variant 21, 21, 22, 23, 25, ang bilang nito ay 5, ay nahuhulog sa pangalawang pagitan mula 19.5 hanggang 36.5. Samakatuwid, ang dalas ng pangalawang pagitan ay n 2 =5, at ang dalas . Sa pagkakaroon ng magkatulad na natagpuang mga frequency at frequency para sa lahat ng mga agwat, nakuha namin ang sumusunod na serye ng agwat.

Ang serye ng pagitan ng pamamahagi ng dalas ay may anyo:

Ang kabuuan ng mga frequency ay 6+5+9+11+8+11=50.

Ang serye ng pagitan ng pamamahagi ng dalas ay may anyo:

Ang kabuuan ng mga frequency ay 0.12+0.1+0.18+0.22+0.16+0.22=1. ■

Kapag nagtatayo ng mga serye ng agwat, depende sa mga tiyak na kondisyon ng problema na isinasaalang-alang, ang iba pang mga patakaran ay maaaring mailapat, lalo

1. Ang mga serye ng pagkakaiba-iba ng pagitan ay maaaring binubuo ng mga bahagyang pagitan ng iba't ibang haba. Ang hindi pantay na haba ng mga agwat ay ginagawang posible na iisa ang mga katangian ng isang istatistikal na populasyon na may hindi pantay na distribusyon ng isang tampok. Halimbawa, kung ang mga hangganan ng mga agwat ay tumutukoy sa bilang ng mga naninirahan sa mga lungsod, pagkatapos ay ipinapayong sa problemang ito na gumamit ng mga agwat na hindi pantay sa haba. Malinaw, para sa maliliit na bayan, ang isang maliit na pagkakaiba sa bilang ng mga naninirahan ay mahalaga din, at para sa malalaking lungsod, ang pagkakaiba ng sampu at daan-daang mga naninirahan ay hindi makabuluhan. serye ng pagitan na may hindi pantay na haba ng mga bahagyang agwat ay pinag-aaralan pangunahin sa pangkalahatang teorya ng mga istatistika at ang kanilang pagsasaalang-alang ay lampas sa saklaw ng manwal na ito.

2. Sa mga istatistika ng matematika minsan ay isinasaalang-alang ang mga serye ng pagitan, kung saan ang kaliwang hangganan ng unang pagitan ay ipinapalagay na katumbas ng –∞, at ang kanang hangganan ng huling pagitan ay +∞. Ginagawa ito upang mailapit ang distribusyon ng istatistika sa teoretikal.

3. Kapag gumagawa ng mga serye ng pagitan, maaaring lumabas na ang halaga ng ilang variant ay eksaktong tumutugma sa hangganan ng pagitan. Ang pinakamagandang gawin sa kasong ito ay ang mga sumusunod. Kung mayroon lamang isang ganoong pagkakataon, pagkatapos ay isaalang-alang na ang variant na isinasaalang-alang kasama ang dalas nito ay nahulog sa pagitan na matatagpuan mas malapit sa gitna ng serye ng agwat, kung mayroong ilang mga ganoong variant, kung gayon ang lahat ng mga ito ay itinalaga sa mga agwat sa ang kanan ng variant na ito, o lahat sa kaliwa.

4. Matapos matukoy ang bilang ng mga pagitan at ang kanilang haba, ang lokasyon ng mga pagitan ay maaaring gawin sa ibang paraan. Hanapin ang arithmetic mean ng lahat ng isinasaalang-alang na halaga ng mga opsyon X cf. at buuin ang unang agwat sa paraang ang ibig sabihin ng sample na ito ay nasa loob ng ilang agwat. Kaya, nakukuha namin ang pagitan mula sa X cf. – 0.5 h dati X avg. + 0.5 h. Pagkatapos ay kaliwa at kanan, pagdaragdag ng haba ng agwat, itinatayo namin ang natitirang mga agwat hanggang x min at x ang max ay hindi mahuhulog sa una at huling mga pagitan, ayon sa pagkakabanggit.

5. Ang mga serye ng pagitan na may malaking bilang ng mga pagitan ay maginhawang nakasulat nang patayo, i.e. magtala ng mga pagitan hindi sa unang linya, ngunit sa unang hanay, at mga frequency (o frequency) sa pangalawang hanay.

Ang sample na data ay maaaring ituring bilang mga halaga ng ilang random na variable X. Ang isang random na variable ay may sariling batas sa pamamahagi. Ito ay kilala mula sa probability theory na ang batas ng pamamahagi ng isang discrete random variable ay maaaring tukuyin bilang isang serye ng pamamahagi, at para sa isang tuluy-tuloy, gamit ang distribution density function. Gayunpaman, mayroong isang unibersal na batas sa pamamahagi na humahawak para sa parehong discrete at tuloy-tuloy mga random na variable. Ang batas sa pamamahagi na ito ay ibinigay bilang isang function ng pamamahagi F(x) = P(X<x). Para sa sample na data, maaari mong tukuyin ang isang analogue ng distribution function - ang empirical distribution function.


Katulad na impormasyon.


Ang mga ito ay ipinakita sa anyo ng serye ng pamamahagi at naka-format bilang .

Ang isang serye ng pamamahagi ay isang uri ng pagpapangkat.

Saklaw ng pamamahagi- kumakatawan sa isang maayos na pamamahagi ng mga yunit ng pinag-aralan na populasyon sa mga pangkat ayon sa isang tiyak na iba't ibang katangian.

Depende sa katangiang pinagbabatayan ng pagbuo ng isang serye ng pamamahagi, mayroong katangian at pagkakaiba-iba mga ranggo ng pamamahagi:

  • katangian- tawagan ang serye ng pamamahagi na binuo sa mga batayan ng husay.
  • Ang mga serye ng pamamahagi na binuo sa pataas o pababang pagkakasunud-sunod ng mga halaga ng isang quantitative na katangian ay tinatawag pagkakaiba-iba.
Ang variation series ng distribution ay binubuo ng dalawang column:

Ang unang column ay naglalaman ng mga quantitative value ng variable na katangian, na tinatawag mga pagpipilian at minarkahan. Discrete variant - ipinahayag bilang integer. Ang opsyon sa pagitan ay nasa hanay mula at hanggang. Depende sa uri ng mga variant, posibleng bumuo ng discrete o interval variational series.
Ang ikalawang hanay ay naglalaman ng bilang ng tiyak na opsyon, na ipinahayag sa mga tuntunin ng mga frequency o frequency:

Mga frequency- ito ay mga ganap na numero na nagpapakita kung gaano karaming beses sa pinagsama-samang nangyayari ang ibinigay na halaga ng tampok, na nagsasaad ng . Ang kabuuan ng lahat ng mga frequency ay dapat na katumbas ng bilang ng mga yunit ng buong populasyon.

Mga frequency() ay ang mga frequency na ipinahayag bilang isang porsyento ng kabuuan. Ang kabuuan ng lahat ng mga frequency na ipinahayag bilang isang porsyento ay dapat na katumbas ng 100% sa mga fraction ng isa.

Graphical na representasyon ng serye ng pamamahagi

Ang serye ng pamamahagi ay nakikita gamit ang mga graphic na larawan.

Ang serye ng pamamahagi ay ipinapakita bilang:
  • Polygon
  • Mga histogram
  • Nag-iipon
  • ogives

Polygon

Kapag gumagawa ng isang polygon, sa pahalang na axis (abscissa) ang mga halaga ng variable na katangian ay naka-plot, at sa vertical axis (ordinate) - mga frequency o frequency.

Ang polygon sa fig. 6.1 ay itinayo ayon sa micro-census ng populasyon ng Russia noong 1994.

6.1. Pamamahagi ng mga kabahayan ayon sa laki

Kundisyon: Ang data ay ibinigay sa pamamahagi ng 25 empleyado ng isa sa mga negosyo ayon sa mga kategorya ng taripa:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Isang gawain: Bumuo ng discrete variational series at ilarawan ito nang grapiko bilang distribution polygon.
Solusyon:
Sa halimbawang ito, ang mga opsyon ay ang kategorya ng sahod ng manggagawa. Upang matukoy ang mga frequency, kinakailangan upang kalkulahin ang bilang ng mga empleyado na may naaangkop na kategorya ng sahod.

Ginagamit ang polygon para sa discrete variation series.

Upang makabuo ng polygon ng pamamahagi (Larawan 1), kasama ang abscissa (X), inilalagay namin ang dami ng mga halaga ng iba't ibang katangian - mga variant, at kasama ang ordinate - mga frequency o frequency.

Kung ang mga katangiang halaga ay ipinahayag bilang mga agwat, kung gayon ang naturang serye ay tinatawag na isang serye ng agwat.
serye ng pagitan ang mga distribusyon ay ipinapakita nang grapiko bilang isang histogram, cumulate o ogive.

Talahanayan ng istatistika

Kundisyon: Data sa laki ng mga deposito ng 20 indibidwal sa isang bangko (libong rubles) 60; 25; 12; sampu; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; labing-walo; 7; 42.
Isang gawain: Bumuo ng serye ng pagkakaiba-iba ng pagitan na may pantay na pagitan.
Solusyon:

  1. Ang paunang populasyon ay binubuo ng 20 yunit (N = 20).
  2. Gamit ang formula ng Sturgess, tinutukoy namin ang kinakailangang bilang ng mga pangkat na ginamit: n=1+3.322*lg20=5
  3. Kalkulahin natin ang halaga ng pantay na pagitan: i=(152 - 2) /5 = 30 thousand rubles
  4. Hinahati namin ang paunang populasyon sa 5 grupo na may pagitan ng 30 libong rubles.
  5. Ang mga resulta ng pagpapangkat ay ipinakita sa talahanayan:

Sa ganoong pag-record ng tuluy-tuloy na feature, kapag ang parehong halaga ay nangyari nang dalawang beses (bilang ang itaas na limitasyon ng isang agwat at ang mas mababang limitasyon ng isa pang agwat), ang halagang ito ay nabibilang sa pangkat kung saan ang halagang ito ay nagsisilbing pinakamataas na limitasyon.

bar chart

Upang makabuo ng isang histogram sa kahabaan ng abscissa, ipahiwatig ang mga halaga ng mga hangganan ng mga agwat at, sa kanilang batayan, bumuo ng mga parihaba na ang taas ay proporsyonal sa mga frequency (o mga frequency).

Sa fig. 6.2. ipinapakita ang histogram ng pamamahagi ng populasyon ng Russia noong 1997 ayon sa mga pangkat ng edad.

kanin. 6.2. Pamamahagi ng populasyon ng Russia ayon sa mga pangkat ng edad

Kundisyon: Ibinibigay ang pamamahagi ng 30 empleyado ng kumpanya ayon sa laki ng buwanang suweldo

Isang gawain: Ipakita ang graphic na serye ng pagkakaiba-iba ng agwat bilang isang histogram at i-cumulate.
Solusyon:

  1. Ang hindi kilalang hangganan ng bukas (unang) agwat ay tinutukoy ng halaga ng pangalawang agwat: 7000 - 5000 = 2000 rubles. Sa parehong halaga, nakita namin ang mas mababang limitasyon ng unang agwat: 5000 - 2000 = 3000 rubles.
  2. Upang makabuo ng histogram sa isang hugis-parihaba na sistema ng coordinate, kasama ang abscissa axis, nagtabi kami ng mga segment na ang mga halaga ay tumutugma sa mga pagitan ng variant row.
    Ang mga segment na ito ay nagsisilbing mas mababang base, at ang kaukulang dalas (frequency) ay nagsisilbing taas ng mga parihaba na nabuo.
  3. Bumuo tayo ng histogram:

Upang mabuo ang pinagsama-samang, kinakailangan upang kalkulahin ang naipon na mga frequency (mga frequency). Natutukoy ang mga ito sa pamamagitan ng sunud-sunod na pagsusuma ng mga frequency (frequencies) ng mga naunang agwat at tinutukoy ng S. Ang mga naipon na frequency ay nagpapakita kung gaano karaming mga yunit ng populasyon ang may tampok na halaga na hindi hihigit sa isa na isinasaalang-alang.

Magsama-sama

Ang distribusyon ng isang katangian sa isang variational series ayon sa mga naipon na frequency (frequencies) ay inilalarawan gamit ang cumulate.

Magsama-sama o ang pinagsama-samang kurba, sa kaibahan sa polygon, ay binuo sa mga naipon na frequency o frequency. Kasabay nito, ang mga halaga ng tampok ay inilalagay sa abscissa axis, at ang mga naipon na frequency o frequency ay inilalagay sa ordinate axis (Fig. 6.3).

kanin. 6.3. Pinagsama-samang pamamahagi ng mga kabahayan ayon sa laki

4. Kalkulahin ang mga naipon na frequency:
Ang dalas ng tuhod ng unang pagitan ay kinakalkula tulad ng sumusunod: 0 + 4 = 4, para sa pangalawa: 4 + 12 = 16; para sa pangatlo: 4 + 12 + 8 = 24, atbp.

Kapag binubuo ang cumulate, ang naipon na dalas (dalas) ng kaukulang agwat ay itinalaga sa itaas na hangganan nito:

Ogiva

Ogiva ay itinayo nang katulad ng pinagsama-samang may pagkakaiba lamang na ang mga naipon na frequency ay inilalagay sa abscissa axis, at ang mga halaga ng tampok ay inilalagay sa ordinate axis.

Ang isang variation ng cumulate ay ang concentration curve o Lorenz plot. Upang i-plot ang curve ng konsentrasyon, ang parehong mga axes ng rectangular coordinate system ay ini-scale bilang isang porsyento mula 0 hanggang 100. Sa kasong ito, ang mga abscissa axes ay nagpapahiwatig ng mga naipon na frequency, at ang mga ordinate axes ay nagpapakita ng mga naipon na halaga ng bahagi (sa porsyento) sa dami ng tampok.

Ang pare-parehong pamamahagi ng tanda ay tumutugma sa dayagonal ng parisukat sa graph (Larawan 6.4). Sa hindi pantay na distribusyon, ang graph ay isang malukong kurba depende sa antas ng konsentrasyon ng katangian.

6.4. kurba ng konsentrasyon