Bumuo ng isang serye ng pagitan ng 5 pagitan. Pagbuo ng isang serye ng pagkakaiba-iba ng pagitan para sa tuluy-tuloy na dami ng data

pagpapangkat- ito ay ang paghahati ng populasyon sa mga pangkat na homogenous sa ilang paraan.

Pagtatalaga ng serbisyo. Gamit ang online na calculator maaari kang:

  • bumuo ng serye ng variation, bumuo ng histogram at polygon;
  • maghanap ng mga indicator ng variation (mean, mode (kabilang ang graphically), median, range of variation, quartiles, deciles, quartile coefficient of differentiation, coefficient of variation at iba pang indicator);

Pagtuturo. Upang mapangkat ang isang serye, dapat mong piliin ang uri ng resulta serye ng pagkakaiba-iba(discrete o interval) at tukuyin ang dami ng data (bilang ng mga row). Ang resultang solusyon ay nai-save sa isang Word file (tingnan ang halimbawa ng pagpapangkat ng istatistikal na data).

Bilang ng data ng pag-input
",0);">

Kung nagawa na ang pagpapangkat at ang discrete variation series o serye ng pagitan , pagkatapos ay kailangan mong gamitin ang online na calculator Variation indicator. Pagsubok sa hypothesis tungkol sa uri ng pamamahagi ginawa gamit ang serbisyo Pag-aaral ng anyo ng pamamahagi.

Mga uri ng istatistikal na pagpapangkat

Serye ng pagkakaiba-iba. Sa kaso ng mga obserbasyon ng isang discrete random variable ang parehong halaga ay matatagpuan nang higit sa isang beses. Ang ganitong mga halaga ng isang random na variable x i ay naitala na nagpapahiwatig n i ang bilang ng beses na ito ay lumilitaw sa n obserbasyon, ito ang dalas ng halagang ito.
Sa kaso ng isang tuluy-tuloy na random na variable, ang pagpapangkat ay ginagamit sa pagsasanay.
  1. Typological grouping- ito ang paghahati ng pinag-aralan na qualitatively heterogenous na populasyon sa mga klase, socio-economic na uri, homogenous na grupo ng mga yunit. Upang buuin ang pagpapangkat na ito, gamitin ang parameter ng Discrete variational series.
  2. Structural grouping ang tawag, kung saan ang isang homogenous na populasyon ay nahahati sa mga pangkat na nagpapakilala sa istraktura nito ayon sa ilang magkakaibang katangian. Upang buuin ang pagpapangkat na ito, gamitin ang parameter ng Interval series.
  3. Ang isang pagpapangkat na nagpapakita ng kaugnayan sa pagitan ng mga pinag-aralan na phenomena at ang kanilang mga tampok ay tinatawag pangkat ng pagsusuri(tingnan ang analytical grouping ng mga serye).

Mga prinsipyo ng pagbuo ng mga istatistikal na pagpapangkat

Ang isang serye ng mga obserbasyon na inayos sa pataas na pagkakasunud-sunod ay tinatawag pagkakaiba-iba serye . tanda ng pagpapangkat ay ang palatandaan kung saan ang populasyon ay nahahati sa magkakahiwalay na grupo. Ito ay tinatawag na base ng grupo. Ang pagpapangkat ay maaaring batay sa parehong quantitative at qualitative na mga katangian.
Matapos matukoy ang batayan ng pagpapangkat, ang tanong ng bilang ng mga pangkat kung saan dapat hatiin ang populasyon ng pag-aaral ay dapat na mapagpasyahan.

Kapag gumagamit ng mga personal na computer para sa pagproseso ng data ng istatistika, ang pagpapangkat ng mga yunit ng isang bagay ay isinasagawa gamit ang mga karaniwang pamamaraan.
Ang isang naturang pamamaraan ay batay sa paggamit ng Sturgess formula upang matukoy ang pinakamainam na bilang ng mga grupo:

k = 1+3.322*lg(N)

Kung saan ang k ay ang bilang ng mga pangkat, ang N ay ang bilang ng mga yunit ng populasyon.

Ang haba ng mga bahagyang pagitan ay kinakalkula bilang h=(x max -x min)/k

Pagkatapos ay bilangin ang bilang ng mga hit ng mga obserbasyon sa mga pagitan na ito, na kinukuha bilang mga frequency n i . Ilang mga frequency, ang mga halaga ay mas mababa sa 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Ang mga midpoint ng mga pagitan x i =(c i-1 +c i)/2 ay kinuha bilang mga bagong halaga.

Ipadala ang iyong mabuting gawa sa base ng kaalaman ay simple. Gamitin ang form sa ibaba

Magaling sa site">

Ang mga mag-aaral, nagtapos na mga estudyante, mga batang siyentipiko na gumagamit ng base ng kaalaman sa kanilang pag-aaral at trabaho ay lubos na magpapasalamat sa iyo.

Nai-post sa http://www.allbest.ru/

ISANG GAWAIN1

Ang sumusunod na impormasyon ay makukuha tungkol sa sahod mga empleyado sa negosyo:

Talahanayan 1.1

Ang halaga ng sahod sa conv. den. mga yunit

Kinakailangang bumuo ng isang serye ng pagitan ng pamamahagi kung saan mahahanap;

1) karaniwang suweldo;

2) average na linear deviation;

4) karaniwang paglihis;

5) saklaw ng pagkakaiba-iba;

6) koepisyent ng oscillation;

7) linear coefficient mga pagkakaiba-iba;

8) simpleng koepisyent ng pagkakaiba-iba;

10) panggitna;

11) koepisyent ng kawalaan ng simetrya;

12) Pearson asymmetry index;

13) koepisyent ng kurtosis.

Solusyon

Tulad ng alam mo, ang mga pagpipilian (nakilala ang mga halaga) ay nakaayos sa pataas na pagkakasunud-sunod upang mabuo discrete variation series. Sa malalaking numero variant (higit sa 10), kahit na sa kaso ng discrete variation, ang mga serye ng interval ay binuo.

Kung ang isang serye ng agwat ay pinagsama-sama na may mga pantay na agwat, kung gayon ang hanay ng variation ay hinati sa tinukoy na bilang ng mga agwat. Sa kasong ito, kung ang nakuha na halaga ay integer at hindi malabo (na bihira), kung gayon ang haba ng agwat ay kinuha katumbas ng numerong ito. Sa ibang mga kaso ginawa pagbilog kinakailangan sa gilid pagpapalaki, Kaya sa ang huling natitirang digit ay pantay. Malinaw, na may pagtaas sa haba ng agwat, ang hanay ng pagkakaiba-iba sa pamamagitan ng isang halaga na katumbas ng produkto ng bilang ng mga pagitan: sa pamamagitan ng pagkakaiba sa pagitan ng kinakalkula at paunang haba ng pagitan

a) Kung ang halaga ng pagpapalawak ng hanay ng variation ay hindi gaanong mahalaga, ito ay maaaring idagdag sa pinakamalaki o ibawas mula sa pinakamaliit na halaga ng katangian;

b) Kung ang magnitude ng pagpapalawak ng hanay ng pagkakaiba-iba ay nadarama, kung gayon upang maiwasan ang paghahalo sa gitna ng hanay, ito ay halos nahahati sa kalahati, sabay-sabay na idinagdag sa pinakamalaki at pagbabawas mula sa pinakamaliit na halaga ng katangian.

Kung ang isang serye ng agwat ay pinagsama-sama na may hindi pantay na mga agwat, kung gayon ang proseso ay pinasimple, ngunit tulad ng dati, ang haba ng mga agwat ay dapat na ipahayag bilang isang numero na may huling kahit na digit, na lubos na nagpapadali sa kasunod na mga kalkulasyon. mga katangiang numero.

30 - laki ng sample.

Bumuo tayo ng isang serye ng pamamahagi ng pagitan gamit ang formula ng Sturges:

K \u003d 1 + 3.32 * lg n,

K - bilang ng mga pangkat;

K \u003d 1 + 3.32 * lg 30 \u003d 5.91 \u003d 6

Nakita namin ang hanay ng sign - ang sahod ng mga empleyado sa enterprise - (x) ayon sa formula

R \u003d xmax - xmin at hatiin ng 6; R=195-112=83

Pagkatapos ang haba ng pagitan ay magiging l lane=83:6=13.83

Ang simula ng unang agwat ay magiging 112. Pagdaragdag sa 112 l ras=13.83, nakukuha natin ang huling halaga nito na 125.83, na siyang simula rin ng pangalawang pagitan, at iba pa. ang dulo ng ikalimang pagitan ay 195.

Kapag naghahanap ng mga frequency, ang isa ay dapat na magabayan ng panuntunan: "kung ang halaga ng isang tampok ay tumutugma sa hangganan ng panloob na agwat, dapat itong i-refer sa nakaraang agwat."

Kumuha kami ng isang serye ng pagitan ng mga frequency at pinagsama-samang frequency.

Talahanayan 1.2

Samakatuwid, 3 empleyado ang may suweldo. pagbabayad mula 112 hanggang 125.83 na conventional units. Pinakamataas na suweldo pagbabayad mula 181.15 hanggang 195 na conventional units. 6 na manggagawa lamang.

Upang kalkulahin ang mga numerical na katangian, kino-convert namin ang serye ng pagitan sa isang discrete, na ginagawa ang gitna ng mga pagitan bilang isang variant:

Talahanayan 1.3

14131,83

Ayon sa weighted arithmetic mean formula

cond.mon.un.

Average na linear deviation:

kung saan ang xi ay ang halaga ng pinag-aralan na tampok sa i-th unit ng populasyon,

Ang average na halaga ng pinag-aralan na katangian.

Nai-post sa http://www.allbest.ru/

Na-post noong http://www.allbest.ru/

Unit ng pananalapi

Karaniwang lihis:

Dispersion:

Relatibong hanay ng variation (coefficient of oscillation): c=R:,

Relatibong linear deviation: q = L:

Ang koepisyent ng pagkakaiba-iba: V = y:

Ang koepisyent ng oscillation ay nagpapakita ng kamag-anak na pagbabagu-bago ng mga matinding halaga ng katangian sa paligid ng arithmetic mean, at ang koepisyent ng pagkakaiba-iba ay nagpapakilala sa antas at homogeneity ng populasyon.

c \u003d R: \u003d 83 / 159.485 * 100% \u003d 52.043%

Kaya, ang pagkakaiba sa pagitan ng mga matinding halaga ay 5.16% (=94.84%-100%) mas mababa kaysa sa average na suweldo ng mga empleyado sa negosyo.

q \u003d L: \u003d 17.765 / 159.485 * 100% \u003d 11.139%

V \u003d y: \u003d 21.704 / 159.485 * 100% \u003d 13.609%

Ang koepisyent ng pagkakaiba-iba ay mas mababa sa 33%, na nagpapahiwatig ng mahinang pagkakaiba-iba sa sahod ng mga empleyado sa negosyo, i.e. na ang average ay isang tipikal na katangian ng sahod ng mga manggagawa (homogeneous aggregate).

Sa serye ng pamamahagi ng pagitan fashion ay tinutukoy ng formula -

Ang dalas ng modal interval, ibig sabihin, ang agwat na naglalaman ng pinakamalaking bilang ng mga opsyon;

Ang dalas ng agwat bago ang modal;

Ang dalas ng agwat kasunod ng modal;

Ang haba ng modal interval;

Ang lower bound ng modal interval.

Para sa pagtukoy median sa serye ng pagitan, ginagamit namin ang formula

kung saan ay ang pinagsama-samang (cumulative) dalas ng pagitan bago ang median;

Ang mas mababang limitasyon ng median interval;

Dalas ng median interval;

Ang haba ng median interval.

Median Interval- interval, ang naipon na dalas kung saan (=3+3+5+7) ay lumampas sa kalahati ng kabuuan ng mga frequency - (153.49; 167.32).

Kalkulahin natin ang skewness at kurtosis, kung saan bubuo tayo ng isang bagong worksheet:

Talahanayan 1.4

Makatotohanang datos

Tinantyang data

Kalkulahin ang sandali ng ikatlong pagkakasunud-sunod

Samakatuwid, ang kawalaan ng simetrya ay

Dahil 0.3553 0.25, kinikilala ang kawalaan ng simetrya bilang makabuluhan.

Kalkulahin ang sandali ng ikaapat na pagkakasunud-sunod

Samakatuwid, ang kurtosis ay

kasi< 0, то эксцесс является плосковершинным.

Ang antas ng skewness ay maaaring matukoy gamit ang Pearson's skewness coefficient (As): oscillation sample cost turnover

nasaan ang average serye ng aritmetika pamamahagi; -- fashion; -- karaniwang lihis.

Sa isang simetriko (normal) na distribusyon = Mo, samakatuwid, ang koepisyent ng kawalaan ng simetrya sero. Kung Аs > 0, pagkatapos ay mayroong higit na mode, samakatuwid, mayroong isang kanang panig na kawalaan ng simetrya.

Kung si As< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Ang pamamahagi ay hindi simetriko, ngunit may kaliwang panig na kawalaan ng simetrya.

ISANG GAWAIN 2

Ano ang dapat na laki ng sample upang mayroong posibilidad na 0.954 na ang error sa sampling ay hindi lalampas sa 0.04 kung ang pagkakaiba ay nalalaman mula sa mga nakaraang survey na 0.24?

Solusyon

Ang laki ng sample para sa hindi paulit-ulit na sampling ay kinakalkula ng formula:

t - koepisyent ng kumpiyansa (na may posibilidad na 0.954 ito ay katumbas ng 2.0; tinutukoy mula sa mga talahanayan ng mga integral na posibilidad),

y2=0.24 - karaniwang paglihis;

10000 tao - laki ng sample;

Dx =0.04 - marginal error ng sample mean.

Sa probabilidad na 95.4%, maaaring pagtalunan na ang laki ng sample, na nagbibigay ng kamag-anak na error na hindi hihigit sa 0.04, ay dapat na hindi bababa sa 566 na pamilya.

ISANG GAWAIN3

Ang sumusunod na data ay magagamit sa kita mula sa pangunahing aktibidad ng negosyo, milyong rubles.

Upang suriin ang isang serye ng mga dinamika, tukuyin ang mga sumusunod na tagapagpahiwatig:

1) chain at basic:

Ganap na mga pakinabang;

Mga rate ng paglago;

Mga rate ng paglago;

2) daluyan

Dynamic na antas ng hanay;

Ganap na paglago;

Rate ng paglago;

Rate ng pagtaas;

3) ang ganap na halaga ng 1% na paglago.

Solusyon

1. ganap na paglaki (Dy)- ito ang pagkakaiba sa pagitan ng susunod na antas ng serye at ng nauna (o basic):

chain: Du \u003d yi - yi-1,

basic: Du \u003d yi - y0,

yi - antas ng hilera,

i - numero ng antas ng hilera,

y0 - antas ng batayang taon.

2. Rate ng paglago (Tu) ay ang ratio ng susunod na antas ng serye at ang nauna (o ang batayang taon 2001):

chain: Tu = ;

basic: Tu =

3. Rate ng paglago (TD) - ito ang ratio ng ganap na paglago sa nakaraang antas, na ipinahayag sa%.

chain: Tu = ;

basic: Tu =

4. Ganap na halaga ng 1% na pagtaas (A)- ay ang ratio ng chain absolute growth sa rate ng paglago, na ipinahayag sa%.

PERO =

Antas ng gitnang hilera kinakalkula gamit ang arithmetic mean formula.

Average na antas ng kita mula sa mga pangunahing aktibidad sa loob ng 4 na taon:

Average na ganap na paglago kinakalkula ng formula:

kung saan ang n ay ang bilang ng mga antas sa serye.

Sa karaniwan, para sa taon, ang kita mula sa mga pangunahing aktibidad ay tumaas ng 3.333 milyong rubles.

Average na taunang rate ng paglago kinakalkula ng geometric mean formula:

уn - ang huling antas ng serye,

y0 - Unang antas hilera.

Tu \u003d 100% \u003d 102.174%

Average na taunang rate ng paglago kinakalkula ng formula:

T? \u003d Tu - 100% \u003d 102.74% - 100% \u003d 2.74%.

Kaya, sa karaniwan, para sa taon, ang kita mula sa pangunahing aktibidad ng negosyo ay tumaas ng 2.74%.

MGA GAWAINPERO4

Kalkulahin:

1. Indibidwal na mga indeks ng presyo;

2. Pangkalahatang turnover index;

3. Pinagsama-samang index ng presyo;

4. Pinagsama-samang index ng pisikal na dami ng pagbebenta ng mga kalakal;

5. Ang ganap na pagtaas sa halaga ng turnover at nabubulok ng mga salik (dahil sa mga pagbabago sa mga presyo at bilang ng mga kalakal na naibenta);

6. Gumawa maikling konklusyon para sa lahat ng nakuhang marka.

Solusyon

1. Ayon sa kondisyon, ang mga indibidwal na indeks ng presyo para sa mga produkto A, B, C ay umabot sa -

ipA=1.20; ipB=1.15; iрВ=1.00.

2. Ang kabuuang turnover index ay kinakalkula ng formula:

I w \u003d \u003d 1470/1045 * 100% \u003d 140.67%

Ang trade turnover ay tumaas ng 40.67% (140.67% -100%).

Sa karaniwan, tumaas ng 10.24% ang presyo ng mga bilihin.

Ang halaga ng mga karagdagang gastos para sa mga mamimili mula sa pagtaas ng presyo:

w(p) = ? p1q1-? p0q1 \u003d 1470 - 1333.478 \u003d 136.522 milyong rubles.

Bilang resulta ng pagtaas ng mga presyo, ang mga mamimili ay kailangang gumastos ng karagdagang 136.522 milyong rubles.

4. Pangkalahatang index ng pisikal na dami ng kalakalan:

Ang pisikal na dami ng kalakalan ay tumaas ng 27.61%.

5. Tukuyin natin ang kabuuang pagbabago sa turnover sa ikalawang yugto kumpara sa unang yugto:

w \u003d 1470- 1045 \u003d 425 milyong rubles.

dahil sa pagbabago ng presyo:

W(p) \u003d 1470 - 1333.478 \u003d 136.522 milyong rubles.

sa pamamagitan ng pagbabago ng pisikal na volume:

w(q) \u003d 1333.478 - 1045 \u003d 288.478 milyong rubles.

Ang turnover ng mga kalakal ay tumaas ng 40.67%. Ang mga presyo sa average para sa 3 mga kalakal ay tumaas ng 10.24%. Ang pisikal na dami ng kalakalan ay tumaas ng 27.61%.

Sa pangkalahatan, ang dami ng mga benta ay tumaas ng 425 milyong rubles, kabilang ang dahil sa pagtaas ng mga presyo, tumaas ito ng 136.522 milyong rubles, at dahil sa pagtaas ng mga volume ng benta - ng 288.478 milyong rubles.

ISANG GAWAIN5

Para sa 10 halaman sa isang industriya, available ang sumusunod na data.

Factory No.

Output, libong piraso (X)

Batay sa ibinigay na datos:

I) upang kumpirmahin ang mga probisyon ng lohikal na pagsusuri sa pagkakaroon ng isang linear correlation sa pagitan ng factor sign (production output) at ang resultang sign (electricity consumption), i-plot ang paunang data sa graph ng correlation field at gumawa ng mga konklusyon tungkol sa anyo ng relasyon, ipahiwatig ang formula nito;

2) tukuyin ang mga parameter ng equation ng koneksyon at i-plot ang resultang theoretical line sa graph ng field ng ugnayan;

3) kalkulahin ang linear correlation coefficient,

4) ipaliwanag ang mga halaga ng mga tagapagpahiwatig na nakuha sa mga talata 2) at 3);

5) gamit ang nakuha na modelo, gumawa ng isang pagtataya tungkol sa posibleng pagkonsumo ng kuryente sa isang planta na may dami ng produksyon na 4.5 libong mga yunit.

Solusyon

Data ng character - ang dami ng output (factor), na tinutukoy ng хi; sign - pagkonsumo ng kuryente (resulta) sa pamamagitan ng ui; Ang mga puntos na may mga coordinate (x, y) ay naka-plot sa OXY correlation field.

Ang mga punto ng patlang ng ugnayan ay matatagpuan sa ilang tuwid na linya. Samakatuwid, ang koneksyon ay linear, hahanapin natin ang equation ng regression sa anyo ng isang tuwid na linya Yx=ax+b. Upang mahanap ito, ginagamit namin ang sistema ng mga normal na equation:

Gumawa tayo ng spreadsheet.

Batay sa mga average na natagpuan, binubuo namin ang system at lutasin ito nang may paggalang sa mga parameter a at b:

Kaya, nakukuha namin ang equation ng regression para sa y sa x: \u003d 3.57692 x + 3.19231

Bumubuo kami ng linya ng regression sa field ng ugnayan.

Ang pagpapalit ng mga halaga ng x mula sa haligi 2 sa equation ng regression, nakuha namin ang mga kinakalkula (haligi 7) at ihambing ang mga ito sa y data, na makikita sa hanay 8. Sa pamamagitan ng paraan, ang kawastuhan ng mga kalkulasyon ay nakumpirma din sa pamamagitan ng pagkakataon ng mga average na halaga ng y at.

Coefficientlinear na ugnayan sinusuri ang higpit ng ugnayan sa pagitan ng mga tampok na x at y at kinakalkula ng formula

Ang angular coefficient ng direktang regression a (sa x) ay nagpapakilala sa direksyon ng natukoydependenciesmga palatandaan: para sa a>0 sila ay pareho, para sa a<0- противоположны. Kanyang ganap halaga - isang sukatan ng pagbabago sa resultang sign kapag ang factorial sign ay nagbabago sa bawat yunit ng pagsukat.

Ang libreng miyembro ng direktang regression ay nagpapakita ng direksyon, at ang ganap na halaga nito - isang dami ng sukat ng impluwensya sa epektibong tanda ng lahat ng iba pang mga kadahilanan.

Kung ang< 0, pagkatapos ay ang mapagkukunan ng kadahilanan na katangian ng isang indibidwal na bagay ay ginagamit na may mas kaunti, at kung kailan>0 Samas mataas na pagganap kaysa sa average para sa buong hanay ng mga bagay.

Gumawa tayo ng pagsusuri sa post-regression.

Ang koepisyent sa x ng direktang regression ay 3.57692 > 0, samakatuwid, na may pagtaas (pagbaba) sa output, ang pagkonsumo ng kuryente ay tumataas (bumaba). Pagtaas sa output ng 1 libong piraso. nagbibigay ng average na pagtaas sa konsumo ng kuryente ng 3.57692 thousand kWh.

2. Ang libreng termino ng direktang regression ay katumbas ng 3.19231, samakatuwid, ang impluwensya ng iba pang mga kadahilanan ay nagpapataas ng epekto ng output sa pagkonsumo ng kuryente sa ganap na mga termino ng 3.19231 libong kWh.

3. Ang koepisyent ng ugnayan ng 0.8235 ay nagpapakita ng napakalapit na pagdepende ng pagkonsumo ng kuryente sa output.

Madaling gumawa ng mga hula gamit ang equation ng regression model. Upang gawin ito, ang mga halaga ng x sa dami ng output ay pinapalitan sa equation ng regression at hinuhulaan ang pagkonsumo ng kuryente. Sa kasong ito, ang mga halaga ng x ay maaaring kunin hindi lamang sa loob ng isang naibigay na saklaw, kundi pati na rin sa labas nito.

Gumawa tayo ng forecast tungkol sa posibleng pagkonsumo ng kuryente sa isang planta na may dami ng produksyon na 4.5 thousand units.

3.57692*4.5 + 3.19231= 19.288 45 thousand kWh.

LISTAHAN NG MGA GINAMIT NA PINAGMULAN

1. Zakharenkov S.N. Socio-economic statistics: Gabay sa pag-aaral. - Minsk: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Pangkalahatang teorya ng istatistika. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Mga istatistika. - M.: Prospekt, 2002.

4. Pangkalahatang teorya ng istatistika / Ed. ed. O.E. Bashina, A.A. Spirin. - M.: Pananalapi at istatistika, 2000.

5. Socio-economic statistics: Textbook.-practice. allowance / Zakharenkov S.N. atbp. - Minsk: YSU, 2004.

6. Socio-economic statistics: Proc. allowance. / Ed. Nesterovich S.R. - Minsk: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistics. - Minsk, 2000.

8. Kharchenko L.P. Mga istatistika. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Mga istatistika. - M.: INFRA - M, 1999.

10. Mga istatistika ng ekonomiya / Ed. Yu.N. Ivanova - M., 2000.

Naka-host sa Allbest.ru

...

Mga Katulad na Dokumento

    Pagkalkula ng arithmetic mean para sa serye ng pamamahagi ng pagitan. Kahulugan pangkalahatang indeks ang pisikal na dami ng kalakalan. Pagsusuri ng ganap na pagbabago sa kabuuang halaga ng produksyon dahil sa mga pagbabago sa pisikal na dami. Pagkalkula ng koepisyent ng pagkakaiba-iba.

    pagsubok, idinagdag noong 07/19/2010

    Ang kakanyahan ng pakyawan, tingi at pampublikong kalakalan. Mga formula para sa pagkalkula ng indibidwal, pinagsama-samang mga indeks ng turnover. Pagkalkula ng mga katangian ng serye ng pamamahagi ng agwat - arithmetic mean, mode at median, koepisyent ng pagkakaiba-iba.

    term paper, idinagdag noong 05/10/2013

    Pagkalkula ng nakaplano at aktwal na dami ng mga benta, ang porsyento ng plano, ang ganap na pagbabago sa turnover. Pagpapasiya ng ganap na paglago, average na mga rate ng paglago at paglago sa kita ng cash. Pagkalkula ng mga average na istruktura: mga mode, median, quartiles.

    pagsubok, idinagdag noong 02/24/2012

    Interval serye ng pamamahagi ng mga bangko ayon sa dami ng kita. Paghahanap ng Mode at Median ng Nakuhang Interval Distribution Series graphic na pamamaraan at sa pamamagitan ng mga kalkulasyon. Pagkalkula ng mga katangian ng serye ng pamamahagi ng pagitan. Pagkalkula ng arithmetic mean.

    pagsubok, idinagdag noong 12/15/2010

    Mga formula para sa pagtukoy ng mga average na halaga ng serye ng agwat - mga mode, median, mga pagkakaiba-iba. Pagkalkula ng mga analytical indicator ng time series ayon sa chain at basic scheme, growth rate at growth. Ang konsepto ng isang pinagsama-samang index ng gastos, mga presyo, mga gastos at paglilipat.

    term paper, idinagdag noong 02/27/2011

    Ang konsepto at layunin, kaayusan at mga panuntunan para sa pagbuo ng isang variational series. Pagsusuri ng homogeneity ng data sa mga grupo. Mga indicator ng variation (fluctuation) ng isang katangian. Pagpapasiya ng linear mean at karaniwang lihis, koepisyent ng oscillation at variation.

    pagsubok, idinagdag noong 04/26/2010

    Ang konsepto ng mode at median bilang mga tipikal na katangian, ang pagkakasunud-sunod at pamantayan para sa kanilang pagpapasiya. Paghahanap ng mode at median sa isang discrete at interval variation series. Quartiles at decile bilang mga karagdagang katangian ng variational statistical series.

    pagsubok, idinagdag noong 09/11/2010

    Pagbuo ng isang serye ng pagitan ng pamamahagi sa batayan ng pagpapangkat. Pagkilala sa paglihis ng pamamahagi ng dalas mula sa simetriko na anyo, pagkalkula ng mga tagapagpahiwatig ng kurtosis at kawalaan ng simetrya. Pagsusuri ng mga tagapagpahiwatig ng balanse o pahayag ng kita.

    control work, idinagdag noong 10/19/2014

    Pagbabago ng empirical series sa discrete at interval. Pagpapasiya ng average na halaga sa isang discrete na serye gamit ang mga katangian nito. Pagkalkula ng isang discrete series ng mga mode, median, variation indicator (dispersion, deviation, oscillation coefficient).

    pagsubok, idinagdag noong 04/17/2011

    Pagbuo ng isang serye ng istatistika ng pamamahagi ng mga organisasyon. Graphical na kahulugan ng halaga ng mode at median. Ang higpit ng ugnayan sa paggamit ng coefficient of determination. Kahulugan ng sampling error average na bilang ng mga tao manggagawa.

Ang pinakamahalagang yugto sa pag-aaral ng mga socio-economic phenomena at mga proseso ay ang sistematisasyon ng pangunahing data at, sa batayan na ito, pagkuha ng isang buod na katangian ng buong bagay gamit ang generalizing indicator, na nakamit sa pamamagitan ng pagbubuod at pagpapangkat ng pangunahing istatistikal na materyal.

Buod ng istatistika - ito ay isang kumplikado ng mga sunud-sunod na operasyon upang i-generalize ang mga partikular na solong katotohanan na bumubuo ng isang set, upang makilala tipikal na katangian at mga pattern na likas sa kababalaghang pinag-aaralan sa kabuuan. Kasama sa pagsasagawa ng buod ng istatistika ang mga sumusunod na hakbang :

  • pagpili ng tampok na pagpapangkat;
  • pagpapasiya ng pagkakasunud-sunod ng pagbuo ng mga grupo;
  • pagbuo ng isang sistema ng mga istatistikal na tagapagpahiwatig upang makilala ang mga grupo at ang bagay sa kabuuan;
  • pagbuo ng mga layout ng mga istatistikal na talahanayan para sa paglalahad ng mga resulta ng buod.

Pagpapangkat ng istatistika tinatawag na paghahati ng mga yunit ng pinag-aralan na populasyon sa magkakatulad na mga grupo ayon sa ilang mga katangian na mahalaga para sa kanila. Ang mga pagpapangkat ay ang pinakamahalaga istatistikal na paraan generalization ng statistical data, ang batayan para sa tamang pagkalkula ng statistical indicators.

Mayroong mga sumusunod na uri ng pagpapangkat: typological, structural, analytical. Ang lahat ng mga pagpapangkat na ito ay pinagsama ng katotohanan na ang mga yunit ng bagay ay nahahati sa mga pangkat ayon sa ilang katangian.

tanda ng pagpapangkat ay tinatawag na tanda kung saan ang mga yunit ng populasyon ay nahahati sa magkakahiwalay na grupo. Ang mga konklusyon ay nakasalalay sa tamang pagpili ng tampok na pagpapangkat. istatistikal na pag-aaral. Bilang batayan para sa pagpapangkat, kinakailangang gumamit ng makabuluhang, theoretically substantiated features (quantitative o qualitative).

Dami ng mga palatandaan ng pagpapangkat magkaroon ng numerical expression (volume ng kalakalan, edad ng isang tao, kita ng pamilya, atbp.), at mga katangian ng husay ng pagpapangkat sumasalamin sa estado ng yunit ng populasyon (kasarian, katayuan sa pag-aasawa, kaakibat sa industriya ng negosyo, anyo ng pagmamay-ari nito, atbp.).

Matapos matukoy ang batayan ng pagpapangkat, ang tanong ng bilang ng mga pangkat kung saan dapat hatiin ang populasyon ng pag-aaral ay dapat na mapagpasyahan. Ang bilang ng mga pangkat ay nakasalalay sa mga layunin ng pag-aaral at ang uri ng tagapagpahiwatig na pinagbabatayan ng pagpapangkat, ang dami ng populasyon, ang antas ng pagkakaiba-iba ng katangian.

Halimbawa, ang pagpapangkat ng mga negosyo ayon sa mga anyo ng pagmamay-ari ay isinasaalang-alang ang munisipyo, pederal at ang pag-aari ng mga paksa ng pederasyon. Kung ang pagpapangkat ay isinasagawa ayon sa isang quantitative na katangian, kung gayon kinakailangan na magbayad ng espesyal na pansin sa bilang ng mga yunit ng bagay na pinag-aaralan at ang antas ng pagbabagu-bago ng katangian ng pagpapangkat.

Kapag natukoy ang bilang ng mga grupo, dapat matukoy ang mga pagitan ng pagpapangkat. Pagitan - ito ang mga halaga ng isang variable na katangian na nasa loob ng ilang mga limitasyon. Ang bawat pagitan ay may sariling halaga, itaas at mas mababang mga limitasyon, o hindi bababa sa isa sa mga ito.

Ang mas mababang hangganan ng pagitan ay tinatawag na pinakamaliit na halaga ng katangian sa pagitan, at itaas na hangganan - ang pinakamalaking halaga ng katangian sa pagitan. Ang halaga ng pagitan ay ang pagkakaiba sa pagitan ng upper at lower limit.

Ang mga pagitan ng pagpapangkat, depende sa kanilang laki, ay: pantay at hindi pantay. Kung ang pagkakaiba-iba ng katangian ay nagpapakita mismo sa medyo makitid na mga hangganan at ang pamamahagi ay pare-pareho, kung gayon ang isang pagpapangkat ay binuo na may pantay na pagitan. Ang halaga ng isang pantay na pagitan ay tinutukoy ng sumusunod na formula :

kung saan Xmax, Xmin - ang maximum at minimum na mga halaga ng katangian sa pinagsama-samang; n ay ang bilang ng mga pangkat.

Ang pinakasimpleng pagpapangkat, kung saan ang bawat napiling pangkat ay nailalarawan sa pamamagitan ng isang tagapagpahiwatig, ay isang serye ng pamamahagi.

Serye ng pamamahagi ng istatistika - ito ay isang maayos na pamamahagi ng mga yunit ng populasyon sa mga pangkat ayon sa isang tiyak na katangian. Depende sa katangiang pinagbabatayan ng pagbuo ng isang serye ng pamamahagi, nakikilala ang mga attributive at variation distribution series.

katangian tinatawag na serye ng pamamahagi na binuo ayon sa mga katangian ng husay, iyon ay, mga tampok na wala pagpapahayag ng numero(pamamahagi ayon sa mga uri ng trabaho, ayon sa kasarian, ayon sa propesyon, atbp.). Ang serye ng pamamahagi ng katangian ay nagpapakilala sa komposisyon ng populasyon ayon sa isa o ibang mahahalagang katangian. Sa loob ng ilang panahon, binibigyang-daan kami ng data na ito na pag-aralan ang pagbabago sa istruktura.

Mga hanay ng pagkakaiba-iba tinatawag na serye ng pamamahagi na binuo sa isang quantitative na batayan. Ang anumang variational series ay binubuo ng dalawang elemento: mga variant at frequency. Mga pagpipilian ang mga indibidwal na halaga ng katangian na kinukuha nito sa serye ng variation ay tinatawag, iyon ay, ang tiyak na halaga ng variable na katangian.

Mga frequency tinatawag na bilang ng indibidwal na variant o bawat pangkat ng serye ng variation, ibig sabihin, ito ay mga numerong nagpapakita kung gaano kadalas nangyayari ang ilang variant sa serye ng pamamahagi. Tinutukoy ng kabuuan ng lahat ng mga frequency ang laki ng buong populasyon, ang dami nito. Mga frequency ang mga frequency ay tinatawag, na ipinahayag sa mga fraction ng isang yunit o bilang isang porsyento ng kabuuan. Alinsunod dito, ang kabuuan ng mga frequency ay katumbas ng 1 o 100%.

Depende sa likas na katangian ng pagkakaiba-iba ng katangian, tatlong anyo ng serye ng pagkakaiba-iba ay nakikilala: isang ranggo na serye, discrete na serye at serye ng pagitan.

Serye ng variation ng ranggo - ito ang distribusyon ng mga indibidwal na yunit ng populasyon sa pataas o pababang pagkakasunud-sunod ng katangiang pinag-aaralan. Pinapadali ng pagraranggo na hatiin ang dami ng data sa mga pangkat, agad na makita ang pinakamaliit at pinakamalaking halaga feature, i-highlight ang mga value na madalas na inuulit.

Mga serye ng discrete variation nailalarawan ang distribusyon ng mga unit ng populasyon ayon sa isang discrete attribute na kumukuha lamang ng mga integer value. Halimbawa, kategorya ng taripa, ang bilang ng mga bata sa pamilya, ang bilang ng mga empleyado sa negosyo, atbp.

Kung ang isang palatandaan ay may patuloy na pagbabago, na sa loob ng ilang mga limitasyon ay maaaring tumagal sa anumang mga halaga ("mula - hanggang"), kung gayon para sa sign na ito kailangan mong bumuo serye ng pagkakaiba-iba ng pagitan . Halimbawa, ang halaga ng kita, karanasan sa trabaho, ang halaga ng mga fixed asset ng enterprise, atbp.

Mga halimbawa ng paglutas ng mga problema sa paksang "Buod ng istatistika at pagpapangkat"

Gawain 1 . Mayroong impormasyon sa bilang ng mga aklat na natanggap ng mga mag-aaral sa pamamagitan ng subscription para sa nakaraang taon ng akademiko.

Bumuo ng isang ranged at discrete variational distribution series, na tumutukoy sa mga elemento ng serye.

Solusyon

Ang set na ito ay isang hanay ng mga opsyon para sa bilang ng mga aklat na natatanggap ng mga mag-aaral. Bilangin natin ang bilang ng mga naturang variant at ayusin ang mga ito sa anyo ng variational na ranggo at variational discrete distribution series.

Gawain 2 . Mayroong data sa halaga ng mga nakapirming asset para sa 50 mga negosyo, libong rubles.

Bumuo ng isang serye ng pamamahagi, na nagha-highlight ng 5 grupo ng mga negosyo (sa pantay na pagitan).

Solusyon

Para sa solusyon, pipiliin namin ang pinakamalaki at pinakamaliit na halaga halaga ng mga fixed asset ng mga negosyo. Ito ay 30.0 at 10.2 libong rubles.

Hanapin ang laki ng agwat: h \u003d (30.0-10.2): 5 \u003d 3.96 libong rubles.

Pagkatapos ay isasama ng unang grupo ang mga negosyo, ang halaga ng mga nakapirming asset na kung saan ay mula sa 10.2 libong rubles. hanggang 10.2 + 3.96 = 14.16 libong rubles. Magkakaroon ng 9 na ganoong mga negosyo. Ang pangalawang grupo ay magsasama ng mga negosyo, ang halaga ng mga nakapirming asset na kung saan ay mula sa 14.16 libong rubles. hanggang 14.16 + 3.96 = 18.12 libong rubles. Magkakaroon ng 16 na ganoong mga negosyo. Katulad nito, nakita natin ang bilang ng mga negosyong kasama sa ikatlo, ikaapat at ikalimang grupo.

Ang resultang serye ng pamamahagi ay inilalagay sa talahanayan.

Gawain 3 . Para sa isang bilang ng mga negosyo magaan na industriya natanggap ang sumusunod na data:

Gumawa ng pagpapangkat ng mga negosyo ayon sa bilang ng mga manggagawa, na bumubuo ng 6 na grupo sa pantay na pagitan. Bilangin para sa bawat pangkat:

1. bilang ng mga negosyo
2. bilang ng mga manggagawa
3. dami ng mga ginawang produkto kada taon
4. average na aktwal na output ng bawat manggagawa
5. halaga ng mga fixed asset
6. average na laki ng mga fixed asset ng isang enterprise
7. average na halaga ng mga ginawang produkto ng isang negosyo

Itala ang mga resulta ng pagkalkula sa mga talahanayan. Gumuhit ng iyong sariling mga konklusyon.

Solusyon

Para sa solusyon, pinipili namin ang pinakamalaki at pinakamaliit na halaga ng average na bilang ng mga manggagawa sa negosyo. Ito ay 43 at 256.

Hanapin ang laki ng pagitan: h = (256-43): 6 = 35.5

Pagkatapos ang unang grupo ay isasama ang mga negosyo na may average na bilang ng mga manggagawa mula 43 hanggang 43 + 35.5 = 78.5 katao. Magkakaroon ng 5 tulad na mga negosyo. Ang pangalawang grupo ay isasama ang mga negosyo, ang average na bilang ng mga manggagawa kung saan ay mula 78.5 hanggang 78.5 + 35.5 = 114 na tao. Magkakaroon ng 12 tulad na mga negosyo. Katulad nito, nakita natin ang bilang ng mga negosyo na kasama sa ikatlo, ikaapat, ikalima at ikaanim na grupo.

Inilalagay namin ang nagresultang serye ng pamamahagi sa isang talahanayan at kinakalkula ang mga kinakailangang tagapagpahiwatig para sa bawat pangkat:

Konklusyon : Tulad ng makikita mula sa talahanayan, ang pangalawang pangkat ng mga negosyo ay ang pinakamarami. Kabilang dito ang 12 negosyo. Ang pinakamaliit ay ang ikalima at ikaanim na grupo (dalawang negosyo bawat isa). Ito ang pinakamalaking negosyo (sa mga tuntunin ng bilang ng mga manggagawa).

Dahil ang pangalawang pangkat ang pinakamarami, ang dami ng output bawat taon ng mga negosyo ng pangkat na ito at ang dami ng mga fixed asset ay mas mataas kaysa sa iba. Kasabay nito, ang average na aktwal na output ng isang manggagawa sa mga negosyo ng grupong ito ay hindi ang pinakamataas. Nangunguna rito ang mga negosyo ng ikaapat na grupo. Ang grupong ito ay nagsasaalang-alang din ng medyo malaking halaga ng mga fixed asset.

Sa konklusyon, napapansin namin na ang average na laki ng mga fixed asset at ang average na halaga ng output ng isang enterprise ay direktang proporsyonal sa laki ng enterprise (sa mga tuntunin ng bilang ng mga manggagawa).

Kung ang random na variable sa ilalim ng pag-aaral ay tuluy-tuloy, kung gayon ang pagraranggo at pagpapangkat ng mga naobserbahang halaga ay kadalasang hindi pinapayagan ang isa na mag-isa. katangian ng karakter pag-iiba-iba ng mga halaga nito. Ito ay ipinaliwanag sa pamamagitan ng katotohanan na ang mga indibidwal na halaga ng isang random na variable ay maaaring mag-iba nang kasing liit ng ninanais mula sa isa't isa, at samakatuwid, sa kabuuan ng naobserbahang data, ang parehong mga halaga ng isang dami ay maaaring bihirang mangyari, at ang mga frequency ng mga variant ay bahagyang naiiba sa bawat isa.

Hindi rin praktikal na bumuo ng isang discrete series para sa isang discrete random variable, ang bilang ng mga posibleng value na kung saan ay malaki. AT katulad na mga kaso dapat itayo serye ng pagkakaiba-iba ng pagitan pamamahagi.

Upang makabuo ng naturang serye, ang buong pagitan ng pagkakaiba-iba ng mga naobserbahang halaga ng isang random na variable ay nahahati sa isang serye bahagyang agwat at pagbibilang ng dalas ng paglitaw ng mga halaga ng magnitude sa bawat bahagyang pagitan.

Serye ng pagkakaiba-iba ng pagitan tinatawag na isang nakaayos na hanay ng mga pagitan ng pagkakaiba-iba ng mga halaga ng isang random na variable na may kaukulang mga frequency o mga kamag-anak na frequency ng mga hit sa bawat isa sa mga halaga ng halaga.

Upang bumuo ng isang serye ng pagitan, kailangan mo:

  1. tukuyin halaga bahagyang agwat;
  2. tukuyin lapad mga pagitan;
  3. itakda para sa bawat pagitan nito itaas at lower bound ;
  4. pangkatin ang mga resulta ng obserbasyon.

1 . Ang tanong ng pagpili ng bilang at lapad ng mga pagitan ng pagpapangkat ay kailangang mapagpasyahan sa bawat partikular na kaso batay sa mga layunin pananaliksik, dami sampling at antas ng pagkakaiba-iba tampok sa sample.

Tinatayang bilang ng mga agwat k maaari lamang matantya mula sa laki ng sample n sa isa sa mga sumusunod na paraan:

  • ayon sa pormula Sturges : k = 1 + 3.32 log n ;
  • gamit ang talahanayan 1.

Talahanayan 1

2 . Karaniwang mas gusto ang mga pagitan ng parehong lapad. Upang matukoy ang lapad ng mga pagitan h kalkulahin:

  • saklaw ng pagkakaiba-iba R - mga sample na halaga: R = x max - x min ,

saan xmax at xmin - maximum at minimum na mga pagpipilian sa sample;

  • ang lapad ng bawat pagitan h tinutukoy ng sumusunod na formula: h = R/k .

3 . Bottom line unang pagitan x h1 ay pinili upang ang pinakamababang sample na variant xmin nahulog humigit-kumulang sa gitna ng agwat na ito: x h1 = x min - 0.5 h .

Mga pagitan nakuha sa pamamagitan ng pagdaragdag sa dulo ng nakaraang pagitan ng haba ng bahagyang pagitan h :

xhi = xhi-1 +h.

Ang pagtatayo ng sukat ng mga agwat batay sa pagkalkula ng mga hangganan ng mga agwat ay nagpapatuloy hanggang sa halaga x hi natutugunan ang kaugnayan:

x hi< x max + 0,5·h .

4 . Alinsunod sa sukat ng mga agwat, ang mga halaga ng katangian ay pinagsama - para sa bawat bahagyang agwat, ang kabuuan ng mga frequency ay kinakalkula n i nahuli ang variant i -ika agwat. Sa kasong ito, ang pagitan ay kinabibilangan ng mga halaga ng isang random na variable na mas malaki kaysa o katumbas ng mas mababang limitasyon at mas mababa sa itaas na limitasyon ng agwat.

Polygon at histogram

Para sa kalinawan, ang iba't ibang mga graph ng distribusyon ng istatistika ay binuo.

Batay sa data ng discrete variational series, bumubuo kami polygon mga frequency o relative frequency.

Polygon ng dalas x 1 ; n 1 ), (x2 ; n 2 ), ..., (x k ; nk ). Upang bumuo ng isang polygon ng mga frequency sa abscissa axis, ang mga opsyon ay itinatabi x i , at sa y-axis - ang kaukulang mga frequency n i . Mga puntos ( x i ; n i ) ay konektado sa pamamagitan ng mga segment ng mga tuwid na linya at isang frequency polygon ay nakuha (Larawan 1).

Kamag-anak na dalas ng polygon ay tinatawag na polyline na ang mga segment ay nagkokonekta sa mga punto ( x 1 ; W 1 ), (x2 ; W2 ), ..., (x k ; W k ). Upang bumuo ng isang polygon ng mga kamag-anak na frequency sa abscissa, tanggalin ang mga opsyon x i , at sa y-axis - ang mga kamag-anak na frequency na naaayon sa kanila Wi . Mga puntos ( x i ; Wi ) ay konektado sa pamamagitan ng mga segment ng mga tuwid na linya at isang polygon ng mga relatibong frequency ay nakuha.

Kailan tuluy-tuloy na tampok ito ay nararapat na magtayo histogram .

frequency histogram tinatawag na stepped figure na binubuo ng mga parihaba na ang mga base ay bahagyang pagitan ng haba h , at ang mga taas ay katumbas ng ratio NIH (densidad ng dalas).

Upang makabuo ng histogram ng mga frequency, ang mga bahagyang pagitan ay naka-plot sa abscissa axis, at ang mga segment ay iginuhit sa itaas ng mga ito parallel sa abscissa axis sa layo. NIH .

Sa maraming mga kaso, kung ang istatistikal na populasyon ay may kasamang malaki o, higit pa, isang walang katapusang bilang ng mga opsyon, na kadalasang nahaharap sa patuloy na pagkakaiba-iba, halos imposible at hindi praktikal na bumuo ng isang pangkat ng mga yunit para sa bawat opsyon. Sa ganitong mga kaso, ang pagsasama-sama ng mga yunit ng istatistika sa mga grupo ay posible lamang sa batayan ng agwat, i.e. tulad ng isang pangkat na may ilang mga limitasyon ng mga halaga ng iba't ibang katangian. Ang mga limitasyong ito ay ipinahiwatig ng dalawang numero na nagsasaad ng itaas at mas mababang mga limitasyon ng bawat pangkat. Ang paggamit ng mga agwat ay humahantong sa pagbuo ng isang serye ng pamamahagi ng agwat.

interval rad ay isang variational na serye, ang mga variant nito ay ipinakita bilang mga pagitan.

Ang serye ng pagitan ay maaaring mabuo na may pantay at hindi pantay na pagitan, habang ang pagpili ng prinsipyo para sa pagbuo ng seryeng ito ay higit na nakasalalay sa antas ng pagiging kinatawan at kaginhawahan ng istatistikal na populasyon. Kung ang hanay ay sapat na malaki (kinatawan) sa mga tuntunin ng bilang ng mga yunit at medyo homogenous sa komposisyon, pagkatapos ay ipinapayong ibase ang pagbuo ng serye ng pagitan sa pantay na pagitan. Karaniwan, ayon sa prinsipyong ito, ang isang serye ng pagitan ay nabuo para sa mga populasyon kung saan ang hanay ng pagkakaiba-iba ay medyo maliit, i.e. ang maximum at minimum na mga variant ay karaniwang nag-iiba sa bawat isa nang ilang beses. Sa kasong ito, ang halaga ng pantay na pagitan ay kinakalkula sa pamamagitan ng ratio ng hanay ng pagkakaiba-iba ng katangian sa ibinigay na bilang ng mga nabuong pagitan. Upang matukoy ang pantay at interval, maaaring gamitin ang formula ng Sturgess (karaniwan ay may maliit na pagkakaiba-iba sa mga feature ng interval at malaking bilang ng mga unit sa istatistikal na populasyon):

kung saan x i - ang halaga ng isang pantay na pagitan; X max, X min - maximum at minimum na mga opsyon sa istatistikal na populasyon; n . - ang bilang ng mga yunit sa populasyon.

Halimbawa. Maipapayo na kalkulahin ang laki ng isang pantay na agwat ayon sa density ng radioactive contamination na may cesium - 137 sa 100 mga pamayanan ng distrito ng Krasnopolsky ng rehiyon ng Mogilev, kung alam na ang paunang (minimum) na variant ay katumbas ng I km / km 2, ang pangwakas ( maximum) - 65 ki / km 2. Gamit ang formula 5.1. makuha namin:

Samakatuwid, upang makabuo ng isang serye ng agwat na may pantay na agwat para sa density ng polusyon ng cesium - 137 mga pamayanan ng distrito ng Krasnopolsky, ang laki ng isang pantay na agwat ay maaaring 8 ki/km 2 .

Sa mga kondisyon ng hindi pantay na pamamahagi i.e. kapag ang maximum at minimum na mga pagpipilian ay daan-daang beses, kapag bumubuo ng serye ng pagitan, maaari mong ilapat ang prinsipyo hindi pantay mga pagitan. Karaniwang tumataas ang hindi pantay na pagitan habang lumilipat ka sa mas malalaking halaga ng feature.

Ang hugis ng mga pagitan ay maaaring sarado at bukas. sarado Nakaugalian na ang pangalan ng mga agwat kung saan ang parehong ibaba at itaas na mga hangganan ay ipinahiwatig. bukas ang mga pagitan ay may isang hangganan lamang: sa unang pagitan - ang itaas, sa huli - ang mas mababang hangganan.

Maipapayo na suriin ang mga serye ng agwat, lalo na ang mga may hindi pantay na agwat, na isinasaalang-alang density ng pamamahagi, ang pinakasimpleng paraan upang kalkulahin kung alin ang ratio ng lokal na dalas (o dalas) sa laki ng pagitan.

Para sa praktikal na pagbuo ng serye ng pagitan, maaari mong gamitin ang layout ng talahanayan. 5.3.

T a b l e 5.3. Ang pagkakasunud-sunod ng pagbuo ng serye ng pagitan mga pamayanan Krasnopolsky district ayon sa density ng radioactive contamination na may cesium -137

Ang pangunahing bentahe ng serye ng pagitan ay ang limitasyon nito pagiging compactness. sa parehong oras, sa pagitan ng serye ng pamamahagi, ang mga indibidwal na variant ng katangian ay nakatago sa kaukulang mga pagitan

Kapag ang isang graphical na representasyon ng isang serye ng agwat sa isang sistema ng mga parihabang coordinate, ang itaas na mga hangganan ng mga pagitan ay naka-plot sa abscissa axis, at ang mga lokal na frequency ng serye ay nasa ordinate axis. Ang graphical na konstruksyon ng isang serye ng agwat ay naiiba sa pagbuo ng isang polygon ng pamamahagi dahil ang bawat agwat ay may mas mababa at itaas na hangganan, at dalawang abscissas ay tumutugma sa anumang halaga ng ordinate. Samakatuwid, sa graph ng serye ng pagitan, hindi isang punto ang minarkahan, tulad ng sa isang polygon, ngunit isang linya na nagkokonekta sa dalawang puntos. Ang mga ito pahalang na linya kumonekta sa isa't isa mga linyang patayo at ang pigura ng isang stepped polygon ay nakuha, na karaniwang tinatawag histogram mga pamamahagi (Larawan 5.3).

Sa graphical na pagtatayo ng isang serye ng pagitan para sa isang sapat na malaking istatistikal na populasyon, ang histogram ay lumalapit simetriko form ng pamamahagi. Sa mga kasong iyon kung saan maliit ang istatistikal na populasyon, bilang panuntunan, ito ay nabuo walang simetriko bar chart.

Sa ilang mga kaso, mayroong kahusayan sa pagbuo ng isang bilang ng mga naipon na frequency, i.e. pinagsama-samang hilera. Maaaring mabuo ang pinagsama-samang serye batay sa isang discrete o interval distribution series. Gamit ang isang graphic pinagsama-samang serye sa sistema ng mga parihaba na coordinate, ang mga variant ay naka-plot sa abscissa axis, at ang mga naipon na frequency (frequencies) ay naka-plot sa ordinate axis. Ang nagresultang hubog na linya ay tinatawag pinagsama-samang mga pamamahagi (Larawan 5.4).

Pagbubuo at graphic na larawan iba't ibang uri Ang variational series ay nag-aambag sa isang pinasimple na pagkalkula ng mga pangunahing istatistikal na katangian, na tinalakay nang detalyado sa paksa 6, ay tumutulong upang mas maunawaan ang kakanyahan ng mga batas ng pamamahagi ng isang istatistikal na populasyon. Ang pagsusuri ng serye ng variation ay partikular na kahalagahan sa mga kaso kung saan kinakailangan upang matukoy at masubaybayan ang kaugnayan sa pagitan ng mga variant at frequency (mga frequency). Ang pag-asa na ito ay ipinakita sa katotohanan na ang bilang ng mga kaso para sa bawat variant ay sa isang tiyak na paraan na nauugnay sa halaga ng variant na ito, i.e. na may pagtaas sa mga halaga ng iba't ibang tanda ng dalas (dalas) ng mga halagang ito, nakakaranas sila ng tiyak, sistematikong mga pagbabago. Nangangahulugan ito na ang mga numero sa column ng mga frequency (frequencies) ay hindi napapailalim sa magulong pagbabagu-bago, ngunit nagbabago sa isang tiyak na direksyon, sa isang tiyak na pagkakasunud-sunod at pagkakasunud-sunod.

Kung ang mga frequency sa kanilang mga pagbabago ay nagpapakita ng isang tiyak na sistematiko, nangangahulugan ito na tayo ay patungo sa pagtukoy ng mga pattern. Ang sistema, pagkakasunud-sunod, pagkakasunud-sunod sa pagbabago ng mga frequency ay isang salamin ng mga karaniwang sanhi, pangkalahatang kondisyon katangian ng buong populasyon.

Hindi dapat ipagpalagay na ang pattern ng pamamahagi ay palaging ibinibigay na handa. Napakaraming serye ng variational kung saan kakaibang tumalon ang mga frequency, tumataas man o bumababa. Sa ganitong mga kaso, ipinapayong alamin kung anong uri ng pamamahagi ang kinakaharap ng mananaliksik: alinman sa pamamahagi na ito ay hindi likas sa mga pattern, o ang kalikasan nito ay hindi pa natukoy: Ang unang kaso ay bihira, habang ang pangalawa, ang pangalawang kaso ay medyo madalas at napaka-pangkaraniwang pangyayari.

Kaya, kapag bumubuo ng serye ng pagitan kabuuang bilang ang mga istatistikal na yunit ay maaaring maliit, at ang isang maliit na bilang ng mga opsyon ay nahuhulog sa bawat pagitan (halimbawa, 1-3 mga yunit). Sa ganitong mga kaso, hindi kinakailangang umasa sa pagpapakita ng anumang regularidad. Upang makakuha ng regular na resulta batay sa mga random na obserbasyon, kinakailangan para sa batas na magkabisa malalaking numero, ibig sabihin. upang sa bawat pagitan ay hindi magkakaroon ng ilan, ngunit sampu at daan-daang mga yunit ng istatistika. Sa layuning ito, dapat nating subukang dagdagan ang bilang ng mga obserbasyon hangga't maaari. Ito ang pinaka Ang tamang daan pagtuklas ng mga pattern sa mga proseso ng masa. Kung hindi ito lilitaw tunay na pagkakataon dagdagan ang bilang ng mga obserbasyon, pagkatapos ay ang pagkakakilanlan ng mga pattern ay maaaring makamit sa pamamagitan ng pagbabawas ng bilang ng mga agwat sa serye ng pamamahagi. Binabawasan ang bilang ng mga agwat sa serye ng variation, sa gayon ay nadaragdagan ang bilang ng mga frequency sa bawat agwat. Nangangahulugan ito na ang mga random na pagbabagu-bago ng bawat yunit ng istatistika ay nakapatong sa bawat isa, "pinakinis", nagiging isang pattern.

Ang pagbuo at pagbuo ng variational series ay nagbibigay-daan sa iyo upang makakuha lamang ng pangkalahatan, tinatayang larawan ng distribusyon ng istatistikal na populasyon. Halimbawa, ang isang histogram ay halos nagpapahayag lamang ng kaugnayan sa pagitan ng mga halaga ng isang tampok at ng mga frequency nito (mga frequency). Samakatuwid, ang mga variational series ay mahalagang batayan lamang para sa karagdagang, malalim na pag-aaral ng panloob na regularidad ng isang static na pamamahagi.

PAKSA 5 MGA TANONG

1. Ano ang pagkakaiba-iba? Ano ang sanhi ng pagkakaiba-iba ng isang katangian sa isang istatistikal na populasyon?

2. Anong mga uri ng mga variable na palatandaan ang maaaring maganap sa mga istatistika?

3. Ano ang variation series? Ano ang mga uri ng variation series?

4. Ano ang isang ranggo na serye? Ano ang mga pakinabang at disadvantage nito?

5. Ano ang isang discrete series at ano ang mga pakinabang at disadvantage nito?

6. Ano ang pagkakasunud-sunod ng pagbuo ng serye ng pagitan, ano ang mga pakinabang at disadvantage nito?

7. Ano ang isang graphical na representasyon ng isang ranggo, discrete, interval distribution series?

8. Ano ang distribution cumulate at ano ang katangian nito?