Mean quadratic equation. Dispersion, root mean square (standard) deviation, coefficient of variation

Isa sa mga pangunahing kasangkapan istatistikal na pagsusuri ay ang pagkalkula ng standard deviation. Ang tagapagpahiwatig na ito ay nagbibigay-daan sa iyo upang tantyahin ang karaniwang paglihis para sa isang sample o para sa populasyon. Alamin natin kung paano gamitin ang standard deviation formula sa Excel.

Tukuyin natin agad kung ano ang average karaniwang lihis at ano ang hitsura ng formula. Ang halagang ito ay ang square root ng mean numero ng aritmetika mga parisukat ng pagkakaiba ng lahat ng mga halaga ng serye at ang kanilang ibig sabihin ng aritmetika. Mayroong magkaparehong pangalan para sa tagapagpahiwatig na ito - karaniwang lihis. Ang parehong mga pangalan ay ganap na katumbas.

Ngunit, siyempre, sa Excel, hindi kailangang kalkulahin ito ng gumagamit, dahil ginagawa ng programa ang lahat para sa kanya. Alamin natin kung paano kalkulahin ang standard deviation sa Excel.

Pagkalkula sa Excel

Maaari mong kalkulahin ang tinukoy na halaga sa Excel gamit ang dalawang espesyal na function STDEV.B(ayon sa sample) at STDEV.G(ayon sa pangkalahatang populasyon). Ang prinsipyo ng kanilang operasyon ay ganap na pareho, ngunit maaari silang tawagan sa tatlong paraan, na tatalakayin natin sa ibaba.

Paraan 1: Function Wizard


Paraan 2: Tab na Mga Formula


Paraan 3: Manu-manong pagpasok ng formula

Mayroon ding paraan kung saan hindi mo na kailangang tawagan ang argument window. Upang gawin ito, manu-manong ipasok ang formula.


Tulad ng nakikita mo, ang mekanismo para sa pagkalkula ng karaniwang paglihis sa Excel ay napaka-simple. Kailangan lang ng user na magpasok ng mga numero mula sa populasyon o mga link sa mga cell na naglalaman ng mga ito. Ang lahat ng mga kalkulasyon ay ginagawa ng mismong programa. Mas mahirap maunawaan kung ano ang kinakalkula na tagapagpahiwatig at kung paano mailalapat ang mga resulta ng pagkalkula sa pagsasanay. Ngunit ang pag-unawa dito ay higit na nabibilang sa larangan ng mga istatistika kaysa sa pag-aaral kung paano magtrabaho sa software.

Ang ibig sabihin ng parisukat ng dalawang di-negatibong numero a, b ay tinatawag di-negatibong numero, ang parisukat nito ay ang arithmetic mean ng mga parisukat ng mga numerong a at b, ibig sabihin, ang numero

Suliranin 351. Sa kahulugan nag-uusap kami tungkol sa arithmetic mean. Ano ang mangyayari kung papalitan natin ito ng geometric na ibig sabihin?

Problema 352. Patunayan na ang mean square ng dalawang numero ay mas malaki sa o katumbas ng kanilang arithmetic mean:

(Halimbawa, ang mean square ng mga numerong 0 at a ay , at ang arithmetic mean ay )

Desisyon. Ihambing natin ang mga parisukat at patunayan iyon

Multiply sa 4 at buksan ang mga bracket

Muli, ang kaliwang bahagi ay isang parisukat at samakatuwid ay hindi negatibo.

Problema 353. Para sa aling a at b ang mean square ay katumbas ng arithmetic mean?

Suliranin 354. Patunayan na ang geometric mean ay hindi lalampas sa mean square.

Ang geometric na paglalarawan ay ipinapakita sa fig. 31. Gumuhit tayo ng graph. Ikonekta natin ang mga punto sa mga coordinate na nakahiga dito gamit ang isang segment. Ang gitna ng segment na ito ay magkakaroon ng mga coordinate na arithmetic mean ng mga coordinate ng mga dulo, i.e.

Sa ibaba nito sa graph ay isang punto

Kaya, ang hindi pagkakapantay-pantay tungkol sa arithmetic mean at mean square ay nangangahulugan na ang graph ay pababang matambok (ang curve ay nasa ibaba ng "chord.

Problema 355. Sa pamamagitan ng pagpapalit ng x at y axes, mula sa graph ay nakukuha natin ang graph ng function, na nasa itaas ng alinman sa mga chord nito (tingnan ang Fig. 32). Anong hindi pagkakapantay-pantay ang katumbas nito?

Alam na natin na para sa anumang hindi negatibong a at b

Para sa bawat isa sa tatlong uri ng average na ito, gumuhit kami ng mga puntos (a, b) kung saan ang average ay hindi lalampas sa 1 (tingnan ang Fig. 33 a-c).

Ang pagsasama-sama ng mga ito sa isang figure (Larawan 34), nakikita natin na mas malaki ang average, mas maliit ang kaukulang lugar.

Problema 356. Patunayan ang hindi pagkakapantay-pantay tungkol sa arithmetic mean at mean square para sa tatlong numero:

Suliranin 357. (a) Ang kabuuan ng dalawa mga positibong numero ay 2. Ano ang pinakamababang halaga ng kabuuan ng kanilang mga parisukat?

(b) Ang parehong tanong para sa kabuuan ng mga parisukat ng tatlong positibong numero na ang kabuuan ay 3.

Ang pinakaperpektong katangian ng variation ay ang standard deviation, na tinatawag na standard (o standard deviation). Karaniwang lihis() ay katumbas ng square root ng mean square ng mga deviations ng mga indibidwal na feature values ​​mula sa arithmetic mean:

Katamtaman karaniwang lihis simple:

Ang weighted standard deviation ay inilapat para sa nakapangkat na data:

Sa pagitan ng standard at average na linear deviations sa mga kundisyon normal na pamamahagi ang sumusunod na ratio ay nagaganap: ~ 1.25.

Ang karaniwang paglihis, bilang pangunahing ganap na sukatan ng pagkakaiba-iba, ay ginagamit sa pagtukoy ng mga halaga ng mga ordinate ng normal na curve ng pamamahagi, sa mga kalkulasyon na nauugnay sa organisasyon ng sample na pagmamasid at pagtatatag ng katumpakan ng mga katangian ng sample, pati na rin sa pagtatasa ng mga hangganan ng pagkakaiba-iba ng isang katangian sa isang homogenous na populasyon.

Ang pagpapakalat, mga uri nito, karaniwang paglihis.

Pagkakaiba-iba ng isang random na variable- isang sukatan ng pagkalat ng isang ibinigay na random na variable, ibig sabihin, ang paglihis nito mula sa inaasahan sa matematika. Sa mga istatistika, ang pagtatalaga o ay kadalasang ginagamit. Kuwadrado na ugat ng pagkakaiba ay tinatawag na standard deviation, standard deviation, o standard spread.

Kabuuang pagkakaiba (σ2) sinusukat ang pagkakaiba-iba ng isang katangian sa buong populasyon sa ilalim ng impluwensya ng lahat ng mga salik na naging sanhi ng pagkakaiba-iba na ito. Kasabay nito, salamat sa paraan ng pagpapangkat, posibleng ihiwalay at sukatin ang pagkakaiba-iba dahil sa tampok na pagpapangkat, at ang pagkakaiba-iba na nangyayari sa ilalim ng impluwensya ng hindi natukoy na mga kadahilanan.

pagkakaiba-iba sa pagitan ng pangkat (σ 2 m.gr) ay nagpapakilala sa sistematikong pagkakaiba-iba, ibig sabihin, mga pagkakaiba sa laki ng pinag-aralan na katangian na nagmumula sa ilalim ng impluwensya ng katangian - ang kadahilanan na pinagbabatayan ng pagpapangkat.

karaniwang lihis(kasingkahulugan: standard deviation, standard deviation, standard deviation; magkatulad na termino: standard deviation, standard spread) - sa probability theory at statistics, ang pinakakaraniwang indicator ng dispersion ng mga value ng random variable na may kaugnayan sa matematikal na inaasahan nito. Sa limitadong mga arrays ng mga sample ng mga value, sa halip na ang mathematical expectation, ang arithmetic mean ng set ng mga sample ay ginagamit.

Ang karaniwang paglihis ay sinusukat sa mga yunit ng pinaka-random na variable at ginagamit sa pagkalkula karaniwang error arithmetic mean, kapag nagtatayo mga pagitan ng kumpiyansa, kapag sinusubok ng istatistika ang mga hypotheses, kapag nagsusukat ng linear na relasyon sa pagitan mga random na variable. Ito ay tinukoy bilang square root ng variance ng isang random variable.


Karaniwang lihis:

Karaniwang lihis(pagtatantya ng standard deviation ng isang random variable x kaugnay sa inaasahan sa matematika nito batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba nito):

nasaan ang pagpapakalat; — i-ika sample na elemento; - laki ng sample; - arithmetic mean ng sample:

Dapat tandaan na ang parehong mga pagtatantya ay may kinikilingan. Sa pangkalahatang kaso, imposibleng bumuo ng walang pinapanigan na pagtatantya. Gayunpaman, ang isang pagtatantya batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba ay pare-pareho.

Kakanyahan, saklaw at pamamaraan para sa pagtukoy ng mode at median.

Bilang karagdagan sa mga average ng power-law sa mga istatistika para sa isang kamag-anak na katangian ng magnitude ng isang variable na katangian at panloob na istraktura ang mga serye ng pamamahagi ay gumagamit ng mga istrukturang average, na pangunahing kinakatawan ng mode at median.

Fashion- Ito ang pinakakaraniwang variant ng serye. Ang fashion ay ginagamit, halimbawa, sa pagtukoy ng laki ng mga damit, sapatos, na kung saan ay sa pinakamalaking demand sa mga mamimili. Ang mode para sa isang discrete series ay ang variant na may pinakamataas na frequency. Kapag kinakalkula ang mode para sa pagitan serye ng pagkakaiba-iba kailangan munang matukoy ang modal interval (ayon sa maximum frequency), at pagkatapos ay ang halaga ng modal value ng attribute ayon sa formula:

- - halaga ng fashion

- - mas mababang limitasyon ng modal interval

- - halaga ng pagitan

- - dalas ng agwat ng modal

- - dalas ng agwat bago ang modal

- - dalas ng agwat kasunod ng modal

Median - ito ang halaga ng feature na sumasailalim sa ranggo na serye at hinahati ang seryeng ito sa dalawang bahagi na pantay sa bilang.

Upang matukoy ang median sa discrete na serye sa pagkakaroon ng mga frequency, ang kalahating kabuuan ng mga frequency ay unang kinakalkula, at pagkatapos ay tinutukoy kung anong halaga ng variant ang nahuhulog dito. (Kung ang pinagsunod-sunod na row ay naglalaman ng kakaibang bilang ng mga feature, ang median na numero ay kinakalkula ng formula:

M e \u003d (n (bilang ng mga tampok sa pinagsama-samang) + 1) / 2,

sa kaso ng pantay na bilang ng mga feature, ang median ay magiging katumbas ng average ng dalawang feature sa gitna ng row).

Kapag nagkalkula median para sa isang serye ng pagkakaiba-iba ng pagitan, tukuyin muna ang median interval kung saan matatagpuan ang median, at pagkatapos ay ang halaga ng median ayon sa formula:

- ay ang nais na median

- ay ang lower bound ng interval na naglalaman ng median

- - halaga ng pagitan

- - ang kabuuan ng mga frequency o ang bilang ng mga miyembro ng serye

Ang kabuuan ng mga naipon na frequency ng mga pagitan bago ang median

- ay ang dalas ng median na pagitan

Halimbawa. Hanapin ang mode at median.

Desisyon:
Sa halimbawang ito, ang modal interval ay nasa loob ng pangkat ng edad na 25-30 taon, dahil ang agwat na ito ay tumutukoy sa pinakamataas na dalas (1054).

Kalkulahin natin ang halaga ng mode:

Nangangahulugan ito na ang modal age ng mga mag-aaral ay 27 taon.

Kalkulahin ang median. Ang median interval ay nasa pangkat ng edad 25-30 taon, dahil sa loob ng pagitan na ito ay mayroong isang variant na naghahati sa populasyon sa dalawang pantay na bahagi (Σf i /2 = 3462/2 = 1731). Susunod, pinapalitan namin ang kinakailangang numerical data sa formula at makuha ang halaga ng median:

Nangangahulugan ito na ang kalahati ng mga mag-aaral ay wala pang 27.4 taong gulang, at ang kalahati ay higit sa 27.4 taong gulang.

Bilang karagdagan sa mode at median, ang mga tagapagpahiwatig tulad ng mga quartile ay maaaring gamitin, na naghahati sa ranggo na serye sa 4 na pantay na bahagi, decile- 10 bahagi at porsyento - bawat 100 bahagi.

Ang konsepto ng selective observation at saklaw nito.

Selective observation nalalapat kapag naglalapat ng tuluy-tuloy na pagmamasid pisikal na imposible dahil sa malaking halaga ng data o hindi praktikal sa ekonomiya. Ang pisikal na imposibilidad ay nangyayari, halimbawa, kapag pinag-aaralan ang mga daloy ng pasahero, mga presyo sa merkado, mga badyet ng pamilya. Ang kakulangan sa ekonomiya ay nangyayari kapag tinatasa ang kalidad ng mga kalakal na nauugnay sa kanilang pagkasira, halimbawa, pagtikim, pagsubok ng mga brick para sa lakas, atbp.

Ang mga yunit ng istatistika na pinili para sa pagmamasid ay bumubuo ng isang sample o sample, at ang kanilang buong hanay - ang pangkalahatang populasyon (GS). Sa kasong ito, ang bilang ng mga yunit sa sample ay nagpapahiwatig n, at sa buong HS - N. Saloobin n/N tinatawag na relatibong laki o proporsyon ng sample.

Ang kalidad ng mga resulta ng sampling ay nakasalalay sa pagiging kinatawan ng sample, ibig sabihin, kung gaano ito kinatawan sa HS. Upang matiyak ang pagiging kinatawan ng sample, kinakailangan na obserbahan prinsipyo ng random na pagpili ng mga yunit, na ipinapalagay na ang pagsasama ng isang unit ng HS sa sample ay hindi maaaring maimpluwensyahan ng anumang iba pang salik maliban sa pagkakataon.

Umiiral 4 na paraan ng random na pagpili magpakita ng halimbawa:

  1. Talagang random pagpili o "paraan ng lotto", kapag ang mga serial number ay itinalaga sa mga istatistikal na halaga, ipinasok sa ilang partikular na bagay (halimbawa, mga kegs), na pagkatapos ay ihalo sa ilang lalagyan (halimbawa, sa isang bag) at pinili nang random. Sa pagsasagawa, ang pamamaraang ito ay isinasagawa gamit ang isang generator random na mga numero o mga mathematical table ng mga random na numero.
  2. Mekanikal pagpili, ayon sa kung saan ang bawat ( N/n)-ika halaga ng pangkalahatang populasyon. Halimbawa, kung naglalaman ito ng 100,000 na halaga, at gusto mong pumili ng 1,000, ang bawat 100,000 / 1000 = ika-100 na halaga ay mahuhulog sa sample. Bukod dito, kung hindi sila niraranggo, ang una ay pinili nang random mula sa unang daan, at ang mga bilang ng iba ay magiging isang daan pa. Halimbawa, kung ang unit number 19 ang nauna, dapat ay number 119 ang susunod, pagkatapos ay number 219, pagkatapos ay number 319, at iba pa. Kung ang mga yunit ng populasyon ay niraranggo, pagkatapos ay #50 ang unang pipiliin, pagkatapos ay #150, pagkatapos ay #250, at iba pa.
  3. Ang pagpili ng mga halaga mula sa isang magkakaibang hanay ng data ay isinasagawa pinagsasapin-sapin(stratified) na paraan, kapag ang pangkalahatang populasyon ay dati nang nahahati sa mga homogenous na grupo, kung saan inilalapat ang random o mekanikal na pagpili.
  4. Ang isang espesyal na paraan ng sampling ay serial pagpili, kung saan hindi indibidwal na dami ang random o mekanikal na pinili, ngunit ang kanilang serye (mga pagkakasunud-sunod mula sa ilang numero hanggang sa ilang sunod-sunod), kung saan isinasagawa ang patuloy na pagmamasid.

Ang kalidad ng mga sample na obserbasyon ay nakasalalay din sa uri ng sampling: paulit-ulit o hindi paulit-ulit.

Sa muling pagpili ang mga istatistikal na halaga o ang kanilang serye na nahulog sa sample ay ibinalik sa pangkalahatang populasyon pagkatapos gamitin, na may pagkakataong makapasok sa isang bagong sample. Kasabay nito, ang lahat ng mga halaga ng pangkalahatang populasyon ay may parehong posibilidad na maisama sa sample.

Hindi paulit-ulit na pagpili nangangahulugan na ang mga istatistikal na halaga o ang kanilang mga serye na kasama sa sample ay hindi ibinalik sa pangkalahatang populasyon pagkatapos gamitin, at samakatuwid ang posibilidad na makapasok sa susunod na sample ay tumataas para sa natitirang mga halaga ng huli.

Ang hindi paulit-ulit na sampling ay nagbibigay ng mas tumpak na mga resulta, kaya mas madalas itong ginagamit. Ngunit may mga sitwasyon na hindi ito mailalapat (pag-aaral ng mga daloy ng pasahero, demand ng mamimili atbp.) at pagkatapos ay isasagawa ang muling pagpili.

Ang marginal error ng observation sample, ang average na error ng sample, ang pagkakasunud-sunod kung saan sila kinakalkula.

Isaalang-alang natin nang detalyado ang mga pamamaraan sa itaas ng pagbuo ng isang sample na populasyon at ang mga pagkakamali na lumitaw sa kasong ito. pagiging kinatawan .
Actually-random ang sample ay batay sa pagpili ng mga yunit mula sa pangkalahatang populasyon nang random nang walang anumang mga elemento ng pagkakapare-pareho. Sa teknikal, ang wastong random na pagpili ay isinasagawa sa pamamagitan ng pagguhit ng mga lot (halimbawa, mga lottery) o sa pamamagitan ng isang talahanayan ng mga random na numero.

Wastong random na pagpili purong anyo» ay bihirang ginagamit sa pagsasagawa ng selective observation, ngunit ito ang inisyal sa iba pang uri ng pagpili, ito ay nagpapatupad ng mga pangunahing prinsipyo ng selective observation. Isaalang-alang ang ilang mga katanungan ng teorya paraan ng sampling at mga formula ng error para sa isang simpleng random na sample.

Error sa pag-sample- ito ang pagkakaiba sa pagitan ng halaga ng parameter sa pangkalahatang populasyon, at ang halaga nito na kinakalkula mula sa mga resulta ng sample na pagmamasid. Para sa isang average na quantitative na katangian, ang sampling error ay tinutukoy ng

Ang tagapagpahiwatig ay tinatawag na marginal sampling error.
Ang sample mean ay isang random na variable na maaaring tumagal sa iba't ibang mga halaga depende sa kung aling mga unit ang nasa sample. Samakatuwid, ang mga sampling error ay mga random na variable din at maaaring tumagal sa iba't ibang mga halaga. Samakatuwid, tukuyin ang average ng mga posibleng error - ibig sabihin ng sampling error, na nakasalalay sa:

Laki ng sample: mas malaki ang numero, mas maliit ang average na error;

Ang antas ng pagbabago ng pinag-aralan na katangian: mas maliit ang pagkakaiba-iba ng katangian, at, dahil dito, ang pagkakaiba, mas kaunti ibig sabihin ng pagkakamali mga sample.

Sa random na muling pagpili ang average na error ay kinakalkula:
.
Sa pagsasagawa, ang pangkalahatang pagkakaiba ay hindi eksaktong kilala, ngunit sa teorya ng posibilidad napatunayan na
.
Dahil ang halaga para sa sapat na malaking n ay malapit sa 1, maaari nating ipagpalagay na . Pagkatapos ay maaaring kalkulahin ang mean sampling error:
.
Ngunit sa mga kaso ng isang maliit na sample (para sa n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Sa random sampling ang mga ibinigay na formula ay itinatama ng halaga. Kung gayon ang average na error ng non-sampling ay:
at .
kasi ay palaging mas mababa sa , pagkatapos ang salik () ay palaging mas mababa sa 1. Nangangahulugan ito na ang average na error sa hindi paulit-ulit na pagpili ay palaging mas mababa kaysa sa paulit-ulit na pagpili.
Mechanical sampling ay ginagamit kapag ang pangkalahatang populasyon ay inayos sa ilang paraan (halimbawa, mga listahan ng botante sa alpabetikong pagkakasunud-sunod, mga numero ng telepono, mga numero ng bahay, mga apartment). Ang pagpili ng mga yunit ay isinasagawa sa isang tiyak na agwat, na katumbas ng katumbas ng porsyento ng sample. Kaya, na may 2% sample, bawat 50 unit = 1 / 0.02 ay pinili, na may 5%, bawat 1 / 0.05 = 20 unit ng pangkalahatang populasyon.

Ang pinagmulan ay pinili sa iba't ibang paraan: random, mula sa gitna ng pagitan, na may pagbabago sa pinagmulan. Ang pangunahing bagay ay upang maiwasan ang sistematikong pagkakamali. Halimbawa, na may 5% na sample, kung ang ika-13 ay pinili bilang unang yunit, pagkatapos ay ang susunod na 33, 53, 73, atbp.

Sa mga tuntunin ng katumpakan, ang mekanikal na pagpili ay malapit sa wastong random sampling. Samakatuwid, upang matukoy ang average na error ng mechanical sampling, ginagamit ang mga formula ng tamang random na pagpili.

Sa tipikal na seleksyon ang na-survey na populasyon ay preliminarily nahahati sa homogenous, single-type na mga grupo. Halimbawa, kapag nagsusuri ng mga negosyo, ang mga ito ay maaaring mga industriya, mga sub-sektor, habang pinag-aaralan ang populasyon - mga lugar, panlipunan o mga pangkat ng edad. Pagkatapos ang isang independiyenteng pagpili ay ginawa mula sa bawat pangkat sa isang mekanikal o wastong random na paraan.

Ang karaniwang sampling ay nagbibigay ng mas tumpak na mga resulta kaysa sa iba pang mga pamamaraan. Tinitiyak ng typification ng pangkalahatang populasyon ang representasyon ng bawat typological group sa sample, na ginagawang posible na ibukod ang impluwensya ng pagkakaiba-iba ng intergroup sa average na error sa sample. Samakatuwid, kapag hinahanap ang error ng isang tipikal na sample ayon sa panuntunan ng pagdaragdag ng mga pagkakaiba-iba (), kinakailangang isaalang-alang lamang ang average ng mga pagkakaiba-iba ng grupo. Kung gayon ang mean sampling error ay:
sa muling pagpili
,
na may hindi paulit-ulit na pagpili
,
saan ay ang ibig sabihin ng mga pagkakaiba-iba ng intra-grupo sa sample.

Serial (o nested) na seleksyon ginagamit kapag ang populasyon ay nahahati sa serye o mga grupo bago magsimula ang sample survey. Ang mga seryeng ito ay maaaring mga pakete ng mga natapos na produkto, mga grupo ng mag-aaral, mga koponan. Ang mga serye para sa pagsusuri ay pinili nang wala sa loob o random, at sa loob ng serye ay isinasagawa ang isang kumpletong survey ng mga yunit. Samakatuwid, ang average sampling error ay nakasalalay lamang sa intergroup (interseries) variance, na kinakalkula ng formula:

kung saan ang r ay ang bilang ng napiling serye;
- ang average ng i-th series.

Kinakalkula ang average na serial sampling error:

kapag muling pinili:
,
na may hindi paulit-ulit na pagpili:
,
kung saan ang R ay ang kabuuang bilang ng mga serye.

pinagsama-sama pagpili ay isang kumbinasyon ng mga itinuturing na paraan ng pagpili.

Ang average na error sa pag-sample para sa anumang paraan ng pagpili ay higit sa lahat ay nakasalalay sa ganap na laki ng sample at, sa mas mababang lawak, sa porsyento ng sample. Ipagpalagay na 225 obserbasyon ang ginawa sa unang kaso mula sa isang populasyon na 4,500 na yunit at sa pangalawang kaso, mula sa 225,000 na mga yunit. Ang mga pagkakaiba sa parehong mga kaso ay katumbas ng 25. Pagkatapos, sa unang kaso, na may 5% na pagpili, ang sampling error ay magiging:

Sa pangalawang kaso, na may 0.1% na seleksyon, ito ay magiging katumbas ng:


Sa ganitong paraan, na may pagbaba sa porsyento ng sample ng 50 beses, bahagyang tumaas ang error sa sample, dahil hindi nagbago ang laki ng sample.
Ipagpalagay na ang laki ng sample ay nadagdagan sa 625 na mga obserbasyon. Sa kasong ito, ang sampling error ay:

Ang pagtaas sa sample ng 2.8 beses na may parehong laki ng pangkalahatang populasyon ay binabawasan ang laki ng error sa sampling ng higit sa 1.6 na beses.

Mga pamamaraan at paraan ng pagbuo ng sample na populasyon.

Sa mga istatistika, ginagamit ang iba't ibang paraan ng pagbuo ng mga sample set, na tinutukoy ng mga layunin ng pag-aaral at nakasalalay sa mga detalye ng bagay ng pag-aaral.

Ang pangunahing kondisyon para sa pagsasagawa ng sample na survey ay upang maiwasan ang paglitaw ng mga sistematikong error na nagmumula sa paglabag sa prinsipyo ng pantay na pagkakataon para sa bawat yunit ng pangkalahatang populasyon na makapasok sa sample. Ang pag-iwas sa mga sistematikong pagkakamali ay nakamit bilang resulta ng paggamit ng mga pamamaraang nakabatay sa siyentipiko para sa pagbuo ng isang sample na populasyon.

Mayroong mga sumusunod na paraan upang pumili ng mga yunit mula sa pangkalahatang populasyon:

1) indibidwal na pagpili - ang mga indibidwal na yunit ay pinili sa sample;

2) pagpili ng grupo - ang mga qualitatively homogenous na mga grupo o serye ng mga yunit sa ilalim ng pag-aaral ay nahulog sa sample;

3) pinagsamang pagpili ay isang kumbinasyon ng indibidwal at pangkat na pagpili.
Ang mga paraan ng pagpili ay tinutukoy ng mga patakaran para sa pagbuo ng sampling na populasyon.

Ang sample ay maaaring:

  • tamang random ay binubuo sa katotohanan na ang sample ay nabuo bilang isang resulta ng random (hindi sinasadya) na pagpili ng mga indibidwal na yunit mula sa pangkalahatang populasyon. Sa kasong ito, ang bilang ng mga yunit na napili sa sample set ay karaniwang tinutukoy batay sa tinatanggap na proporsyon ng sample. Ang sample share ay ang ratio ng bilang ng mga unit sa sample na populasyon n sa bilang ng mga unit sa pangkalahatang populasyon N, i.e.
  • mekanikal ay binubuo sa katotohanan na ang pagpili ng mga yunit sa sample ay ginawa mula sa pangkalahatang populasyon, na nahahati sa pantay na pagitan (mga grupo). Sa kasong ito, ang laki ng agwat sa pangkalahatang populasyon ay katumbas ng kapalit ng proporsyon ng sample. Kaya, na may 2% sample, bawat ika-50 na unit ay pinipili (1:0.02), na may 5% na sample, bawat ika-20 na unit (1:0.05), atbp. Kaya, alinsunod sa tinatanggap na proporsyon ng pagpili, ang pangkalahatang populasyon ay, bilang ito ay, mekanikal na nahahati sa pantay na mga grupo. Isang yunit lamang ang pipiliin mula sa bawat pangkat sa sample.
  • tipikal - kung saan ang pangkalahatang populasyon ay unang nahahati sa homogenous na tipikal na mga grupo. Pagkatapos, mula sa bawat tipikal na grupo, ang isang indibidwal na pagpili ng mga yunit sa sample ay ginawa ng isang random o mekanikal na sample. Ang isang mahalagang tampok ng isang tipikal na sample ay ang nagbibigay ito ng mas tumpak na mga resulta kumpara sa iba pang mga paraan ng pagpili ng mga yunit sa isang sample;
  • serial- kung saan ang pangkalahatang populasyon ay nahahati sa mga grupo ng parehong laki - serye. Pinili ang mga serye sa sample set. Sa loob ng serye, isinasagawa ang patuloy na pagmamasid sa mga yunit na nahulog sa serye;
  • pinagsama-sama- Ang sampling ay maaaring dalawang yugto. Sa kasong ito, ang pangkalahatang populasyon ay nahahati muna sa mga grupo. Pagkatapos ay pipiliin ang mga grupo, at sa loob ng huli, pipiliin ang mga indibidwal na yunit.

Sa mga istatistika, ang mga sumusunod na paraan ng pagpili ng mga yunit sa isang sample ay nakikilala::

  • iisang yugto sample - ang bawat napiling unit ay agad na sasailalim sa pag-aaral sa isang partikular na batayan (talagang random at serial sample);
  • multistage sampling - ang pagpili ay ginawa mula sa pangkalahatang populasyon ng mga indibidwal na grupo, at ang mga indibidwal na yunit ay pinili mula sa mga grupo (isang tipikal na sample na may mekanikal na paraan ng pagpili ng mga yunit sa sample na populasyon).

Bilang karagdagan, mayroong:

  • muling pagpili- ayon sa scheme ng ibinalik na bola. Sa kasong ito, ang bawat yunit o serye na nahulog sa sample ay ibinalik sa pangkalahatang populasyon at samakatuwid ay may pagkakataong maisama muli sa sample;
  • hindi paulit-ulit na pagpili- ayon sa pamamaraan ng hindi naibalik na bola. Mayroon itong mas tumpak na mga resulta para sa parehong laki ng sample.

Pagpapasiya ng kinakailangang laki ng sample (gamit ang talahanayan ng Mag-aaral).

Ang isa sa mga siyentipikong prinsipyo sa teorya ng sampling ay upang matiyak na ang isang sapat na bilang ng mga yunit ay napili. Theoretically, ang pangangailangan na sumunod sa prinsipyong ito ay ipinakita sa mga patunay ng limitasyon ng theorems ng probability theory, na nagbibigay-daan sa iyo upang maitaguyod kung gaano karaming mga yunit ang dapat piliin mula sa pangkalahatang populasyon upang ito ay sapat at matiyak ang pagiging kinatawan ng sample.

Ang pagbaba sa karaniwang error ng sample, at, dahil dito, ang pagtaas sa katumpakan ng pagtatantya ay palaging nauugnay sa isang pagtaas sa laki ng sample, samakatuwid, nasa yugto na ng pag-aayos ng isang sample na pagmamasid, kinakailangan na magpasya kung ano ang dapat na sukat ng sample upang matiyak ang kinakailangang katumpakan ng mga resulta ng pagmamasid. Ang pagkalkula ng kinakailangang laki ng sample ay binuo gamit ang mga formula na nagmula sa mga formula para sa marginal sampling error (A), na tumutugma sa isa o ibang uri at paraan ng pagpili. Kaya, para sa isang random na paulit-ulit na laki ng sample (n), mayroon kaming:

Ang kakanyahan ng formula na ito ay na sa isang random na muling pagpili ng kinakailangang numero, ang laki ng sample ay direktang proporsyonal sa parisukat ng koepisyent ng kumpiyansa (t2) at variance ng variation feature (?2) at inversely proportional sa square ng marginal sampling error (?2). Sa partikular, sa pamamagitan ng pagdodoble sa marginal error, ang kinakailangang laki ng sample ay maaaring bawasan ng apat na salik. Sa tatlong parameter, dalawa (t at?) ang itinakda ng mananaliksik.

Kasabay nito, ang mananaliksik Para sa mga layunin ng sample na survey, ang tanong ay dapat mapagpasyahan: sa anong dami ng kumbinasyon ang mas mahusay na isama ang mga parameter na ito upang maibigay ang pinakamainam na variant? Sa isang kaso, maaaring mas nasiyahan siya sa pagiging maaasahan ng mga resulta na nakuha (t) kaysa sa sukatan ng katumpakan (?), sa kabilang banda - vice versa. Mas mahirap lutasin ang isyu tungkol sa halaga ng marginal sampling error, dahil ang mananaliksik ay walang indicator na ito sa yugto ng pagdidisenyo ng sample na obserbasyon, samakatuwid, sa pagsasagawa, kaugalian na itakda ang marginal sampling error, bilang isang panuntunan, sa loob ng 10% ng inaasahang average na antas ng katangian. Ang pagtatatag ng isang ipinapalagay na average na antas ay maaaring lapitan sa iba't ibang paraan: gamit ang data mula sa mga katulad na nakaraang survey, o paggamit ng data mula sa sampling frame at pagkuha ng maliit na pilot sample.

Ang pinakamahirap na bagay na itatag kapag nagdidisenyo ng isang sample na pagmamasid ay ang ikatlong parameter sa formula (5.2) - ang pagkakaiba-iba ng sample na populasyon. Sa kasong ito, kinakailangang gamitin ang lahat ng impormasyong magagamit ng imbestigador, na nakuha mula sa mga nakaraang katulad at pilot na survey.

Tanong ng kahulugan Ang kinakailangang laki ng sample ay nagiging mas kumplikado kung ang sample na survey ay nagsasangkot ng pag-aaral ng ilang mga tampok ng mga sampling unit. Sa kasong ito, ang mga average na antas ng bawat isa sa mga katangian at ang kanilang pagkakaiba-iba, bilang panuntunan, ay magkakaiba, at samakatuwid ay posible na magpasya kung aling pagpapakalat kung alin sa mga katangian ang bibigyan ng kagustuhan na isinasaalang-alang lamang ang layunin at layunin ng ang survey.

Kapag nagdidisenyo ng isang sample na pagmamasid, ang isang paunang natukoy na halaga ng pinahihintulutang sampling error ay ipinapalagay alinsunod sa mga layunin ng isang partikular na pag-aaral at ang posibilidad ng mga konklusyon batay sa mga resulta ng pagmamasid.

Sa pangkalahatan, binibigyang-daan ka ng formula para sa marginal error ng sample mean value na matukoy ang:

Ang laki ng posibleng mga paglihis ng mga tagapagpahiwatig ng pangkalahatang populasyon mula sa mga tagapagpahiwatig ng sample na populasyon;

Ang kinakailangang laki ng sample, na nagbibigay ng kinakailangang katumpakan, kung saan ang mga limitasyon ng isang posibleng error ay hindi lalampas sa isang tiyak na tinukoy na halaga;

Ang posibilidad na ang error sa sample ay magkakaroon ng ibinigay na limitasyon.

Pamamahagi ng mag-aaral sa probability theory, ito ay isang isang-parameter na pamilya ng ganap na tuluy-tuloy na mga distribusyon.

Serye ng dynamics (interval, moment), pagsasara ng serye ng dynamics.

Serye ng dynamics- ito ang mga halaga ng mga istatistikal na tagapagpahiwatig na ipinakita sa isang tiyak na pagkakasunud-sunod na magkakasunod.

Ang bawat serye ng oras ay naglalaman ng dalawang bahagi:

1) mga tagapagpahiwatig ng mga yugto ng panahon (taon, quarters, buwan, araw o petsa);

2) mga tagapagpahiwatig na nagpapakilala sa bagay na pinag-aaralan para sa mga yugto ng panahon o sa mga kaukulang petsa, na tinatawag na mga antas ng serye.

Ang mga antas ng serye ay ipinahayag parehong absolute at average o relative values. Depende sa likas na katangian ng mga tagapagpahiwatig, ang mga dinamikong serye ng ganap, kamag-anak at average na mga halaga ay binuo. Ang mga dinamikong serye ng mga kamag-anak at average na mga halaga ay itinayo batay sa derivative na serye ng mga ganap na halaga. Mayroong agwat at sandali na serye ng mga dinamika.

Mga serye ng dynamic na pagitan naglalaman ng mga halaga ng mga tagapagpahiwatig para sa ilang mga tagal ng panahon. Sa serye ng agwat, ang mga antas ay maaaring summed up, pagkuha ng dami ng kababalaghan para sa isang mas mahabang panahon, o ang tinatawag na accumulated totals.

Mga serye ng dinamikong sandali sumasalamin sa mga halaga ng mga tagapagpahiwatig sa isang tiyak na punto ng oras (petsa ng oras). Sa serye ng sandali, maaaring interesado lang ang mananaliksik sa pagkakaiba ng mga phenomena, na sumasalamin sa pagbabago sa antas ng serye sa pagitan ng ilang partikular na petsa, dahil ang kabuuan ng mga antas dito ay walang tunay na nilalaman. Ang mga pinagsama-samang kabuuan ay hindi kinakalkula dito.

Ang pinakamahalagang kundisyon para sa tamang pagbuo ng dynamic na serye ay ang pagiging maihahambing ng mga antas ng serye na nauugnay sa iba't ibang panahon. Ang mga antas ay dapat iharap sa magkakatulad na dami, dapat mayroong parehong pagkakumpleto ng saklaw ng iba't ibang bahagi ng kababalaghan.

Nang sa gayon Upang maiwasan ang pagbaluktot sa tunay na dinamika, ang mga paunang kalkulasyon ay isinasagawa sa istatistikal na pag-aaral (ang pagsasara ng serye ng oras), na nauuna sa istatistikal na pagsusuri ng serye ng oras. Ang pagsasara ng serye ng oras ay nauunawaan bilang kumbinasyon ng dalawa o higit pang serye sa isang serye, ang mga antas nito ay kinakalkula ayon sa iba't ibang pamamaraan o hindi tumutugma sa mga hangganan ng teritoryo, atbp. Ang pagsasara ng serye ng mga dinamika ay maaari ring magpahiwatig ng pagbabawas ng ganap na antas ng serye ng mga dinamika sa isang karaniwang batayan, na nag-aalis ng hindi pagkakatugma ng mga antas ng serye ng mga dinamika.

Ang konsepto ng comparability ng time series, coefficients, growth at growth rate.

Serye ng dynamics- ito ay mga serye ng mga istatistikal na tagapagpahiwatig na nagpapakilala sa pag-unlad ng natural at panlipunang phenomena sa oras. Ang mga koleksyon ng istatistika na inilathala ng Komite ng Istatistika ng Estado ng Russia ay naglalaman ng isang malaking bilang ng mga serye ng oras sa anyong tabular. Ang mga serye ng dinamika ay nagbibigay-daan sa pagbubunyag ng mga pattern ng pag-unlad ng mga pinag-aralan na phenomena.

Ang serye ng oras ay naglalaman ng dalawang uri ng mga tagapagpahiwatig. Mga tagapagpahiwatig ng oras(mga taon, quarter, buwan, atbp.) o mga punto sa oras (sa simula ng taon, sa simula ng bawat buwan, atbp.). Mga tagapagpahiwatig ng antas ng hilera. Ang mga tagapagpahiwatig ng mga antas ng serye ng oras ay maaaring ipahayag sa mga ganap na halaga (produksyon ng isang produkto sa tonelada o rubles), mga kamag-anak na halaga (bahagi ng populasyon ng lunsod sa%) at mga average na halaga (average na sahod ng mga manggagawa sa industriya sa pamamagitan ng mga taon, atbp.). Sa anyong tabular, ang serye ng oras ay naglalaman ng dalawang column o dalawang row.

Ang tamang pagtatayo ng time series ay nagsasangkot ng katuparan ng ilang mga kinakailangan:

  1. lahat ng mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat na siyentipikong pinatunayan, maaasahan;
  2. ang mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat na maihahambing sa oras, i.e. dapat kalkulahin para sa parehong mga yugto ng panahon o sa parehong mga petsa;
  3. ang mga tagapagpahiwatig ng isang bilang ng mga dinamika ay dapat na maihahambing sa buong teritoryo;
  4. ang mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat na maihahambing sa nilalaman, i.e. kinakalkula ayon sa isang solong pamamaraan, sa parehong paraan;
  5. ang mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat na maihahambing sa hanay ng mga sakahan na isinasaalang-alang. Ang lahat ng mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat ibigay sa parehong mga yunit ng pagsukat.

Mga tagapagpahiwatig ng istatistika maaaring makilala ang alinman sa mga resulta ng prosesong pinag-aaralan sa loob ng isang yugto ng panahon, o ang estado ng hindi pangkaraniwang bagay na pinag-aaralan sa isang tiyak na punto ng panahon, i.e. Ang mga tagapagpahiwatig ay maaaring agwat (pana-panahon) at instant. Alinsunod dito, sa simula ang serye ng mga dinamika ay maaaring alinman sa pagitan o sandali. Ang serye ng sandali ng dynamics, sa turn, ay maaaring may pantay at hindi pantay na agwat ng oras.

Ang paunang serye ng mga dinamika ay maaaring ma-convert sa isang serye ng mga average na halaga at isang serye ng mga kamag-anak na halaga (chain at base). Ang nasabing serye ng oras ay tinatawag na derived time series.

Ang paraan ng pagkalkula ng average na antas sa serye ng dynamics ay iba, dahil sa uri ng serye ng dynamics. Gamit ang mga halimbawa, isaalang-alang ang mga uri ng serye ng oras at mga formula para sa pagkalkula ng average na antas.

Ganap na mga nadagdag (Δy) ipakita kung gaano karaming mga yunit ang nabago ng kasunod na antas ng serye kumpara sa nauna (hanay 3. - chain absolute increments) o kumpara sa unang antas (column 4. - basic absolute increments). Ang mga formula ng pagkalkula ay maaaring isulat bilang mga sumusunod:

Sa isang pagbawas sa ganap na mga halaga ng serye, magkakaroon ng "pagbaba", "pagbaba", ayon sa pagkakabanggit.

Ang mga tagapagpahiwatig ng ganap na paglago ay nagpapahiwatig na, halimbawa, noong 1998 ang produksyon ng produktong "A" ay tumaas ng 4,000 tonelada kumpara noong 1997, at ng 34,000 tonelada kumpara noong 1994; para sa iba pang mga taon, tingnan ang talahanayan. 11.5 gr. 3 at 4.

Paglago kadahilanan nagpapakita kung ilang beses nagbago ang antas ng serye kumpara sa nauna (column 5 - chain growth o decline factors) o kumpara sa paunang level (column 6 - basic growth o decline factors). Ang mga formula ng pagkalkula ay maaaring isulat bilang mga sumusunod:

Mga rate ng paglago ipakita kung gaano karaming porsyento ang susunod na antas ng serye ay inihambing sa nauna (kolumna 7 - mga rate ng paglago ng chain) o inihambing sa paunang antas (kolumna 8 - pangunahing mga rate ng paglago). Ang mga formula ng pagkalkula ay maaaring isulat bilang mga sumusunod:

Kaya, halimbawa, noong 1997, ang dami ng produksyon ng produkto na "A" kumpara noong 1996 ay 105.5% (

Rate ng paglago ipakita kung gaano karaming porsyento ang pagtaas ng antas ng panahon ng pag-uulat kumpara sa nauna (kolumna 9 - mga rate ng paglago ng chain) o kumpara sa paunang antas (kolumna 10 - mga pangunahing rate ng paglago). Ang mga formula ng pagkalkula ay maaaring isulat bilang mga sumusunod:

T pr \u003d T p - 100% o T pr \u003d ganap na pagtaas / antas ng nakaraang panahon * 100%

Kaya, halimbawa, noong 1996, kumpara noong 1995, ang produktong "A" ay ginawa nang higit pa ng 3.8% (103.8% - 100%) o (8:210) x 100%, at kumpara noong 1994. - ng 9% ( 109% - 100%).

Kung bumaba ang ganap na mga antas sa serye, ang rate ay magiging mas mababa sa 100% at, nang naaayon, magkakaroon ng rate ng pagtanggi (rate ng paglago na may minus sign).

Ganap na halaga ng 1% na pagtaas(column 11) ay nagpapakita kung gaano karaming mga yunit ang dapat gawin sa isang naibigay na panahon upang ang antas ng nakaraang panahon ay tumaas ng 1%. Sa aming halimbawa, noong 1995 kinakailangan na gumawa ng 2.0 libong tonelada, at noong 1998 - 2.3 libong tonelada, i.e. mas malaki.

Mayroong dalawang paraan upang matukoy ang laki ng ganap na halaga ng 1% na paglago:

Hatiin ang antas ng nakaraang panahon ng 100;

Hatiin ang ganap na mga rate ng paglago ng chain sa mga katumbas na rate ng paglago ng chain.

Ganap na halaga ng 1% na pagtaas =

Sa dynamics, lalo na sa mahabang panahon, mahalagang sama-samang pag-aralan ang rate ng paglago sa nilalaman ng bawat pagtaas o pagbaba ng porsyento.

Tandaan na ang itinuturing na pamamaraan para sa pagsusuri ng mga serye ng oras ay naaangkop kapwa para sa mga serye ng oras, ang mga antas ng kung saan ay ipinahayag sa mga ganap na halaga (t, libong rubles, ang bilang ng mga empleyado, atbp.), At para sa serye ng oras, ang mga antas ng na ipinahayag sa mga relatibong tagapagpahiwatig (% ng scrap , % ash na nilalaman ng karbon, atbp.) o mga average na halaga (average na ani sa c/ha, average na sahod, atbp.).

Kasama ng mga itinuturing na analytical indicator na kinakalkula para sa bawat taon kumpara sa nauna o paunang antas, kapag sinusuri ang serye ng oras, kinakailangang kalkulahin ang average na analytical indicator para sa panahon: ang average na antas ng serye, ang average na taunang ganap na pagtaas (pagbaba) at ang average na taunang rate ng paglago at rate ng paglago.

Ang mga pamamaraan para sa pagkalkula ng average na antas ng isang serye ng mga dinamika ay tinalakay sa itaas. Sa pagitan ng serye ng dinamika na aming isinasaalang-alang, ang average na antas ng serye ay kinakalkula ng formula ng arithmetic mean simple:

Ang average na taunang output ng produkto para sa 1994-1998. umabot sa 218.4 libong tonelada.

Ang average na taunang ganap na pagtaas ay kinakalkula din ng formula ng simpleng arithmetic mean:

Ang taunang ganap na mga pagtaas ay nag-iba sa mga taon mula 4 hanggang 12 libong tonelada (tingnan ang gr. 3), at ang average na taunang pagtaas ng produksyon para sa panahon ng 1995 - 1998. umabot sa 8.5 libong tonelada.

Ang mga pamamaraan para sa pagkalkula ng average na rate ng paglago at ang average na rate ng paglago ay nangangailangan ng mas detalyadong pagsasaalang-alang. Isaalang-alang natin ang mga ito sa halimbawa ng taunang mga tagapagpahiwatig ng antas ng serye na ibinigay sa talahanayan.

Ang gitnang antas ng hanay ng mga dinamika.

Serye ng dynamics (o time series)- ito ang mga numerical na halaga ng isang tiyak na istatistikal na tagapagpahiwatig sa magkakasunod na sandali o yugto ng panahon (i.e. nakaayos sa magkakasunod na pagkakasunud-sunod).

Ang mga numerong halaga ng isang partikular na tagapagpahiwatig ng istatistika na bumubuo sa isang serye ng mga dinamika ay tinatawag antas ng isang numero at karaniwang tinutukoy ng titik y. Unang miyembro ng serye y 1 tinatawag na inisyal o baseline, at ang huli y n - pangwakas. Ang mga sandali o yugto ng panahon kung saan ang mga antas ay tinutukoy ng t.

Ang mga dinamikong serye, bilang panuntunan, ay ipinakita sa anyo ng isang talahanayan o graph, at ang isang sukat ng oras ay binuo sa kahabaan ng x-axis t, at kasama ang ordinate - ang sukat ng mga antas ng serye y.

Mga average na tagapagpahiwatig ng isang serye ng mga dinamika

Ang bawat serye ng dynamics ay maaaring ituring bilang isang tiyak na hanay n mga tagapagpahiwatig na nag-iiba-iba ng oras na maaaring ibuod bilang mga average. Ang mga naturang pangkalahatang (average) na mga tagapagpahiwatig ay kinakailangan lalo na kapag inihahambing ang mga pagbabago sa isa o ibang tagapagpahiwatig sa iba't ibang mga panahon, sa iba't ibang mga bansa, atbp.

Ang isang pangkalahatang katangian ng isang serye ng mga dinamika ay maaaring, una sa lahat, average na antas ng hilera. Ang paraan ng pagkalkula ng average na antas ay depende sa kung ito ay isang serye ng sandali o isang serye ng pagitan (panahon).

Kailan pagitan serye, ang average na antas nito ay tinutukoy ng formula ng isang simpleng arithmetic mean ng mga antas ng serye, i.e.

=
Kung bakante sandali hilera na naglalaman ng n antas ( y1, y2, …, yn) na may pantay na pagitan sa pagitan ng mga petsa (mga punto ng oras), kung gayon ang naturang serye ay madaling ma-convert sa isang serye ng mga average na halaga. Kasabay nito, ang tagapagpahiwatig (antas) sa simula ng bawat panahon ay sabay-sabay na tagapagpahiwatig sa pagtatapos ng nakaraang panahon. Pagkatapos ay ang average na halaga ng indicator para sa bawat panahon (interval sa pagitan ng mga petsa) ay maaaring kalkulahin bilang kalahating kabuuan ng mga halaga sa sa simula at katapusan ng panahon, i.e. Paano . Ang bilang ng naturang mga average ay magiging . Tulad ng nabanggit kanina, para sa serye ng mga average, ang average na antas ay kinakalkula mula sa arithmetic average.

Samakatuwid, maaari tayong sumulat:
.
Pagkatapos ma-convert ang numerator, nakukuha natin ang:
,

saan Y1 at Yn- ang una at huling mga antas ng serye; Yi- mga intermediate na antas.

Ang average na ito ay kilala sa mga istatistika bilang average na kronolohikal para sa mga serye ng sandali. Natanggap niya ang pangalang ito mula sa salitang "cronos" (oras, lat.), dahil kinakalkula ito mula sa mga tagapagpahiwatig na nagbabago sa paglipas ng panahon.

Sa kaso ng hindi pantay agwat sa pagitan ng mga petsa, ang kronolohikal na average para sa serye ng sandali ay maaaring kalkulahin bilang ang average na arithmetic ng mga average na halaga ng mga antas para sa bawat pares ng mga sandali, na natimbang ng mga distansya (mga agwat ng oras) sa pagitan ng mga petsa, i.e.
.
Sa kasong ito ipinapalagay na sa pagitan ng mga petsa ang mga antas ay kinuha sa iba't ibang mga halaga, at kami ay mula sa dalawang kilala ( yi at yi+1) tinutukoy namin ang mga average, kung saan namin pagkatapos ay kinakalkula ang pangkalahatang average para sa buong nasuri na panahon.
Kung ito ay ipinapalagay na ang bawat halaga yi nananatiling hindi nagbabago hanggang sa susunod (i+ 1)- ang sandali, i.e. ang eksaktong petsa ng pagbabago sa mga antas ay alam, pagkatapos ay ang pagkalkula ay maaaring isagawa gamit ang weighted arithmetic mean formula:
,

kung saan ang oras kung saan ang antas ay nanatiling hindi nagbabago.

Bilang karagdagan sa average na antas sa serye ng mga dinamika, ang iba pang mga average na tagapagpahiwatig ay kinakalkula din - ang average na pagbabago sa mga antas ng serye (pangunahing at chain method), ang average na rate ng pagbabago.

Ang ibig sabihin ng baseline ay ganap na pagbabago ay ang quotient ng huling pangunahing ganap na pagbabago na hinati sa bilang ng mga pagbabago. Yan ay

Ang kadena ay nangangahulugang ganap na pagbabago Ang mga antas ng isang serye ay ang quotient ng paghahati sa kabuuan ng lahat ng mga ganap na pagbabago sa chain sa bilang ng mga pagbabago, i.e.

Sa pamamagitan ng pag-sign ng average na ganap na mga pagbabago, ang likas na katangian ng pagbabago sa kababalaghan ay hinuhusgahan din sa karaniwan: paglago, pagbaba o katatagan.

Mula sa panuntunan para sa pagkontrol sa basic at chain absolute na mga pagbabago, sumusunod na ang basic at chain average na mga pagbabago ay dapat na pantay.

Kasama ang average na ganap na pagbabago, ang average na kamag-anak ay kinakalkula din gamit ang basic at chain method.

Baseline Average na Relatibong Pagbabago ay tinutukoy ng formula:

Ang ibig sabihin ng chain ay relatibong pagbabago ay tinutukoy ng formula:

Naturally, ang mga pangunahing at chain average na kamag-anak na mga pagbabago ay dapat na pareho, at sa pamamagitan ng paghahambing ng mga ito sa criterion value na 1, ang isang konklusyon ay ginawa tungkol sa likas na katangian ng pagbabago sa phenomenon sa karaniwan: paglago, pagbaba o katatagan.
Sa pamamagitan ng pagbabawas ng 1 mula sa base o chain average na relatibong pagbabago, ang katumbas average na rate ng pagbabago, sa pamamagitan ng tanda kung saan maaari ring hatulan ng isa ang likas na pagbabago sa hindi pangkaraniwang bagay na pinag-aaralan, na sinasalamin ng seryeng ito ng dinamika.

Mga pagbabago sa pana-panahon at mga indeks ng seasonality.

Ang mga seasonal fluctuation ay stable intra-annual fluctuation.

Ang pangunahing prinsipyo ng pamamahala upang makuha ang pinakamataas na epekto ay ang pag-maximize ng kita at pagliit ng mga gastos. Sa pamamagitan ng pag-aaral ng mga seasonal fluctuations, ang problema ng maximum equation sa bawat antas ng taon ay nalutas.

Kapag nag-aaral ng mga pana-panahong pagbabagu-bago, dalawang magkakaugnay na gawain ang malulutas:

1. Pagkilala sa mga detalye ng pag-unlad ng kababalaghan sa intra-taunang dinamika;

2. Pagsukat ng mga seasonal na pagbabago-bago sa pagbuo ng isang seasonal wave model;

Ang mga pana-panahong turkey ay karaniwang binibilang upang sukatin ang seasonality. Sa pangkalahatang mga termino, ang mga ito ay tinutukoy ng ratio ng orihinal na mga equation ng isang serye ng mga dinamika sa mga teoretikal na equation na nagsisilbing batayan para sa paghahambing.

Dahil ang mga random na paglihis ay nakapatong sa mga seasonal na pagbabagu-bago, ang mga indeks ng seasonality ay ina-average upang maalis ang mga ito.

Sa kasong ito, para sa bawat panahon ng taunang cycle, ang mga pangkalahatang tagapagpahiwatig ay tinutukoy sa anyo ng mga average na pana-panahong mga indeks:

Ang mga average na indeks ng seasonal fluctuations ay libre mula sa impluwensya ng random deviations ng pangunahing trend ng pag-unlad.

Depende sa likas na katangian ng trend, ang formula para sa average na seasonality index ay maaaring magkaroon ng mga sumusunod na anyo:

1.Para sa mga serye ng intra-taunang dinamika na may malinaw na pangunahing trend ng pag-unlad:

2. Para sa serye ng intra-taunang dinamika kung saan walang pataas o pababang trend, o hindi gaanong mahalaga:

Nasaan ang pangkalahatang average;

Mga pamamaraan para sa pagsusuri ng pangunahing kalakaran.

Ang pagbuo ng mga phenomena sa paglipas ng panahon ay naiimpluwensyahan ng mga salik na naiiba sa kalikasan at lakas ng impluwensya. Ang ilan sa mga ito ay random sa kalikasan, ang iba ay may halos pare-parehong epekto at bumubuo ng isang tiyak na kalakaran sa pag-unlad sa serye ng mga dinamika.

Ang isang mahalagang gawain ng mga istatistika ay upang tukuyin ang isang trend sa serye ng mga dinamika, napalaya mula sa pagkilos ng iba't ibang mga random na kadahilanan. Para sa layuning ito, ang serye ng oras ay pinoproseso ng mga pamamaraan ng pagpapalaki ng agwat, moving average at analytical alignment, atbp.

Pamamaraan ng interval coarsening ay batay sa pagpapalaki ng mga yugto ng panahon, na kinabibilangan ng mga antas ng isang serye ng mga dinamika, i.e. ay ang pagpapalit ng data na nauugnay sa maliliit na yugto ng panahon na may data mula sa mas malalaking yugto. Ito ay lalong epektibo kapag ang mga unang antas ng serye ay para sa maikling panahon. Halimbawa, ang mga serye ng mga tagapagpahiwatig na nauugnay sa mga pang-araw-araw na kaganapan ay pinapalitan ng mga serye na nauugnay sa lingguhan, buwanan, atbp. Ito ay mas malinaw na magpapakita "Axis of Development of the Phenomenon". Ang average, na kinakalkula batay sa pinalaki na mga pagitan, ay ginagawang posible upang matukoy ang direksyon at karakter (pagpabilis ng paglago o pagbabawas ng bilis) ng pangunahing trend ng pag-unlad.

moving average na paraan katulad ng nauna, ngunit sa kasong ito, ang mga aktwal na antas ay pinapalitan ng mga average na antas na kinakalkula para sa sunud-sunod na paglipat (pag-slide) na pinalaki na mga pagitan na sumasaklaw sa m mga antas ng hilera.

Halimbawa kung tatanggapin m=3, pagkatapos, una, ang average ng unang tatlong antas ng serye ay kinakalkula, pagkatapos - mula sa parehong bilang ng mga antas, ngunit simula sa pangalawa sa isang hilera, pagkatapos - simula sa pangatlo, atbp. Kaya, ang average, bilang ito ay, "mga slide" kasama ang serye ng mga dinamika, gumagalaw para sa isang panahon. Kinakalkula mula sa m ang mga miyembro ng moving average ay tumutukoy sa gitna (gitna) ng bawat pagitan.

Ang pamamaraang ito ay nag-aalis lamang ng mga random na pagbabagu-bago. Kung ang serye ay may pana-panahong alon, pagkatapos ay mananatili ito pagkatapos ng pag-smoothing sa pamamagitan ng moving average na paraan.

Analytical alignment. Upang maalis ang mga random na pagbabagu-bago at matukoy ang isang trend, ang mga antas ng serye ay nakahanay ayon sa analytical formula (o analytical alignment). Ang kakanyahan nito ay upang palitan ang mga empirical (aktwal) na antas ng mga teoretikal, na kinakalkula ayon sa isang tiyak na equation, na kinuha bilang isang modelo ng matematika ng trend, kung saan ang mga antas ng teoretikal ay itinuturing bilang isang function ng oras: . Sa kasong ito, ang bawat aktwal na antas ay itinuturing bilang kabuuan ng dalawang bahagi: , kung saan ay isang sistematikong bahagi at ipinahayag ng isang tiyak na equation, at ito ay isang random na variable na nagdudulot ng mga pagbabago sa paligid ng trend.

Ang gawain ng analytical alignment ay ang mga sumusunod:

1. Pagtukoy sa batayan ng aktwal na data ang uri ng hypothetical function na pinaka-sapat na sumasalamin sa trend ng pag-unlad ng indicator na pinag-aaralan.

2. Paghahanap ng mga parameter ng tinukoy na function (equation) mula sa empirical data

3. Pagkalkula ayon sa nahanap na equation ng theoretical (leveled) level.

Ang pagpili ng isang partikular na function ay isinasagawa, bilang panuntunan, batay sa isang graphical na representasyon ng empirical data.

Ang mga modelo ay mga equation ng regression, ang mga parameter na kung saan ay kinakalkula sa pamamagitan ng least squares method

Nasa ibaba ang pinakakaraniwang ginagamit na mga equation ng regression para sa pag-level ng serye ng oras, na nagsasaad kung aling mga trend ng pag-unlad ang pinakaangkop para sa pagpapakita.

Upang mahanap ang mga parameter ng mga equation sa itaas, mayroong mga espesyal na algorithm at mga programa sa computer. Sa partikular, upang mahanap ang mga parameter ng equation ng isang tuwid na linya, maaaring gamitin ang sumusunod na algorithm:

Kung ang mga tagal o sandali ng oras ay binibilang upang makuha ang St = 0, kung gayon ang mga algorithm sa itaas ay magiging makabuluhang pinasimple at magiging

Ang mga nakahanay na antas sa chart ay matatagpuan sa isang tuwid na linyang dumadaan sa pinakamalapit na distansya mula sa mga aktwal na antas ng dynamic na seryeng ito. Ang kabuuan ng mga squared deviations ay isang salamin ng impluwensya ng mga random na kadahilanan.

Sa tulong nito, kinakalkula namin ang average (standard) na error ng equation:

Narito ang n ay ang bilang ng mga obserbasyon, at ang m ay ang bilang ng mga parameter sa equation (mayroon kaming dalawa sa kanila - b 1 at b 0).

Ang pangunahing trend (trend) ay nagpapakita kung paano nakakaapekto ang mga sistematikong salik sa mga antas ng isang serye ng dynamics, at ang pagbabagu-bago ng mga antas sa paligid ng trend () ay nagsisilbing sukatan ng epekto ng mga natitirang salik.

Upang masuri ang kalidad ng modelo ng serye ng oras na ginamit, ginagamit din ito Fisher's F test. Ito ay ang ratio ng dalawang variances, katulad ng ratio ng variance na dulot ng regression, i.e. pinag-aralan na kadahilanan, sa pagpapakalat na dulot ng mga random na sanhi, i.e. natitirang pagkakaiba-iba:

Sa pinalawak na anyo, ang formula para sa pamantayang ito ay maaaring katawanin bilang mga sumusunod:

kung saan ang n ay ang bilang ng mga obserbasyon, i.e. bilang ng mga antas ng hilera,

m ay ang bilang ng mga parameter sa equation, y ay ang aktwal na antas ng serye,

Naka-align na antas ng row, - ang average na antas ng row.

Mas matagumpay kaysa sa iba, ang modelo ay maaaring hindi palaging sapat na kasiya-siya. Makikilala lamang ito kung ang criterion F para dito ay lumampas sa isang partikular na kritikal na limitasyon. Ang hangganang ito ay itinakda gamit ang F mga talahanayan ng pamamahagi.

Kakanyahan at pag-uuri ng mga indeks.

Ang isang index sa mga istatistika ay nauunawaan bilang isang kamag-anak na tagapagpahiwatig na nagpapakita ng pagbabago sa laki ng isang kababalaghan sa oras, espasyo, o kung ihahambing sa anumang pamantayan.

Ang pangunahing elemento ng kaugnayan ng index ay ang na-index na halaga. Ang isang naka-index na halaga ay nauunawaan bilang ang halaga ng isang tanda ng isang istatistikal na populasyon, ang pagbabago nito ay ang object ng pag-aaral.

Ang mga index ay nagsisilbi sa tatlong pangunahing layunin:

1) pagtatasa ng mga pagbabago sa isang kumplikadong kababalaghan;

2) pagpapasiya ng impluwensya ng mga indibidwal na kadahilanan sa pagbabago ng isang kumplikadong kababalaghan;

3) paghahambing ng magnitude ng ilang kababalaghan na may magnitude ng nakaraang panahon, ang magnitude ng isa pang teritoryo, pati na rin sa mga pamantayan, plano, pagtataya.

Ang mga indeks ay inuri ayon sa 3 pamantayan:

2) ayon sa antas ng saklaw ng mga elemento ng populasyon;

3) sa pamamagitan ng mga paraan ng pagkalkula ng mga pangkalahatang indeks.

Sa pamamagitan ng nilalaman ng mga na-index na halaga, ang mga indeks ay nahahati sa mga indeks ng quantitative (volumetric) indicator at mga indeks ng qualitative indicator. Mga indeks ng mga tagapagpahiwatig ng dami - mga indeks ng pisikal na dami ng produksyong pang-industriya, pisikal na dami ng mga benta, numero, atbp. Mga indeks ng mga tagapagpahiwatig ng husay - mga indeks ng mga presyo, gastos, produktibidad ng paggawa, average na sahod, atbp.

Ayon sa antas ng saklaw ng mga yunit ng populasyon, ang mga indeks ay nahahati sa dalawang klase: indibidwal at pangkalahatan. Upang makilala ang mga ito, ipinakilala namin ang mga sumusunod na kombensiyon na pinagtibay sa pagsasanay ng paglalapat ng paraan ng index:

q- dami (volume) ng anumang produkto sa uri ; R- presyo ng yunit ng produksyon; z- halaga ng yunit ng produksyon; t- oras na ginugol sa paggawa ng isang yunit ng output (labor intensity) ; w- output ng produksyon sa mga tuntunin ng halaga bawat yunit ng oras; v- output sa pisikal na mga tuntunin sa bawat yunit ng oras; T- kabuuang oras na ginugol o bilang ng mga empleyado.

Upang makilala kung aling panahon o bagay ang nabibilang sa mga na-index na halaga, kaugalian na maglagay ng mga subscript pagkatapos ng kaukulang simbolo sa kanang ibaba. Kaya, halimbawa, sa mga index ng dinamika, bilang panuntunan, para sa mga panahon ng paghahambing (kasalukuyan, pag-uulat), ang subscript 1 ay ginagamit at para sa mga panahon kung saan ginawa ang paghahambing,

Indibidwal na mga indeks nagsisilbing paglalarawan ng pagbabago sa mga indibidwal na elemento ng isang kumplikadong kababalaghan (halimbawa, isang pagbabago sa dami ng output ng isang uri ng produkto). Kinakatawan nila ang mga kamag-anak na halaga ng dinamika, katuparan ng mga obligasyon, paghahambing ng mga na-index na halaga.

Natutukoy ang indibidwal na index ng pisikal na dami ng produksyon

Mula sa isang analytical na pananaw, ang ibinigay na indibidwal na mga indeks ng dinamika ay katulad ng mga coefficient (mga rate) ng paglago at nailalarawan ang pagbabago sa na-index na halaga sa kasalukuyang panahon kumpara sa base one, ibig sabihin, ipakita kung gaano karaming beses itong tumaas (bumaba). ) o kung gaano karaming porsyento ito ay paglago (pagbaba). Ang mga halaga ng index ay ipinahayag sa mga coefficient o porsyento.

Pangkalahatang (composite) index sumasalamin sa pagbabago sa lahat ng elemento ng isang komplikadong phenomenon.

Pinagsama-samang index ay ang pangunahing anyo ng index. Tinatawag itong aggregate dahil ang numerator at denominator nito ay isang set ng "aggregate"

Average na mga indeks, ang kanilang kahulugan.

Bilang karagdagan sa mga pinagsama-samang indeks, ang isa pang anyo ng mga ito ay ginagamit sa mga istatistika - mga average na timbang na indeks. Ang kanilang pagkalkula ay ginagamit kapag ang impormasyong magagamit ay hindi nagpapahintulot sa pagkalkula ng pangkalahatang pinagsama-samang index. Kaya, kung walang data sa mga presyo, ngunit mayroong impormasyon sa halaga ng mga produkto sa kasalukuyang panahon at ang mga indibidwal na indeks ng presyo para sa bawat produkto ay kilala, kung gayon ang pangkalahatang indeks ng presyo ay hindi maaaring matukoy bilang isang pinagsama-samang isa, ngunit posible upang kalkulahin ito bilang isang average ng mga indibidwal. Sa parehong paraan, kung ang mga dami ng mga indibidwal na produkto na ginawa ay hindi alam, ngunit ang mga indibidwal na mga indeks at ang gastos ng produksyon ng batayang panahon ay kilala, kung gayon ang pangkalahatang indeks ng pisikal na dami ng produksyon ay maaaring matukoy bilang isang timbang na average.

Average na index - ito ay isang index na kinakalkula bilang isang average ng mga indibidwal na indeks. Ang pinagsama-samang index ay ang pangunahing anyo ng pangkalahatang index, kaya ang average na index ay dapat na magkapareho sa pinagsama-samang index. Kapag kinakalkula ang mga average na indeks, dalawang anyo ng mga average ang ginagamit: arithmetic at harmonic.

Ang arithmetic mean index ay magkapareho sa pinagsama-samang index kung ang mga timbang ng mga indibidwal na indeks ay ang mga termino ng denominator ng pinagsama-samang index. Sa kasong ito lamang ang halaga ng index na kinakalkula ng arithmetic mean formula ay magiging katumbas ng pinagsama-samang index.

Pagtuturo

Hayaang magkaroon ng ilang numero na nagpapakilala - o magkakatulad na dami. Halimbawa, ang mga resulta ng mga sukat, pagtimbang, istatistikal na obserbasyon, atbp. Ang lahat ng mga dami na ipinakita ay dapat masukat sa pamamagitan ng parehong pagsukat. Upang mahanap ang karaniwang paglihis, gawin ang sumusunod.

Tukuyin ang arithmetic mean ng lahat ng mga numero: idagdag ang lahat ng mga numero at hatiin ang kabuuan sa kabuuang bilang ng mga numero.

Tukuyin ang dispersion (scatter) ng mga numero: pagsamahin ang mga parisukat ng mga deviations na nakita kanina at hatiin ang resultang kabuuan sa bilang ng mga numero.

Mayroong pitong pasyente sa ward na may temperaturang 34, 35, 36, 37, 38, 39 at 40 degrees Celsius.

Ito ay kinakailangan upang matukoy ang average na paglihis mula sa average.
Desisyon:
"sa ward": (34+35+36+37+38+39+40)/7=37 ºС;

Mga paglihis ng temperatura mula sa average (sa kasong ito, ang normal na halaga): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, lumalabas na: -3, -2, -1 , 0, 1, 2, 3 (ºС);

Hatiin ang kabuuan ng mga numerong nakuha kanina sa kanilang numero. Para sa katumpakan ng pagkalkula, mas mainam na gumamit ng calculator. Ang resulta ng paghahati ay ang arithmetic mean ng mga summand.

Bigyang-pansin ang lahat ng mga yugto ng pagkalkula, dahil ang isang error sa hindi bababa sa isa sa mga kalkulasyon ay hahantong sa isang hindi tamang pangwakas na tagapagpahiwatig. Suriin ang natanggap na mga kalkulasyon sa bawat yugto. Ang average na arithmetic ay may parehong metro bilang mga summand ng mga numero, iyon ay, kung matukoy mo ang average na pagdalo, kung gayon ang lahat ng mga tagapagpahiwatig ay magiging "tao".

Ang pamamaraang ito ng pagkalkula ay ginagamit lamang sa mga kalkulasyon sa matematika at istatistika. Kaya, halimbawa, ang arithmetic mean sa computer science ay may ibang algorithm ng pagkalkula. Ang arithmetic mean ay isang napaka-kondisyon na tagapagpahiwatig. Ipinapakita nito ang posibilidad ng isang kaganapan, sa kondisyon na mayroon lamang itong isang salik o tagapagpahiwatig. Para sa pinaka-malalim na pagsusuri, maraming mga kadahilanan ang dapat isaalang-alang. Para dito, ginagamit ang pagkalkula ng mas pangkalahatang dami.

Ang arithmetic mean ay isa sa mga sukat ng central tendency, na malawakang ginagamit sa matematika at statistical calculations. Ang paghahanap ng average na arithmetic ng ilang mga halaga ay napaka-simple, ngunit ang bawat gawain ay may sariling mga nuances, na kailangan lang malaman upang maisagawa ang mga tamang kalkulasyon.

Dami ng mga resulta ng naturang mga eksperimento.

Paano hanapin ang ibig sabihin ng aritmetika

Ang paghahanap para sa arithmetic mean para sa isang hanay ng mga numero ay dapat magsimula sa pagtukoy sa algebraic na kabuuan ng mga halagang ito. Halimbawa, kung ang array ay naglalaman ng mga numerong 23, 43, 10, 74 at 34, ang kanilang algebraic sum ay magiging 184. Kapag nagsusulat, ang arithmetic mean ay tinutukoy ng titik μ (mu) o x (x na may bar) . Susunod, ang algebraic sum ay dapat na hatiin sa bilang ng mga numero sa array. Sa halimbawang ito, mayroong limang numero, kaya ang arithmetic mean ay magiging 184/5 at magiging 36.8.

Mga tampok ng pagtatrabaho sa mga negatibong numero

Kung may mga negatibong numero sa array, ang arithmetic mean ay makikita gamit ang isang katulad na algorithm. May pagkakaiba lamang kapag nagkalkula sa kapaligiran ng programming, o kung may mga karagdagang kundisyon sa gawain. Sa mga kasong ito, ang paghahanap ng arithmetic mean ng mga numero na may iba't ibang mga palatandaan ay bumaba sa tatlong hakbang:

1. Paghahanap ng karaniwang arithmetic mean sa pamamagitan ng karaniwang pamamaraan;
2. Paghahanap ng arithmetic mean ng mga negatibong numero.
3. Pagkalkula ng arithmetic mean ng mga positibong numero.

Ang mga tugon ng bawat isa sa mga aksyon ay nakasulat na pinaghihiwalay ng mga kuwit.

Natural at decimal na mga fraction

Kung ang hanay ng mga numero ay kinakatawan ng mga decimal fraction, ang solusyon ay nangyayari ayon sa paraan ng pagkalkula ng arithmetic mean ng mga integer, ngunit ang resulta ay nabawasan ayon sa mga kinakailangan ng problema para sa katumpakan ng sagot.

Kapag nagtatrabaho sa mga natural na fraction, dapat silang bawasan sa isang karaniwang denominator, na pinarami ng bilang ng mga numero sa array. Ang numerator ng sagot ay ang kabuuan ng mga ibinigay na numerator ng orihinal na fractional na elemento.