Konstruksyon ng ranggo, pagitan at pinagsama-samang serye.

Kapag nagtatrabaho sa data, madalas na kailangang malaman kung anong lugar ang nasasakupan ng isang partikular na tagapagpahiwatig sa pinagsama-samang listahan sa mga tuntunin ng laki. Sa statistics ito ay tinatawag na ranking. May mga tool ang Excel na nagbibigay-daan sa mga user na gawin ang pamamaraang ito nang mabilis at madali. Alamin natin kung paano gamitin ang mga ito.

Mga Pag-andar sa Pagraranggo

Upang maisagawa ang pagraranggo sa Excel, ibinibigay ang mga espesyal na function. Sa mas lumang mga bersyon ng application mayroong isang operator na idinisenyo upang malutas ang problemang ito - RANK. Para sa mga kadahilanan ng pagiging tugma, naiwan ito sa isang hiwalay na kategorya ng mga formula sa mga modernong bersyon ng programa, ngunit sa kanila ay ipinapayong magtrabaho kasama ang mga mas bagong analogue, kung maaari. Kabilang dito ang mga istatistikal na operator na RANK.RV at RANK.SR. Pag-uusapan natin ang tungkol sa mga pagkakaiba at ang algorithm para sa karagdagang pagtatrabaho sa kanila.

Paraan 1: RANK.RV function

Pinoproseso ng operator ng RANK.RV ang data at ipinapakita ang serial number ng tinukoy na argumento mula sa pinagsama-samang listahan sa tinukoy na cell. Kung ang ilang mga halaga ay may parehong antas, pagkatapos ay ipinapakita ng operator ang pinakamataas na halaga mula sa listahan. Kung, halimbawa, ang dalawang halaga ay may parehong halaga, pagkatapos ay pareho silang bibigyan ng pangalawang numero, at ang susunod na pinakamalaking halaga ay magkakaroon ng ikaapat na numero. Sa pamamagitan ng paraan, ang RANK operator ay gumagawa ng parehong bagay sa mga mas lumang bersyon ng Excel, kaya ang mga function na ito ay maaaring ituring na magkapareho.

Ang syntax ng operator na ito ay nakasulat tulad ng sumusunod:

Ang mga argumentong "number" at "reference" ay kinakailangan, ngunit ang "order" ay opsyonal. Bilang argumento ng "numero", kailangan mong maglagay ng link sa cell na naglalaman ng halaga na ang serial number ay gusto mong malaman. Ang argumentong "link" ay naglalaman ng address ng buong hanay na niraranggo. Ang argumentong "order" ay maaaring magkaroon ng dalawang halaga - "0" at "1". Sa unang kaso, ang pagkakasunud-sunod ay binibilang sa isang bumababa na pagkakasunud-sunod, at sa pangalawang kaso, sa isang pagtaas ng pagkakasunud-sunod. Kung argumentong ito ay hindi tinukoy, awtomatiko itong itinuturing na zero ng programa.

Ang formula na ito ay maaaring isulat nang manu-mano sa cell kung saan mo gustong ipakita ang resulta ng pagpoproseso, ngunit para sa maraming mga gumagamit ay mas maginhawang magtakda ng mga input sa pamamagitan ng window ng Function Wizard.


Aralin: Function Wizard sa Excel

Paraan 2: RANK.SR function

Ang pangalawang function na nagsasagawa ng ranggo na operasyon sa Excel ay RANK.SR. Hindi tulad ng mga pag-andar ng RANK at RANK.RV, kung ang mga halaga ng ilang mga elemento ay nag-tutugma, ang operator na ito ay gumagawa ng isang average na antas. Iyon ay, kung mayroong dalawang halaga pantay na halaga at pagkatapos ng halaga na may bilang na 1, pagkatapos ay pareho silang itatalaga ng numero 2.5.

Ang syntax ng RANK.SR ay halos kapareho sa scheme ng nakaraang pahayag. Mukhang ganito:

Ang formula ay maaaring ipasok nang manu-mano o sa pamamagitan ng Function Wizard. Tatalakayin natin ang huling opsyon nang mas detalyado.

  1. Pumili kami ng cell sa sheet upang ipakita ang resulta. Sa parehong paraan tulad ng nakaraang oras, pumunta sa Function Wizard sa pamamagitan ng "Insert Function" na button.
  2. Pagkatapos buksan ang window ng Function Wizard, piliin ang pangalang RANK.SR sa listahan ng kategoryang "Statistical" at mag-click sa pindutang "OK".
  3. Ang window ng mga argumento ay isinaaktibo. Ang mga argumento ng operator na ito ay eksaktong kapareho ng mga argumento ng RANK.RV function:
    • Numero (address ng cell na naglalaman ng elemento na dapat matukoy ang antas);
    • Link (mga coordinate ng saklaw kung saan ginaganap ang pagraranggo);
    • Order (opsyonal na argumento).

    Ang pagpasok ng data sa mga patlang ay nangyayari sa eksaktong parehong paraan tulad ng sa nakaraang operator. Matapos makumpleto ang lahat ng mga setting, mag-click sa pindutang "OK".

  4. Tulad ng nakikita mo, pagkatapos makumpleto ang mga aksyon, ang resulta ng pagkalkula ay ipinakita sa cell na minarkahan sa unang talata ng pagtuturo na ito. Ang kabuuan mismo ay kumakatawan sa lugar kung saan ang isang partikular na halaga ay sumasakop sa iba pang mga halaga sa hanay. Hindi tulad ng resulta ng RANK.RV, maaaring magkaroon ng fractional value ang resulta ng operator ng RANK.SR.
  5. Tulad ng nakaraang formula, sa pamamagitan ng pagbabago ng mga sanggunian mula sa kamag-anak patungo sa absolute at ang highlight marker, maaari mong i-rank ang buong hanay ng data gamit ang autofill. Ang algorithm ng mga aksyon ay eksaktong pareho.

Aralin: Iba pang istatistikal na function sa Microsoft Excel

Aralin: Paano mag-autofill sa Excel

Tulad ng nakikita mo, sa Excel mayroong dalawang pag-andar para sa pagtukoy ng ranggo ng isang tiyak na halaga sa isang hanay ng data: RANK.RV at RANK.SR. Para sa mga mas lumang bersyon ng programa, ginagamit ang RANK operator, na, sa katunayan, ay isang kumpletong analogue ng RANK.RV function. Ang pangunahing pagkakaiba sa pagitan ng RANG.RV at RANG.SR na mga formula ay ang una sa mga ito ay nagpapahiwatig pinakamataas na antas kung ang mga halaga ay nag-tutugma, at ang pangalawa ay nagpapakita ng average sa form decimal. Ito lamang ang pagkakaiba sa pagitan ng mga operator na ito, ngunit dapat itong isaalang-alang kapag pumipili kung aling function ang dapat gamitin ng user.

Natutuwa kaming natulungan ka naming malutas ang problema.

Tanungin ang iyong tanong sa mga komento, na naglalarawan sa kakanyahan ng problema nang detalyado. Susubukan ng aming mga espesyalista na sumagot nang mabilis hangga't maaari.

Nakatulong ba sa iyo ang artikulong ito?

Matuto tayo ranggo ng numerical data sa Excel gamit ang karaniwang pag-uuri, pati na rin ang RANK function at ang mga espesyal na kaso nito (RANG.RV at RANG.SR), na makakatulong sa pag-automate ng pag-uuri.

Pagbati sa lahat, mahal na mga mambabasa ng TutorExcel.Ru blog.

Ang problema sa pagraranggo ng numerical data ay lumalabas sa lahat ng oras sa trabaho na may layuning mahanap ang pinakamalaki o pinakamaliit na halaga sa isang listahan.
Sa Excel, maaari mong pangasiwaan ang gawaing ito sa 2 paraan: gamit ang isang karaniwang tool pag-uuri at sa tulong mga function.

Halimbawa, kumuha tayo ng isang simpleng talahanayan na may listahan ng mga numerical na halaga, kung saan mas ira-rank natin ang data:

Pag-uuri ng data

Magsimula tayo sa pinakasimple at pinaka-naa-access na opsyon - pag-uuri.

Bahagyang nasuri na namin kung paano mabubuo ang data gamit ang mga filter at pag-uuri.
Sa madaling sabi, para pagbukud-bukurin, kailangan mong pumili ng hanay na may data at pumili bahay -> Pag-edit -> Pag-uuri at Salain, at pagkatapos ay ipahiwatig ayon sa kung anong pamantayan ang gusto mong pag-uri-uriin.

Sa kasong ito pipili tayo Pagbukud-bukurin sa pababang pagkakasunud-sunod, kung saan ang mga halaga ay isasaayos mula sa pinakamalaki hanggang sa pinakamaliit:


Minus ang pamamaraang ito ay isang pagbabago sa istruktura ng pinagmumulan ng data, dahil sa proseso ng pag-uuri ng data, ang mga hilera at haligi ay maaaring mapalitan, na sa ilang mga kaso ay hindi maginhawa o imposibleng gawin.
Ang isa pang mahalagang kawalan ng pagpipiliang ito ay ang kakulangan ng kakayahang i-automate ang pag-uuri. Samakatuwid, sa tuwing nagbabago ang data, ang pag-uuri ay kailangang gawin muli.

Bilang solusyon sa problemang ito, isaalang-alang natin ang isa pang paraan ng pagraranggo, na, gayunpaman, ay maaaring isaalang-alang nang hiwalay mula sa paglutas ng problemang ito.

Pagraranggo ng data

Kung hindi posible na baguhin ang istraktura ng dokumento, maaari kaming lumikha ng karagdagang serye ng data na maglalaman ng mga serial number ng source data.
Tutulungan kami ng function na makuha ang mga serial number na ito RANGGO(at RANK.RV At RANK.SR).

RANK function sa Excel

Syntax at paglalarawan ng function:

  • Numero(kinakailangang argumento) - ang numero kung saan kinakalkula ang ranggo;
  • Link(kinakailangang argumento) - array o sanggunian sa isang hanay ng mga numero;
  • Umorder(opsyonal na argumento) - paraan ng pag-order. Kung ang argument ay 0 o hindi tinukoy, kung gayon ang value 1 ay itinalaga sa pinakamataas na elemento sa listahan (medyo pagsasalita, pinag-uuri-uriin namin sa pababang pagkakasunud-sunod), kung hindi, ang halaga 1 ay itinalaga sa pinakamababang elemento (nag-uuri kami sa pataas na pagkakasunud-sunod) .

Available ang feature na ito sa lahat ng bersyon ng Excel, ngunit mula noong Excel 2010 ay pinalitan na ito ng RANK.RV At RANK.SR, A RANGGO naiwan para sa pagiging tugma sa Excel 2007, tingnan natin nang mabuti kung paano gumagana ang mga ito.

Gumagana ang RANK.RV at RANK.SR sa Excel

Syntax at paglalarawan ng mga function:

RANK.RV(numero; link;)
Ibinabalik ang ranggo ng isang numero sa isang listahan ng mga numero: ang ordinal na numero nito na nauugnay sa iba pang mga numero sa listahan; kung ang maraming mga halaga ay may parehong ranggo, ang pinakamataas na ranggo mula sa hanay ng mga halaga ay ibabalik.

Ang mga argumento para sa lahat ng tatlong mga function ay pareho, i.e. Ang mga ito ay halos pareho sa panimula, may mga bahagyang pagkakaiba sa mga detalye.
Gamit ang source table bilang halimbawa, tingnan natin kung paano gumagana ang bawat function sa data:


Tulad ng nakikita natin, ang pagkakaiba ay nakasalalay lamang sa uri ng pagraranggo ng mga tumutugmang elemento ng data.

Kung sakali RANK.RV ang mga pantay na elemento ay itinalaga ng pinakamataas na ranggo.
Sa aming halimbawa, mga kategorya Mga laptop At Mga multicooker tumutugma sa parehong halaga ng elemento - 710, na kung saan ay 3 sa pababang pagkakasunud-sunod, ayon sa pagkakabanggit, ang parehong mga halaga ay itinalaga sa pinakamataas na ranggo - 3.
Para sa RANK.SR para sa parehong mga halaga, ang kanilang average na ranggo ay itinatag, i.e. ang average sa pagitan ng 3 at 4 na serial number ay 3.5.

Dito nagtatapos ang mga pagkakaiba sa pagitan ng mga ito, kaya depende sa iyong mga gawain, maaari mong gamitin ang isa o isa pang function.
Kung kailangan mong pag-uri-uriin ang mga halaga sa pataas na pagkakasunud-sunod, pagkatapos ay bilang isang argumento Umorder kailangan mong tukuyin ang halaga 1:

Awtomatikong pag-uuri

Medyo gawing kumplikado ang gawain at isipin na sa hinaharap kailangan nating lumikha ng isang pinagsunod-sunod na talahanayan na awtomatikong maa-update kapag nagbago ang data sa talahanayan ng pinagmulan.

Halimbawa, ito ay maaaring gawin gamit ang VLOOKUP function, o isang kumbinasyon ng INDEX at MATCH, gayunpaman, kung mayroong magkaparehong mga halaga sa listahan, hindi namin magagawang makuha nang tama ang data at makakatanggap ng isang error:


Sa kasong ito, maaari kang gumamit ng isang simpleng pamamaraan sa anyo ng isang maliit na lansihin.
Idagdag natin sa bawat halaga ng orihinal na talahanayan na hindi tumutugma sa mga random na numero na malapit sa zero, halimbawa, para sa mga layuning ito ginagamit ko ang mga function na ROW o COLUMN, na hinati sa isang malinaw na malaking halaga.

Ang hakbang na ito ay magbibigay-daan sa amin na makakuha ng iba't ibang numero sa pinagmulang data, maiwasan ang mga tugma sa ranggo at mga error kapag kumukuha ng data:

Ngayon ang lahat ng mga elemento ng talahanayan (kahit na ang mga unang tumutugma) ay may sariling indibidwal na ranggo, na iba sa iba, kaya maiiwasan ang mga error kapag awtomatikong nagraranggo ng data.

Mag-download ng halimbawang file.

Salamat sa iyong atensyon!
Kung mayroon kang anumang mga katanungan, sumulat sa mga komento.

Good luck sa iyo at makita ka sa lalong madaling panahon sa mga pahina ng TutorExcel.Ru blog!

Upang i-rank ang data sa Excel, ginagamit ang mga statistical function na RANK, RANK.RV, RANK.SR. Ibinabalik nilang lahat ang bilang ng isang numero sa isang ranggo na listahan ng mga numerong halaga. Tingnan natin ang syntax at mga halimbawa.

Halimbawa ng RANK function sa Excel

Ginagamit ang function kapag nagraranggo sa isang listahan ng mga numero. Iyon ay, pinapayagan ka nitong malaman ang halaga ng isang numero na nauugnay sa iba pang mga numerical na halaga. Kung pag-uri-uriin mo ang listahan sa pataas na pagkakasunud-sunod, ibabalik ng function ang posisyon ng numero. Halimbawa, sa hanay ng mga numero (30;2;26), ang numero 2 ay magkakaroon ng ranggo 1; 26 –2; 30 –3 (bilang pinakamalaking halaga sa listahan).

Syntax ng function:

  1. Numero. Kung saan kinakailangan upang matukoy ang numero sa ranggo.
  2. Link. Isang hanay ng mga numero o hanay ng mga cell na may mga numerong halaga. Kung tumukoy ka lamang ng mga numero bilang isang argumento, ang function ay magbabalik ng isang error. Ang mga hindi numeric na halaga ay hindi itinalaga ng isang numero.
  3. Umorder. Isang paraan upang mag-order ng mga numero sa isang listahan. Mga Pagpipilian: ang argumento ay "0" o tinanggal - ang halaga 1 ay itinalaga sa pinakamataas na numero sa listahan (parang ang listahan ay pinagsunod-sunod sa pababang pagkakasunud-sunod); Ang argumento ay katumbas ng anumang hindi zero na numero - ang ranking number 1 ay itinalaga sa pinakamaliit na numero sa listahan (parang ang listahan ay pinagsunod-sunod sa pataas na pagkakasunud-sunod).

Tukuyin natin ang ranggo ng mga numero sa listahan nang walang pag-uulit:

Ang argumento na tumutukoy kung paano inayos ang mga numero ay "0". Samakatuwid, sa function na ito, ang mga numero ay itinalaga sa mga halaga mula sa pinakamataas hanggang sa pinakamababa. Ang maximum na bilang na 87 ay itinalaga bilang 1.

Ipinapakita ng ikatlong column ang formula na may pataas na ranggo.

Tukuyin natin ang mga bilang ng mga halaga sa listahan kung saan mayroong mga dobleng halaga.

Ang mga umuulit na numero ay naka-highlight sa dilaw. Ang parehong bilang ay tinutukoy para sa kanila. Halimbawa, ang numero 7 sa pangalawang hanay ay itinalaga ang numero 9 (sa parehong ikalawa at ikasiyam na hanay); sa ikatlong column - 3. Ngunit wala sa mga numero sa pangalawang column ang magiging 10, at wala sa mga numero sa ikatlo ang magiging 4.

Upang maiwasang maulit ang mga ranggo (kung minsan ay pinipigilan nito ang user na lutasin ang gawain), ginagamit ang sumusunod na formula:

Maaaring itakda ang mga limitasyon para sa kung paano gumagana ang function. Halimbawa, kailangan mong ranggo lamang ang mga halaga mula 0 hanggang 30. Upang malutas ang problema, gamitin ang IF function (=IF(A2)

Ang mga halaga na nakakatugon sa tinukoy na kundisyon ay naka-highlight sa kulay abo. Para sa mga numerong higit sa 30, isang walang laman na linya ang ipinapakita.

Halimbawa ng RANK.RV function sa Excel

Sa mga bersyon ng Excel simula 2010, lumitaw ang RANK.RV function. Ito ay isang ganap na analogue ng nakaraang function. Ang syntax ay pareho. Ang mga titik na "РВ" sa pangalan ay nagpapahiwatig na kung ang formula ay nakakita ng magkaparehong mga halaga, ibabalik ng function ang pinakamataas na ranggo na numero (iyon ay, ang unang elemento na nakita sa listahan ng mga katumbas).

Tulad ng makikita mo mula sa halimbawa, pinangangasiwaan ng function na ito ang mga umuulit na numero sa isang listahan sa parehong paraan tulad ng sa isang regular na formula. Kung kinakailangan upang maiwasan ang pag-uulit ng mga ranggo, gumagamit kami ng isa pang formula (tingnan sa itaas).

Halimbawa ng RANK.SR function sa Excel

Ibinabalik ang mga numero ng isang numeric na halaga sa isang listahan (ordinal na numero na nauugnay sa iba pang mga halaga). Ibig sabihin, ginagawa nito ang parehong gawain. Ibinabalik lamang ang average kung may nakitang magkakaparehong halaga.

Narito ang resulta ng function:

Ang formula sa column na “pababa” ay: =RANK.SR(A2,$A$2:$A$9,0). Kaya, itinalaga ng function ang average na numero na 1.5 sa halagang 87.

Sabihin nating mayroong tatlong umuulit na halaga sa isang listahan ng mga numero (naka-highlight sa orange).

Itinalaga ng function ang bawat isa sa kanila ng ranggo na 5, na siyang average ng 4, 5, at 6.

Ihambing natin ang gawain ng dalawang pag-andar:

Bilang paalala, gumagana lang ang dalawang function na ito sa Excel 2010 at mas mataas. Sa mga naunang bersyon, maaari kang gumamit ng array formula para sa layuning ito.

Mag-download ng mga halimbawa ng RANK ranking function sa Excel.

Kaya, ang lahat ng mga halimbawa na inilarawan sa itaas ay nagbibigay-daan sa iyo upang i-automate ang gawain ng pagraranggo ng data at pag-compile ng isang pagraranggo ng mga halaga nang hindi gumagamit ng pag-uuri.

Ang pinakamahalagang yugto sa pag-aaral ng mga phenomena at proseso ng sosyo-ekonomiko ay ang sistematisasyon ng pangunahing data at, sa batayan na ito, pagkuha ng isang buod na katangian ng buong bagay gamit ang mga pangkalahatang tagapagpahiwatig, na nakamit sa pamamagitan ng pagbubuod at pagpapangkat ng pangunahing istatistikal na materyal.

Buod ng istatistika - ito ay isang kumplikado ng mga sunud-sunod na operasyon upang i-generalize ang mga partikular na indibidwal na katotohanan na bumubuo ng isang set upang matukoy ang mga tipikal na tampok at pattern na likas sa phenomenon na pinag-aaralan sa kabuuan. Kasama sa pagsasagawa ng buod ng istatistika ang mga sumusunod na hakbang :

  • pagpili ng mga katangian ng pagpapangkat;
  • pagtukoy sa pagkakasunud-sunod ng pagbuo ng grupo;
  • pagbuo ng isang sistema ng mga istatistikal na tagapagpahiwatig upang makilala ang mga grupo at ang bagay sa kabuuan;
  • pagbuo ng mga layout ng talahanayan ng istatistika upang ipakita ang mga resulta ng buod.

Pagpapangkat ng istatistika ay tinatawag na paghahati ng mga yunit ng populasyon na pinag-aaralan sa magkakatulad na mga grupo ayon sa ilang mga katangiang mahalaga sa kanila. Ang mga pagpapangkat ay ang pinakamahalaga istatistikal na paraan generalization ng statistical data, ang batayan para sa tamang pagkalkula ng statistical indicators.

Ang mga sumusunod na uri ng pagpapangkat ay nakikilala: typological, structural, analytical. Ang lahat ng mga pangkat na ito ay nagkakaisa sa pamamagitan ng katotohanan na ang mga yunit ng bagay ay nahahati sa mga pangkat ayon sa ilang katangian.

Tampok ng pagpapangkat ay isang katangian kung saan ang mga yunit ng isang populasyon ay nahahati sa magkakahiwalay na grupo. Ang mga konklusyon ng isang istatistikal na pag-aaral ay nakasalalay sa tamang pagpili ng isang katangian ng pagpapangkat. Bilang batayan para sa pagpapangkat, kinakailangang gumamit ng makabuluhan, ayon sa teoryang mga katangian (quantitative o qualitative).

Mga katangian ng dami ng pagpapangkat magkaroon ng numerical expression (volume ng kalakalan, edad ng tao, kita ng pamilya, atbp.), at husay na mga palatandaan ng pagpapangkat sumasalamin sa estado ng isang yunit ng populasyon (kasarian, Katayuan ng pamilya, kaakibat sa industriya ng negosyo, anyo ng pagmamay-ari nito, atbp.).

Matapos matukoy ang batayan ng pagpapangkat, ang tanong ng bilang ng mga pangkat kung saan ang populasyon na pinag-aaralan ay dapat na hatiin. Ang bilang ng mga pangkat ay nakasalalay sa mga layunin ng pag-aaral at ang uri ng tagapagpahiwatig na pinagbabatayan ng pagpapangkat, ang dami ng populasyon, at ang antas ng pagkakaiba-iba ng katangian.

Halimbawa, ang pagpapangkat ng mga negosyo ayon sa uri ng pagmamay-ari ay isinasaalang-alang ang municipal, federal at federal subject property. Kung ang pagpapangkat ay isinasagawa ayon sa isang quantitative criterion, kung gayon kinakailangan na magbayad ng espesyal na pansin sa bilang ng mga yunit ng bagay na pinag-aaralan at ang antas ng pagbabagu-bago ng katangian ng pagpapangkat.

Kapag natukoy na ang bilang ng mga pangkat, dapat matukoy ang mga pagitan ng pagpapangkat. Pagitan - ito ang mga halaga ng iba't ibang katangian na nasa loob ng ilang mga hangganan. Ang bawat agwat ay may sariling halaga, itaas at mas mababang mga hangganan, o hindi bababa sa isa sa mga ito.

Mas mababang limitasyon ng agwat ay tinatawag na pinakamaliit na halaga ng katangian sa pagitan, at itaas na limitasyon - ang pinakamataas na halaga ng katangian sa pagitan. Ang halaga ng pagitan ay ang pagkakaiba sa pagitan ng upper at lower boundaries.

Ang mga pagitan ng pagpapangkat, depende sa kanilang laki, ay: pantay at hindi pantay. Kung ang pagkakaiba-iba ng isang katangian ay nagpapakita mismo sa loob ng medyo makitid na mga hangganan at ang pamamahagi ay pare-pareho, kung gayon ang isang grupo ay itinayo sa pantay na pagitan. Ang halaga ng pantay na pagitan ay tinutukoy ng sumusunod na formula :

kung saan ang Xmax, Xmin ay ang pinakamataas at pinakamababang halaga ng katangian sa pinagsama-samang; n - bilang ng mga pangkat.

Ang pinakasimpleng pagpapangkat kung saan ang bawat napiling pangkat ay nailalarawan sa pamamagitan ng isang tagapagpahiwatig ay kumakatawan sa isang serye ng pamamahagi.

Serye ng pamamahagi ng istatistika - ito ay isang maayos na pamamahagi ng mga yunit ng populasyon sa mga pangkat ayon sa isang tiyak na katangian. Depende sa katangiang pinagbabatayan ng pagbuo ng serye ng pamamahagi, nakikilala ang katangian at variational na serye ng pamamahagi.

Attributive ay tinatawag na serye ng pamamahagi na binuo ayon sa mga katangian ng husay, iyon ay, mga katangian na wala numerical expression(pamamahagi ayon sa uri ng paggawa, ayon sa kasarian, ayon sa propesyon, atbp.). Nailalarawan ng mga katangian ng serye ng pamamahagi ang komposisyon ng populasyon ayon sa ilang mahahalagang katangian. Sa loob ng ilang panahon, ginagawang posible ng data na ito na pag-aralan ang mga pagbabago sa istraktura.

Variational series ay tinatawag na serye ng pamamahagi na binuo sa isang quantitative na batayan. Ang anumang serye ng variation ay binubuo ng dalawang elemento: mga opsyon at frequency. Mga pagpipilian ang mga indibidwal na halaga ng katangian na kinukuha nito sa serye ng pagkakaiba-iba ay tinatawag, iyon ay, ang tiyak na halaga ng iba't ibang katangian.

Mga frequency tinatawag na mga bilang ng mga indibidwal na variant o bawat pangkat serye ng pagkakaiba-iba, ibig sabihin, ito ay mga numerong nagpapakita kung gaano kadalas nangyayari ang ilang mga opsyon sa serye ng pamamahagi. Tinutukoy ng kabuuan ng lahat ng mga frequency ang laki ng buong populasyon, ang dami nito. Mga frequency ay tinatawag na mga frequency na ipinahayag sa mga fraction ng isang yunit o bilang isang porsyento ng kabuuan. Alinsunod dito, ang kabuuan ng mga frequency ay katumbas ng 1 o 100%.

Depende sa likas na katangian ng pagkakaiba-iba ng isang katangian, tatlong anyo ng serye ng variation ay nakikilala: serye ng ranggo, discrete na serye at serye ng pagitan.

Serye ng variation ng ranggo - ito ang distribusyon ng mga indibidwal na yunit ng populasyon sa pataas o pababang ayos ng katangiang pinag-aaralan. Ang pagraranggo ay nagbibigay-daan sa iyo upang madaling hatiin ang dami ng data sa mga pangkat, agad na makita ang pinakamaliit at pinakamalaking halaga ng isang katangian, at i-highlight ang mga halaga na madalas na paulit-ulit.

Mga serye ng discrete variation nailalarawan ang distribusyon ng mga yunit ng populasyon ayon sa isang discrete na katangian na kumukuha lamang ng mga integer na halaga. Halimbawa, kategorya ng taripa, bilang ng mga anak sa pamilya, bilang ng mga empleyado sa negosyo, atbp.

Kung ang isang katangian ay may patuloy na pagbabago, na sa loob ng ilang mga limitasyon ay maaaring tumagal ng anumang mga halaga ("mula - hanggang"), kung gayon para sa katangiang ito kinakailangan na bumuo serye ng pagkakaiba-iba ng pagitan . Halimbawa, ang halaga ng kita, haba ng serbisyo, halaga ng mga fixed asset ng enterprise, atbp.

Mga halimbawa ng paglutas ng mga problema sa paksang "Buod ng istatistika at pagpapangkat"

Problema 1 . Mayroong impormasyon tungkol sa bilang ng mga aklat na natanggap ng mga mag-aaral sa pamamagitan ng mga subscription sa nakalipas na taon ng akademiko.

Bumuo ng ranggo at discrete variation distribution series, na nagtatalaga ng mga elemento ng serye.

Solusyon

Ang set na ito ay kumakatawan sa maraming mga opsyon para sa bilang ng mga aklat na natatanggap ng mga mag-aaral. Bilangin natin ang bilang ng mga naturang opsyon at ayusin ang mga ito sa anyo ng variational ranking at variational discrete distribution series.

Problema 2 . Mayroong data sa halaga ng mga nakapirming asset para sa 50 negosyo, libong rubles.

Bumuo ng isang serye ng pamamahagi, na nagha-highlight ng 5 grupo ng mga negosyo (sa pantay na pagitan).

Solusyon

Upang malutas, pipiliin namin ang pinakamalaki at pinakamaliit na halaga ang halaga ng mga fixed asset ng mga negosyo. Ito ay 30.0 at 10.2 libong rubles.

Hanapin natin ang laki ng pagitan: h = (30.0-10.2):5= 3.96 thousand rubles.

Pagkatapos ay isasama ng unang pangkat ang mga negosyo na ang mga nakapirming asset ay mula sa 10.2 libong rubles. hanggang 10.2+3.96=14.16 thousand rubles. Magkakaroon ng 9 na ganitong mga negosyo. Ang pangalawang grupo ay magsasama ng mga negosyo na ang mga fixed asset ay mula sa 14.16 thousand rubles. hanggang 14.16+3.96=18.12 thousand rubles. Magkakaroon ng 16 na mga negosyo. Katulad nito, makikita natin ang bilang ng mga negosyo na kasama sa ikatlo, ikaapat at ikalimang grupo.

Inilalagay namin ang nagresultang serye ng pamamahagi sa talahanayan.

Suliranin 3 . Para sa isang bilang ng mga negosyo magaan na industriya Natanggap ang sumusunod na data:

Igrupo ang mga negosyo ayon sa bilang ng mga manggagawa, na bumubuo ng 6 na grupo sa pantay na pagitan. Kalkulahin para sa bawat pangkat:

1. bilang ng mga negosyo
2. bilang ng mga manggagawa
3. dami ng mga produktong ginawa kada taon
4. average na aktwal na output ng bawat manggagawa
5. dami ng mga fixed asset
6. average na laki ng mga fixed asset ng isang enterprise
7. average na halaga ng mga produktong ginawa ng isang negosyo

Ipakita ang mga resulta ng pagkalkula sa mga talahanayan. Gumawa ng mga konklusyon.

Solusyon

Upang malutas, pipiliin namin ang pinakamalaki at pinakamaliit na halaga ng average na bilang ng mga manggagawa sa negosyo. Ito ay 43 at 256.

Hanapin natin ang laki ng pagitan: h = (256-43):6 = 35.5

Pagkatapos ang unang grupo ay isasama ang mga negosyo na ang average na bilang ng mga manggagawa ay mula 43 hanggang 43 + 35.5 = 78.5 katao. Magkakaroon ng 5 tulad na mga negosyo. Ang pangalawang grupo ay magsasama ng mga negosyo na ang average na bilang ng mga manggagawa ay mula 78.5 hanggang 78.5+35.5=114 na tao. Magkakaroon ng 12 tulad na mga negosyo. Katulad nito, makikita natin ang bilang ng mga negosyo na kasama sa ikatlo, ikaapat, ikalima at ikaanim na grupo.

Inilalagay namin ang nagresultang serye ng pamamahagi sa isang talahanayan at kinakalkula ang mga kinakailangang tagapagpahiwatig para sa bawat pangkat:

Konklusyon : Tulad ng makikita mula sa talahanayan, ang pangalawang pangkat ng mga negosyo ay ang pinakamarami. Kabilang dito ang 12 negosyo. Ang pinakamaliit na grupo ay ang ikalima at ikaanim na grupo (dalawang negosyo bawat isa). Ito ang pinakamalaking negosyo (sa mga tuntunin ng bilang ng mga manggagawa).

Dahil ang pangalawang pangkat ang pinakamalaki, ang dami ng mga produkto na ginawa bawat taon ng mga negosyo ng pangkat na ito at ang dami ng mga nakapirming asset ay makabuluhang mas mataas kaysa sa iba. Kasabay nito, hindi ang average na aktwal na output ng bawat manggagawa sa mga negosyo sa grupong ito. Nangunguna rito ang mga negosyo ng ikaapat na grupo. Ang grupong ito ay nagsasaalang-alang din ng medyo malaking dami ng mga fixed asset.

Sa konklusyon, tandaan namin na ang average na laki ng mga fixed asset at average na halaga ang mga produktong ginawa ng isang negosyo ay direktang proporsyonal sa laki ng negosyo (sa bilang ng mga manggagawa).

Sa istatistika, ang pagpapangkat ay nauunawaan bilang ang paghahati ng isang istatistikal na populasyon sa mga pangkat na homogenous sa anumang makabuluhang paggalang, ang mga katangian ng mga napiling grupo ng isang sistema ng mga tagapagpahiwatig upang matukoy ang mga uri ng phenomena, at ang pag-aaral ng kanilang istruktura at ugnayan. Sa proseso ng pagbubuod ng pangunahing materyal, ang mga phenomena ay nahahati sa mga grupo ayon sa iba't ibang magkakaibang katangian.

Ang variable na katangian ay isang katangian na tumatagal ng iba't ibang kahulugan para sa mga indibidwal na yunit ng populasyon.

Mga gawaing kinakaharap ng pangkat:

1. Pagkilala sa mga bahagi ng isang mass phenomenon na magkakatulad sa kalidad at mga kondisyon ng pag-unlad, at kung saan ang parehong natural na impluwensya ng mga salik ay gumagana;

2. Pag-aaral at paglalarawan ng istruktura at mga pagbabago sa istruktura sa mga populasyon na pinag-aaralan;

3. Ang impluwensya ng relasyon sa pagitan ng mga indibidwal na katangian ng phenomenon na pinag-aaralan.

Ang pangunahing isyu ng pamamaraan ng pagpapangkat ay ang pagpili ng isang katangian ng pagpapangkat, ang tamang pagpili kung saan tinutukoy ang mga resulta ng pagpapangkat at ang gawain sa kabuuan.

Pagkatapos pumili ng katangian ng pagpapangkat, mahalagang hatiin ang mga yunit ng populasyon sa mga pangkat.

Ang mga napiling grupo ay dapat na qualitatively homogenous, at mayroon ding sapat na malaking bilang ng mga unit, na magpapahintulot sa kanila na magpakita tipikal na katangian katangian ng mass phenomena. kaya lang malaking atensyon ay ibinibigay sa pagtukoy ng bilang ng mga pangkat at kanilang mga hangganan. Kapag nilutas ang isyung ito, ang uri ng pagpapangkat, ang katangian ng katangian ng pagpapangkat at ang mga layunin ng pag-aaral ay isinasaalang-alang.

Igrupo natin ang mga sakahan. Kunin natin ang ani ng gatas mula sa isang baka, sa kg, bilang isang katangian ng pagpapangkat. Mayroong malaking pagkakaiba sa antas ng produktibidad ng gatas sa mga sakahan sa sonang ito. Iba-iba ang sign na ito

Gamit ang istatistikal na paraan ng pagpapangkat, ang mga pagkakaiba sa pagitan ng mga sakahan sa mga tuntunin ng antas ng produktibidad ng gatas ng mga baka ay iba-iba.

Ang unang yugto ng trabaho ay ang pagbuo ng isang ranggo na serye. Sa ranggo na serye, ang lahat ng mga halaga ay nakaayos sa pataas o pababang pagkakasunud-sunod ng katangian ng pagpapangkat.

Ipinapakita ng ranggo na serye ang intensity ng mga pagbabago sa mga halaga mula 1364 hanggang 6270 kg. pagpapangkat ng katangian, gamit ito ay posible na magtatag ng matalim na mga transition at tukuyin ang mga yunit na ibang-iba sa halaga ng katangian.

Upang mag-compile ng isang ranggo na serye, gumagamit kami ng data sa produktibidad ng gatas ng mga baka sa mga sakahan sa Achinsk zone para sa 2003.

Ipapakita namin ang mga resulta sa Talahanayan 2.1.

Talahanayan 2.1.

Pangalan ng bukid

Ang ani ng gatas mula sa 1 baka bawat taon, kg

JSC "Beloozerskoe"

JSC Sharypovskoe

JSC "Ivanovskoe"

CJSC "Orakskoe"

JSC "Sakhaptinskoe"

SJSC "Anashenskoe"

CJSC "Energetik"

SZAO "Baraitskoye"

SZAOOT "Igryshenskoye"

Pang-agrikulturang produksyon complex "Beloyarsky"

AOZT "Pavlovskoye"

JSC "Adymskoe"

JSC "Krasnopolyanskoe"

JSC "Dorokhovskoye"

JSC "Glyadenskoe"

SKhAOZT "Legostaevskoe"

CJSC "Altaiskoye"

JSC "Svetlolobovskoe"

JSC "Podsosensky"

JSC "Krutoyarskoe"

LLP p/z "Achinsky"

JSC "Avangard"

JSC "Malinovsky"

SAZT "Navoselovskoe"

JSC "Nazarovskoye"

Para sa higit na kalinawan, ilarawan namin ang ranggo na serye nang graphical, kung saan gagawa kami ng Galton flint.

Upang gawin ito, ilalagay namin sa x-axis sa pataas na pagkakasunud-sunod ng katangian ng pagpapangkat, at kasama ang axis - ang halaga ng produktibidad ng gatas ng mga baka na naaayon sa bukid, Fig. 2.1.

Niraranggo ang serye ng mga sakahan ayon sa antas ng produktibidad ng gatas ng mga baka.

Suriin natin ang data mula sa ranggo na serye at ang graph nito - suriin ang kalikasan at intensity ng mga pagkakaiba sa pagitan ng mga sakahan at subukang tukuyin ang makabuluhang magkakaibang grupo ng mga sakahan. Mayroong makabuluhang pagkakaiba sa pagitan ng mga sakahan sa antas ng produktibidad ng gatas ng mga baka: ang saklaw ng mga pagbabago ay 6270 - 1364 = 4906 kg bawat baka, at ang antas ng produksyon ng gatas sa bukid No. 25 ay 4.6 beses na mas mataas kaysa sa No. 1 ( 6720/1364).

Ang pagtaas ng produktibidad ng gatas mula sa sakahan patungo sa sakahan ay higit sa lahat ay nangyayari nang unti-unti, maayos, nang walang malalaking pagtalon, ngunit ang ani ng gatas sa bawat baka ng huling sakahan ay malaki ang pagkakaiba sa iba pang mga sakahan. Ngunit ang sakahan na ito ay hindi maaaring ihiwalay sa isang hiwalay na grupo, at dahil ang mga pagkakaiba sa pagitan ng iba pang mga sakahan ay maliit, walang mga pagtalon, at walang iba pang data na nagpapahiwatig ng mga hangganan ng paglipat mula sa isang grupo patungo sa isa pa, imposibleng makilala ang tipikal na mga pangkat batay sa isang pagsusuri ng serye ng ranggo sa kasong ito. Samakatuwid, ang susunod na ito ay kinakailangan upang bumuo ng isang serye ng pagitan ng pamamahagi ng sakahan.

Ginagawang posible ng isang serye ng pagkakaiba-iba ng agwat na makakuha ng ideya ng bilang at katangian ng mga grupo. Una, magpasya tayo sa tanong ng bilang ng mga grupo kung saan dapat ipamahagi ang kabuuan ng mga sakahan. Ang tinatayang numero n ay maaaring matukoy gamit ang formula (2.1):

n = 1+3.322LgN, (2.1)

kung saan ang n ay ang bilang ng mga pangkat, ang N ay isang hanay ng mga yunit.

Ang pag-asa na ito ay maaaring magsilbi bilang isang patnubay kapag tinutukoy ang bilang ng mga grupo sa kasong ito, kung ang distribusyon ng mga yunit ng populasyon para sa isang partikular na katangian ay lumalapit sa normal at pantay na pagitan sa mga grupo ay ginagamit.

n = 1+3.322Lg25 = 1+3.322*1.5 ~ 6 na pangkat.

i = (X max - X min) / n, kung saan (2.2)

X max - maximum na halaga ng attribute sa pinag-aralan na ranggo na serye,

X min - pinakamababang halaga ng attribute sa pinag-aralan na ranggo na serye,

n - bilang ng mga pangkat.

I = (6270 - 1364)/6 = 818

Ngayon ay gagawa kami ng isang serye ng pamamahagi ng mga sakahan na may ganitong halaga ng pagitan, ang halaga ng X min = 818 kg, kung gayon ang itaas na limitasyon ng unang pangkat ay magiging: Xmin+i = 2182 kg. Ang hangganang ito ay hangganan din ng pangalawang pangkat. Ang mga hangganan ng iba pang mga grupo ay tinutukoy nang katulad. Ang nakuhang datos ay ipinakita sa talahanayan 2.2.

Talahanayan 2.2

Ang pagitan ng serye ng pamamahagi ng mga sakahan ng estado (Talahanayan 2.2.) ay nagpapakita na sa pinagsama-samang, ang mga sakahan na may ani ng gatas bawat baka (11 mga sakahan) mula 1364 hanggang 2182 kg ang nangingibabaw. Ang mga pangkat ng mga sakahan na may mataas na produktibo ay maliit sa bilang, kaya dapat silang pagsamahin, iyon ay, isang pangalawang pagpapangkat ang dapat isagawa, dahil walang isang sakahan sa ikaapat na grupo, at isa sa ikalima, ngunit ang bawat pangkat ay dapat magkaroon ng hindi bababa sa tatlong mga sakahan.


Interval serye ng pamamahagi ng mga sakahan ayon sa antas ng produktibidad ng gatas ng mga baka.

Talahanayan 2.3

Pangalawang pagpapangkat ng mga sakahan ayon sa antas ng produktibidad ng gatas ng mga baka.

Kung ihahambing ang bilang ng mga sakahan sa loob ng bawat pangkat, masasabi nating ang bilang ng mga sakahan na may mababang antas ang pagiging produktibo ay mas malaki kaysa sa mataas sa isang malaking lawak.

Ang pinakamahalagang bahagi istatistikal na pagsusuri ay ang pagbuo ng serye ng pamamahagi (structural grouping) upang i-highlight katangian ng mga katangian at mga pattern ng populasyon na pinag-aaralan. Depende sa kung aling tampok (quantitative o qualitative) ang kinuha bilang batayan para sa pagpapangkat ng data, ang mga uri ng serye ng pamamahagi ay nakikilala nang naaayon.

Kung ang isang kalidad na katangian ay kinuha bilang batayan para sa pagpapangkat, kung gayon ang naturang serye ng pamamahagi ay tinatawag katangian(pamamahagi ayon sa uri ng paggawa, ayon sa kasarian, ayon sa propesyon, ayon sa relihiyon, nasyonalidad, atbp.).

Kung ang isang serye ng pamamahagi ay itinayo sa isang dami na batayan, kung gayon ang naturang serye ay tinatawag pagkakaiba-iba. Upang makabuo ng isang serye ng pagkakaiba-iba ay nangangahulugan na ayusin ang dami ng pamamahagi ng mga yunit ng populasyon sa pamamagitan ng mga katangiang halaga, at pagkatapos ay bilangin ang bilang ng mga yunit ng populasyon na may mga halagang ito (bumuo ng isang talahanayan ng pangkat).

Mayroong tatlong anyo ng serye ng variation: serye ng ranggo, serye ng discrete at serye ng interval.

Serye ng ranggo- ito ang distribusyon ng mga indibidwal na yunit ng populasyon sa pataas o pababang ayos ng katangiang pinag-aaralan. Ang pagraranggo ay nagbibigay-daan sa iyo upang madaling hatiin ang dami ng data sa mga pangkat, agad na makita ang pinakamaliit at pinakamalaking halaga ng isang katangian, at i-highlight ang mga halaga na madalas na paulit-ulit.

Ang iba pang mga anyo ng serye ng pagkakaiba-iba ay mga talahanayan ng pangkat na pinagsama-sama ayon sa likas na katangian ng pagkakaiba-iba sa mga halaga ng katangian na pinag-aaralan. Ayon sa likas na katangian ng pagkakaiba-iba, ang discrete (discontinuous) at tuloy-tuloy na mga katangian ay nakikilala.

Discrete na serye- ito ay isang serye ng pagkakaiba-iba, ang pagbuo nito ay batay sa mga katangian na may hindi tuloy-tuloy na pagbabago (discrete na mga katangian). Kasama sa huli ang kategorya ng taripa, ang bilang ng mga bata sa pamilya, ang bilang ng mga empleyado sa negosyo, atbp. Ang mga tampok na ito ay maaari lamang tumagal ng isang tiyak na bilang ng mga partikular na halaga.

Ang isang discrete variation series ay kumakatawan sa isang table na binubuo ng dalawang column. Ang unang column ay nagpapahiwatig ng partikular na halaga ng attribute, at ang pangalawang column ay nagpapahiwatig ng bilang ng mga unit sa populasyon na may partikular na halaga ng attribute.

Kung ang isang katangian ay may tuluy-tuloy na pagbabago (halaga ng kita, haba ng serbisyo, halaga ng mga nakapirming assets ng negosyo, atbp., na sa loob ng ilang mga limitasyon ay maaaring tumagal sa anumang mga halaga), kung gayon para sa katangiang ito kinakailangan na bumuo serye ng pagkakaiba-iba ng pagitan.

Ang talahanayan ng pangkat dito ay mayroon ding dalawang column. Ang una ay nagpapahiwatig ng halaga ng katangian sa pagitan ng "mula - hanggang" (mga opsyon), ang pangalawa ay nagpapahiwatig ng bilang ng mga yunit na kasama sa pagitan (dalas).

Dalas (dalas ng pag-uulit) - ang bilang ng mga pag-uulit ng isang partikular na variant ng mga halaga ng katangian, ay tinutukoy na fi, at ang kabuuan ng mga frequency na katumbas ng dami ng populasyon na pinag-aaralan ay tinutukoy

kung saan ang k ay ang bilang ng mga opsyon para sa mga halaga ng katangian

Kadalasan, ang talahanayan ay pupunan ng isang haligi kung saan kinakalkula ang mga naipon na frequency S, na nagpapakita kung gaano karaming mga yunit sa populasyon ang may katangiang halaga na hindi hihigit sa halagang ito.

Ang mga frequency ng f series ay maaaring palitan ng mga frequency w, na ipinahayag sa mga relatibong numero (fraction o porsyento). Kinakatawan nila ang ratio ng mga frequency ng bawat agwat sa kanilang kabuuan, ibig sabihin:

Kapag gumagawa ng isang serye ng pagkakaiba-iba na may mga halaga ng agwat, una sa lahat ay kinakailangan upang maitaguyod ang halaga ng agwat i, na tinukoy bilang ang ratio ng saklaw ng pagkakaiba-iba R sa bilang ng mga pangkat m:

kung saan R = xmax - xmin; m = 1 + 3.322 logn (Sturgess formula); n- kabuuang bilang mga yunit ng populasyon.

Upang matukoy ang istraktura ng isang populasyon, ginagamit ang mga espesyal na average na tagapagpahiwatig, na kinabibilangan ng median at mode, o ang tinatawag na structural average. Kung ang arithmetic mean ay kinakalkula batay sa paggamit ng lahat ng variant ng mga value ng attribute, ang median at mode ay naglalarawan sa halaga ng variant na sumasakop sa isang partikular na average na posisyon sa ranggo na serye ng variation.

Median (Ako)- ito ang value na tumutugma sa opsyong matatagpuan sa gitna ng ranggo na serye.

Para sa isang ranggo na serye na may kakaibang bilang ng mga indibidwal na halaga (halimbawa, 1, 2, 3, 3, 6, 7, 9, 9, 10), ang median ay ang halaga na matatagpuan sa gitna ng serye, i.e. ikalimang magnitude.

Para sa isang ranggo na serye na may pantay na bilang ng mga indibidwal na halaga (halimbawa, 1, 5, 7, 10, 11, 14), ang median ay ang average dami ng aritmetika, na kinakalkula mula sa dalawang magkatabing halaga.

Iyon ay, upang mahanap ang median, kailangan mo munang matukoy ang serial number nito (posisyon nito sa ranggo na serye) gamit ang formula

kung saan ang n ay ang bilang ng mga yunit sa pinagsama-samang.

Ang numerical value ng median ay tinutukoy mula sa mga naipon na frequency sa isang discrete variation series. Upang gawin ito, kailangan mo munang ipahiwatig ang pagitan kung saan matatagpuan ang median sa serye ng pagitan ng pamamahagi. Ang median ay ang unang agwat kung saan ang kabuuan ng mga naipon na frequency ay lumampas sa kalahati ng mga obserbasyon mula sa kabuuang bilang ng lahat ng mga obserbasyon.

Numerical na halaga ng median

kung saan ang xMe ay ang mas mababang limitasyon ng median interval; i - halaga ng pagitan; Ang S-1 ay ang naipon na dalas ng pagitan na nauuna sa median; f ay ang dalas ng median na pagitan.

Fashion (Mo) Tinatawag nila ang halaga ng isang katangian na kadalasang nangyayari sa mga yunit ng populasyon. Para sa discrete na serye Ang fashion ang magiging opsyon na may pinakamataas na dalas. Upang matukoy ang fashion serye ng pagitan Una, tinutukoy ang modal interval (ang interval na may pinakamataas na frequency). Pagkatapos, sa loob ng agwat na ito, makikita ang halaga ng tampok, na maaaring maging isang mode.

Upang makahanap ng isang partikular na halaga ng mode, kailangan mong gamitin ang formula

kung saan ang xMo ay ang mas mababang limitasyon ng modal interval; Ang iMo ay ang halaga ng modal interval; fMo - dalas ng modal interval; fMo-1 - dalas ng agwat bago ang modal isa; fMo+1 - dalas ng interval kasunod ng modal one.

Laganap ang fashion sa mga aktibidad sa marketing kapag pinag-aaralan ang demand ng consumer, lalo na kapag tinutukoy ang mga pinakasikat na laki ng damit at sapatos, at kapag kinokontrol ang mga patakaran sa pagpepresyo.

Ang pangunahing layunin ng pagsusuri ng mga serye ng variation ay upang matukoy ang pattern ng pamamahagi, habang hindi kasama ang impluwensya ng mga random. ibinigay na pamamahagi mga kadahilanan. Ito ay maaaring makamit sa pamamagitan ng pagtaas ng dami ng populasyon na pinag-aaralan at sabay-sabay na pagbabawas ng pagitan ng serye. Kapag sinubukan naming ilarawan ang data na ito nang grapiko, makakakuha kami ng ilang makinis na hubog na linya, na magiging isang tiyak na limitasyon para sa frequency polygon. Ang linyang ito ay tinatawag na distribution curve.

Sa ibang salita, kurba ng pamamahagi mayroong isang graphical na representasyon sa anyo ng isang tuloy-tuloy na linya ng mga pagbabago sa dalas sa isang serye ng variation, na gumaganang nauugnay sa pagbabago sa opsyon. Ang kurba ng pamamahagi ay sumasalamin sa pattern ng mga pagbabago sa dalas sa kawalan ng mga random na kadahilanan. Graphic na larawan pinapadali ang pagsusuri ng serye ng pamamahagi.

Napakaraming anyo ng mga curve ng pamamahagi ang nalalaman, kung saan maaaring ihanay ang isang serye ng variation, ngunit sa pagsasanay istatistikal na pananaliksik ang pinakakaraniwang ginagamit na anyo ay ang normal at Poisson distribution.

Ang normal na distribusyon ay nakasalalay sa dalawang parameter: ang arithmetic mean at ang standard deviation. Ang curve nito ay ipinahayag ng equation

kung saan ang y ay ang ordinate ng normal na distribution curve; - standardized deviations; e at π ay mathematical constants; x - mga variant ng serye ng variation; - ang kanilang average na halaga; - karaniwang lihis.

Kung kailangan mong makakuha ng mga teoretikal na frequency f" kapag inihanay ang serye ng variation sa normal na curve ng distribution, maaari mong gamitin ang formula

saan ang kabuuan ng lahat ng empirical frequency ng variation series; h - ang laki ng pagitan sa mga grupo; - karaniwang lihis; - normalized deviation ng mga opsyon mula sa arithmetic mean; lahat ng iba pang dami ay madaling kalkulahin gamit ang mga espesyal na talahanayan.

Gamit ang formula na ito nakukuha namin teoretikal (probability) distribution, pinapalitan sila empirical (aktwal) na pamamahagi, hindi sila dapat magkaiba ng karakter sa isa't isa.

Gayunpaman, sa ilang mga kaso, kung ang serye ng pagkakaiba-iba ay isang pamamahagi ayon sa isang discrete na katangian, kung saan habang ang mga halaga ng katangian na x ay tumataas, ang mga frequency ay nagsisimulang bumaba nang husto, at ang arithmetic mean, naman, ay pantay. sa o malapit sa halaga sa dispersion (), ang naturang serye ay nakahanay sa pamamagitan ng Poisson curve.

Poisson curve maaaring ipahayag ng kaugnayan

kung saan ang Px ay ang posibilidad ng paglitaw ng mga indibidwal na halaga ng x; - arithmetic mean ng serye.

Kapag equalizing ang empirical data, ang theoretical frequency ay maaaring matukoy sa pamamagitan ng formula

kung saan ang f" ay theoretical frequency; N ang kabuuang bilang ng mga unit ng serye.

Ang paghahambing ng mga nakuha na halaga ng mga teoretikal na frequency f" sa empirical (aktwal) na mga frequency f, kami ay kumbinsido na ang kanilang mga pagkakaiba ay maaaring napakaliit.

Ang isang layunin na katangian ng pagsusulatan sa pagitan ng teoretikal at empirical na mga frequency ay maaaring makuha gamit ang mga espesyal na istatistikal na tagapagpahiwatig, na tinatawag na pamantayan ng kasunduan.

Upang masuri ang kalapitan ng mga empirical at teoretikal na frequency, ang Pearson goodness-of-fit test, Romanovsky goodness-of-fit test, at Kolmogorov goodness-of-fit test ay ginagamit.

Ang pinakakaraniwan ay K. Pearson's goodness-of-fit test, na maaaring kinakatawan bilang kabuuan ng mga ratio ng mga squared na pagkakaiba sa pagitan ng f" at f sa mga teoretikal na frequency:

Ang kinakalkula na halaga ng criterion ay dapat ihambing sa naka-tabulate (kritikal) na halaga. Ang naka-tabulate na halaga ay tinutukoy mula sa isang espesyal na talahanayan; ito ay nakasalalay sa tinatanggap na probabilidad P at ang bilang ng mga antas ng kalayaan k (kung saan ang k = m - 3, kung saan ang m ay ang bilang ng mga pangkat sa serye ng pamamahagi para sa isang normal na pamamahagi). Kapag kinakalkula ang pamantayan ng kasunduan sa Pearson, ang sumusunod na kundisyon ay dapat matugunan: ang bilang ng mga obserbasyon ay dapat sapat na malaki (n 50), at kung sa ilang mga pagitan ay ang mga teoretikal na frequency< 5, то интервалы объединяют для условия > 5.

Kung , kung gayon ang mga pagkakaiba sa pagitan ng empirical at theoretical frequency distribution ay maaaring random at ang pagpapalagay na ang empirical distribution ay malapit sa normal ay hindi maaaring tanggihan.

Kung sakaling walang mga talahanayan para sa pagtatasa ng randomness ng pagkakaiba sa pagitan ng teoretikal at empirical na mga frequency, maaari mong gamitin pamantayan ng kasunduan V.I. Romanovsky Si KR, na, gamit ang value, ay nagmungkahi na suriin ang kalapitan ng empirical distribution ng normal distribution curve gamit ang ratio

kung saan ang m ay ang bilang ng mga pangkat; k = (m - 3) - ang bilang ng mga antas ng kalayaan kapag kinakalkula ang mga frequency ng isang normal na distribusyon.

Kung ang kaugnayan sa itaas< 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение >3, kung gayon ang mga pagkakaiba ay maaaring maging lubos na makabuluhan at ang hypothesis tungkol sa normal na pamamahagi dapat tanggihan.

Pamantayan ng kasunduan A.N. Kolmogorov ginagamit sa pagtukoy ng maximum na pagkakaiba sa pagitan ng mga frequency ng empirical at theoretical distribution, na kinakalkula ng formula

kung saan ang D ay ang pinakamataas na halaga ng pagkakaiba sa pagitan ng naipon na empirical at theoretical frequency; - kabuuan ng mga empirical frequency.

Gamit ang mga talahanayan ng mga halaga ng posibilidad, ang pamantayan ay maaaring gamitin upang mahanap ang halaga na tumutugma sa posibilidad na P. Kung ang halaga ng posibilidad na P ay makabuluhan kaugnay ng nahanap na halaga, maaari nating ipagpalagay na ang mga pagkakaiba sa pagitan ng teoretikal at empirikal na distribusyon ay hindi gaanong mahalaga.

Ang isang kinakailangang kundisyon kapag gumagamit ng Kolmogorov goodness-of-fit criterion ay sapat malaking numero mga obserbasyon (hindi bababa sa isang daan).

Ranging– isang pamamaraan para sa pag-order ng anumang mga bagay sa pataas o pababang pagkakasunud-sunod ng ilan sa kanilang mga ari-arian, sa kondisyon na sila ay nagtataglay ng ari-arian na ito.

Maaari kang mag-ranggo:

Estado ayon sa pamantayan ng pamumuhay, rate ng kapanganakan, kawalan ng trabaho;

Mga propesyon ayon sa prestihiyo;

Mga produkto ayon sa kagustuhan ng mamimili;

Mga sumasagot ayon sa aktibidad sa pulitika, sitwasyong pinansyal;

Ang mga bagay sa pagraranggo ay ang mga bagay na direktang nakaayos. Pagraranggo ng batayan(ranking feature) – ang ari-arian kung saan inorder ang mga bagay. Bilang resulta ng pagraranggo, nakakakuha kami ng isang ranggo na serye kung saan ang bawat bagay ay itinalaga ng sarili nitong indibidwal ranggo– ang lugar ng bagay sa ranggo na serye. Ang bilang ng mga lugar at, nang naaayon, ang bilang ng mga ranggo sa ranggo na serye ay katumbas ng bilang ng mga bagay.

Mga uri ng ranggo na serye:

1) ang bawat bagay ay may isang katangian na halaga na naiiba sa mga katangian na halaga ng iba pang mga bagay, pagkatapos ang bawat bagay sa ranggo na serye ay itinalaga ng sarili nitong ranggo, naiiba sa iba pang bagay;

2) ilang mga bagay ay may parehong halaga ng katangian, pagkatapos ang mga bagay na ito sa ranggo na serye ay itinalaga ng parehong mga ranggo, na kinakalkula ng isang tiyak na pormula. Sa kasong ito, ang ranggo na serye ay tinatawag na ranggo na serye na may mga kaugnay na ranggo. Kapag nilulutas ang mga problema, itatalaga namin ang unang ranggo pinakamataas na halaga tanda. Ang nauugnay na ranggo ay kinakalkula bilang ang average ng mga lugar na inookupahan ng mga bagay na may parehong halaga ng katangian. Ang pagtatatag ng istatistikal na koneksyon para sa 2 o higit pang ranggo na serye ay isinasagawa gamit ang koepisyent ng pagraranggo mga komunikasyon– tulad ng mga coefficient na ginagawang posible upang makalkula ang antas ng pagkakapare-pareho sa pagraranggo ng parehong mga bagay sa dalawang magkaibang mga batayan (mga katangian). Ang pinakakaraniwang ranggo na koepisyent ng koneksyon ( ugnayan ng ranggo) ay ang ρ-Spearman coefficient.

Ipagpalagay natin na ang n mga bagay ay inayos ng x at ng y. Hayaan

Isang sukatan ng mga pagkakaiba sa pagitan ng mga ranggo ng i-th object: d i = R x i - R y i

Ari-arian:

Mga pagbabago sa hanay mula -1 hanggang 1;

Po = 1, kung mayroong kumpletong pagkakapare-pareho ng ranggo na serye; ang mga ranggo ng parehong bagay ayon sa dalawang katangian ay nagtutugma.

Po = -1, kung mayroong kumpletong hindi pagkakapare-pareho ng ranggo na serye; ang sitwasyong ito ay lumitaw kung ang serye ng pagraranggo ay may kabaligtaran na direksyon: R x i – 1 2 3 4 5; R y i – 5 4 3 2 1.

Tandaan: maaaring kalkulahin para sa dalawang uri ng katumbas (kung ang bawat bagay ay may sariling ranggo at kung may mga kaugnay na ranggo).

Pagsubok sa hypothesis tungkol sa istatistikal na kahalagahanρ-Spearman coefficient.

H 0: ρ gc = 0

H 1: ρ gc ≠ 0

Ang null hypothesis ay palaging nagsasaad na ang ρ ay katumbas ng 0. Ang alternatibong hypothesis ay palaging nagsasaad na ang halaga ng ρ ay iba sa 0.

Antas ng kahalagahan tulad ng sa mga talahanayan ng contingency.

Estado A B SA G D E AT Z AT
Ang kalidad ng buhay 6,8 7,0 6,5 5,9 4,6 5,7 4,5 5,8 4,0
Kawalan ng trabaho 20,3 18,0 19,8 23,4 21,6 20,8
Ranggo x
Ranggo y
|d ako |
d 2 i
Σ d 2 i

τ -Kendall– ang pagkakaiba sa pagitan ng mga probabilidad ng tama at maling pagkakasunud-sunod para sa dalawang obserbasyon na nakuha mula sa populasyon nang random, sa kondisyon na walang magkakaugnay na mga ranggo. Ari-arian:

Mga pagbabago mula -1 hanggang 1;

Kung ang mga katangian x at y ay independyente sa istatistika, ang koepisyent τ ay nagiging 0; kung ang τ ay katumbas ng 0, hindi ito nangangahulugan na ang mga katangian ay independyente sa istatistika;

Kung ang τ ay katumbas ng 1, nangangahulugan ito na mayroong kumpletong direktang istatistikal na koneksyon sa pagitan ng mga katangian o ang ranggo na serye ay ganap na pare-pareho; kung ang τ ay katumbas ng -1, nangangahulugan ito na mayroong isang kumpletong kabaligtaran na ugnayang istatistika, o ang ranggo na serye ay hindi pare-pareho.

S – kabuuang bilang ng mga pares ng mga bagay na may pare-pareho sa tamang pagkakasunod-sunod para sa parehong mga bagay. Ang D ay ang kabuuang bilang ng mga pares ng mga bagay na may hindi pare-parehong maling pagkakasunud-sunod para sa parehong mga bagay.

Pagsubok sa hypothesis tungkol sa istatistikal na kahalagahan ng koepisyent τ:

H 0: τ gc = 0

H 1: τ gc ≠ 0

Ang koepisyent τ ay makabuluhan sa istatistika kung ang halaga nito para sa GS ay iba sa 0.

|Z H | > Z cr => H 1

Kung gagawa tayo ng isang ranggo na serye para sa isang maliit na bilang ng mga bagay, kung gayon ang pagkumpirma ng null hypothesis ay nagsasabi sa atin na kailangan nating pag-aralan malaking dami mga bagay.

Kung ang isang sapat na bilang ng mga bagay ay pinag-aralan, kung gayon ang pagkumpirma ng null hypothesis ay nagpapahiwatig na walang kaugnayan sa pagitan ng mga katangian.

Maramihang koepisyent koneksyon sa ranggo

Ginagamit ito sa mga kaso kung saan kinakailangang sukatin ang ugnayan sa pagitan ng higit sa 2 ranggo na serye (halimbawa, kapag gusto nating tasahin ang pagkakapare-pareho ng mga opinyon ng eksperto (higit sa 2) kapag tinatasa ang 1 sa parehong mga bagay).

S – kabuuan square deviations row rank values ​​mula sa average na ranggo para sa buong populasyon. k 2 – bilang ng mga variable (bilang ng mga eksperto). n – bilang ng mga nakararanggo na bagay.