Paano gumawa ng discrete variational series. Pagbuo ng isang serye ng pagkakaiba-iba ng pagitan para sa tuluy-tuloy na dami ng data

Ano ang pagpapangkat ng istatistikal na data, at kung paano ito nauugnay sa serye ng pamamahagi, ang isinaalang-alang sa lecture na ito, kung saan maaari mo ring malaman kung ano ang isang discrete at variational na serye ng pamamahagi.

Ang serye ng pamamahagi ay isa sa mga uri ng serye ng istatistika (bilang karagdagan sa mga ito, ang mga serye ng dinamika ay ginagamit sa mga istatistika), ginagamit ang mga ito upang pag-aralan ang data tungkol sa mga phenomena pampublikong buhay. Ang pagtatayo ng variational series ay isang magagawang gawain para sa lahat. Gayunpaman, may mga panuntunang dapat tandaan.

Paano bumuo ng isang discrete variational distribution series

Halimbawa 1 Available ang data sa bilang ng mga bata sa 20 na-survey na pamilya. Bumuo ng discrete variational series pamamahagi ng mga pamilya sa bilang ng mga bata.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Solusyon:

  1. Magsimula tayo sa layout ng talahanayan, kung saan ilalagay natin ang data. Dahil ang mga hilera ng pamamahagi ay may dalawang elemento, ang talahanayan ay bubuo ng dalawang hanay. Ang unang hanay ay palaging isang variant - kung ano ang aming pinag-aaralan - kinuha namin ang pangalan nito mula sa gawain (ang dulo ng pangungusap na may gawain sa mga kondisyon) - sa bilang ng mga bata- kaya ang aming bersyon ay ang bilang ng mga bata.

Ang pangalawang column ay ang dalas - kung gaano kadalas nangyayari ang aming variant sa phenomenon na pinag-aaralan - kinuha din namin ang pangalan ng column mula sa gawain - pamamahagi ng mga pamilya - kaya ang dalas namin ay ang bilang ng mga pamilya na may katumbas na bilang ng mga bata.

  1. Ngayon, mula sa paunang data, pipiliin namin ang mga halagang iyon na nangyayari nang hindi bababa sa isang beses. Sa aming kaso, ito

At ayusin natin ang data na ito sa unang hanay ng aming talahanayan sa isang lohikal na pagkakasunud-sunod, sa kasong ito ay tumataas mula 0 hanggang 4. Nakukuha namin

At sa konklusyon, kalkulahin natin kung gaano karaming beses nangyayari ang bawat halaga ng mga opsyon.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

Bilang resulta, nakakakuha kami ng kumpletong talahanayan o ang kinakailangang serye ng pamamahagi ng mga pamilya ayon sa bilang ng mga bata.

Ang gawain . Mayroong data sa mga kategorya ng taripa ng 30 manggagawa ng negosyo. Bumuo ng discrete variational series ng distribution ng mga manggagawa ayon sa kategorya ng taripa. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Paano bumuo ng isang pagkakaiba-iba ng pagitan ng serye ng pamamahagi

Bumuo tayo ng isang serye ng pamamahagi ng agwat, at tingnan kung paano naiiba ang pagtatayo nito sa isang discrete na serye.

Halimbawa 2 Mayroong data sa halaga ng kita na natanggap ng 16 na negosyo, milyong rubles. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Bumuo ng serye ng pagkakaiba-iba ng pagitan para sa pamamahagi ng mga negosyo ayon sa dami ng kita, na pumipili ng 3 grupo sa magkapantay na pagitan.

Ang pangkalahatang prinsipyo ng pagbuo ng isang serye, siyempre, ay mapangalagaan, ang parehong dalawang hanay, ang parehong mga variant at dalas, ngunit sa kasong ito ang mga variant ay matatagpuan sa pagitan at ang mga frequency ay mabibilang nang iba.

Solusyon:

  1. Magsimula tayo nang katulad sa nakaraang gawain sa pamamagitan ng pagbuo ng layout ng talahanayan, kung saan ilalagay natin ang data. Dahil ang mga hilera ng pamamahagi ay may dalawang elemento, ang talahanayan ay bubuo ng dalawang hanay. Ang unang column ay palaging isang variant - kung ano ang aming pinag-aaralan - kinuha namin ang pangalan nito mula sa gawain (ang dulo ng pangungusap na may gawain sa mga kondisyon) - sa pamamagitan ng halaga ng kita - na nangangahulugan na ang aming variant ay ang halaga ng kita natanggap.

Ang pangalawang column ay ang dalas - kung gaano kadalas nangyayari ang aming variant sa phenomenon na pinag-aaralan - kinuha din namin ang pangalan ng column mula sa assignment - ang pamamahagi ng mga negosyo - nangangahulugan ito na ang frequency namin ay ang bilang ng mga negosyo na may katumbas na kita, sa ang kasong ito ay bumabagsak sa pagitan.

Bilang resulta, ang layout ng aming talahanayan ay magiging ganito:

kung saan ang i ay ang halaga o haba ng pagitan,

Xmax at Xmin - ang maximum at minimum na halaga ng tampok,

n ay ang kinakailangang bilang ng mga pangkat ayon sa kondisyon ng problema.

Kalkulahin natin ang halaga ng pagitan para sa ating halimbawa. Upang gawin ito, kabilang sa mga paunang data, nakita namin ang pinakamalaki at pinakamaliit

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 - ang maximum na halaga ay 118 milyong rubles, at ang minimum ay 9 milyong rubles. Kalkulahin natin ang formula.

Sa pagkalkula nakuha namin ang bilang na 36, ​​(3) tatlo sa panahon, sa mga ganitong sitwasyon ang halaga ng pagitan ay dapat na bilugan sa isang mas malaki upang pagkatapos ng mga kalkulasyon ay hindi mawawala ang maximum na data, kaya naman ang halaga ng agwat sa pagkalkula ay 36.4 milyong rubles.

  1. Ngayon, buuin natin ang mga agwat - ang ating mga opsyon sa problemang ito. Ang unang agwat ay nagsisimula mula sa pinakamababang halaga, ang halaga ng agwat ay idinagdag dito at ang pinakamataas na limitasyon ng unang agwat ay nakuha. Pagkatapos ang itaas na limitasyon ng unang agwat ay nagiging mas mababang limitasyon ng pangalawang agwat, ang halaga ng agwat ay idinagdag dito at ang pangalawang agwat ay nakuha. At iba pa nang maraming beses hangga't kinakailangan upang bumuo ng mga agwat ayon sa kondisyon.

Bigyang-pansin natin kung hindi natin bilugan ang halaga ng pagitan sa 36.4, ngunit iiwan itong 36.3, kung gayon ang huling halaga ay magiging 117.9. Ito ay upang maiwasan ang pagkawala ng data na ito ay kinakailangan upang bilugan ang halaga ng pagitan sa isang mas malaking halaga.

  1. Bilangin natin ang bilang ng mga negosyo na nahuhulog sa bawat partikular na agwat. Kapag nagpoproseso ng data, dapat tandaan na ang itaas na halaga ng agwat sa agwat na ito ay hindi isinasaalang-alang (ay hindi kasama sa agwat na ito), ngunit isinasaalang-alang sa susunod na agwat (ang mas mababang limitasyon ng agwat ay kasama sa pagitan na ito, at hindi kasama ang nasa itaas), maliban sa huling agwat.

Kapag nagsasagawa ng pagpoproseso ng data, pinakamahusay na ipahiwatig ang napiling data gamit ang mga kumbensyonal na icon o kulay upang pasimplehin ang pagproseso.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Tinutukoy namin ang unang agwat dilaw- at tukuyin kung gaano karaming data ang nahuhulog sa pagitan mula 9 hanggang 45.4, habang ang 45.4 na ito ay isasaalang-alang sa pangalawang agwat (sa kondisyon na ito ay nasa data) - bilang isang resulta, makakakuha tayo ng 7 mga negosyo sa unang agwat. At iba pa para sa lahat ng mga pagitan.

  1. (karagdagang aksyon) Kalkulahin natin ang kabuuang halaga ng tubo na natanggap ng mga negosyo para sa bawat pagitan at sa pangkalahatan. Upang gawin ito, idinagdag namin ang data na minarkahan iba't ibang Kulay at makuha ang kabuuang halaga ng tubo.

Para sa unang pagitan 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 milyong rubles

Para sa pangalawang pagitan - 48 + 57 + 48 + 56 + 63 = 272 milyong rubles.

Para sa ikatlong pagitan - 118 + 87 + 98 + 88 = 391 milyong rubles.

Ang gawain . Mayroong data sa laki ng deposito sa bangko ng 30 depositor, libong rubles. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Bumuo serye ng pagkakaiba-iba ng pagitan pamamahagi ng mga depositor, ayon sa laki ng kontribusyon, na nagha-highlight ng 4 na grupo sa pantay na pagitan. Kalkulahin para sa bawat pangkat kabuuang sukat mga deposito.

Gawain sa laboratoryo №1. Pangunahing pagproseso ng istatistikal na data

Konstruksyon ng serye ng pamamahagi

Ang nakaayos na pamamahagi ng mga yunit ng populasyon sa mga pangkat ayon sa alinmang katangian ay tinatawag malapit sa pamamahagi . Sa kasong ito, ang pag-sign ay maaaring parehong dami, pagkatapos ay tinawag ang serye pagkakaiba-iba , at husay, pagkatapos ay tinatawag ang serye katangian . Halimbawa, ang populasyon ng isang lungsod ay maaaring ipamahagi ayon sa grupo ayon sa idad sa isang serye ng pagkakaiba-iba, o ayon sa propesyonal na kaugnayan sa isang serye ng katangian (siyempre, maaari kang mag-alok ng maraming higit pang husay at dami ng mga palatandaan para sa pagbuo ng serye ng pamamahagi, ang pagpili ng isang tanda ay tinutukoy ng gawain istatistikal na pananaliksik).

Ang anumang serye ng pamamahagi ay nailalarawan sa pamamagitan ng dalawang elemento:

- opsyon(x i) - ito ay mga indibidwal na halaga ng katangian ng mga yunit ng sample na populasyon. Para sa isang variational series, ang variant ay kumukuha ng mga numerical value, para sa isang attribute na series - mga qualitative (halimbawa, x = "civil servant");

- dalas(n i) ay isang numero na nagpapakita kung gaano karaming beses nangyayari ito o ang halaga ng tampok na iyon. Kung ang dalas ay ipinahayag bilang isang kamag-anak na numero (ibig sabihin, ang proporsyon ng mga elemento ng populasyon na naaayon sa binigay na halaga mga opsyon, sa kabuuang dami ng populasyon), pagkatapos ito ay tinatawag relatibong dalas o dalas.

Ang serye ng pagkakaiba-iba ay maaaring:

- discrete kapag ang katangiang pinag-aaralan ay nailalarawan ng isang tiyak na numero (karaniwan ay isang integer).

- pagitan kapag ang mga hangganan "mula sa" at "sa" ay tinukoy para sa isang patuloy na variable na tampok. serye ng pagitan bumuo din kung ang hanay ng mga halaga ng isang discretely variable na katangian ay malaki.

Ang isang serye ng agwat ay maaaring itayo kapwa na may mga pagitan ng pantay na haba (pantay na serye ng agwat) at may hindi pantay na mga agwat, kung ito ay idinidikta ng mga kondisyon ng istatistikal na pag-aaral. Halimbawa, ang isang serye ng pamamahagi ng kita ng populasyon na may mga sumusunod na pagitan ay maaaring isaalang-alang:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



kung saan ang k ay ang bilang ng mga pagitan, n ang laki ng sample. (Siyempre, ang formula ay karaniwang nagbibigay ng fractional na numero, at ang pinakamalapit na integer sa resultang numero ay pipiliin bilang bilang ng mga pagitan.) Ang haba ng pagitan sa kasong ito ay tinutukoy ng formula

.

Sa graphically, ang variational series ay maaaring katawanin bilang histograms(isang "column" ng taas na tumutugma sa frequency sa interval na ito ay binuo sa itaas ng bawat interval ng interval series), lugar ng pamamahagi(putol na linya na nagdudugtong sa mga punto ( x i;n i) o nag-iipon(itinayo ayon sa naipon na mga frequency, ibig sabihin, para sa bawat halaga ng katangian, ang dalas ng paglitaw sa hanay ng mga bagay na may halaga ng katangian na mas mababa kaysa sa ibinigay na isa ay kinuha).

Kapag nagtatrabaho sa Excel, ang mga sumusunod na function ay maaaring gamitin upang bumuo ng variational series:

SURIIN( hanay ng data) – upang matukoy ang laki ng sample. Ang argument ay ang hanay ng mga cell na naglalaman ng sample na data.

COUNTIF( saklaw; pamantayan) - maaaring gamitin upang bumuo ng isang katangian o serye ng variation. Ang mga argumento ay ang hanay ng array ng sample value ng attribute at ang criterion - ang numeric o text value ng attribute o ang numero ng cell kung saan ito matatagpuan. Ang resulta ay ang dalas ng paglitaw ng halagang iyon sa sample.

DALAS( hanay ng data; hanay ng pagitan) – upang bumuo ng isang variational series. Ang mga argumento ay ang hanay ng sample na array ng data at ang column ng mga agwat. Kung kinakailangan upang bumuo ng isang discrete na serye, kung gayon ang mga halaga ng mga pagpipilian ay ipinahiwatig dito, kung ito ay isang serye ng agwat, kung gayon ang itaas na mga hangganan ng mga agwat (tinatawag din silang "mga bulsa"). Dahil ang resulta ay isang column ng mga frequency, ang pagpapakilala ng function ay dapat kumpletuhin sa pamamagitan ng pagpindot sa CTRL+SHIFT+ENTER key na kumbinasyon. Tandaan na kapag nagtatakda ng isang hanay ng mga agwat kapag nagpapakilala ng isang function, ang huling halaga dito ay maaaring tanggalin - lahat ng mga halaga na hindi nahulog sa nakaraang "bulsa" ay ilalagay sa kaukulang "bulsa". Minsan nakakatulong ito upang maiwasan ang error na ang pinakamalaking sample na halaga ay hindi awtomatikong inilalagay sa huling "bulsa".

Bilang karagdagan, para sa mga kumplikadong pagpapangkat (ayon sa ilang pamantayan), ang tool na "pivot tables" ay ginagamit. Magagamit din ang mga ito upang bumuo ng mga katangian at serye ng variation, ngunit hindi kinakailangang kumplikado nito ang gawain. Gayundin, upang makabuo ng serye ng variation at histogram, mayroong "histogram" na pamamaraan mula sa add-in na "Analysis Package" (upang gumamit ng mga add-in sa Excel, kailangan mo munang i-download ang mga ito, hindi sila naka-install bilang default)

Inilalarawan namin ang proseso ng pangunahing pagpoproseso ng data sa mga sumusunod na halimbawa.

Halimbawa 1.1. may mga datos sa quantitative composition ng 60 pamilya.

Bumuo ng serye ng variation at polygon ng pamamahagi

Solusyon.

Buksan natin ang mga spreadsheet ng Excel. Maglagay tayo ng array ng data sa range A1:L5. Kung nag-aaral ka ng isang dokumento sa electronic form (sa Word format, halimbawa), ang kailangan mo lang gawin ay pumili ng isang talahanayan na may data at kopyahin ito sa clipboard, pagkatapos ay piliin ang cell A1 at i-paste ang data - awtomatiko nilang sasakupin ang naaangkop na saklaw. Kalkulahin natin ang sample size n - ang bilang ng sample data, para dito, sa cell B7, ipasok ang formula = COUNT (A1: L5). Tandaan na upang maipasok ang nais na hanay sa formula, hindi kinakailangan na ipasok ang pagtatalaga nito mula sa keyboard, sapat na upang piliin ito. Tukuyin natin ang minimum at maximum na mga halaga sa sample sa pamamagitan ng pagpasok ng formula =MIN(A1:L5) sa cell B8, at sa cell B9: =MAX(A1:L5).

Fig.1.1 Halimbawa 1. Pangunahing pagproseso ng istatistikal na data sa mga talahanayan ng Excel

Susunod, maghanda tayo ng talahanayan para sa pagbuo ng serye ng variation sa pamamagitan ng paglalagay ng mga pangalan para sa column ng interval (mga halaga ng opsyon) at column ng frequency. Sa hanay ng mga agwat, ipasok ang mga halaga ng katangian mula sa minimum (1) hanggang sa maximum (6), na sumasakop sa hanay na B12:B17. Piliin ang column ng frequency, ilagay ang formula =FREQUENCY(A1:L5;B12:B17) at pindutin ang key combination CTRL+SHIFT+ENTER

Fig.1.2 Halimbawa 1. Pagbuo ng isang serye ng variation

Para sa kontrol, kinakalkula namin ang kabuuan ng mga frequency gamit ang function na SUM (icon ng function na S sa pangkat ng Pag-edit sa tab na Home), dapat tumugma ang kinakalkula na kabuuan sa naunang nakalkulang laki ng sample sa cell B7.

Ngayon, bumuo tayo ng isang polygon: na napili ang resultang hanay ng dalas, piliin ang "Graph" na utos sa tab na "Insert". Bilang default, ang mga halaga sa pahalang na axis ay mga ordinal na numero - sa aming kaso, mula 1 hanggang 6, na tumutugma sa mga halaga ng mga pagpipilian (mga bilang ng mga kategorya ng taripa).

Ang pangalan ng serye ng chart na "serye 1" ay maaaring baguhin gamit ang parehong opsyon na "piliin ang data" sa tab na "Designer," o i-delete lang.

Fig.1.3. Halimbawa 1. Pagbuo ng frequency polygon

Halimbawa 1.2. Available ang data sa mga pollutant emissions mula sa 50 source:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Mag-compile ng pantay na serye ng pagitan, bumuo ng histogram

Solusyon

Magdagdag tayo ng isang array ng data sa isang Excel sheet, sasakupin nito ang hanay na A1:J5 Tulad ng sa nakaraang gawain, tutukuyin natin ang laki ng sample n, ang minimum at maximum na mga halaga sa sample. Dahil ngayon hindi namin kailangan ng isang discrete, ngunit isang serye ng pagitan, at ang bilang ng mga agwat sa problema ay hindi tinukoy, kinakalkula namin ang bilang ng mga pagitan k gamit ang formula ng Sturgess. Upang gawin ito, sa cell B10, ilagay ang formula =1+3.322*LOG10(B7).

Fig.1.4. Halimbawa 2. Konstruksyon ng isang pantay na serye ng pagitan

Ang resultang halaga ay hindi isang integer, ito ay humigit-kumulang 6.64. Dahil para sa k=7 ang haba ng mga pagitan ay ipapahayag bilang isang integer (sa kaibahan sa kaso ng k=6), pipiliin namin ang k=7 sa pamamagitan ng paglalagay ng halagang ito sa cell C10. Kinakalkula namin ang haba ng interval d sa cell B11 sa pamamagitan ng pagpasok ng formula = (B9-B8) / C10.

Tukuyin natin ang isang hanay ng mga pagitan, na tumutukoy sa itaas na hangganan para sa bawat isa sa 7 mga pagitan. Upang gawin ito, sa cell E8, kalkulahin ang itaas na limitasyon ng unang pagitan sa pamamagitan ng pagpasok ng formula =B8+B11; sa cell E9 ang itaas na limitasyon ng pangalawang pagitan sa pamamagitan ng pagpasok ng formula =E8+B11. Upang kalkulahin ang natitirang mga halaga ng itaas na mga limitasyon ng mga agwat, inaayos namin ang bilang ng cell B11 sa inilagay na formula gamit ang $ sign, upang ang formula sa cell E9 ay maging =E8+B$11, at kopyahin ang mga nilalaman ng cell E9 hanggang sa mga cell E10-E14. Ang huling halaga na nakuha ay katumbas ng pinakamataas na halaga sa sample na kinakalkula kanina sa cell B9.

Fig.1.5. Halimbawa 2. Konstruksyon ng isang pantay na serye ng pagitan


Ngayon punan natin ang hanay ng mga "bulsa" gamit ang FREQUENCY function, tulad ng ginawa sa halimbawa 1.

Fig.1.6. Halimbawa 2. Konstruksyon ng isang pantay na serye ng pagitan

Batay sa resultang variational series, bubuo kami ng histogram: piliin ang frequency column at piliin ang "Histogram" sa tab na "Insert". Matapos matanggap ang histogram, babaguhin namin ang mga label ng pahalang na axis sa loob nito sa mga halaga sa hanay ng mga agwat, para dito pipiliin namin ang pagpipiliang "Pumili ng data" ng tab na "Designer". Sa lalabas na window, piliin ang command na "Baguhin" para sa seksyong "Mga label ng horizontal axis" at ipasok ang hanay ng mga halaga ng mga variant sa pamamagitan ng pagpili nito gamit ang "mouse".

Fig.1.7. Halimbawa 2. Pagbuo ng histogram

Fig.1.8. Halimbawa 2. Pagbuo ng histogram

Isang halimbawa ng paglutas ng pagsusulit sa mga istatistika ng matematika

Gawain 1

Paunang data : mga mag-aaral ng isang partikular na grupo na binubuo ng 30 katao ang pumasa sa pagsusulit sa kursong "Informatics". Ang mga markang natanggap ng mga mag-aaral ay bumubuo ng mga sumusunod na serye ng mga numero:

I. Bumuo ng isang variational series

m x

w x

m x nak

w x nak

Kabuuan:

II. Graphical na representasyon ng istatistikal na impormasyon.

III. Mga numerical na katangian ng sample.

1. Arithmetic mean

2. Geometric ibig sabihin

3. Fashion

4. Median

222222333333333 | 3 34444444445555

5. Sample na pagkakaiba

7. Coefficient ng variation

8. Kawalaan ng simetrya

9. Asymmetry coefficient

10. Kurtosis

11. Kurtosis coefficient

Gawain 2

Paunang data : sumulat ng panghuling pagsusulit ang mga mag-aaral ng isang partikular na grupo. Ang grupo ay binubuo ng 30 katao. Ang mga iskor na nakuha ng mga mag-aaral ay bumubuo sa mga sumusunod na serye ng mga numero

Solusyon

I. Dahil ang tanda ay tumatagal ng maraming iba't ibang mga halaga, gagawa kami ng isang serye ng pagkakaiba-iba ng pagitan para dito. Upang gawin ito, itinakda muna namin ang halaga ng pagitan h. Gamitin natin ang formula ng Sturger

Gumawa tayo ng iskala ng mga pagitan. Sa kasong ito, para sa itaas na hangganan ng unang pagitan ay kukunin namin ang halaga na tinutukoy ng formula:

Ang itaas na mga hangganan ng kasunod na mga agwat ay tinutukoy ng sumusunod na recursive formula:

, pagkatapos

Natapos namin ang pagbuo ng sukat ng mga agwat, dahil ang pinakamataas na limitasyon ng susunod na agwat ay naging mas malaki kaysa o katumbas ng pinakamataas na halaga ng sample
.

II. Graphical na pagpapakita ng serye ng pagkakaiba-iba ng pagitan

III. Mga numerical na katangian ng sample

Upang matukoy ang mga numerical na katangian ng sample, bubuo kami ng isang auxiliary table

Sum:

1. Arithmetic mean

2. Geometric ibig sabihin

3. Fashion

4. Median

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Sample na pagkakaiba

6. Sample na standard deviation

7. Coefficient ng variation

8. Kawalaan ng simetrya

9. Asymmetry coefficient

10. Kurtosis

11. Kurtosis coefficient

Gawain 3

Kundisyon : ang halaga ng dibisyon ng sukat ng ammeter ay 0.1 A. Ang mga pagbasa ay bilugan sa pinakamalapit na buong dibisyon. Hanapin ang posibilidad na ang isang error na higit sa 0.02 A ay gagawin sa panahon ng pagbabasa.

Solusyon.

Ang error sa pag-ikot ay maaaring ituring bilang isang random na variable X, na ibinahagi nang pantay-pantay sa pagitan sa pagitan ng dalawang katabing dibisyon ng integer. Densidad ng pare-parehong pamamahagi

saan
- ang haba ng pagitan na naglalaman ng mga posibleng halaga X; sa labas ng pagitan na ito
Sa problemang ito, ang haba ng agwat na naglalaman ng mga posibleng halaga X, ay katumbas ng 0.1, kaya

Ang error sa pagbabasa ay lalampas sa 0.02 kung ito ay nakapaloob sa pagitan (0.02; 0.08). Pagkatapos

Sagot: R=0,6

Gawain 4

Paunang data: mathematical expectation at standard deviation ng isang feature na karaniwang ipinamamahagi X ay 10 at 2, ayon sa pagkakabanggit. Hanapin ang posibilidad na bilang resulta ng pagsubok X kukunin ang halaga na nakapaloob sa pagitan (12, 14).

Solusyon.

Gamitin natin ang formula

At theoretical frequency

Solusyon

Para sa X, ang mathematical expectation nito na M(X) at variance D(X). Solusyon. Hanapin ang distribution function F(x) ng isang random variable... sampling error). Mag-compose tayo pagkakaiba-iba hilera Lapad ng pagitan magiging: Para sa bawat halaga hilera Kalkulahin natin kung ilan...

  • Solusyon: separable equation

    Solusyon

    Sa form Upang makahanap ng isang pribado mga solusyon hindi magkakatulad na equation sumulat sistema Let's solve the resulting system... ; +47; +61; +10; -8. Bumuo ng pagitan pagkakaiba-iba hilera. Magbigay ng mga istatistikal na pagtatantya ng mean...

  • Solusyon: Kalkulahin natin ang chain at basic absolute growth rate, growth rate, growth rate. Ang nakuha na mga halaga ay ibinubuod sa talahanayan 1

    Solusyon

    Ang dami ng produksyon. Solusyon: Arithmetic mean ng pagitan pagkakaiba-iba hilera kinakalkula bilang sumusunod: bawat... Marginal sampling error na may posibilidad na 0.954 (t=2) magiging: Δ w = t*μ = 2*0.0146 = 0.02927 Tukuyin natin ang mga hangganan...

  • Solusyon. tanda

    Solusyon

    Tungkol sa kaninong karanasan sa trabaho at umabot sa sample. Ang average na haba ng serbisyo para sa sample ... ng araw ng trabaho ng mga empleyadong ito at umabot sa sample. Average na tagal para sa sample... 1.16, antas ng kabuluhan α = 0.05. Solusyon. pagkakaiba-iba hilera ng sample na ito ay may anyo: 0.71 ...

  • Working curriculum sa biology para sa mga baitang 10-11 Compiled by Polikarpova S. V

    Kurikulum sa pagtatrabaho

    Ang pinakasimpleng crossbreeding scheme» 5 L.r. " Solusyon elementarya genetic problema” 6 L.r. " Solusyon elementarya genetic problema” 7 L.r. "..., 110, 115, 112, 110. Mag-compose pagkakaiba-iba hilera, gumuhit pagkakaiba-iba curve, hanapin ang average na halaga ng tampok ...

  • Ang pagkakaroon ng data ng statistical observation na nagpapakilala sa ito o sa hindi pangkaraniwang bagay na iyon, una sa lahat ay kinakailangan upang i-streamline ang mga ito, i.e. gawin itong sistematiko

    English statistician. Matalinhagang sinabi ni UjReichman tungkol sa mga hindi nakaayos na pinagsama-samang pagsasama-sama na ang pagharap sa isang masa ng hindi pangkalahatan na data ay katumbas ng isang sitwasyon kapag ang isang tao ay itinapon sa kagubatan nang walang kumpas. Ano ang sistematisasyon ng istatistikal na datos sa anyo ng serye ng pamamahagi?

    Ang serye ng pamamahagi ng istatistika ay isang nakaayos na istatistikal na populasyon (Talahanayan 17). Ang pinakasimpleng uri ng serye ng pamamahagi ng istatistika ay isang serye ng ranggo, i.e. isang serye ng mga numero sa pataas o pababang pagkakasunod-sunod na iba't ibang mga palatandaan. Ang ganitong serye ay hindi nagpapahintulot sa amin na hatulan ang mga pattern na likas sa ipinamahagi na data: kung aling halaga ang nakagrupo ng karamihan ng mga tagapagpahiwatig, ano ang mga paglihis mula sa halagang ito; bilang pangkalahatang pattern ng pamamahagi. Para sa layuning ito, pinagsama-sama ang data, na nagpapakita kung gaano kadalas nangyayari ang mga indibidwal na obserbasyon sa kanilang kabuuang bilang (Skema 1a 1).

    . Talahanayan 17

    . Pangkalahatang pagtingin sa serye ng pamamahagi ng istatistika

    . Scheme 1. Scheme ng istatistika mga ranggo ng pamamahagi

    Ang distribusyon ng mga yunit ng populasyon ayon sa mga katangian na walang quantitative expression ay tinatawag serye ng katangian(halimbawa, ang pamamahagi ng mga negosyo ayon sa kanilang linya ng produksyon)

    Ang serye ng pamamahagi ng mga yunit ng populasyon ayon sa mga katangian, ay may isang quantitative expression, ay tinatawag serye ng pagkakaiba-iba. Sa naturang serye, ang halaga ng tampok (mga opsyon) ay nasa pataas o pababang pagkakasunud-sunod

    Sa serye ng pagkakaiba-iba ng pamamahagi, dalawang elemento ang nakikilala: mga variant at dalas . Pagpipilian- ito ay isang hiwalay na halaga ng tampok na pagpapangkat dalas- isang numero na nagpapakita kung gaano karaming beses nangyayari ang bawat opsyon

    Sa mathematical statistics, isa pang elemento ng variational series ang kinakalkula - bahagyang. Ang huli ay tinukoy bilang ang ratio ng dalas ng mga kaso ng isang naibigay na agwat sa kabuuang dami ng mga frequency, ang bahagi ay tinutukoy sa mga fraction ng isang yunit, porsyento (%) sa ppm (% o)

    Kaya, ang variational distribution series ay isang serye kung saan ang mga opsyon ay nakaayos sa pataas o pababang pagkakasunud-sunod, ang kanilang mga frequency o frequency ay ipinahiwatig. Ang variational series ay discrete (pererivny) at iba pang mga interval (continuous).

    . Discrete variation series- ito ay mga serye ng pamamahagi kung saan ang variant bilang ang halaga ng isang quantitative trait ay maaari lamang tumagal sa isang tiyak na halaga. Ang mga variant ay naiiba sa isa't isa sa pamamagitan ng isa o higit pang mga unit

    Kaya, ang bilang ng mga bahagi na ginawa sa bawat shift ng isang partikular na manggagawa ay maaaring ipahayag lamang ng isang tiyak na numero (6, 10, 12, atbp.). Ang isang halimbawa ng isang discrete variation series ay ang pamamahagi ng mga manggagawa ayon sa bilang ng mga bahaging ginawa (Talahanayan 18-18).

    . Talahanayan 18

    . Discrete na saklaw ng pamamahagi _

    . Interval (continuous) variation series- tulad ng serye ng pamamahagi kung saan ang halaga ng mga opsyon ay ibinibigay bilang mga pagitan, i.e. Ang mga halaga ng tampok ay maaaring mag-iba sa bawat isa sa pamamagitan ng isang maliit na halaga. Kapag gumagawa ng variational series ng NEP, imposibleng tukuyin ang bawat halaga ng mga variant, kaya ang set ay ipinamamahagi sa mga pagitan. Ang huli ay maaaring pantay o hindi. Para sa bawat isa sa kanila, ang mga frequency o frequency ay ipinahiwatig (Talahanayan 1 9 19).

    Sa serye ng pamamahagi ng agwat na may hindi pantay na agwat, ang mga katangiang pangmatematika tulad ng density ng pamamahagi at kamag-anak na density ng pamamahagi sa isang partikular na agwat ay kinakalkula. Ang unang katangian ay tinutukoy ng ratio ng dalas sa halaga ng parehong pagitan, ang pangalawa - sa pamamagitan ng ratio ng dalas sa halaga ng parehong pagitan. Para sa halimbawa sa itaas, ang density ng pamamahagi sa unang pagitan ay magiging 3: 5 = 0.6, at ang kamag-anak na density sa pagitan na ito ay magiging 7.5: 5 = 1.55%.

    . Talahanayan 19

    . Serye ng pamamahagi ng pagitan _

    2. Ang konsepto ng serye ng pamamahagi. Discrete at interval distribution series

    mga hilera ng pamamahagi Ang mga pagpapangkat ng isang espesyal na uri ay tinatawag, kung saan para sa bawat katangian, pangkat ng mga katangian o klase ng mga katangian, ang bilang ng mga yunit sa pangkat o ang bahagi ng bilang na ito sa kabuuan ay nalalaman. Yung. serye ng pamamahagi– isang nakaayos na hanay ng mga halaga ng katangian na nakaayos sa pataas o pababang pagkakasunud-sunod na may katumbas na mga timbang. Ang mga serye ng pamamahagi ay maaaring gawin sa pamamagitan ng quantitative o sa pamamagitan ng attribute.

    Ang mga serye ng pamamahagi na binuo sa isang quantitative na batayan ay tinatawag na serye ng pagkakaiba-iba. Sila ay discrete at interval. Ang isang serye ng pamamahagi ay maaaring buuin sa isang patuloy na nag-iiba-iba na tampok (kapag ang isang tampok ay maaaring tumagal sa anumang mga halaga sa loob ng isang agwat) at sa isang discretely nag-iiba-iba na tampok (kumukuha ng mahigpit na tinukoy na mga halaga ng integer).

    discrete ang variational distribution series ay isang hanay ng mga variant na may katumbas na frequency o mga detalye. Ang mga variant ng isang discrete series ay discretely na walang tigil na pagbabago ng mga value ng isang sign, kadalasan ito ang resulta ng isang count.

    discrete

    Ang variational series ay karaniwang itinatayo kung ang mga halaga ng katangiang pinag-aaralan ay maaaring mag-iba sa isa't isa ng hindi bababa sa ilang may hangganang halaga. Sa discrete series, tinukoy ang mga point value ng isang feature. Halimbawa : Pamamahagi ng mga panlalaking suit na ibinebenta ng mga tindahan bawat buwan ayon sa laki.

    pagitan

    ang isang variational series ay isang nakaayos na hanay ng mga agwat ng pagkakaiba-iba ng mga halaga ng isang random na variable na may kaukulang mga frequency o frequency ng mga halaga ng dami na bumabagsak sa bawat isa sa kanila. Ang serye ng pagitan ay idinisenyo upang suriin ang pamamahagi ng isang patuloy na pagbabago ng tampok, ang halaga nito ay kadalasang naitala sa pamamagitan ng pagsukat o pagtimbang. Ang mga variant ng naturang row ay isang pagpapangkat.

    Halimbawa : Pamamahagi ng mga binili sa grocery store ayon sa halaga.

    Kung sa discrete variational series ang frequency response ay direktang tumutukoy sa variant ng series, pagkatapos ay sa pagitan ng mga ito sa pangkat ng mga variant.

    Maginhawang suriin ang serye ng pamamahagi sa tulong ng kanilang graphical na representasyon, na ginagawang posible upang hatulan ang parehong hugis ng pamamahagi at ang mga pattern. Ang isang discrete series ay ipinapakita sa chart bilang isang putol na linya - lugar ng pamamahagi. Upang maitayo ito sa isang hugis-parihaba na sistema ng coordinate, ang mga naka-rank (nakaayos) na mga halaga ng iba't ibang tampok ay naka-plot sa abscissa sa parehong sukat, at ang sukat para sa pagpapahayag ng mga frequency ay naka-plot kasama ang ordinate.

    Ang mga serye ng pagitan ay ipinapakita bilang mga histogram ng pamamahagi(ibig sabihin, mga bar graph).

    Kapag bumubuo ng isang histogram, ang mga halaga ng mga pagitan ay naka-plot sa abscissa axis, at ang mga frequency ay inilalarawan ng mga parihaba na binuo sa kaukulang mga agwat. Ang taas ng mga haligi sa kaso ng pantay na mga pagitan ay dapat na proporsyonal sa mga frequency.

    Ang anumang histogram ay maaaring ma-convert sa isang polygon ng mga distribusyon; para dito, kinakailangan upang ikonekta ang mga vertices ng mga parihaba nito na may mga tuwid na segment.

    2. Paraan ng index para sa pagsusuri ng epekto ng average na output at average na headcount sa mga pagbabago sa output

    Paraan ng index ay ginagamit upang pag-aralan ang dynamics at paghambingin ang mga pangkalahatang tagapagpahiwatig, pati na rin ang mga salik na nakakaimpluwensya sa pagbabago sa mga antas ng mga tagapagpahiwatig na ito. Sa tulong ng mga indeks, posibleng ihayag ang impluwensya ng average na output at ang average na headcount sa mga pagbabago sa dami ng produksyon. Ang problemang ito ay nalulutas sa pamamagitan ng pagbuo ng isang sistema ng analytical index.

    Ang index ng dami ng produksyon na may index ng average na bilang ng mga empleyado at ang index ng average na output ay nauugnay sa parehong paraan tulad ng output (Q) ay nauugnay sa output ( w) at numero ( r) .

    Maaari nating tapusin na ang dami ng produksyon ay magiging katumbas ng produkto ng average na output at ang average na headcount:

    Q = w r, kung saan ang Q ay ang dami ng produksyon,

    w - average na output,

    r ay ang average na bilang ng mga tao.

    Tulad ng nakikita mo, pinag-uusapan natin ang kaugnayan ng mga phenomena sa statics: ang produkto ng dalawang mga kadahilanan ay nagbibigay ng kabuuang dami ng nagresultang kababalaghan. Malinaw din na gumagana ang koneksyon na ito, samakatuwid, ang dynamics ng koneksyon na ito ay pinag-aralan sa tulong ng mga indeks. Para sa halimbawang ibinigay, ito ang sumusunod na sistema:

    J w × J r = J wr .

    Halimbawa, ang index ng production volume Jwr, bilang isang index ng isang resultang phenomenon, ay maaaring mabulok sa dalawang index factor: ang index ng average na output (Jw), at ang index ng average na headcount (Jr):

    Index Index Index

    ang dami ng average

    lakas ng output ng produksyon

    saan J w- labor productivity index na kinakalkula ng Laspeyres formula;

    J r- index ng bilang ng mga empleyado, na kinakalkula ayon sa Paasche formula.

    Ang mga sistema ng index ay ginagamit upang matukoy ang impluwensya ng mga indibidwal na kadahilanan sa pagbuo ng antas ng epektibong tagapagpahiwatig; pinapayagan nila ang pagtukoy ng halaga ng hindi alam sa pamamagitan ng 2 kilalang mga halaga ng index.

    Sa batayan ng ibinigay na sistema ng mga indeks, mahahanap din ng isa ang ganap na pagtaas sa dami ng produksyon, na nabulok sa impluwensya ng mga salik.

    1. Kabuuang pagtaas sa dami ng produksyon:

    ∆wr = ∑w 1 r 1 - ∑w 0 r 0 .

    2. Paglago dahil sa pagkilos ng average na tagapagpahiwatig ng output:

    ∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

    3. Paglago dahil sa pagkilos ng indicator ng average na headcount:

    ∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

    ∆wr = ∆wr/w + ∆wr/r.

    Halimbawa. Ang sumusunod na impormasyon ay kilala

    Matutukoy natin kung paano nagbago ang dami ng produksyon sa relatibong at ganap na mga termino at kung paano naimpluwensyahan ng mga indibidwal na salik ang pagbabagong ito.

    Ang dami ng produksyon ay umabot sa:

    sa base period

    w 0 * r 0 \u003d 2000 * 90 \u003d 180000,

    at sa pag-uulat

    w 1 * r 1 \u003d 2100 * 100 \u003d 210000.

    Dahil dito, tumaas ang dami ng produksyon ng 30,000 o 1.16%.

    ∆wr=∑w 1 r 1 -∑w 0 r 0= (210000-180000)=30000

    o (210000:180000)*100%=1.16%.

    Ang pagbabagong ito sa dami ng produksyon ay dahil sa:

    1) pagtaas ng average na headcount ng 10 tao o ng 111.1%

    r 1 / r 0 \u003d 100 / 90 \u003d 1.11 o 111.1%.

    Sa ganap na termino, dahil sa kadahilanang ito, ang dami ng produksyon ay tumaas ng 20,000:

    w 0 r 1 - w 0 r 0 \u003d w 0 (r 1 -r 0) \u003d 2000 (100-90) \u003d 20000.

    2) pagtaas ng average na output ng 105% o ng 10,000:

    w 1 r 1 / w 0 r 1 \u003d 2100 * 100 / 2000 * 100 \u003d 1.05 o 105%.

    Sa ganap na termino, ang pagtaas ay:

    w 1 r 1 - w 0 r 1 \u003d (w 1 -w 0) r 1 \u003d (2100-2000) * 100 \u003d 10000.

    Samakatuwid, ang pinagsamang impluwensya ng mga kadahilanan ay:

    1. Sa ganap na termino

    10000 + 20000 = 30000

    2. Sa relatibong termino

    1,11 * 1,05 = 1,16 (116%)

    Samakatuwid, ang pagtaas ay 1.16%. Ang parehong mga resulta ay nakuha dati.

    Ang salitang "index" sa pagsasalin ay nangangahulugang pointer, indicator. Sa mga istatistika, ang index ay binibigyang kahulugan bilang isang kamag-anak na tagapagpahiwatig na nagpapakita ng pagbabago sa isang kababalaghan sa oras, espasyo o kung ihahambing sa plano. Dahil ang index ay isang kamag-anak na halaga, ang mga pangalan ng mga indeks ay kaayon ng mga pangalan ng mga kaugnay na halaga.

    Sa mga kasong iyon kapag pinag-aaralan namin ang pagbabago sa paglipas ng panahon ng mga inihambing na produkto, maaari naming itaas ang tanong kung paano nagbabago ang mga bahagi ng index (presyo, pisikal na dami, istraktura ng produksyon o mga benta ng mga indibidwal na uri ng mga produkto) sa ilalim ng iba't ibang mga kondisyon (sa iba't ibang mga lugar). Kaugnay nito, ang mga indeks ng pare-pareho ang komposisyon, variable na komposisyon, at mga pagbabago sa istruktura ay binuo.

    Permanenteng (fixed) composition index - ito ay isang index na nagpapakilala sa dinamika ng average na halaga na may parehong nakapirming istraktura ng populasyon.

    Ang prinsipyo ng pagbuo ng isang index ng pare-pareho ang komposisyon ay upang maalis ang impluwensya ng mga pagbabago sa istraktura ng mga timbang sa na-index na halaga sa pamamagitan ng pagkalkula ng timbang na average na antas ng na-index na tagapagpahiwatig na may parehong mga timbang.

    Ang index ng pare-parehong komposisyon ay magkapareho sa anyo sa pinagsama-samang index. Ang pinagsama-samang anyo ay ang pinakakaraniwan.

    Ang palaging index ng komposisyon ay kinakalkula gamit ang mga timbang na naayos sa antas ng isa sa anumang panahon, at ipinapakita lamang ang pagbabago sa na-index na halaga. Ang palaging index ng komposisyon ay nag-aalis ng impluwensya ng mga pagbabago sa istraktura ng mga timbang sa na-index na halaga sa pamamagitan ng pagkalkula ng average na timbang na antas ng na-index na tagapagpahiwatig na may parehong mga timbang. Sa mga indeks ng pare-pareho ang komposisyon, ang mga tagapagpahiwatig na kinakalkula batay sa isang pare-parehong istraktura ng mga phenomena ay inihambing.