Mga de-numerong katangian ng mga random na variable. Mode at median

Ang layunin ng aralin: upang mabuo ang pag-unawa ng mga mag-aaral sa median ng isang set ng mga numero at ang kakayahang kalkulahin ito para sa mga simpleng hanay ng numero, pag-aayos ng konsepto ng arithmetic mean set ng mga numero.

Uri ng aralin: pagpapaliwanag ng bagong materyal.

Kagamitan: board, textbook, ed. Yu.N Tyurina "Probability theory and statistics", computer na may projector.

Sa panahon ng mga klase

1. Organisasyon sandali.

Ipaalam ang paksa ng aralin at bumalangkas ng mga layunin nito.

2. Actualization ng dating kaalaman.

Mga tanong para sa mga mag-aaral:

  • Ano ang arithmetic mean ng isang set ng mga numero?
  • Saan matatagpuan ang arithmetic mean sa loob ng isang set ng mga numero?
  • Ano ang katangian ng arithmetic mean ng isang set ng mga numero?
  • Nasaan ang arithmetic mean ng isang set ng mga numero na kadalasang ginagamit?

Mga gawain sa bibig:

Hanapin ang arithmetic mean ng isang set ng mga numero:

  • 1, 3, 5, 7, 9;
  • 10, 12, 18, 20

Pagsusulit takdang aralin gamit ang projector ( Kalakip 1):

Teksbuk:: Blg. 12 (b, d), Blg. 18 (c, d)

3. Pag-aaral ng bagong materyal.

Sa nakaraang aralin, nakilala natin ang isang istatistikal na katangian tulad ng arithmetic mean ng isang set ng mga numero. Ngayon ay maglalaan tayo ng isang aralin sa isa pang istatistikal na katangian - ang median.

Hindi lamang ang arithmetic mean ay nagpapakita kung saan sa linya ng numero ang mga numero ng anumang hanay ay matatagpuan at kung saan ang kanilang sentro. Ang isa pang tagapagpahiwatig ay ang median.

Ang median ng isang set ng mga numero ay ang bilang na naghahati sa set sa dalawang pantay na bahagi. Sa halip na "median" maaaring sabihin ng isa ang "gitna".

Una, gamit ang mga halimbawa, susuriin namin kung paano hanapin ang median, at pagkatapos ay magbibigay kami ng isang mahigpit na kahulugan.

Isaalang-alang ang mga sumusunod pasalitang halimbawa gamit ang projector Appendix 2)

Sa huli taon ng paaralan 11 estudyante ng ika-7 baitang ang pumasa sa pamantayan para sa pagtakbo ng 100 metro. Ang mga sumusunod na resulta ay naitala:

Matapos tumakbo ang mga lalaki sa malayo, nilapitan ni Petya ang guro at tinanong kung ano ang kanyang resulta.

"Karamihan sa karaniwan: 16.9 segundo," sagot ng guro

"Bakit?" Nagulat si Petya. - Pagkatapos ng lahat, ang arithmetic mean ng lahat ng mga resulta ay humigit-kumulang 18.3 segundo, at tumakbo ako ng isang segundo o mas mahusay. At sa pangkalahatan, ang resulta ni Katya (18.4) ay mas malapit sa average kaysa sa akin."

“Average ang resulta mo dahil limang tao ang tumakbo nang mas mahusay kaysa sa iyo at limang mas masahol pa. Kaya nasa gitna ka,” sabi ng guro. [ 2 ]

Sumulat ng isang algorithm para sa paghahanap ng median ng isang hanay ng mga numero:

  1. Pag-order ng numerical set (bumuo ng isang ranggo na serye).
  2. Kasabay nito ay tinatawid namin ang "pinakamalaking" at "pinakamaliit" na mga numero ng hanay ng mga numerong ito hanggang sa manatili ang isang numero o dalawang numero.
  3. Kung mayroon lamang isang numero, ito ay ang median.
  4. Kung may natitira pang dalawang numero, ang median ay ang arithmetic mean ng dalawang natitirang numero.

Anyayahan ang mga mag-aaral na independiyenteng bumalangkas ng kahulugan ng median ng isang set ng mga numero, pagkatapos ay basahin ang dalawang kahulugan ng median sa textbook (p. 50), pagkatapos ay suriin ang mga halimbawa 4 at 5 ng textbook (pp. 50-52)

Komento:

Gumuhit ng pansin ng mga mag-aaral sa isang mahalagang pangyayari: ang median ay halos hindi sensitibo sa mga makabuluhang paglihis ng mga indibidwal na matinding halaga ng mga hanay ng mga numero. Sa mga istatistika, ang ari-arian na ito ay tinatawag na katatagan. Ang katatagan ng isang istatistikal na tagapagpahiwatig ay isang napakahalagang katangian, sinisiguro nito sa amin laban sa mga random na error at indibidwal na hindi mapagkakatiwalaang data.

4. Pagsasama-sama ng pinag-aralan na materyal.

Ang desisyon ng mga numero mula sa aklat-aralin hanggang sa item 11 "Median".

Set ng mga numero: 1,3,5,7,9

=(1+3+5+7+9):5=25:5=5

Set ng mga numero: 1,3,5,7,14.

=(1+3+5+7+14):5=30:5=6

a) Set ng mga numero: 3,4,11,17,21

b) Set ng mga numero: 17,18,19,25,28

c) Set ng mga numero: 25, 25, 27, 28, 29, 40, 50

Konklusyon: ang median ng isang set ng mga numero na binubuo ng isang kakaibang bilang ng mga miyembro ay katumbas ng bilang sa gitna.

a) Set ng mga numero: 2, 4, 8 , 9.

Ako = (4+8):2=12:2=6

b) Set ng mga numero: 1,3, 5,7 ,8,9.

Ako = (5+7):2=12:2=6

Ang median ng isang set ng mga numero na naglalaman ng kahit na bilang ng mga miyembro ay kalahati ng kabuuan ng dalawang numero sa gitna.

Natanggap ng estudyante ang mga sumusunod na marka sa algebra sa quarter:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Hanapin ang mean score at median ng set na ito. [ 3 ]

Mag-order tayo ng isang set ng mga numero: 2,4,4,4,5,5,5,5,5,5,5

10 numero lamang, upang mahanap ang median kailangan mong kumuha ng dalawang gitnang numero at hanapin ang kanilang kalahating kabuuan.

Ako = (5+5):2 = 5

Tanong sa mga mag-aaral: Kung ikaw ay isang guro, anong grado ang ibibigay mo sa mag-aaral na ito sa isang quarter? Pangatwiranan ang sagot.

Ang presidente ng kumpanya ay tumatanggap ng suweldo na 300,000 rubles. tatlo sa kanyang mga kinatawan ay tumatanggap ng 150,000 rubles bawat isa, apatnapung empleyado - 50,000 rubles bawat isa. at ang suweldo ng isang tagapaglinis ay 10,000 rubles. Hanapin ang arithmetic mean at median ng mga suweldo sa kumpanya. Alin sa mga katangiang ito ang mas kumikita para magamit ng pangulo para sa mga layunin ng advertising?

= (300000+3 150000+40 50000+10000):(1+3+40+1) = 2760000:4561333.33 (rubles)

Gawain 3. (Anyayahan ang mga mag-aaral na mag-solve sa kanilang sarili, i-proyekto ang gawain gamit ang projector)

Ipinapakita ng talahanayan ang tinatayang dami ng tubig sa mga pinakamalaking lawa at reservoir sa Russia sa metro kubiko. km. (Annex 3) [ 4 ]

A) Hanapin ang average na dami ng tubig sa mga reservoir na ito (arithmetic mean);

B) Hanapin ang dami ng tubig sa average na laki ng reservoir (median ng data);

C) Sa iyong palagay, alin sa mga katangiang ito - ang arithmetic mean o ang median - ang pinakamahusay na naglalarawan sa dami ng isang tipikal na malaking reservoir ng Russia? Ipaliwanag ang sagot.

a) 2459 cu. km

b) 60 cu. km

c) Median, dahil ang data ay naglalaman ng mga halaga na ibang-iba sa lahat ng iba pa.

Gawain 4. Pasalita.

A) Ilang numero ang nasa set kung ang median nito ay ang ika-siyam na termino nito?

B) Ilang numero ang nasa set kung ang median nito ay ang arithmetic mean ng ika-7 at ika-8 miyembro?

C) Sa isang set ng pitong numero, ang pinakamalaking bilang ay nadagdagan ng 14. Mababago ba nito ang parehong arithmetic mean at median?

D) Ang bawat isa sa mga numero sa set ay nadagdagan ng 3. Ano ang mangyayari sa arithmetic mean at median?

Ang mga matamis sa tindahan ay ibinebenta ayon sa timbang. Upang malaman kung gaano karaming mga matamis ang nilalaman sa isang kilo, nagpasya si Masha na hanapin ang bigat ng isang kendi. Tumimbang siya ng ilang kendi at nakuha ang mga sumusunod na resulta:

12, 13, 14, 12, 15, 16, 14, 13, 11.

Ang parehong mga katangian ay angkop para sa pagtantya ng bigat ng isang kendi, dahil hindi sila gaanong naiiba sa isa't isa.

Kaya, upang makilala ang istatistikal na impormasyon, ang arithmetic mean at median ay ginagamit. Sa maraming mga kaso, ang ilan sa mga katangian ay maaaring walang anumang makabuluhang kahulugan (halimbawa, pagkakaroon ng impormasyon tungkol sa oras ng mga aksidente sa trapiko, halos hindi makatuwirang pag-usapan ang tungkol sa arithmetic mean ng data na ito).

  1. Takdang-Aralin: talata 11, Blg. 3,4,9,11.
  2. Mga resulta ng aralin. Pagninilay.

Panitikan:

  1. Yu.N. Tyurin et al. "Teorya ng Probability at Statistics", MCNMO Publishing House, JSC "Moscow Textbooks", Moscow 2008.
  2. E.A. Bunimovich, V.A. Bulychev "Mga Batayan ng mga istatistika at posibilidad", DROFA, Moscow 2004.
  3. Pahayagang “Mathematics” No. 23, 2007.
  4. Demo na bersyon kontrol sa trabaho sa probability theory at statistics para sa grade 7, 2007/2008 account. taon.

fashion() tuloy-tuloy random variable ay ang halaga nito, na tumutugma sa pinakamataas na halaga ng probability density nito.

median() Ang isang tuluy-tuloy na random na variable ay ang halaga nito, na tinutukoy ng pagkakapantay-pantay:

B15. Binomial distribution law at ang mga numerical na katangian nito. Binomial na pamamahagi naglalarawan ng paulit-ulit na malayang karanasan. Tinutukoy ng batas na ito ang paglitaw ng mga oras ng kaganapan sa mga independiyenteng pagsubok, kung ang posibilidad ng paglitaw ng isang kaganapan sa bawat isa sa mga eksperimentong ito ay hindi nagbabago mula sa karanasan hanggang sa karanasan. Probability:

,

kung saan: ay ang alam na posibilidad ng paglitaw ng isang kaganapan sa eksperimento, na hindi nagbabago mula sa karanasan hanggang sa karanasan;

ay ang posibilidad na hindi lumitaw ang kaganapan sa eksperimento;

ay ang tinukoy na bilang ng paglitaw ng kaganapan sa mga eksperimento;

ay ang bilang ng mga kumbinasyon ng mga elemento sa pamamagitan ng .

B15. Uniform na batas sa pamamahagi, mga graph ng function at density ng pamamahagi, mga katangian ng numero. Ang isang tuluy-tuloy na random na variable ay isinasaalang-alang pantay na ipinamahagi, kung ang probability density nito ay may anyo:

Inaasahang halaga isang random variable na mayroon pare-parehong pamamahagi:

Pagpapakalat maaaring kalkulahin tulad ng sumusunod:

Katamtaman karaniwang lihis magiging ganito:

.

B17. Ang exponential law ng distribution, mga graph ng function at distribution density, mga numerical na katangian. exponential distribution Ang tuluy-tuloy na random na variable ay isang distribusyon na inilalarawan ng sumusunod na expression para sa probability density:

,

kung saan ay isang palaging positibong halaga.

Ang probability distribution function sa kasong ito ay may anyo:

Ang mathematical na inaasahan ng isang random na variable na may exponential distribution ay nakuha batay sa pangkalahatang pormula isinasaalang-alang ang katotohanan na kapag:

.

Ang pagsasama ng expression na ito sa pamamagitan ng mga bahagi, makikita natin ang: .

Ang pagkakaiba para sa exponential distribution ay maaaring makuha gamit ang expression:

.

Ang pagpapalit ng expression para sa probability density, nakita namin:

Ang pagkalkula ng integral sa pamamagitan ng mga bahagi, nakukuha natin ang: .



B16. Normal na batas sa pamamahagi, mga graph ng function at density ng pamamahagi. Karaniwang normal na pamamahagi. Sinasalamin ang function normal na pamamahagi. normal tinatawag ang gayong distribusyon ng isang random na variable, ang probability density nito ay inilalarawan ng Gaussian function:

nasaan ang standard deviation;

ay ang matematikal na inaasahan ng isang random na variable.


Ang isang normal na plot ng density ng pamamahagi ay tinatawag na isang normal na Gaussian curve.

B18. Ang hindi pagkakapantay-pantay ni Markov. Pangkalahatan ang hindi pagkakapantay-pantay ni Chebyshev. Kung para sa isang random variable X umiiral, pagkatapos ay para sa anumang Ang hindi pagkakapantay-pantay ni Markov .

Nagmumula ito sa pangkalahatang hindi pagkakapantay-pantay ng Chebyshev: Hayaang ang function ay monotonically pagtaas at non-negatibo sa . Kung para sa isang random variable X umiiral, pagkatapos ay para sa anumang hindi pagkakapantay-pantay .

B19. Batas malalaking numero sa anyo ng Chebyshev. Kahulugan nito. Bunga ng batas ng malalaking numero sa anyo ng Chebyshev. Ang batas ng malalaking numero sa anyo ng Bernoulli. Sa ilalim batas ng malalaking numero sa probability theory, ang isang bilang ng mga theorems ay nauunawaan, sa bawat isa kung saan ang katotohanan ng asymptotic approximation ng average na halaga ng isang malaking bilang ng mga eksperimentong data sa matematikal na inaasahan ng isang random na variable ay itinatag. Ang mga patunay ng mga teorema na ito ay batay sa hindi pagkakapantay-pantay ni Chebyshev. Ang hindi pagkakapantay-pantay na ito ay maaaring makuha sa pamamagitan ng pagsasaalang-alang sa isang discrete random variable na may mga posibleng halaga.

Teorama. Hayaang magkaroon ng isang may hangganang pagkakasunod-sunod mga independiyenteng random na variable, na may parehong pag-asa sa matematika at mga pagkakaiba-iba na limitado ng parehong pare-pareho :

Pagkatapos, anuman ang numero , ang posibilidad ng kaganapan

may kaugaliang pagkakaisa sa .

Ang teorama ni Chebyshev ay nagtatatag ng isang koneksyon sa pagitan ng teorya ng posibilidad, na isinasaalang-alang ang average na mga katangian ng buong hanay ng mga halaga ng isang random na variable, at mga istatistika ng matematika, na nagpapatakbo sa isang limitadong hanay ng mga halaga ng variable na ito. Ipinakita niya iyon nang sapat malalaking numero mga sukat ng ilang random na variable, ang arithmetic mean ng mga halaga ng mga sukat na ito ay lumalapit sa mathematical na inaasahan.

SA 20. Paksa at mga gawain ng mga istatistika ng matematika. Pangkalahatan at sample na populasyon. Paraan ng pagpili. Mga istatistika sa matematika- ang agham ng mga pamamaraan sa matematika sistematisasyon at paggamit ng istatistikal na datos para sa siyentipiko at praktikal na konklusyon, batay sa teorya ng posibilidad.

Ang mga bagay ng pag-aaral ng mga istatistika ng matematika ay mga random na kaganapan, dami at mga function na nagpapakilala sa itinuturing na random na kababalaghan. Ang mga sumusunod na kaganapan ay random: nanalo ng isang tiket ng cash lottery, pagsunod sa kinokontrol na produkto sa itinatag na mga kinakailangan, walang problema na pagpapatakbo ng kotse sa unang buwan ng operasyon nito, katuparan ng kontratista ng pang-araw-araw na iskedyul ng trabaho.

set ng sampling ay isang koleksyon ng mga random na napiling mga bagay.

Pangkalahatang populasyon pangalanan ang hanay ng mga bagay kung saan ginawa ang sample.

SA 21. Mga paraan ng pagpili.

Mga paraan ng pagpili: 1 Pagpili na hindi nangangailangan ng paghiwa-hiwalay populasyon sa mga bahagi. Kabilang dito ang a) simpleng random na hindi paulit-ulit na pagpili at b) simpleng random na muling pagpili. 2) Pagpili, kung saan ang pangkalahatang populasyon ay nahahati sa mga bahagi. Kabilang dito ang a) pagpili ng uri, b) pagpili ng mekanikal at c) pagpili ng serial.

Simpleng random tinatawag na seleksyon, kung saan ang mga bagay ay kinukuha ng isa-isa mula sa pangkalahatang populasyon.

Karaniwan tinatawag na seleksyon, kung saan ang mga bagay ay pinili hindi mula sa buong pangkalahatang populasyon, ngunit mula sa bawat isa sa mga "karaniwang" bahagi nito.

Mekanikal tinatawag na seleksyon, kung saan ang pangkalahatang populasyon ay mekanikal na nahahati sa kasing dami ng mga bagay na isasama sa sample, at isang bagay ang pinipili mula sa bawat pangkat.

Serial tinatawag na seleksyon, kung saan ang mga bagay ay pinili mula sa pangkalahatang populasyon hindi isa-isa, ngunit "serye", na sumasailalim sa isang patuloy na survey.

B22. Statistical at variational series. Empirical distribution function at mga katangian nito. Serye ng pagkakaiba-iba para sa discrete at tuluy-tuloy na random variable. Hayaang kunin ang isang sample mula sa pangkalahatang populasyon, at ang halaga ng parameter na pinag-aaralan ay naobserbahan nang isang beses, isang beses, atbp. Gayunpaman, ang laki ng sample Ang mga naobserbahang halaga ay tinatawag mga pagpipilian, at ang sequence ay isang variant na nakasulat sa pataas na pagkakasunud-sunod - serye ng pagkakaiba-iba . Ang bilang ng mga obserbasyon ay tinatawag mga frequency, at ang kanilang kaugnayan sa laki ng sample - mga kamag-anak na frequency.Serye ng pagkakaiba-iba ay maaaring katawanin bilang isang talahanayan:

X …..
n ….

Ang istatistikal na pamamahagi ng sample tawagan ang listahan ng mga opsyon at ang kani-kanilang mga kamag-anak na frequency. Ang distribusyon ng istatistika ay maaaring kinakatawan bilang:

X …..
w ….

nasaan ang mga relatibong frequency .

Empirical distribution function tawagan ang function na tumutukoy para sa bawat value x ang relatibong dalas ng kaganapan X

Fashion- ang halaga sa hanay ng mga obserbasyon na kadalasang nangyayari

Mo \u003d X Mo + h Mo * (f Mo - f Mo-1) : ((f Mo - f Mo-1) + (f Mo - f Mo + 1)),

dito X Mo ay ang kaliwang hangganan ng modal interval, h Mo ay ang haba ng modal interval, f Mo-1 ay ang frequency ng premodal interval, f Mo ay ang frequency ng modal interval, f Mo+1 ay ang dalas ng postmodal interval.

Ang mode ng isang ganap na tuluy-tuloy na pamamahagi ay anumang punto ng lokal na maximum ng density ng pamamahagi. Para sa mga discrete distribution, ang mode ay anumang value a i na ang probability p i ay mas malaki kaysa sa probabilities ng mga kalapit na value.

Median tuluy-tuloy na random variable X Ang halaga nito ay tinatawag na Me, kung saan ito ay pantay na posibilidad kung ang random na variable ay magiging mas kaunti o higit pa. Ako, ibig sabihin.

M e \u003d (n + 1) / 2 P(X < Ako) = P(X > Ako)

Pantay na ipinamahagi BAGONG

Kahit distribusyon. Ang tuluy-tuloy na random na variable ay tinatawag na pantay na ipinamamahagi sa segment () kung ang distribution density function nito (Fig. 1.6, a) parang:

Pagtatalaga: - Ang SW ay ibinahagi nang pantay-pantay sa .

Alinsunod dito, ang function ng pamamahagi sa segment (Larawan 1.6, b):

kanin. 1.6. Mga function ng isang random na variable na ibinahagi nang pantay sa [ a,b]: a– density ng posibilidad f(x); b– mga pamamahagi F(x)

Ang mathematical na inaasahan at pagkakaiba ng RV na ito ay tinutukoy ng mga expression:

Dahil sa simetrya ng pag-andar ng density, ito ay kasabay ng median. Ang fashion ay walang pantay na pamamahagi

Halimbawa 4 Ang oras ng paghihintay para sa isang sagot sa isang tawag sa telepono ay isang random na variable na sumusunod sa isang pare-parehong batas sa pamamahagi sa saklaw mula 0 hanggang 2 minuto. Hanapin ang integral at differential distribution function ng random variable na ito.

27. Normal na batas ng probability distribution

Ang tuluy-tuloy na random na variable x ay may normal na distribution na may mga parameter: m,s > 0, kung ang probability distribution density ay may anyo:

kung saan: m - inaasahan sa matematika, s - average karaniwang lihis.



Ang normal na distribusyon ay tinatawag ding Gaussian pagkatapos ng German mathematician na si Gauss. Ang katotohanan na ang isang random na variable ay may normal na distribusyon na may mga parameter: m, , ay tinutukoy bilang mga sumusunod: N (m, s), kung saan: m=a=M[X];

Kadalasan, sa mga formula, ang inaasahan sa matematika ay tinutukoy ng a . Kung ang isang random na variable ay ibinahagi ayon sa batas N(0,1), kung gayon ito ay tinatawag na isang normalized o standardized normal na halaga. Ang function ng pamamahagi para dito ay may anyo:

Ang graph ng density ng normal na distribution, na tinatawag na normal na curve o Gaussian curve, ay ipinapakita sa Fig. 5.4.

kanin. 5.4. Normal na density ng pamamahagi

ari-arian isang random na variable na may normal na batas sa pamamahagi.

1. Kung , pagkatapos ay upang mahanap ang posibilidad na ang halagang ito ay bumaba sa isang naibigay na pagitan ( x 1; x 2) ang formula ay ginagamit:

2. Ang posibilidad na ang paglihis ng isang random variable mula nito inaasahan sa matematika ay hindi lalampas sa halaga (sa ganap na halaga), ay katumbas ng.

Kabilang sa mga numerical na katangian ng mga random na variable, ito ay kinakailangan, una sa lahat, upang tandaan ang mga na nagpapakilala sa posisyon ng isang random na variable sa numero axis, i.e. ipahiwatig ang ilang average, tinatayang halaga, kung saan pinagsama-sama ang lahat ng posibleng halaga ng isang random na variable.

Ang average na halaga ng isang random na variable ay isang tiyak na numero, na kung saan ay, bilang ito ay, ang "kinatawan" nito at pinapalitan ito sa magaspang na tinatayang mga kalkulasyon. Kapag sinabi namin: "ang average na oras ng pagpapatakbo ng lamp ay 100 oras" o "ang average na punto ng epekto ay inilipat kaugnay sa target ng 2 m sa kanan", ipinapahiwatig namin sa pamamagitan nito ang isang tiyak na numerical na katangian ng isang random na variable na naglalarawan nito lokasyon sa numerical axis, i.e. paglalarawan ng posisyon.

Sa mga katangian ng isang posisyon sa probability theory, ang pinakamahalagang papel ay ginagampanan ng matematikal na pag-asa ng isang random variable, na kung minsan ay tinatawag lamang na average na halaga ng isang random variable.

Isaalang-alang ang isang discrete random variable na may mga posibleng halaga na may probabilities. Kailangan nating kilalanin sa pamamagitan ng ilang numero ang posisyon ng mga halaga ng random na variable sa x-axis, na isinasaalang-alang ang katotohanan na ang mga halagang ito ay may iba't ibang mga probabilidad. Para sa layuning ito, natural na gamitin ang tinatawag na "weighted average" ng mga halaga, at ang bawat halaga ay dapat isaalang-alang sa panahon ng pag-average na may "timbang" na proporsyonal sa posibilidad ng halagang ito. Kaya, kakalkulahin natin ang ibig sabihin ng random variable , na ating tutukuyin ng :

o, ibinigay na,

. (5.6.1)

Ang weighted average na ito ay tinatawag na mathematical expectation ng random variable. Kaya, ipinakilala namin bilang pagsasaalang-alang ang isa sa pinakamahalagang konsepto ng teorya ng probabilidad - ang konsepto ng pag-asa sa matematika.

Ang inaasahan sa matematika ng isang random na variable ay ang kabuuan ng mga produkto ng lahat ng posibleng mga halaga ng isang random na variable at ang mga probabilities ng mga halagang ito.

Tandaan na sa pormulasyon sa itaas, ang kahulugan ng mathematical na inaasahan ay wasto, mahigpit na pagsasalita, para lamang sa mga discrete random variable; Sa ibaba, isa-generalize natin ang konseptong ito sa kaso ng tuluy-tuloy na dami.

Upang gawing mas mailarawan ang konsepto ng pag-asa sa matematika, buksan natin ang mekanikal na interpretasyon ng pamamahagi ng isang discrete random variable. Hayaang ang mga puntos na may abscissas ay matatagpuan sa abscissa axis, kung saan ang mga masa ay puro, ayon sa pagkakabanggit, at . Pagkatapos, malinaw naman, ang mathematical expectation na tinukoy ng formula (5.6.1) ay walang iba kundi ang abscissa ng center of gravity ng ibinigay na sistema ng mga materyal na puntos.

Ang pag-asa sa matematika ng isang random na variable ay konektado sa pamamagitan ng isang kakaibang pag-asa sa arithmetic mean ng mga naobserbahang halaga ng isang random na variable na may malaking bilang ng mga eksperimento. Ang pag-asa na ito ay kapareho ng uri ng pag-asa sa pagitan ng dalas at posibilidad, lalo na: na may malaking bilang ng mga eksperimento, ang arithmetic mean ng mga naobserbahang halaga ng isang random na variable ay lumalapit (nagsasama-sama sa posibilidad) ang inaasahan sa matematika nito. Mula sa pagkakaroon ng isang relasyon sa pagitan ng dalas at posibilidad, ang isa ay maaaring mahihinuha bilang isang resulta ng pagkakaroon ng isang katulad na relasyon sa pagitan ng arithmetic mean at matematikal na inaasahan.

Sa katunayan, isaalang-alang ang isang discrete random variable na nailalarawan ng isang serye ng pamamahagi:

saan .

Hayaang magsagawa ng mga independiyenteng eksperimento, sa bawat isa kung saan ang dami ay tumatagal sa isang tiyak na halaga. Ipagpalagay na ang halaga ay lumitaw nang isang beses, ang halaga ay lumitaw nang isang beses, sa pangkalahatan ang halaga ay lumitaw nang isang beses. Obviously,

Kalkulahin natin ang arithmetic mean ng mga naobserbahang halaga ng dami , na, sa kaibahan sa inaasahan ng matematika, ipapakita natin:

Ngunit wala nang hihigit pa sa dalas (o istatistikal na posibilidad) ng isang kaganapan; ang dalas na ito ay maaaring tawaging . Pagkatapos

,

mga. ang arithmetic mean ng mga sinusunod na halaga ng isang random na variable ay katumbas ng kabuuan ng mga produkto ng lahat ng posibleng mga halaga ng random variable at ang mga frequency ng mga halagang ito.

Sa pagtaas ng bilang ng mga eksperimento, lalapit ang mga frequency (magtatagpo sa probabilidad) sa mga katumbas na probabilidad. Dahil dito, ang arithmetic mean ng mga naobserbahang halaga ng isang random na variable na may pagtaas sa bilang ng mga eksperimento ay lalapit (magtatagpo sa probabilidad) sa kanyang inaasahan sa matematika.

Ang koneksyon sa pagitan ng arithmetic mean at ang mathematical expectation na binalangkas sa itaas ay bumubuo sa nilalaman ng isa sa mga anyo ng batas ng malalaking numero. Magbibigay kami ng mahigpit na patunay ng batas na ito sa Kabanata 13.

Alam na natin na ang lahat ng anyo ng batas ng malalaking numero ay nagsasaad ng katotohanan na ang ilang mga average ay matatag sa isang malaking bilang ng mga eksperimento. Dito nag-uusap kami tungkol sa katatagan ng arithmetic mean mula sa isang serye ng mga obserbasyon ng parehong halaga. Sa isang maliit na bilang ng mga eksperimento, ang arithmetic mean ng kanilang mga resulta ay random; na may sapat na pagtaas sa bilang ng mga eksperimento, ito ay nagiging "halos hindi random" at, nagpapatatag, lumalapit sa isang pare-parehong halaga - ang inaasahan sa matematika.

Ang pag-aari ng katatagan ng mga average para sa isang malaking bilang ng mga eksperimento ay madaling i-verify nang eksperimento. Halimbawa, ang pagtimbang ng anumang katawan sa laboratoryo sa tumpak na mga timbangan, bilang resulta ng pagtimbang ay nakakakuha tayo ng bagong halaga sa bawat oras; upang mabawasan ang pagkakamali ng pagmamasid, tinitimbang namin ang katawan ng ilang beses at ginagamit ang arithmetic mean ng mga nakuhang halaga. Madaling makita na sa isang karagdagang pagtaas sa bilang ng mga eksperimento (pagtimbang), ang arithmetic mean ay tumutugon sa pagtaas na ito nang mas kaunti, at sa isang sapat na malaking bilang ng mga eksperimento ay halos huminto sa pagbabago.

Ang formula (5.6.1) para sa mathematical na inaasahan ay tumutugma sa kaso ng isang discrete random variable. Para sa tuloy-tuloy na halaga ang pag-asa sa matematika, siyempre, ay hindi na ipinahayag ng kabuuan, ngunit ng integral:

, (5.6.2)

saan ang density ng pamamahagi ng dami .

Ang formula (5.6.2) ay nakuha mula sa formula (5.6.1), kung papalitan natin ang mga indibidwal na halaga dito ng isang patuloy na pagbabago ng parameter x, ang kaukulang mga probabilidad - na may elemento ng posibilidad, at ang pangwakas na kabuuan - na may isang integral. Sa mga sumusunod, madalas nating gagamitin ang pamamaraang ito ng pagpapalawak ng mga pormula na hinango para sa mga hindi tuluy-tuloy na dami sa kaso ng tuluy-tuloy na dami.

Sa mekanikal na interpretasyon, ang matematikal na inaasahan ng isang tuluy-tuloy na random na variable ay nagpapanatili ng parehong kahulugan - ang abscissa ng sentro ng grabidad sa kaso kapag ang masa ay ipinamahagi sa kahabaan ng abscissa axis nang tuluy-tuloy, na may density . Ang interpretasyong ito ay kadalasang ginagawang posible upang mahanap ang mathematical na inaasahan nang hindi kinakalkula ang integral (5.6.2), mula sa mga simpleng mekanikal na pagsasaalang-alang.

Sa itaas, ipinakilala namin ang notasyon para sa mathematical na inaasahan ng dami . Sa ilang mga kaso, kapag ang isang halaga ay kasama sa mga formula bilang isang tiyak na numero, ito ay mas maginhawa upang tukuyin ito sa isang solong titik. Sa mga kasong ito, tutukuyin namin ang mathematical na inaasahan ng halaga sa pamamagitan ng:

Ang notasyon at para sa mathematical na inaasahan ay gagamitin nang magkatulad sa hinaharap, depende sa kaginhawahan ng isa o ibang notasyon ng mga formula. Sumang-ayon din tayo, kung kinakailangan, na paikliin ang mga salitang "mathematical expectation" ng mga titik m.o.

Dapat tandaan na ang pinakamahalagang katangian ng posisyon - ang inaasahan sa matematika - ay hindi umiiral para sa lahat ng mga random na variable. Posibleng gumawa ng mga halimbawa ng mga random na variable kung saan ang inaasahan sa matematika ay hindi umiiral, dahil ang katumbas na kabuuan o integral ay nag-iiba.

Isaalang-alang, halimbawa, ang isang discontinuous random variable na may serye ng pamamahagi:

Madaling i-verify na , i.e. ang serye ng pamamahagi ay may katuturan; gayunpaman, ang kabuuan sa kasong ito ay nag-iiba at, samakatuwid, ang mathematical na inaasahan ng halaga ay hindi umiiral. Gayunpaman, para sa pagsasanay, ang mga ganitong kaso ay hindi makabuluhang interes. Karaniwan, ang mga random na variable na ating kinakaharap ay may limitadong hanay ng mga posibleng halaga at, siyempre, may inaasahan.

Sa itaas, nagbigay kami ng mga formula (5.6.1) at (5.6.2) na nagpapahayag ng mathematical na inaasahan para sa isang hindi tuluy-tuloy at tuluy-tuloy na random variable , ayon sa pagkakabanggit.

Kung ang halaga ay kabilang sa mga halaga ng halo-halong uri, kung gayon ang pag-asa sa matematika nito ay ipinahayag ng isang formula ng form:

, (5.6.3)

kung saan ang kabuuan ay umaabot sa lahat ng mga punto kung saan ang distribution function ay nasira, at ang integral ay umaabot sa lahat ng mga seksyon kung saan ang distribution function ay tuloy-tuloy.

Bilang karagdagan sa pinakamahalaga sa mga katangian ng posisyon - ang inaasahan sa matematika - ang iba pang mga katangian ng posisyon ay minsan ginagamit sa pagsasanay, sa partikular, ang mode at median ng isang random na variable.

Ang mode ng isang random na variable ay ang pinaka-malamang na halaga nito. Ang terminong "malamang na halaga", sa mahigpit na pagsasalita, ay nalalapat lamang sa mga hindi tuloy-tuloy na dami; para sa tuloy-tuloy na dami, ang mode ay ang halaga kung saan ang probability density ay maximum. Sumasang-ayon kaming italaga ang mode na may sulat. Sa fig. Ang 5.6.1 at 5.6.2 ay nagpapakita ng mode para sa mga di-tuloy at tuluy-tuloy na random na variable, ayon sa pagkakabanggit.

Kung ang distribution polygon (distribution curve) ay may higit sa isang maximum, ang distribution ay tinatawag na "polymodal" (Figures 5.6.3 at 5.6.4).

Minsan may mga distribusyon na sa gitna ay hindi isang maximum, ngunit isang minimum (Larawan 5.6.5 at 5.6.6). Ang ganitong mga pamamahagi ay tinatawag na "antimodal". Ang isang halimbawa ng isang antimodal distribution ay ang pamamahagi na nakuha sa halimbawa 5, n° 5.1.

Sa pangkalahatang kaso, ang mode at ang mathematical na inaasahan ng isang random na variable ay hindi nagtutugma. Sa isang partikular na kaso, kapag ang distribusyon ay simetriko at modal (i.e. may mode) at mayroong matematikal na pag-asa, pagkatapos ito ay tumutugma sa mode at sa sentro ng simetrya ng pamamahagi.

Ang isa pang katangian ng posisyon ay madalas na ginagamit - ang tinatawag na median ng isang random na variable. Ang katangiang ito ay kadalasang ginagamit lamang para sa tuluy-tuloy na mga random na variable, bagama't maaari din itong pormal na tukuyin para sa isang di-tuloy na variable.

Ang median ng isang random na variable ay ang halaga nito kung saan

mga. ito ay pantay na malamang na ang random na variable ay magiging mas mababa sa o mas malaki kaysa sa . Sa geometriko, ang median ay ang abscissa ng punto kung saan nahahati sa kalahati ang lugar na nakatali sa kurba ng pamamahagi (Larawan 5.6.7).

Bilang karagdagan sa mathematical na pag-asa at pagpapakalat, ang isang bilang ng mga numerical na katangian ay ginagamit sa probability theory, na sumasalamin sa ilang mga tampok ng pamamahagi.

Kahulugan. Ang Mode Mo(X) ng isang random na variable X ay ang pinakamalamang na halaga nito(kung saan ang posibilidad r r o probability density

Kung ang probabilidad o probability density ay umabot sa maximum na hindi sa isa, ngunit sa ilang mga punto, ang pamamahagi ay tinatawag polymodal(Larawan 3.13).

Fashion Lumot), kung saan ang posibilidad R ( o ang probability density (p(x) ay umabot sa global maximum, ay tinatawag malamang na halaga random variable (sa Fig. 3.13 ito Mo(X) 2).

Kahulugan. Ang median na Me(X) ng isang tuluy-tuloy na random variable X ay ang halaga nito, para sa

mga. ang posibilidad na ang random variable X kumukuha ng halagang mas mababa sa median balahibo) o mas malaki kaysa dito, pareho at katumbas ng 1/2. Geometrically vertical na linya X = balahibo) na dumadaan sa isang punto na may abscissa na katumbas ng balahibo), hinahati ang lugar ng figure ng curve ng pamamahagi sa dalawang pantay na bahagi (Larawan 3.14). Malinaw, sa punto X = balahibo) ang distribution function ay katumbas ng 1/2, i.e. P(Ako(X))= 1/2 (Larawan 3.15).

Tandaan ang isang mahalagang katangian ng median ng isang random na variable: ang mathematical na inaasahan ng absolute value ng deviation ng random variable X mula sa constant value C ay minimal pagkatapos, kapag ang pare-parehong C na ito ay katumbas ng median na Me(X) = m, ibig sabihin.

(ang property ay katulad ng property (3.10") ng minimality ng mean square ng deviation ng random variable mula sa mathematical expectation nito).

O Halimbawa 3.15. Hanapin ang mode, median at mean ng isang random na variable X s probability density φ(x) = 3x 2 para sa xx.

Solusyon. Ang curve ng pamamahagi ay ipinapakita sa fig. 3.16. Malinaw, ang probability density φ(x) ay pinakamataas sa X= Mo(X) = 1.

Median balahibo) = b makikita natin mula sa kondisyon (3.28):

saan

Ang pag-asa sa matematika ay kinakalkula ng formula (3.25):

Mutual na pag-aayos ng mga puntos M(X) > Ako(X) at Lumot) sa pataas na pagkakasunud-sunod ng abscissa ay ipinapakita sa fig. 3.16. ?

Kasama ng mga numerical na katangian na binanggit sa itaas, ang konsepto ng quantiles at percentage points ay ginagamit upang ilarawan ang isang random variable.

Kahulugan. Ang dami ng antas y-quantile )

ay tinatawag na tulad ng isang halaga x q ng isang random variable , kung saan ang distribution function nito ay tumatagal ng katumbas na halaga d, ibig sabihin.

Ang ilang mga quantile ay nakatanggap ng isang espesyal na pangalan. Malinaw, ang nasa itaas panggitna random variable ay ang 0.5 level quantile, i.e. Ako (X) \u003d x 05. Ang mga quantile dg 0 2 5 at x 075 ay pinangalanan ayon sa pagkakabanggit mas mababa at itaas na kuwartilK

Malapit na nauugnay sa konsepto ng isang quantile ang konsepto punto ng porsyento. Sa ilalim YuOuHo-noi tuldok ipinahiwatig na dami x x (( , mga. tulad ng isang halaga ng isang random variable x, sa ilalim ng kung saan

0 Halimbawa 3.16. Ayon sa halimbawa 3.15 hanapin ang quantile x 03 at 30% random variable point x.

Solusyon. Ayon sa formula (3.23), ang distribution function

Nahanap namin ang quantile r 0 z mula sa equation (3.29), i.e. x$ 3 \u003d 0.3, mula sa kung saan L "oz -0.67. Hanapin ang 30% na punto ng random variable x, o quantile x 0 7, mula sa equation x$ 7 = 0.7, kung saan x 0 7 "0.89. ?

Kabilang sa mga numerical na katangian ng isang random na variable espesyal na kahulugan magkaroon ng mga sandali - inisyal at sentral.

Kahulugan. Panimulang sandaliAng k-th order ng random variable X ay tinatawag na mathematical expectation k-ika degree ang halagang ito :

Kahulugan. Gitnang puntoang k-th order ng random variable X ay ang mathematical expectation ng k-th degree ng deviation ng random variable X mula sa mathematical expectation nito:

Mga formula para sa pagkalkula ng mga sandali para sa mga discrete random variable (pagkuha ng mga value x 1 na may probabilidad p,) at tuloy-tuloy (na may probability density cp(x)) ay ibinibigay sa Talahanayan. 3.1.

Talahanayan 3.1

Madaling makita iyon kapag k = 1 unang unang sandali ng random variable X ay ang mathematical expectation nito, i.e. h x \u003d M [X) \u003d a, sa sa= 2 ang pangalawang sentral na sandali ay ang pagpapakalat, i.e. p 2 = T)(X).

Ang mga gitnang sandali p A ay maaaring ipahayag sa mga tuntunin ng mga unang sandali gamit ang mga formula:

atbp.

Halimbawa, c 3 \u003d M (X-a) * \u003d M (X * -ZaX 2 + Za 2 X-a-\u003e) \u003d M (X *) ~ -ZaM (X 2) + Za 2 M (X) ~ a3 \u003d y 3 -Zy ^ + Zy (y, -y ^ \u003d y 3 - Zy ^ + 2y ^ (kapag nagmula, isinasaalang-alang namin iyon a = M(X)= V, - hindi random na halaga). ?

Tulad ng nabanggit sa itaas, ang pag-asa sa matematika M(X), o ang unang unang sandali, ay nagpapakilala sa average na halaga o posisyon, ang sentro ng pamamahagi ng isang random na variable X sa linya ng numero; pagpapakalat OH), o ang pangalawang sentral na sandali p 2 , - s t s - distribusyon scattering X medyo M(X). Para sa karagdagang Detalyadong Paglalarawan ang mga pamamahagi ay mga sandali ng mas mataas na mga order.

Pangatlong gitnang sandali p 3 ay nagsisilbing katangian ng kawalaan ng simetrya ng distribusyon (skewness). Ito ay may sukat ng isang kubo ng isang random na variable. Upang makakuha ng walang sukat na halaga, hinati ito ng humigit-kumulang 3, kung saan ang a ay ang standard deviation ng random variable. x. Natanggap na halaga PERO tinawag koepisyent ng kawalaan ng simetrya ng isang random na variable.

Kung ang distribusyon ay simetriko kaugnay ng inaasahan sa matematika, kung gayon ang skewness coefficient ay A = 0.

Sa fig. Ang 3.17 ay nagpapakita ng dalawang kurba ng pamamahagi: I at II. Ang curve I ay may positibong (kanang gilid) na kawalaan ng simetrya (L > 0), at ang curve II ay may negatibo (kaliwang bahagi) (L


Ikaapat na sentral na sandali p 4 ay nagsisilbi upang makilala ang steepness (tugatog ng tuktok o patag na tuktok - post) ng pamamahagi.