Ano ang ipinapakita ng confidence interval. Agwat ng kumpiyansa

Bumuo tayo ng agwat ng kumpiyansa sa MS EXCEL para sa pagtantya ng ibig sabihin ng halaga ng distribusyon sa kaso ng isang kilalang halaga ng pagkakaiba.

Syempre ang pagpili antas ng pagtitiwala ganap na nakasalalay sa gawain sa kamay. Kaya, ang antas ng kumpiyansa ng pasahero ng hangin sa pagiging maaasahan ng sasakyang panghimpapawid, siyempre, ay dapat na mas mataas kaysa sa antas ng kumpiyansa ng bumibili sa pagiging maaasahan ng ilaw na bombilya.

Pagbubuo ng Gawain

Ipagpalagay natin na mula sa populasyon pagkuha sample laki n. Ito ay ipinapalagay na karaniwang lihis kilala ang pamamahagi na ito. Kinakailangan sa batayan nito mga sample suriin ang hindi alam ibig sabihin ng pamamahagi(μ, ) at buuin ang katumbas bilateral agwat ng kumpiyansa.

Pagtataya ng Punto

Tulad ng nalalaman mula sa mga istatistika(tawagan natin X cf) ay isang walang pinapanigan na pagtatantya ng mean ito populasyon at may distribusyon na N(μ;σ 2 /n).

Tandaan: Paano kung kailangan mong magtayo agwat ng kumpiyansa sa kaso ng pamamahagi, na ay hindi normal? Sa kasong ito, pagdating sa iligtas, na nagsasabi na may sapat na Malaki mga sample n mula sa pamamahagi hindi- normal, sampling distribution ng statistics Х av kalooban humigit-kumulang tumutugma normal na pamamahagi may mga parameter na N(μ;σ 2 /n).

Kaya, pagtatantya ng punto gitna mga halaga ng pamamahagi mayroon kami ay sample ibig sabihin, ibig sabihin. X cf. Ngayon, maging abala tayo agwat ng kumpiyansa.

Bumuo ng agwat ng kumpiyansa

Karaniwan, alam ang pamamahagi at mga parameter nito, maaari nating kalkulahin ang posibilidad na ang isang random na variable ay kukuha ng isang halaga mula sa isang naibigay na pagitan. Ngayon gawin natin ang kabaligtaran: hanapin ang agwat kung saan ang random na variable ay nahuhulog na may ibinigay na posibilidad. Halimbawa, mula sa mga ari-arian normal na pamamahagi ito ay kilala na may posibilidad na 95%, ang isang random na variable ay ipinamahagi sa ibabaw normal na batas, ay mahuhulog sa pagitan ng humigit-kumulang +/- 2 mula sa ibig sabihin ng halaga(tingnan ang artikulo tungkol sa). Ang agwat na ito ay magsisilbing aming prototype para sa agwat ng kumpiyansa .

Ngayon tingnan natin kung alam natin ang pamamahagi , upang kalkulahin ang agwat na ito? Upang masagot ang tanong, dapat nating tukuyin ang anyo ng pamamahagi at mga parameter nito.

Alam natin ang anyo ng pamamahagi normal na pamamahagi(tandaan mo yan nag-uusap kami tungkol sa sampling distribution mga istatistika X cf).

Ang parameter na μ ay hindi alam sa amin (kailangan lang itong tantyahin gamit ang agwat ng kumpiyansa), ngunit mayroon kaming pagtatantya nito X cf, kinakalkula batay sa sample, na maaaring gamitin.

Ang pangalawang parameter ay sample mean na standard deviation malalaman, ito ay katumbas ng σ/√n.

kasi hindi namin alam μ, pagkatapos ay bubuo kami ng pagitan +/- 2 standard deviations hindi galing ibig sabihin ng halaga, ngunit mula sa kilalang pagtatantya nito X cf. Yung. kapag nagkalkula agwat ng kumpiyansa HINDI namin ipagpalagay na X cf babagsak sa pagitan ng +/- 2 standard deviations mula sa μ na may posibilidad na 95%, at ipagpalagay namin na ang pagitan ay +/- 2 standard deviations mula sa X cf na may posibilidad na 95% ay sumasakop sa μ - ang average ng pangkalahatang populasyon, mula saan sample. Ang dalawang pahayag na ito ay katumbas, ngunit ang pangalawang pahayag ay nagpapahintulot sa amin na bumuo agwat ng kumpiyansa.

Bilang karagdagan, pinipino namin ang agwat: isang random na variable na ipinamahagi normal na batas, na may 95% na posibilidad ay nasa pagitan ng +/- 1.960 standard deviations, hindi +/- 2 standard deviations. Ito ay maaaring kalkulahin gamit ang formula \u003d NORM.ST.OBR ((1 + 0.95) / 2), cm. sample file Sheet Spacing.

Ngayon ay maaari na tayong bumuo ng isang probabilistikong pahayag na magsisilbi sa atin upang mabuo agwat ng kumpiyansa:
"Ang posibilidad na ibig sabihin ng populasyon matatagpuan mula sa average na sample sa loob ng 1.960" standard deviations ng sample mean", ay katumbas ng 95%.

Ang halaga ng posibilidad na binanggit sa pahayag ay may espesyal na pangalan , na nauugnay sa antas ng kabuluhan α (alpha) sa pamamagitan ng isang simpleng expression antas ng tiwala =1 . Sa kaso natin lebel ng kahalagahan α =1-0,95=0,05 .

Ngayon, batay sa probabilistikong pahayag na ito, sumusulat kami ng isang expression para sa pagkalkula agwat ng kumpiyansa:

kung saan ang Zα/2 pamantayan normal na pamamahagi(tulad ng halaga random variable z, Ano P(z>=Zα/2 )=α/2).

Tandaan: Itaas na α/2-quantile tumutukoy sa lapad agwat ng kumpiyansa sa standard deviations sample ibig sabihin. Itaas na α/2-quantile pamantayan normal na pamamahagi ay palaging mas malaki kaysa sa 0, na kung saan ay napaka-maginhawa.

Sa aming kaso, sa α=0.05, itaas na α/2-quantile katumbas ng 1.960. Para sa iba pang antas ng kahalagahan α (10%; 1%) itaas na α/2-quantile Zα/2 maaaring kalkulahin gamit ang formula \u003d NORM.ST.OBR (1-α / 2) o, kung kilala antas ng tiwala, =NORM.ST.OBR((1+antas ng kumpiyansa)/2).

Kadalasan kapag nagtatayo mga pagitan ng kumpiyansa para sa pagtatantya ng mean gamitin lamang itaas na α/2-dami at huwag gamitin ibaba ang α/2-dami. Posible ito dahil pamantayan normal na pamamahagi simetriko tungkol sa x-axis ( density ng pamamahagi nito simetriko tungkol sa karaniwan, i.e. 0). Samakatuwid, hindi na kailangang kalkulahin mas mababang α/2-quantile(tinatawag lang itong α /2-quantile), dahil ito ay katumbas itaas na α/2-dami na may minus sign.

Alalahanin na, anuman ang hugis ng distribusyon ng x, ang katumbas na random variable X cf ipinamahagi humigit-kumulang ayos lang N(μ;σ 2 /n) (tingnan ang artikulo tungkol sa). Samakatuwid, sa pangkalahatan, ang expression sa itaas para sa agwat ng kumpiyansa ay tinatayang lamang. Kung ang x ay ibinahagi sa ibabaw normal na batas N(μ;σ 2 /n), pagkatapos ay ang expression para sa agwat ng kumpiyansa ay tumpak.

Pagkalkula ng agwat ng kumpiyansa sa MS EXCEL

Solusyonan natin ang problema.
Ang oras ng pagtugon ng isang electronic component sa isang input signal ay isang mahalagang katangian ng isang device. Nais ng isang inhinyero na magplano ng agwat ng kumpiyansa para sa average na oras ng pagtugon sa antas ng kumpiyansa na 95%. Mula sa nakaraang karanasan, alam ng inhinyero na ang karaniwang paglihis ng oras ng pagtugon ay 8 ms. Ito ay kilala na ang inhinyero ay gumawa ng 25 mga sukat upang matantya ang oras ng pagtugon, ang average na halaga ay 78 ms.

Desisyon: Nais malaman ng isang inhinyero ang oras ng pagtugon ng isang elektronikong aparato, ngunit nauunawaan niya na ang oras ng pagtugon ay hindi naayos, ngunit isang random na variable na may sariling pamamahagi. Kaya ang pinakamahusay na maaari niyang asahan ay upang matukoy ang mga parameter at hugis ng pamamahagi na ito.

Sa kasamaang palad, mula sa kondisyon ng problema, hindi namin alam ang anyo ng pamamahagi ng oras ng pagtugon (hindi ito kailangang maging normal). , hindi rin alam ang pamamahaging ito. Siya lang ang kilala karaniwang lihisσ=8. Samakatuwid, habang hindi namin makalkula ang mga probabilidad at bumuo agwat ng kumpiyansa.

Gayunpaman, bagaman hindi namin alam ang pamamahagi oras hiwalay na tugon, alam natin na ayon sa CPT, sampling distribution average na oras ng pagtugon ay humigit-kumulang normal(Ipapalagay namin na ang mga kondisyon CPT ay ginanap, dahil ang sukat mga sample sapat na malaki (n=25)) .

At saka, ang karaniwan ang pamamahagi na ito ay katumbas ng ibig sabihin ng halaga mga pamamahagi ng tugon ng yunit, ibig sabihin. μ. PERO karaniwang lihis ng distribusyon na ito (σ/√n) ay maaaring kalkulahin gamit ang formula =8/ROOT(25) .

Nabatid din na nakatanggap ang engineer pagtatantya ng punto parameter μ katumbas ng 78 ms (X cf). Samakatuwid, ngayon maaari naming kalkulahin ang mga probabilidad, dahil alam natin ang form ng pamamahagi ( normal) at mga parameter nito (Х ср at σ/√n).

Gustong malaman ng engineer inaasahang halagaμ ng distribusyon ng oras ng pagtugon. Gaya ng nakasaad sa itaas, ang μ na ito ay katumbas ng inaasahan ng sample distribution ng average na oras ng pagtugon. Kung gagamitin natin normal na pamamahagi N(X cf; σ/√n), kung gayon ang nais na μ ay nasa hanay na +/-2*σ/√n na may posibilidad na humigit-kumulang 95%.

Lebel ng kahalagahan katumbas ng 1-0.95=0.05.

Panghuli, hanapin ang kaliwa at kanang hangganan agwat ng kumpiyansa.
Kaliwang hangganan: \u003d 78-NORM.ST.INR (1-0.05 / 2) * 8 / ROOT (25) = 74,864
kanang hangganan: \u003d 78 + NORM. ST. OBR (1-0.05 / 2) * 8 / ROOT (25) \u003d 81.136

Kaliwang hangganan: =NORM.INV(0.05/2, 78, 8/SQRT(25))
kanang hangganan: =NORM.INV(1-0.05/2, 78, 8/SQRT(25))

Sagot: agwat ng kumpiyansa sa 95% na antas ng kumpiyansa at σ=8msec katumbas 78+/-3.136ms

AT halimbawa ng file sa sheet na Sigma kilala na lumikha ng isang form para sa pagkalkula at pagbuo bilateral agwat ng kumpiyansa para sa arbitraryo mga sample na may ibinigay na σ at lebel ng kahalagahan.

CONFIDENCE.NORM() function

Kung ang mga halaga mga sample ay nasa hanay B20:B79 , a lebel ng kahalagahan katumbas ng 0.05; pagkatapos MS EXCEL formula:
=AVERAGE(B20:B79)-CONFIDENCE(0.05,σ, COUNT(B20:B79))
ibabalik ang kaliwang hangganan agwat ng kumpiyansa.

Ang parehong hangganan ay maaaring kalkulahin gamit ang formula:
=AVERAGE(B20:B79)-NORM.ST.INV(1-0.05/2)*σ/SQRT(COUNT(B20:B79))

Tandaan: Ang TRUST.NORM() function ay lumabas sa MS EXCEL 2010. Ang mga naunang bersyon ng MS EXCEL ay gumamit ng TRUST() function.

Hayaan na natin malaking bilang ng mga item na may normal na pamamahagi ng ilang mga katangian (halimbawa, isang buong bodega ng parehong uri ng mga gulay, ang laki at bigat nito ay nag-iiba). Gusto mong malaman ang mga karaniwang katangian ng buong batch ng mga kalakal, ngunit wala kang oras o hilig na sukatin at timbangin ang bawat gulay. Naiintindihan mo na hindi ito kailangan. Ngunit ilang piraso ang kailangan mong kunin para sa random na inspeksyon?

Bago magbigay ng ilang mga formula na kapaki-pakinabang para sa sitwasyong ito, naaalala namin ang ilang notasyon.

Una, kung susukatin natin ang buong bodega ng mga gulay (ang hanay ng mga elementong ito ay tinatawag na pangkalahatang populasyon), malalaman natin nang buong katumpakan na magagamit sa atin ang average na halaga ng bigat ng buong batch. Tawagin natin itong average X cf .g en . - pangkalahatang average. Alam na natin kung ano ang ganap na natutukoy kung ang ibig sabihin ng halaga at paglihis nito ay kilala . Totoo, sa ngayon ay hindi kami X avg. o s hindi natin alam ang pangkalahatang populasyon. Maaari lamang kaming kumuha ng ilang sample, sukatin ang mga halaga na kailangan namin at kalkulahin para sa sample na ito pareho ang mean value X sr. sa sample at ang standard deviation S sb.

Alam na kung ang aming pasadyang pagsusuri ay naglalaman ng isang malaking bilang ng mga elemento (karaniwan ay n ay mas malaki kaysa sa 30), at sila ay kinuha random talaga, pagkatapos ay s ang pangkalahatang populasyon ay halos hindi mag-iiba mula sa S ..

Bilang karagdagan, para sa kaso ng isang normal na distribusyon, maaari naming gamitin ang mga sumusunod na formula:

May posibilidad na 95%


May posibilidad na 99%



AT pangkalahatang pananaw may posibilidad na Р (t)


Ang kaugnayan sa pagitan ng halaga ng t at ng halaga ng probabilidad na P (t), kung saan nais nating malaman ang pagitan ng kumpiyansa, ay maaaring kunin mula sa sumusunod na talahanayan:


Kaya, natukoy namin kung anong hanay ang average na halaga para sa pangkalahatang populasyon (na may ibinigay na posibilidad).

Maliban kung mayroon kaming sapat na malaking sample, hindi namin masasabi na ang populasyon ay may s = S sel. Bilang karagdagan, sa kasong ito, ang pagiging malapit ng sample sa normal na pamamahagi ay may problema. Sa kasong ito, gamitin din ang S sb sa halip s sa formula:




ngunit ang halaga ng t para sa isang nakapirming posibilidad na P(t) ay magdedepende sa bilang ng mga elemento sa sample n. Kung mas malaki ang n, mas malapit ang magreresultang confidence interval sa halagang ibinigay ng formula (1). Ang mga halaga ng t sa kasong ito ay kinuha mula sa isa pang talahanayan ( T-test ng mag-aaral), na ipinakita namin sa ibaba:

Ang mga halaga ng t-test ng mag-aaral para sa posibilidad na 0.95 at 0.99


Halimbawa 3 30 katao ang random na pinili mula sa mga empleyado ng kumpanya. Ayon sa sample, lumabas na ang average na suweldo (bawat buwan) ay 30 libong rubles, na may average karaniwang lihis 5 libong rubles. Sa posibilidad na 0.99 matukoy ang average na suweldo sa kompanya.

Desisyon: Sa kondisyon, mayroon tayong n = 30, X cf. =30000, S=5000, P=0.99. Upang mahanap ang agwat ng kumpiyansa, ginagamit namin ang formula na tumutugma sa pamantayan ng Mag-aaral. Ayon sa talahanayan para sa n \u003d 30 at P \u003d 0.99 nakita namin ang t \u003d 2.756, samakatuwid,


mga. ninanais na pagtitiwala pagitan 27484< Х ср.ген < 32516.

Kaya, na may posibilidad na 0.99, maaari itong maitalo na ang pagitan (27484; 32516) ay naglalaman ng karaniwang suweldo sa kumpanya.

Umaasa kami na gagamitin mo ang paraang ito nang hindi kinakailangang may kasamang spreadsheet sa bawat oras. Ang mga kalkulasyon ay maaaring awtomatikong isagawa sa Excel. Papasok Excel file, pindutin ang fx button sa tuktok na menu. Pagkatapos, piliin sa mga function ang uri ng "statistical", at mula sa iminungkahing listahan sa kahon - STEUDRASP. Pagkatapos, sa prompt, paglalagay ng cursor sa field na "probability", i-type ang halaga ng reciprocal probability (iyon ay, sa aming kaso, sa halip na ang probabilidad na 0.95, kailangan mong i-type ang probabilidad na 0.05). Tila, ang spreadsheet ay idinisenyo upang masagot ng resulta ang tanong kung gaano tayo malamang na magkamali. Katulad nito, sa field na "degree of freedom," ilagay ang value (n-1) para sa iyong sample.

Ang agwat ng kumpiyansa ay dumating sa amin mula sa larangan ng mga istatistika. Ito ay isang tinukoy na hanay na nagsisilbing tantyahin ang isang hindi kilalang parameter na may mataas na antas ng pagiging maaasahan. Ang pinakamadaling paraan upang ipaliwanag ito ay sa pamamagitan ng isang halimbawa.

Ipagpalagay na kailangan mong mag-imbestiga ng ilang random na variable, halimbawa, ang bilis ng tugon ng server sa isang kahilingan ng kliyente. Sa tuwing nagta-type ang user sa address ng isang partikular na site, tumutugon ang server gamit ang ibang bilis. Kaya, ang inimbestigahang oras ng pagtugon ay may random na karakter. Kaya, pinapayagan ka ng agwat ng kumpiyansa na matukoy ang mga hangganan ng parameter na ito, at pagkatapos ay posible na igiit na may posibilidad na 95% ang server ay nasa saklaw na aming kinakalkula.

O kailangan mong malaman kung gaano karaming mga tao ang nakakaalam tungkol sa tatak ng kumpanya. Kapag kinakalkula ang agwat ng kumpiyansa, posible, halimbawa, na sabihin na may 95% na posibilidad ang bahagi ng mga mamimili na nakakaalam tungkol dito ay nasa saklaw mula 27% hanggang 34%.

Ang malapit na nauugnay sa terminong ito ay isang halaga bilang antas ng kumpiyansa. Kinakatawan nito ang posibilidad na ang nais na parameter ay kasama sa pagitan ng kumpiyansa. Tinutukoy ng value na ito kung gaano kalaki ang ating gustong hanay. Kung mas malaki ang halaga na kailangan, mas makitid ang pagitan ng kumpiyansa, at kabaliktaran. Kadalasan ito ay nakatakda sa 90%, 95% o 99%. Ang halaga ng 95% ay ang pinakasikat.

Ang tagapagpahiwatig na ito ay naiimpluwensyahan din ng pagkakaiba-iba ng mga obserbasyon at ang kahulugan nito ay batay sa pagpapalagay na ang tampok na pinag-aaralan ay sumusunod. Ang pahayag na ito ay kilala rin bilang Gauss' Law. Ayon sa kanya, ang naturang distribusyon ng lahat ng probabilities ng isang tuluy-tuloy na random variable ay tinatawag na normal, na maaaring ilarawan ng probability density. Kung ang pagpapalagay ng isang normal na pamamahagi ay naging mali, kung gayon ang pagtatantya ay maaaring maging mali.

Una, alamin natin kung paano kalkulahin ang agwat ng kumpiyansa para Dito, dalawang kaso ang posible. Ang dispersion (ang antas ng pagkalat ng isang random na variable) ay maaaring malaman o hindi. Kung ito ay kilala, kung gayon ang aming agwat ng kumpiyansa ay kinakalkula gamit ang sumusunod na formula:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - tanda,

t ay isang parameter mula sa talahanayan ng pamamahagi ng Laplace,

Ang σ ay ang square root ng dispersion.

Kung ang pagkakaiba ay hindi alam, maaari itong kalkulahin kung alam natin ang lahat ng mga halaga ng nais na tampok. Para dito, ginagamit ang sumusunod na formula:

σ2 = х2ср - (хр)2, kung saan

х2ср - ang average na halaga ng mga parisukat ng katangian na pinag-aaralan,

Ang (xsr)2 ay ang parisukat ng tampok na ito.

Ang formula kung saan kinakalkula ang agwat ng kumpiyansa sa kasong ito ay bahagyang nagbabago:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - sample ibig sabihin,

α - tanda,

t ay isang parameter na matatagpuan gamit ang talahanayan ng pamamahagi ng Estudyante t \u003d t (ɣ; n-1),

Ang sqrt(n) ay ang square root ng kabuuang sample size,

s ay ang square root ng variance.

Isaalang-alang ang halimbawang ito. Ipagpalagay na, batay sa mga resulta ng 7 pagsukat, ang katangiang pinag-aaralan ay natukoy na 30 at ang sample na pagkakaiba ay katumbas ng 36. Kinakailangang maghanap ng confidence interval na may posibilidad na 99% na naglalaman ng tunay na halaga ng sinusukat. parameter.

Una, tukuyin natin kung ano ang katumbas ng t: t \u003d t (0.99; 7-1) \u003d 3.71. Gamit ang formula sa itaas, nakukuha namin:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3.71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Ang agwat ng kumpiyansa para sa variance ay kinakalkula kapwa sa kaso ng isang kilalang mean at kapag walang data sa mathematical na inaasahan, at tanging ang halaga ng walang pinapanigan na pagtatantya ng punto ng pagkakaiba ang nalalaman. Hindi namin ibibigay dito ang mga formula para sa pagkalkula nito, dahil ang mga ito ay medyo kumplikado at, kung ninanais, palagi silang matatagpuan sa net.

Tandaan lamang namin na maginhawa upang matukoy ang agwat ng kumpiyansa gamit ang Excel program o isang serbisyo sa network, na tinatawag na gayon.

Sa mga istatistika, mayroong dalawang uri ng mga pagtatantya: punto at pagitan. Pagtataya ng Punto ay isang solong sample na istatistika na ginagamit upang tantyahin ang isang parameter ng populasyon. Halimbawa, ang ibig sabihin ng sample ay isang puntong pagtatantya ng ibig sabihin ng populasyon, at ang sample na pagkakaiba-iba S2- punto ng pagtatantya ng pagkakaiba-iba ng populasyon σ2. ipinakita na ang sample mean ay isang walang pinapanigan na pagtatantya ng inaasahan ng populasyon. Ang sample mean ay tinatawag na walang pinapanigan dahil ang ibig sabihin ng lahat ng sample ay (na may parehong laki ng sample n) ay katumbas ng mathematical na inaasahan ng pangkalahatang populasyon.

Upang ang sample na pagkakaiba-iba S2 naging walang pinapanigan na estimator ng pagkakaiba-iba ng populasyon σ2, ang denominator ng sample na variance ay dapat itakda na katumbas ng n – 1 , ngunit hindi n. Sa madaling salita, ang pagkakaiba-iba ng populasyon ay ang average ng lahat ng posibleng pagkakaiba-iba ng sample.

Kapag tinatantya ang mga parameter ng populasyon, dapat tandaan na ang mga sample na istatistika tulad ng , depende sa mga partikular na sample. Upang isaalang-alang ang katotohanang ito, upang makuha pagtatantya ng pagitan ang matematikal na inaasahan ng pangkalahatang populasyon ay sinusuri ang pamamahagi ng sample na paraan (para sa higit pang mga detalye, tingnan). Ang itinayong agwat ay nailalarawan sa pamamagitan ng isang tiyak na antas ng kumpiyansa, na kung saan ay ang posibilidad na ang tunay na parameter ng pangkalahatang populasyon ay natantiya nang tama. Maaaring gamitin ang mga katulad na agwat ng kumpiyansa upang tantiyahin ang proporsyon ng isang feature R at ang pangunahing ibinahagi na masa ng pangkalahatang populasyon.

Mag-download ng tala sa o format, mga halimbawa sa format

Pagbuo ng isang agwat ng kumpiyansa para sa mathematical na inaasahan ng pangkalahatang populasyon na may kilalang standard deviation

Pagbuo ng isang agwat ng kumpiyansa para sa proporsyon ng isang katangian sa pangkalahatang populasyon

Sa seksyong ito, ang konsepto ng isang agwat ng kumpiyansa ay pinalawak sa kategoryang data. Ito ay nagpapahintulot sa iyo na tantyahin ang bahagi ng katangian sa pangkalahatang populasyon R na may sample share RS= X/n. Tulad ng nabanggit, kung ang mga halaga nR at n(1 - p) lumampas sa numero 5, ang binomial distribution ay maaaring tantiyahin ng normal. Samakatuwid, upang tantyahin ang bahagi ng isang katangian sa pangkalahatang populasyon R posible na bumuo ng isang pagitan na ang antas ng kumpiyansa ay katumbas ng (1 - α)x100%.


saan pS- sample na bahagi ng tampok, katumbas ng X/n, ibig sabihin. ang bilang ng mga tagumpay na hinati sa laki ng sample, R- ang bahagi ng katangian sa pangkalahatang populasyon, Z ay ang kritikal na halaga ng standardized normal distribution, n- laki ng sample.

Halimbawa 3 Ipagpalagay natin na ang isang sample ay kinuha mula sa sistema ng impormasyon, na binubuo ng 100 mga invoice na nakumpleto noong nakaraang buwan. Sabihin nating mali ang 10 sa mga invoice na ito. kaya, R= 10/100 = 0.1. Ang 95% na antas ng kumpiyansa ay tumutugma sa kritikal na halaga Z = 1.96.

Kaya, mayroong 95% na pagkakataon na sa pagitan ng 4.12% at 15.88% ng mga invoice ay naglalaman ng mga error.

Para sa isang ibinigay na laki ng sample, ang agwat ng kumpiyansa na naglalaman ng proporsyon ng katangian sa pangkalahatang populasyon ay tila mas malawak kaysa sa isang tuluy-tuloy na random na variable. Ito ay dahil ang mga sukat ng isang tuluy-tuloy na random na variable ay naglalaman ng mas maraming impormasyon kaysa sa mga sukat ng pang-kategoryang data. Sa madaling salita, ang kategoryang data na kumukuha lamang ng dalawang halaga ay naglalaman ng hindi sapat na impormasyon upang matantya ang mga parameter ng kanilang pamamahagi.

ATpagkalkula ng mga pagtatantya na nakuha mula sa isang may hangganang populasyon

Pagtataya ng inaasahan sa matematika. Salik ng pagwawasto para sa huling populasyon ( fpc) ay ginamit upang mabawasan karaniwang error sa oras. Kapag kinakalkula ang mga agwat ng kumpiyansa para sa mga pagtatantya ng parameter ng populasyon, inilalapat ang isang salik sa pagwawasto sa mga sitwasyon kung saan kinukuha ang mga sample nang walang kapalit. Kaya, ang pagitan ng kumpiyansa para sa inaasahan sa matematika, pagkakaroon ng antas ng kumpiyansa na katumbas ng (1 - α)x100%, ay kinakalkula ng formula:

Halimbawa 4 Upang ilarawan ang aplikasyon ng correction factor para sa isang limitadong populasyon, bumalik tayo sa problema ng pagkalkula ng confidence interval para sa average na halaga ng mga invoice na tinalakay sa Halimbawa 3 sa itaas. Ipagpalagay na ang isang kumpanya ay nag-isyu ng 5,000 invoice bawat buwan, at Xᅳ=110.27 USD, S= $28.95 N = 5000, n = 100, α = 0.05, t99 = 1.9842. Ayon sa formula (6) nakukuha natin:

Pagtatantya ng bahagi ng tampok. Kapag pumipili ng walang pagbabalik, ang agwat ng kumpiyansa para sa proporsyon ng tampok na may antas ng kumpiyansa na katumbas ng (1 - α)x100%, ay kinakalkula ng formula:

Mga agwat ng kumpiyansa at mga isyu sa etika

Kapag nagsa-sample ng isang populasyon at bumubuo ng mga istatistikal na hinuha, madalas na lumitaw ang mga problema sa etika. Ang pangunahing isa ay kung paano nagkakasundo ang mga agwat ng kumpiyansa at mga pagtatantya ng punto ng mga sample na istatistika. Ang mga pagtatantya sa punto ng pag-publish nang hindi tinutukoy ang mga naaangkop na agwat ng kumpiyansa (karaniwan ay nasa 95% na antas ng kumpiyansa) at ang laki ng sample kung saan nagmula ang mga ito ay maaaring mapanlinlang. Ito ay maaaring magbigay sa user ng impresyon na ang pagtatantya ng punto ay eksaktong kailangan niya upang mahulaan ang mga katangian ng buong populasyon. Kaya, kinakailangang maunawaan na sa anumang pananaliksik, hindi punto, ngunit ang mga pagtatantya ng pagitan ay dapat ilagay sa unahan. Bilang karagdagan, ang espesyal na pansin ay dapat bayaran sa tamang pagpili ng mga laki ng sample.

Kadalasan, ang mga object ng statistical manipulations ay ang mga resulta ng sociological survey ng populasyon sa iba't ibang isyung pampulitika. Kasabay nito, ang mga resulta ng survey ay inilalagay sa mga front page ng mga pahayagan, at ang sampling error at ang pamamaraan ng statistical analysis ay naka-print sa isang lugar sa gitna. Upang patunayan ang bisa ng nakuha na mga pagtatantya ng punto, kinakailangang ipahiwatig ang laki ng sample batay sa kung saan nakuha ang mga ito, ang mga hangganan ng agwat ng kumpiyansa at antas ng kahalagahan nito.

Susunod na tala

Mga materyales mula sa aklat na Levin et al. Ginagamit ang mga istatistika para sa mga tagapamahala. - M.: Williams, 2004. - p. 448–462

Central limit theorem nagsasaad na para sa isang sapat na malaking sukat ng sample, ang sample na pamamahagi ng mga paraan ay maaaring tantiyahin sa pamamagitan ng isang normal na distribusyon. Ang ari-arian na ito ay hindi nakadepende sa uri ng pamamahagi ng populasyon.

Pagtataya ng mga pagitan ng kumpiyansa

Mga Layunin sa pag-aaral

Isinasaalang-alang ng mga istatistika ang mga sumusunod dalawang pangunahing gawain:

    Mayroon kaming ilang pagtatantya batay sa sample na data at gusto naming gumawa ng ilang probabilistic na pahayag tungkol sa kung nasaan ang totoong halaga ng parameter na tinatantya.

    Mayroon kaming partikular na hypothesis na kailangang masuri batay sa sample na data.

Sa paksang ito, isinasaalang-alang namin ang unang problema. Ipinakilala rin namin ang kahulugan ng agwat ng kumpiyansa.

Ang agwat ng kumpiyansa ay isang agwat na binuo sa paligid ng tinantyang halaga ng isang parameter at nagpapakita kung saan ang tunay na halaga ng tinantyang parameter ay nasa isang priori na ibinigay na posibilidad.

Pagkatapos pag-aralan ang materyal sa paksang ito, ikaw ay:

    alamin kung ano ang agwat ng kumpiyansa ng pagtatantya;

    matutong pag-uri-uriin ang mga problema sa istatistika;

    master ang pamamaraan ng pagbuo ng mga agwat ng kumpiyansa, parehong gamit ang mga istatistikal na formula at paggamit ng mga tool sa software;

    matutong tukuyin ang mga kinakailangang laki ng sample upang makamit ang ilang partikular na parameter ng katumpakan ng mga istatistikal na pagtatantya.

Pamamahagi ng mga katangian ng sample

T-pamamahagi

Tulad ng tinalakay sa itaas, ang distribusyon ng random variable ay malapit sa isang standardized normal distribution na may mga parameter na 0 at 1. Dahil hindi natin alam ang halaga ng σ, pinapalitan natin ito ng ilang pagtatantya s . Ang dami ay mayroon nang ibang distribusyon, ibig sabihin, o Pamamahagi ng mag-aaral, na tinutukoy ng parameter n -1 (bilang ng mga antas ng kalayaan). Ang distribusyon na ito ay malapit sa normal na distribusyon (mas malaki n, mas malapit ang mga distribusyon).

Sa fig. 95
Ang pamamahagi ng mag-aaral na may 30 degrees ng kalayaan ay ipinakita. Tulad ng nakikita mo, ito ay napakalapit sa normal na pamamahagi.

Katulad ng mga function para sa pagtatrabaho sa normal na distribution NORMDIST at NORMINV, may mga function para sa pagtatrabaho sa t-distribution - STUDIST (TDIST) at STUDRASPBR (TINV). Ang isang halimbawa ng paggamit ng mga function na ito ay matatagpuan sa STUDRIST.XLS file (template at solusyon) at sa fig. 96
.

Pamamahagi ng iba pang mga katangian

Tulad ng alam na natin, upang matukoy ang katumpakan ng pagtatantya ng inaasahan, kailangan natin ng t-distribution. Upang matantya ang iba pang mga parameter, tulad ng pagkakaiba-iba, ang iba pang mga distribusyon ay kinakailangan. Dalawa sa kanila ay ang F-distribution at x 2 -pamamahagi.

Agwat ng kumpiyansa para sa mean

Agwat ng kumpiyansa ay isang agwat na binuo sa paligid ng tinantyang halaga ng parameter at nagpapakita kung saan ang tunay na halaga ng tinantyang parameter ay nasa isang priori na ibinigay na posibilidad.

Ang pagbuo ng isang agwat ng kumpiyansa para sa average na halaga ay nangyayari sa sumusunod na paraan:

Halimbawa

Plano ng fast food restaurant na palawakin ang assortment nito gamit ang isang bagong uri ng sandwich. Upang matantya ang pangangailangan para dito, plano ng manager na random na pumili ng 40 bisita mula sa mga nakasubok na nito at hilingin sa kanila na i-rate ang kanilang saloobin sa bagong produkto sa isang sukat mula 1 hanggang 10. Nais tantyahin ng manager ang inaasahang bilang ng mga puntos na matatanggap ng bagong produkto at bubuo ng 95% confidence interval para sa pagtatantyang ito. Paano ito gagawin? (tingnan ang file na SANDWICH1.XLS (template at solusyon).

Desisyon

Upang malutas ang problemang ito, maaari mong gamitin ang . Ang mga resulta ay ipinakita sa fig. 97
.

Agwat ng kumpiyansa para sa kabuuang halaga

Minsan, ayon sa sample na data, kinakailangan na tantyahin hindi ang inaasahan sa matematika, ngunit ang kabuuang kabuuan ng mga halaga. Halimbawa, sa isang sitwasyon sa isang auditor, maaaring maging interesado na tantiyahin hindi ang average na halaga ng isang invoice, ngunit ang kabuuan ng lahat ng mga invoice.

Hayaan N - kabuuan elemento, n ang laki ng sample, ang T 3 ay ang kabuuan ng mga halaga sa sample, ang T" ay ang pagtatantya para sa kabuuan sa buong populasyon, pagkatapos , at ang agwat ng kumpiyansa ay kinakalkula ng formula , kung saan ang s ay ang pagtatantya ng karaniwang paglihis para sa sample, ay ang pagtatantya ng mean para sa sample.

Halimbawa

Sabihin nating gusto ng isang tanggapan ng buwis na tantyahin ang halaga ng kabuuang mga refund ng buwis para sa 10,000 nagbabayad ng buwis. Ang nagbabayad ng buwis ay maaaring makatanggap ng refund o magbabayad ng karagdagang mga buwis. Hanapin ang 95% na agwat ng kumpiyansa para sa halaga ng refund, kung ipagpalagay na ang laki ng sample na 500 tao (tingnan ang file REFUND AMOUNT.XLS (template at solusyon).

Desisyon

Walang espesyal na pamamaraan sa StatPro para sa kasong ito, gayunpaman, makikita mo na ang mga hangganan ay maaaring makuha mula sa mga hangganan para sa mean gamit ang mga formula sa itaas (Fig. 98
).

Agwat ng kumpiyansa para sa proporsyon

Hayaan ang p ay ang inaasahan ng bahagi ng mga customer, at ang pv ay isang pagtatantya ng bahaging ito, na nakuha mula sa isang sample ng laki n. Ito ay maaaring ipakita na para sa sapat na malaki ang distribusyon ng pagtatantya ay magiging malapit sa normal na may mean p at standard deviation . Ang karaniwang error ng pagtatantya sa kasong ito ay ipinahayag bilang , at ang pagitan ng kumpiyansa bilang .

Halimbawa

Plano ng fast food restaurant na palawakin ang assortment nito gamit ang isang bagong uri ng sandwich. Upang matantya ang pangangailangan para dito, random na pinili ng manager ang 40 bisita mula sa mga nakasubok na nito at hiniling sa kanila na i-rate ang kanilang saloobin sa bagong produkto sa isang sukat mula 1 hanggang 10. Gusto ng manager na tantyahin ang inaasahang proporsyon ng mga customer na nagre-rate ng bagong produkto ng hindi bababa sa 6 na puntos (inaasahan niya na ang mga customer na ito ay ang mga mamimili ng bagong produkto).

Desisyon

Sa una, gumawa kami ng bagong column batay sa 1 kung ang marka ng kliyente ay higit sa 6 na puntos at 0 kung hindi man (tingnan ang SANDWICH2.XLS file (template at solusyon).

Paraan 1

Bilangin ang halaga ng 1, tinatantya namin ang bahagi, at pagkatapos ay ginagamit namin ang mga formula.

Ang halaga ng z cr ay kinuha mula sa mga espesyal na talahanayan ng normal na pamamahagi (halimbawa, 1.96 para sa isang 95% na agwat ng kumpiyansa).

Gamit diskarteng ito at tiyak na data para sa pagbuo ng 95% na pagitan, makuha namin ang mga sumusunod na resulta (Larawan 99
). kritikal na halaga ang parameter na z cr ay katumbas ng 1.96. Ang karaniwang error ng pagtatantya ay 0.077. Ang mas mababang limitasyon ng agwat ng kumpiyansa ay 0.475. Ang pinakamataas na limitasyon ng agwat ng kumpiyansa ay 0.775. Kaya, maaaring ipagpalagay ng isang manager na may 95% na katiyakan na ang porsyento ng mga customer na nagre-rate ng isang bagong produkto ng 6 na puntos o higit pa ay nasa pagitan ng 47.5 at 77.5.

Paraan 2

Maaaring malutas ang problemang ito gamit ang mga karaniwang tool ng StatPro. Upang gawin ito, sapat na tandaan na ang bahagi sa kasong ito ay tumutugma sa average na halaga ng hanay ng Uri. Susunod na mag-apply StatPro/Statistical Inference/One-Sample na Pagsusuri para bumuo ng confidence interval para sa mean value (expectation estimate) para sa Type column. Ang mga resulta na nakuha sa kasong ito ay magiging napakalapit sa resulta ng 1st method (Fig. 99).

Agwat ng kumpiyansa para sa karaniwang paglihis

s ay ginagamit bilang isang pagtatantya ng karaniwang paglihis (ang formula ay ibinigay sa Seksyon 1). Ang densidad function ng pagtatantya s ay ang chi-squared function, na, tulad ng t-distribution, ay may n-1 degrees ng kalayaan. May mga espesyal na function para sa pagtatrabaho sa pamamahaging ito CHI2DIST (CHIDIST) at CHI2OBR (CHIINV) .

Ang agwat ng kumpiyansa sa kasong ito ay hindi na magiging simetriko. Ang conditional scheme ng mga hangganan ay ipinapakita sa fig. 100 .

Halimbawa

Ang makina ay dapat gumawa ng mga bahagi na may diameter na 10 cm. Gayunpaman, dahil sa iba't ibang mga pangyayari, ang mga pagkakamali ay nangyayari. Ang controller ng kalidad ay nag-aalala tungkol sa dalawang bagay: una, ang average na halaga ay dapat na 10 cm; pangalawa, kahit na sa kasong ito, kung ang mga paglihis ay malaki, kung gayon maraming mga detalye ang tatanggihan. Araw-araw ay gumagawa siya ng sample ng 50 bahagi (tingnan ang file QUALITY CONTROL.XLS (template at solusyon). Anong mga konklusyon ang maibibigay ng naturang sample?

Desisyon

Bumubuo kami ng 95% na agwat ng kumpiyansa para sa mean at para sa karaniwang paglihis gamit StatPro/Statistical Inference/ One-Sample Analysis(Larawan 101
).

Dagdag pa, gamit ang pagpapalagay ng isang normal na pamamahagi ng mga diameters, kinakalkula namin ang proporsyon ng mga may sira na produkto, na nagtatakda ng maximum na paglihis ng 0.065. Gamit ang mga kakayahan ng lookup table (ang kaso ng dalawang parameter), binubuo namin ang dependence ng porsyento ng mga pagtanggi sa mean value at standard deviation (Fig. 102
).

Ang pagitan ng kumpiyansa para sa pagkakaiba ng dalawang paraan

Ito ay isa sa pinakamahalagang aplikasyon paraang istatistikal. Mga halimbawa ng sitwasyon.

    Gustong malaman ng isang manager ng tindahan ng damit kung magkano o mas kaunti ang ginagastos ng karaniwang babaeng mamimili sa tindahan kaysa sa isang lalaki.

    Ang dalawang airline ay lumilipad ng magkatulad na ruta. Gusto ng isang organisasyon ng consumer na ihambing ang pagkakaiba sa pagitan ng average na inaasahang oras ng pagkaantala ng flight para sa parehong airline.

    Nagpapadala ang kumpanya ng mga kupon para sa ibang mga klase mga kalakal sa isang lungsod at hindi nagpapadala sa iba. Gusto ng mga manager na paghambingin ang average na mga pagbili ng mga item na ito sa susunod na dalawang buwan.

    Ang isang dealer ng kotse ay madalas na nakikipag-ugnayan sa mga mag-asawa sa mga presentasyon. Upang maunawaan ang kanilang mga personal na reaksyon sa pagtatanghal, ang mga mag-asawa ay madalas na hiwalay na kapanayamin. Gustong suriin ng manager ang pagkakaiba sa mga rating na ibinibigay ng mga lalaki at babae.

Kaso ng mga independiyenteng sample

Ang ibig sabihin ng pagkakaiba ay magkakaroon ng t-distribution na may n 1 + n 2 - 2 degrees ng kalayaan. Ang agwat ng kumpiyansa para sa μ 1 - μ 2 ay ipinahayag ng ratio:

Ang problemang ito ay maaaring malutas hindi lamang sa pamamagitan ng mga formula sa itaas, kundi pati na rin ng mga karaniwang tool ng StatPro. Upang gawin ito, ito ay sapat na upang mag-aplay

Agwat ng kumpiyansa para sa pagkakaiba sa pagitan ng mga sukat

Hayaan ang mathematical na inaasahan ng mga pagbabahagi. Hayaan ang kanilang mga sample na pagtatantya na binuo sa mga sample ng laki n 1 at n 2, ayon sa pagkakabanggit. Pagkatapos ay isang pagtatantya para sa pagkakaiba. Samakatuwid, ang agwat ng kumpiyansa para sa pagkakaibang ito ay ipinahayag bilang:

Narito ang z cr ay ang value na nakuha mula sa normal na distribution ng mga espesyal na talahanayan (halimbawa, 1.96 para sa 95% confidence interval).

Ang karaniwang error ng pagtatantya ay ipinahayag sa kasong ito ng kaugnayan:

.

Halimbawa

Ang tindahan, bilang paghahanda para sa malaking sale, ay nagsagawa ng mga sumusunod na hakbang: pananaliksik sa marketing. Ang nangungunang 300 na mamimili ay pinili at random na hinati sa dalawang grupo ng 150 miyembro bawat isa. Ang lahat ng mga napiling mamimili ay pinadalhan ng mga imbitasyon upang lumahok sa pagbebenta, ngunit para lamang sa mga miyembro ng unang pangkat ay may nakalakip na kupon na nagbibigay ng karapatan sa 5% na diskwento. Sa panahon ng pagbebenta, ang mga pagbili ng lahat ng 300 napiling mamimili ay naitala. Paano mabibigyang-kahulugan ng isang tagapamahala ang mga resulta at gumawa ng paghatol tungkol sa pagiging epektibo ng kuponing? (Tingnan ang COUPONS.XLS file (template at solusyon)).

Desisyon

Para sa aming partikular na kaso, sa 150 customer na nakatanggap ng discount coupon, 55 ang bumili sa pagbebenta, at sa 150 na hindi nakatanggap ng coupon, 35 lang ang bumili (Fig. 103
). Pagkatapos ang mga halaga ng mga proporsyon ng sample ay 0.3667 at 0.2333, ayon sa pagkakabanggit. At ang sample na pagkakaiba sa pagitan ng mga ito ay katumbas ng 0.1333, ayon sa pagkakabanggit. Ipagpalagay na ang pagitan ng kumpiyansa na 95%, makikita natin mula sa normal na talahanayan ng pamamahagi z cr = 1.96. Ang pagkalkula ng karaniwang error ng sample na pagkakaiba ay 0.0524. Sa wakas, nakuha namin na ang mas mababang limitasyon ng 95% na agwat ng kumpiyansa ay 0.0307, ​​​​at ang pinakamataas na limitasyon ay 0.2359, ayon sa pagkakabanggit. Ang mga resultang nakuha ay maaaring bigyang-kahulugan sa paraang para sa bawat 100 customer na nakatanggap ng discount coupon, maaari naming asahan mula 3 hanggang 23 bagong customer. Gayunpaman, dapat tandaan na ang konklusyon na ito mismo ay hindi nangangahulugan ng kahusayan ng paggamit ng mga kupon (dahil sa pagbibigay ng diskwento, natalo tayo sa kita!). Ipakita natin ito sa konkretong datos. Ipagpalagay na ang average na halaga ng pagbili ay 400 rubles, kung saan 50 rubles. may tubo sa tindahan. Kung gayon ang inaasahang tubo sa bawat 100 customer na hindi nakatanggap ng kupon ay katumbas ng:

50 0.2333 100 \u003d 1166.50 rubles.

Mga katulad na kalkulasyon para sa 100 mamimili na nakatanggap ng coupon give:

30 0.3667 100 \u003d 1100.10 rubles.

Ang pagbaba sa average na kita sa 30 ay ipinaliwanag sa pamamagitan ng katotohanan na, gamit ang diskwento, ang mga mamimili na nakatanggap ng isang kupon ay, sa karaniwan, ay bibili para sa 380 rubles.

Kaya, ang pangwakas na konklusyon ay nagpapahiwatig ng inefficiency ng paggamit ng naturang mga kupon sa partikular na sitwasyong ito.

Magkomento. Maaaring malutas ang problemang ito gamit ang mga karaniwang tool ng StatPro. Upang gawin ito, sapat na upang bawasan ang problemang ito sa problema ng pagtantya ng pagkakaiba ng dalawang average sa pamamagitan ng pamamaraan, at pagkatapos ay ilapat StatPro/Statistical Inference/Two-Sample Analysis upang bumuo ng agwat ng kumpiyansa para sa pagkakaiba sa pagitan ng dalawang mean na halaga.

Kontrol ng agwat ng kumpiyansa

Ang haba ng agwat ng kumpiyansa ay nakasalalay sa sumusunod na mga kondisyon:

    direktang data (standard deviation);

    lebel ng kahalagahan;

    laki ng sample.

Laki ng sample para sa pagtatantya ng mean

Isaalang-alang muna natin ang problema sa pangkalahatang kaso. Tukuyin natin ang halaga ng kalahati ng haba ng agwat ng kumpiyansa na ibinigay sa atin bilang B (Larawan 104
). Alam namin na ang agwat ng kumpiyansa para sa mean na halaga ng ilang random na variable X ay ipinahayag bilang , saan . Ipagpalagay na:

at pagpapahayag n , nakukuha natin .

Sa kasamaang palad, eksaktong halaga hindi natin alam ang pagkakaiba ng random variable X. Bilang karagdagan, hindi natin alam ang halaga ng t cr dahil ito ay nakasalalay sa n sa pamamagitan ng bilang ng mga antas ng kalayaan. Sa sitwasyong ito, magagawa natin ang mga sumusunod. Sa halip na ang variance s, gumagamit kami ng ilang pagtatantya ng variance para sa ilang available na realizations ng random variable na pinag-aaralan. Sa halip na ang halaga ng t cr, ginagamit namin ang halaga ng z cr para sa normal na distribusyon. Ito ay lubos na katanggap-tanggap, dahil ang mga function ng density para sa normal at t-distribusyon ay napakalapit (maliban sa kaso ng maliit na n ). Kaya, ang nais na pormula ay nasa anyo:

.

Dahil ang formula ay nagbibigay, sa pangkalahatan, ng mga hindi integer na resulta, ang pag-round na may labis na resulta ay kinukuha bilang ang nais na laki ng sample.

Halimbawa

Plano ng fast food restaurant na palawakin ang assortment nito gamit ang isang bagong uri ng sandwich. Upang matantya ang pangangailangan para dito, random na pinaplano ng manager na pumili ng ilang bisita mula sa mga nakasubok na nito, at hilingin sa kanila na i-rate ang kanilang saloobin sa bagong produkto sa sukat mula 1 hanggang 10. Gusto ng manager upang tantyahin ang inaasahang bilang ng mga puntos na matatanggap ng bagong produkto. produkto at i-plot ang 95% na agwat ng kumpiyansa ng pagtatantiyang iyon. Gayunpaman, nais niyang ang kalahati ng lapad ng pagitan ng kumpiyansa ay hindi lalampas sa 0.3. Ilang bisita ang kailangan niyang i-poll?

tulad ng sumusunod:

Dito r ots ay isang pagtatantya ng fraction p, at ang B ay isang ibinigay na kalahati ng haba ng agwat ng kumpiyansa. Ang isang napalaki na halaga para sa n ay maaaring makuha gamit ang halaga r ots= 0.5. Sa kasong ito, ang haba ng agwat ng kumpiyansa ay hindi lalampas itakda ang halaga Sa para sa anumang tunay na halaga ng p .

Halimbawa

Hayaang magplano ang manager mula sa nakaraang halimbawa na tantyahin ang proporsyon ng mga customer na mas gusto ang isang bagong uri ng produkto. Gusto niyang bumuo ng 90% confidence interval na ang kalahating haba ay mas mababa sa o katumbas ng 0.05. Ilang kliyente ang dapat random na ma-sample?

Desisyon

Sa aming kaso, ang halaga ng z cr = 1.645. Samakatuwid, ang kinakailangang dami ay kinakalkula bilang .

Kung ang tagapamahala ay may dahilan upang maniwala na ang nais na halaga ng p ay, halimbawa, mga 0.3, kung gayon sa pamamagitan ng pagpapalit ng halagang ito sa formula sa itaas, makakakuha tayo ng mas maliit na halaga ng random na sample, katulad ng 228.

Formula upang matukoy random na laki ng sample sa kaso ng pagkakaiba sa pagitan ng dalawang paraan nakasulat bilang:

.

Halimbawa

May customer service center ang ilang kumpanya ng kompyuter. AT kamakailang mga panahon tumaas ang bilang ng mga reklamo ng customer tungkol sa mahinang kalidad ng serbisyo. Ang sentro ng serbisyo ay pangunahing gumagamit ng dalawang uri ng mga empleyado: yaong may kaunting karanasan, ngunit nakatapos ng mga espesyal na kurso sa pagsasanay, at yaong may malawak na praktikal na karanasan, ngunit hindi nakatapos ng mga espesyal na kurso. Nais ng kumpanya na suriin ang mga reklamo ng customer sa nakalipas na anim na buwan at ihambing ang kanilang mga average na numero sa bawat isa sa dalawang grupo ng mga empleyado. Ipinapalagay na ang mga numero sa mga sample para sa parehong grupo ay magiging pareho. Ilang empleyado ang dapat isama sa sample para makakuha ng 95% interval na may kalahating haba na hindi hihigit sa 2?

Desisyon

Narito ang σ ots ay isang pagtatantya ng karaniwang paglihis ng parehong mga random na variable sa ilalim ng pagpapalagay na sila ay malapit. Kaya, sa aming gawain, kailangan naming makuha ang pagtatantya na ito. Magagawa ito, halimbawa, tulad ng sumusunod. Sa pagtingin sa data ng reklamo ng customer sa nakalipas na anim na buwan, maaaring mapansin ng isang manager na sa pangkalahatan ay nasa pagitan ng 6 at 36 na reklamo bawat empleyado. Alam na para sa isang normal na pamamahagi, halos lahat ng mga halaga ay hindi hihigit sa tatlong karaniwang paglihis mula sa mean, makatwirang maniniwala siya na:

, kung saan σ ots = 5.

Ang pagpapalit ng halagang ito sa formula, nakukuha namin .

Formula upang matukoy ang laki ng isang random na sample sa kaso ng pagtantya ng pagkakaiba sa pagitan ng mga pagbabahagi mukhang:

Halimbawa

Ang ilang kumpanya ay may dalawang pabrika para sa paggawa ng mga katulad na produkto. Nais ng tagapamahala ng isang kumpanya na ihambing ang mga rate ng depekto ng parehong mga pabrika. Ayon sa magagamit na impormasyon, ang rate ng pagtanggi sa parehong mga pabrika ay mula 3 hanggang 5%. Ito ay dapat na bumuo ng isang 99% na agwat ng kumpiyansa na may kalahating haba na hindi hihigit sa 0.005 (o 0.5%). Ilang produkto ang dapat piliin mula sa bawat pabrika?

Desisyon

Dito ang p 1ot at p 2ot ay mga pagtatantya ng dalawang hindi kilalang fraction ng mga pagtanggi sa 1st at 2nd factory. Kung maglalagay kami ng p 1ots \u003d p 2ots \u003d 0.5, pagkatapos ay makakakuha kami ng isang overestimated na halaga para sa n. Ngunit dahil sa aming kaso mayroon kaming ilang priori na impormasyon tungkol sa mga pagbabahaging ito, kinukuha namin ang itaas na pagtatantya ng mga pagbabahagi na ito, katulad ng 0.05. Nakukuha namin

Kapag tinatantya ang ilang parameter ng populasyon mula sa sample na data, kapaki-pakinabang na magbigay hindi lamang pagtatantya ng punto parameter, ngunit tumukoy din ng agwat ng kumpiyansa na nagpapakita kung saan ang eksaktong halaga ng tinantyang parameter.

Sa kabanatang ito, nakilala rin namin ang mga quantitative na relasyon na nagpapahintulot sa amin na bumuo ng mga ganoong agwat para sa iba't ibang mga parameter; natutunan ang mga paraan upang makontrol ang haba ng agwat ng kumpiyansa.

Napansin din namin na ang problema sa pagtantya sa laki ng sample (problema sa pagpaplano ng eksperimento) ay maaaring malutas gamit ang mga karaniwang tool ng StatPro, lalo na. StatPro/Statistical Inference/Sample Size Selection.