Miks me vajame usaldusvahemikku? Valimid ja usaldusvahemikud

Üks statistiliste probleemide lahendamise meetodeid on usaldusvahemiku arvutamine. Seda kasutatakse punkthinnangu eelistatava alternatiivina, kui valimi suurus on väike. Tuleb märkida, et usaldusvahemiku arvutamise protsess ise on üsna keeruline. Kuid Exceli programmi tööriistad võimaldavad teil seda mõnevõrra lihtsustada. Uurime, kuidas seda praktikas tehakse.

Seda meetodit kasutatakse erinevate statistiliste suuruste intervallide hindamiseks. Selle arvutuse põhiülesanne on vabaneda punkthinnangu määramatusest.

Excelis on selle meetodi abil arvutuste tegemiseks kaks peamist võimalust: kui dispersioon on teada ja kui see pole teada. Esimesel juhul kasutatakse funktsiooni arvutusteks USLALDA.NORM ja teises - UKSUSLIKE.TUDENG.

1. meetod: CONFIDENCE NORM funktsioon

Operaator USLALDA.NORM, mis kuulub funktsioonide statistilisse rühma, ilmus esmakordselt programmis Excel 2010. Selle programmi varasemad versioonid kasutavad selle analoogi USLADA. Selle operaatori eesmärk on arvutada usaldusvahemik keskmise normaaljaotusega elanikkonnast.

Selle süntaks on järgmine:

CONFIDENCE.NORM(alfa;standard_väljas;suurus)

"Alfa"— argument, mis näitab usaldustaseme arvutamiseks kasutatavat olulisuse taset. Usaldusväärsuse tase on võrdne järgmise avaldisega:

(1-"Alfa")*100

"Standardhälve"- See on argument, mille olemus on nimest selge. See on kavandatud valimi standardhälve.

"Suurus"— valimi suurust määratlev argument.

Kõik selle operaatori argumendid on nõutavad.

Funktsioon USLADA on täpselt samad argumendid ja võimalused, mis eelmisel. Selle süntaks on:

TRUST(alfa, standard_väljas, suurus)

Nagu näete, on erinevused ainult operaatori nimes. Ühilduvuse huvides on see funktsioon Excel 2010 ja uuemates versioonides jäetud erikategooriasse "Ühilduvus". Excel 2007 ja varasemates versioonides on see statistiliste operaatorite põhirühmas.

Usaldusvahemiku piir määratakse järgmise valemi abil:

X+(-)KINDLUSNORM

Kus X on valimi keskmine väärtus, mis asub valitud vahemiku keskel.

Nüüd vaatame, kuidas arvutada usaldusvahemikku konkreetne näide. Viidi läbi 12 testi, mille tulemusena saadi tabelis erinevad tulemused. See on meie tervik. Standardhälve on 8. Me peame arvutama usaldusvahemiku 97% usaldusnivoo juures.

  1. Valige lahter, kus kuvatakse andmetöötluse tulemus. Klõpsake nuppu "Sisesta funktsioon".
  2. Ilmub Funktsiooniviisard. Mine kategooriasse "Statistiline" ja tõstke nimi esile "USALDUS. NORM". Pärast seda klõpsake nuppu "OKEI".
  3. Avaneb argumentide aken. Selle väljad vastavad loomulikult argumentide nimedele.
    Asetage kursor esimesele väljale - "Alfa". Siin peaksime märkima olulisuse taseme. Nagu mäletame, on meie usalduse tase 97%. Samal ajal ütlesime, et see arvutatakse järgmiselt:

    (1 – usaldustase)/100

    See tähendab, et väärtuse asendamisel saame:

    Lihtsate arvutuste abil saame teada, et argument "Alfa" võrdub 0,03 . Sisenema antud väärtus põllul.

    Nagu teada, on tingimuse järgi standardhälve võrdne 8 . Seetõttu põllul "Standardhälve" lihtsalt kirjuta see number üles.

    Põllul "Suurus" peate sisestama sooritatud testielementide arvu. Nagu me mäletame, nende 12 . Kuid selleks, et valemit automatiseerida ja mitte redigeerida seda iga kord, kui teeme uut testi, määrakem see väärtus mitte tavalise numbriga, vaid operaatori abil KONTROLLIMA. Niisiis, asetame kursori väljale "Suurus" ja seejärel klõpsake kolmnurgal, mis asub valemiribast vasakul.

    Ilmub hiljuti kasutatud funktsioonide loend. Kui operaator KONTROLLIMA olete hiljuti kasutanud, peaks see selles loendis olema. Sel juhul peate lihtsalt klõpsama selle nimel. Vastasel juhul, kui te seda ei leia, minge asja juurde "Muud funktsioonid...".

  4. Ilmub juba tuttav Funktsiooniviisard. Liigume uuesti rühma juurde "Statistiline". Toome seal nime esile "KONTROLLIMA". Klõpsake nuppu "OKEI".
  5. Ilmub ülaltoodud väite argumendiaken. See funktsioon on mõeldud arvulisi väärtusi sisaldavate lahtrite arvu arvutamiseks määratud vahemikus. Selle süntaks on järgmine:

    COUNT(väärtus1,väärtus2,…)

    Vaidlusgrupp "Väärtused" on viide vahemikule, milles soovite arvutada arvandmetega täidetud lahtrite arvu. Kokku võib selliseid argumente olla kuni 255, kuid meie puhul vajame ainult ühte.

    Asetage kursor väljale "Väärtus1" ja hoides hiire vasakut nuppu all, valige lehel vahemik, mis sisaldab meie kogu. Seejärel kuvatakse väljale tema aadress. Klõpsake nuppu "OKEI".

  6. Pärast seda teostab rakendus arvutuse ja kuvab tulemuse lahtris, kus see asub. Meie konkreetsel juhul nägi valem välja selline:

    CONFIDENCE NORM(0,03;8;LOEND(B2:B13))

    Arvutuste üldtulemus oli 5,011609 .

  7. Kuid see pole veel kõik. Nagu mäletame, arvutatakse usaldusvahemiku piir, lisades ja lahutades arvutustulemuse valimi keskmisest USLALDA.NORM. Sel viisil arvutatakse usaldusvahemiku parem ja vasak piir. Valimi keskmist saab arvutada operaatori abil KESKMINE.

    See operaator on loodud valitud arvuvahemiku aritmeetilise keskmise arvutamiseks. Sellel on järgmine üsna lihtne süntaks:

    KESKMINE(arv1,arv2,…)

    Argument "number" võib olla kas üks arvväärtus või viide lahtritele või isegi tervetele vahemikele, mis neid sisaldavad.

    Seega valige lahter, milles kuvatakse keskmise väärtuse arvutamine, ja klõpsake nuppu "Sisesta funktsioon".

  8. Avaneb Funktsiooniviisard. Kategooria juurde tagasi minnes "Statistiline" ja valige loendist nimi "KESKMINE". Nagu alati, klõpsake nuppu "OKEI".
  9. Avaneb argumentide aken. Asetage kursor väljale "Number1" ja hoides hiire vasakut nuppu all, vali kogu väärtuste vahemik. Kui koordinaadid on väljal kuvatud, klõpsake nuppu "OKEI".
  10. Pärast seda KESKMINE kuvab arvutustulemuse leheelemendis.
  11. Arvutame usaldusvahemiku õige piiri. Selleks valige eraldi lahter ja pange märk «=» ja liita nende leheelementide sisud, milles funktsioonide arvutuste tulemused paiknevad KESKMINE Ja USLALDA.NORM. Arvutamiseks vajutage nuppu Sisenema. Meie puhul saime järgmise valemi:

    Arvutuse tulemus: 6,953276

  12. Samamoodi arvutame usaldusvahemiku vasakpoolse piiri, ainult seekord arvutuse tulemusest KESKMINE lahutage operaatori arvutuse tulemus USLALDA.NORM. Meie näite saadud valem on järgmist tüüpi:

    Arvutuse tulemus: -3,06994

  13. Püüdsime üksikasjalikult kirjeldada kõiki usaldusvahemiku arvutamise samme, seega kirjeldasime iga valemit üksikasjalikult. Kuid võite ühendada kõik toimingud ühes valemis. Usaldusvahemiku parempoolse piiri arvutamise saab kirjutada järgmiselt:

    KESKMINE(B2:B13)+KONFIDENTSIOON.NORM(0,03,8,LOEND(B2:B13))

  14. Sarnane arvutus vasakpoolse piiri jaoks näeks välja järgmine:

    KESKMINE(B2:B13)-KONFIDENTSIOON.NORM(0,03,8,LOEND(B2:B13))

2. meetod: funktsioon TRUST.STUDENT

Lisaks on Excelil veel üks funktsioon, mis on seotud usaldusvahemiku arvutamisega - UKSUSLIKE.TUDENG. See ilmus ainult Excel 2010-s. See operaator arvutab õpilaste jaotuse abil populatsiooni usaldusvahemiku. Seda on väga mugav kasutada, kui dispersioon ja vastavalt ka standardhälve on teadmata. Operaatori süntaks on:

CONFIDENCE.TUDENT(alfa,standard_off,suurus)

Nagu näha, jäid operaatorite nimed antud juhul muutumatuks.

Vaatame, kuidas arvutada tundmatu standardhälbega usaldusvahemiku piire sama üldkogumi näitel, mida käsitlesime eelmises meetodis. Võtame usalduse taseme nagu eelmisel korral 97%.

  1. Valige lahter, milles arvutus tehakse. Klõpsake nuppu "Sisesta funktsioon".
  2. Avatud Funktsiooniviisard mine kategooriasse "Statistiline". Valige nimi "USALDUSLIK TUDENG". Klõpsake nuppu "OKEI".
  3. Käivitatakse määratud operaatori argumentide aken.

    Põllul "Alfa", arvestades, et usaldusnivoo on 97%, paneme numbri kirja 0,03 . Teist korda me selle parameetri arvutamise põhimõtetel pikemalt ei peatu.

    Pärast seda asetage kursor väljale "Standardhälve". Seekordne näitaja on meile tundmatu ja vajab arvutamist. Seda tehakse spetsiaalse funktsiooni abil - STDEV.V. Selle operaatori akna avamiseks klõpsake valemiribast vasakul asuval kolmnurgal. Kui me avanevas loendis soovitud nime ei leia, minge üksuse juurde "Muud funktsioonid...".

  4. Käivitub Funktsiooniviisard. Liikumine kategooriasse "Statistiline" ja märkige sinna nimi "STDEV.V". Seejärel klõpsake nuppu "OKEI".
  5. Avaneb argumentide aken. Operaatori ülesanne STDEV.V on valimi standardhälbe määramine. Selle süntaks näeb välja selline:

    STANDARDHÕLVE.B(arv1;arv2;…)

    Ei ole raske ära arvata, et argument "number" on valikuelemendi aadress. Kui valik on paigutatud ühte massiivi, saate selle vahemiku linkimiseks kasutada ainult ühte argumenti.

    Asetage kursor väljale "Number1" ja nagu alati, hoides hiire vasakut nuppu all, vali kollektsioon. Kui koordinaadid on väljas, ärge kiirustage nuppu vajutama "OKEI", kuna tulemus on vale. Kõigepealt peame minema tagasi operaatori argumentide aknasse UKSUSLIKE.TUDENG et lisada viimane argument. Selleks klõpsake valemiribal vastavat nime.

  6. Juba tuttava funktsiooni argumendiaken avaneb uuesti. Asetage kursor väljale "Suurus". Operaatorite valiku juurde minemiseks klõpsake uuesti meile juba tuttaval kolmnurgal. Nagu aru saate, vajame nime "KONTROLLIMA". Kuna me kasutasime seda funktsiooni eelmise meetodi arvutustes, on see selles loendis olemas, nii et klõpsake lihtsalt sellel. Kui te seda ei leia, järgige esimeses meetodis kirjeldatud algoritmi.
  7. Kord argumentide aknas KONTROLLIMA, asetage kursor väljale "Number1" ja hoidke hiirenuppu all, valige kollektsioon. Seejärel klõpsake nuppu "OKEI".
  8. Pärast seda teostab programm arvutuse ja kuvab usaldusvahemiku väärtuse.
  9. Piiride määramiseks peame jällegi arvutama valimi keskmise. Kuid arvestades, et arvutusalgoritm kasutab valemit KESKMINE sama, mis eelmises meetodis ja isegi tulemus pole muutunud, me ei peatu sellel üksikasjalikult teist korda.
  10. Arvutustulemuste liitmine KESKMINE Ja UKSUSLIKE.TUDENG, saame usaldusvahemiku õige piiri.
  11. Operaatori arvutustulemustest lahutamine KESKMINE arvutustulemus UKSUSLIKE.TUDENG, meil on usaldusvahemiku vasakpoolne piir.
  12. Kui arvutus on kirjutatud ühes valemis, näeb meie puhul õige piiri arvutamine välja järgmine:

    KESKMINE(B2:B13)+KINDLUS.ÕPILAS(0,03,STDEV.B(B2:B13),LOEND(B2:B13))

  13. Sellest lähtuvalt näeb vasakpoolse piiri arvutamise valem välja järgmine:

    KESKMINE(B2:B13)-KINDLUS.ÕPILAS(0,03,STDEV.B(B2:B13),LOEND(B2:B13))

Nagu näete, muudavad Exceli tööriistad usaldusvahemiku ja selle piiride arvutamise palju lihtsamaks. Sel eesmärgil kasutatakse valimite jaoks, mille dispersioon on teada ja teadmata, eraldi operaatoreid.

Ja teised. Kõik need on nende teoreetiliste analoogide hinnangud, mida oleks võimalik saada, kui oleks olemas mitte valim, vaid üldkogum. Kuid paraku on elanikkond väga kallis ja sageli kättesaamatu.

Intervallhinnangu mõiste

Igal valimihinnangul on teatud levik, kuna on juhuslik suurus, mis sõltub konkreetse valimi väärtustest. Seetõttu peaks usaldusväärsemate statistiliste järelduste tegemiseks teadma mitte ainult punkthinnangut, vaid ka intervalli, mis suure tõenäosusega γ (gamma) katab hinnatud näitaja θ (teeta).

Formaalselt on need kaks sellist väärtust (statistika) T 1 (X) Ja T 2 (X), Mida T 1< T 2 , mille puhul antud tõenäosuse tasemel γ tingimus on täidetud:

Lühidalt, see on tõenäoline γ või rohkem on tegelik näitaja punktide vahel T 1 (X) Ja T 2 (X), mida nimetatakse alumiseks ja ülemiseks piiriks usaldusvahemik.

Usaldusvahemike konstrueerimise üheks tingimuseks on selle maksimaalne kitsus, s.o. see peaks olema võimalikult lühike. Soov on üsna loomulik, sest... uurija püüab soovitud parameetri asukohta täpsemalt lokaliseerida.

Sellest järeldub, et usaldusvahemik peab katma jaotuse maksimaalsed tõenäosused. ja hindamine ise peaks olema kesksel kohal.

See tähendab, et (tõelise näitaja hinnangust) kõrvalekaldumise tõenäosus ülespoole on võrdne allapoole kõrvalekaldumise tõenäosusega. Samuti tuleb märkida, et asümmeetriliste jaotuste korral ei võrdu parempoolne intervall vasakpoolse intervalliga.

Ülaltoodud joonis näitab selgelt, et mida suurem on usalduse tõenäosus, seda laiem on intervall – otsene seos.

See oli lühike sissejuhatus tundmatute parameetrite intervallide hindamise teooriasse. Liigume edasi matemaatilise ootuse usalduspiiride leidmise juurde.

Matemaatilise ootuse usaldusvahemik

Kui algandmed on jaotatud , on keskmine normaalväärtus. See tuleneb reeglist, et normaalväärtuste lineaarsel kombinatsioonil on ka normaaljaotus. Seetõttu võiksime tõenäosuste arvutamiseks kasutada normaaljaotuse seaduse matemaatilist aparaati.

Selleks on aga vaja teada kahte parameetrit – ootust ja dispersiooni, mis on tavaliselt teadmata. Parameetrite (aritmeetiline keskmine ja ) asemel võib muidugi kasutada hinnanguid, kuid siis ei ole keskmise jaotus päris normaalne, vaid veidi allapoole tasandatud. Selle fakti märkis kavalalt ära kodanik William Gosset Iirimaalt, avaldades oma avastuse ajakirja Biometrica 1908. aasta märtsinumbris. Saladuse hoidmise eesmärgil kirjutas Gosset endale üliõpilase alla. Nii tekkis Student t-jaotus.

Andmete normaaljaotus, mida K. Gauss kasutab astronoomiliste vaatluste vigade analüüsimisel, on aga maises elus äärmiselt haruldane ja seda on üsna raske kindlaks teha (näiteks kõrge täpsusega vaja on umbes 2 tuhat vaatlust). Seetõttu on kõige parem loobuda normaalsuse eeldusest ja kasutada meetodeid, mis ei sõltu algandmete jaotusest.

Tekib küsimus: milline on aritmeetilise keskmise jaotus, kui see arvutatakse tundmatu jaotuse andmetest? Vastuse annab tõenäosusteoorias hästi tuntud Keskpiiri teoreem(CPT). Matemaatikas on sellel mitu varianti (kogu pikkadeks aastateks sõnastused on viimistletud), kuid jämedalt öeldes taanduvad need kõik väitele, et suure hulga sõltumatute juhuslike suuruste summa järgib normaaljaotuse seadust.

Aritmeetilise keskmise arvutamisel kasutatakse juhuslike suuruste summat. Siit selgub, et aritmeetiline keskmine on normaaljaotusega, milles ootus on algandmete ootus ja dispersioon on .

Targad inimesed teavad, kuidas CLT-d tõestada, kuid me kontrollime seda Excelis tehtud katse abil. Simuleerime 50 ühtlaselt jaotatud juhusliku muutuja valimit (Exceli funktsiooni RANDBETWEEN abil). Seejärel teeme 1000 sellist valimit ja arvutame igaühe aritmeetilise keskmise. Vaatame nende levikut.

On näha, et keskmise jaotus on normaalseadusele lähedane. Kui valimi suurus ja arv veelgi suuremaks teha, on sarnasus veelgi parem.

Nüüd, kui oleme oma silmaga näinud CLT kehtivust, saame, kasutades , arvutada aritmeetilise keskmise usaldusvahemikud, mis katavad tegeliku keskmise või matemaatilise ootuse antud tõenäosusega.

Ülemise ja alumise piiri määramiseks peate teadma normaaljaotuse parameetreid. Reeglina neid pole, seega kasutatakse hinnanguid: aritmeetiline keskmine Ja valimi dispersioon. Kordan, see meetod annab hea ligikaudse hinnangu ainult suurte proovide puhul. Kui valimid on väikesed, on sageli soovitatav kasutada Studenti jaotust. Ära usu seda! Keskmise Studenti jaotus ilmneb ainult siis, kui algandmed on normaalselt jaotatud, st peaaegu mitte kunagi. Seetõttu on parem kohe seada nõutavate andmete hulga miinimumriba ja kasutada asümptootiliselt õigeid meetodeid. Nad ütlevad, et 30 vaatlusest piisab. Võtke 50 - te ei eksi.

T 1.2– usaldusvahemiku alumine ja ülemine piir

– valimi aritmeetiline keskmine

s 0– valimi standardhälve (erapooletu)

n - näidissuurus

γ – usalduse tõenäosus (tavaliselt 0,9, 0,95 või 0,99)

c γ = Φ -1 ((1+γ)/2)– standardse normaaljaotuse funktsiooni pöördväärtus. Lihtsamalt öeldes on see standardvigade arv aritmeetilisest keskmisest alumise või ülemise piirini (need kolm tõenäosust vastavad väärtustele 1,64, 1,96 ja 2,58).

Valemi olemus seisneb selles, et võetakse aritmeetiline keskmine ja siis jäetakse sellest teatud summa kõrvale ( γ-ga) standardvead ( s 0 /√n). Kõik on teada, võta ja arvesta.

Enne personaalarvutite laialdast kasutamist said nad normaaljaotuse funktsiooni väärtusi ja selle pöördväärtusi. Neid kasutatakse ka tänapäeval, kuid efektiivsem on kasutada Exceli valmis valemeid. Kõiki ülaltoodud valemi elemente ( , ja ) saab Excelis hõlpsasti arvutada. Kuid usaldusvahemiku arvutamiseks on valmis valem - USLALDA.NORM. Selle süntaks on järgmine.

CONFIDENCE.NORM(alfa;standard_väljas;suurus)

alfa– olulisuse tase ehk usaldusnivoo, mis ülaltoodud tähistuses võrdub 1- γ, s.o. tõenäosus, et matemaatilineootus jääb väljaspool usaldusvahemikku. Usaldustasemega 0,95 on alfa 0,05 jne.

standard_off– näidisandmete standardhälve. Standardviga pole vaja arvutada, Excel ise jagab n-i juurega.

suurus– valimi suurus (n).

Funktsiooni CONFIDENCE NORM tulemus on usaldusvahemiku arvutamise valemist teine ​​liige, s.o. poolintervall Vastavalt sellele on alumine ja ülemine punkt keskmine ± saadud väärtus.

Seega on võimalik konstrueerida aritmeetilise keskmise usaldusvahemike arvutamiseks universaalne algoritm, mis ei sõltu algandmete jaotusest. Universaalsuse hind on selle asümptootilisus, s.t. vajadus kasutada suhteliselt suuri proove. Samas ajastul kaasaegsed tehnoloogiad koguda vajalik kogus andmed ei ole tavaliselt keerulised.

Statistiliste hüpoteeside testimine usaldusvahemike abil

(moodul 111)

Üks peamisi statistikas lahendatavaid probleeme on. Selle olemus on lühidalt järgmine. Eeldatakse näiteks, et üldrahvastiku ootus võrdub mingi väärtusega. Seejärel konstrueeritakse valimi keskmiste jaotus, mida saab vaadelda antud ootuse korral. Järgmisena vaadeldakse, kus selles tinglikus jaotuses asub reaalne keskmine. Kui see ületab vastuvõetavaid piire, on sellise keskmise ilmumine väga ebatõenäoline ja kui katset korratakse üks kord, on see peaaegu võimatu, mis on vastuolus püstitatud hüpoteesiga, mis lükatakse edukalt tagasi. Kui keskmine ei ületa kriitilist piiri, siis hüpoteesi ei lükata (aga ka ei tõestata!).

Nii et usaldusintervallide abil, meie puhul ootuse jaoks, saate ka mõnda hüpoteese testida. Seda on väga lihtne teha. Oletame, et teatud valimi aritmeetiline keskmine on võrdne 100-ga. Kontrollitakse hüpoteesi, et eeldatav väärtus on näiteks 90. See tähendab, et kui esitame küsimuse primitiivselt, siis kõlab see järgmiselt: kas see võib olla tõene. kui keskmine väärtus võrdub 90-ga, osutus vaadeldud keskmine 100?

Sellele küsimusele vastamiseks vajate lisaks teavet keskmise kohta ruuthälve ja valimi suurus. Oletame, et standardhälve on 30 ja vaatluste arv on 64 (juure hõlpsaks eraldamiseks). Siis on keskmise standardviga 30/8 ehk 3,75. 95% usaldusvahemiku arvutamiseks peate keskmise (täpsemalt 1,96) mõlemale poolele lisama kaks standardviga. Usaldusvahemik see osutub ligikaudu 100 ± 7,5 või 92,5 kuni 107,5.

Edasine põhjendus on järgmine. Kui testitav väärtus jääb usaldusvahemikku, siis ei ole see hüpoteesiga vastuolus, sest jääb juhuslike kõikumiste piiridesse (tõenäosusega 95%). Kui kontrollitav punkt jääb väljapoole usaldusvahemikku, siis on sellise sündmuse tõenäosus väga väike, vähemalt väiksem lubatud tase. See tähendab, et hüpotees lükatakse tagasi, kuna see on vaadeldud andmetega vastuolus. Meie puhul on hüpotees oodatava väärtuse kohta väljaspool usaldusvahemikku (testitud väärtus 90 ei sisaldu intervallis 100±7,5), mistõttu tuleks see tagasi lükata. Ülaltoodud primitiivsele küsimusele vastates tuleks öelda: ei, see ei saa, igal juhul juhtub seda äärmiselt harva. Sageli viitavad need hüpoteesi eksliku tagasilükkamise konkreetsele tõenäosusele (p-tase), mitte aga kindlaksmääratud tasemele, mille alusel usaldusvahemik konstrueeriti, vaid sellest mõni teine ​​kord.

Nagu näete, ei ole keskmise (või matemaatilise ootuse) usaldusvahemiku konstrueerimine keeruline. Peaasi on olemusest aru saada ja siis läheb asi edasi. Praktikas kasutatakse enamikul juhtudel 95% usaldusvahemikku, mis on ligikaudu kahe standardvea laius mõlemal pool keskmist.

Praeguseks kõik. Kõike paremat!

Juhised

Pange tähele, et intervall(l1 või l2), mille keskne ala on hinnang l* ja milles tõenäoliselt sisaldub ka parameetri tegelik väärtus, on usaldusväärsus. intervall om või usaldustõenäosuse alfa vastav väärtus. Sel juhul viitab l* ise punkthinnangutele. Näiteks juhusliku väärtuse X (x1, x2,..., xn) mis tahes valimiväärtuste tulemuste põhjal on vaja arvutada indikaatori l tundmatu parameeter, millest jaotus sõltub. Sel juhul seisneb antud parameetri l* hinnangu saamine selles, et iga valimi jaoks on vaja määrata parameetri teatud väärtus, st luua indikaatori Q vaatlustulemuste funktsioon. , mille väärtus võetakse võrdseks parameetri l* hinnangulise väärtusega valemi kujul: l*=Q*(x1, x2,..., xn).

Pange tähele, et kõiki vaatlustulemustel põhinevaid funktsioone nimetatakse statistikaks. Veelgi enam, kui see kirjeldab vaadeldavat parameetrit (nähtust) täielikult, nimetatakse seda piisavaks statistikaks. Ja kuna vaatlustulemused on juhuslikud, on l* ka juhuslik suurus. Statistika arvutamise ülesanne tuleb täita, võttes arvesse selle kvaliteedi kriteeriume. Siin on vaja arvestada, et hinnangu jaotusseadus on üsna kindel, tõenäosustihedusjaotus W(x, l).

Saate arvutada usalduse intervallüsna lihtne, kui tead hindamiste jagamise seadust. Näiteks usaldusisik intervall hinnangud matemaatilise ootuse kohta ( keskmine suurus juhuslik väärtus) mx* =(1/n)*(x1+x2+ …+xn) . See hinnang on erapooletu, see tähendab, et indikaatori matemaatiline ootus ehk keskmine väärtus on võrdne parameetri tegeliku väärtusega (M(mx*) = mx).

Saate kindlaks teha, et matemaatilisel ootusel põhineva hinnangu dispersioon on: bx*^2=Dx/n. Piirikeskse teoreemi põhjal saame teha vastava järelduse, et selle hinnangu jaotusseadus on Gaussi (normaal). Seetõttu võite arvutuste tegemiseks kasutada indikaatorit Ф(z) - tõenäosuste integraali. Sel juhul valige usaldusväärsuse pikkus intervall ja 2ld, seega saad: alfa = P(mx-ld (kasutades tõenäosusintegraali omadust valemi järgi: Ф(-z)=1- Ф(z)).

Loo usaldus intervall matemaatilise ootuse hinnangud: - leidke valemi väärtus (alfa+1)/2; - valige tõenäosusintegraali tabelist väärtus, mis on võrdne väärtusega lд/sqrt(Dx/n); - arvutage tegelik dispersioon: Dx *=(1/n)*( (x1 - mx*)^2+(x2 - mx*)^2+…+(xn - mx*)^2); - määrake ld; - leidke usaldusväärsus intervall valemi järgi: (mx*-ld, mx*+ld).

Sageli peab hindaja analüüsima selle segmendi kinnisvaraturgu, kus hinnatav kinnisvara asub. Kui turg on arenenud, võib kogu esitatud objektide komplekti analüüsimine olla keeruline, seetõttu kasutatakse analüüsimiseks objektide valimit. See valim ei osutu alati homogeenseks, mõnikord on vaja see puhastada äärmuslikest punktidest - liiga kõrgetest või liiga madalatest turupakkumistest. Sel eesmärgil kasutatakse seda usaldusvahemik. Selle uuringu eesmärk on viia läbi kahe usaldusvahemiku arvutamise meetodi võrdlev analüüs ja valida parim variant arvutused estimatica.pro süsteemis erinevate valimitega töötamisel.

Usaldusvahemik on valimi põhjal arvutatud atribuutide väärtuste intervall, mis teadaoleva tõenäosusega sisaldab üldkogumi hinnangulist parameetrit.

Usaldusvahemiku arvutamise mõte on koostada selline intervall näidisandmete põhjal nii, et antud tõenäosusega saab väita, et hinnangulise parameetri väärtus on selles intervallis. Teisisõnu sisaldab usaldusvahemik teatud tõenäosusega hinnangulise väärtuse tundmatut väärtust. Mida laiem on intervall, seda suurem on ebatäpsus.

Usaldusvahemiku määramiseks on erinevaid meetodeid. Selles artiklis vaatleme kahte meetodit:

  • läbi mediaani ja standardhälbe;
  • läbi t-statistika kriitilise väärtuse (Studendi koefitsient).

Etapid võrdlev analüüs erinevatel viisidel CI arvutus:

1. moodustada andmeproov;

2. töötleme seda statistiliste meetoditega: arvutame keskmise väärtuse, mediaani, dispersiooni jne;

3. arvutada usaldusvahemik kahel viisil;

4. analüüsida puhastatud proove ja saadud usaldusvahemikke.

1. etapp. Andmete valim

Valim moodustati süsteemi estimatica.pro abil. Valimis oli 91 müügipakkumist 1 toalisi kortereid 3. hinnatsoonis “Hruštšovka” tüüpi paigutusega.

Tabel 1. Esialgne valim

Hind 1 ruutmeetrit, tk

Joonis 1. Esialgne proov



2. etapp. Algproovi töötlemine

Proovi töötlemine statistiliste meetodite abil nõuab järgmiste väärtuste arvutamist:

1. Aritmeetiline keskmine

2. Mediaan on valimit iseloomustav arv: täpselt pooled valimi elemendid on mediaanist suuremad, teised pooled on mediaanist väiksemad.

(paaritu arvu väärtustega proovi jaoks)

3. Vahemik - erinevus proovi maksimaalsete ja minimaalsete väärtuste vahel

4. Dispersioon – kasutatakse andmete varieerumise täpsemaks hindamiseks

5. Valimi standardhälve (edaspidi - SD) on kõige levinum näitaja, mis näitab korrigeerimisväärtuste hajumist aritmeetilise keskmise ümber.

6. Variatsioonikoefitsient – ​​peegeldab korrigeerimisväärtuste hajumise astet

7. võnkekoefitsient – ​​peegeldab valimi äärmuslike hinnaväärtuste suhtelist kõikumist keskmise ümber

Tabel 2. Algvalimi statistilised näitajad

Andmete homogeensust iseloomustav variatsioonikordaja on 12,29%, kuid võnketegur on liiga kõrge. Seega võime öelda, et algne valim ei ole homogeenne, seega jätkame usaldusvahemiku arvutamist.

3. etapp. Usaldusintervalli arvutamine

Meetod 1. Arvutamine mediaani ja standardhälbe abil.

Usaldusvahemik määratakse järgmiselt: minimaalne väärtus – mediaanist lahutatakse standardhälve; maksimaalne väärtus – mediaanile lisatakse standardhälve.

Seega usaldusvahemik (47179 CU; 60689 CU)

Riis. 2. Väärtused, mis jäävad usaldusvahemikku 1.



Meetod 2. Usaldusvahemiku konstrueerimine, kasutades t-statistika kriitilist väärtust (õpilaste koefitsient)

S.V. Gribovsky kirjeldab oma raamatus “Matemaatilisi meetodeid kinnisvara väärtuse hindamiseks” meetodit usaldusvahemiku arvutamiseks Studenti koefitsiendi kaudu. Selle meetodi abil arvutamisel peab hindaja ise määrama olulisuse taseme ∝, mis määrab tõenäosuse, millega usaldusvahemik konstrueeritakse. Tavaliselt kasutatakse olulisuse tasemeid 0,1; 0,05 ja 0,01. Need vastavad usalduse tõenäosusele 0,9; 0,95 ja 0,99. Selle meetodi puhul eeldatakse, et matemaatilise ootuse ja dispersiooni tegelikud väärtused on praktiliselt tundmatud (mis on praktiliste hinnanguülesannete lahendamisel peaaegu alati tõene).

Usaldusvahemiku valem:

n - valimi suurus;

t-statistika (Õpilaste jaotuse) kriitiline väärtus olulisuse tasemega ∝, vabadusastmete arv n-1, mis määratakse spetsiaalsetest statistilistest tabelitest või MS Exceli abil (→"Statistiline"→ TUDENG);

∝ - olulisuse tase, võta ∝=0,01.

Riis. 2. Väärtused, mis jäävad usaldusvahemikku 2.

4. etapp. Usaldusvahemiku arvutamise erinevate meetodite analüüs

Kaks usaldusintervalli arvutamise meetodit – läbi mediaani ja Studenti koefitsiendi – viisid selleni erinevad tähendused intervallidega. Vastavalt sellele saime kaks erinevat puhastatud proovi.

Tabel 3. Statistika kolme valimi kohta.

Indeks

Esialgne proov

1 variant

2. variant

Keskmine väärtus

Dispersioon

Coef. variatsioonid

Coef. võnkumisi

Vanade objektide arv, tk.

Tehtud arvutuste põhjal võime öelda, et saadud erinevaid meetodeid usaldusvahemike väärtused lõikuvad, nii et saate hindaja äranägemisel kasutada mis tahes arvutusmeetodeid.

Siiski usume, et süsteemis estimatica.pro töötades on soovitav valida usaldusvahemiku arvutamise meetod sõltuvalt turu arenguastmest:

  • kui turg on väljakujunemata, kasutage mediaani ja standardhälbega arvutusmeetodit, kuna kasutuselt kõrvaldatud objektide arv on sel juhul väike;
  • kui turg on arenenud, rakenda arvutust läbi t-statistika kriitilise väärtuse (Studendi koefitsient), kuna on võimalik moodustada suur algvalim.

Artikli ettevalmistamisel kasutati järgmist:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matemaatilised meetodid vara väärtuse hindamiseks. Moskva, 2014

2. Süsteemiandmed estimatica.pro

Usaldusintervallide hindamine

Õppeeesmärgid

Statistika arvestab järgmist kaks peamist ülesannet:

    Meil on näidisandmetel põhinev hinnang ja me tahame teha tõenäosusliku väite selle kohta, kus asub hinnangulise parameetri tegelik väärtus.

    Meil on konkreetne hüpotees, mida tuleb prooviandmete abil testida.

Selles teemas käsitleme esimest ülesannet. Tutvustame ka usaldusvahemiku määratlust.

Usaldusvahemik on intervall, mis on üles ehitatud parameetri hinnangulise väärtuse ümber ja näitab, kus asub hinnangulise parameetri tegelik väärtus a priori määratud tõenäosusega.

Pärast selle teema materjali uurimist:

    õppida, mis on usaldusvahemik;

    õppida klassifitseerima statistilisi probleeme;

    valdama usaldusvahemike konstrueerimise tehnikat, kasutades nii statistilisi valemeid kui ka tarkvaratööriistu;

    õppida määratlema nõutavad mõõtmed proovid saavutada teatud parameetrid statistiliste hinnangute täpsus.

Valimi tunnuste jaotused

T-jaotus

Nagu ülalpool jaotus käsitletud juhuslik muutuja standardiseeritud normaaljaotuse lähedane parameetritega 0 ja 1. Kuna me ei tea σ väärtust, asendame selle mingi s hinnanguga. Kogusel on juba erinev jaotus, nimelt või Õpilaste jaotus, mis määratakse parameetriga n -1 (vabadusastmete arv). See jaotus on lähedane normaaljaotusele (mida suurem n, seda lähemal on jaotused).

Joonisel fig. 95
esitatakse õpilaste jaotus 30 vabadusastmega. Nagu näete, on see normaaljaotusele väga lähedal.

Sarnaselt normaaljaotusega NORMIDIST ja NORMINV töötavatele funktsioonidele on olemas ka t-jaotusega töötamise funktsioonid - STUDIST (TDIST) ja STUDRASOBR (TINV). Nende funktsioonide kasutamise näide on näha failis STUDRASP.XLS (mall ja lahendus) ja joonisel fig. 96
.

Muude tunnuste jaotused

Nagu me juba teame, vajame matemaatilise ootuse hindamise täpsuse määramiseks t-jaotust. Teiste parameetrite, näiteks dispersiooni, hindamiseks on vaja erinevaid jaotusi. Kaks neist on F-jaotus ja x 2 -jaotus.

Keskmise usaldusvahemik

Usaldusvahemik- see on intervall, mis on üles ehitatud parameetri hinnangulise väärtuse ümber ja näitab, kus asub hinnangulise parameetri tegelik väärtus a priori määratud tõenäosusega.

Tekib keskmise väärtuse usaldusvahemiku konstrueerimine järgmisel viisil:

Näide

Kiirtoidurestoran plaanib oma sortimenti laiendada uut tüüpi võileivaga. Nõudluse hindamiseks selle järele plaanib juht valida juba proovinute hulgast juhuslikult 40 külastajat ja paluda neil hinnata oma suhtumist uude tootesse skaalal 1-10. Juht soovib hinnata eeldatavat punktide arv, mille toode saab. Uus toode ja koostage selle hinnangu jaoks 95% usaldusvahemik. Kuidas seda teha? (vt faili SANDWICH1.XLS (mall ja lahendus).

Lahendus

Selle probleemi lahendamiseks võite kasutada. Tulemused on esitatud joonisel fig. 97
.

Koguväärtuse usaldusvahemik

Mõnikord on näidisandmete abil vaja hinnata mitte matemaatilist ootust, vaid väärtuste kogusummat. Näiteks olukorras, kus on audiitor, võib huvi pakkuda mitte konto keskmise suuruse, vaid kõigi kontode summa hindamine.

Olgu N elementide koguarv, n valimi suurus, T 3 valimi väärtuste summa, T" summa hinnang kogu populatsiooni kohta, siis , ja usaldusvahemik arvutatakse valemiga , kus s on valimi standardhälbe hinnang ja valimi keskmise hinnang.

Näide

Oletame, et maksuamet soovib hinnata 10 000 maksumaksja kogumaksutagastust. Maksumaksja kas saab raha tagasi või maksab täiendavalt makse. Leidke tagasimakse summa 95% usaldusvahemik, eeldades, et valimi suurus on 500 inimest (vt faili AMOUNT OF REFUND.XLS (mall ja lahendus).

Lahendus

StatPro-l ei ole selleks puhuks spetsiaalset protseduuri, kuid võib märkida, et piirid saab ülaltoodud valemite põhjal keskmise jaoks saada piiridest (joon. 98
).

Proportsiooni usaldusvahemik

Olgu p klientide osakaalu matemaatiline ootus ja p b selle osakaalu hinnang, mis saadakse n suuruse valimi põhjal. Võib näidata, et piisavalt suur hindamise jaotus on matemaatilise ootuse p ja standardhälbe korral normaalsele lähedane . Hinnangu standardviga sisse sel juhul väljendatud kui , ja usaldusvahemik on nagu .

Näide

Kiirtoidurestoran plaanib oma sortimenti laiendada uut tüüpi võileivaga. Nõudluse hindamiseks valis juht juhuslikult 40 külastajat juba proovinute seast ja palus neil hinnata oma suhtumist uude tootesse skaalal 1-10. Juht soovib hinnata eeldatavat osakaalu kliendid, kes hindavad uut toodet vähemalt 6 punktiga (ta eeldab, et need kliendid on uue toote tarbijad).

Lahendus

Algselt loome uue veeru atribuudi 1 alusel, kui kliendi hinnang oli üle 6 punkti ja muul juhul 0 (vt faili SANDWICH2.XLS (mall ja lahendus).

1. meetod

Arvu 1 lugedes hindame osakaalu ja seejärel kasutame valemeid.

Zcr väärtus võetakse spetsiaalsetest normaaljaotuse tabelitest (näiteks 1,96 95% usaldusvahemiku korral).

Kasutades seda lähenemisviisi ja konkreetseid andmeid 95% intervalli koostamiseks, saame järgmised tulemused (joonis 99
). Parameetri zcr kriitiline väärtus on 1,96. Hinnangu standardviga on 0,077. Usaldusvahemiku alumine piir on 0,475. Usaldusvahemiku ülempiir on 0,775. Seega on juhil õigus 95% kindlusega uskuda, et klientide osakaal, kes hindab uut toodet 6 punkti või kõrgemalt, jääb vahemikku 47,5–77,5.

2. meetod

Selle probleemi saab lahendada standardsete StatPro tööriistade abil. Selleks piisab, kui märkida, et osakaal langeb sel juhul kokku veeru Tüüp keskmise väärtusega. Järgmisena kandideerime StatPro/Statistiline järeldus/Ühe proovi analüüs et koostada veeru Tüüp keskmise (matemaatilise ootuse hinnangu) usaldusvahemik. Sel juhul saadud tulemused on väga lähedased 1. meetodi tulemustele (joonis 99).

Standardhälbe usaldusvahemik

s kasutatakse standardhälbe hinnanguna (valem on toodud jaotises 1). Hinnangu s tihedusfunktsioon on hii-ruutfunktsioon, millel on sarnaselt t-jaotusele n-1 vabadusastet. Selle distributsiooniga CHIDIST ja CHIINV on töötamiseks spetsiaalsed funktsioonid.

Sel juhul ei ole usaldusvahemik enam sümmeetriline. Tingimuslik diagramm piirid on näidatud joonisel fig. 100 .

Näide

Masin peab tootma 10 cm läbimõõduga detaile, kuid erinevatel asjaoludel tuleb ette vigu. Kvaliteedikontrolör on mures kahe asjaolu pärast: esiteks peaks keskmine väärtus olema 10 cm; teiseks, isegi sel juhul, kui kõrvalekalded on suured, lükatakse paljud osad tagasi. Iga päev teeb ta 50 osast koosneva näidise (vt faili QUALITY CONTROL.XLS (mall ja lahendus). Milliseid järeldusi selline näidis annab?

Lahendus

Koostame 95% usaldusvahemikud keskmise ja standardhälbe jaoks kasutades StatPro/Statistiline järeldus/Ühe proovi analüüs(Joonis 101
).

Järgmisena arvutame läbimõõtude normaaljaotuse eeldust kasutades defektsete toodete osakaalu, seades maksimaalseks hälbeks 0,065. Kasutades asendustabeli (kahe parameetri juhtum) võimalusi, joonistame defektide osakaalu sõltuvuse keskmisest väärtusest ja standardhälbest (joon. 102
).

Kahe keskmise erinevuse usaldusvahemik

See on üks olulisemaid rakendusi statistilised meetodid. Näited olukordadest.

    Rõivapoe juhataja tahaks teada, kui palju keskmine naisklient poes rohkem või vähem kulutab kui keskmine meesklient.

    Need kaks lennufirmat lendavad sarnastel marsruutidel. Tarbijaorganisatsioon soovib võrrelda mõlema lennufirma keskmiste eeldatavate lendude hilinemise aegade erinevust.

    Ettevõte saadab teatud tüüpi kaupade kuponge ühes linnas, teises mitte. Juhid soovivad võrrelda nende toodete keskmisi ostumahte järgmise kahe kuu jooksul.

    Automüüja tegeleb esitlustel sageli abielupaaridega. Et mõista nende isiklikke reaktsioone esitlusele, intervjueeritakse paare sageli eraldi. Juht soovib hinnata meeste ja naiste antud hinnangute erinevust.

Sõltumatute proovide juhtum

Keskmiste erinevusel on t-jaotus n 1 + n 2 - 2 vabadusastmega. Usaldusvahemikku μ 1 - μ 2 jaoks väljendab seos:

Seda probleemi saab lahendada mitte ainult ülaltoodud valemite, vaid ka standardsete StatPro tööriistade abil. Selleks piisab, kui kasutada

Proportsioonide erinevuse usaldusvahemik

Laskma olla aktsiate matemaatiline ootus. Olgu nende valimi hinnangud, mis on koostatud vastavalt n 1 ja n 2 suurustest valimitest. Siis on erinevuse hinnang. Seetõttu väljendatakse selle erinevuse usaldusvahemikku järgmiselt:

Siin on z cr väärtus, mis saadakse spetsiaalsete tabelite abil normaaljaotusest (näiteks 1,96 95% usaldusvahemiku korral).

Hinnangu standardviga väljendatakse sel juhul seosega:

.

Näide

Suureks müügiks valmistuv pood võttis ette järgmised turundusuuringud. Valiti 300 parimad ostjad, mis omakorda jagunesid juhuslikult kaheks 150-liikmeliseks rühmaks. Kõigile valitud klientidele saadeti kutsed müügil osalemiseks, kuid ainult esimese grupi liikmed said kupongi, mis andis õiguse 5% allahindlusele. Müügi käigus fikseeriti kõigi 300 valitud ostja ostud. Kuidas saab juht tulemusi tõlgendada ja kupongide tõhususe kohta hinnanguid anda? (vt faili COUPONS.XLS (mall ja lahendus)).

Lahendus

Meie konkreetse juhtumi puhul sooritas 150 sooduskupongi saanud kliendist 55 soodusostu ja 150 kupongi mittesaanud kliendi hulgast sooritas ostu vaid 35 (joonis 103).
). Siis on proovi proportsioonide väärtused vastavalt 0,3667 ja 0,2333. Ja nende valimi erinevus on vastavalt 0,1333. 95% usaldusvahemikku eeldades leiame normaaljaotuse tabelist z cr = 1,96. Valimi erinevuse standardvea arvutus on 0,0524. Lõpuks leiame, et 95% usaldusvahemiku alumine piir on vastavalt 0,0307 ja ülempiir 0,2359. Saadud tulemusi võib tõlgendada nii, et iga 100 sooduskupongi saanud kliendi kohta on meil oodata 3 kuni 23 uut klienti. Peame aga meeles pidama, et see järeldus iseenesest ei tähenda kupongide kasutamise efektiivsust (kuna allahindlust tehes kaotame kasumit!). Näitame seda konkreetsete andmetega. Oletame, et keskmine ostusumma on 400 rubla, millest 50 rubla. poe jaoks on kasum. Siis on oodatav kasum 100 kliendilt, kes ei saanud kupongi:

50 0,2333 100 = 1166,50 hõõruda.

Sarnased arvutused 100 kupongi saanud kliendi kohta annavad:

30 0,3667 100 = 1100,10 hõõruda.

Keskmise kasumi vähenemine 30-le on seletatav asjaoluga, et soodustust kasutades sooritavad kupongi saanud kliendid keskmiselt 380 rubla eest ostu.

Seega näitab lõppjäreldus selliste kupongide kasutamise ebaefektiivsust selles konkreetses olukorras.

kommenteerida. Selle probleemi saab lahendada standardsete StatPro tööriistade abil. Selleks piisab, kui taandada see probleem kahe keskmise erinevuse hindamise probleemiks meetodi abil ja seejärel rakendada StatPro/Statistiline järeldus/Kahe proovi analüüs kahe keskmise väärtuse erinevuse usaldusvahemiku konstrueerimiseks.

Usaldusvahemiku pikkuse juhtimine

Usaldusvahemiku pikkus sõltub järgmisi tingimusi :

    andmed otse (standardhälve);

    olulisuse tase;

    näidissuurus.

Valimi suurus keskmise hindamiseks

Esiteks käsitleme probleemi üldiselt. Tähistame meile antud usaldusvahemiku poole pikkuse väärtuse B-ks (joon. 104
). Teame, et mõne juhusliku suuruse X keskmise väärtuse usaldusvahemik on väljendatud kujul , Kus . Uskudes:

ja väljendades n, saame .

Kahjuks ei tea me juhusliku suuruse X dispersiooni täpset väärtust. Lisaks ei tea me tcr väärtust, kuna see sõltub vabadusastmete arvust n-st. Sellises olukorras saame teha järgmist. Dispersiooni s asemel kasutame mingit dispersiooni hinnangut, mis põhineb uuritava juhusliku muutuja mis tahes saadaolevatel rakendustel. T cr väärtuse asemel kasutame normaaljaotuse jaoks z cr väärtust. See on täiesti vastuvõetav, kuna normaal- ja t-jaotuse jaotustiheduse funktsioonid on väga lähedased (välja arvatud väikese n puhul). Seega on nõutav valem järgmine:

.

Kuna valem annab üldiselt mittetäisarvulisi tulemusi, võetakse soovitud valimi suuruseks ümardamine tulemuse ülejäägiga.

Näide

Kiirtoidurestoran plaanib oma sortimenti laiendada uut tüüpi võileivaga. Nõudluse hindamiseks plaanib juht valida juba proovinute hulgast juhuslikult külastajate arvu ja paluda neil hinnata oma suhtumist uude tootesse skaalal 1-10. Juht soovib hinnata. eeldatav punktide arv, mille uus toode toote saab, ja koostage selle hinnangu jaoks 95% usaldusvahemik. Samas soovib ta, et usaldusvahemiku poollaius ei ületaks 0,3. Kui palju külastajaid ta küsitlemiseks vajab?

järgnevalt:

Siin r ots on proportsiooni p hinnang ja B on antud pool usaldusvahemiku pikkusest. Väärtuse abil saab saada n ülehinnangu r ots= 0,5. Sel juhul ei ületa usaldusvahemiku pikkus p ühegi tegeliku väärtuse jaoks määratud väärtust B.

Näide

Laske eelmise näite juhil hinnata uut tüüpi toodet eelistanud klientide osakaalu. Ta soovib konstrueerida 90% usaldusvahemiku, mille poole pikkus ei ületa 0,05. Mitu klienti peaks juhuslikku valimisse kaasama?

Lahendus

Meie puhul on z cr väärtus 1,645. Seetõttu arvutatakse vajalik kogus järgmiselt .

Kui juhil oleks põhjust arvata, et soovitud p-väärtus on näiteks ligikaudu 0,3, siis asendades selle väärtuse ülaltoodud valemiga, saaksime väiksema juhusliku valimi väärtuse, nimelt 228.

Määramise valem juhuslik valimi suurus kahe keskmise erinevuse korral kirjutatud kui:

.

Näide

Mõnel arvutifirmal on klienditeeninduskeskus. Viimasel ajal on suurenenud klientide kaebuste arv teenuse halva kvaliteedi kohta. IN teeninduskeskus Peamiselt on kahte tüüpi töötajaid: need, kes ei tööta suurepärane kogemus, kuid lõpetas eriala koolitused, ja kellel on laialdased praktilised kogemused, kuid nad ei ole läbinud erikursusi. Ettevõte soovib analüüsida viimase kuue kuu klientide kaebusi ja võrrelda kahe töötajate grupi keskmist kaebuste arvu. Eeldatakse, et mõlema rühma valimite numbrid on samad. Mitu töötajat peab valimisse kaasama, et saada 95% intervall, mille poole pikkus ei ületa 2?

Lahendus

Siin on σ ots mõlema juhusliku suuruse standardhälbe hinnang eeldusel, et need on lähedased. Seega peame oma ülesandes selle hinnangu kuidagi saama. Seda saab teha näiteks järgmiselt. Vaadates viimase kuue kuu klientide kaebuste andmeid, võib juht märgata, et iga töötaja saab üldjuhul 6–36 kaebust. Teades, et normaaljaotuse korral on peaaegu kõik väärtused kuni kolme standardhälbe kaugusel keskmisest, võib ta mõistlikult arvata, et:

, kust σ ots = 5.

Asendades selle väärtuse valemis, saame .

Määramise valem juhusliku valimi suurus proportsioonide erinevuse hindamisel on kujul:

Näide

Mõnel ettevõttel on kaks tehast, mis toodavad sarnaseid tooteid. Firmajuht soovib võrrelda defektsete toodete protsenti mõlemas tehases. Olemasoleva teabe kohaselt on defektide määr mõlemas tehases 3–5%. Selle eesmärk on konstrueerida 99% usaldusvahemik, mille poole pikkus ei ületa 0,005 (või 0,5%). Mitu toodet tuleb igast tehasest valida?

Lahendus

Siin on p 1ots ja p 2ots hinnangud kahe teadmata defektide osakaalu kohta 1. ja 2. tehases. Kui paneme p 1ots = p 2ots = 0,5, siis saame n jaoks ülehinnatud väärtuse. Aga kuna meil on nende aktsiate kohta a priori info olemas, siis võtame nende aktsiate ülemise hinnangu, nimelt 0,05. Saame

Valimiandmete põhjal mõne üldkogumi parameetri hindamisel on kasulik anda mitte ainult parameetri punkthinnang, vaid esitada ka usaldusvahemik, mis näitab, kus hinnatava parameetri täpne väärtus võib asuda.

Selles peatükis tutvusime ka kvantitatiivsete seostega, mis võimaldavad konstrueerida selliseid intervalle erinevate parameetrite jaoks; õppinud viise usaldusvahemiku pikkuse kontrollimiseks.

Pange tähele ka seda, et valimi suuruse hindamise probleemi (katse planeerimise probleemi) saab lahendada standardsete StatPro tööriistade abil, nimelt StatPro/statistiline järeldus/proovi suuruse valik.

Jaga