Standardni interval pouzdanosti. Interval pouzdanosti za procjenu srednje vrijednosti (varijansa je poznata) u MS EXCEL-u

Svaki uzorak daje samo približnu predstavu o općoj populaciji, a sve statističke karakteristike uzorka (srednja vrijednost, modus, varijansa...) su neka aproksimacija ili recimo procjena općih parametara, koji se u većini slučajeva ne mogu izračunati zbog nepristupačnost opšte populacije (Slika 20) .

Slika 20. Greška uzorkovanja

Ali možete odrediti interval u kojem, sa određenim stepenom vjerovatnoće, leži prava (opšta) vrijednost statističke karakteristike. Ovaj interval se zove d interval pouzdanosti (CI).

Dakle, opšti prosek sa verovatnoćom od 95% leži unutar

od do, (20)

Gdje t - tabelarna vrijednost Studentovog kriterija za α =0,05 i f= n-1

Može se naći i 99% CI, u ovom slučaju t izabran za α =0,01.

Koji je praktični značaj intervala povjerenja?

    Širok interval pouzdanosti ukazuje da srednja vrijednost uzorka ne odražava tačno srednju vrijednost populacije. To je obično zbog nedovoljne veličine uzorka, ili zbog njegove heterogenosti, tj. velika disperzija. Oba daju veliku grešku u srednjoj vrijednosti i, shodno tome, širi CI. I to je razlog da se vratimo na fazu planiranja istraživanja.

    Gornja i donja granica CI procjenjuju da li će rezultati biti klinički značajni

Zaustavimo se detaljnije na pitanju statističkog i kliničkog značaja rezultata proučavanja grupnih svojstava. Podsjetimo da je zadatak statistike da otkrije barem neke razlike u općim populacijama, na osnovu podataka iz uzorka. Zadatak kliničara je da pronađe takve (ne bilo kakve) razlike koje će pomoći u dijagnozi ili liječenju. I nisu uvijek statistički zaključci osnova za kliničke zaključke. Dakle, statistički značajno smanjenje hemoglobina za 3 g/l nije razlog za zabrinutost. I obrnuto, ako neki problem u ljudskom tijelu nema masovni karakter na nivou cjelokupne populacije, to nije razlog da se ne bavimo ovim problemom.

Razmotrićemo ovu poziciju u primjer.

Istraživači su se pitali da li dječaci koji su imali neku vrstu zarazne bolesti zaostaju za svojim vršnjacima u rastu. U tu svrhu je sprovedena selektivna studija u kojoj je učestvovalo 10 dječaka koji su imali ovu bolest. Rezultati su prikazani u tabeli 23.

Tabela 23. Statistički rezultati

donja granica

gornja granica

Specifikacije (cm)

srednji

Iz ovih proračuna proizilazi da je selektivna prosječna visina dječaka od 10 godina koji su imali neku vrstu zarazne bolesti blizu normalne (132,5 cm). Međutim, donja granica intervala pouzdanosti (126,6 cm) ukazuje da postoji 95% vjerovatnoće da prava prosječna visina ove djece odgovara konceptu „niskog rasta“, tj. ova djeca su zakržljala.

U ovom primjeru, rezultati izračunavanja intervala pouzdanosti su klinički značajni.

Procjena intervala povjerenja

Ciljevi učenja

Statistike razmatraju sljedeće dva glavna zadatka:

    Imamo neku procjenu zasnovanu na uzorku podataka i želimo da napravimo neku vjerojatnostnu izjavu o tome gdje je prava vrijednost parametra koji se procjenjuje.

    Imamo specifičnu hipotezu koju treba testirati na osnovu podataka uzorka.

U ovoj temi razmatramo prvi problem. Uvodimo i definiciju intervala povjerenja.

Interval pouzdanosti je interval koji se gradi oko procijenjene vrijednosti parametra i pokazuje gdje leži prava vrijednost procijenjenog parametra sa a priori datom vjerovatnoćom.

Nakon proučavanja materijala na ovu temu, vi:

    saznati koji je interval pouzdanosti procjene;

    naučiti klasificirati statističke probleme;

    ovladati tehnikom konstruisanja intervala poverenja, kako korišćenjem statističkih formula tako i korišćenjem softverskih alata;

    naučiti odrediti potrebne veličine uzorka za postizanje određenih parametara tačnosti statističkih procjena.

Raspodjela karakteristika uzorka

T-distribucija

Kao što je gore objašnjeno, raspodjela slučajne varijable je bliska standardiziranoj normalnoj raspodjeli sa parametrima 0 i 1. Pošto ne znamo vrijednost σ, zamjenjujemo je nekom procjenom s. Količina već ima drugačiju distribuciju, odnosno, ili Distribucija učenika, koji je određen parametrom n -1 (broj stepena slobode). Ova raspodjela je bliska normalnoj (što je n veće, distribucije su bliže).

Na sl. 95
Prikazana je Studentova distribucija sa 30 stepeni slobode. Kao što vidite, vrlo je blizu normalnoj distribuciji.

Slično funkcijama za rad sa normalnom distribucijom NORMDIST i NORMINV, postoje funkcije za rad sa t-distribucijom - STUDIST (TDIST) i STUDRASPBR (TINV). Primjer korištenja ovih funkcija može se naći u datoteci STUDRIST.XLS (šablon i rješenje) i na sl. 96
.

Raspodjela ostalih karakteristika

Kao što već znamo, da bismo odredili tačnost procjene očekivanja, potrebna nam je t-distribucija. Za procjenu drugih parametara, kao što je varijansa, potrebne su druge distribucije. Dvije od njih su F-distribucija i x 2 -distribucija.

Interval pouzdanosti za srednju vrijednost

Interval povjerenja je interval koji se gradi oko procijenjene vrijednosti parametra i pokazuje gdje leži prava vrijednost procijenjenog parametra sa a priori datom vjerovatnoćom.

Događa se konstrukcija intervala povjerenja za srednju vrijednost na sledeći način:

Primjer

Restoran brze hrane planira svoj asortiman proširiti novom vrstom sendviča. Kako bi procijenio potražnju za njim, menadžer planira nasumično odabrati 40 posjetitelja među onima koji su ga već isprobali i zamoliti ih da ocijene svoj stav prema novom proizvodu na skali od 1 do 10. Menadžer želi procijeniti očekivani broj bodova koje će novi proizvod dobiti i konstruirati interval pouzdanosti od 95% za ovu procjenu. Kako uraditi? (pogledajte datoteku SANDWICH1.XLS (šablon i rješenje).

Rješenje

Da biste riješili ovaj problem, možete koristiti . Rezultati su prikazani na sl. 97
.

Interval pouzdanosti za ukupnu vrijednost

Ponekad je, prema podacima uzorka, potrebno procijeniti ne matematičko očekivanje, već ukupan zbir vrijednosti. Na primjer, u situaciji sa revizorom, može biti od interesa procijeniti ne prosječnu vrijednost fakture, već zbir svih faktura.

Neka je N ukupan broj elemenata, n veličina uzorka, T 3 zbir vrijednosti u uzorku, T" procjena sume za cijelu populaciju, tada , a interval povjerenja se izračunava po formuli , gdje je s procjena standardne devijacije za uzorak, a procjena srednje vrijednosti za uzorak.

Primjer

Recimo da poreska uprava želi da procijeni iznos ukupnih povrata poreza za 10.000 poreskih obveznika. Poreski obveznik ili prima povrat ili plaća dodatne poreze. Pronađite interval pouzdanosti od 95% za iznos povrata, uz pretpostavku da je uzorak od 500 ljudi (pogledajte datoteku REFUND AMOUNT.XLS (šablon i rješenje).

Rješenje

Ne postoji posebna procedura u StatPro-u za ovaj slučaj, međutim, možete vidjeti da se granice mogu dobiti iz granica za srednju vrijednost korištenjem gornjih formula (Sl. 98
).

Interval pouzdanosti za proporciju

Neka je p očekivanje udjela kupaca, a pv procjena ovog udjela, dobijena iz uzorka veličine n. Može se pokazati da za dovoljno velike distribucija procjene će biti blizu normalne sa srednjim p i standardnom devijacijom . Standardna greška procjene u ovom slučaju se izražava kao , i interval povjerenja kao .

Primjer

Restoran brze hrane planira svoj asortiman proširiti novom vrstom sendviča. Kako bi procijenio potražnju za njim, menadžer je nasumično odabrao 40 posjetitelja među onima koji su ga već isprobali i zamolio ih da ocijene svoj stav prema novom proizvodu na skali od 1 do 10. Menadžer želi procijeniti očekivani udio kupaca koji novi proizvod ocijene najmanje sa 6 bodova (očekuje da će ti kupci biti potrošači novog proizvoda).

Rješenje

U početku kreiramo novu kolonu na osnovu 1 ako je rezultat klijenta veći od 6 bodova i 0 u suprotnom (pogledajte datoteku SANDWICH2.XLS (šablon i rješenje).

Metoda 1

Računajući iznos od 1, procjenjujemo udio, a zatim koristimo formule.

Vrijednost z cr je uzeta iz posebnih tablica normalne distribucije (na primjer, 1,96 za interval pouzdanosti od 95%).

Koristeći ovaj pristup i specifične podatke za konstruisanje intervala od 95% dobijamo sledeće rezultate (Sl. 99
). Kritična vrijednost parametra z cr je 1,96. Standardna greška procjene je 0,077. Donja granica intervala pouzdanosti je 0,475. Gornja granica intervala pouzdanosti je 0,775. Dakle, menadžer može sa sigurnošću od 95% pretpostaviti da će postotak kupaca koji novi proizvod ocijene 6 bodova ili više biti između 47,5 i 77,5.

Metoda 2

Ovaj problem se može riješiti korištenjem standardnih StatPro alata. Da bismo to učinili, dovoljno je napomenuti da se udio u ovom slučaju poklapa sa prosječnom vrijednošću kolone Tip. Sljedeća prijava StatPro/Statističko zaključivanje/Analiza jednog uzorka da se izgradi interval pouzdanosti za srednju vrijednost (procjena očekivanja) za kolonu Tip. Rezultati dobijeni u ovom slučaju bit će vrlo bliski rezultatu 1. metode (Sl. 99).

Interval pouzdanosti za standardnu ​​devijaciju

s se koristi kao procjena standardne devijacije (formula je data u odjeljku 1). Funkcija gustine procjene s je hi-kvadrat funkcija, koja, kao i t-distribucija, ima n-1 stupnjeva slobode. Postoje posebne funkcije za rad sa ovom distribucijom CHI2DIST (CHIDIST) i CHI2OBR (CHIINV) .

Interval pouzdanosti u ovom slučaju više neće biti simetričan. Uslovna šema granica prikazana je na sl. 100 .

Primjer

Mašina treba da proizvodi delove prečnika 10 cm, ali zbog različitih okolnosti dolazi do grešaka. Kontrolor kvaliteta brine o dvije stvari: prvo, prosječna vrijednost treba da bude 10 cm; drugo, čak i u ovom slučaju, ako su odstupanja velika, tada će mnogi detalji biti odbačeni. Svaki dan pravi uzorak od 50 delova (pogledajte fajl KVALITETA CONTROL.XLS (šablon i rešenje). Kakve zaključke može dati takav uzorak?

Rješenje

Konstruiramo 95% intervale povjerenja za srednju vrijednost i za standardnu ​​devijaciju koristeći StatPro/Statističko zaključivanje/ Analiza jednog uzorka(Sl. 101
).

Nadalje, koristeći pretpostavku normalne raspodjele prečnika, izračunavamo udio neispravnih proizvoda, postavljajući maksimalno odstupanje od 0,065. Koristeći mogućnosti tabele pretraživanja (slučaj dva parametra), konstruišemo zavisnost procenta odbijenih od srednje vrednosti i standardne devijacije (Sl. 102).
).

Interval povjerenja za razliku dvaju srednjih vrijednosti

Ovo je jedna od najvažnijih primjena statističkih metoda. Primjeri situacija.

    Menadžer prodavnice odeće želi da zna koliko više ili manje prosečna žena kupac troši u prodavnici od muškarca.

    Dvije avio kompanije lete na sličnim rutama. Organizacija potrošača želi da uporedi razliku između prosečnog očekivanog vremena kašnjenja leta za obe avio kompanije.

    Kompanija šalje kupone za određene vrste robe u jednom gradu, a ne šalje u drugom. Menadžeri žele da uporede prosečne kupovine ovih artikala u naredna dva meseca.

    Prodavac automobila često ima posla sa bračnim parovima na prezentacijama. Kako bi razumjeli njihove lične reakcije na prezentaciju, parovi se često intervjuišu odvojeno. Menadžer želi procijeniti razliku u ocjenama muškaraca i žena.

Slučaj nezavisnih uzoraka

Srednja razlika će imati t-distribuciju sa n 1 + n 2 - 2 stepena slobode. Interval pouzdanosti za μ 1 - μ 2 izražava se omjerom:

Ovaj problem se može riješiti ne samo gornjim formulama, već i standardnim StatPro alatima. Da biste to učinili, dovoljno je da se prijavite

Interval pouzdanosti za razliku između proporcija

Neka je matematičko očekivanje dionica. Neka su njihove procjene uzorka izgrađene na uzorcima veličine n 1 i n 2, respektivno. Zatim je procjena razlike. Stoga se interval povjerenja za ovu razliku izražava kao:

Ovdje je z cr vrijednost dobijena iz normalne distribucije posebnih tabela (na primjer, 1,96 za 95% interval pouzdanosti).

Standardna greška procjene je u ovom slučaju izražena relacijom:

.

Primjer

Radnja je, pripremajući se za veliku rasprodaju, poduzela sljedeće marketinško istraživanje. Odabrano je 300 najboljih kupaca i nasumično podijeljeno u dvije grupe od po 150 članova. Svim odabranim kupcima upućeni su pozivi za učešće u prodaji, ali je samo za članove prve grupe priložen kupon koji daje pravo na popust od 5%. Prilikom prodaje evidentirane su kupovine svih 300 odabranih kupaca. Kako menadžer može protumačiti rezultate i donijeti sud o djelotvornosti kuponiranja? (Pogledajte datoteku COUPONS.XLS (šablon i rješenje)).

Rješenje

U našem konkretnom slučaju, od 150 kupaca koji su dobili kupon za popust, 55 je kupilo na akciji, a od 150 koji nisu dobili kupon, samo 35 je kupilo (Sl. 103).
). Tada su vrijednosti proporcija uzorka 0,3667 i 0,2333, respektivno. A razlika uzorka između njih je jednaka 0,1333, respektivno. Uz pretpostavku intervala povjerenja od 95%, nalazimo iz tabele normalne distribucije z cr = 1,96. Izračunavanje standardne greške razlike uzorka je 0,0524. Konačno, dobijamo da je donja granica intervala pouzdanosti od 95% 0,0307, ​​a gornja granica 0,2359, respektivno. Dobijeni rezultati se mogu tumačiti na način da na svakih 100 kupaca koji su dobili kupon za popust možemo očekivati ​​od 3 do 23 nova kupca. Međutim, treba imati na umu da ovaj zaključak sam po sebi ne znači efikasnost korišćenja kupona (jer davanjem popusta gubimo na profitu!). Hajde da to pokažemo na konkretnim podacima. Pretpostavimo da je prosječni iznos kupovine 400 rubalja, od čega 50 rubalja. postoji profit prodavnice. Tada je očekivani profit na 100 kupaca koji nisu dobili kupon jednak:

50 0,2333 100 \u003d 1166,50 rubalja.

Slične kalkulacije za 100 kupaca koji su dobili kupon daju:

30 0,3667 100 \u003d 1100,10 rubalja.

Pad prosječne dobiti na 30 objašnjava se činjenicom da će, koristeći popust, kupci koji su dobili kupon u prosjeku kupovati za 380 rubalja.

Dakle, konačni zaključak ukazuje na neefikasnost korištenja takvih kupona u konkretnoj situaciji.

Komentar. Ovaj problem se može riješiti korištenjem standardnih StatPro alata. Da bismo to učinili, dovoljno je ovaj problem svesti na problem procjene razlike dva prosjeka metodom, a zatim primijeniti StatPro/Statističko zaključivanje/Analiza dva uzorka da se izgradi interval pouzdanosti za razliku između dvije srednje vrijednosti.

Kontrola intervala povjerenja

Dužina intervala pouzdanosti zavisi od sledećim uslovima:

    direktni podaci (standardna devijacija);

    nivo značajnosti;

    veličina uzorka.

Veličina uzorka za procjenu srednje vrijednosti

Razmotrimo prvo problem u opštem slučaju. Označimo vrijednost polovine dužine intervala povjerenja koji nam je dat kao B (Sl. 104
). Znamo da se interval pouzdanosti za srednju vrijednost neke slučajne varijable X izražava kao , Gdje . pod pretpostavkom:

i izražavajući n , dobijamo .

Nažalost, ne znamo tačnu vrijednost varijanse slučajne varijable X. Osim toga, ne znamo vrijednost t cr jer ovisi o n kroz broj stupnjeva slobode. U ovoj situaciji možemo učiniti sljedeće. Umjesto varijanse s, koristimo neku procjenu varijanse za neke dostupne realizacije slučajne varijable koja se proučava. Umjesto vrijednosti t cr, koristimo vrijednost z cr za normalnu distribuciju. Ovo je sasvim prihvatljivo, budući da su funkcije gustoće za normalnu i t-distribuciju vrlo bliske (osim za slučaj malog n). Dakle, željena formula ima oblik:

.

Budući da formula daje, općenito govoreći, necijelobrojne rezultate, zaokruživanje s viškom rezultata uzima se kao željena veličina uzorka.

Primjer

Restoran brze hrane planira svoj asortiman proširiti novom vrstom sendviča. Kako bi procijenio potražnju za njim, menadžer nasumično planira da odabere određeni broj posjetitelja među onima koji su ga već isprobali i zamoli ih da ocijene svoj stav prema novom proizvodu na skali od 1 do 10. Menadžer želi da se procijeni očekivani broj bodova koje će novi proizvod dobiti proizvod i nacrtati interval pouzdanosti od 95% te procjene. Međutim, on želi da polovina širine intervala pouzdanosti ne prelazi 0,3. Koliko mu je posjetitelja potrebno za anketiranje?

kao što slijedi:

Evo r ots je procjena razlomka p, a B je data polovina dužine intervala povjerenja. Naduvana vrijednost za n može se dobiti korištenjem vrijednosti r ots= 0,5. U ovom slučaju, dužina intervala pouzdanosti neće premašiti datu vrijednost B za bilo koju pravu vrijednost p.

Primjer

Neka menadžer iz prethodnog primjera planira procijeniti udio kupaca koji preferiraju novu vrstu proizvoda. On želi da konstruiše interval pouzdanosti od 90% čija je polovina dužine manja ili jednaka 0,05. Koliko klijenata treba nasumično uzorkovati?

Rješenje

U našem slučaju, vrijednost z cr = 1,645. Stoga se potrebna količina izračunava kao .

Ako bi menadžer imao razloga vjerovati da je željena vrijednost p, na primjer, oko 0,3, onda bi zamjenom ove vrijednosti u gornjoj formuli dobili manju vrijednost slučajnog uzorka, odnosno 228.

Formula za određivanje slučajne veličine uzorka u slučaju razlike između dva srednja vrijednost napisano kao:

.

Primjer

Neka kompjuterska kompanija ima centar za korisničku podršku. U posljednje vrijeme povećan je broj pritužbi kupaca na loš kvalitet usluge. U servisnom centru su uglavnom zaposlene dvije vrste radnika: oni sa malim iskustvom, ali koji su završili specijalne kurseve obuke i oni sa velikim praktičnim iskustvom, a koji nisu završili specijalne kurseve. Kompanija želi analizirati pritužbe kupaca u proteklih šest mjeseci i uporediti njihove prosječne brojke po svakoj od dvije grupe zaposlenih. Pretpostavlja se da će brojevi u uzorcima za obje grupe biti isti. Koliko zaposlenih mora biti uključeno u uzorak da bi se dobio interval od 95% sa polovičnom dužinom ne većom od 2?

Rješenje

Ovdje je σ ots procjena standardne devijacije obje slučajne varijable pod pretpostavkom da su bliske. Dakle, u našem zadatku moramo nekako dobiti ovu procjenu. To se može učiniti, na primjer, na sljedeći način. Gledajući podatke o žalbama kupaca u proteklih šest mjeseci, menadžer može primijetiti da generalno postoji između 6 i 36 pritužbi po zaposlenom. Znajući da za normalnu distribuciju gotovo sve vrijednosti nisu više od tri standardne devijacije od srednje vrijednosti, on može razumno vjerovati da:

, odakle je σ ots = 5.

Zamjenom ove vrijednosti u formulu dobijamo .

Formula za određivanje veličina slučajnog uzorka u slučaju procjene razlike između udjela izgleda kao:

Primjer

Neka kompanija ima dvije fabrike za proizvodnju sličnih proizvoda. Menadžer kompanije želi da uporedi stope kvarova u obe fabrike. Prema dostupnim informacijama, stopa odbijanja u obje fabrike je od 3 do 5%. Trebalo bi da izgradi interval pouzdanosti od 99% sa polovičnom dužinom ne većom od 0,005 (ili 0,5%). Koliko proizvoda treba izabrati iz svake fabrike?

Rješenje

Ovdje su p 1ot i p 2ot procjene dvije nepoznate frakcije otpada u 1. i 2. tvornici. Ako stavimo p 1ots = p 2ots = 0,5, tada ćemo dobiti precijenjenu vrijednost za n. Ali pošto u našem slučaju imamo neke apriorne informacije o ovim udjelima, uzimamo gornju procjenu ovih udjela, odnosno 0,05. Dobijamo

Kada se neki parametri populacije procjenjuju iz podataka uzorka, korisno je dati ne samo tačku procjenu parametra, već i interval pouzdanosti koji pokazuje gdje može ležati tačna vrijednost parametra koji se procjenjuje.

U ovom poglavlju upoznali smo se i sa kvantitativnim odnosima koji nam omogućavaju da gradimo takve intervale za različite parametre; naučili načine za kontrolu dužine intervala povjerenja.

Također napominjemo da se problem procjene veličine uzorka (problem planiranja eksperimenta) može riješiti korištenjem standardnih StatPro alata, tj. StatPro/Statistički zaključak/Odabir veličine uzorka.

Izgradimo interval pouzdanosti u MS EXCEL-u za procjenu srednje vrijednosti distribucije u slučaju poznate vrijednosti varijanse.

Naravno izbor nivo poverenja u potpunosti ovisi o zadatku koji se radi. Dakle, stepen poverenja putnika u pouzdanost aviona, naravno, treba da bude veći od stepena poverenja kupca u pouzdanost sijalice.

Formulacija zadatka

Pretpostavimo da od stanovništva uzimajući uzorak veličina n. Pretpostavlja se da standardna devijacija ova distribucija je poznata. Neophodan na osnovu ovoga uzorci proceniti nepoznato srednja distribucija(μ, ) i konstruisati odgovarajuće bilateralni interval povjerenja.

Point Estimation

Kao što je poznato iz statistika(nazovimo to X cf) je nepristrasna procjena srednje vrijednosti ovo stanovništva i ima distribuciju N(μ;σ 2 /n).

Bilješka: Šta ako treba da gradite interval povjerenja u slučaju distribucije, koja nije normalno? U ovom slučaju dolazi u pomoć, što govori da je s dovoljno velikom veličinom uzorci n iz distribucije ne- normalno, uzorkovanje distribucije statistike H avće otprilike dopisivati ​​se normalna distribucija sa parametrima N(μ;σ 2 /n).

dakle, tačka procene srednji vrijednosti distribucije imamo je srednja vrijednost uzorka, tj. X cf. A sada da se zaposlimo interval povjerenja.

Izgradnja intervala povjerenja

Obično, poznavajući distribuciju i njene parametre, možemo izračunati vjerovatnoću da će slučajna varijabla uzeti vrijednost iz datog intervala. Sada uradimo suprotno: pronađite interval u koji slučajna varijabla pada sa datom vjerovatnoćom. Na primjer, iz svojstava normalna distribucija poznato je da je sa vjerovatnoćom od 95% slučajna varijabla raspoređena po normalan zakon, pasti će unutar intervala približno +/- 2 od srednja vrijednost(vidi članak o). Ovaj interval će nam poslužiti kao prototip za interval povjerenja.

Sada da vidimo da li znamo distribuciju , izračunati ovaj interval? Da bismo odgovorili na pitanje, moramo navesti oblik distribucije i njegove parametre.

Znamo kakav je oblik distribucije normalna distribucija(zapamtite da govorimo o distribucija uzorkovanja statistika X cf).

Parametar μ nam je nepoznat (samo ga treba procijeniti pomoću interval povjerenja), ali imamo njegovu procjenu X cf, izračunato na osnovu uzorak, koji se mogu koristiti.

Drugi parametar je srednja standardna devijacija uzorka biće poznato, jednako je σ/√n.

Jer ne znamo μ, onda ćemo izgraditi interval +/- 2 standardne devijacije ne od srednja vrijednost, ali prema njegovoj poznatoj procjeni X cf. One. prilikom izračunavanja interval povjerenja to NEĆEMO pretpostaviti X cf pasti u interval +/- 2 standardne devijacije od μ sa vjerovatnoćom od 95%, a pretpostavićemo da je interval +/- 2 standardne devijacije od X cf sa vjerovatnoćom od 95% će pokriti μ - prosjek opšte populacije, iz koje uzorak. Ove dvije izjave su ekvivalentne, ali nam druga izjava omogućava konstruiranje interval povjerenja.

Osim toga, preciziramo interval: slučajna varijabla raspoređena po normalan zakon, sa vjerovatnoćom od 95% spada u interval +/- 1.960 standardne devijacije, ne +/- 2 standardne devijacije. Ovo se može izračunati pomoću formule \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. uzorak datoteke Razmak listova.

Sada možemo formulisati verovatnoćan iskaz koji će nam poslužiti za formiranje interval povjerenja:
„Verovatnoća da srednja populacija nalazi se od prosek uzorka unutar 1.960" standardne devijacije srednje vrijednosti uzorka", je jednako 95%.

Vrijednost vjerovatnoće spomenuta u izjavi ima poseban naziv , koji je povezan sa nivo značajnosti α (alfa) jednostavnim izrazom nivo poverenja =1 . U našem slučaju nivo značajnosti α =1-0,95=0,05 .

Sada, na osnovu ove vjerovatnoće, pišemo izraz za izračunavanje interval povjerenja:

gdje je Zα/2 standard normalna distribucija(takva vrijednost slučajne varijable z, Šta P(z>=Zα/2 )=α/2).

Bilješka: Gornji α/2-kvantil definiše širinu interval povjerenja V standardne devijacije srednja vrijednost uzorka. Gornji α/2-kvantil standard normalna distribucija je uvijek veći od 0, što je vrlo zgodno.

U našem slučaju, pri α=0,05, gornji α/2-kvantil jednako 1.960. Za druge nivoe značajnosti α (10%; 1%) gornji α/2-kvantil Zα/2 može se izračunati pomoću formule \u003d NORM.ST.OBR (1-α / 2) ili, ako je poznato nivo poverenja, =NORM.ST.OBR((1+nivo pouzdanosti)/2).

Obično prilikom izgradnje intervali povjerenja za procjenu srednje vrijednosti koristiti samo gornji α/2-kvantil i nemojte koristiti niži α/2-kvantil. Ovo je moguće jer standard normalna distribucija simetrično oko x-ose ( gustina njegove distribucije simetrično oko prosjek, tj. 0). Stoga nema potrebe za kalkulacijom niži α/2-kvantil(jednostavno se zove α /2-kvantil), jer jednako je gornji α/2-kvantil sa znakom minus.

Podsjetimo da je, bez obzira na oblik distribucije x, odgovarajuća slučajna varijabla X cf distribuirano otprilike U redu N(μ;σ 2 /n) (vidi članak o). Stoga, općenito, gornji izraz za interval povjerenja je samo približan. Ako je x distribuiran preko normalan zakon N(μ;σ 2 /n), zatim izraz za interval povjerenja je tačno.

Izračunavanje intervala pouzdanosti u MS EXCEL-u

Hajde da rešimo problem.
Vrijeme odziva elektronske komponente na ulazni signal je važna karakteristika uređaja. Inženjer želi da nacrta interval pouzdanosti za prosječno vrijeme odgovora na nivou pouzdanosti od 95%. Iz prethodnog iskustva, inženjer zna da je standardna devijacija vremena odziva 8 ms. Poznato je da je inženjer izvršio 25 mjerenja kako bi procijenio vrijeme odziva, prosječna vrijednost je bila 78 ms.

Rješenje: Inženjer želi znati vrijeme odziva elektronskog uređaja, ali razumije da vrijeme odziva nije fiksno, već slučajna varijabla koja ima svoju distribuciju. Dakle, najbolje čemu se može nadati je da odredi parametre i oblik ove distribucije.

Nažalost, iz uslova problema ne znamo oblik distribucije vremena odziva (ne mora biti normalno). , ova distribucija je također nepoznata. Samo on je poznat standardna devijacijaσ=8. Stoga, dok ne možemo izračunati vjerovatnoće i konstruirati interval povjerenja.

Međutim, iako ne znamo distribuciju vrijeme odvojen odgovor, znamo da prema CPT, distribucija uzorkovanja prosječno vrijeme odgovora je približno normalno(pretpostavićemo da su uslovi CPT se izvode, jer veličina uzorci dovoljno velika (n=25)) .

Štaviše, prosjek ova distribucija je jednaka srednja vrijednost distribucije odziva jedinica, tj. μ. A standardna devijacija ove distribucije (σ/√n) može se izračunati pomoću formule =8/ROOT(25) .

Takođe je poznato da je inženjer primio tačka procene parametar μ jednak 78 ms (X cf). Dakle, sada možemo izračunati vjerovatnoće, jer znamo oblik distribucije ( normalno) i njegove parametre (H sr i σ/√n).

Inženjer želi da zna očekivanu vrijednostμ distribucije vremena odziva. Kao što je gore navedeno, ovaj μ je jednak očekivanje distribucije uzorka prosječnog vremena odgovora. Ako koristimo normalna distribucija N(X cf; σ/√n), tada će željeni μ biti u opsegu +/-2*σ/√n sa vjerovatnoćom od približno 95%.

Nivo značaja jednako 1-0,95=0,05.

Konačno, pronađite lijevu i desnu granicu interval povjerenja.
Lijeva granica: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / ROOT (25) = 74,864
Desna granica: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / KORIJEN (25) = 81,136

Lijeva granica: =NORM.INV(0,05/2, 78, 8/SQRT(25))
Desna granica: =NORM.INV(1-0,05/2, 78, 8/SQRT(25))

Odgovori: interval povjerenja at 95% nivo pouzdanosti i σ=8msec jednaki 78+/-3.136ms

IN primjer fajla na listu Sigma poznat kreirao obrazac za proračun i konstrukciju bilateralni interval povjerenja za proizvoljno uzorci sa datim σ i nivo značajnosti.

CONFIDENCE.NORM() funkcija

Ako vrijednosti uzorci su u dometu B20:B79 , A nivo značajnosti jednako 0,05; zatim MS EXCEL formula:
=PROSJEČNO(B20:B79)-POVJERENJE(0,05,σ, BROJ(B20:B79))
će vratiti lijevu ivicu interval povjerenja.

Ista granica se može izračunati pomoću formule:
=PROSJEK(B20:B79)-NORM.ST.INV(1-0,05/2)*σ/SQRT(BROJ(B20:B79))

Bilješka: Funkcija TRUST.NORM() pojavila se u MS EXCEL-u 2010. Ranije verzije MS EXCEL-a koristile su funkciju TRUST().

„Katren-Style“ nastavlja da objavljuje ciklus Konstantina Kravčika o medicinskoj statistici. U dva prethodna članka, autor se dotaknuo objašnjenja pojmova kao i.

Konstantin Kravchik

Matematičar-analitičar. Specijalista u oblasti statističkih istraživanja u medicini i humanističkim naukama

Moskva grad

Vrlo često u člancima o kliničkim ispitivanjima možete pronaći misteriozni izraz: "interval pouzdanosti" (95% CI ili 95% CI - interval pouzdanosti). Na primjer, članak bi mogao reći: "Studentov t-test je korišten za procjenu značajnosti razlika, sa izračunatim intervalom pouzdanosti od 95%."

Koja je vrijednost "95% intervala pouzdanosti" i zašto je izračunati?

Šta je interval pouzdanosti? - Ovo je raspon u kojem padaju prave srednje vrijednosti u populaciji. I šta, postoje "neistiniti" proseci? U određenom smislu, da, imaju. Objasnili smo da je nemoguće izmjeriti parametar od interesa u cijeloj populaciji, pa se istraživači zadovoljavaju ograničenim uzorkom. U ovom uzorku (npr. po tjelesnoj težini) postoji jedna prosječna vrijednost (određena težina), po kojoj prosuđujemo prosječnu vrijednost u cjelokupnoj općoj populaciji. Međutim, malo je vjerovatno da će se prosječna težina u uzorku (posebno malom) poklapati sa prosječnom težinom u općoj populaciji. Stoga je ispravnije izračunati i koristiti raspon prosječnih vrijednosti opće populacije.

Na primjer, pretpostavimo da je interval pouzdanosti od 95% (95% CI) za hemoglobin između 110 i 122 g/L. To znači da će sa vjerovatnoćom od 95 % prava srednja vrijednost za hemoglobin u općoj populaciji biti u rasponu od 110 do 122 g/l. Drugim riječima, ne znamo prosječan hemoglobin u općoj populaciji, ali možemo naznačiti raspon vrijednosti za ovu osobinu sa 95% vjerovatnoće.

Intervali povjerenja su posebno relevantni za razliku u srednjim vrijednostima između grupa, ili ono što se zove veličina efekta.

Pretpostavimo da smo uporedili efikasnost dva preparata gvožđa: jednog koji je već duže vreme na tržištu i jednog koji je tek registrovan. Nakon završene terapije procijenjena je koncentracija hemoglobina u ispitivanim grupama pacijenata, a statistički program nam je izračunao da je razlika između prosječnih vrijednosti dvije grupe sa vjerovatnoćom od 95% u rasponu od 1,72 do 14,36 g/l (Tabela 1).

Tab. 1. Kriterij za nezavisne uzorke
(grupe se porede po nivou hemoglobina)

Ovo treba tumačiti na sljedeći način: kod dijela pacijenata u općoj populaciji koji uzimaju novi lijek, hemoglobin će u prosjeku biti viši za 1,72–14,36 g/l nego kod onih koji su uzimali već poznati lijek.

Drugim riječima, u općoj populaciji razlika u prosječnim vrijednostima hemoglobina u grupama sa vjerovatnoćom od 95% je unutar ovih granica. Na istraživaču će biti da proceni da li je to mnogo ili malo. Poenta svega je da ne radimo sa jednom prosječnom vrijednošću, već s rasponom vrijednosti, pa stoga pouzdanije procjenjujemo razliku u parametru između grupa.

U statističkim paketima, prema diskreciji istraživača, mogu se samostalno suziti ili proširiti granice intervala pouzdanosti. Smanjenjem vjerovatnoće intervala povjerenja, sužavamo raspon srednjih vrijednosti. Na primjer, pri 90% CI, raspon srednjih vrijednosti (ili srednjih razlika) će biti uži nego kod 95% CI.

Suprotno tome, povećanje vjerovatnoće na 99% proširuje raspon vrijednosti. Prilikom upoređivanja grupa, donja granica CI može preći nultu oznaku. Na primjer, ako smo proširili granice intervala povjerenja na 99 %, onda su granice intervala bile u rasponu od –1 do 16 g/L. To znači da u opštoj populaciji postoje grupe čija je razlika između prosjeka za proučavano svojstvo 0 (M=0).

Intervali pouzdanosti se mogu koristiti za testiranje statističkih hipoteza. Ako interval povjerenja prijeđe nultu vrijednost, tada je tačna nulta hipoteza, koja pretpostavlja da se grupe ne razlikuju po ispitivanom parametru. Gore je opisan primjer kada smo proširili granice na 99%. Negdje u opštoj populaciji našli smo grupe koje se ni po čemu nisu razlikovale.

95% interval pouzdanosti razlike u hemoglobinu, (g/l)


Slika prikazuje 95% interval pouzdanosti srednje razlike hemoglobina između dvije grupe kao linija. Linija prelazi nultu oznaku, stoga postoji razlika između srednjih vrijednosti jednakih nuli, što potvrđuje nultu hipotezu da se grupe ne razlikuju. Razlika između grupa kreće se od -2 do 5 g/l, što znači da se hemoglobin može ili smanjiti za 2 g/l ili povećati za 5 g/l.

Interval pouzdanosti je veoma važan indikator. Zahvaljujući njemu možete vidjeti da li su razlike u grupama zaista nastale zbog razlike u srednjim vrijednostima ili zbog velikog uzorka, jer su kod velikog uzorka šanse za pronalaženje razlika veće nego kod malog.

U praksi bi to moglo izgledati ovako. Uzeli smo uzorak od 1000 ljudi, izmjerili nivo hemoglobina i ustanovili da je interval pouzdanosti za razliku u srednjim vrijednostima od 1,2 do 1,5 g/L. Nivo statističke značajnosti u ovom slučaju str

Vidimo da je koncentracija hemoglobina porasla, ali gotovo neprimjetno, pa se statistička značajnost pojavila upravo zbog veličine uzorka.

Intervali povjerenja mogu se izračunati ne samo za prosjeke, već i za proporcije (i omjere rizika). Na primjer, zanima nas interval povjerenja proporcija pacijenata koji su postigli remisiju uzimajući razvijeni lijek. Pretpostavimo da je CI od 95% za proporcije, odnosno za udio takvih pacijenata, u rasponu od 0,60-0,80. Dakle, možemo reći da naš lijek ima terapeutski učinak u 60 do 80% slučajeva.

U statistici postoje dvije vrste procjena: tačka i interval. Point Estimation je statistika jednog uzorka koja se koristi za procjenu parametra populacije. Na primjer, srednja vrijednost uzorka je tačkasta procjena srednje vrijednosti populacije i varijanse uzorka S2- bodovna procjena varijanse populacije σ2. pokazalo se da je srednja vrijednost uzorka nepristrasna procjena očekivanja populacije. Srednja vrijednost uzorka naziva se nepristrasna jer je srednja vrijednost svih srednjih vrijednosti uzorka (sa istom veličinom uzorka n) jednak je matematičkom očekivanju opće populacije.

U cilju varijanse uzorka S2 postao nepristrasan procjenitelj varijanse stanovništva σ2, nazivnik varijanse uzorka treba postaviti jednakim n – 1 , ali ne n. Drugim riječima, varijansa populacije je prosjek svih mogućih varijansi uzorka.

Prilikom procjene parametara populacije, treba imati na umu da statistika uzorka kao npr , ovise o konkretnim uzorcima. Uzeti ovu činjenicu u obzir, dobiti intervalna procjena matematička očekivanja opće populacije analiziraju distribuciju srednjih vrijednosti uzorka (za više detalja vidjeti). Konstruisani interval karakteriše određeni nivo pouzdanosti, a to je verovatnoća da je pravi parametar opšte populacije tačno procenjen. Slični intervali pouzdanosti mogu se koristiti za procjenu udjela neke karakteristike R i glavna rasprostranjena masa opšte populacije.

Preuzmite bilješku u formatu ili, primjere u formatu

Izgradnja intervala povjerenja za matematičko očekivanje opće populacije s poznatom standardnom devijacijom

Izgradnja intervala povjerenja za udio osobine u općoj populaciji

U ovom odeljku, koncept intervala poverenja je proširen na kategoričke podatke. Ovo vam omogućava da procijenite udio ove osobine u općoj populaciji R sa udjelom uzorka RS= X/n. Kao što je spomenuto, ako vrijednosti nR I n(1 - str) prelazi broj 5, binomna distribucija se može aproksimirati normalnom. Stoga, procijeniti udio neke osobine u opštoj populaciji R moguće je konstruisati interval čiji je nivo pouzdanosti jednak (1 - α)x100%.


Gdje strS- udio uzorka obilježja, jednak X/n, tj. broj uspjeha podijeljen s veličinom uzorka, R- udio osobine u opštoj populaciji, Z je kritična vrijednost standardizirane normalne distribucije, n- veličina uzorka.

Primjer 3 Pretpostavimo da je iz informacionog sistema izvučen uzorak koji se sastoji od 100 faktura popunjenih tokom prošlog mjeseca. Recimo da je 10 od ovih faktura netačno. dakle, R= 10/100 = 0,1. Nivo pouzdanosti od 95% odgovara kritičnoj vrijednosti Z = 1,96.

Dakle, postoji 95% šanse da između 4,12% i 15,88% faktura sadrži greške.

Za datu veličinu uzorka, čini se da je interval pouzdanosti koji sadrži udio osobine u općoj populaciji širi nego za kontinuiranu slučajnu varijablu. To je zato što mjerenja kontinuirane slučajne varijable sadrže više informacija nego mjerenja kategoričkih podataka. Drugim riječima, kategorički podaci koji uzimaju samo dvije vrijednosti ne sadrže dovoljno informacija za procjenu parametara njihove distribucije.

INizračunavanje procjena izvučenih iz konačne populacije

Procjena matematičkog očekivanja. Korekcioni faktor za konačnu populaciju ( fpc) je korišten za smanjenje standardne greške za faktor . Prilikom izračunavanja intervala pouzdanosti za procjene parametara populacije, faktor korekcije se primjenjuje u situacijama kada se uzorci uzimaju bez zamjene. Dakle, interval pouzdanosti za matematičko očekivanje, koji ima nivo pouzdanosti jednak (1 - α)x100%, izračunava se po formuli:

Primjer 4 Da bismo ilustrovali primenu faktora korekcije za konačnu populaciju, vratimo se problemu izračunavanja intervala poverenja za prosečni iznos faktura o kome se govori u primeru 3. Pretpostavimo da preduzeće izdaje 5.000 faktura mesečno, i =110,27 USD, S= 28,95 dolara N = 5000, n = 100, α = 0,05, t99 = 1,9842. Prema formuli (6) dobijamo:

Procjena udjela karakteristike. Prilikom odabira bez povrata, interval pouzdanosti za udio obilježja koji ima nivo pouzdanosti jednak (1 - α)x100%, izračunava se po formuli:

Intervali povjerenja i etička pitanja

Prilikom uzorkovanja populacije i formulisanja statističkih zaključaka, često se javljaju etički problemi. Glavni je način na koji se slažu intervali povjerenja i procjene tačaka statistike uzorka. Procjene tačaka objavljivanja bez specificiranja odgovarajućih intervala pouzdanosti (obično na 95% nivoa pouzdanosti) i veličine uzorka iz kojeg su izvedene mogu dovesti u zabludu. Ovo može dati korisniku utisak da je bodovna procjena upravo ono što mu je potrebno da predvidi svojstva cjelokupne populacije. Stoga je potrebno shvatiti da u svakom istraživanju u prvi plan treba staviti ne tačke, već intervalne procjene. Osim toga, posebnu pažnju treba posvetiti pravilnom izboru veličina uzoraka.

Predmet statističkih manipulacija najčešće su rezultati socioloških istraživanja stanovništva o različitim političkim temama. Istovremeno, rezultati ankete se stavljaju na naslovne strane novina, a greška uzorka i metodologija statističke analize štampaju se negde na sredini. Da bi se dokazala validnost dobijenih tačaka, potrebno je navesti veličinu uzorka na osnovu koje su dobijene, granice intervala poverenja i nivo njegove značajnosti.

Sledeća napomena

Korišteni su materijali iz knjige Levin i dr. Statistika za menadžere. - M.: Williams, 2004. - str. 448–462

Centralna granična teorema navodi da, s obzirom na dovoljno veliku veličinu uzorka, distribucija uzorka srednjih vrijednosti može se aproksimirati normalnom distribucijom. Ovo svojstvo ne zavisi od vrste distribucije stanovništva.