Standardowy przedział ufności. Przedział ufności do szacowania średniej (znana jest wariancja) w MS EXCEL

Każda próbka daje jedynie przybliżone wyobrażenie o ogólnej populacji, a wszystkie cechy statystyczne próbki (średnia, tryb, wariancja ...) są pewnym przybliżeniem lub powiedzmy oszacowaniem ogólnych parametrów, których w większości przypadków nie można obliczyć ze względu na niedostępność ogółu ludności (Wykres 20).

Rysunek 20. Błąd próbkowania

Ale możesz określić przedział, w którym z pewnym stopniem prawdopodobieństwa leży prawdziwa (ogólna) wartość cechy statystycznej. Ten interwał nazywa się D przedział ufności (CI).

Tak więc ogólna średnia z prawdopodobieństwem 95% mieści się w granicach

od do, (20)

Gdzie T - wartość tabelaryczna Kryterium Studenta dla α =0,05 i F= N-1

Można znaleźć i 99% CI, w tym przypadku T wybrany dla α =0,01.

Jakie jest praktyczne znaczenie przedziału ufności?

    Szeroki przedział ufności wskazuje, że średnia z próby nie odzwierciedla dokładnie średniej z populacji. Wynika to zwykle z niewystarczającej liczebności próby lub jej niejednorodności, tj. duża dyspersja. Oba dają duży błąd średniej i odpowiednio szerszy CI. I to jest powód, aby powrócić do etapu planowania badań.

    Górne i dolne granice CI oceniają, czy wyniki będą istotne klinicznie

Zastanówmy się bardziej szczegółowo nad kwestią statystycznego i klinicznego znaczenia wyników badania właściwości grupowych. Przypomnijmy, że zadaniem statystyki jest wykrycie przynajmniej niektórych różnic w populacjach ogólnych na podstawie danych z próby. Zadaniem klinicysty jest znalezienie takich (nie żadnych) różnic, które pomogą w postawieniu diagnozy lub leczeniu. I nie zawsze wnioski statystyczne są podstawą wniosków klinicznych. Statystycznie istotny spadek stężenia hemoglobiny o 3 g/l nie jest więc powodem do niepokoju. I odwrotnie, jeśli jakiś problem w organizmie człowieka nie ma charakteru masowego na poziomie całej populacji, nie jest to powód, aby nie zajmować się tym problemem.

Rozważymy tę pozycję w przykład.

Naukowcy zastanawiali się, czy chłopcy, którzy cierpieli na jakąś chorobę zakaźną, nie byli w tyle za swoimi rówieśnikami. W tym celu przeprowadzono wybiórcze badanie, w którym wzięło udział 10 chłopców z tą chorobą. Wyniki przedstawiono w tabeli 23.

Tabela 23. Wyniki statystyczne

dolna granica

Górna granica

Dane techniczne (cm)

środek

Z tych obliczeń wynika, że ​​selektywny średni wzrost 10-letnich chłopców, którzy przebyli jakąś chorobę zakaźną, jest zbliżony do normalnego (132,5 cm). Jednak dolna granica przedziału ufności (126,6 cm) wskazuje, że istnieje 95% prawdopodobieństwo, że prawdziwy średni wzrost tych dzieci odpowiada pojęciu „niskiego wzrostu”, tj. te dzieci są skarłowaciałe.

W tym przykładzie wyniki obliczeń przedziału ufności są istotne klinicznie.

Szacowanie przedziałów ufności

Cele kształcenia

Statystyki uwzględniają następujące kwestie dwa główne zadania:

    Mamy pewne oszacowanie oparte na przykładowych danych i chcemy sformułować probabilistyczne stwierdzenie, gdzie znajduje się prawdziwa wartość szacowanego parametru.

    Mamy konkretną hipotezę, którą należy przetestować na podstawie przykładowych danych.

W tym temacie rozważymy pierwszy problem. Wprowadzimy również definicję przedziału ufności.

Przedział ufności to przedział, który jest zbudowany wokół oszacowanej wartości parametru i pokazuje, gdzie leży prawdziwa wartość oszacowanego parametru z określonym z góry prawdopodobieństwem.

Po przestudiowaniu materiału na ten temat:

    dowiedzieć się, jaki jest przedział ufności oszacowania;

    nauczyć się klasyfikować problemy statystyczne;

    opanować technikę konstruowania przedziałów ufności, zarówno przy użyciu formuł statystycznych, jak i narzędzi programowych;

    nauczyć się określać wymagane wielkości próby, aby osiągnąć określone parametry dokładności szacunków statystycznych.

Rozkłady cech próbek

Rozkład T

Jak omówiono powyżej, rozkład zmiennej losowej jest zbliżony do standaryzowanego rozkładu normalnego z parametrami 0 i 1. Ponieważ nie znamy wartości σ, zastępujemy ją pewnym oszacowaniem s . Ilość ma już inny rozkład, a mianowicie lub Dystrybucja studencka, co określa parametr n -1 (liczba stopni swobody). Rozkład ten jest zbliżony do rozkładu normalnego (im większe n, tym bliższe rozkłady).

na ryc. 95
Przedstawiono rozkład Studenta z 30 stopniami swobody. Jak widać, jest on bardzo zbliżony do rozkładu normalnego.

Podobnie jak funkcje do pracy z rozkładem normalnym ROZKŁAD.NORMALNY i ROZKŁAD.NORMALNY.ODW istnieją funkcje do pracy z rozkładem t - ROZKŁAD.STUDENT (ROZKŁAD.T) i STUDRASPBR (ROZKŁAD.ODW). Przykład wykorzystania tych funkcji można znaleźć w pliku STUDRIST.XLS (szablon i rozwiązanie) oraz na rys. 96
.

Rozkłady innych cech

Jak już wiemy, aby określić dokładność oszacowania oczekiwań, potrzebujemy rozkładu t. Aby oszacować inne parametry, takie jak wariancja, wymagane są inne rozkłady. Dwa z nich to rozkład F i x 2 -dystrybucja.

Przedział ufności dla średniej

Przedział ufności jest przedziałem zbudowanym wokół oszacowanej wartości parametru i pokazuje, gdzie leży prawdziwa wartość oszacowanego parametru z określonym z góry prawdopodobieństwem.

Następuje konstrukcja przedziału ufności dla wartości średniej w następujący sposób:

Przykład

Restauracja typu fast food planuje poszerzyć swój asortyment o nowy rodzaj kanapki. Aby oszacować popyt na ten produkt, manager planuje wylosować 40 gości spośród tych, którzy już go wypróbowali i poprosić ich o ocenę stosunku do nowego produktu w skali od 1 do 10. Kierownik chce oszacować przewidywaną liczbę punktów, jaką otrzyma nowy produkt, i skonstruuj 95% przedział ufności dla tego oszacowania. Jak to zrobić? (patrz plik SANDWICH1.XLS (szablon i rozwiązanie).

Rozwiązanie

Aby rozwiązać ten problem, możesz użyć . Wyniki przedstawiono na ryc. 97
.

Przedział ufności dla wartości całkowitej

Czasami, zgodnie z przykładowymi danymi, wymagane jest oszacowanie nie matematycznego oczekiwania, ale całkowitej sumy wartości. Na przykład w sytuacji z audytorem interesujące może być oszacowanie nie średniej wartości faktury, ale sumy wszystkich faktur.

Niech N będzie całkowitą liczbą elementów, n będzie wielkością próby, T 3 będzie sumą wartości w próbie, T" będzie oszacowaniem sumy w całej populacji, a następnie , a przedział ufności oblicza się według wzoru , gdzie s jest oszacowaniem odchylenia standardowego dla próby, jest oszacowaniem średniej dla próby.

Przykład

Załóżmy, że urząd skarbowy chce oszacować łączną kwotę zwrotu podatku dla 10 000 podatników. Podatnik albo otrzymuje zwrot, albo płaci dodatkowe podatki. Znajdź 95% przedział ufności dla kwoty zwrotu, zakładając wielkość próby 500 osób (patrz plik KWOTA ZWROTU.XLS (szablon i rozwiązanie).

Rozwiązanie

W StatPro nie ma specjalnej procedury dla tego przypadku, jednak widać, że granice można uzyskać z granic dla średniej za pomocą powyższych wzorów (Rys. 98)
).

Przedział ufności dla proporcji

Niech p będzie oczekiwaną częścią klientów, a pv estymacją tego udziału uzyskaną z próby o wielkości n. Można wykazać, że dla wystarczająco dużych rozkład estymacji będzie zbliżony do normalnego ze średnią p i odchyleniem standardowym . Standardowy błąd oszacowania w tym przypadku jest wyrażony jako , a przedział ufności jako .

Przykład

Restauracja typu fast food planuje poszerzyć swój asortyment o nowy rodzaj kanapki. Aby oszacować popyt na produkt, manager wybrał losowo 40 gości spośród tych, którzy już go wypróbowali i poprosił ich o ocenę stosunku do nowego produktu w skali od 1 do 10. Kierownik chce oszacować oczekiwaną proporcję klientów, którzy oceniają nowy produkt na co najmniej 6 punktów (oczekuje, że ci klienci będą konsumentami nowego produktu).

Rozwiązanie

Wstępnie tworzymy nową kolumnę na podstawie 1 jeśli wynik klienta był większy niż 6 punktów i 0 w innym przypadku (patrz plik SANDWICH2.XLS (szablon i rozwiązanie).

Metoda 1

Licząc kwotę 1, szacujemy udział, a następnie korzystamy ze wzorów.

Wartość z cr jest pobierana ze specjalnych tabel rozkładu normalnego (na przykład 1,96 dla 95% przedziału ufności).

Korzystając z tego podejścia i konkretnych danych do skonstruowania przedziału 95%, otrzymujemy następujące wyniki (ryc. 99
). Krytyczna wartość parametru z cr wynosi 1,96. Błąd standardowy oszacowania wynosi 0,077. Dolna granica przedziału ufności wynosi 0,475. Górna granica przedziału ufności wynosi 0,775. W ten sposób menedżer może założyć z 95% pewnością, że odsetek klientów, którzy oceniają nowy produkt na 6 lub więcej punktów, wyniesie od 47,5 do 77,5.

Metoda 2

Ten problem można rozwiązać za pomocą standardowych narzędzi StatPro. W tym celu wystarczy zauważyć, że udział w tym przypadku pokrywa się ze średnią wartością kolumny Typ. Następnie zastosuj StatPro/Wnioskowanie statystyczne/Analiza jednej próby w celu zbudowania przedziału ufności dla wartości średniej (oszacowania oczekiwań) dla kolumny Typ. Wyniki uzyskane w tym przypadku będą bardzo zbliżone do wyniku pierwszej metody (ryc. 99).

Przedział ufności dla odchylenia standardowego

s służy jako oszacowanie odchylenia standardowego (wzór podano w sekcji 1). Funkcją gęstości oszacowania s jest funkcja chi-kwadrat, która podobnie jak rozkład t ma n-1 stopni swobody. Istnieją specjalne funkcje do pracy z tym rozkładem ROZKŁAD.CHI2 (ROZKŁAD.CHI) i ROZKŁ.CHI2ODWR.

Przedział ufności w tym przypadku nie będzie już symetryczny. Warunkowy schemat granic pokazano na ryc. 100 .

Przykład

Maszyna powinna produkować detale o średnicy 10 cm, jednak z różnych powodów występują błędy. Kontrolerowi jakości zależy na dwóch rzeczach: po pierwsze, średnia wartość powinna wynosić 10 cm; po drugie, nawet w tym przypadku, jeśli odchylenia są duże, wiele szczegółów zostanie odrzuconych. Codziennie wykonuje próbkę 50 części (patrz plik KONTROLA JAKOŚCI.XLS (szablon i rozwiązanie). Jakie wnioski może dać taka próbka?

Rozwiązanie

Konstruujemy 95% przedziały ufności dla średniej i odchylenia standardowego za pomocą StatPro/Wnioskowanie statystyczne/Analiza jednej próbki(Rys. 101
).

Ponadto, przy założeniu normalnego rozkładu średnic, obliczamy udział produktów wadliwych, ustalając maksymalne odchylenie 0,065. Wykorzystując możliwości tablicy przeglądowej (przypadek dwóch parametrów) konstruujemy zależność odsetka odrzutów od wartości średniej i odchylenia standardowego (ryc. 102)
).

Przedział ufności dla różnicy dwóch średnich

Jest to jedno z najważniejszych zastosowań metod statystycznych. Przykłady sytuacji.

    Kierownik sklepu odzieżowego chciałby wiedzieć, ile więcej lub mniej przeciętna klientka wydaje w sklepie niż mężczyzna.

    Obie linie latają na podobnych trasach. Organizacja konsumencka chciałaby porównać różnicę między średnim oczekiwanym czasem opóźnienia lotu dla obu linii lotniczych.

    Firma wysyła kupony na określone rodzaje towarów w jednym mieście i nie wysyła ich w innym. Menedżerowie chcą porównać średnie zakupy tych artykułów w ciągu najbliższych dwóch miesięcy.

    Dealer samochodowy często zajmuje się parami małżeńskimi podczas prezentacji. Aby zrozumieć ich osobiste reakcje na prezentację, pary często przeprowadzają osobne wywiady. Kierownik chce ocenić różnicę w ocenach wystawianych przez mężczyzn i kobiety.

Przypadek niezależnych próbek

Średnia różnica będzie miała rozkład t z n 1 + n 2 - 2 stopnie swobody. Przedział ufności dla μ 1 - μ 2 wyraża się stosunkiem:

Ten problem można rozwiązać nie tylko za pomocą powyższych wzorów, ale także za pomocą standardowych narzędzi StatPro. Aby to zrobić, wystarczy złożyć wniosek

Przedział ufności dla różnicy między proporcjami

Niech będzie matematyczną wartością oczekiwaną akcji. Niech będą ich przykładowymi oszacowaniami zbudowanymi na próbkach o wielkości odpowiednio n 1 i n 2 . Następnie jest oszacowanie różnicy. Dlatego przedział ufności dla tej różnicy jest wyrażony jako:

Tutaj z cr jest wartością uzyskaną z rozkładu normalnego ze specjalnych tabel (na przykład 1,96 dla 95% przedziału ufności).

Błąd standardowy oszacowania wyraża się w tym przypadku zależnością:

.

Przykład

Sklep przygotowując się do wielkiej wyprzedaży przeprowadził następujące badania marketingowe. Wybrano 300 najlepszych kupujących i losowo podzielono na dwie grupy po 150 członków każda. Do wszystkich wybranych kupujących wysłano zaproszenia do udziału w wyprzedaży, ale tylko dla członków pierwszej grupy dołączony był kupon uprawniający do 5% rabatu. Podczas wyprzedaży rejestrowano zakupy wszystkich 300 wybranych kupujących. W jaki sposób menedżer może zinterpretować wyniki i ocenić skuteczność kuponów? (Patrz plik COUPONS.XLS (szablon i rozwiązanie)).

Rozwiązanie

W naszym konkretnym przypadku na 150 klientów, którzy otrzymali kupon rabatowy, 55 dokonało zakupu na wyprzedaży, a spośród 150, którzy nie otrzymali kuponu, tylko 35 dokonało zakupu (ryc. 103).
). Wtedy wartości proporcji próbki wynoszą odpowiednio 0,3667 i 0,2333. A różnica próbek między nimi wynosi odpowiednio 0,1333. Zakładając przedział ufności 95%, z tabeli rozkładu normalnego znajdujemy z cr = 1,96. Obliczenie błędu standardowego różnicy próbek wynosi 0,0524. Ostatecznie otrzymujemy, że dolna granica 95% przedziału ufności wynosi odpowiednio 0,0307, ​​a górna granica to odpowiednio 0,2359. Uzyskane wyniki można interpretować w ten sposób, że na 100 klientów, którzy otrzymali kupon rabatowy, możemy spodziewać się od 3 do 23 nowych klientów. Należy jednak mieć na uwadze, że wniosek ten sam w sobie nie oznacza efektywności wykorzystania kuponów (bo udzielając rabatu tracimy na zyskach!). Pokażmy to na konkretnych danych. Załóżmy, że średnia kwota zakupu wynosi 400 rubli, z czego 50 rubli. jest zysk sklepu. Wtedy oczekiwany zysk na 100 klientów, którzy nie otrzymali kuponu, wynosi:

50 0,2333 100 \u003d 1166,50 rubli.

Podobne obliczenia dla 100 kupujących, którzy otrzymali kupon, dają:

30 0,3667 100 \u003d 1100,10 rubli.

Spadek średniego zysku do 30 wynika z faktu, że korzystając z rabatu kupujący, którzy otrzymali kupon, dokonają zakupu średnio za 380 rubli.

Końcowy wniosek wskazuje więc na nieefektywność wykorzystania takich kuponów w tej konkretnej sytuacji.

Komentarz. Ten problem można rozwiązać za pomocą standardowych narzędzi StatPro. W tym celu wystarczy sprowadzić ten problem do problemu oszacowania różnicy dwóch średnich metodą, a następnie zastosować StatPro/Wnioskowanie statystyczne/Analiza dwóch próbek zbudować przedział ufności dla różnicy między dwiema wartościami średnimi.

Kontrola przedziału ufności

Długość przedziału ufności zależy od następujące warunki:

    bezpośrednio dane (odchylenie standardowe);

    poziom istotności;

    wielkość próbki.

Wielkość próby do oszacowania średniej

Rozważmy najpierw problem w przypadku ogólnym. Oznaczmy wartość połowy długości podanego nam przedziału ufności jako B (ryc. 104
). Wiemy, że przedział ufności dla wartości średniej pewnej zmiennej losowej X wyraża się jako , Gdzie . Zarozumiały:

i wyrażając n , otrzymujemy .

Niestety nie znamy dokładnej wartości wariancji zmiennej losowej X. Ponadto nie znamy wartości t cr, ponieważ zależy ona od n poprzez liczbę stopni swobody. W tej sytuacji możemy wykonać następujące czynności. Zamiast wariancji s używamy pewnego oszacowania wariancji dla niektórych dostępnych realizacji badanej zmiennej losowej. Zamiast wartości t cr używamy wartości z cr dla rozkładu normalnego. Jest to całkiem do przyjęcia, ponieważ funkcje gęstości dla rozkładów normalnych i t są bardzo zbliżone (z wyjątkiem przypadku małego n). Zatem pożądana formuła przyjmuje postać:

.

Ponieważ formuła daje, ogólnie rzecz biorąc, wyniki niecałkowite, zaokrąglenie z nadmiarem wyniku przyjmuje się jako pożądaną wielkość próby.

Przykład

Restauracja typu fast food planuje poszerzyć swój asortyment o nowy rodzaj kanapki. Aby oszacować popyt na ten produkt, menedżer planuje wylosować liczbę odwiedzających spośród tych, którzy już go wypróbowali, i poprosić ich o ocenę stosunku do nowego produktu w skali od 1 do 10. Menedżer chce oszacować oczekiwaną liczbę punktów, jaką otrzyma nowy produkt. i wykreślić 95% przedział ufności tego oszacowania. Chce jednak, aby połowa szerokości przedziału ufności nie przekraczała 0,3. Ilu gości potrzebuje, aby przeprowadzić ankietę?

następująco:

Tutaj r ots jest oszacowaniem ułamka p, a B jest daną połową długości przedziału ufności. Zawyżoną wartość dla n można uzyskać za pomocą wartości r ots= 0,5. W tym przypadku długość przedziału ufności nie przekroczy podanej wartości B dla żadnej prawdziwej wartości p.

Przykład

Niech menedżer z poprzedniego przykładu zaplanuje oszacowanie odsetka klientów, którzy preferują nowy typ produktu. Chce skonstruować 90% przedział ufności, którego połowa długości jest mniejsza lub równa 0,05. Ilu klientów należy wylosować?

Rozwiązanie

W naszym przypadku wartość z cr = 1,645. Dlatego wymagana ilość jest obliczana jako .

Gdyby kierownik miał podstawy sądzić, że pożądana wartość p wynosi np. około 0,3, to podstawiając tę ​​wartość do powyższego wzoru, otrzymalibyśmy mniejszą wartość próby losowej, czyli 228.

Formuła do ustalenia losowe liczebności próby w przypadku różnicy między dwiema średnimi napisane jako:

.

Przykład

Niektóre firmy komputerowe mają centrum obsługi klienta. W ostatnim czasie wzrosła liczba skarg klientów na złą jakość obsługi. Centrum usług zatrudnia głównie dwa rodzaje pracowników: tych z niewielkim doświadczeniem, którzy ukończyli specjalne szkolenia, oraz tych z dużym doświadczeniem praktycznym, którzy nie ukończyli specjalnych kursów. Firma chce przeanalizować skargi klientów w ciągu ostatnich sześciu miesięcy i porównać ich średnią liczbę na każdą z dwóch grup pracowników. Zakłada się, że liczebności w próbach dla obu grup będą takie same. Ilu pracowników należy uwzględnić w próbie, aby uzyskać przedział 95% o długości połowy nie większej niż 2?

Rozwiązanie

Tutaj σ ots jest oszacowaniem odchylenia standardowego obu zmiennych losowych przy założeniu, że są one bliskie. Zatem w naszym zadaniu musimy w jakiś sposób uzyskać to oszacowanie. Można to zrobić na przykład w następujący sposób. Analizując dane dotyczące skarg klientów z ostatnich sześciu miesięcy, kierownik może zauważyć, że na jednego pracownika przypada zazwyczaj od 6 do 36 skarg. Wiedząc, że dla rozkładu normalnego praktycznie wszystkie wartości są nie większe niż trzy odchylenia standardowe od średniej, może rozsądnie sądzić, że:

, skąd σ ots = 5.

Podstawiając tę ​​wartość do wzoru, otrzymujemy .

Formuła do ustalenia wielkość próby losowej w przypadku szacowania różnicy między udziałami wygląda jak:

Przykład

Niektóre firmy mają dwie fabryki do produkcji podobnych produktów. Kierownik firmy chce porównać wskaźniki defektów w obu fabrykach. Według dostępnych informacji wskaźnik odrzutów w obu fabrykach wynosi od 3 do 5%. Ma on budować 99% przedział ufności o połowie długości nie większej niż 0,005 (lub 0,5%). Ile produktów należy wybrać z każdej fabryki?

Rozwiązanie

Tutaj p 1ot i p 2ot są szacunkami dwóch nieznanych frakcji odrzutów w 1. i 2. fabryce. Jeśli umieścimy p 1ots \u003d p 2ots \u003d 0,5, otrzymamy przeszacowaną wartość dla n. Ale ponieważ w naszym przypadku mamy pewne informacje a priori o tych udziałach, przyjmujemy górną ocenę tych udziałów, czyli 0,05. dostajemy

Gdy niektóre parametry populacji są szacowane na podstawie danych z próby, przydatne jest podanie nie tylko oszacowania punktowego parametru, ale także przedziału ufności, który pokazuje, gdzie może leżeć dokładna wartość szacowanego parametru.

W tym rozdziale zapoznaliśmy się również z zależnościami ilościowymi, które pozwalają nam budować takie przedziały dla różnych parametrów; poznali sposoby kontrolowania długości przedziału ufności.

Zauważmy również, że problem oszacowania wielkości próby (problem planowania eksperymentu) można rozwiązać za pomocą standardowych narzędzi StatPro, a mianowicie StatPro/Wnioskowanie statystyczne/Wybór wielkości próby.

Zbudujmy w programie MS EXCEL przedział ufności do oszacowania średniej wartości rozkładu w przypadku znanej wartości wariancji.

Oczywiście wybór poziom zaufania całkowicie zależy od wykonywanego zadania. Zatem stopień zaufania pasażera lotniczego do niezawodności samolotu powinien być oczywiście wyższy niż stopień zaufania kupującego do niezawodności żarówki.

Formułowanie zadań

Załóżmy, że od populacja biorąc próbka rozmiar r. Zakłada się, że odchylenie standardowe ten rozkład jest znany. Niezbędne na tej podstawie próbki ocenić nieznane średnia dystrybucji(μ, ) i skonstruuj odpowiedni dwustronny przedział ufności.

Szacowanie punktowe

Jak wiadomo z Statystyka(nazwijmy to X por) Jest nieobciążone oszacowanie średniej Ten populacja i ma rozkład N(μ;σ 2 /n).

Notatka: Co jeśli musisz zbudować przedział ufności w przypadku dystrybucji, które nie jest normalna? W tym przypadku przychodzi na ratunek, który mówi, że o wystarczająco dużym rozmiarze próbki n z dystrybucji nie- normalna, próbkowanie rozkład statystyk Х śr będzie około korespondować normalna dystrybucja o parametrach N(μ;σ 2 /n).

Więc, Punktowe oszacowanie środek wartości dystrybucji mamy jest próbka średnia, tj. X por. Teraz bądźmy zajęci przedział ufności.

Budowanie przedziału ufności

Zwykle znając rozkład i jego parametry możemy obliczyć prawdopodobieństwo, że zmienna losowa przyjmie wartość z zadanego przedziału. Teraz zróbmy coś przeciwnego: znajdź przedział, w którym zmienna losowa wypada z zadanym prawdopodobieństwem. Na przykład z właściwości normalna dystrybucja wiadomo, że z prawdopodobieństwem 95% zmienna losowa o rozkładzie normalne prawo, mieści się w przedziale około +/- 2 od Średnia wartość(patrz artykuł o). Ten interwał posłuży jako nasz prototyp przedział ufności.

Teraz zobaczmy, czy znamy rozkład , obliczyć ten odstęp? Aby odpowiedzieć na pytanie, musimy określić formę dystrybucji i jej parametry.

Wiemy, jaka jest forma dystrybucji normalna dystrybucja(pamiętaj, że mówimy o dystrybucja próbek Statystyka X por).

Parametr μ jest nam nieznany (wystarczy go oszacować za pomocą przedział ufności), ale mamy jego oszacowanie X por., obliczona na podstawie próbka, które można wykorzystać.

Drugi parametr to średnie odchylenie standardowe próbki będzie znany, jest równe σ/√n.

Ponieważ nie znamy μ, to zbudujemy przedział +/- 2 odchylenia standardowe nie z Średnia wartość, ale ze znanego oszacowania X por. Te. przy obliczaniu przedział ufności NIE będziemy tego zakładać X por mieści się w przedziale +/- 2 odchylenia standardowe od μ z prawdopodobieństwem 95% i przyjmiemy, że przedział wynosi +/- 2 odchylenia standardowe z X por z prawdopodobieństwem 95% pokryje μ - średnia dla populacji ogólnej, z którego próbka. Te dwa stwierdzenia są równoważne, ale drugie stwierdzenie pozwala nam konstruować przedział ufności.

Ponadto udoskonalamy przedział: zmienną losową o rozkładzie normalne prawo, z 95% prawdopodobieństwem mieści się w przedziale +/- 1,960 odchylenia standardowe, nie +/- 2 odchylenia standardowe. Można to obliczyć za pomocą wzoru \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. przykładowy plik Rozstaw arkuszy.

Teraz możemy sformułować twierdzenie probabilistyczne, które posłuży nam do sformułowania przedział ufności:
„Prawdopodobieństwo, że średnia populacji znajduje się od Średnia próbki w promieniu 1,960" odchylenia standardowe średniej próbki”, jest równe 95%.

Wartość prawdopodobieństwa wymieniona w zestawieniu ma specjalną nazwę , z którym jest powiązany poziomu istotności α (alfa) za pomocą prostego wyrażenia poziom zaufania =1 . W naszym przypadku poziom istotności α =1-0,95=0,05 .

Teraz, opierając się na tym stwierdzeniu probabilistycznym, piszemy wyrażenie do obliczania przedział ufności:

gdzie Zα/2 standard normalna dystrybucja(taka wartość zmiennej losowej z, Co P(z>=Za/2 )=α/2).

Notatka: Górny kwantyl α/2 określa szerokość przedział ufności V odchylenia standardowe próbka średnia. Górny kwantyl α/2 standard normalna dystrybucja jest zawsze większe od 0, co jest bardzo wygodne.

W naszym przypadku, przy α=0,05, górny kwantyl α/2 równa się 1,960. Dla pozostałych poziomów istotności α (10%; 1%) górny kwantyl α/2 Za/2 można obliczyć za pomocą wzoru \u003d NORM.ST.OBR (1-α / 2) lub, jeśli jest znany poziom zaufania, =NORM.ST.OBR((1+poziom ufności)/2).

Zazwyczaj podczas budowy przedziały ufności do oszacowania średniej tylko do użytku górna α/2-kwantyl i nie używać niższy α/2-kwantyl. Jest to możliwe, ponieważ standard normalna dystrybucja symetrycznie względem osi x ( gęstość jego dystrybucji symetryczny ok średnia, tj. 0). Dlatego nie ma potrzeby obliczania niższy kwantyl α/2(nazywa się to po prostu α /2-kwantyl), ponieważ jest równy górna α/2-kwantyl ze znakiem minusa.

Przypomnijmy, że niezależnie od kształtu rozkładu x, odpowiadająca mu zmienna losowa X por Rozpowszechniane około Cienki N(μ;σ 2 /n) (patrz artykuł o). Dlatego ogólnie powyższe wyrażenie dla przedział ufności jest tylko przybliżony. Jeśli x jest rozłożone normalne prawo N(μ;σ 2 /n), to wyrażenie dla przedział ufności Jest dokładna.

Obliczanie przedziału ufności w MS EXCEL

Rozwiążmy problem.
Czas odpowiedzi elementu elektronicznego na sygnał wejściowy jest ważną cechą urządzenia. Inżynier chce wykreślić przedział ufności dla średniego czasu odpowiedzi na poziomie ufności 95%. Z wcześniejszego doświadczenia inżynier wie, że odchylenie standardowe czasu odpowiedzi wynosi 8 ms. Wiadomo, że inżynier wykonał 25 pomiarów, aby oszacować czas odpowiedzi, średnia wartość wyniosła 78 ms.

Rozwiązanie: Inżynier chce poznać czas odpowiedzi urządzenia elektronicznego, ale rozumie, że czas odpowiedzi nie jest ustalony, ale jest zmienną losową, która ma swój własny rozkład. Więc najlepsze, na co może liczyć, to określenie parametrów i kształtu tego rozkładu.

Niestety ze stanu problemu nie znamy postaci rozkładu czasu odpowiedzi (nie musi być normalna). , ten rozkład jest również nieznany. Tylko on jest znany odchylenie standardoweσ=8. Dlatego, chociaż nie możemy obliczyć prawdopodobieństw i skonstruować przedział ufności.

Jednak chociaż nie znamy dystrybucji czas oddzielna odpowiedź, wiemy, że wg CPT, dystrybucja próbek średni czas odpowiedzi jest w przybliżeniu normalna(założymy, że warunki CPT są wykonywane, ponieważ rozmiar próbki wystarczająco duży (n=25)) .

Ponadto, przeciętny ten rozkład jest równy Średnia wartość rozkłady odpowiedzi jednostkowych, tj. μ. A odchylenie standardowe tego rozkładu (σ/√n) można obliczyć za pomocą wzoru =8/ROOT(25) .

Wiadomo też, że otrzymał inżynier Punktowe oszacowanie parametr μ równy 78 ms (X cf). Dlatego teraz możemy obliczyć prawdopodobieństwa, ponieważ znamy formę dystrybucji ( normalna) i jego parametry (Х ср i σ/√n).

Inżynier chce wiedzieć wartość oczekiwanaμ rozkładu czasu odpowiedzi. Jak stwierdzono powyżej, to μ jest równe oczekiwanie rozkładu próby średniego czasu odpowiedzi. Jeśli używamy normalna dystrybucja N(X cf; σ/√n), to pożądane μ będzie mieścić się w przedziale +/-2*σ/√n z prawdopodobieństwem około 95%.

Poziom istotności równa się 1-0,95=0,05.

Na koniec znajdź lewą i prawą granicę przedział ufności.
Lewa granica: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / PIERWIEŃ (25) = 74,864
Prawa granica: \u003d 78 + NORM ST OBR (1-0,05 / 2) * 8 / KORZEŃ (25) \u003d 81,136

Lewa granica: =ROZKŁAD.NORMALNY.ODWR(0,05/2; 78; 8/PIERW.PIERW.(25))
Prawa granica: =ROZKŁ.NORMALNY.ODWR(1-0,05/2; 78; 8/PIERW.PIERW.(25))

Odpowiedź: przedział ufności Na 95% poziom ufności i σ=8msek równa się 78+/-3,136ms

W przykładowy plik na arkuszu Sigma znany stworzył formularz do obliczeń i konstrukcji dwustronny przedział ufności za arbitralne próbki z zadanym σ i poziom istotności.

UFNOŚĆ.NORMALNA().

Jeśli wartości próbki są w zasięgu B20:B79 , A poziom istotności równe 0,05; następnie formuła MS EXCEL:
=ŚREDNIA(B20:B79)-UFNOŚĆ(0,05;σ;LICZ.(B20:B79))
zwróci lewe obramowanie przedział ufności.

Tę samą granicę można obliczyć za pomocą wzoru:
=ŚREDNIA(B20:B79)-ROZKŁAD.NORMALNY.ST.ODWR(1-0,05/2)*σ/PRÓB(LICZ.(B20:B79))

Notatka: Funkcja TRUST.NORM() pojawiła się w MS EXCEL 2010. Wcześniejsze wersje MS EXCEL używały funkcji TRUST().

„Katren-Style” nadal publikuje cykl Konstantina Kravchika na temat statystyki medycznej. W dwóch poprzednich artykułach autor poruszył kwestię wyjaśnienia takich pojęć jak i.

Konstanty Krawczyk

Matematyk-analityk. Specjalista w dziedzinie badań statystycznych w medycynie i naukach humanistycznych

Moskwa

Bardzo często w artykułach dotyczących badań klinicznych można znaleźć tajemnicze sformułowanie: „przedział ufności” (95% CI lub 95% CI – przedział ufności). Na przykład artykuł może brzmieć: „Test t-Studenta został użyty do oceny istotności różnic, z obliczonym 95% przedziałem ufności”.

Jaka jest wartość „95% przedziału ufności” i po co go obliczać?

Co to jest przedział ufności? - Jest to zakres, w którym mieszczą się prawdziwe średnie wartości w populacji. I co, są "nieprawdziwe" średnie? W pewnym sensie tak, mają. W wyjaśniliśmy, że nie da się zmierzyć interesującego nas parametru w całej populacji, więc badacze zadowalają się ograniczoną próbą. W tej próbie (na przykład według masy ciała) występuje jedna wartość średnia (określona waga), na podstawie której oceniamy wartość średnią w całej populacji ogólnej. Jest jednak mało prawdopodobne, aby średnia waga w próbie (zwłaszcza małej) pokrywała się ze średnią wagą w populacji ogólnej. Dlatego bardziej poprawne jest obliczenie i wykorzystanie zakresu średnich wartości populacji ogólnej.

Załóżmy na przykład, że 95% przedział ufności (95% CI) dla hemoglobiny wynosi od 110 do 122 g/l. Oznacza to, że z 95-procentowym prawdopodobieństwem prawdziwa średnia wartość hemoglobiny w populacji ogólnej będzie mieścić się w przedziale od 110 do 122 g/l. Innymi słowy, nie znamy średniej hemoglobiny w populacji ogólnej, ale możemy wskazać zakres wartości dla tej cechy z 95% prawdopodobieństwem.

Przedziały ufności są szczególnie istotne dla różnicy średnich między grupami lub tak zwanej wielkości efektu.

Załóżmy, że porównaliśmy skuteczność dwóch preparatów żelaza: tego, który jest na rynku od dłuższego czasu i tego, który właśnie został zarejestrowany. Po przebiegu terapii oceniono stężenie hemoglobiny w badanych grupach pacjentów, a program statystyczny wyliczył nam, że różnica między średnimi wartościami obu grup z prawdopodobieństwem 95% mieści się w przedziale od 1,72 do 14,36 g/l (Tabela 1).

Patka. 1. Kryterium dla prób niezależnych
(grupy są porównywane według poziomu hemoglobiny)

Należy to interpretować następująco: u części pacjentów z populacji ogólnej, którzy przyjmują nowy lek, stężenie hemoglobiny będzie wyższe średnio o 1,72–14,36 g/l niż u osób, które przyjmowały już znany lek.

Innymi słowy, w populacji ogólnej różnica średnich wartości hemoglobiny w grupach z 95% prawdopodobieństwem mieści się w tych granicach. O tym, czy to dużo, czy mało, zadecyduje badacz. Chodzi o to, że nie pracujemy z jedną wartością średnią, ale z zakresem wartości, dlatego bardziej wiarygodnie szacujemy różnicę parametru między grupami.

W pakietach statystycznych, według uznania badacza, można samodzielnie zawęzić lub rozszerzyć granice przedziału ufności. Obniżając prawdopodobieństwa przedziału ufności, zawężamy przedział średnich. Na przykład przy 90% CI zakres średnich (lub średnich różnic) będzie węższy niż przy 95% CI.

I odwrotnie, zwiększenie prawdopodobieństwa do 99% poszerza zakres wartości. Podczas porównywania grup dolna granica CI może przekraczać zero. Na przykład, gdybyśmy rozszerzyli granice przedziału ufności do 99 %, to granice przedziału wahałyby się od –1 do 16 g/L. Oznacza to, że w populacji ogólnej istnieją grupy, których różnica między średnimi dla badanej cechy wynosi 0 (M=0).

Przedziały ufności można wykorzystać do testowania hipotez statystycznych. Jeżeli przedział ufności przekracza wartość zero, to prawdziwa jest hipoteza zerowa, która zakłada, że ​​grupy nie różnią się badanym parametrem. Przykład opisano powyżej, kiedy rozszerzyliśmy granice do 99%. Gdzieś w populacji ogólnej znaleźliśmy grupy, które nie różniły się w żaden sposób.

95% przedział ufności różnicy w hemoglobinie, (g/l)


Rysunek przedstawia 95% przedział ufności średniej różnicy hemoglobiny między dwiema grupami jako linię. Linia przechodzi przez punkt zerowy, zatem występuje różnica między średnimi równa zeru, co potwierdza hipotezę zerową, że grupy nie różnią się. Różnica między grupami wynosi od -2 do 5 g/l, co oznacza, że ​​stężenie hemoglobiny może spaść o 2 g/l lub wzrosnąć o 5 g/l.

Przedział ufności jest bardzo ważnym wskaźnikiem. Dzięki niemu widać, czy różnice w grupach rzeczywiście wynikały z różnicy średnich, czy z dużej próby, bo przy dużej próbie szanse na znalezienie różnic są większe niż przy małej.

W praktyce może to wyglądać tak. Pobraliśmy próbkę 1000 osób, zmierzyliśmy poziom hemoglobiny i stwierdziliśmy, że przedział ufności dla różnicy średnich wynosi od 1,2 do 1,5 g/l. Poziom istotności statystycznej w tym przypadku p

Widzimy, że stężenie hemoglobiny wzrosło, ale prawie niezauważalnie, dlatego istotność statystyczna pojawiła się właśnie ze względu na wielkość próby.

Przedziały ufności można obliczyć nie tylko dla średnich, ale także dla proporcji (i współczynników ryzyka). Interesuje nas na przykład przedział ufności odsetka pacjentów, którzy uzyskali remisję podczas przyjmowania opracowanego leku. Przyjmijmy, że 95% CI dla proporcji, czyli dla odsetka takich pacjentów, mieści się w przedziale 0,60–0,80. Można więc powiedzieć, że nasz lek ma działanie terapeutyczne w 60 do 80% przypadków.

W statystyce istnieją dwa rodzaje oszacowań: punktowe i przedziałowe. Szacowanie punktowe to statystyka pojedynczej próbki, która jest używana do oszacowania parametru populacji. Na przykład średnia próbki jest estymatorem punktowym średniej populacji i wariancją próby S2- estymator punktowy wariancji populacji σ2. wykazano, że średnia z próby jest nieobciążonym oszacowaniem oczekiwań populacji. Średnia próbki jest nazywana nieobciążoną, ponieważ średnia wszystkich średnich próbek (przy tej samej wielkości próby N) jest równa matematycznym oczekiwaniom populacji ogólnej.

Aby uzyskać wariancję próbki S2 stał się nieobciążonym estymatorem wariancji populacji σ2, mianownik wariancji próby powinien być równy N – 1 , ale nie N. Innymi słowy, wariancja populacji jest średnią wszystkich możliwych wariancji próby.

Przy szacowaniu parametrów populacji należy mieć na uwadze, że przykładowe statystyki, takie jak np , zależą od konkretnych próbek. Aby wziąć ten fakt pod uwagę, aby uzyskać estymacja interwałowa matematyczne oczekiwania populacji ogólnej przeanalizować rozkład średnich z próby (więcej szczegółów, patrz). Skonstruowany przedział charakteryzuje się pewnym poziomem ufności, czyli prawdopodobieństwem, że prawdziwy parametr populacji generalnej jest oszacowany poprawnie. Podobne przedziały ufności można wykorzystać do oszacowania proporcji cechy R i główną rozproszoną masę populacji ogólnej.

Pobierz notatkę w formacie lub, przykłady w formacie

Konstrukcja przedziału ufności dla matematycznych oczekiwań populacji ogólnej ze znanym odchyleniem standardowym

Budowanie przedziału ufności dla odsetka cechy w populacji ogólnej

W tej sekcji pojęcie przedziału ufności zostało rozszerzone na dane kategoryczne. Pozwala to oszacować udział danej cechy w populacji ogólnej R z udziałem próbki RS= X/N. Jak wspomniano, jeśli wartości NR I N(1 - p) przekracza liczbę 5, rozkład dwumianowy można przybliżyć rozkładem normalnym. Dlatego, aby oszacować udział cechy w populacji ogólnej R możliwe jest skonstruowanie przedziału, którego poziom ufności jest równy (1 - α)x100%.


Gdzie PS- przykładowy udział cechy, równy X/N, tj. liczba sukcesów podzielona przez wielkość próby, R- udział cechy w populacji ogólnej, Z jest wartością krytyczną standaryzowanego rozkładu normalnego, N- wielkość próbki.

Przykład 3 Załóżmy, że z systemu informatycznego pobierana jest próbka składająca się ze 100 faktur zrealizowanych w ciągu ostatniego miesiąca. Załóżmy, że 10 z tych faktur jest nieprawidłowych. Zatem, R= 10/100 = 0,1. Poziom ufności 95% odpowiada wartości krytycznej Z = 1,96.

Zatem istnieje 95% szans, że od 4,12% do 15,88% faktur zawiera błędy.

Dla danej liczebności próby przedział ufności zawierający proporcję cechy w populacji ogólnej wydaje się być szerszy niż dla ciągłej zmiennej losowej. Dzieje się tak, ponieważ pomiary ciągłej zmiennej losowej zawierają więcej informacji niż pomiary danych kategorycznych. Innymi słowy, dane kategoryczne, które przyjmują tylko dwie wartości, zawierają niewystarczające informacje do oszacowania parametrów ich rozkładu.

Wobliczanie szacunków pochodzących ze skończonej populacji

Szacowanie oczekiwań matematycznych. Współczynnik korygujący dla populacji końcowej ( fpc) został użyty do zmniejszenia błędu standardowego o współczynnik . Podczas obliczania przedziałów ufności dla oszacowań parametrów populacji współczynnik korygujący jest stosowany w sytuacjach, gdy próbki są pobierane bez zwracania. Zatem przedział ufności dla oczekiwań matematycznych, o poziomie ufności równym (1 - α)x100%, oblicza się ze wzoru:

Przykład 4 Aby zilustrować zastosowanie współczynnika korygującego dla skończonej populacji, wróćmy do problemu obliczania przedziału ufności dla średniej kwoty faktur omówionej powyżej w Przykładzie 3. Załóżmy, że firma wystawia 5000 faktur miesięcznie i X=110,27 USD, S= 28,95 USD N = 5000, N = 100, α = 0,05, t99 = 1,9842. Zgodnie ze wzorem (6) otrzymujemy:

Oszacowanie udziału cechy. W przypadku wybrania braku powrotu przedział ufności dla części cechy, której poziom ufności jest równy (1 - α)x100%, oblicza się ze wzoru:

Przedziały ufności i kwestie etyczne

Podczas pobierania próbek populacji i formułowania wniosków statystycznych często pojawiają się problemy etyczne. Głównym z nich jest to, jak zgadzają się przedziały ufności i oszacowania punktowe statystyk próbek. Publikowanie szacunków punktowych bez określenia odpowiednich przedziałów ufności (zwykle na poziomie ufności 95%) i wielkości próby, z której zostały one wyprowadzone, może wprowadzać w błąd. Może to dać użytkownikowi wrażenie, że oszacowanie punktowe jest dokładnie tym, czego potrzebuje do przewidywania właściwości całej populacji. Dlatego konieczne jest zrozumienie, że w każdym badaniu na pierwszym miejscu należy umieścić szacunki nie punktowe, ale przedziałowe. Ponadto należy zwrócić szczególną uwagę na właściwy dobór wielkości próbek.

Najczęściej przedmiotem manipulacji statystycznych są wyniki badań socjologicznych ludności dotyczących różnych kwestii politycznych. Jednocześnie wyniki ankiety umieszczane są na pierwszych stronach gazet, a gdzieś pośrodku drukowany jest błąd próby i metodologia analizy statystycznej. Aby udowodnić słuszność uzyskanych oszacowań punktowych, należy wskazać liczebność próby, na podstawie której zostały one uzyskane, granice przedziału ufności oraz jego poziom istotności.

Następna uwaga

Wykorzystano materiały z książki Levin i wsp. Statystyki dla menedżerów. - M.: Williams, 2004. - s. 448–462

Centralne twierdzenie graniczne stwierdza, że ​​przy wystarczająco dużej liczebności próby rozkład średnich w próbie można przybliżyć rozkładem normalnym. Właściwość ta nie zależy od rodzaju rozmieszczenia populacji.