Charakterystyki numeryczne zmiennych losowych

Wśród liczbowych charakterystyk zmiennych losowych należy przede wszystkim zwrócić uwagę na te, które charakteryzują położenie zmiennej losowej na osi liczbowej, tj. wskazać jakąś średnią, przybliżoną wartość, wokół której zgrupowane są wszystkie możliwe wartości zmiennej losowej.

Wartość średnia zmiennej losowej to pewna liczba, która jest niejako jej „przedstawicielem” i zastępuje ją w przybliżonych obliczeniach przybliżonych. Kiedy mówimy: „średni czas pracy lampy wynosi 100 godzin” lub „średni punkt trafienia jest przesunięty względem celu o 2 m w prawo”, wskazujemy przez to na pewną liczbową charakterystykę zmiennej losowej opisującej jej położenie na osi liczbowej, tj. opis pozycji.

Spośród cech pozycji w teorii prawdopodobieństwa najważniejszą rolę odgrywa matematyczne oczekiwanie zmiennej losowej, które czasami nazywane jest po prostu średnią wartością zmiennej losowej.

Rozważ dyskretną zmienną losową, która ma możliwe wartości z prawdopodobieństwem. Musimy scharakteryzować jakąś liczbą położenie wartości zmiennej losowej na osi x, biorąc pod uwagę fakt, że wartości te mają różne prawdopodobieństwa. Naturalne jest w tym celu wykorzystanie tzw. „średniej ważonej” wartości, a każdą wartość należy uwzględnić przy uśrednianiu z „wagą” proporcjonalną do prawdopodobieństwa tej wartości. W ten sposób obliczymy średnią zmiennej losowej, którą oznaczymy wzorem:

lub, biorąc pod uwagę, że

. (5.6.1)

Ta średnia ważona nazywana jest matematycznym oczekiwaniem zmiennej losowej. Tym samym wprowadziliśmy do rozważań jedno z najważniejszych pojęć teorii prawdopodobieństwa – pojęcie oczekiwań matematycznych.

Matematyczne oczekiwanie zmiennej losowej jest sumą iloczynów wszystkich możliwych wartości zmiennej losowej i prawdopodobieństw tych wartości.

Należy zauważyć, że w powyższym sformułowaniu definicja oczekiwań matematycznych obowiązuje ściśle rzecz biorąc, tylko dla dyskretnych zmiennych losowych; Poniżej uogólnimy tę koncepcję na przypadek wielkości ciągłych.

Aby uczynić koncepcję oczekiwań matematycznych bardziej ilustracyjną, przejdźmy do mechanicznej interpretacji rozkładu dyskretnej zmiennej losowej. Niech punkty z odciętymi znajdą się na osi odciętych, w których skupione są odpowiednio masy, oraz . Wtedy oczywiście oczekiwanie matematyczne określone wzorem (5.6.1) jest niczym innym jak odciętą środka ciężkości danego układu punktów materialnych.

Matematyczne oczekiwanie zmiennej losowej wiąże się ze szczególną zależnością ze średnią arytmetyczną zaobserwowanych wartości zmiennej losowej przy dużej liczbie eksperymentów. Zależność ta jest tego samego typu, co zależność między częstotliwością a prawdopodobieństwem, a mianowicie: przy dużej liczbie eksperymentów średnia arytmetyczna zaobserwowanych wartości zmiennej losowej zbliża się (zbiega się pod względem prawdopodobieństwa) do jej oczekiwań matematycznych. Z obecności związku pomiędzy częstotliwością a prawdopodobieństwem można w konsekwencji wywnioskować istnienie podobnej zależności pomiędzy średnią arytmetyczną i oczekiwaniem matematycznym.

Rzeczywiście, rozważ dyskretną zmienną losową charakteryzującą się szeregiem rozkładów:

Gdzie .

Niech zostaną przeprowadzone niezależne eksperymenty, w każdym z których ilość przyjmuje określoną wartość. Załóżmy, że wartość pojawiła się raz, wartość pojawiła się raz, ogólnie rzecz biorąc, wartość pojawiła się raz. Oczywiście,

Obliczmy średnią arytmetyczną zaobserwowanych wartości wielkości, którą w przeciwieństwie do oczekiwań matematycznych oznaczymy:

Ale nie ma nic więcej niż częstotliwość (lub statystyczne prawdopodobieństwo) zdarzenia; tę częstotliwość można nazwać . Następnie

,

te. średnia arytmetyczna zaobserwowanych wartości zmiennej losowej jest równa sumie iloczynów wszystkich możliwych wartości zmiennej losowej i częstotliwości tych wartości.

Wraz ze wzrostem liczby eksperymentów częstotliwości zbliżą się (zbiegają się pod względem prawdopodobieństwa) z odpowiednimi prawdopodobieństwami. W rezultacie średnia arytmetyczna zaobserwowanych wartości zmiennej losowej wraz ze wzrostem liczby eksperymentów zbliży się (zbiega się pod względem prawdopodobieństwa) z jej matematycznym oczekiwaniem.

Związek średniej arytmetycznej ze sformułowanym powyżej oczekiwaniem matematycznym stanowi treść jednej z form prawa wielkich liczb. Dokładny dowód tego prawa przedstawimy w rozdziale 13.

Wiemy już, że wszystkie formy prawa wielkich liczb stwierdzają, że pewne średnie są stabilne w dużej liczbie eksperymentów. Mówimy tu o stabilności średniej arytmetycznej z serii obserwacji o tej samej wartości. Przy niewielkiej liczbie eksperymentów średnia arytmetyczna ich wyników jest losowa; przy wystarczającym wzroście liczby eksperymentów staje się „prawie nie losowy” i stabilizując się, zbliża się do stałej wartości - oczekiwania matematycznego.

Właściwość stabilności średnich dla dużej liczby eksperymentów jest łatwa do sprawdzenia eksperymentalnego. Przykładowo ważąc dowolne ciało w laboratorium na dokładnych wagach, w wyniku ważenia za każdym razem otrzymujemy nową wartość; aby zmniejszyć błąd obserwacji, ważymy ciało kilka razy i stosujemy średnią arytmetyczną uzyskanych wartości. Łatwo zauważyć, że wraz ze wzrostem liczby doświadczeń (ważeń) średnia arytmetyczna coraz mniej reaguje na ten wzrost, a przy odpowiednio dużej liczbie doświadczeń praktycznie przestaje się zmieniać.

Wzór (5.6.1) na oczekiwanie matematyczne odpowiada przypadkowi dyskretnej zmiennej losowej. W przypadku wartości ciągłej oczekiwanie matematyczne nie jest już oczywiście wyrażane jako suma, ale jako całka:

, (5.6.2)

gdzie jest gęstością rozkładu ilości .

Wzór (5.6.2) otrzymujemy ze wzoru (5.6.1), jeśli zastąpimy w nim poszczególne wartości stale zmieniającym się parametrem x, odpowiadające im prawdopodobieństwa – elementem prawdopodobieństwa, a sumę końcową – całką. W dalszej części będziemy często używać tej metody rozszerzania wzorów wyprowadzonych na wielkości nieciągłe na przypadek wielkości ciągłych.

W interpretacji mechanicznej matematyczne oczekiwanie ciągłej zmiennej losowej zachowuje to samo znaczenie - odciętą środka ciężkości w przypadku, gdy masa jest rozłożona wzdłuż osi odciętych w sposób ciągły, z gęstością . Taka interpretacja często pozwala znaleźć oczekiwanie matematyczne bez obliczania całki (5.6.2) na podstawie prostych rozważań mechanicznych.

Powyżej wprowadziliśmy zapis matematycznego oczekiwania wielkości. W niektórych przypadkach, gdy wartość jest zawarta we wzorach jako określona liczba, wygodniej jest oznaczyć ją pojedynczą literą. W takich przypadkach będziemy oznaczać matematyczne oczekiwanie wartości poprzez:

Zapis i oczekiwanie matematyczne będą w przyszłości stosowane równolegle, w zależności od wygody takiego lub innego zapisu formuł. Zgódźmy się także, jeśli to konieczne, na skróty słów „oczekiwanie matematyczne” literami m.o.

Należy zauważyć, że najważniejsza cecha pozycji – oczekiwanie matematyczne – nie istnieje dla wszystkich zmiennych losowych. Można ułożyć przykłady takich zmiennych losowych, dla których nie istnieje oczekiwanie matematyczne, ponieważ odpowiadająca im suma lub całka jest rozbieżna.

Rozważmy na przykład nieciągłą zmienną losową z szeregiem rozkładów:

Łatwo to sprawdzić, tzn. szereg dystrybucji ma sens; jednakże suma w tym przypadku jest rozbieżna i dlatego matematyczne oczekiwanie wartości nie istnieje. Jednak w praktyce takie przypadki nie cieszą się dużym zainteresowaniem. Zwykle zmienne losowe, z którymi mamy do czynienia, mają ograniczony zakres możliwych wartości i oczywiście mają oczekiwanie.

Powyżej podaliśmy wzory (5.6.1) i (5.6.2) wyrażające odpowiednio oczekiwanie matematyczne dla nieciągłej i ciągłej zmiennej losowej.

Jeżeli wartość należy do wartości typu mieszanego, to jej matematyczne oczekiwanie wyraża się wzorem w postaci:

, (5.6.3)

gdzie suma rozciąga się na wszystkie punkty, w których rozkład się załamuje, a całka rozciąga się na wszystkie odcinki, na których dystrybuanta jest ciągła.

Oprócz najważniejszej charakterystyki pozycji – oczekiwania matematycznego – w praktyce stosuje się czasami inne charakterystyki pozycji, w szczególności modę i medianę zmiennej losowej.

Modą zmiennej losowej jest jej najbardziej prawdopodobna wartość. Termin „najbardziej prawdopodobna wartość” odnosi się ściśle do wielkości nieciągłych; dla wielkości ciągłej modą jest wartość, przy której gęstość prawdopodobieństwa jest maksymalna. Wyrażamy zgodę na oznaczenie trybu literą . Na ryc. Rysunki 5.6.1 i 5.6.2 pokazują odpowiednio tryb dla nieciągłych i ciągłych zmiennych losowych.

Jeżeli wielokąt rozkładu (krzywa rozkładu) ma więcej niż jedno maksimum, rozkład nazywa się „polimodalnym” (rysunki 5.6.3 i 5.6.4).

Czasami zdarzają się rozkłady, które mają pośrodku nie maksimum, ale minimum (ryc. 5.6.5 i 5.6.6). Takie rozkłady nazywane są „antymodalnymi”. Przykładem rozkładu antymodalnego jest rozkład otrzymany w przykładzie 5, nr 5.1.

W ogólnym przypadku tryb i oczekiwanie matematyczne zmiennej losowej nie pokrywają się. W szczególnym przypadku, gdy rozkład jest symetryczny i modalny (tj. ma modę) i istnieje oczekiwanie matematyczne, to pokrywa się on z modą i środkiem symetrii rozkładu.

Często wykorzystuje się inną charakterystykę pozycji – tzw. medianę zmiennej losowej. Cecha ta jest zwykle używana tylko dla ciągłych zmiennych losowych, chociaż można ją formalnie zdefiniować również dla zmiennej nieciągłej.

Mediana zmiennej losowej to jej wartość, dla której

te. jest równie prawdopodobne, że zmienna losowa będzie mniejsza lub większa niż . Geometrycznie mediana jest odciętą punktu, w którym obszar ograniczony krzywą rozkładu jest podzielony na pół (ryc. 5.6.7).

Moda- wartość w zbiorze obserwacji, która występuje najczęściej

Mo \u003d X Mo + h Mo * (f Mo - f Mo-1): ((f Mo - f Mo-1) + (f Mo - f Mo + 1)),

tutaj X Mo jest lewą granicą przedziału modalnego, h Mo jest długością przedziału modalnego, f Mo-1 jest częstotliwością przedziału przedmodalnego, f Mo jest częstotliwością przedziału modalnego, f Mo+1 jest częstotliwością częstotliwość interwału postmodalnego.

Postacią rozkładu absolutnie ciągłego jest dowolny punkt lokalnego maksimum gęstości rozkładu. W przypadku rozkładów dyskretnych modą jest dowolna wartość a i, której prawdopodobieństwo p i jest większe niż prawdopodobieństwa sąsiednich wartości

Mediana ciągła zmienna losowa X jego wartość Me nazywa się taką, dla której jest równie prawdopodobne, czy zmienna losowa okaże się mniejsza, czy większa Ja, tj.

M e \u003d (n + 1) / 2 P(X < Ja) = P(X > Ja)

Równomiernie rozprowadzane NOWOŚĆ

Równomierna dystrybucja. Ciągłą zmienną losową nazywa się równomiernie rozłożoną na segmencie (), jeśli jej funkcja gęstości rozkładu (ryc. 1.6, A) wygląda jak:

Oznaczenie: - SW jest równomiernie rozłożone na .

Odpowiednio funkcja rozkładu na segmencie (ryc. 1.6, B):

Ryż. 1.6. Funkcje zmiennej losowej o rozkładzie jednostajnym na [ A,B]: A– gęstości prawdopodobieństwa F(X); B– dystrybucje F(X)

Matematyczne oczekiwanie i wariancja tego RV są określone przez wyrażenia:

Ze względu na symetrię funkcji gęstości pokrywa się ona z medianą. Moda nie ma jednolitego rozkładu

Przykład 4 Czas oczekiwania na odpowiedź na telefon jest zmienną losową spełniającą jednolite prawo rozkładu w zakresie od 0 do 2 minut. Znajdź funkcje rozkładu całkowego i różniczkowego tej zmiennej losowej.

27. Normalne prawo rozkładu prawdopodobieństwa

Ciągła zmienna losowa x ma rozkład normalny o parametrach: m,s > 0, jeżeli gęstość rozkładu prawdopodobieństwa ma postać:

gdzie: m to oczekiwanie matematyczne, s to odchylenie standardowe.



Rozkład normalny nazywany jest także gaussowskim, na cześć niemieckiego matematyka Gaussa. Fakt, że zmienna losowa ma rozkład normalny o parametrach: m, , oznaczamy następująco: N (m, s), gdzie: m=a=M[X];

Dość często we wzorach oczekiwanie matematyczne jest oznaczone przez A . Jeśli zmienna losowa ma rozkład zgodnie z prawem N(0,1), wówczas nazywa się ją znormalizowaną lub standaryzowaną wartością normalną. Funkcja dystrybucji dla niego ma postać:

Wykres gęstości rozkładu normalnego, zwanego krzywą normalną lub krzywą Gaussa, pokazano na ryc. 5.4.

Ryż. 5.4. Normalna gęstość dystrybucji

nieruchomości zmienna losowa o prawie rozkładu normalnego.

1. Jeżeli , to znaleźć prawdopodobieństwo, że ta wartość mieści się w zadanym przedziale ( x 1; x 2) stosuje się wzór:

2. Prawdopodobieństwo, że odchylenie zmiennej losowej od jej oczekiwań matematycznych nie przekroczy wartości (w wartości bezwzględnej) wynosi:

3. „Zasada trzech sigma”. Jeżeli jest to zmienna losowa, to praktycznie pewne jest, że jej wartości mieszczą się w przedziale (). (Prawdopodobieństwo przekroczenia tych granic wynosi 0,0027.) Reguła pozwala, znając parametry ( i ), w przybliżeniu wyznaczyć przedział praktycznych wartości zmiennej losowej.

rozkład wykładniczy

Zmienna losowa X ma rozkład wykładniczy z parametrem, jeśli jej gęstość ma postać

Całkując gęstość, otrzymujemy funkcję rozkładu wykładniczego:

główne cechy rozkładu wykładniczego:

Wykresy gęstości i funkcje otrzymanego rozkładu wykładniczego

Wartość oczekiwana. oczekiwanie matematyczne Dyskretna zmienna losowa X, który przyjmuje skończoną liczbę wartości XI z prawdopodobieństwami RI, nazywa się sumą:

oczekiwanie matematyczne ciągła zmienna losowa X nazywa się całką iloczynu jej wartości X na gęstość rozkładu prawdopodobieństwa F(X):

(6B)

Całka niewłaściwa (6 B) zakłada się, że jest absolutnie zbieżny (w przeciwnym razie mówimy, że oczekiwanie M(X) nie istnieje). Charakteryzuje się oczekiwaniem matematycznym Średnia wartość zmienna losowa X. Jego wymiar pokrywa się z wymiarem zmiennej losowej.

Właściwości oczekiwań matematycznych:

Dyspersja. dyspersja zmienna losowa X numer nazywa się:

Rozproszenie jest charakterystyka rozpraszania wartości zmiennej losowej X w stosunku do jego średniej wartości M(X). Wymiar wariancji jest równy kwadratowi wymiaru zmiennej losowej. Bazując na definicjach wariancji (8) i oczekiwaniu matematycznym (5) dla dyskretnej zmiennej losowej i (6) dla ciągłej zmiennej losowej otrzymujemy podobne wyrażenia na wariancję:

(9)

Tutaj M = M(X).

Właściwości dyspersji:

Odchylenie standardowe:

(11)

Ponieważ wymiar odchylenia standardowego jest taki sam jak wymiar zmiennej losowej, jest on częściej niż wariancja stosowana jako miara rozproszenia.

momenty dystrybucji. Pojęcia matematycznego oczekiwania i wariancji są szczególnymi przypadkami bardziej ogólnej koncepcji numerycznej charakterystyki zmiennych losowych - momenty dystrybucji. Momenty rozkładu zmiennej losowej wprowadza się jako oczekiwania matematyczne prostych funkcji zmiennej losowej. A więc moment porządku k względem punktu X Wartość 0 nazywa się oczekiwaniami M(XX 0 )k. Momenty względem początku X= 0 są wywoływane początkowe chwile i są oznaczone:

(12)

Momentem początkowym pierwszego rzędu jest środek rozkładu rozważanej zmiennej losowej:

(13)

Momenty względem centrum dystrybucyjnego X= M zwany centralne momenty i są oznaczone:

(14)

Z (7) wynika, że ​​moment centralny pierwszego rzędu jest zawsze równy zeru:

Momenty centralne nie zależą od pochodzenia wartości zmiennej losowej, ponieważ przy przesunięciu o stałą wartość Z jego środek rozmieszczenia jest przesunięty o tę samą wartość Z, a odchylenie od środka nie zmienia się: XM = (XZ) – (MZ).
Teraz jest to oczywiste dyspersja- Ten moment centralny drugiego rzędu:

Asymetria. Moment centralny trzeciego rzędu:

(17)

służy ocenie skośność dystrybucji. Jeśli rozkład jest symetryczny względem punktu X= M, wówczas moment centralny trzeciego rzędu będzie równy zeru (podobnie jak wszystkie momenty centralne rzędów nieparzystych). Zatem jeśli moment centralny trzeciego rzędu jest różny od zera, to rozkład nie może być symetryczny. Wielkość asymetrii szacuje się za pomocą bezwymiarowości współczynnik asymetrii:

(18)

Znak współczynnika asymetrii (18) wskazuje na asymetrię prawostronną lub lewostronną (rys. 2).


Ryż. 2. Rodzaje asymetrii rozkładów.

Nadmiar. Moment centralny czwartego rzędu:

(19)

służy do oceny tzw kurtoza, który określa stopień stromości (punktowości) krzywej rozkładu w pobliżu centrum rozkładu w stosunku do krzywej rozkładu normalnego. Ponieważ dla rozkładu normalnego wielkość przyjęta jako kurtoza wynosi:

(20)

Na ryc. 3 pokazuje przykłady krzywych rozkładu o różnych wartościach kurtozy. Dla rozkładu normalnego mi= 0. Krzywe z większymi szczytami niż normalnie mają kurtozę dodatnią, a krzywe z bardziej płaskimi wierzchołkami mają kurtozę ujemną.


Ryż. 3. Krzywe rozkładu o różnym stopniu stromości (kurtoza).

Momenty wyższego rzędu w inżynieryjnych zastosowaniach statystyki matematycznej zwykle nie są używane.

Moda oddzielny zmienna losowa jest jej najbardziej prawdopodobną wartością. Moda ciągły zmienna losowa to jej wartość, przy której gęstość prawdopodobieństwa jest maksymalna (rys. 2). Jeżeli krzywa rozkładu ma jedno maksimum, wówczas nazywa się rozkład jednomodalny. Jeżeli krzywa rozkładu ma więcej niż jedno maksimum, wówczas nazywa się rozkład polimodalny. Czasami istnieją rozkłady, których krzywe nie mają maksimum, ale minimum. Takie rozkłady nazywane są antymodalny. W ogólnym przypadku tryb i oczekiwanie matematyczne zmiennej losowej nie pokrywają się. W konkretnym przypadku np modalny, tj. mający modę, rozkład symetryczny i pod warunkiem, że istnieje oczekiwanie matematyczne, to drugie pokrywa się z trybem i środkiem symetrii rozkładu.

Mediana zmienna losowa X jest jego znaczenie Ja, dla którego zachodzi równość: tj. jest równie prawdopodobne, że zmienna losowa X będzie mniej lub więcej Ja. Geometrycznie mediana jest odciętą punktu, w którym pole pod krzywą rozkładu jest podzielone na pół (ryc. 2). W przypadku symetrycznego rozkładu modalnego mediana, moda i średnia są takie same.