Zmienna losowa: kompletny przewodnik z definicjami, typami i przykładami

Ostatnia aktualizacja: Listopada 19, 2025
  • Zmienna losowa to mierzalna funkcja, która przypisuje rzeczywiste liczby losowym wynikom i określa ich rozkład.
  • FDA i gęstość determinują prawo zmiennej; w trybie ciągłym F(x)=∫fy, w trybie dyskretnym używana jest funkcja prawdopodobieństwa.
  • Transformacje Y=g(X) pozwalają na wyprowadzenie nowych rozkładów ze szczególnymi wzorami dla przypadków odwracalnych lub rozgałęzionych.
  • Momenty (E[X], Var[X]) i funkcje generujące podsumowują właściwości i pomagają w wnioskowaniu oraz stosowanym modelowaniu.

Koncepcja zmiennej losowej

Kiedy mówimy o zmiennej losowej Krótko mówiąc, mamy na myśli liczbę, której wartość jest losowo ustalana za każdym razem, gdy powtarzamy eksperyment. Nie możemy z całą pewnością przewidzieć, jaki będzie wynik konkretnego pomiaru, ale wiemy, że te możliwe wartości rozkładają się zgodnie z pewnym rozkładem prawdopodobieństwa – czyli systematycznym sposobem przypisywania prawdopodobieństw wynikom. Te ramy pozwalają nam modelować zjawiska ze świata rzeczywistego takich jak rzuty monetą, pomiary pogody lub wykonywanie procesów przemysłowych.

Pracować rygorystycznie, Wygodniej jest myśleć o zmiennej losowej jako o funkcji która przekształca elementarne wyniki eksperymentu (punkty w przestrzeni prób) na liczby rzeczywiste. W ten sposób za każdym razem, gdy wynik wystąpi w świecie rzeczywistym, zmienna zwraca wartość. Analiza statystyczna opiera się na wielokrotnym powtarzaniu. eksperymentu i ilościowego określenia wyników, aby odnieść je do liczb rzeczywistych, dzięki czemu będziemy mogli badać ich zachowanie przy użyciu narzędzi probabilistycznych.

Formalne ramy definicji i pomiaru

Ściśle mówiąc, Rzeczywista zmienna losowa X jest funkcją mierzalną zdefiniowane w przestrzeni probabilistycznej (Ω, A, P) i z wartościami w mierzalnej dziedzinie (S, Σ). W praktyce dziedziną tą jest (ℝ, B(ℝ)), gdzie B(ℝ) jest borelowską σ-algebrą liczb rzeczywistych. Można to streścić następująco: X: (Ω, A, P) → (ℝ, B(ℝ)), a kluczowy warunek mierzalności wymaga, aby dla każdego zbioru borelowskiego B, X⁻¹(B) ∈ A. Własność ta gwarantuje, że możemy sensownie mówić o P[X ∈ B], ponieważ zbiór przeciwobrazów jest zdarzeniem mierzalnym.

Ważnym niuansem jest to, że punkty ω ∈ Ω nie są obserwowalneWidzimy X(ω), wartość liczbową. Zatem niepewność nie wynika z wartości X już zaobserwowanej, ale z braku wcześniejszej wiedzy o rzeczywistej wartości ω. Teoria miary dostarcza odpowiedniego języka (σ-algebry, miary prawdopodobieństwa), aby sformalizować te idee bez dwuznaczności.

Zakres zmiennej

Zakres X, oznaczony jako RX, jest zbiorem wartości rzeczywistych, jakie może przyjąć zmienna: RX = { x ∈ ℝ | istnieje ω ∈ Ω takie, że X(ω) = x }. Innymi słowy jest to obraz funkcji X i naturalnie określa, gdzie zmienna może mieć masę lub gęstość prawdopodobieństwa.

Przykłady ilustrujące

Przykład 1 (dwie monety): Jeśli rzucimy dwiema monetami, przestrzeń próby będzie wynosić Ω = {HH, HT, HT, TW}, gdzie HH to orły, a HT to reszki. Definiujemy X jako liczbę uzyskanych orłów: X(HH)=2; X(HT)=1; X(HT)=1; X(TW)=0. Zakres wynosi RX = {0, 1, 2}Przypadek ten jest prototypem zmiennej dyskretnej, ponieważ przyjmuje tylko kilka izolowanych wartości.

Przykład 2 (opady dzienne): Niech X będzie poziomem opadów deszczu odnotowanym w danym dniu w mieście. Jego zakres można sensownie przedstawić jako [0, ∞). Tutaj podstawowa przestrzeń próby jest złożona (stan atmosfery, modele meteorologiczne), ale możemy oszacować rozkład X na podstawie szeregów historycznych i założyć, że rzeczywisty rozkład populacji przybliża rozkład empiryczny, jeśli dane są rozległe i reprezentatywne. W praktyce Pracujemy z funkcją dystrybucji FX przybliżony pochodzące z tych zapisów.

Rodzaje zmiennych losowych

Zmienna losowa dyskretna: Zmienną uważa się za dyskretną, jeśli jej zakres jest skończony lub przeliczalnie nieskończony, bez punktów akumulacji. Klasycznymi przykładami są liczenie orłów w rzutach monetą lub liczba osób oczekujących w kolejce w ciągu minuty. Jego zachowanie jest opisane funkcją prawdopodobieństwa (nazywana również funkcją masy prawdopodobieństwa), która przypisuje p(x) = P[X = x] każdej możliwej wartości.

Zmienna losowa ciągła: To taki, którego zakres jest nieprzeliczalny, zazwyczaj mieści się w przedziale ℝ. Przykładami są wzrost człowieka, czas życia składnika lub dzienne opady. Te zmienne są modelowane za pomocą funkcji gęstości f(x), z którego prawdopodobieństwo oblicza się przez całkowanie po przedziałach i z którego wyprowadza się jego funkcję dystrybucji skumulowanej.

Definicje te naturalnie obejmują zmienne wektorowe o wartościach w ℝⁿ lub ℂⁿ. Istnieją nawet zmienne z bardziej egzotycznymi przestrzeniami wartości, takie jak partycje (występujące w procesach stochastycznych, takich jak chińska restauracja) lub zbiory funkcji (jak w procesie Dirichleta). Ogólna teoria obejmuje wszystkie te przypadki. używając języka przestrzeni mierzalnych.

Funkcja dystrybucji skumulowanej (CDF)

Funkcja rozkładu X, FX(x) = P[X ≤ x], przypisuje każdemu rzeczywistemu x skumulowane prawdopodobieństwo do tego punktu. Każdy rzeczywisty FDA spełnia trzy właściwości: (i) granica F(x) → 0, gdy x → −∞ i F(x) → 1, gdy x → +∞; (ii) jest monotonicznie niemalejąca; oraz (iii) jest prawostronnie ciągła. Znać FX(x) jest równoważne ze znajomością prawa Xzarówno w przypadkach dyskretnych, jak i ciągłych.

Funkcja gęstości (PDF) i jej związek z FDA

Gdy X jest ciągłe, gęstość fX(x) jest pochodną FX(x) (w sensie klasycznym lub dystrybucyjnym). Odwrotnie, F uzyskuje się przez całkowanie gęstości: F(x) = ∫−∞x f(t) dt. Gęstość opisuje sposób koncentracji prawdopodobieństwa. wokół różnych wartości, co pozwala na obliczenie P[a ≤ X ≤ b] jako ∫ab f(x) dx.

Transformacje zmiennych losowych

Jeżeli Y = g(X) z borelowską mierzalnością g, To także zmienna losowa w tej samej przestrzeni bazowej, ponieważ kompozycja mierzalnych funkcji borelowskich jest mierzalna. To pozwala nam przejść z rozkładu X do rozkładu Y: FY(y) = P[g(X) ≤ y]. Warto zauważyć, że jeśli g nie rośnie ściśle lub nie jest globalnie odwracalna, uzyskanie gęstości Y wymaga uwzględnienia wszystkich gałęzi inwersyjnych g.

Jeżeli g jest odwracalne i rosnące, to FY(y) = FX(g⁻¹(y))Jeżeli dodatkowo g jest różniczkowalna, gęstość spełnia warunek fY(y) = fX(g⁻¹(y)) · |d(g⁻¹(y))/dy|. Gdy g nie jest iniekcyjne ale dla każdego y istnieje skończona liczba praobrazów xi, wzór jest uogólnionyY(y) = Σi fX(xi) · |dxi/dy|, gdzie xi = gł-1i(y). Suma ta dodaje wkład każdej gałęzi, która jest mapowana na y.

Przykład transformacji: kwadrat normalnej

Załóżmy, że X ∼ N(0, 1), o gęstości fX(x) = (1/√(2π))·e−x²/2Jeśli zdefiniujemy Y = X², każda wartość y ≥ 0 ma dwa przeciwobrazy: x = ±√y. Stosując wzór z dwiema gałęziami symetrycznymi, f jest uzyskiwanyY(y) = (1/√(2π y))·e−y/2 dla y > 0i fY(y) = 0 dla y ≤ 0. Jest to gęstość χ² z 1 stopniem swobody (równoważnie gęstości gamma o kształcie 1/2 i skali 2).

Jeśli przyjrzymy się kumulatywnemu rozkładowi Y, Dla y < 0 prawdopodobieństwo wynosi 0. Dla y ≥ 0, FY(y) = P[−√y ≤ X ≤ √y] = FX(√y) − FX(−√y), gdzie FX Jest to norma FDA. Ten przykład ilustruje dwa uzupełniające się podejścia:praca z gęstościami (zmianą zmiennej) lub z rozkładami skumulowanymi.

Przykład transformacji: z prawa logistycznego podniesionego do wykładniczego

Rozważ zmienną X z FDA FX(x) = 1 / (1 + e−x)θ, przy θ > 0. Definiujemy Y = ln(1 + e-X). Wtedy Y ≤ y jest równoważne X ≥ −ln(ey − 1). Stąd, FY(y) = 1 − FX(−ln(ey − 1)). Wymiana FX i upraszczając, dochodzimy do FY(y) = 1 − e−θ i, która jest FDA wykładnika z parametrem θ. To elegancka zmiana zmiennej łączący rozszerzoną rodzinę logistyczną z dystrybucją wykładniczą.

Oczekiwanie, wariancja i momenty

Wartość oczekiwana lub wartość oczekiwana E[X] podsumowuje centralną tendencjęJeżeli X jest dyskretny i ma wartości xi i prawdopodobieństwa p(x)i), wtedy E[X] = Σ xi p(xi). Jeśli X jest ciągła z gęstością f(x), E[X] = ∫−∞ xf(x) dx. Pod względem pomiaru, można zapisać jako ∫Ω X dP, co podkreśla jego abstrakcyjną definicję w przestrzeni probabilistycznej.

Wariancja określa ilość rozproszenia: Zmienna(X) = E[(X − E[X])²]Odchylenie standardowe wynosi σ = √Var(X) i spełnia warunek σ² = Var(X). W rozkładach ciągłych zbiór momentów M(n)X = E[Xⁿ] może w pełni scharakteryzować prawo w odpowiednich warunkach. Momenty są powiązane z funkcją charakterystyczną φX(t) za pomocą φ(n)X(0) = iⁿ E[Xⁿ], a z funkcją generującą momenty MX(t) przez M(n)X(0) = E[Xⁿ]. Te narzędzia kondensują informacje przydatne do wnioskowania, przybliżeń i porównywania rozkładów.

Klasyfikacja praktyczna i powiązanie z aplikacjami

Dyskretne kontra ciągłe Nie jest to jedyna użyteczna dychotomia: wyróżniamy również zmienne mieszane (z częścią dyskretną i ciągłą), zmienne wielowymiarowe (wektory losowe) i zmienne o wartościach funkcyjnych w procesach stochastycznych. Różnorodność ta odzwierciedla złożoność zjawisk zachodzących w realnym świecie., gdzie często współistnieją niepewności kategoryczne i ilościowe.

W modelowaniu w świecie rzeczywistym ważne jest, aby pamiętać, że Obserwuje się zmienną przekształconą X(ω), a nie element bazowy ω. To kieruje wyborem miar, definicją zdarzeń będących przedmiotem zainteresowania i interpretacją wyników. W inżynierii, naukach o zdrowiu lub ekonomiiTaka perspektywa pomaga w formalizacji hipotez i wyborze spójnych modeli probabilistycznych.

Jak przejść z X do Y = g(X): szczegóły techniczne

Ogólna formuła: jeśli g jest monotoniczna i odwracalna, fY(y) = fX(g⁻¹(y)) · |(d/dy) g⁻¹(y)|Jeżeli g nie jest monotoniczne, ale każde y ma skończoną liczbę pierwiastków xi które weryfikują g(xi) = y, wówczas wkłady każdej gałęzi są sumowane: fY(y) = Σ fX(xi) · |dxi/dy|. Ta zmienna zmienia regułę Jest to narzędzie służące do wyprowadzania gęstości typowych przekształceń (potęg, logarytmów, funkcji trygonometrycznych itp.).

Jeśli chodzi o mierzalność, skład funkcji mierzalnych borelowskich jest mierzalna, co potwierdza procedurę Y = g(X). W bardziej ogólnych kontekstach, z funkcjami Lebesgue'a jedynie mierzalnymi poza ramami Borela, skład może powodować problemy Wymagane są dodatkowe warunki. Ten szczegół techniczny uzasadnia powszechne stosowanie funkcji Borela w statystyce i rachunku prawdopodobieństwa w celu zagwarantowania prawidłowego zachowania.

Zastosowanie edukacyjne: wiek i efektywność pracy nauczyciela

Opisano dochodzenie w sprawie efektywność nauczania EIB w szkołach prywatnych w San Juan de Lurigancho, na próbie 54 nauczycieli. Analizie poddano wiek, ze szczególnym uwzględnieniem grupy młodych nauczycieli (X < 29 lat). Dostępna jest tabela zawierająca częstości, wartości procentowe, wartości procentowe ważne (które pomijają brakujące dane) oraz wartości procentowe skumulowane. Celem jest obliczenie wartości oczekiwanej i wariancji. w przypadku młodych nauczycieli i pozostałych grup wiekowych wyciągnij wnioski, zaproponuj działania naprawcze i oszacuj prawdopodobieństwo, że nauczyciel ma od 29 do 31 lat.

Jak postępować: jeśli tabela wiekowa jest pogrupowana według przedziałów, środek każdego interwału jest używany jako przedstawiciel xi i częstotliwość fi lub procent ważny jako waga. W przypadku grupy młodych (X < 29) klasy z górną granicą mniejszą niż 29 są filtrowane, a suma częstotliwości jest przeskalowywana, aby reprezentować całkowitą liczbę podgrup. Oczekiwanie warunkowe oblicza się jako E[X | X < 29] ≈ Σ xi pja|młodyi wariancję warunkową jako Var(X | X < 29) ≈ Σ (xi −μjoven)² str.ja|młodyW przypadku grupy niemłodszej (X ≥ 29) proces powtarza się w odniesieniu do ich klas.

Jeżeli tabela nie jest zgrupowana i ma konkretne wieki z częstotliwościami, wtedy E[X] = (1/N) Σ xi fi i Var(X) = (1/N) Σ (xi − μ)² fiW przypadku wersji warunkowych według podgrup, N jest zastępowane przez rozmiar podgrupy (Njoven lub Nnie młody) i tylko odpowiadające im częstotliwości są sumowane. Ta metodologia dokładnie odzwierciedla definicję wartości oczekiwanej i wariancji, dostosowaną do rzeczywistych danych, z grupowaniem lub bez.

Co możemy wywnioskować z tych wyników? Jeśli E[X | X < 29] jest znacznie mniejsze, a Var(X | X < 29] jest zmniejszone, W grupie młodej średnia wieku jest niska i jednorodnaJeśli inne wskaźniki również wskazują na lepsze wyniki w nauce dla X < 29, młodzież może być powiązana z pewnymi obecnymi praktykami w nauce lub większym dostosowaniem się do aktywnych metod nauczania. Jednakże wnioskowanie przyczynowe wymaga ostrożności.Wskazane jest sprawdzenie doświadczenia, przeszkolenia, dostępu do zasobów i stylu przywództwa w ośrodku.

Działania mające na celu poprawę wyników i osiągnięć: (1) ukierunkowane kształcenie ustawiczne w skutecznych metodologiach (aktywne uczenie się, ocena kształtująca, informacja zwrotna o jakości); (2) mentoring krzyżowy między młodszymi i bardziej doświadczonymi nauczycielami w celu wymiany innowacji i strategii zarządzania klasą; (3) społeczności praktyki z obserwacją koleżeńską i cyklami doskonalenia; (4) dostęp do zasobów edukacyjnych i technologii ze wsparciem technicznym; oraz (5) monitorowanie za pomocą wskaźników przejrzyste wskaźniki postępów uczniów, łączące dane dotyczące wyników z decyzjami pedagogicznymi.

Jakie jest prawdopodobieństwo, że nauczyciele będą mieli od 29 do 31 lat? Jeśli tabela zawiera częstotliwości według wieku lub drobnych interwałówWystarczy dodać częstotliwości 29, 30 i 31 (lub przedział [29,31]) i podzielić przez łączną liczbę 54 nauczycieli lub przez całkowitą liczbę ważnych danych, jeśli występują straty. Jeśli tabela używa szerokich przedziałów (na przykład [28,32]), Można go interpolować proporcjonalnie Zakładając rozkład jednostajny w przedziale: P(29–31) ≈ (długość podprzedziału)/(długość przedziału) × (częstość przedziału)/N. Gdyby istniało wiarygodne dopasowanie do rozkładu ciągłego, Inną opcją byłoby zintegrowanie gęstości skorygowano pomiędzy 29 a 31. Bez szczegółowych danych nie można podać konkretnej liczby, ale procedura jest taka, jak opisano.

Notatki i powiązania z innymi koncepcjami

Dystrybucje referencyjne Rozkłady dwumianowy i normalny są paradygmatycznymi przykładami odpowiednio zmiennych dyskretnych i ciągłych. Podstawą kursów wprowadzających jest badanie rozkładów prawdopodobieństwa, wartości oczekiwanych i wariancji. W zaawansowanym wnioskowaniu statystycznym Pojawiają się takie pojęcia, jak informacja Fishera, która określa, ile informacji o parametrze niesie ze sobą losowa obserwacja i jest kluczowa dla efektywności estymatorów i granic Craméra-Rao.

Poza teorią, galerie i zasoby akademickie Pomagają wizualizować koncepcje i poszerzać zakres badań. Dostępne są repozytoria z materiałami graficznymi na temat zmiennych losowych oraz bogata bibliografia, która zgłębia podstawy i zastosowania. Te wsparcia są cenne aby skonsolidować zrozumienie i nawiązać kontakt z rzeczywistymi problemami.

Zasoby PDF zawierające dalsze informacje (link zewnętrzny)

Niektóre materiały otwarte i referencyjne które zagłębiają się w definicję i właściwości zmiennych losowych i rozkładów:

Podsumujmy architekturę koncepcyjnąZmienna losowa to mierzalna funkcja, która odwzorowuje wyniki na liczby. Jej skumulowany rozkład, a w przypadku rozkładu ciągłego, jej gęstość, całkowicie kodują jej zachowanie. Zakres oznacza możliwe wartości. Transformacje umożliwiają konstruowanie nowych zmiennych. Takie wielkości sumaryczne, jak wartość oczekiwana, wariancja i momenty, syntetyzują kluczowe cechy. Z tymi fundamentamiPrzykłady (od monet po opady deszczu i epoki) analizowane są przy użyciu unikalnego języka, który łączy teorię z praktyką.