Случайная величина: полное руководство с определениями, типами и примерами.

Последнее обновление: 19 ноября 2025
  • Случайная величина — это измеримая функция, которая присваивает случайным результатам действительные числа, имеющие соответствующее распределение.
  • Закон распределения вероятностей (FDA) и плотность определяют закон распределения переменных; в непрерывном случае F(x)=∫fy, в дискретном используется функция вероятности.
  • Преобразования Y=g(X) позволяют выводить новые распределения со специальными формулами для обратимых или разветвленных случаев.
  • Моменты (E[X], Var[X]) и производящие функции обобщают свойства и помогают в выводах и прикладном моделировании.

Понятие случайной величины

Когда мы говорим о случайной переменной Короче говоря, речь идёт о числе, значение которого определяется случайным образом при каждом повторении эксперимента. Мы не можем с уверенностью предсказать результат конкретного измерения, но мы знаем, что эти возможные значения распределены в соответствии с определённым распределением вероятностей — то есть, систематическим способом присвоения вероятностей исходам. Эта структура позволяет нам моделировать явления реального мира. например, подбрасывание монеты, измерения погоды или эффективность промышленного процесса.

Работать усердно, Удобно рассматривать случайную величину как функцию. Эта переменная преобразует элементарные результаты эксперимента (точки в пространстве элементарных исходов) в действительные числа. Таким образом, каждый раз, когда в реальном мире происходит какое-либо событие, переменная возвращает значение. Статистический анализ основан на многократном повторении. эксперимент и количественная оценка результатов для сопоставления их с действительными числами, чтобы мы могли изучать их поведение с помощью вероятностных инструментов.

Формальное определение и система измерения

Строго говоря, Действительная случайная величина X — это измеримая функция. определено на вероятностном пространстве (Ω, A, P) и имеет значения в измеримой области значений (S, Σ). В большинстве случаев область значений — (ℝ, B(ℝ)), где B(ℝ) — борелевская σ-алгебра действительных чисел. Это можно суммировать следующим образом: X: (Ω, A, P) → (ℝ, B(ℝ)), а ключевое условие измеримости требует, чтобы для каждого борелевского множества B, X⁻¹(B) ∈ A. Это свойство гарантирует, что мы можем осмысленно говорить о P[X ∈ B].поскольку множество прообразов является измеримым событием.

Важный нюанс заключается в том, что Точки ω ∈ Ω ненаблюдаемыМы видим X(ω), числовое значение. Следовательно, неопределенность заключается не в уже наблюдаемом значении X, а в том, что заранее неизвестно, каким будет фактическое значение ω. Теория меры предоставляет подходящий язык. (σ-алгебры, вероятностные меры) для формализации этих идей без двусмысленности.

Диапазон переменной

Диапазон значений X обозначается как R.X, — это множество действительных значений, которые может принимать переменная: RX = { x ∈ ℝ | существует ω ∈ Ω такое, что X(ω) = x }. Иными словами, это образ функции X. и естественным образом определяет, где переменная может иметь массу или плотность вероятности.

Наглядные примеры

Пример 1 (две монеты): Если подбросить две монеты, пространство элементарных исходов будет Ω = {HH, HT, HT, TW}, где HH — орел, а HT — решка. Мы определяем X как количество выпавших орлов: X(HH)=2; X(HT)=1; X(HT)=1; X(TW)=0. Диапазон составляет RX = {0, 1, 2}Этот случай типичен для дискретной переменной, поскольку она принимает лишь несколько изолированных значений.

Пример 2 (суточные осадки): Пусть X — уровень осадков, зафиксированный в определенный день в городе. Его диапазон можно с достаточной точностью представить как [0, ∞). В данном случае базовое пространство элементарных исходов является комплексным. (состояние атмосферы, метеорологические модели), но мы можем оценить распределение X на основе исторических рядов и считать, что фактическое распределение населения приближается к эмпирическому распределению, если данные являются обширными и репрезентативными. На практике, Мы работаем с функцией распределения F.X приблизительный получено из указанных записей.

Типы случайных величин

Дискретная случайная величина: Переменная считается дискретной, если её диапазон представляет собой конечное или счётно бесконечное множество без предельных точек накопления. Классическими примерами являются подсчёт орлов при подбрасывании монеты или количество прибывших в очередь за одну минуту. Его поведение описывается функцией вероятности. (также называемая функцией вероятностной массы), которая присваивает p(x) = P[X = x] каждому возможному значению.

Непрерывная случайная величина: Это величина, диапазон значений которой неисчислим, обычно это интервал в ℝ. Примерами могут служить рост человека, время жизни компонента или суточные осадки. Эти переменные моделируются с помощью функции плотности. f(x), из которого вероятность получается путем интегрирования по интервалам, и из которого выводится ее кумулятивная функция распределения.

Эти определения естественным образом распространяются на векторные переменные со значениями в ℝⁿ или ℂⁿ. Существуют даже переменные с более экзотическими пространствами значений.например, разбиения (появляющиеся в стохастических процессах, таких как «Китайский ресторан») или множества функций (как в процессе Дирихле). Общая теория охватывает все эти случаи. используя язык измеримых пространств.

Функция кумулятивного распределения (ФКР)

Функция распределения X, FX(x) = P[X ≤ x], каждому действительному x присваивается кумулятивная вероятность до этой точки. Каждая действительная функция распределения вероятностей удовлетворяет трем свойствам: (i) ограничивает F(x) → 0 при x → −∞ и F(x) → 1 при x → +∞; (ii) является монотонно неубывающей; и (iii) является непрерывной справа. Знай ФX(x) эквивалентно знанию закона X.как в дискретном, так и в непрерывном случаях.

Функция плотности вероятности (PDF) и её связь с FDA

Когда X является непрерывной функцией, плотность fX(x) — производная FX(Х) (в классическом смысле или смысле распределения). Наоборот, F получается интегрированием плотности: F(x) = ∫-∞x f(t) dt. Плотность описывает, как концентрируется вероятность. при различных значениях, что позволяет вычислить P[a ≤ X ≤ b] как ∫ab f(x) dx.

Преобразования случайных величин

Если Y = g(X), причем g является борелевски измеримой величиной, И это также случайная величина. на том же базовом пространстве, поскольку композиция измеримых функций Бореля измерима. Это снова позволяет нам перейти от распределения X к распределению Y: FY(y) = P[g(X) ≤ y]. Стоит отметить, что если функция g не является строго возрастающей, то это справедливо и в этом случае. Если функция не является глобально обратимой, то для получения плотности Y необходимо учитывать все ветви инверсии функции g.

Если функция g обратима и возрастает, то FY(y) = FX(g⁻¹(y))Если, кроме того, функция g дифференцируема, то плотность удовлетворяет условию f.Y(y) = fX(g⁻¹(y)) · |d(g⁻¹(y))/dy|. Когда g не является инъективным но для каждого y существует конечное число прообразов x.iФормула является обобщенной.Y(y) = Σi fX(xi) · |dxi/dy|, где xi = г-1i(y). Эта сумма суммирует вклад каждой ветви, которая отображается на y.

Пример преобразования: квадрат нормали

Предположим, X ∼ N(0, 1), с плотностью fX(x) = (1/√(2π))·e−x²/2Если мы определим Y = X², то для каждого значения y ≥ 0 существует два прообраза: x = ±√y. Применяя формулу с двумя симметричными ветвями, f полученY(y) = (1/√(2π y))·e−y/2 для y > 0, и еY(y) = 0 при y ≤ 0. Это плотность распределения χ² с 1 степенью свободы (эквивалентно, гамма-распределения с формой 1/2 и масштабом 2).

Если мы посмотрим на кумулятивное распределение Y, При y < 0 вероятность равна 0.. При y ≥ 0, FY(y) = P[−√y ≤ X ≤ √y] = FX(√y) − FX(−√y), где FX Это соответствует стандартам FDA. Этот пример иллюстрирует два взаимодополняющих подхода.: работа с плотностями (замена переменных) или с кумулятивными распределениями.

Пример преобразования: из логистической функции, возведенной в степень.

Рассмотрим переменную X, имеющую FDA FX(x) = 1 / (1 + e-x)θ, где θ > 0. Мы определяем Y = ln(1 + e-X). Тогда Y ≤ y эквивалентно X ≥ −ln(e)y − 1). Следовательно, FY(y) = 1 − FX(−ln(ey − 1))Замена FX и, упрощая, получаем FY(y) = 1 − e−θ и, что представляет собой FDA экспоненциальной функции с параметром θ. Это элегантное изменение переменной. которая связывает усовершенствованную систему логистики с экспоненциальным распределением.

Ожидание, дисперсия и моменты

Ожидаемое значение, или ожидаемое значение E[X] суммирует центральную тенденциюЕсли X — дискретная величина со значениями xi и вероятности p(x)i), тогда E[X] = Σ xi р(хiЕсли X — непрерывная функция с плотностью f(x), то E[X] = ∫-∞ ∫ xf(x) dx. С точки зрения измерения, можно записать как ∫Ω X dP, в котором акцент делается на абстрактном определении, а не на вероятностном пространстве.

Дисперсия количественно оценивает разброс: Var(X) = E[(X − E[X])²]Стандартное отклонение равно σ = √Var(X) и удовлетворяет условию σ² = Var(X). В непрерывных распределениях набор моментов M(П)X = E[Xⁿ] может полностью охарактеризовать закон при подходящих условиях. Моменты связаны с характеристической функцией φ.X(t) посредством φ(П)X(0) = iⁿ E[Xⁿ], и с функцией генерации моментов MX(t) через М(П)X(0) = E[Xⁿ]. Эти инструменты сжимают информацию. Полезно для выводов, аппроксимаций и сравнения распределений.

Практическая классификация и связь с приложениями

Дискретные и непрерывные Это не единственная полезная дихотомия: мы также различаем смешанные переменные (с дискретной и непрерывной частями), многомерные переменные (случайные векторы) и переменные с функциональными значениями в стохастических процессах. Это разнообразие отражает сложность явлений реального мира.где часто сосуществуют категориальные и количественные неопределенности.

При моделировании реальных ситуаций важно помнить, что Наблюдаемая переменная является преобразованной. X(ω), а не лежащий в основе элемент ω. Это определяет выбор показателей, определение интересующих событий и интерпретацию результатов. В области инженерии, медицинских наук или экономики.Такой подход помогает формализовать гипотезы и выбрать согласованные вероятностные модели.

Как перейти от X к Y = g(X): технические подробности

Общая формулировка: если g — монотонная и обратимая функция, fY(y) = fX(g⁻¹(y)) · |(d/dy) g⁻¹(y)|Если функция g не монотонна, но каждое число y имеет конечное число корней xi что подтверждают g(x)i) = y, затем вклады каждой ветви суммируются: fY(y) = Σ fX(xi) · |dxi/dy|. Это правило изменения переменной Это основной инструмент для вывода плотностей распространенных преобразований (степеней, логарифмов, тригонометрических функций и т. д.).

Что касается измеримости, композиция борелевских измеримых функций является измеримой, что подтверждает процедуру Y = g(X). В более общих контекстах с просто измеримыми функциями Лебега вне борелевской модели, состав может вызвать проблемы И требуются дополнительные условия. Эта техническая деталь оправдывает широкое использование функций Бореля в статистике и теории вероятностей для обеспечения их корректного поведения.

Применение в образовании: возраст и эффективность работы учителя.

Расследование описано в педагогической эффективности ЕИБ В частных школах Сан-Хуан-де-Луриганчо была проведена выборка из 54 учителей. Анализировались возрастные группы, особое внимание уделялось младшей возрастной категории (средний возраст < 29 лет). Была составлена ​​таблица, включающая частоты, проценты, действительный процент (с учетом пропущенных данных) и кумулятивный процент. Цель состоит в том, чтобы вычислить ожидаемое значение и дисперсию. Для молодых учителей необходимо сделать выводы, предложить меры по улучшению и оценить вероятность того, что возраст учителя находится в диапазоне от 29 до 31 года.

Как действовать дальше: если таблица возрастов сгруппирована по интервалам, используется середина каждого интервала в качестве представителя xi и частота fi или процентное значение, допустимое в качестве веса. Для молодой группы (X < 29) классы с верхним пределом менее 29 отфильтровываются, а сумма частот масштабируется для представления общего числа в подгруппе. Условное математическое ожидание вычисляется следующим образом: E[X | X < 29] ≈ Σ xi pi|youngи условная дисперсия как Var(X | X < 29) ≈ Σ (xi - мкмолодой)² пi|youngДля группы лиц старше 29 лет (X ≥ 29) процесс повторяется с их классами.

Если таблица не сгруппирована и имеет конкретные возрастные группы с указанием частотытогда E[X] = (1/N) Σ xi fi и Var(X) = (1/N) Σ (x)i − μ)² fiДля условных версий по подгруппам, N заменяется размером подгруппы. (Nмолодой или Nне молодой) и суммируются только соответствующие частоты. Эта методология точно воспроизводит определение ожидаемого значения и дисперсии, адаптированное к реальным данным с группировкой или без нее.

Что можно заключить из этих результатов? Если E[X | X < 29] значительно меньше, а Var(X | X < 29] уменьшено, У молодой группы низкий и однородный средний возраст.Если другие показатели также указывают на лучшие результаты в классе для лиц с X < 29, это может быть связано с определенными современными методами обучения или большей адаптацией к активным методикам. Однако для установления причинно-следственных связей следует проявлять осторожность.Рекомендуется проверить опыт, квалификацию, доступ к ресурсам и стили руководства в этом центре.

Действия по улучшению результатов и достижений: (1) целенаправленное непрерывное образование в эффективных методологиях (активное обучение, формирующее оценивание, качественная обратная связь); (2) перекрестное наставничество между младшими и более опытными учителями для обмена инновациями и стратегиями управления классом; (3) сообществах практики с циклами взаимного наблюдения и улучшения; (4) доступ к образовательным ресурсам и технологии с технической поддержкой; и (5) мониторинг с использованием индикаторов Четкие показатели успеваемости учащихся, связывающие данные об успеваемости с педагогическими решениями.

Какова вероятность того, что возраст учителей будет от 29 до 31 года? Если таблица предоставляет частота встречаемости по возрасту или с небольшими интерваламиПросто сложите частоты 29, 30 и 31 (или интервал [29,31]) и разделите на общее число 54 учителей или на общее допустимое число, если есть потери. Если в таблице используются широкие интервалы (например, [28,32]), Его можно интерполировать пропорционально. Предположим равномерное распределение внутри интервала: P(29–31) ≈ (длина подинтервала)/(длина интервала) × (частота интервала)/N. Если бы существовало правдоподобное соответствие непрерывному распределению, Другой вариант — интегрировать плотность. Скорректировано в диапазоне от 29 до 31. Без конкретных данных назвать точное число невозможно, но процедура выполняется так, как описано.

Примечания и взаимосвязь с другими понятиями

Референтные распределения Биномиальное и нормальное распределения являются показательными примерами дискретных и непрерывных переменных соответственно. Изучение вероятностных распределений, математических ожиданий и дисперсий составляет основу вводных курсов. В углубленном статистическом выводе Возникают такие понятия, как информация Фишера, которая количественно определяет, сколько информации о параметре содержит случайное наблюдение, и имеет центральное значение для эффективности оценок и пределов Крамера-Рао.

Помимо теории, галереи и академические ресурсы Они помогают визуализировать концепции и расширяют область исследования. Существуют хранилища с графическими материалами по случайным величинам и обширная библиография, которая углубляется в основы и приложения. Эти опоры ценны. чтобы закрепить понимание и связать его с реальными проблемами.

Дополнительные материалы в формате PDF (внешняя ссылка)

Некоторые открытые и справочные материалы которые углубляются в определение и свойства случайных величин и распределений:

Давайте подведем итоги концептуальной архитектуры.Случайная величина — это измеримая функция, которая отображает результаты в числа; её кумулятивное распределение и, в непрерывном случае, плотность полностью кодируют её поведение; диапазон значений обозначает возможные значения; преобразования позволяют создавать новые переменные; а обобщающие величины, такие как математическое ожидание, дисперсия и моменты, синтезируют ключевые характеристики. На этих основахПримеры (от монет до осадков или возраста) анализируются с помощью уникального языка, связывающего теорию и практику.