確率変数は、確率空間上の結果を数値へ対応させる写像として定義される概念であり、確率論を解析学的に扱うための基本的構成要素である。確率変数の導入により、抽象的な事象の代わりに数値的対象を扱うことが可能となる。
確率空間 $(\Omega, \mathcal{F}, P)$ において、写像
\[X : \Omega \to \mathbb{R}\]
が確率変数であるとは、任意のボレル集合 $B \subseteq \mathbb{R}$ に対して
\[\{\omega \in \Omega \mid X(\omega) \in B\} \in \mathcal{F}\]
が成り立つ、すなわち $X$ が可測であることをいう。
この条件により、確率
\[P(X \in B)\]
が意味を持つようになる。
可測性は、確率変数に対して確率測度を引き戻すことを可能にする条件である。すなわち、確率変数 $X$ によって、実数直線上のボレル集合族 $\mathcal{B}(\mathbb{R})$ に対し、
\[P_X(B) = P(X \in B)\]
と定義される測度 $P_X$ が誘導される。この $P_X$ を $X$ の分布という。
確率変数 $X$ に対して、その分布は累積分布関数(cumulative distribution function)によって特徴づけられる。
\[F_X(x) = P(X \leq x)\]
この関数は以下の性質を満たす:
確率変数は、その分布の性質により大きく分類される。
取りうる値が可算集合であり、確率質量関数 $p(x)$ によって
\[P(X = x) = p(x), \quad \sum_x p(x) = 1\]
と表される。
確率密度関数 $f(x)$ が存在し、
\[P(a \leq X \leq b) = \int_a^b f(x)\,dx\]
と表される。このとき、
\[F_X(x) = \int_{-\infty}^{x} f(t)\,dt\]
が成立する。
確率変数に対しては、その平均的な値やばらつきを測る量が定義される。
期待値:
\[\mathbb{E}[X] =\begin{cases}\sum_x x\,p(x) & \text{(離散型)} \\\int_{-\infty}^{\infty} x f(x)\,dx & \text{(連続型)}\end{cases}\]
分散:
\[\mathrm{Var}(X) = \mathbb{E}[(X - \mathbb{E}[X])^2]\]
確率変数 $X$ に対して、可測関数 $g$ を作用させた $Y = g(X)$ も確率変数となる。このとき分布は
\[P(Y \in B) = P(g(X) \in B)\]
によって与えられる。
複数の確率変数をまとめて扱う場合、ベクトル値確率変数
\[X = (X_1, \dots, X_n) : \Omega \to \mathbb{R}^n\]
を考える。このとき、同時分布や周辺分布、条件付き分布が定義される。
確率変数は、確率空間から実数空間への可測写像として定義され、その分布を通じて確率論の解析的展開を可能にする。可測性により確率測度の引き戻しが保証され、期待値や分散といった統計量の定義が成立する。この概念は、確率論を関数解析的枠組みへと拡張する基礎である。
Mathematics is the language with which God has written the universe.