多次元確率変数と同時分布

多次元確率変数は、複数の確率変数を同時に扱うための枠組みであり、それらの相互関係を記述するために同時分布が導入される。この概念により、依存構造や相関関係を含む確率モデルの構築が可能となる。

多次元確率変数の定義

確率空間 $(\Omega, \mathcal{F}, P)$ 上において、写像

\[X = (X_1, X_2, \dots, X_n) : \Omega \to \mathbb{R}^n\]

が多次元確率変数であるとは、任意のボレル集合 $B \subseteq \mathbb{R}^n$ に対して

\[\{\omega \in \Omega \mid X(\omega) \in B\} \in \mathcal{F}\]

が成立する、すなわち可測であることをいう。

同時分布

多次元確率変数 $X = (X_1, \dots, X_n)$ に対して、その同時分布は

\[P_X(B) = P(X \in B), \quad B \in \mathcal{B}(\mathbb{R}^n)\]

によって定義される確率測度である。

同時分布関数

同時分布は累積分布関数によっても表現される。

\[F_X(x_1, \dots, x_n) = P(X_1 \leq x_1, \dots, X_n \leq x_n)\]

この関数は各変数について単調非減少であり、右連続である。

離散型の場合

離散型多次元確率変数に対しては、同時確率質量関数

\[p(x_1, \dots, x_n) = P(X_1 = x_1, \dots, X_n = x_n)\]

が定義され、

\[\sum_{x_1}\cdots\sum_{x_n} p(x_1, \dots, x_n) = 1\]

を満たす。

連続型の場合

同時確率密度関数 $f(x_1, \dots, x_n)$ が存在する場合、

\[P(X \in A) = \int_A f(x_1, \dots, x_n)\,dx_1 \cdots dx_n\]

が成立する。

また、

\[F_X(x_1, \dots, x_n) = \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_n}f(t_1, \dots, t_n)\,dt_1 \cdots dt_n\]

が成り立つ。

周辺分布

同時分布から各成分の分布(周辺分布)を得ることができる。

例えば2次元の場合、

\[f_{X_1}(x_1) = \int_{-\infty}^{\infty} f(x_1, x_2)\,dx_2\]

である。

条件付き分布

条件付き分布は、ある確率変数の値が与えられたときの他の変数の分布を表す。

連続型の場合、

\[f_{X_1 \mid X_2}(x_1 \mid x_2) = \frac{f(x_1, x_2)}{f_{X_2}(x_2)}\]

で定義される(ただし $f_{X_2}(x_2) > 0$)。

独立性

確率変数 $X_1, \dots, X_n$ が独立であるとは、

\[P(X_1 \in A_1, \dots, X_n \in A_n) = \prod_{i=1}^n P(X_i \in A_i)\]

が任意の集合 $A_1, \dots, A_n$ に対して成立することをいう。

密度関数が存在する場合、

\[f(x_1, \dots, x_n) = \prod_{i=1}^n f_i(x_i)\]

が成立する。

共分散と相関

2次元確率変数 $(X,Y)$ に対して、共分散は

\[\mathrm{Cov}(X,Y) = \mathbb{E}[(X-\mathbb{E}[X])(Y-\mathbb{E}[Y])]\]

で定義される。

相関係数は

\[\rho = \frac{\mathrm{Cov}(X,Y)}{\sqrt{\mathrm{Var}(X)\mathrm{Var}(Y)}}\]

である。

まとめ

多次元確率変数は、複数の確率変数を統一的に扱うための枠組みであり、その同時分布により依存構造が記述される。周辺分布や条件付き分布、独立性といった概念は、この同時分布から自然に導かれ、統計解析や確率モデルの構築において中心的な役割を果たす。

Mathematics is the language with which God has written the universe.





















周辺分布と条件付き分布 期待値の定義と性質 分散と標準偏差 共分散と相関係数 モーメント母関数と特性関数