多次元確率変数は、複数の確率変数を同時に扱うための枠組みであり、それらの相互関係を記述するために同時分布が導入される。この概念により、依存構造や相関関係を含む確率モデルの構築が可能となる。
確率空間 $(\Omega, \mathcal{F}, P)$ 上において、写像
\[X = (X_1, X_2, \dots, X_n) : \Omega \to \mathbb{R}^n\]
が多次元確率変数であるとは、任意のボレル集合 $B \subseteq \mathbb{R}^n$ に対して
\[\{\omega \in \Omega \mid X(\omega) \in B\} \in \mathcal{F}\]
が成立する、すなわち可測であることをいう。
多次元確率変数 $X = (X_1, \dots, X_n)$ に対して、その同時分布は
\[P_X(B) = P(X \in B), \quad B \in \mathcal{B}(\mathbb{R}^n)\]
によって定義される確率測度である。
同時分布は累積分布関数によっても表現される。
\[F_X(x_1, \dots, x_n) = P(X_1 \leq x_1, \dots, X_n \leq x_n)\]
この関数は各変数について単調非減少であり、右連続である。
離散型多次元確率変数に対しては、同時確率質量関数
\[p(x_1, \dots, x_n) = P(X_1 = x_1, \dots, X_n = x_n)\]
が定義され、
\[\sum_{x_1}\cdots\sum_{x_n} p(x_1, \dots, x_n) = 1\]
を満たす。
同時確率密度関数 $f(x_1, \dots, x_n)$ が存在する場合、
\[P(X \in A) = \int_A f(x_1, \dots, x_n)\,dx_1 \cdots dx_n\]
が成立する。
また、
\[F_X(x_1, \dots, x_n) = \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_n}f(t_1, \dots, t_n)\,dt_1 \cdots dt_n\]
が成り立つ。
同時分布から各成分の分布(周辺分布)を得ることができる。
例えば2次元の場合、
\[f_{X_1}(x_1) = \int_{-\infty}^{\infty} f(x_1, x_2)\,dx_2\]
である。
条件付き分布は、ある確率変数の値が与えられたときの他の変数の分布を表す。
連続型の場合、
\[f_{X_1 \mid X_2}(x_1 \mid x_2) = \frac{f(x_1, x_2)}{f_{X_2}(x_2)}\]
で定義される(ただし $f_{X_2}(x_2) > 0$)。
確率変数 $X_1, \dots, X_n$ が独立であるとは、
\[P(X_1 \in A_1, \dots, X_n \in A_n) = \prod_{i=1}^n P(X_i \in A_i)\]
が任意の集合 $A_1, \dots, A_n$ に対して成立することをいう。
密度関数が存在する場合、
\[f(x_1, \dots, x_n) = \prod_{i=1}^n f_i(x_i)\]
が成立する。
2次元確率変数 $(X,Y)$ に対して、共分散は
\[\mathrm{Cov}(X,Y) = \mathbb{E}[(X-\mathbb{E}[X])(Y-\mathbb{E}[Y])]\]
で定義される。
相関係数は
\[\rho = \frac{\mathrm{Cov}(X,Y)}{\sqrt{\mathrm{Var}(X)\mathrm{Var}(Y)}}\]
である。
多次元確率変数は、複数の確率変数を統一的に扱うための枠組みであり、その同時分布により依存構造が記述される。周辺分布や条件付き分布、独立性といった概念は、この同時分布から自然に導かれ、統計解析や確率モデルの構築において中心的な役割を果たす。
Mathematics is the language with which God has written the universe.