多次元確率変数において、各成分の分布や特定の条件のもとでの分布を記述するために、周辺分布および条件付き分布の概念が導入される。これらは同時分布から導出される基本的な構成であり、確率構造の分解と理解に不可欠である。
確率空間 $(\Omega, \mathcal{F}, P)$ 上の2次元確率変数
\[(X,Y) : \Omega \to \mathbb{R}^2\]
を考える。このとき、同時分布は
\[P_{X,Y}(A) = P\big((X,Y) \in A\big), \quad A \subseteq \mathbb{R}^2\]
によって定義される。
周辺分布(marginal distribution)は、多次元分布から一部の変数に関する分布を取り出したものである。
同時確率質量関数 $p(x,y) = P(X=x, Y=y)$ に対して、周辺分布は
\[p_X(x) = \sum_{y} p(x,y), \quadp_Y(y) = \sum_{x} p(x,y)\]
によって定義される。
同時確率密度関数 $f(x,y)$ に対して、
\[f_X(x) = \int_{-\infty}^{\infty} f(x,y)\,dy, \quadf_Y(y) = \int_{-\infty}^{\infty} f(x,y)\,dx\]
が周辺密度関数である。
条件付き分布は、一方の変数の値が与えられたもとでの他方の分布を記述する。
$P(Y=y) > 0$ のとき、条件付き確率は
\[P(X=x \mid Y=y) = \frac{P(X=x, Y=y)}{P(Y=y)} = \frac{p(x,y)}{p_Y(y)}\]
と定義される。
$f_Y(y) > 0$ のとき、条件付き密度関数は
\[f_{X \mid Y}(x \mid y) = \frac{f(x,y)}{f_Y(y)}\]
で定義される。
同時分布は、周辺分布と条件付き分布を用いて次のように分解される。
\[p(x,y) = p_Y(y)\,P(X=x \mid Y=y)\]
\[f(x,y) = f_Y(y)\,f_{X \mid Y}(x \mid y)\]
これは確率論における基本的な分解公式である。
周辺分布は条件付き分布を用いて再構成することもできる。
\[p_X(x) = \sum_{y} p_Y(y)\,P(X=x \mid Y=y)\]
\[f_X(x) = \int_{-\infty}^{\infty} f_Y(y)\,f_{X \mid Y}(x \mid y)\,dy\]
確率変数 $X, Y$ が独立であるとは、
\[p(x,y) = p_X(x)\,p_Y(y)\quad \text{または} \quadf(x,y) = f_X(x)\,f_Y(y)\]
が成立することをいう。このとき条件付き分布は
\[P(X=x \mid Y=y) = P(X=x), \quadf_{X \mid Y}(x \mid y) = f_X(x)\]
となり、条件によらず分布が変化しない。
条件付き分布を用いると、期待値は次のように分解される。
\[\mathbb{E}[X] = \mathbb{E}[\mathbb{E}[X \mid Y]]\]
これは全期待値の法則と呼ばれる。
周辺分布は多次元分布から個々の変数の分布を抽出する操作であり、条件付き分布は他の変数の値を固定したときの分布を与える。これらは同時分布の分解と再構成を可能にし、確率構造の理解と統計的推論において中心的な役割を果たす。
Mathematics is the language with which God has written the universe.