周辺分布と条件付き分布

多次元確率変数において、各成分の分布や特定の条件のもとでの分布を記述するために、周辺分布および条件付き分布の概念が導入される。これらは同時分布から導出される基本的な構成であり、確率構造の分解と理解に不可欠である。

設定

確率空間 $(\Omega, \mathcal{F}, P)$ 上の2次元確率変数

\[(X,Y) : \Omega \to \mathbb{R}^2\]

を考える。このとき、同時分布は

\[P_{X,Y}(A) = P\big((X,Y) \in A\big), \quad A \subseteq \mathbb{R}^2\]

によって定義される。

周辺分布

周辺分布(marginal distribution)は、多次元分布から一部の変数に関する分布を取り出したものである。

離散型の場合

同時確率質量関数 $p(x,y) = P(X=x, Y=y)$ に対して、周辺分布は

\[p_X(x) = \sum_{y} p(x,y), \quadp_Y(y) = \sum_{x} p(x,y)\]

によって定義される。

連続型の場合

同時確率密度関数 $f(x,y)$ に対して、

\[f_X(x) = \int_{-\infty}^{\infty} f(x,y)\,dy, \quadf_Y(y) = \int_{-\infty}^{\infty} f(x,y)\,dx\]

が周辺密度関数である。

条件付き分布

条件付き分布は、一方の変数の値が与えられたもとでの他方の分布を記述する。

離散型の場合

$P(Y=y) > 0$ のとき、条件付き確率は

\[P(X=x \mid Y=y) = \frac{P(X=x, Y=y)}{P(Y=y)} = \frac{p(x,y)}{p_Y(y)}\]

と定義される。

連続型の場合

$f_Y(y) > 0$ のとき、条件付き密度関数は

\[f_{X \mid Y}(x \mid y) = \frac{f(x,y)}{f_Y(y)}\]

で定義される。

同時分布の分解

同時分布は、周辺分布と条件付き分布を用いて次のように分解される。

離散型

\[p(x,y) = p_Y(y)\,P(X=x \mid Y=y)\]

連続型

\[f(x,y) = f_Y(y)\,f_{X \mid Y}(x \mid y)\]

これは確率論における基本的な分解公式である。

全確率の法則(再表示)

周辺分布は条件付き分布を用いて再構成することもできる。

離散型

\[p_X(x) = \sum_{y} p_Y(y)\,P(X=x \mid Y=y)\]

連続型

\[f_X(x) = \int_{-\infty}^{\infty} f_Y(y)\,f_{X \mid Y}(x \mid y)\,dy\]

独立性との関係

確率変数 $X, Y$ が独立であるとは、

\[p(x,y) = p_X(x)\,p_Y(y)\quad \text{または} \quadf(x,y) = f_X(x)\,f_Y(y)\]

が成立することをいう。このとき条件付き分布は

\[P(X=x \mid Y=y) = P(X=x), \quadf_{X \mid Y}(x \mid y) = f_X(x)\]

となり、条件によらず分布が変化しない。

期待値の分解(条件付き期待値)

条件付き分布を用いると、期待値は次のように分解される。

\[\mathbb{E}[X] = \mathbb{E}[\mathbb{E}[X \mid Y]]\]

これは全期待値の法則と呼ばれる。

まとめ

周辺分布は多次元分布から個々の変数の分布を抽出する操作であり、条件付き分布は他の変数の値を固定したときの分布を与える。これらは同時分布の分解と再構成を可能にし、確率構造の理解と統計的推論において中心的な役割を果たす。

Mathematics is the language with which God has written the universe.





















期待値の定義と性質 分散と標準偏差 共分散と相関係数 モーメント母関数と特性関数 チェビシェフの不等式