連続分布

Difinition:

連続分布[continuous distribution]とは,可測空間 $(\Omega, \mathcal{F})$ 上の確率測度 $\mathbb{P}$ であって,確率変数 $X: \Omega \to \mathbb{R}$ の像測度 $\mathbb{P}_X$ がルベーグ測度に対して絶対連続であり,ある非負関数 $f: \mathbb{R} \to [0, \infty)$[確率密度関数]が存在して,任意の可測集合 $A \subset \mathbb{R}$ に対し,\[\mathbb{P}_X(A) = \int_A f(x) \, dx\]を満たすものである.ここで,関数 $f$ は\[f(x) \geq 0,\quad \int_{-\infty}^{\infty} f(x) \, dx = 1\]を満たす.

また,連続分布の特徴として,任意の点 $x \in \mathbb{R}$ に対して,\[\mathbb{P}_X(\{x\}) = 0\]すなわち,1点集合の確率がゼロである確率測度であるという性質を持つ.

連続分布とは,確率が個々の点に集中せず,確率密度関数を通じて区間ごとの確率が積分で与えられる確率分布である.この点で離散分布と本質的に異なる.離散分布では,確率変数がとりうる値が高々可算な集合,つまり有限または可算無限個の個別の点に限定されるため,各点,すなわち1点からなる集合に対して正の確率質量が割り当てられる.言い換えれば,離散分布においては,少なくとも一つ以上の点集合が非ゼロの確率を持ち,それらの点の確率の和が1になることで全体の確率が分配されている.

一方,連続分布では,任意の単一の点,すなわち1点集合の確率は常にゼロである.これは確率が「点」ではなく「区間」という連続的な集合に分布していることを意味し,確率密度関数を用いて,任意の区間に含まれる確率をその区間にわたる密度関数の積分として表現する.したがって,連続分布の確率測度は,ある意味で「滑らかに」広がっており,確率の重みが点には集中していない.

より正確には,確率変数 $X$ が連続分布に従うとき,その分布は確率密度関数[probability density function, PDF]$f[x]$ によって特徴づけられる.確率密度関数は非負の実数値関数であり,$\int_{-\infty}^{\infty} f[x] dx = 1$ を満たす.任意の区間 $[a, b]$ に対して,確率変数 $X$ がその区間に含まれる確率は $P[a \leq X \leq b] = \int_a^b f[x] dx$ として計算される.重要な点は,連続分布においては $P[X = c] = 0$[任意の実数 $c$ に対して]であることであり,これにより $P[a \leq X \leq b] = P[a < X < b] = P[a \leq X < b] = P[a < X \leq b]$ がすべて等しくなる.

確率密度関数は確率そのものではなく,確率の「密度」を表す概念である.したがって,$f[x]$ の値が1を超えることも可能であり,これは確率の解釈と混同してはならない.密度関数の値が大きい領域ほど,その近傍に確率変数の値が現れやすいことを意味する.

連続分布の重要な特徴として,累積分布関数[cumulative distribution function, CDF]$F[x] = P[X \leq x] = \int_{-\infty}^x f[t] dt$ が連続関数となることが挙げられる.これは離散分布の累積分布関数が階段関数となることと対照的である.さらに,連続分布の累積分布関数は微分可能であり,$F'[x] = f[x]$[ほぼすべての点で]が成り立つ.

連続分布の代表例には,正規分布,指数分布,一様分布,ガンマ分布,ベータ分布などがある.これらの分布は,自然現象や社会現象の多くの場面でモデルとして用いられる.特に正規分布は中心極限定理により理論的重要性を持ち,多くの統計的推論の基礎となっている.

この対比は,確率変数の性質や解析手法に大きな影響を与える.離散分布では確率質量関数[probability mass function, PMF]が個別の点の確率を直接与え,和をとることで様々な確率を計算できる.一方連続分布では確率密度関数が確率の「密度」を示し,実際の確率は区間に対する積分によって求められるため,微積分の手法が不可欠である.期待値の計算においても,離散分布では $E[X] = \sum_x x \cdot P[X = x]$ となるのに対し,連続分布では $E[X] = \int_{-\infty}^{\infty} x \cdot f[x] dx$ として積分で表される.

測度論的観点から見ると,離散分布は可算個の点上に集中した原子測度[atomic measure]の性質を持つのに対し,連続分布はルベーグ測度に対して絶対連続な測度として特徴づけられる.これはラドン・ニコディム定理により,連続分布の確率測度がルベーグ測度に対する密度関数[すなわち確率密度関数]を持つことを保証している.

このように,離散分布は「可算個の特定の点に確率が集中」する分布であり,連続分布は「確率が点には集中せず,連続的な区間にわたって分布」するという基本的な違いがある.この区別は確率論や統計学の理論構築において基本的であり,適切な数学的手法の選択や現象のモデル化において重要な指針となる.理解を深めるためには,この両者の性質の違いを明確に意識し,それぞれに適した数学的取り扱いを習得することが不可欠である.

Mathematics is the language with which God has written the universe.





















自然対数の底 離散分布 確率測度 カタログ スターリングの公式 ガウス積分