Definition:
もし, $X\ge 0$ が $\mathbb{P}$-ほとんど確実に成り立つなら, 期待値[数学的期待値]は,\[\mathbb{E}[X]\;=\;\int_{\Omega} X\,\mathrm{d}\mathbb{P}\;=\;\sup\left\{\int_{\Omega} s\,\mathrm{d}\mathbb{P}:\ s\ \text{は単純関数},\ 0\le s\le X\right\}\]と定義される.ここで単純関数とは, $s=\sum_{i=1}^n a_i\mathbf{1}_{A_i}$($a_i\ge0$, $A_i\in\mathcal{F}$)の形の関数であり,その積分は $\displaystyle \int_{\Omega} s\,\mathrm{d}\mathbb{P}=\sum_{i=1}^n a_i\,\mathbb{P}(A_i)$ で与えられる.
期待値の最も根本的な定義は,非負の確率変数[非負可測関数]に対して積分を "単純関数で下から近似し,その上限として定義する" という形である.この方法はルベーグ積分の構成そのものである.\[\mathbb{E}[X]\;=\;\int_{\Omega} X\,\mathrm{d}\mathbb{P}\;=\;\sup\left\{\int_{\Omega} s\,\mathrm{d}\mathbb{P}:\ s\ \text{は単純関数},\ 0\le s\le X\right\}\]
期待値とは,確率変数の「平均的な値」を与える数学的概念であり,測度論的には確率測度に関するルベーグ積分として定義されるものである.まず,確率変数 $X$ は可測関数でなければならず,この可測性がない限り積分は定義できない.非負の可測関数の場合,期待値は単純関数[有限個の値を取り,各値の出現事象の確率が定義可能な関数]による近似の上限として構成される.単純関数 $s$ は $s = \sum_{i=1}^n a_i \mathbf{1}{A_i}$ の形を持ち,積分は $\sum{i=1}^n a_i \mathbb{P}[A_i]$ で計算される.単純関数列で下から近似し,その積分の極限を取ることにより一般の非負可測関数の積分が定義される.この構成の正当性は単調収束定理によって保証される.
一般の実数値可測関数 $X$ については,正の部分 $X^+$ と負の部分 $X^-$ に分解し,それぞれの積分が有限である場合にのみ $X$ は可積分であるといい,期待値 $\mathbb{E}[X]$ が定義できる.$X\ge0$ の場合,期待値は $+\infty$ となる可能性があるが,$\mathbb{E}[X^+]=\mathbb{E}[X^-]=+\infty$ の場合は $\infty-\infty$ という不定形となり,期待値は未定義である.
離散型の場合は確率質量関数を用いて $\mathbb{E}[X] = \sum x_i p_i$ と表せる.ここで級数の絶対収束が有限期待値の条件である.
連続型の場合は確率密度関数を用いて $\mathbb{E}[X] = \int x f_X[x] dx$ と表し,この積分の絶対値が有限であることが必要である.これらはいずれも測度論的定義の特殊化に過ぎない.
より一般には,確率変数 $X$ の分布 $\mu_X$ を用いると,任意の可測関数 $g$ に対して,より一般には,確率変数 $X$ の分布 $\mu_X$ を用いると,任意の可測関数 $g$ に対して\[\mathbb{E}[g[X]] = \int g[x] \, \mathrm{d}\mu_X[x]\]が成り立つ.これにより,確率空間 $\Omega$ 上での積分を $X$ の値域上での積分に変換できる.この事実は LOTUS[law of the unconscious statistician;無意識の統計学者の法則]として知られる.これは「確率変数の分布を介して期待値を計算できる」という事実を指す.
期待値は線形性や単調性といった重要な性質を持つ.すなわち,$X, Y$ が積分可能で $a, b \in \mathbb{R}$ に対して\[\mathbb{E}[aX + bY] = a \mathbb{E}[X] + b \mathbb{E}[Y]\]が成り立ち,また $X \ge Y$ がほとんど確実に成立すれば $\mathbb{E}[X] \ge \mathbb{E}[Y]$ である.さらに指示関数 $\mathbf{1}_A$ に対しては\[\mathbb{E}[\mathbf{1}_A] = \mathbb{P}[A]\]が成立する.
極限操作と期待値の交換は確率論の中心的道具である.非負増加列 $X_n \uparrow X$ については単調収束定理により\[\mathbb{E}[X_n] \uparrow \mathbb{E}[X]\]が成り立つ.また支配収束定理により,ある可積分関数 $Y$ が $|X_n| \le Y$ を満たし,かつ $X_n \to X$[ほぼ確実]ならば\[\mathbb{E}[X_n] \to \mathbb{E}[X]\]が保証される.
なお,$X$ の分布[プッシュフォワード測度] $\mu_X(B)=\mathbb{P}(X\in B)$ を用いると,任意の可測関数 $g:\mathbb{R}\to\mathbb{R}$ に対して,\[\mathbb{E}[g(X)]=\int_{\Omega} g(X(\omega))\,\mathrm{d}\mathbb{P}(\omega)=\int_{\mathbb{R}} g(x)\,\mathrm{d}\mu_X(x)\]が成り立つ.
Mathematics is the language with which God has written the universe.