「期待値」のことを「平均」(「平均値」ではない)という場合もある。しかしながら,後述するとおり,「期待値」と「平均値」は別物であるから紛らわしい。ここでは「期待値」で統一して表現する。
「赤玉 \( 3 \) 個,白玉 \( 2 \)個が入った袋から,玉を \( 2 \) 個取り出す」という試行を考える。確率変数 \( X \) を「取り出した赤玉の個数」とすると,確率分布は, \begin{array}{c|ccc|c} X & 0 & 1 & 2 & \text{計} \\ \hline P & \dfrac{1}{10} & \dfrac{6}{10} & \dfrac{3}{10} & 1 \\ \end{array} となる。よって, \( X \)の期待値 \( E(X) \) は, \begin{eqnarray} E(X) &=& 0 \cdot \dfrac{1}{10} + 1 \cdot \dfrac{6}{10} + 2 \cdot \dfrac{3}{10} \\ &=& \dfrac{6}{5} \end{eqnarray}
「期待値」の定義は次のとおり。
「平均値」の定義は次のとおり。
これらの定義から分かるように,
である。そもそも対象としているものが異なる。
期待値については,まず最初に試行があって,その試行に対して確率変数を定めると,その確率変数がとりうるすべての値と,その値をとる確率から期待値が求められる。実際にその試行を行う必要はない。確率変数理論上の数値である。「期待値」という言葉のとおり,「もしこれからその試行を \( 1 \) 回行うとすると,確率変数はどれくらいの値をとることが期待されるか」を表す。
平均値については,まずデータ(値の集合)があって,データの値をすべて足して,値の個数で割ることでデータの平均値が求まる。「平均値」という言葉のとおり,「データの各値を,その総和を保って平らに均したとき,すなわちデータの各値を同じ値にしたとき,各値はどのような値になるか」を表す。試行や確率変数は関係ない。
期待値を考えるうえで,試行や確率変数は関係ない。関係するのはデータだけである。ただし,そもそものデータをつくる際に試行や確率変数が関わることはあり得る。例えば「赤玉 \( 3 \) 個,白玉 \( 2 \)個が入った袋から,玉を \( 2 \) 個取り出すという試行に対して,取り出した赤玉の個数を確率変数 \( X \) とする。この試行を \( 10 \) 回繰り返したときに,それぞれの \( X \) の値を記録したデータ」などの場合である。この場合は,\( 10 \) 個の値を持つデータがあるので,それらの値を足して, \( 10 \) で割れば平均値が求まる。これはあくまでも確率変数 \( X \) の値を集めてつくったデータの平均値である。確率変数 \( X \) の平均値ではない( \( X \) の平均値と表現する人もいるが)。
期待値は,確率変数がとりうるすべての値と,その値をとる確率から求められる。実際にその試行を行う必要はない。一方で平均値は,実際に試行をおこなわないと求めることができない。試行の結果得られた値の集合(データ)から平均値が求められる。
例えば, \[ \{1, 2, 2, 3, 3, 3 \} \] というデータを考えてみよう。このデータの平均値を \( m \) とすると, \begin{eqnarray} m &=& \dfrac{1 + 2 + 2 + 3 + 3 + 3}{6} \\ &=& \dfrac{7}{3} \end{eqnarray} となる。また,このデータの相対度数分布を考えると, \begin{array}{c|c} \text{値} & \text{相対度数} \\ \hline 1 & \dfrac{1}{6} \\ 2 & \dfrac{2}{6} \\ 3 & \dfrac{3}{6} \\ \hline \text{計} & 1 \end{array} となる。ここで,「このデータから値を \( 1 \) つ無作為に取り出す」という試行について考えてみよう。取り出した値を \( X \) とすると, \( X \) は確率変数である。 \( X \) の確率分布は, \begin{array}{c|ccc|c} X & 1 & 2 & 3 & \text{計} \\ \hline P & \dfrac{1}{6} & \dfrac{2}{6} & \dfrac{3}{6} & 1 \\ \end{array} となる。先ほどのデータの相対度数分布と一致している。また,確率変数 \( X \) の期待値 \( E(X) \) は, \begin{eqnarray} E(X) &=& 1 \cdot \dfrac{1}{6} + 2 \cdot \dfrac{2}{6} + 3 \cdot \dfrac{3}{6} \\ &=& \dfrac{7}{3} \end{eqnarray} となる。先ほどのデータの平均値と一致している。ただしこれは,「『あるデータから値を \( 1 \) つ無作為に取り出す』という試行において,取り出した値を確率変数 \( X \) とすると, \( X \) の期待値はデータの平均値と一致する」というだけである。特殊な設定上では期待値と平均値が同じになるということである。一般に期待値と平均値が同じものであるということではない。
人によっては,期待値のことを「平均」と言ったり,期待値と平均値は同じであると言ったりする。定義や解釈が違えば,期待値と平均値の意味も変わるため,一概にそれはおかしいとは言えないが,この先,期待値と平均値を混同して学習を進めていくと勘違いしやすいので,ここでは,上述のように期待値と平均値を定め,別物として扱っていく。