朝が苦手な人間が綴るブログ (限界大学院生編)

基礎こそ物の上手なれ. 人間万事塞翁が馬. を大切にしている経済学徒.

統計学における期待値の説明と証明(例題を用いた簡単な解説付き)

統計学を勉強をすると、初めに学ぶのことの1つに期待値と分散があります。
私は経済学部に入学してから統計学を知り、統計学統計学の理論を基礎とする計量経済学を学んでいます。復習などを目的の1つとしたこのブログで、Texのプログラミングの練習がてらにまずは期待値について書いてみようと思います。

f:id:econgrad:20180228202636j:plain

期待値とは何か

期待値とは、統計学における目安というか、データや試行(サイコロなど)を説明するのに用いられるものであり、数値として得られるある結果の平均値のこと。平均またはどんな結果が期待できるかといったものである。

期待値の計算

サイコロを1回振ることを考えましょう。統計学や確率論ではあるあるの前提ですが、このサイコロはイカサマなどされていないものとする。
このときの、サイコロの各目(1〜6)が出る確率は(自明ですが)以下の通り。

サイコロのとる目の値 |1|2|3|4|5|6|計 ------------------------------|:-:|:-:|:-:|:-:|:-:|:-:|:-:|

その確率| \displaystyle\frac{1}{6}| \displaystyle\frac{1}{6}| \displaystyle\frac{1}{6}| \displaystyle\frac{1}{6}| \displaystyle\frac{1}{6}| \displaystyle\frac{1}{6}|1|

ここで、大数の法則とう理論がありますが、それを無視して直感的にサイコロを1回振ると出る値は以下のような計算で期待できる。

\begin{align} 1 \times \frac{1}{6} + 2 \times \frac{1}{6} + 3 \times \frac{1}{6} + 4 \times \frac{1}{6} + 5 \times \frac{1}{6} + 6 \times \frac{1}{6} \\ = \left(\frac{1}{6}\right) (1+2+3+4+5+6) = \frac{7}{2} = 3.5 \end{align}

となり、期待される値は3.5となる。これは上の表のそれぞれ上と下をかけて足し合わせただけである。

 \sumを使った表記をすると、より簡単に書くことができる。

を使った離散型確率変数の期待値の定義
\begin{equation} E[X] = \sum_{i=1}^n x_i p_i \end{equation}

と書くことができる。ここで E[X]の Eとは、期待値(expectation)からきている。 p_iは、 i番目における確率のこと。

上の公式を使った例題
Xのとる値  x_1 =15  x_2 =20  x_3 =17  x_4 =39  x_5 =10  x_6 =26
その確率  \displaystyle\frac{20}{100}  \displaystyle\frac{15}{100}  \displaystyle\frac{10}{100}  \displaystyle\frac{30}{100}  \displaystyle\frac{5}{100}  \displaystyle\frac{20}{100} 1

\begin{align} \sum_{x=1}^6 &= 15 \left( \frac{20}{100} \right) + 20 \left( \frac{15}{100} \right) + 17 \left( \frac{10}{100} \right) + 39 \left( \frac{30}{100} \right) + 10 \left( \frac{5}{100} \right) + 26 \left( \frac{20}{100} \right) \\ &= 3+3+1.7+11.7+0.5+5.2 \\ &= 25.1 \end{align}

という風になる。特にサイコロなど具体的な例はあげていないが、このように計算できると分かれば大丈夫。

積分でも期待値は表せる

サイコロなどを含む上の例は、 Xの値として、1.5などの小数の値はとらないことが前提としてあった。
しかし、身長や所得など、現実の多くのデータは小数第何位までなどと、連続した値をとることになる。
そのような変数のことを統計学では連続型確率変数といい、ある確率変数 f(x_i)を、確率変数 f(x)に置き換えることにより、上の総和記号 \sumで表したものを積分記号 \intで同じように定義することができる。

\begin{equation} \int_{-\infty}^\infty x{\space}f(x) dx \end{equation}

これは、連続型確率変数の期待値(平均)の定義を表している。
その確率変数は以下の汚い手書きのグラフになっており、このヒストグラム(のようなもの)の上を結んでいる曲線が f(x)であり、この f(x)確率密度関数(probability density function)という。

f:id:econgrad:20180301235337j:plain

全ての連続型確率変数 Xに対して、確率密度関数を考えることができる。

確率密度関数には3つの性質がある。

  1.  \displaystyle
\int_{-\infty}^\infty f(x) dx =1
  2.  \displaystyle
P(a \leq X \leq b) = \int_{a}^b f(x) dx
  3.  \displaystyle f(x) \geq 0
ヒストグラムをイメージして証明してみる

\begin{equation} \int_{-\infty}^\infty x{\space}f(x) dx \end{equation}
の証明をしてみよう。

どんなな形でもいいが確率密度関数ヒストグラムをイメージしてみよう。
 Nをサンプル数、 x_iを階級値、 f_iヒストグラムの棒の高さとする。
すると、ヒストグラムの平均 \overline {x}は、

\begin{eqnarray} \overline{x} &=& \left( \frac{1}{N} \right) \sum_i f_i x_i \\ &=& \left( \frac{1}{N \Delta x} \right) (\sum_i f_i x_i \Delta x) \\ &=& \sum_i \left( \frac{f_i}{S} \right) x_i \Delta x \\ &=& \sum_i f_i^{'} x_i \Delta x \\ N \to \infty,{\space} \Delta x \to 0 \\ \end{eqnarray} (すなわち刻み幅を0)とすると、

連続型確率変数の期待値の定義 \begin{eqnarray} E[X] = \int_{-\infty}^\infty x f(x) dx \end{eqnarray}

となる。 Q.E.D.

例題:積分を使って期待値を求めよう

ここで、

  •  f_i^{'}という個々のヒストグラムの棒の高さは、 f(x)となる
  •  \Delta x \to 0だから、個々の階級の階級値は横軸の値 xとみなせる
  •  \Delta xは、積分したときの dxに対応する

という感じになります。

ここで、 x軸上の a bの点をとる関数
 f(x) = \left( \frac{1}{b-a} \right)
の連続一様分布を考えてみよう(ただし(a < b)である)。

このときの期待値は
\begin{eqnarray} E[X] &=& \int_a^{b} x f(x) dx \\ &=& \int_a^{b} x \left( \frac{1}{b-a} \right) dx \\ &=& \frac{1}{b-a} \int_a^{b} x dx \\ &=& \frac{1}{b-a} \left[ \frac{x^2}{2} \right]_a^b \\ &=& \frac{1}{2(b-a)} (b^2 - a^2) \\ &=& \frac{1}{2(b-a)} (b+a)(b-a) \\ &=& \frac{a+b}{2} \end{eqnarray}

積分の範囲が a \sim bである理由は、それ以外の領域では0となり、積分結果には影響を与えないからである。

このケースにおける簡単な説明

  •  a \sim bの範囲内のどの値も同様に、どの xも同じ出やすさででるため、この分布のことを一様分布と呼ぶ。
  • その連続型確率変数についての平均値は、 a \sim bのど真ん中、つまり \frac {a+b}{2}となる(これは直感的に理解できるだろう)。

さいごに

最後まで読んでいただきありがとうございました。
何か誤値などありましたら、コメント欄にて教えていただけると幸いです。
この記事が参考になったと思う方は最後にポチッと☆+をお願いします!

参考文献

です!基本統計学は良書ですので、興味のある人はCheck It Out!!