朝が苦手な人間が綴るブログ (限界大学院生編)

基礎こそ物の上手なれ. 人間万事塞翁が馬. を大切にしている経済学徒.

回帰分析やエクセル統計で出てくるダミー変数とは②??(計量講義4)

前回は、ダミー変数は(0, 1)の値であるという説明をいたしました。

ダミー変数についての理解が十分でない方は下の①の記事を参照下さい。

 

もう1つ用語の説明を加えると、0の値をとるカテゴリーのグループのことを、

基準グループ(reference group)と言います(これは覚える重要性低い)。

 

この記事では数式での説明を行い、少しだけ数学的な説明をします。

初めてみる記号が変数に入っているとビビりますが、ただの記号です。

計量経済学を勉強している人誰にでも理解できるような説明を心がけます。

 

まず、タイトルの通りダミー変数を加えた回帰分析を考えます。

 

説明変数にダミー変数を加えた重回帰モデル

Y = β0 + δ0D + β1X + U

D: ダミー変数

δ: ダミー変数の係数

U: 誤差項

 

ここで、女性の場合D=1, 男性の場合D=0としましょう。 

すると、性別はダミー変数であるので、性別によって切片が「シフト」するモデルと考えることができます。

 

上の重回帰モデルから、男性の場合D=0なので、

Y = β0 + β1X + U

女性の場合はD=1なので、

Y = (β00) + β1X + U

 

となります。この2つの回帰モデルの違いは、切片パラメーターであります。

男性の場合は、切片パラメーターは βであるのに対し、

女性の場合は、切片パラメーターは00) であります。

 

図示すると、こうなります(雑ですいません)。

f:id:econgrad:20171119020013j:plain

 

これが、回帰モデルにダミー変数を加えた場合の解釈になります。

ダミー変数をモデルに組み込んでいるのは、(この場合では)男女の結果に差があると仮定しているためであります。

もし、男性と女性の結果(所得など)が平均的に異なるのであれば、δ0≠0 ということになるので、上のグラフのような回帰線が描かれます。

逆に、男女間で所得が平均的に同じであるならば、δ0=0 となり、1本の回帰線が描かれることになります。

 

これが、回帰分析にダミー変数を加えた場合の解釈となります。

この話だけで終わろうと思いましたが、回帰分析でのダミー変数を用いた場合、

交差項(interaction term)の概念も入ってきますので、「ダミー変数とは③」で書こうかと思います。