朝が苦手な人間が綴るブログ (限界大学院生編)

基礎こそ物の上手なれ. 人間万事塞翁が馬. を大切にしている経済学徒.

What is z-score? Zスコアとは?

計量分析、統計学などでみるZスコアとは何か?

卒論の期限が迫っているのに、分析は終わっているのに、文字数が全然追いついていない。その卒論でもZスコアを用いて、Stataで分析しました。まだStataを使用して1年ちょっとの初学者ですが、また気が向けば?Stataについても書きます。

計量ソフトのStataとはこんなやつです。

f:id:econgrad:20171102202720p:plain

 データクリーニングのコードや、分析のコードなどを手前の"do file"というものに書いて、実際に回していくものです。こう思うと、計量分析をする経済学者が高給で民間企業に引き抜かれるのもわかりますよね。私も訓練すればプログラミングできるかなとたまに思います。

 

*完璧に説明できるほどの統計学的知識はありませんのでご留意ください。

 

本題:z-scoreとは何か。

論文とwebページから学びましたが、Zスコアは標準偏差(standard deviation)です。本当に先生に教わりたかったです。

例えば、z-scoreが2であれば、標準偏差も2となります。これは、p値を考えるときと同じように、標準正規分布で考えることができます。

f:id:econgrad:20171102014117j:plain

 

手書きで汚いですが、標準正規分布ですね。

このように、p値と関連付けて考えることができます。p値の有意水準、つまり、p値の低い値に対応するように、絶対値で高い水準のz-scoreが、標準正規分布の尾部にくるようになっています。

.

.

.

そうです、つまり外れ値のことを表しているのです。

絶対値なので、例えば、|z-score|> 2 なら、確率的にまあまあ起こりにくいということです。英語では、somewhat unlikely というはずです。

 

私の研究で分析の対象としているのはChild Healthです。この場合は、z-scoreのマイナスに注目します。健康状態が著しく悪い子どもがこれに対応します。

 

私の知識から書いたので、Poorな記事になってしまいました。

間違いなどご指摘、またその他何かありましたら、feel free to leave a comment :D