標準誤差 StandardEoor
標準誤差と標準偏差はよく混同されます。
標準誤差の説明の前に、統計をなぜ使うのかというところから説明します。
なぜ統計を使うのか?
心理学などのよくあるアンケートでは、人類一般・特定の属性を持つ人一般のことを測定することが目的です。
たとえば、「日本人の幸福度を測定したい」などですかね。
ここでひとつの問題があります。
日本人の幸福度を測定する方法として、日本人全員に対してアンケートを実施することができれば、真の値を得ることができます。
しかし、日本人全員にアンケートなんて、無理ですよね。
コストもかかるし、意味もあまりありません。
そこで、日本人の一部をサンプリングして、そのサンプルから全体を平均を予測します。
推測統計です。
サンプルを標本、全体を母集団と呼びます。
はい、ということで、標準偏差と標準誤差の違いものすごくザックリいうと。
標本内での誤差のばらつき→標準偏差(Standard Deviation) 標本間での誤差のばらつき→標準誤差(Standard Error)
先ほどの「日本人の幸福度を測定したい」という例で説明すると。
日本人の幸福度を推測するために、100人の標本(A)を集めました。
その標本Aの100人の中では、幸福度が高い人もいれば、低い人もいます。
このばらつきを示すのが、標準偏差です。
そして、標本Aの100人の平均がでます。
また、別の100人の標本Bを集め直し、幸福度を測定しました。
この標本B100人の中でも、幸福度が高い人もいれば、低い人もいます。
標本Bについても100人の平均がでます。
さて、標本Aと標本Bはそれぞれ別の100人です。
同じ母集団から標本をとっても、毎回平均が異なりますよね。
平均点も違います。このような標本間の平均のばらつきのことを標準誤差といいます。
標準誤差の求めかたですが・・・
標準誤差 = 標準偏差/√n
標準誤差は標準偏差をデータ数の平方根で割ったものです。
基本的に、標準誤差は標準偏差よりも小さい値になります。
感覚的にもわかると思います。
「各標本の平均」の平均の分布が標準誤差です。
んじゃ、次はRの使い方(記述統計編)。