どらちゃんのポッケ

R・統計・技術メモなど勉強ログ置き場

標準誤差 StandardEoor

標準誤差と標準偏差はよく混同されます。

標準誤差の説明の前に、統計をなぜ使うのかというところから説明します。



なぜ統計を使うのか?
心理学などのよくあるアンケートでは、人類一般・特定の属性を持つ人一般のことを測定することが目的です。
たとえば、「日本人の幸福度を測定したい」などですかね。

ここでひとつの問題があります。
日本人の幸福度を測定する方法として、日本人全員に対してアンケートを実施することができれば、真の値を得ることができます。

しかし、日本人全員にアンケートなんて、無理ですよね。
コストもかかるし、意味もあまりありません。

そこで、日本人の一部をサンプリングして、そのサンプルから全体を平均を予測します。
推測統計です。
サンプルを標本、全体を母集団と呼びます。

はい、ということで、標準偏差と標準誤差の違いものすごくザックリいうと。

標本内での誤差のばらつき→標準偏差(Standard Deviation)
標本間での誤差のばらつき→標準誤差(Standard Error)

先ほどの「日本人の幸福度を測定したい」という例で説明すると。
日本人の幸福度を推測するために、100人の標本(A)を集めました。
その標本Aの100人の中では、幸福度が高い人もいれば、低い人もいます。
このばらつきを示すのが、標準偏差です。
そして、標本Aの100人の平均がでます。

また、別の100人の標本Bを集め直し、幸福度を測定しました。
この標本B100人の中でも、幸福度が高い人もいれば、低い人もいます。
標本Bについても100人の平均がでます。

さて、標本Aと標本Bはそれぞれ別の100人です。
同じ母集団から標本をとっても、毎回平均が異なりますよね。
平均点も違います。このような標本間の平均のばらつきのことを標準誤差といいます。

標準誤差の求めかたですが・・・

標準誤差 = 標準偏差/√n

標準誤差は標準偏差をデータ数の平方根で割ったものです。
基本的に、標準誤差は標準偏差よりも小さい値になります。
感覚的にもわかると思います。
「各標本の平均」の平均の分布が標準誤差です。


んじゃ、次はRの使い方(記述統計編)。