どらちゃんのポッケ

R・統計・技術メモなど勉強ログ置き場

気圧と自分の体調の関係の可視化 その2

気圧と体調の善し悪しの関係をモデリングする

  • 前回の記事の続きです
  • 前回の内容は、気圧と体調の関係を可視化するために、気圧と体調の記録用のiphoneアプリを作成し、データを収集しました

ロジステック回帰

  • ロジステック回帰についてはこの辺の資料を参考にしてください
  • 誤解を恐れずに雑にまとまると、ロジステック回帰は従属変数がカテゴリ変数などの離散(連続変数でない)を扱う回帰分析でしょうか
  • 独立変数が気圧(連続変数)、従属変数が体調の善し悪し(離散変数)としてモデリングしてみます

Rでモデリングしてみる

  • ということでRのコード

データ(output.txt)

1,1,1,0,1,436055755.676608,1007.324982
2,1,1,0,0,436104325.90339,1007.113419
3,1,1,0,0,436104344.141229,0.0
4,1,1,0,0,436104352.560469,1007.164841
5,1,1,0,0,436104641.950152,1007.14035
6,1,1,0,0,436104681.293719,1007.212906
7,1,1,0,0,436104747.788622,1007.245407
8,1,1,0,1,436104787.410669,1007.202225
9,1,1,0,0,436353989.101696,1020.320358
10,1,1,0,0,436354327.143468,1020.328217
11,1,1,0,0,436354357.956097,1020.381546
〜以下略〜

Rのコード

    d<-read.csv("output.txt")
    d<-d[7:length(d$X1),] //余計なテストデータの削除
    names(d) <- c('id','id2',"--","-","condition","timestamp","press")

    condition.glm <- glm(condition~press, data=d, family=binomial)
    summary(condition.glm)

- 結果

f:id:sleeping_micchi:20141201234755p:plain

あまり気圧の影響は強くないですが、一応有意になりました。

  • plotしてみると・・・

f:id:sleeping_micchi:20141201234937p:plain

Rでのモデリングはできたので、次は今回のモデルでの予測の的中率の検証と、同じロジステック回帰をpython/Azureをつかってやってみたいとおもいます。