どらちゃんのポッケ

R・統計・技術メモなど勉強ログ置き場

路線の隣接駅データからハブ駅を見つけた話

やってみたこと

駅データ.jpのデータを使って、東京都にある駅のネットワークグラフを作成して、 ハブになる駅やグループを導きだした

駅データ.jpとは

駅データ.jpとは、日本の鉄道駅の情報(駅データ)を配布するサイトです。 当サイトで提供している駅データは、法人・個人及び、商用・非商用を問わず、どなたでもご利用いただくことができます。(抜粋)

実装について

環境

  • mac os x
  • R 3.0.2
    • 使ったパッケージ

        library(XML)
        library(foreach)
        library(igraph)
        library(linkcomm)
      

コード

Rのコードについて

  • xmlのパーサを久々につかったのですが、xmlSApply(doc, function(x) xmlSApply(x, xmlValue))でまるっとxmlタグを外してくれるので、便利でした
  • あと、foreachパッケージも初めて使ってみた
    • 今回はやらなかったけども、並列化もできるようで、今度試してみよう
  • ネットワーク分析については、おなじみの感じで特に、コメントないです

データについて

  • 駅データ.jpで提供されている隣接駅取得APIから取得している -[品川-大崎]みたいに返される
  • 東京都内にある路線のデータを取得
  • 新幹線は含まない

結果

概ねいい感じ

f:id:sleeping_micchi:20140812222515p:plain

見にくい場合は、同じ結果のPDFをgithubに置いたので、そちらからダウンロードして見てください。 https://github.com/michitakaiida/station_network/blob/master/Rplot14.pdf

  • 羽田空港のまわりや八王子が孤立していたり、するのも納得
  • 新宿と渋谷は近いけど、違うコミュニティに属していて、そう言われればそうな気もする
    • 渋谷は原宿とかと近くて、私鉄の影響かな
  • 吉祥寺ー中野ー新宿ー池袋ー上野ー大宮と新宿を中心につながっていて、新宿のハブ感が半端なかった
  • 東京駅がハブとしてでなかったのは、以外だった。JRのみだからハブ感がでなかったのではないかしら。

これに加えたいこと

  • 線の太さを乗客数とかで表現したり、人の流れとこのコミュニティで同じようになっているかどうかの検討
  • 地域ブランドイメージの結果が公開されていたら、そのデータと比較してみたり
  • linkcommで小さいつながりを消してしまっているが、大量nodeがある場合でのビジュアルの表現をどうしたら奇麗になるかの検討

以上