どらちゃんのポッケ

R・統計・技術メモなど勉強ログ置き場

2014-04-01から1ヶ月間の記事一覧

word2vecを試してみたが・・・の話

動機 少し前からword2vecの存在は知っていたけど、下記の理由で流していた テキストマイニングなんて、結局は、辞書の出来と前処理でしょ?って思っていた Ngramとか、共起とか、そういったもので十分なのでは?って思っていた デーィブラーニングなんで、ニ…

pillowsのライブのセットリストをネットワーク分析で可視化してみた話

ライブに行ったとき、「次の曲はなんだろうな』「この曲のあとにあの曲は反則」とかセットリストで一喜一憂しますよね? セットリストの曲順のネットワークグラフ書いたら、ライブで演奏される曲のつながりが分かるのでは?と思い、セットリストのネットワー…

機械学習ハッカソンに参加してきた

機械学習ハッカソンに参加してきた tokyoRやqpstudyなど、他の魅力的な勉強会が裏で行われている中、機械学習ハッカソンに参加しました http://connpass.com/event/5607/ ハッカソンでやったこと ニューラルネットとSVMをRとpython(scikit-learn)で写経した …

pythonによるデータ分析入門を写経していく(numpyの使い方)

この本 numpyの配列の生成 pythonの配列を np.array()に渡して上げる In [337]: data1 = [1,2,3,4,5] In [338]: a = np.array(data1) In [339]: a Out[339]: array([1, 2, 3, 4, 5]) 配列の計算 Rと同じ感じ In [332]: data = array([[1,2,3],[4,5,6]]) In […

pythonによるデータ分析入門を写経していく(ipythonの使い方)

Ipythonについて Ipythonはタブ補完や、フォーマット整形などをしてくれる高性能pythonのコンソール python2系の場合はipython,3系の場合はipython3で起動する pythonの開発にリッチなIDEはいらない.Ipythonがあればいい!という意見があるようです。 たしか…

pythonによるデータ分析入門を写経していく(その3)

この本 データの縦横変換と集約 pandas.unstack() http://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.DataFrame.unstack.html In [177]: by_tz_os.size().unstack(1) Out[177]: not_windows windows tz 245 276 Africa/Cairo NaN 3 Afr…

pythonによるデータ分析入門を写経していく(その2)

pythonによるデータ分析入門を写経していってます。 pythonすごい便利。これはRからpythonに乗り換えたいって思ってきました。 とりあえずP25まで。進みが遅い・・・。 この本 リスト内包のif リスト内包にifで条件をつけることができる 下記の例は'tz'を…

pythonによるデータ分析入門を写経していく(その1)

pythonによるデータ分析入門 以下のようなモチベーションで、この本を読んで、写経していくことにする R以外の統計解析・機械学習の引き出しを増やしたい pythonを使えるようになりたい 本の環境はpython2系で行っていたが、私はpython3系でとりあえずスター…