どらちゃんのポッケ

R・統計・技術メモなど勉強ログ置き場

統計的因果探索を読んだ。「なるほど!」がたくさんだった。

統計的因果分析に興味があり、岩波データサイエンス Vol.3「原因と結果」の経済学を読んだり、最近、ちょっとずつ勉強しているのですが、ようやく、この本を読むことができました。

新たな発見がわかりやすく書かれていて、震えるほど、めっちゃ良い本でした。

統計的因果探索 (機械学習プロフェッショナルシリーズ)

統計的因果探索 (機械学習プロフェッショナルシリーズ)

因果と相関の違い・統計的因果推論の概要・LiNGAMの仕組みなどが書かれていて、 因果推論・統計的因果推論はどのように考えたら良いのか?を把握することができました。 (正直、まだLiNGAMの仕組みは全然理解できていないけれども・・・)

第1章で、相関と因果は違うよ?というのを”理論”と”実際のデータシュミレーション”の両方で 示していて、「なるほどねー!」と因果の世界に引き込まれました。 第1章の「 統計的因果探索の出発点」だけでも読んでみる価値は十分にあると思います。

社会心理学会の春の方法論セミナーで一度清水先生のお話を聴いたことはあるけれど、その時は事前知識がなさすぎて全くついていけなかったので、この本を読んだ後、清水先生の公演をもう一度聞きたい・・・

ロボット入門:読書メモ

ロボットの勉強始めようかと思って、下の本、読んだ。

ロボット入門 (図解ロボット技術入門シリーズ)

ロボット入門 (図解ロボット技術入門シリーズ)

制御系・動力系・ソフトウェア・・・。総合力が必要とされるロボットの勉強、何をどう始めればいいんだ?と思ってところに、この本に出会った。

すべてが網羅的に触られていて非常によかった 以下、キーワードメモ!

ロボット入門

概要

ロボットの三原則

  • ロボットは人間に危害を加えてはならない。また人間に危害が及ぶのを見逃してはならない
  • ロボットは人間から与えられた命令に従わなければならない。ただし、与えられた命令が第1条に反する場合はこの限りではない
  • ロボットは第1条と第2条に反しない限り、自分自身を守らなくてはならない

種類

  • 多目的ロボット
  • コミュニケーションロボット
  • 接客ロボット
  • 施業支援ロボット
  • 清掃ロボット
  • 警備ロボット
  • レスキューロボット
  • 福祉ロボット
  • 医療ロボット
  • 玩具ロボット

ロボットの構成

アクチュエーター

  • 入力されたエネルギーを物理的な運動へと変換する機構
  • 肩、ひじ、手首んアドの関節部分などの駆動源
  • 種類

    • 電力モータ(ACモータ、DCモータ、空気圧、油圧、ピエゾ素子、人工筋肉など)
  • 動力源

    • アクチュエーターを動かすもの
    • ロボットの用途や使用するアクチュエーターによって使い分ける
      • 工場内で使うか?屋外で使うか?人間が立ち入る場所か?などで変わってくる
  • センサ

    • 外界の情報を捉えるもの
    • 変位、速度、加速度、角度、角速度、距離などの物理量を電圧に変換するものが主
    • 人間でいう感覚器
  • コンピュータ装置

    • センサで取得したものはアナログ信号なので、デジタル変換する(A-D変換)
    • 逆は、D-A変換
  • 制御

    • センサの信号をもとに、アクチュエーターをいかに制御するのかを考える

開発の流れ

CAD:computer aided design:設計支援システム

CAM:computer aided manufacturnig:製造設計支援システム

  • CADで作られた図面をもとにコンピュータ制御された工作機械を使って、ワークを加工する

板金加工

  • 金属板を切って、曲げて、溶接する
  • よく、アルミニウムが使われる

CAE:computer aided engineering:開発工程支援システム

  • ロボットにソフトウェアを組み込んだ状態での実験・解析をPCでシュミレートできる
  • 航空や自動車がメインだったが、ロボットでも使われるように
  • Ex)歩行ロボット:歩行時のフレーム強度やアクチュエーターの必要トルクを計算で出すのは難しく、試行錯誤をするが、それをCAEで実施できる

問題点:これからのテクノロジー

アクチュエーター

  • アクチュエーターの性能は、大きさ・重量・出力・スピード・制御性・効率によって評価される
  • 様々な種類のアクチュエーターがあるが、すべてを満たすアクチュエーターはない

バッテリー

  • 大きさ、重量、出力、寿命の評価観点があるが、すべてを満たすものはない
  • 1次電池:使い捨て電池
    • 時計など使用期間が長いものに使われる
    • 緊急時の電力供給が切れても心配がないというメリット
  • 2次電池:充電可能・蓄電池
    • 携帯電話など使用期間が短いものに使われる(毎回、電池交換していたら不経済)
* 自己放電:無負荷状態でも蓄電量が次第に減少していくこと
* メモリ効果:電池を完全に使い切らない状態で充電をくり返すと、容量が減っていく減少
    * メモリ効果をおこ明日電池も完全放電・完全充電をくり返すと解消されていく
* 過放電:決められた放電終止電圧以下になること

材料

  • ロボットの材料は、軽くて丈夫なものがいい
  • 軽合金
    • アルミニウム、ジェラルミンなど
  • エンジニアリングプラスチック
    • ABS、アクリルなど
  • 繊維強化プラスチック
    • プラスチックにセラミックなどの強化硬化材料をブレンドしたもの

ロボット基礎

アクチュエーター

  • エネルギーを力や変位に変換する者
  • 主に電気モータ

モータ

  • DCモータ
  • ACモータ
  • PWM:pulse width modulation:パルス幅変調
    • 電源電圧がHigh(電源電圧)とLow(0V)しかない場合に、その中間を作り出す技術
    • 短い周期でHighとLowを繰り返し、パルス感覚を一定にして、パルス幅を変える

ロボット制御のためのセンシング

  • ポテンショメータ
    • 回転角度のセンシング
  • ロータリエンコーダ
    • 回転角度のセンシング
  • ジャイロセンサ
  • 温度センサ
    • 発熱をしたら止める制御とか
  • ストレーンゲージ
    • 歪みセンサ
  • 加速度センサ
    • 蓄積衝撃の計算や、姿勢補助のために使う
  • 距離センサ
  • マイク
  • 全方位カメラ

ロボットの機構

  • リンク、カム、歯車
  • シリアルリンク、パラレルリンク
  • 自由度

    • 空間において剛体の運動を記述するのに必要な独立変数の数(最大6)
    • 特異点
      • ある特定の方向の自由度が失われてしまう姿勢(自由度の縮退):特異点姿勢
  • マニュピレータ

    • ロボットアームの事

移動ロボット

  • 車輪移動機構
    • 4輪、6輪、全方位など
  • クローラ式移動機構
  • 2脚移動歩行
    • 静歩行:支持脚多角形内に重心投影点がある
    • 動歩行:慣性の法則を考慮に入れながら、重心を取る
      • 代表的なもの:ZMP:Zero moment point法
    • 4脚歩行
      • 遊脚(持ち上げている脚)の順序やタイミングによって様々な種類がある
      • 歩き方を歩容(gait)

緊急時の人間工学

  • 緊急時の表示・標識
  • 緊急時の警告音:危険の程度に応じて3種類ある
    • 緊急信号:直ちに危険区域から避難することが求められる
      • サウンドレベルは。65dB以上
      • 背景騒音とのレベル差(S/N)は15dB以上
      • オクターブ分析した場合は、各帯域でのS/Nが10dB以上
    • 危険信号:救出・安全確保のために緊急の行動をとることを指示する
    • 警告音:危険を除去・制御するための行動をとるための情報を提供する
    • 求められるもの
      • 目立つことは必要だが、騒音源となるような大きなレベルや不快感は避ける必要がある
      • 電子機器・事務機器・工場でのさまざな警報、駅の信号音など様々な音があるので、意味を誤解を与えない必要がある。
      • メロディーは音のな彼を識別させる有力な手かがりだが、場合によっては聞く人に煩わしい印象を与える可能性があり、警告音に徹したほうが無難という傾向がある
  • フェイルセーフ
  • フールプルーフ

FTA(Fault tree analysis)

  • システムが故障した時の原因となる事象を、その事象が生じるためには何が必要か?という演繹的な考え
  • 故障や事故を事前に予想するためのものであって、原因分析に使うものではない

ヒューマンエラー

  • SRKモデル:機械を捜査する人間の行動モードの3つ
    • スキルベース
    • ルールベース
    • ナレッジベース
  • ヒューマンエラーに対する2つの対策
    • プリベンティブバリヤ(preventive barrier)
      • ヒューマンエラーが事故に結びつかないようにする
    • プロテクティブバリヤ(protective barrier)
      • ヒューマンエラーによりトラブルが発生しても重大事故にならないようにする
      • 不安全の分類に基づいて、スリップ・ラップス・ミステークの対策を考える

「日本の人事を科学する 因果推論に基づくデータ活用」HRTechブームの現在、非常に参考になる本

日本の人事を科学する 因果推論に基づくデータ活用

日本の人事を科学する 因果推論に基づくデータ活用

手に取ったきっかけ

nakamichi @__nakamichi__
AI人事とか胡乱なこと言わずにこれ読んだ方がいいですよ的な. / 日本の人事を科学する 因果推論に基づくデータ活用 | 大湾 秀雄  http://ow.ly/MLzn30d7F1D
nakamichi @__nakamichi__
経済学者による因果推論の一般向け本のひとつだけど,著者が実際に企業と人事データ活用研究会みたいなのをやった経験がベースになっているので,こういうことを調べたいときはこれを目的変数にしてあの変数をコントロールして回帰分析する,というような実践的な話が色々載っているのがおもしろい.
 nakamichi @__nakamichi__
「なぜ人事ではデータ活用が遅れているのでしょうか.まず言えることは,人事部に配属される人は,文系が多く,そもそも統計リテラシーが低いという現状があります.伝統的に人事の課題を扱う研究は『人的資源管理論』が主流でした.しかし,この分野の研究者も,定性的な分析に終始してきたため,

このあたりのTwitterを見て、この本の存在を知りました。なかなか挑戦的な感じがしたし、これはよい本だろうと、ポチッとしました。データサイエンスやHRTechのブームの今においても、なかなかデータ分析×人事データの書籍が出てきてはいないので貴重な本だと思いました。

感想

企業内データ計量分析プロジェクトでの研究成果がまとめられていて、とても良い本でした。採用/中間管理職の問題/ダイバーシティなど人事課題をどうデータ分析で扱っていくのか?という流れで描かれていて良かったです。

データ分析一辺倒でもなく、単なる組織論だけでなく、実際の人事課題をどうデータ分析で解決していくのか?という実際の現場で使えそうな感じで、バランス感がとてもよく、こういう本を望んでいた感じでした。

人事データはセンシティブデータと言われて、なかなかデータ分析が進まなかったり(個人的には病歴などを除いた人事評価などの人事データはセンシティブデータだとは思っていないのですが・・・)、データ分析できる人が人事部にいなくてデータ分析が進まなかったり、諸々の実際の権限が人事部にないからデータ分析が進まなかったり・・・。

人事データ分析が進まない理由は様々あると思うけれど、こういう本や論文がもっと広まって、人事データ分析が当たり前の世の中になるといいなと思う。実際、この本の中に出てくる分析例をそのまま自社に適応するだけでも、何かが得られると思うので、この本を片手に自社の人事データ分析を進める人が増えてほしい。

そして、回帰分析の強力さを改めて再認識。最近、DeepLearningが流行って、なんでもDeepLearningやっとけばいい空気があるけれども、回帰分析だけでも、使いどころを見極めて正しく使えば、ある程度十分戦えるなと改めて思った。現在のデータ分析の80%ぐらいは可視化と回帰分析でなんとかなるのではないかなと。

「10年後、生き残る理系の条件」を読んで、キャリアパスを考える

10年後、生き残る理系の条件

10年後、生き残る理系の条件

なぜ手に取ったのか?

遅ればせながら、10年後、生き残る理系の条件を読んだ。最近、今後の身の振り方含め、キャリアパスに対してモヤモヤとしている部分が多くあったので、積読の中から引っ張って読んでみた。

どんな本だったか

現在、中央大学の教授をなさっている竹内(@kentakeuchi2003)さんが、東芝MBA留学→大学教授とキャリアを重ねている経験から、理系(エンジニア)が今後どう生き残っていくか?の生存戦略の心構えを説いている本。

実際に体験されていることであったり、日々の中で感じられていることがベースにあるので、非常に具体的でわかりやすく、すっと頭に入ってきた。「なるほどな」と思わされることが多くて、自分も今後どうするのか?ということを考えるのに非常に良い本だったと思う。若い頃にこそ、この本を読むべきだなぁと思いました。

感想

  • 会社と個人の関係性の変化
  • 自分の強みの見つけ方
  • 移り変わりが早いIT業界での振る舞い方
  • 自分の専門ではない異分野との関わりの重要性

そんな感じの部分がとても個人的には参考になりました。 私は1つの技術だけで食っていける程の本当の専門スキルを持っている訳ではないので、コツコツ毎日意識行動+たまにキャリアを振り返りで、良いキャリアを築いていければいいなぁと思います。

Google IO 2017のKeynoteを見て思った事

youtu.be

Google IOのKeynoteを見た。 Google Home / Google Lens/ Google photo book/ Visual Positioning Service / Kotlinあたりで私も観客と一緒に「おーっ」となった。

iPhoneからAndroidに乗り換えようかなと思うぐらいワクワクさせられた。

ちょっと長ったけど・・・w

どのサービスにも機械学習がベースにあって、機械学習によって基本能力が上がっている感じ。

機械学習の使い方も上手い。ユーザのデータが集まったから機械学習しました系の新機能も多かった。

インターネットが登場して世界が変わった時のように、機械学習が進化して世界が変わってきている感を強く感じた。

その機械学習などがソフトウェア企業のGoogleの強みであるし、魅力になっているのは間違いないけれど、機械学習一辺倒なのも少しどうなのかな?とも思った。サービスの新機能を考える上で、「まっさらからユーザのニーズを考えて新機能を作る」のではなく、「ユーザデータを取ってきて機械学習して新機能を作ればいいのでは?」と安易な流れだけには行かないでほしいなーと(個人的な感想)

気になったサービスを2つ

Google Lens

japanese.engadget.com

撮った写真の建物なんだっけ?とか、店のホームページのスクショからtelかけるとかできる。こういうの欲しかった。自分自身WiFiのID/PASSをメモ代わりに写真撮っておくっていう事をよくするので、google LensのユースケースとしてもあのWiFiの例は良かったと思う。

そして、google LensとGoogle photoが連携するのも、さすが。よくわかっている。

Google Photo Books

www.google.com

日本展開がされないから、どのメディアも取り上げないから、あまり注目されてないけど、個人的にはこれが一番「来たかー」感があった発表。

  1. Google photoで気兼ねなく写真を撮ってUPする
  2. → どれがいい写真かよくわからん。写真がたくさんだから、選別も辛い。
  3. Google機械学習で選んであげるよ!

っていうすごく解りやすい流れだし、ソフトウェア以外にも乗り出して一貫サービスをするというのが新しいと思う。Google photoの写真をいい感じに画像処理する機能も入ってきたら、ユーザはただ撮るだけで、いい感じのPhotoBookが送られてくるという凄いサービスが出来上がると思うのです。

「原因と結果」の経済学 ―データから真実を見抜く思考法を読んだ。データと向き合う考え方を教えてもらえる気がする良書。

なぜこの本を手に取ったのか?

2−3年前から因果推論が流行の兆しを見せていて、ずーっと勉強しようとは思っていたが、踏み出せずにいたところに、岩波データサイエンス Vol.3(特集:因果推論)が発売され、因果推論ってこんな感じなんだーと思ったところに、この本が発売されたので読むしかないでしょと。

どんな本だったのか?

今年読んだ本の中で、ベスト5には入るすごく良い本だった。

ランダム化比較試験、差の差分析、回帰不連続デザイン、プロペンシティ・スコア・マッチング(傾向スコア)、回帰分析などなど・・・。因果分析のやり方の概念を具体例を交えながら、分かりやすく説明していた本だった。

概念・考え方に限定し、数式やコードなどは出てこないので、この本だけでは実際に因果統計分析をやろうと思ってもすぐに実践することはできない。けれど、考え方を知っているだけで、誤った解釈を防げたり、データ集めの方針を決めたりする時に参考になる。「入門の入門」にはもってこいだと思う。

因果推論は、 社会心理学会 第3回春の方法論セミナーに参加したり、岩波データサイエンス Vol.3(特集:因果推論)を読んだぐらいで、まだ全然勉強できていないが、俯瞰して分析方法や概念を知れたのは、とてもよかった。

雑多な感想

  • 「おぉ、こんな感じでデータを扱えば因果の方向の考察ができるのか?」という感覚は、大学時代に初めて実験計画法を教わったときのような感覚だった。

  • 現在のビッグデータ時代、データが手に入れやすくなって、データドリブンな判断がされているが・・・。得られた結果は、相関なのか?因果なのか?因果の方向はどっち向きなのか?はたまた、偶然なのか?このあたりのデータを解釈する上でのデータリテラシーは、データに携わる人々は皆が抑えておくべき必須知識だと思う。

  • 因果推論と言っても、唯一無二の方法があるというわけでなく、得られるデータや使い方によって色々な方法を使いこなさないといけない。それぞれの分析方法の前提条件や分析方法のエビデンスの高さなど、分析手法間の違いも、なんとく把握できた。岩波データサイエンス Vol.3(特集:因果推論)を読んだ時には、そこまで理解できていなかったので、とても助かった。

  • 空前のDeepLearningブーム・機械学習ブームの中、「データを大量に集めてDNNにかけたら、なんか知らないけど予測が高精度に出来て良かった!」というのも一つの解としてはアリだとは思う。けれど、統計モデリング派の私としては、その裏側の仕組みやモデリングを行って人間が理解できるようにするという思想は大事にしたいなと思っていて、そういう意味でも因果推論の話は学んでいきたいと思う。そして、最近、機械学習界隈でのDeepLearningに相当するものは、統計モデリング界隈では、因果推論かベイスモデリングMCMCとか)であって、この2つはブームが来程るのではないかと個人的には思っている。

イマイチまだわかっていないこと

教えていただきたい・・・。

  • SEM(構造方程式モデリング)との関係

    • SEMも中途半端な理解しか出来ていないけれども、因果推論の文脈でSEMをどう捉えればいいのかが、ピンとこない。
    • SEMも因子分析+回帰分析なので、やってることは、回帰分析の因果推論と同じ??
  • GoogleCausalImpactというRのパッケージは、因果推論の文脈でいうと何をしているのか?

    • 時系列データから、反事実を推定して穴埋めし、それと実際のデータを比較しているという理解でいいのだろうか・・・。

次は・・・?

この本の著者の津川先生が↓ とおっしゃっているので、

データ分析の力 因果関係に迫る思考法を読もうかと思います

職場の人間科学を読んだ

職場の人間科学: ビッグデータで考える「理想の働き方」

職場の人間科学: ビッグデータで考える「理想の働き方」

きっかけ

最近、HR Techやピープルアナリティクスに興味があって、体系的に書かれた本ないかなーと思って、そういう本を探していて、題名ズバリだし、評価もそこそこだし、勉強しようと思って読んだ。

どんな本だったか?

組織の進化的・歴史的背景知識+データの見えざる手に描かれているような、社員証にセンサーをつけて、コミュニケーションパスを分析して考えてみたという2本立ての内容でした。2013年に書かれた本としては、先進的だったのかな??

感想

  • オプトインや透明性の話、実験参加していない人に対してもダミーのセンサーを配る、ホーソン効果などの話・・・。職場で実験や調査をするときに気をつけないといけないことに言及されていてよかった
  • お互いのことを知ることができる上限の数:ダンバー数
  • 社会ネットワーク分析とかは、分析手法としてRの{igraph}とかを使って触ったことはあるけれど、コミュニケーションとして考えた時に、生産性と社会ネットワーク分析がどう関係していくのか?というのは面白かった
    • 凝集性と多様性というキーワードは覚えておきたい
  • 今、働き方改革などで、リモートワークが推進されているけれども、そうなった時の測定ってどうすればいいんだろうか。数年後、より戻しで、オフィス集中がいいとかなるのだろうか。
  • 直接コミュニケーションによって得られるプラスのメリットをうまく特定できれば、リモートワークでもリアルコミュニケーションと同等の力を発揮できるんだろうか。