2013年3月1日金曜日

多変量解析の主成分分析。自転車ブログなんですけど。

ちいと会社で若干の余裕があるもんで、
昨日今日と主成分分析をかじってみたのです。

自然現象を相手にする職務がら、意味不明のデータの山に埋もれることがあり、
それをモノにする解釈/判断ができるかどうかが、肝だと思う。

大概の人は入り口で「わかんね、意味ねぇ」と諦めるので、優越できる。

そんなときに、重宝してたのが多変量解析の重回帰分析。

重回帰分析は、すごく単純明快で、
煩雑な計算は専用ソフトがあったもんで、サクサクやってた。

でも、主成分分析は、最初に受講した多変量解析研修で講師が分かってなかったんだろうなぁ。

聞いてても意味分からず、さらにソフトの説明書みても意味が分からず。


なんだか、出てきた「主成分」に適当な意味づけしてるだけで、
なにこのお遊びは?と思い、無視することにしてた。


で、ここんとこ暇だったから、ちと再挑戦するかと。

そこで出会ったのがこのサイト

話は脱線するわ、例え話が分かりにくかったりするわ、と厄介なところもあるのですが、
その脱線にヒントがあったりと、そして言っていることは超良いことだったり。

「全部の変数の組み合わせで散布図マトリックスをずらっと並べて仕事してましたというのと、
因子を選択した状態で意味のある因子群を散布図にするのでは、仕事の質が全然違うと思う。」

リスペクトしました。

そして、自分なりに使うには充分に会得できました。わずか数時間で。
感謝。

こういうものを残すヒトって本当に偉い。


重回帰分析がひとつの要因に相関している、
いろんな要因の寄与を可視化するだけなのに対し、

主成分分析は、いろんな要因全部含めたなかで、
ある特徴を持った傾向に関連する要因をいい感じに抽出して、
その興味深い関係性を思考させて素晴らしい発見を促すみたいな。

2次元、かろうじて3次元の散布図でしか思考できなかったのを、
何次元でもドンと来い。見たいな感じ。

まあ、2次元時代でも気合と根性で5次元くらいは読んでましたが、
それは、徹夜とかに頼ってた訳で。
挙句、誰にも説明することはできなかった感じで。


ああ、こっちから先に会得しておけばよかったなぁと。


シンプルな仮説検証だけが、開発のやり方の鉄板だと思うのだけれども、
仮説を立てるのに強力なツールかと思います。



でも最近はそんな「何次元」みたいなデータを扱う開発じゃないので、
つまらなかったりもする訳で。



さて、怪文章書いてスッキリした。寝よう。


1 件のコメント: