無相関検定について
−英語教育学研究におけるよりよい統計処理のために−
キーワード
無相関検定 相関係数の検定 有意な相関
Since 2004.5.25. Last Modified 2004.5.25.
なんとなく,まとめてみました。
Q 相関が有意かどうか調べる方法があると聞いたのですが?
A 個人的には好きではないのですが,無相関検定,もしくは,相関係数の検定,というやつですね。
Q 好みの問題はおいといて,どんなものなんですか?
A おっしゃるように,得られた相関係数が,統計的に有意かどうか調べるということです。つまり,「相関がゼロだと言える確率」がどのくらいか調べてみて低かったら,「相関がゼロだといえる確率」が低いのだから,相関がゼロだと言えることはないだろう,と推論するものですね。
Q 有意だったら,相関があるということになるんですよね?
A そんなことはないです。有意でなかったら無相関だというわけでもありません。あくまで,相関係数を解釈するための,資料のひとつという程度でしょう。
Q そんなもんなんですか…?
A 算出の方法を見てみましょう。いや,もちろん,ワタシがそんなもの書き下ろせるわけないので,他の方のページにリンクします。こちら(青木先生@群馬大)をどうぞ。
式が出ていますよね。nというのがサンプル数。rというのが相関係数です。で,左辺のtを算出するというわけです。で,平たく言えば,tが大きくなれば有意になるということです。
その分子に,nがありますね。これがでかければでかいほど,tの値は大きくなるわけです。そんなものなのですね。
ついでに,nとrしか右辺に出てこないことにも注意。そう,相関係数と,サンプル数とだけで,決まるんですね。
Q なるほど…。同じ相関係数の大きさでも,サンプル数によって有意だったり有意でなかったりするわけですね。
A ということです。もちろん,推測に使うデータ数が多い方が,より確からしい推測ができるわけですから,サンプル数が大きくなればなるほど有意になりやすいというのは,いわゆる検定というものの特徴ですね。
Q まあ,それはそれとして,どうやればいいんですか?
A Excelでやる場合を考えてみます。セルに,次の式を入れてみましょう。
=TDIST((SQRT(r^2)*(SQRT(n-2)))/(SQRT(1-r^2)),n-2,2)
もちろん,nがサンプル数,rが相関係数です。値を入力してもいいですし,セルを参照させてもかまいません。数式の意味は…自分で関数のヘルプを参照してください。
ともかく,上の式を入力すれば,両側検定による無相関検定の結果が,p値として出力されます。慣例に従えば,p値が0.05を下回ると有意,ということですね。
もし,上で紹介した青木先生のページにあるように,まずはt値を算出したい,というのであれば,
=(SQRT(r^2)*(SQRT(n-2)))/(SQRT(1-r^2))
を行えば,t値を得ることもできます。
手持ちのサンプル数から,どのくらいの相関係数だったら有意になるのかどうか,試してみるのも面白いかもしれませんねえ。
http://home.hiroshima-u.ac.jp/keiroh/maeda/statsfaq/arcsin.html