検定結果の表記について

−英語教育学研究におけるよりよい統計処理のために−

 

キーワード

 検定 p値 統計量 自由度 アステリスク 

Since 2008.1.3. Last Modified 2008.1.3.

 

 なんとなく勢いで書いてみます。

 

Q こんなふうに検定結果を書いてみました。

  群1(n=…) 群2(n=…) t(df)
M SD M SD
変数1 *
変数n **

*=p<.05, **=p<.01, ***=p<.001

A ああ, 既に出版された論文を参考にして書いたんですね。残念です。往々にして,残念な結果になります。

 

Q  えっ?古典とまでは言いませんが,とある有力な先生の有名な論文を参考にしたんですけれど。

A  だから残念なことになるんです。いわゆる御大の先生が,論文の書き方を勉強されたのは,少なくとも20年以上前ですよね。パソコンではなく,せいぜいマイコン, まあ関数電卓とか汎用機とかのころかもしれません。

 

Q  いや,よくわかんないんですけど。時代が変わると,論文の書き方も変わるってことですか?

A 近いようで惜しいです。書くべき事項には,変わりはありません。ただし,計算機の発達と普及によって,以前は書 きたかったけど書けないので代替物で済ませていたことが,今は簡単に書けるようになったということです。

 

Q そういうものですか。具体的に,どの点をどうすると良いですか。

A ワタシならという話ですが,こう書きます。それと,ワタシが読むときなら,こう書いてあると十分だと思います。

  群1(n=…) 群2(n=…) p
M SD M SD
変数1
変数n

 

Q はあ,t値と自由度ではなく,p値を書く,ということですか。t値と自由度はいらないんですか。それと,アステリスクはいらないんですか。

A いえ,t値と自由度はある方が丁寧だともいえます。でも,2群の差の検定をして,それぞれの群のnがわかれば,自由度はわかります。自由度とp値がわかれば,t値はわかります。そういうわけで,あった方が丁寧なんですけれども,なくても差し支えないという判断なわけです。紙幅の都合なんかに合わせるといいでしょうね。

 

Q ということは,t値と自由度がわかれば,p値もわかるんですよね。t値ではなくp値を出すのはなぜですか。

A 検定して,結果の出力を見るとき,何を見ますか。t値ではなくp値ですよね。そのp値が,事前に決めておいた有意水準以下であれば統計的に有意であると判断しますよね。t値,見ませんよね。そういうことです。

 

Q だったら,有意なときにはアステリスクとかsig.,有意じゃないときにはn.s.,とかでもいいんじゃないですか。

A よくありません。p値(必須)≧t値≧自由度です。出てきたp値を示すのは必須だと思いましょう。

 

Q はあ。なんでこんなことになるんでしょう。既に世に認められた論文のとおりやったのに。あなたの考えのほうがおかしいんじゃないですか。

A かもしれないですね。でも,検定手順の今昔を考えてみましょうか。

昔:
有意水準を決める
統計量を計算する
自由度を計算する
統計量の臨界値を示す数値表で,有意水準と自由度を参照して,表中の臨界値と算出した統計量を比べる
数値表から,見つけた統計量は有意確率が何以下なのか判断する
(参考:数値表の例http://aoki2.si.gunma-u.ac.jp/CGI-BIN/ttxp.html

今:
有意水準を決める
統計量と自由度と有意確率を計算する

こんな感じですよね。こう考えると,昔のやり方って面倒のように思えますね。統計量と自由度に基づいて有意確率(p値)を計算するというのがそう簡単ではなかったんですよ。だから,あらゆる統計量に関して数値表というものがありまして。そして,ある自由度のときに,得られた統計量が,定めておいた有意水準のときに,数値表で示された臨界値よりも大きいかどうか,判断してたんですね。そんなわけで,統計量や自由度もちゃんと示しておかないといけないわけです。

 今は,有意確率を求めることが,とても簡単です。計算機が発達しましたからね。だから,やむなく回りくどいやり方をしていた昔と違って,最初から有意確率を出しちゃえばいいんですよ。

 これが,上で言った,「計算機の発達と普及によって,以前は書きたかったけど書けないので代替物で済ませていたことが,今は簡単に書けるようになったということ」なんです。

 

Q そんなもんですか。

A そんなふうに思ってます。

 

Q そうそう,「*=p<.05, **=p<.01, ***=p<.001」みたいに,アステリスク…

A  いりません。有意水準を1つ決めて,それと有意確率の大小を比べて,有意かどうかを判断するだけですよね。数値表を使っていたころの名残かもしれませんが,正確なp値を報告できる以上,いりません。複数の有意水準があるかのように,または,p値の大小で差の大きさや確からしさを議論するように,そんなふうに見せるのは基本的な考え方からそれています。

 

 

 

 さて,これで次からは,何かあった際にはこのページを見てもらえれば済むので気が楽になりました。

 

前田啓朗のページのトップへ

 

 

http://home.hiroshima-u.ac.jp/keiroh/maeda/statsfaq/kekkahyouki.html