2回目のクイズ

10月上旬の講義に、Cumming et al. 2007. "Error bars in experimental biology." The Journal of Cell Biology 177 (1): 7-11 を宿題として配った。11月中に小テストをするからねと、言っていたので先週は約束どうり実施した。

結論からいうと、ほとんどの学生は標準誤差と標準偏差の違いにつて、理解しているようだが、論文の内容は思うほど理解していないようだ。

この論文は図に記述されている2群のデータの平均値とエラーバーをどのように解釈するのかについていろいろと書かれている。

とくに、Cummingらは次の7つのルール(論文は6番目のルールを2つに分けている)を述べている。
1) 必ずエラーバーに説明をつけること。
2) サンプル数や独立した実験の回数を記述すること。
3) ある実験の1つの代表的な値にはその実験のエラーバーをつけないこと。
4) 比較をしたい場合、できるだけ推計型のエラーバーを使うこと。つまり、標準誤差 (standard error) や信頼度区間 (confidence interval) など。
5) 20回繰り返した実験の19の平均値は95%信頼度区間内にはいること。(これはルールよりも、95%信頼度区間の定義だと思うが…)
6) 2群 (n=3) の平均値の間が標準誤差の4倍以上または、95%信頼度区間の1倍以上の距離で離れている場合、P < 0.05; n > 9 の場合はその距離が3倍の標準誤差と0.5倍の95%信頼度区間になる。
7) 群内の比較にはつかえない。

エラーバーについて、Cummingらは次の3つの概念が重要だと述べている。
1) n を確認する。
2)データは独立した実験から得られたのか。
3)エラーバーの種類も確認する。

もちろんこの論文は、独立した2群の比較だけにしか使えません。例えば、コントロールと1つの実験区を比べたい場合なら、OK。比較対象となる群がふえると、分散分析や一般化線形モデルなどを使わなければなりません。

ちなみに、小テストはどのようになったのか…1か月も勉強する時間があったから、前回のテスト平均値より高い点になるとおもっていたが、実際は 0.8 点下がった。

The mean and 1 standard error of the mean for Quiz 1 and 2.
さて、Cummingらによると、n > 9 の場合、平均値が 3SE 以上離れていれば優位な差はある。Quiz 1 のSE値は 0.4,そしえ Quiz 2 のは 0.3と推定した。Q1の 0.4 を基準にして、3倍にすると 1.2となる。 平均値の 0.8 は 1.2 をしたまわるので,有意の差はなさそうだ。ちなみに、2群ANOVAで解析したところ、F (1, 101) = 2.332そして、P = 0.1299。αの水準を 0.05 にしたら、有意の差はなかったと判断。

でもやはり、一番気になる統計は中央値の 6 と 5 、そしてその次は"No score"ですね。このままだと、まじめに小テストを受けている学生の半数と全く受けてない13~22名は単位おとしそうだ。





コメントを投稿

このブログの人気の投稿

RStudioとggplot():プロットができないとき

新年度は新上五島町へ

今年度の研究室は今まだ一番大きい