残念ながら、研究・実験が終わってしまってからのパワー算出には、何の意味もありません。例えるなら、遅だしジャンケンみたいなものです。それにもかかわらず仕事上では研究の結果が出たあとに参考として計算してみることが昔ありましたが、これが大変です。統計学的パワーが78%、40%、20%だったりしました。
例えばパワー78%の場合、「その試験結果は大体の感じをつかむ(探索的)位置づけであり、その結果をスケールの大きい試験で将来正式に確かめるという方向なんです。」などとレフリーに説明を試みることはできるでしょう。
しかし、統計学的パワーが50%以下とは何でしょうか。単純にパワーがものすごく低いということではないと思います。
例えば、パワー20%の意味は「実際のデータ中に意味のある差があるとき、100回中20回、有意差が検出できる検定」です。ということは、パワー20%のもと1回の実験で「有意差なし」という結果は80%の確率で起こるのですね。
それほど信頼性のない検定方法ということになりますが、逆に言えば、本当は意味のある差があるときに100回中80回のテストで有意差なしの結果がでるはずだから、1回の実験で「有意差」がでれば80%の確率で「有意差なし」と結論づければ良いんですかね。
??
みなさん、統計学的パワーが50%もない統計的検定方法の本当の意味を考えてみましょう。研究デザインにおける統計学的設計の大切さが実感できるでしょう。
ここで冒頭の話にもどりますが、「iPS細胞で薬がいらなくなる?」の記事で書いたように、再生医療等製品いわゆるiPS製品等の行政による審査方法は、医薬品の審査方法に比べてかなり優遇されています。
医薬品は大規模な患者数で行う第Ⅲ相治験を終えて審査を受けますが、再生医療等製品は小規模で短期間の臨床研究で主に安全性の確認が行われれば見切り発車のようにマーケットに出て行けます。