ディオバン事件:生物統計家の倫理観


統計解析をするには統計解析のプログラミングをしなくてはなりません。研究デザイン全体を把握していなかったり、研究目的(Objectives)を理解していなかったり、高度な解析が必要だったり、もともとのデータがあまりにも汚かったりすると、故意でなくてもプログラミングの過程でデータセットに余計なものが入ってしまったり、データセット構成にエラーが出たり、排除しなければならない個体のデータを入れてしまったりということが出てきます。

これは故意でなくて人間だったら起こしてしまう類のエラーなので、(仕方なくはないですが)起こってしまうこともあります。問題は、エラーに気づいたとき若しくは疑われるときの対応です。

通常、このエラーの具体的原因に最初に気づけるのは統計解析者本人です。しかし、既に解析結果をレポートで医師に提出してしまって言い出しづらいとか、折角良い結果がでたのにエラーを修正し再現できなかったらどうしようとか考えて何もしないでいると問題になります。

ディオバン事件のうち京都府立医大のKYOTO HEART STUDYの経緯では、早い段階で論文中で試験に参加した患者さんに関する基本的な統計の部分(デモグラフィックス)に対し、自治医科大学の先生より指摘を受けました。

読売新聞の記事をみると、糖尿病でない患者群のデータで糖尿病患者が入っていると指摘されたわけです。統計解析者なら、まず脳卒中頻度の比較とかサバイバルアナリシスとか行う前に、比較するグループが試験計画書どおりに定義された患者で構成されているかチェックします。ですから、解析者本人がデータ改ざんしていなかったとしても、デモグラフィックスのエラーが疑われた時点でデータマネージャーやデータを提供した大学側に照会・修正させて整合性あるデータを要求しなくてはなりません。

大学側やデータマネージャーへデータ照会したというニュースは見ないので、このデモグラフィックスデータ問題だけみると統計家解析者の責任の一端はあったように思えます。但し、駆け出しの統計解析者だと、まずデモグラフィックスを確認するという基本も実践できないひとがいるかもしれません(そういう人には指導者がいるものですが)。


にほんブログ村 海外生活ブログ 海外留学(アメリカ・カナダ)へ ブログ村

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です