実務統計家がサンプルサイズ設計の際に臨床家に聞いておきたい質問リスト

統計

Essentials of a Successful Biostatistical Collaboration“という本で,サンプルサイズ設計の際に,臨床家に聞いておきたい質問リストが載っていましたので,まとめてシェアすることにします.

サンプルサイズ設計には,有意水準(α),検出力(1-β),効果サイズが必要なのは当然ですが…,そのほかにも確認すべきことがあります.

統計家は質問するポイントとして,臨床家は気を付けるポイントとして参考になれば幸いです.

  • この研究の主な目的と関連する仮説は何か.

通常サンプルサイズ設計は,研究のprimary aims(主目的)のために行われるべきです.

もし相談者がたくさんリストアップした場合,いくつかのアウトカムについては,サブの目的などに移行するのを検討しましょう.

  • アウトカムの性質と説明変数は何か.

変数の性質によって,仮説や検定方法,サンプルサイズ設計の方法が変わります.

  • 比較は群間(between)か群内 (within)か.

群内(Within)の比較は通常小さなサンプルサイズ設計で済むことが多いです.
しかし,反復測定の場合は,個体内相関の推定などの追加情報が必要になるため,より綿密なサンプルサイズ設計が必要になります.

  • 臨床的視点から最小の効果サイズはいくつか.

サンプルサイズ設計をしてから効果サイズを考えるのではなく,計算に先んじて,効果サイズを決めるべきです.

# 筆者注1:効果サイズとは,標準治療と新規治療の効果の差です.治療成功確率が50%と70%なら,効果サイズは20%です.

# 筆者注2:ここは,先んじては難しくても,サンプルサイズ設計とは独立して,効果サイズを決めてもらうのがいいと思います.

  • あるいは,臨床的に許容される精度の幅はいくらか.

時々,研究の目的がいくつかの品質・精度を測定する場合もあります.

例:ランダムサンプルでの糖尿病の有病率の推定.

この場合,例えば信頼区間を±5%以内にするためのサンプルサイズ設計をすることになります.

  • アウトカム変数の変動性の推定はありますか.

アウトカムの分散は標本数の計算において重要な要素であり,慎重に確認する必要があります.
標準偏差(SD)と,平均値の標準誤差(SE)が混同している場合は,統計家は違いを説明する必要があります.

# 筆者注:SDとSEの違いを説明してあるサイトの一例はこちら

  • 予想される脱落例はどれくらいか.

脱落例をあらかじめ考慮に入れることで,脱落しても検出力が落ちない設計が可能になります.

BMJの臨床試験のレビューで,脱落する割合が中央値7%,最小0.08%,最大48%,IQR 2%-18%,と報告している論文があるようです.

ちなみに,この本は,実務メインの生物統計家が臨床家とコラボするときに知っておきたいことが載ってある本です.

実務で悩ましいことや自分の知識が偏っていないか確認するときに時々見ています.

数式はほとんどなく,小さい本なので,通勤中に読むことが多いです.

よかったらどうぞ!

Wordpress Social Share Plugin powered by Ultimatelysocial