多重代入法のReporting guidelines

統計

多重代入法のMICEアルゴリズムの開発者であり、Rでmiceパッケージに携わっているStef van Buuren先生が,https://stefvanbuuren.name/fimd/で報告手順についてのガイドラインを書いていたので,備忘録としてメモします.原文がいい人は,そちらのほうで確認してください.

報告するスペースが足りない場合は,1, 2, 4, 5, 6, 11に限定してもよい,とのことです.

  1. 欠測データの量:興味のある変数の欠測値の数の記載をする.完全なデータを持つケースの数の記載をする.様々な時点で症例が脱落する場合,機会ごとに分解して,数の記載をする.
  2. 欠測の理由:データが欠落している理由として知られていることを述べる.欠測データが意図的かどうかの記載をする.欠測の原因が結果変数と関連している可能性についての言及をする.また欠測の原因がその他の変数に関連しているかどうかの記載をする.
  3. 結果:完全データと不完全なデータを持つ個人間に重要な違いがあるかどうか.主要な変数の平均値や広がりに違いがあるか.完全データの解析結果の記載をする.
  4. 方法:欠測データを説明にあたりどの手法を用いたかの記載(例:complete case解析、多重代入など).またその際,どの仮定(MCAR, MAR, MNARなど)が行われたかの記載.多変量欠測データへの対処方法の記載.
  5. 統計ソフト:用いた統計ソフトと,デフォルトと異なる設定の言及.
  6. 代入データの数:複製と解析に用いたデータセットの数の記載.
  7. 代入モデル:代入モデルに含まれた変数の言及.(ステップワイズやLassoなどの)変数選択を用いた場合はその旨を記載.非正規分布やカテゴリー変数の補完方法の記載.モデルのデザインの特徴(階層データ、複雑なサンプル、サンプリングの重みなど)はどのように考慮に入れたのかについての言及.
  8. 派生変数:変数変換、再コード化、インデックス、交互作用項などはどのように考慮されたかの記載.
  9. 診断:収束の確認.観測データと代入データを比較.欠測がなかった場合,代入法によって,もっともらしく測定できているか,という視点で妥当性を検討する.
  10. プーリング:繰り返しの見積もりは、最終的な見積もりにどのように統合(プール)されていますか?統計量が変換
  11. complete case解析:多重代入法とcomplete case解析の比較検討,異なる場合はその理由の考察.
  12. 感度分析:多重代入法を用いた変数について,MARの仮定が妥当かどうかの検討.欠測が無視できないモデルでは結論に影響がでるかどうか.

また,このガイドラインに沿ったテンプレも用意してくれています.

The percentage of missing values across the nine variables varied between 0 and 34%. In total 1601 out of 3801 records (42%) were incomplete. Many girls had no score because the nurse felt that the measurement was “unnecessary,” or because the girl did not give permission. Older girls had many more missing data. We used multiple imputation to create and analyze 40 multiply imputed datasets. Methodologists currently regard multiple imputation as a state-of-the-art technique because it improves accuracy and statistical power relative to other missing data techniques. Incomplete variables were imputed under fully conditional specification, using the default settings of the mice 3.0 package (Van Buuren and Groothuis-Oudshoorn 2011). The parameters of substantive interest were estimated in each imputed dataset separately, and combined using Rubin’s rules. For comparison, we also performed the analysis on the subset of complete cases.

https://stefvanbuuren.name/fimd/sec-reporting.html

さいきん査読で多重代入法やりなさい,と指摘されたので,ここら辺の情報をもとにレスポンスしていきたいと思います.

Wordpress Social Share Plugin powered by Ultimatelysocial