Cox比例ハザードモデル,ロジスティック回帰モデルどっちを使うべきですか?
この間,勤務先にてタイトルの質問をされました.
たしかに時々似たような統計相談を受けることが多いので,ここでも書いておくことにします.
疾患Xで入院した患者さんのデータ
治療+処置Aをしたグループと治療のみのグループがある
処置Aと一年後の再入院の関連を見たい
多変量解析をするにあたり
Cox比例ハザードモデルとロジスティック回帰モデルのどちらを用いるべき?
治療+処置Aをしたグループと治療のみのグループがある
処置Aと一年後の再入院の関連を見たい
多変量解析をするにあたり
Cox比例ハザードモデルとロジスティック回帰モデルのどちらを用いるべき?
時々ですが,どっちの解析も使えそうな場面に出会います.
ケースバイケースで,何に着目するかによって使うべき手法が変わってきます.
【Cox比例ハザードモデルの場合】
- 一年以内の再入院の有無についての検討になります.(生存時間解析)
- 解析を行うには一年以内のどの時点で再入院になったかを示す変数列と、再入院というイベントが発生したか否かを示す変数列が各々必要になります.
- ハザード比で議論することになります.
【ロジスティック回帰モデルの場合】
- 一年後の再入院の有無についての検討になります。(途中経過の時間情報はなく、はじめと終わりだけに着目)
- 一年後までの再入院の有無についての変数情報があれば解析が可能です.
- オッズ比で議論することになります
使い分けですが,主に以下の方針に基づいてコメントしています.
- 始めと終わりの情報しか取得できない場合→ロジスティックしかできない
- 1年以内の時間の情報もデータに盛り込みたい場合→生存時間解析が良い
- 始めと終わりだけの情報があれば十分意味を持つ→ロジスティックが妥当
この「始めと終わりだけの情報があれば十分意味を持つ」ですが,
例えば何らかの感染症に対して,非常に高価な治療薬があったとします.
この高価な治療薬のおかげで1週間以内の死亡率自体が下がったとしましょう.
ただ,1ヶ月後の死亡率自体に差がない場合,はたしてこの高価な治療薬は効果があったと言えるのでしょうか.
生存時間解析を行うことで,(時点ごとのデータ情報も増えるので)有意差を出しやすくなるかもしれませんが,この場合はロジスティックを使うのが妥当かと思います.
参考になりましたら幸いです.