Survival Data Analysis
生存時間解析は、機械の使用開始から最初の故障が発生するまでの時間、癌患者の手術から死亡までの時間、入院期間などの「ある時点から何らかのイベントが発生する時点までの時間」を対象とした統計解析分野を示します。そのため、”Time to Event Analysis”とも呼ばれています。
生存時間解析が良く用いられる分野は次のとおりです。
● 工場における機械の寿命解析
● 臨床試験における薬剤効果の解析
● 前向きコホート研究
● うしろ向きコホート研究
● レトロスペクティブな相関研究
特徴的なのは、生存データは正の値を持つ確率変数ですが、イベントの発生により完全に確定される時間データのみでは無く、観察の途中打ち切りまでの時間データを含む点にあります。解析手法として、カプラン・マイヤー法(Kaplan-Meier Method)によるグラフの描画とログランク検定(Log-rank Test)やコックス回帰モデル(Cox Hazard Model)が用いられます。
カプラン・マイヤー法で描画されたグラフは下記の様な階段状の折れ線グラフで表されます。
上図(http://www.snap-tck.com/room04/c01/stat/stat11/stat1101.htmlより引用)は治療法の異なる2群の癌患者集団の生存率を比較したものですが、階段が落ちた時点が死亡例の発生を表しています。途中で”ひげ”が立っていますが、これが打ち切りデータを表し、その時点まで生存が確認されているが、それ以降の消息は不明であることを表します。グラフで見るとA群の生存率がB群よりも高く推移しており、治療Aが優れていることが分かります。尚、結論付けるには、ログランク検定やコックス回帰モデルを用いて、統計的検定を行います。