存活分析在生物醫學上的應用

 

 

  存活分析在生物醫學上的應用

公衛科 陳明岐副教授 

  存活分析 (survival analysis) 是現今被廣泛應用在生物醫學研究上的一種統計方法。事實上,存活分析的方法論,並非只能處理與死亡有關的資料 ( 存活”二字所導致的誤解 ),只要清楚地定義觀測的起始點與該事件(event)發生的時間點,則存活時間(survival time, 簡寫為 T) 便已形成,並可以進一步計算存活函數存活機率(survival function or survival probability,簡寫為 S(t) = P(T > t))。舉幾個例子來說:(1)對於不同的手術方法,其手術後到產生併發症的時間長短是否與手術方法有關此例中時間的起始點”便是手術當天,而事件”則是併發症發生的時間點;(2)男性或女性,誰訂閱某一雜誌的時間較長其中時間的起始點”便是雜誌訂閱的第一天,而事件”則是停止訂閱的那一天。此兩個例子便說明了存活分析的應用範圍,不只包含生物醫學,商業行銷的研究也適用。除此以外,事件”也不一定要與死亡有關。因此,此分析方法亦被稱之為 failuretime data analysis。總之,研究某段時間長短的影響因素,存活分析的確是一種選擇。

  然而處理時間長短,並非是存活分析的主要特色。例如:某研究者想比較兩種不同的手術方法下,病人自術後到產生併發症(事件)時間是否有差異。若所有病人皆產生併發症,且其發生的時間點亦有記錄,一般常見的 two- sample t- test (若兩組的存活時間皆服從常態分佈)或 the Wilcoxon rank sum test ( the Mann-Whitney test ) 皆是合適的統計方法。然而,一般在臨床上常見的,卻是有些人在研究結束前,根本就沒產生併發症,或是研究進行中,病人轉院而不知其是否有併發症的發生,在此情況下,其所謂的存活時間是被設限”(censored) 的。舉例來說:若有人手術後到研究結束前,共8天中根本就沒產生併發症,則其存活時間就是8+ (亦即 T > 8 天),也就是說,如果研究可以繼續觀察下去的話,其併發症的發生一定是在8天後的某一天 (或根本沒發生),只是現在觀察不到。對於 censored survival time,若只佔一小部分,也許研究者可以選擇把它們捨棄不用,但若 censoring rate 太高,或資料得來不易,研究者就必須考慮此些censored data 的部分貢獻,因為捨棄不用”與知道 T > 8”在分析上的價值是完全不同的。一般的 two-sample t-test the Wilcoxon rank sum test ( the Mann-Whitney test ) 是無法處理 censored data。因此,存活分析的方法論就在此突顯出其特別之處。總之,當存活時間出現censoring 而無法被忽視時,研究者就必須採用存活分析的方法。

  在了解存活資料的特性後,下列將由兩個例子來說明,存活分析在基礎醫學與臨床研究的應用:

  (一)線蟲 ( Caenorhabditis elegans ) 的生命週期 (life span)。線蟲是目前生命科學研究上重要的模式動物之一,也是第一個完成基因定序的多細胞生物。它的成蟲約僅1毫米長,全身透明,構造簡單,光學顯微鏡下活體觀察可達到單一細胞的解析程度。此外,它生長快速,可大量養殖,並且容易製造突變株(資料提供:解剖科柳文卿副教授)。因此,當以線蟲生命週期的長短做為量測某一基因或藥物作用之指標時,存活分析就可以派上用場。如表一列出的例子,即是根據存活時間T的長短排列,並把censoring的線蟲考慮進去,進而計算出來的存活機率 (此方法稱為 The Kaplan-Meier Method or product-limit method)。若一開始總共有11隻線蟲,第一隻死亡的線蟲共活了12天,於是活超過12天的機率就是10/11(即 P ( T > 12天) = 10/11),並依此類推到第四隻死亡的線蟲。第五隻死亡的線蟲在被觀察了19天後不見了,那這隻線蟲的存活時間 T=19+ ,也就是至少活了19天。當我們要去計算活超過20天的機率 (或稱存活機率”, P ( T > 20) )時,這隻被 censored 的線蟲,就不應該出現在分母中,因為我們只確定它活超過19天。所以其機率不是單純的計算剩下的4隻 (共11隻,即4/11),而是 0.5090。此方法非常繁瑣,建議以統計軟體計算以避免計算錯誤。

  (二)葉等(2003)的論文主要探討的問題之一,是 「臨床上有哪些因素會影響病人在接受心臟大主動脈的手術後 (起始點”),到其降主動脈瘤 (descending aorta aneurysm formation) 再度形成而需要第二次開刀的時間 (“事件”) 長短。也就是說,哪些因素會延長再度需要開刀的時間呢在觀察的10年中,有病人需要(或已經)開刀,有些則沒有。此研究中採取 log-rank test 來比較兩條 Kaplan-Meier survival curves (“有”或無”假性通道開放, with/without patent false lumen) 的病人其descending aorta aneurysm formation free”的長短,並得到結論為無假性通道開放”的病人,是比較不容易再開刀的,也就是說,其 disease free time 是比較長的。

  總之,只要研究變數是時間”並且有定義清楚的“起始點”與“事件”, 不論是否與死亡有關,存活分析都是可以廣泛被應用的方法論。

▼表一 

Time
(day)
死亡
累積

不見

S(t) S(t)
12 1   1-1/11=0.9091

15 2   1-2/11=0.8182
15.5 3   1-3/11=0.7273
18 4   1-4/11=0.6364
19+ 4   0.6364
19.5+ 4   0.6364
20 4 14 0.509
25     0.4773

 

Reference

 

Chi-Hsiao Yeh Min-Chi Chen Yi-Cheng Wu Yao-Chang Wang Jaw-Ji Chu and Pyng Jing Lin (2003) “Risk Factors for Descending Aortic Aneurysm Formation in Medium-Term Follow-up of Patients With Type A Aortic Dissection” Chest 124(3) pp. 989:995