在生存分析中,風險比(HR)是衡量組間差異最常用的指標,但由于HR是兩組間的風險率之比含義較抽象,無法對患者的生存情況做出直觀的解釋。此外,隨著免疫療法的興盛,越來越多臨床試驗的生存曲線呈現非等比例風險現象,從而違反了COX回歸的前提。因此基于非等比例風險的統計方法越來越多,其中限制平均生存時間(RMST)可以作為一種相對有效的指標或統計量,在近幾年頻繁地出現在各大醫學頂刊上。本文主要結合結合CheckMate 057試驗的PFS曲線來說明在違反等比例風險的情況下,傳統的生存分析方法和結局指標的局限以及限制平均生存時間(RMST)的優勢,具體內容包括以下幾個部分:第一部分簡單地介紹下幾種K-M曲線存在的非等比例風險現象;
與傳統的化學療法相比,腫瘤免疫療法通常顯示出延遲的療效和長期生存獲益,此外,在免疫療法中,可能存在 "偽進展 "和“超進展”問題,從而使生存曲線出現交叉。下面三張圖則展示了3種違反等比例風險假設的生存曲線。



針對CheckMate 057試驗的PFS曲線,便有專家指出其在生存曲線中間出現交叉,HR結果難以解釋(前后兩段的HR發生反轉)。

接下來通過使用IPDfromKM程序包(具體操作見上文)對CheckMate 057試驗的PFS曲線進行重構,結合相關數據來說明傳統的生存分析方法和結局指標的局限。
2.1 程序包的安裝及數據的加載
install.packages("survRM2")
install.packages("tidyverse")
install.packages("survminer")
library(survRM2)
library(tidyverse)
library(survminer)
data<- read_csv("Checkmate057.csv")
# A tibble: 6 × 3
Time Event Arm
<dbl> <dbl> <dbl>
1 0.0817 1 1
2 0.162 1 1
3 0.199 1 1
4 0.276 1 1
5 0.317 1 1
6 0.38 1 1
2.2 Kaplan-Meier分析
Kaplan-Meier分析的主要內容包括,生存曲線的繪制,中位生存時間的計算,log-rank 檢驗和特殊時間的生存率,主要由survival程序包實現。
中位生存時間的計算和特殊時間的生存率:
PFSfit<- survfit( Surv(Time, Event)~Arm, data = data )
PFSfit
Call: survfit(formula = Surv(Time, Event) ~ Arm, data = data)
n events median 0.95LCL 0.95UCL
Arm=0 290 251 4.20 3.45 4.88
Arm=1 292 238 2.37 2.20 3.47
summary(PFSfit,time=c(12,24))
PFSfit
Call: survfit(formula = Surv(Time, Event) ~ Arm, data = data)
Arm=0
time n.risk n.event survival std.err lower 95% CI upper 95% CI
12 18 240 0.0773 0.0173 0.0498 0.1200
24 1 11 0.0246 0.0108 0.0104 0.0583
Arm=1
time n.risk n.event survival std.err lower 95% CI upper 95% CI
12 46 227 0.186 0.0237 0.1444 0.238
24 2 11 0.093 0.0288 0.0507 0.171
生存曲線的繪制:
ggsurvplot(
PFSfit, ## survfit返回的對象
data = data,
pval = TRUE, ##是否顯示P值,TRUE可以換為自己想要表達的字符串
pval.method = F, # 是否展示P值的檢驗方法
legend.title='treatment', # 自定義圖例的標題
legend.labs=c('Docetaxel','Nivolumab'), # 自定義分組變量的名字
xlab = 'Months', ## 自定義X軸的label
ylab=c("Progression-free survival"),
legend = c(0.8, 0.841),
xlim = c(0,27),
break.time.by = 3, ## X軸上的時間以多少步長而隔開(如果年為單位的話,一般設置為1就行了)
break.y.by = 0.2,
ggtheme = theme_classic(), # 設置主題(自定義ggplot2中的主題)
risk.table = T, ## 所有可用的value是TRUE, FALSE, 'absolute', 'percentage', 'nrisk_cumcensor', 'nrisk_cumevents'
risk.table.y.text.col = T, ## risk table左側是否用對應分層變量的顏色注釋
risk.table.y.text = F, ## 是否展示分層變量的文本,如果不展示,則用顏色條進行展示
#surv.median.line = "hv", # 指出中位生存率
tables.theme = clean_table_theme(),
palette = c("nejm") ## 自定義曲線的顏色
)

2.3 COX回歸及HR值
PFScox <- coxph(Surv(Time, Event)~Arm, data = data ) %>%summary()
PFScox
Call:
coxph(formula = Surv(Time, Event) ~ Arm, data = data)
n= 582, number of events= 489
coef exp(coef) se(coef) z Pr(>|z|)
Arm -0.08883 0.91500 0.09200 -0.966 0.334
exp(coef) exp(-coef) lower .95 upper .95
Arm 0.915 1.093 0.764 1.096
Concordance= 0.474 (se = 0.013 )
Likelihood ratio test= 0.93 on 1 df, p=0.3
Wald test = 0.93 on 1 df, p=0.3
Score (logrank) test = 0.93 on 1 df, p=0.3
nivolumab | 0.92(0.74-1.10) | 2.37(2.20-3.47) | 0.19(0.14-0.24) |
docetaxel | P=0.334 | 4.20(3.45-4.88) | 0.08(0.01-0.06) |
由于PFS的Kaplan-Meier曲線在第7個月左右交叉,其HR為0.92(P= 0.334),其結果也難以解釋。nivolumab的中位PFS為2.3個月,docetaxel的中位PFS為4.2個月,差異為1.9個月(P < 0.05),表明docetaxel的中位PFS顯著優于 nivolumab。但從1年的生存率來看,nivolumab1年生存率顯著優于docetaxel。可以看出三個結局指標互相矛盾,HR由于違反等比例風險而難以解釋,而另外兩個指標只能說明生存曲線上的一點,而無法衡量整個生存曲線。
限制平均生存時間(restricted mean survival time, RMST)指的是生存曲線在某個時間段的曲線下面積,即平均的生存時間,平均生存時間越長則說明治療效果越好,治療組間的RMST之差可以衡量組間效果的相對大小可以作為一種替代性治療結局指標。
“限制性”則指的是只計算一定時間范圍內的曲線下面積,因為大多數的研究隨訪時間都不會太長,研究結束時仍有部分患者沒有發生結局,所以繪制的生存曲線并不完整,因此計算曲線下面積時一般要限定在某個特定的時間段范圍內。目前越來越多的研究顯示通過基于RMST的統計方法可以用作比較研究的設計和分析的主要工具可以改善具有OS和PFS結果的常規癌癥臨床試驗的設計和分析。即使當比例風險模型假設合理時,該方法也可以使醫生更好地理解HR的臨床解釋。
另外,2017年BMJ的一篇方法學論文根據RMST拓展了兩個新指標預期壽命差Life expectancy difference (LED)和預期壽命比Life expectancy ratio(LER),簡單的理解就是RMST的差值和比值。上述指標都可以在survRM2程序包中很容易地計算。
首先構建一個用于分析的數據框,并指定研究想要分析的時間窗/24個月(如果不指定,會以隨訪較短的干預措施的隨訪時間為基準進行計算)。
time=data$Time
status=data$Event
arm=data$Arm
tau=24
使用核心函數rmst2進行計算兩組干預措施的RMST、RMSL以及LED。
RMST=rmst2(time, status, arm, tau=24)
print(RMST)
The truncation time: tau = 24 was specified.
Restricted Mean Survival Time (RMST) by arm
Est. se lower .95 upper .95
RMST (arm=1) 6.560 0.463 5.652 7.467
RMST (arm=0) 5.313 0.284 4.756 5.869
Restricted Mean Time Lost (RMTL) by arm
Est. se lower .95 upper .95
RMTL (arm=1) 17.440 0.463 16.533 18.348
RMTL (arm=0) 18.687 0.284 18.131 19.244
Between-group contrast
Est. lower .95 upper .95 p
RMST (arm=1)-(arm=0) 1.247 0.182 2.312 0.022
RMST (arm=1)/(arm=0) 1.235 1.038 1.469 0.017
RMTL (arm=1)/(arm=0) 0.933 0.879 0.991 0.024
從分析結果可以看出,對于PFS在24個月的時間窗內,nivolumab相對于docetaxel的RMST的差異為1.25個月(95% CI,0.18-2.31;P = .022)。
survRM2也提供了RMST的圖形展示功能,使用plot函數便可實現。
plot(
RMST,
xlab = "months",
ylab = "rmstd",
col = "black",
col.RMST = "steelblue",
col.RMTL = "darkred",
density = 80,
angle = 85,
)

今天的文章主要結合結合CheckMate 057試驗的PFS曲線來說明在違反等比例風險的情況下,傳統的生存分析方法和結局指標的局限以及限制平均生存時間(RMST)的優勢。與HR相比,RMST在使用時沒有類似PH假定的前提條件,結果也更為直觀易于解釋,同時RMST又是對生存時間的絕對度量,更能體現生存分析中時間和事件結合的特點,而RMST的差值也更能反映不同機制干預措施的特點。因此,在生存分析過程中,建議RMST應隨HR同時給出,兩者相互配合、相互補充,共同反映生存數據的特征。
但是目前RMST的使用涉及一些方法上的挑戰,尤其是在選擇生存時間t的適當時間。與其他生存指標相比,RMST的使用面臨的另一個挑戰是它在生存分布的不同部分所具有的隱含價值。在常規的臨床試驗中,生存數據還不完全成熟,生存分布尾部的風險數字相對較低,因此此處的生存估計更加不確定,將RMST的差異作為試驗過程中生存經驗差異的單一匯總數字報告時,后續隨訪階段觀察到的存活率的不確定性增加。
參考文獻
[1]Borghaei H, Paz-Ares L, Horn L, et al. Nivolumab versus Docetaxel in Advanced Nonsquamous Non-Small-Cell Lung Cancer. N Engl J Med. 2015;373(17):1627-1639.
[2]Uno H, Claggett B, Tian L, et al. Moving beyond the hazard ratio in quantifying the between-group difference in survival analysis. J Clin Oncol. 2014;32(22):2380-2385
[3]Pak K, Uno H, Kim DH, et al. Interpretability of Cancer Clinical Trial Results Using Restricted Mean Survival Time as an Alternative to the Hazard Ratio. JAMA Oncol. 2017;3(12):1692-1696Kloecker DE, Davies MJ, Khunti K, Zaccardi F. Uses and Limitations of the Restricted Mean Survival Time: Illustrative Examples From Cardiovascular Outcomes and Mortality Trials in Type 2 Diabetes. Ann Intern Med. 2020;172(8):541-552.
[4]McCaw ZR, Wei LJ, Ludmir EB. Interpreting the impact of apalutamide on overall survival among patients with non-metastatic castration-resistant prostate cancer. Ann Oncol. 2020;31(3):438-44
[5]Dehbi HM, Royston P, Hackshaw A. Life expectancy difference and life expectancy ratio: two measures of treatment effects in randomised trials with non-proportional hazards. BMJ. 2017;357:j2250.
[6]楊紫荊,呂晶晶,侯雅文,陳征.限制平均生存時間在臨床隨訪研究中的應用[J].中華流行病學雜志,2019,40(02):247-250.
[7]https://cran.r-project.org/web/packages/survRM2/index.html