【分享】关公战秦琼?经典的随机对照试验(RCT)和真实世界研究(RWS)谁才是金标准
顶级医学刊物《美国医学会杂志》(JAMA)在6月初同期刊登了两篇重量级的文章,分析持续性的血糖监测是否有利于控制2型糖尿病患者的血糖。
不同于传统的“扎手指”测血糖,持续血糖监测通过传感器以每5分钟一次的频率测量皮下组织液中的血糖水平。那么,该方法能否改善目前2型糖尿病患者血糖控制不佳的局面呢,特别是注射胰岛素仍然无法控制血糖的患者?非常有意思的是,这两篇文章分别采用了两种不同的研究方法,一种是经典的随机对照试验(RCT),另外一个则是大热方法真实世界研究(RWS)。而且,闲人郑老师阅读发现,两篇文章均采用了临床研究较为追崇的统计学方法来评价主要研究结局。
是关公战秦琼,还是哥斯拉大战金刚?谁更胜一筹?我且粗浅分析下。首先上场的是神将关公,随机对照研究,这一经典方法百年前被提出,一直是医学研究产生证据的金标准。这项研究在美国15个初级医疗机构招募了175名正在使用基础胰岛素(中效和长效)但尚未使用餐时胰岛素的2型糖尿病成人患者。这些患者2:1分组接受持续血糖监测(n = 116)或传统血糖仪监测(n = 59)。这项研究的主要结局指标结局指标是8周后与基线糖化血红蛋白(HbA1c)的差异性。关键次要结局是每天血糖稳定在目标范围(70-180 mg/dL)内的时间、每天血糖超过250 mg/dL的时间、平均血糖。碰到这种情况,随机对照研究应该采用何种统计学方法呢?
主要结局指标是定量值,并且由于存在着基线值,一般情况下可能考虑协方差分析!不过我说这篇文章是“关公”,不是吹的,它采用了更复杂、在审稿人眼里更喜欢的方法:线性混合模型!结果表明:6个月后,持续血糖监测组的平均糖化血红蛋白(HbA1c)改善幅度更明显,从9.1%降低到8.0%,对照组的HbA1c从9.0%降低到8.4%(差异-0.4%;P=0.02)。持续血糖监测组患者每天血糖稳定在目标范围(70-180 mg/dL)内的时间要多3.6个小时(全天占比59% vs 43%,差异15%;p<0.001);每天血糖超过250 mg/dL的时间少3.8个小时(11% vs 27%,差异−16%;p<0.001);每天平均血糖低26 mg/dL。因此,相应的证据表明,相对常规的血糖监测,持续血糖监测在8月内有助于需胰岛素糖尿病患者的血糖控制。与RCT研究相比,真实世界研究更突出在真实环境下临床措施的效果。也就是回答另外一个问题,持续血糖监测在实验室(也就是实验人群)有效,那么在真实人群的效果如何呢?
因此,JAMA杂志另外一篇文章,针对4万多名的糖尿病患者开展了真实世界的研究。真实世界研究一般不采用随机对照演技,而是观察性研究,该文章采用的便是历史性队列研究。
该研究从北加州综合医疗保健系统中共纳入了41753名患者,包括5673名1型糖尿病患者和36080名2型糖尿病患者。这些患者进入队列时,正在接受胰岛素治疗、自我监测血糖,但此前未接受过持续血糖监测。而后,部分患者接受了持续血糖监测治疗(3806名患者),队列研究称之为暴露组,剩余的人群为对照组。研究团队评估了研究期间启动持续血糖监测所带来的影响。研究主要结局指标是12个月的糖化血红蛋白、低血糖、因低血糖而急诊就诊或住院的风险等。现在很多人都知道,观察性研究评价暴露因素与结局的关系,容易受到混杂偏倚的干扰。
怎么办?现在流行的方法,便是采用倾向得分方法控制混杂偏倚的干扰!该文便是如此!倾向得分匹配后分析结果如下:研究后12个月的结果显示,启动持续血糖监测的患者HbA1c水平从8.17%下降至7.76%,对照组患者则从8.28%下降到8.19%,两组下降值有统计学差异(均差−0.40%; 95%CI, −0.48% to −0.32%; P <0.001)。启动持续血糖监测也都带来了更积极的变化,包括HbA1c<7%、<8%的患者占比增加更多,HbA1c>9%的患者占比减少更多。启动持续血糖监测的患者,因低血糖而急诊就诊或住院的风险改善更明显(率差-2.73%;P=0 .001)。因此,基于真实世界数据的研究证实,无论针对1型糖尿病,还是2型糖尿病,持续血糖监测12个月对患者都具有明显的作用。这是四大医学期刊罕见地同刊用两种研究范式探讨了同一个问题,寻求临床治疗的可靠医学证据。在JAMA同期刊发的社论中,美国芝加哥大学两名内分泌专家指出,这两项研究的结果都具有重要的临床意义。“研究提供了强有力的证据,持续血糖监测有助于控制多个患者群体的糖尿病病情。”
那么谁的证据更强呢?当我早上在学习两篇文章时,脑子就冒出“关公战秦琼”的词组,虽然比喻不太恰当,但是21世纪以来,到底谁代表了医学的证据,RCT和RWS分别给出了他们的解决方案。
今天的两篇文章,都是RCT和RWS研究范式中十分具有代表性的文章。RCT:第一篇论文采用的是多中心对照研究,严谨的设计、严格的实施过程、规范的统计分析。其多中心设计、混合效应模型的统计学方法正是顶级RCT的配置。
RWS: 第二篇论文是真实世界临床研究。研究基于医疗保健数据库,数据详实完整、规模大、信息可靠,其统计学方法也是真实世界研究的顶配方法,结果贴近真实。(1)面对多中心的临床试验,最合适的方式是什么? 当然是本篇文章所记录的线性或者广义线性混合效应模型,将中心作为随机因子。
(2)面对观察性研究,分组不均衡研究,倾向得分匹配方法当然最合适,但是倾向得分匹配也有很多种,用哪一种,当然推荐本文所列举的overlap的方法了!因此,JAMA同期刊登的两篇文章,无论从临床意义上、从研究范式上,从统计学方法上,都可以拿来比较阅读。