上一篇 |

医论

【医论】如何避免被医学文献所误导?

作者:王泓日期:2014-06-15

字体大小: 小中大

临床医生常常对浩如烟海的医学文献感到困扰。PubMed总共收录全世界70多个国家和地区的4000余种生物医学期刊，每周增加的文摘条目即超过10000条。遗憾的是，很多文献得到相互矛盾的结果。例如，严重全身性感染治疗指南依据循证医学(EBM)原则，总结了过去十年间的临床研究结果，就多项治疗措施予以推荐，如早期目标指导治疗(EGDT)、强化胰岛素治疗、肺保护性通气策略、应激剂量皮质激素治疗感染性休克、活化蛋白C、肾脏替代治疗的剂量及每日中断镇静等[1]。然而，回顾上述治疗措施的相关临床试验可以发现，不加选择地盲目依从试验结果往往导致临床工作无所适从，其原因在于指南中推荐的措施均未经过两个独立的前瞻随机对照临床试验证实（表1）。

表1 严重全身性感染治疗指南部分推荐意见的临床证据

因此，临床医生需要熟悉解读医学文献的基本原则和实践，以确保根据高质量的证据做出正确的医疗决策。有鉴于此，EBM工作组将医学文献的谨慎判读(critical appraisal)与高效的医学文献检索(efficient literature searching)并列作为EBM实践的关键技能[2]。

一．避免被医学文献误导的技巧

究竟如何解读医学文献？Montori提出了一些原则[3]，以帮助读者避免被临床试验的结果所误导（表2）。尽管这些原则最初针对药物临床试验结果的分析，但同样适用于其他干预研究的评估。

1. 仅阅读方法学和结果，略过讨论部分

临床研究讨论部分得到的结论常常与读者的自行判断不同。表3比较了两篇系统回顾的结果[4, 5]，这两篇系统回顾总结了评价白蛋白用于液体复苏治疗效果的多项随机临床试验。入选的随机临床试验样本量很小，方法学缺陷明显，结果差异性很大。两篇系统回顾所得到的结果提示白蛋白可能增加病死率，而可信区间范围也表明无法除外病死率显著增加的可能性。然而，一组作者强调白蛋白的危险性[4]，而另一组作者则得到相反结论[5]。各自观点与系统回顾资助方的利益相符合。事实上，有关研究资助及研究结论之间关系的系统分析也发现[6]，与非盈利组织资助相比，受到盈利组织资助的临床试验推荐试验药物的概率增加5倍（比数比5.3，95%可信区间2.0 – 14.4）。

上述事实表明，临床医生应当对方法学和结果自行做出判断（详见第二部分）。

表2 有关应用白蛋白进行液体复苏的两篇系统回顾的比较

2. 阅读循证医学二次文献中的摘要

发表循证医学二次文献的杂志（如ACP Journal Club，Evidence-Based Medicine和Evidence-Based Mental Health等）采用由临床医生与临床流行病学专家团队撰写的结构性摘要。这些摘要常常包含原始文献省略的有关研究方法的重要信息，如分组隐藏、设盲及随访完整性等。这些二次文献的结论反映了没有利益冲突的人们进行谨慎判读后的观点。

3. 警惕错误的对照组

前已述及，与非盈利组织资助的研究相比，由厂家资助的研究显示治疗效果更为明显[6]。可能的解释之一即对照组的选择。希望得到阳性结果的研究者更倾向于选择安慰剂作为对照，而并非具有确定疗效的其他药物。

当阅读随机临床试验的文献时，临床医生应当询问自己：“对照组是否应当采用另一种有作用的药物，而非安慰剂；如果研究者选择的对照药物具有明确疗效，其使用的剂量、剂型及用药方案是否恰当？”

4. 警惕综合预后指标

研究者经常采用综合预后指标以提高临床试验的统计学效力。但是，如果综合预后指标包含的各项预后指标对于患者的重要性差别显著，将会对试验结果的解读造成困难。例如，TIME研究发现，与药物治疗相比，老年冠心病患者采用血管重建治疗的综合预后指标（包括死亡、非致死性心肌梗塞以及因急性冠脉综合征[ACS]入院）明显改善[7]。然而，血管重建治疗组患者的综合预后终点减少主要归因于因ACS入院次数减少(28 vs. 106)，而死亡患者数反而略有增加（表4）。这表明，当综合预后终点中的不同指标在治疗组和对照组的分布差异显著，或者不同指标的预后意义不同时，均需要谨慎分析研究结果。此时应当对各个预后指标分别进行评估。在这种情况下，对于最重要预后终点（如死亡）的分析结果可信度较低，而有关次要预后终点的分析结果可靠性更高。因此，上述研究中综合预后终点的改善其实只是因ACS入院次数减少的结果。

表3 老年冠心病患者血管重建与药物治疗效果的比较

5. 警惕较小的治疗效果

近年来，研究者越来越依赖大规模临床试验以发现较小的治疗效果。当相对危险度或比数比接近1，相对或绝对危险度降低接近0，或可信区间接近无效区域时，提示疗效极小。在一项大样本临床试验中，研究者将6000名高血压患者随机分为血管紧张素转换酶抑制剂或利尿剂治疗组，结果表明，“老年患者应用血管紧张素转换酶抑制剂进行降压治疗预后更佳”[8]。比较两组患者预后可以发现，两组间预后差异极小：治疗组不良预后发生率4.2次/100患者年，而对照组为4.6次/100患者年，相对危险度降低11%，95%可信区间1 – 21%。

据此，我们有理由怀疑两种降压药物的疗效是否的确存在差异。首先，结果提示绝对差异极小（0.4次/100患者年）。其次，可信区间也提示实际疗效可能更小。当对照组患者不良预后的绝对危险较低时，作者可能转而强调相对危险度降低，而忽略绝对危险度降低。夸大疗效的其他方法包括改变图表标尺，以及使用不同的时间标尺表示危险和受益。

6. 警惕亚组分析的结果

约有70%的临床试验进行亚组分析，其结果为部分研究者津津乐道。例如，SAFE研究证实，使用4%白蛋白和生理盐水进行液体复苏，重症监护病房(ICU)患者生存率并无显著差异。但是，亚组分析提示，全身性感染患者使用白蛋白可降低病死率[9]。那么，应当如何解读亚组分析结果呢？

一项研究可能包括多个亚组分析。1982年发表的一项研究使用β受体阻滞剂普萘洛尔治疗急性心梗，其中包括146项亚组分析[10]。亚组分析越多，得到假阳性结果的概率越高。统计学计算显示，如果进行20项亚组分析，假阳性率可高达60%。可以想见，如果亚组分析多达146项，那么几乎肯定可以得到统计学阳性结果。

在上述前提下，亚组分析的阳性结果可能仅为偶然。例如，1988年发表的一项研究比较了阿司匹林和（或）链激酶治疗急性心梗的疗效。亚组分析结果显示，若患者的星座为双子座或水瓶座，则阿司匹林治疗的疗效显著优于对照组[11]。这一结果显然不具有任何临床指导意义。1997年发表的一项研究总结了50项临床试验。结果发现，所有亚组分析的结果均未对此后10年的临床工作产生任何影响[12]。

最后，亚组分析的主要目的是明确不同亚组间的治疗效果是否存在差异，而不是证实在某个亚组中治疗组是否优于对照组。

7. 警惕统计学意义与临床意义的差别

尽管所有研究都根据P < 0.05判断是否为阳性结果，但是统计学意义与临床意义并无必然联系。2008年发表的综述表明，在危重病医学领域72项多中心随机对照研究中，只有10项显示治疗措施明显降低病死率，7项显示病死率增加，其余55项均为阴性结果。作者建议使用其他替代指标而非病死率评估疗效[13]。但是，对于临床医师而言，需要理解替代指标与临床预后的联系。例如，2001年的一项重症胰腺炎动物试验对肾脏替代治疗清除炎性介质及改善病死率的作用进行了研究。结果表明，高容量血液滤过和（或）更换滤器虽然能够明显提高试验动物的存活率，但其血浆肿瘤坏死因子-α水平却明显升高[14]。这一结果提示，炎症介质的清除与临床预后并不一致。另外，研究表明[15]，非感染和感染患者的降钙素原(PCT)水平存在显著差异(0.47 vs. 5.3 ng/ml, P = 0.001)。但是两组患者PCT水平的分布仍有相当程度的重叠，因此若PCT为1.0 ng/ml，临床医生仍无法据此鉴别是否存在感染。

二．医学文献的方法学与结果评估

1. 试验设计

1) 研究人群

van den Berghe等的强化胰岛素治疗研究提示，对外科ICU患者，如果把血糖控制在110 mg/dl以下(80 – 110 mg/dl)，较180 – 200 mg/dl可显著降低患者的ICU病死率及住院病死率(7.2% vs. 11%)，同时各种并发症如血行性感染(4.2% vs. 8%)、需要透析、需要输血、发生多发性神经病等的患者比例也显著降低[16]。但该研究选择的人群是收住外科ICU、接受机械通气的患者，其中约60%为心脏外科手术患者，30%是其他手术患者，急性生理和慢性健康评分(APACHE) II仅为9分。因此，该研究针对的人群多为高危外科手术后患者，而非严重全身性感染和（或）感染性休克患者。

与此相反，得到阴性结果的VISEP研究以严重全身性感染或感染性休克患者为研究对象，其中40%为肺部感染，术后患者仅占50%，APACHE II达20分。强化胰岛素治疗与对照组患者28天病死率分别为25%和26% [17]。

由此可见，上述两项研究的人群完全不同，支持强化胰岛素治疗的临床研究并非针对严重全身性感染患者。事实上，严重全身性感染治疗指南引用的很多研究均非针对严重全身性感染患者[1]。例如，保护性通气策略研究入选急性呼吸窘迫综合征(ARDS)患者，每日中断镇静研究针对机械通气患者。因此，上述研究的结论并不能理所当然地推广到严重全身性感染患者。

2)单中心与多中心研究

严重全身性感染治疗指南中很多推荐意见依据单中心研究[1]，如EGDT、强化胰岛素治疗、高容量血液滤过、每日中断镇静等。单中心研究的优点包括组织工作和数据收集简单，入选病例差异小，花费较低，容易得到一致结论，但其结论有可能无法得到外部证实(external validation)，且容易高估疗效。例如，1999年Drakulovic的一项单中心研究表明[18]，采取45度半卧位，呼吸机相关性肺炎患病率由32%下降到8%，但上述结果并未得到此后多中心研究的证实。另外，2001年Rivers的单中心研究发现[19]，EGDT治疗组患者住院病死率显著下降(31% vs. 47%)。但此后的多中心前瞻临床观察表明，严重全身性感染即使未接受EGDT，其病死率与Rivers的EGDT治疗组并无差异。事实上，目前尚无多中心前瞻平行对照研究证实EGDT的有效性。

此外，很多单中心研究可能高估临床疗效。例如，van den Berghe的单中心研究显示[16]，强化胰岛素治疗可使病死率由8.0%降至4.6%，相对病死率下降超过40%。但是，随后的多中心研究NICE-SUGAR表明[20]，强化胰岛素治疗组病死率显著升高(27.5% vs. 24.9%)。Ronco的单中心研究显示[21]，高容量血液滤过使急性肾功能衰竭的病死率由57%降至41%，相对病死率下降近30%。但随后的多中心研究如ATN和RENAL均未得出相同结论[22, 23]。以上数据表明，对于单中心研究得到的结论需要审慎判读。

2. 结果解读

1) 试验方案及其实施

了解研究的试验方案及其实施情况，对于临床试验结果的解读至关重要。例如，根据EGDT的试验方案，试验组中心静脉压(CVP)目标值为8 – 12 mmHg，平均动脉压(MAP)目标值为65 – 90 mmHg。但是，试验结果显示，对照组CVP为12 mmHg，MAP为81 mmHg，而EGDT组则分别为14 mmHg和95 mmHg [19]。由此可见，与EGDT组相比，对照组的CVP和MAP更接近目标值，其病死率也更高。因此，有学者认为，EGDT研究并不能证实将CVP维持在8 – 12 mmHg，MAP维持在65 – 90 mmHg能够显著降低严重全身性感染的病死率[24]。

2) 病例混杂

2002年Annane有关糖皮质激素治疗感染性休克的研究中，试验组应用氢化可的松50 mg q6h及氟氢可的松50 μg qd，疗程7天，以28天病死率为主要研究终点[25]。研究者根据是否存在相对肾上腺皮质功能不全(RAI)将患者分为2组。研究共入选299例患者，其中229例(77%)存在RAI。结果显示，RAI患者应用糖皮质激素病死率明显下降(53% vs. 63%)，非RAI患者病死率略有升高(61% vs. 53%)。对所有299例入选患者进行分析发现，糖皮质激素可降低病死率。究其原因，是因为77%的患者存在RAI，且糖皮质激素治疗RAI患者有效[25]。那么，感染性休克患者中RAI的比例是否有可能不同？

事实上，该研究中估计样本量时假设感染性休克患者约40%存在RAI [25]。临床研究表明，感染性休克患者中RAI的比例差异极大(30 – 70%)。因此，如果入选的感染性休克患者中RAI比例不同（如为研究预计的40%，或者为CORTICUS研究中的47%），即便糖皮质激素对RAI患者具有同样疗效，仍无法得到激素治疗能够降低感染性休克病死率的阳性结论。

3) 研究提前终止

为符合伦理学原则，很多临床试验均设定了提前终止的标准。但是，对于因试验组疗效改善而提前终止的研究需要警惕。例如，在组织因子途径抑制物(TFPI)治疗感染性休克的临床试验中，中期分析表明TFPI组与对照组病死率分别是29.1%和38.9%，P = 0.006，几乎达到提前终止标准。但是，随着试验的继续进行，两组患者病死率趋势恰恰相反，最终结果并无显著差异(P = 0.88) [26]。这一研究提示，提前终止的研究可能得出错误结论。

严重全身性感染治疗指南中，强化胰岛素治疗及保护性通气等研究均为提前终止。2005年发表的系统回顾表明，因试验组疗效改善而提前终止的研究可能高估临床疗效，低估不良反应[27]。

4) 样本量

Ronco的研究显示，持续静脉静脉血液滤过(CVVH)剂量达到35 ml/kg/h可显著降低急性肾衰病死率[21]。有学者指出，该研究还表明，CVVH剂量达到45 ml/kg/h可显著降低全身性感染病死率。但是，该研究中全身性感染仅占各组患者的11 – 14%（即15 – 20例），如此小的样本量难以得到令人信服的结论。与此相似，EGDT研究中治疗组130例患者中仅有18例应用多巴酚丁胺，因此难以确切反映多巴酚丁胺的疗效[19]。

总结

临床医师需要了解临床流行病学和统计学知识。临床试验的结果可能受到各种因素的影响。如果不了解这些因素，就会影响我们对临床试验结果的解读。对于各种临床试验的结果，临床医生应当进行审慎分析而非盲从，并且结合自己的临床经验，从而避免循证原则(evidence-based)被证据偏倚(evidence-biased)所误导。

参考文献

1. Dellinger RP, Levy MM, Carlet JM, et al. Surviving sepsis campaign: international guidelines for management of severe sepsis and septic shock: 2008. Crit Care Med 2008; 36: 296-327

2. Evidence-Based Medicine Working Group. Evidence-based medicine. A new approach to teaching the practice of medicine. JAMA 1992; 268: 2420-2425
3. Montori VM, Jaeschke R, Schunemann HJ, et al. Users’ guide to detecting misleading claims in clinical research reports. BMJ 2004; 329: 1093-1096
4. Cochrane injuries group albumin reviewers. Human albumin administration in critically ill patients: systematic review of randomized controlled trials. BMJ 1998; 317: 235-240
5. Wilkes MM, Navickis RJ. Patient survival after human albumin administration. A meta-analysis of randomized, controlled trials. Ann Intern Med 2001; 135: 149-164
6. Als-Nielsen B, Chen W, Gluud G, et al. Association of funding and conclusions in randomized drug trials: a reflection of treatment effect or adverse events? JAMA 2003; 290: 921-928
7. TIME Investigators. Trial of invasive versus medical therapy in elderly patients with chronic symptomatic coronary artery disease (TIME): a randomized trial. JAMA 2001; 356: 951-957
8. Wing LM, Reid CM, Ryan P, et al. A comparison of outcomes with angiotensin-converting-enzyme inhibitors and diuretics for hypertension in the elderly. N Engl J Med 2003; 348: 583-592
9. SAFE study investigators. A comparison of albumin and saline for fluid resuscitation in the intensive care unit. N Engl J Med 2004; 350: 2247-2256
10. Beta-blocker Heart Attack Trial Research Group. A randomized trial of propranolol in patients with acute myocardial infarction. I. Mortality results. JAMA 1982; 247: 1707-1714
11. ISIS-2 (Second International Study of Infarct Survival) Collaborative Group. Randomised trial of intravenous streptokinase, oral aspirin, both, or neither among 17,187 cases of suspected acute myocardial infarction: ISIS-2. Lancet 1988; 332: 349-360
12. Assmann SF, Pocock SJ, Enos LE, et al. Subgroup analysis and other (mis)uses of baseline data in clinical trials. Lancet 2000; 355: 1064-1069.
13. Ospina-Tascon GA, Buchele GL, Vincent JL. Multicenter, randomized, controlled trials evaluating mortality in intensive care: Doomed to fail? Crit Care Med 2008; 36: 1311-1322
14. Yekebas EF, Eisenberger CF, Ohnesorge H, et al. Attenuation of sepsis-related immunoparalysis by continuous venovenous hemofiltration in experimental porcine pancreatitis. Crit Care Med 2001; 29: 1423-1430
15. Chan YL, Tseng CP, Tsay PK, et al. Procalcitonin as a marker of bacterial infection in the emergency department: an observational study. Crit Care 2004; 8(1): R12-R20
16. van den Berghe G, Wouters P, Weekers F, et al. Intensive insulin therapy in the critically ill patients. N Engl J Med 2001; 345: 1359-1367
17. Brunkhorst FM, Engel C, Bloods F, et al. Intensive insulin therapy and pentastarch resuscitation in severe sepsis. N Engl J Med 2008; 358: 125-139
18. Drakulovic MB, Torres A, Bauer TT, et al. Supine body position as a risk factor for nosocomial pneumonia in mechanically ventilated patients: A randomised trial. Lancet 1999; 354: 1851-1858
19. Rivers E, Nguyen B, Havstad S, et al. Early goal-directed therapy in the treatment of severe sepsis and septic shock. N Engl J Med 2001; 345: 1368-1377
20. NICE-SUGAR study investigators. Intensive versus conventional glucose control in critically ill patients. N Engl J Med 2009; 360: 1283-1297
21. Ronco C, Bellomo R, Homel P, et al. Effects of different doses in continuous veno-venous haemofiltration on outcomes of acute renal failure: a prospective randomised trial. Lancet 2000; 356: 26-30
22. The VA/NIH acute renal failure trial network. Intensity of renal support in critically ill patients with acute kidney injury. N Engl J Med 2008; 359: 7-20
23. RENAL replacement therapy study investigators. Intensity of continuous renal-replacement therapy in critically ill patients. N Engl J Med 2009; 361: 1627-1638
24. Donnino MW, Clardy P, Talmor D. A central venous pressure goal of 8–12 mm Hg for all patients in septic shock. Crit Care Med 2007; 35: 1441
25. Annane D, Sebille V, Charpentier C, et al. Effect of treatment with low doses of hydrocortisone and fludrocortisone on mortality in patients with septic shock. JAMA 2002; 288: 862-871
26. Abraham E, Reinhart K, Opal S, et al. Efficacy and safety of tifacogin (recombinant tissue factor pathway inhibitor) in severe sepsis. JAMA 2003; 290: 238-247
27. Montori VM, Devereaux PJ, Adhikari NK, et al. Randomized trials stopped early for benefit: a systematic review. JAMA 2005; 294: 2203-2209