普评制点评循证医学——你真的足够了解吗
最近我发表的所有文章,都特别强调了下面这段话:
中国传统哲学和马列毛泽东思想的精髓是实事求是、辩证法和螺旋上升。【我是60岁以后,才开始领悟,这其中道理的。】
实事求是是中国共产党七大所正式确立的思想路线,更是邓小平理论的精髓。
吴仁宝讲“千难万难,实事求是最难”。【吴是将近70退下来,将近80答记者问时才讲的这句话。】这句话的背后,是吴仁宝经过几十年的探索,付出很多代价,经历很多挫折,甚至失误后的宝贵领悟。
小平同志讲:“制度是决定因素”“制度好可以使坏人无法任意横行,制度不好可以使好人无法充分做好事,甚至会走向反面。” 《邓小平文选》第2卷,273页、333页)那究竟是什么样的制度才能起到决定性的历史作用呢?!!!小平同志又说:“最重要的是用人权”(邓选3卷166页)。通过反反复复的比较研究,历史告诉我们:最带根本性的组织用人制度在前进、在变化(即世袭制在向民选制,民选制在向民评制方向前进)才是大国崛起的根本原因。
曼德拉也指出:
我反复提醒大家,解放斗争并不是一种反对任何一个团体或种族的战斗,而是反对一种压迫制度的斗争。
普评制认为,人类社会所犯的一切严重错误都是世袭官僚制、终身官僚制、科举官僚制、普选官僚制、委任官僚制所造成的。 换句话说,我们所反对的是世袭制、终身制、普选制和官僚制,而不是因为这些制度而犯错误的个人、团体或种族。这里面当然包括政党、执政党。而
一个科学合理的解决办法就是要实行真正负责任的民选民评制。也就是要把基层领导干部的评判罢免权交给被他们领导的普通群众——这样一种最带根本性的组织用人制度,也就是普评制,老百姓的普评制,而不是继续交给他们的上级领导。只有这样才能实现毛主席所说的:
全心全意地为人民服务,一刻也不脱离群众;一切从人民的利益出发,而不是从个人或小集团的利益出发;向人民负责和向党的领导机关负责的一致性;这些就是我们的出发点。
《论联合政府》(一九四五年四月二十四日),《毛泽东选集》第三卷第一零九五--一零九六页 只有这样
才能实现习近平关于推动建设人类命运共同体的政治主张。当然,首先要用家庭联户代表制或者走婚登记制建成家庭命运共同体,然后,才能建成国家命运共同体、人类命运共同体。
以上都是老生常谈,另外,还有一句老生常谈:
在老百姓没有评判罢免权的情况下,什么伤天害理的事都有可能出、什么千奇百怪的事都有可能出,而且是层出不穷!没有这么多鲜活的例证加以证明,你们说,我这老生常谈还能谈得下去吗?!!!可是,这鲜活的例证又是多么的令人痛心疾首啊!本不想多谈,但又不能不说。我一个退休老工人,仅仅是希望有一天,关键的少数能够看到、理解、落实这些老生常谈,救民众于水火。仅此而已,别无他求。
下面请看
循证医学——你真的足够了解吗?
兴起于二十余年前的循证医学,无疑对现代医学的发展起到了无法估量的推动作用,可以说循证医学是二十余年来医学领域最具影响力的方法学革命。然而,对于骨科医生来说,循证医学够时髦,够新潮,但有些遥不可及、不切实际,甚至有些中看不中用。可我们对循证医学真的够了解吗?
我这里没有选用那些太牛的文献和著作,而是选用了2004年美国骨科医师学会杂志的一篇文章,或许对于骨科医生来说这更加亲切。提供全文,试着翻译,与大家一起学习、讨论。
摘要
循证医学是指通过应用和评价相关信息从而做出医学决策的一种明确的方法。循证医学可能和通常的观念相反,由于通常无法获得既真实又完整的信息,它要求医生必须接受、权衡相关的不确定性。考虑到医学的不确定性,循证医学提倡通过以下五个步骤来做出合理的决策:例出可回答的问题;搜集证据;评价证据;应用有效的证据;评价整个过程。列出可回答的问题时须根据病例的具体情况进行明确的分类,以对从以往的研究中搜集来的证据进行比较。评价证据时可应用临床流行病学的相关手段,评估证据的有效性和适用性。应用有效的证据是指实施基于整合的证据以及医生的判断和患者的愿望所制定的临床计划。最后,循证医学还要求进行进一步的评价和改进、完善。随着医学知识库的不断发展壮大,在取得最佳治疗结果的要求下,循证医学的方法与同期的医学以及医生的临床实践有着非常密切的关系。
hotstone注:参考Sackett DL的概念,循证医学是指认真、明确、审慎地应用现有最佳的证据,结合医生自身的临床经验,充分考虑患者的意愿,而做出医学决策的方法。
循证医学的发展、推广堪称奇迹(图1),但什么是循证医学?为了评价循证医学的价值[1]评估他对临床实践的影响,我们必须统一其定义。因此,本文主要的目的,是为了明确循证医学的定义,并对其创建的临床流行病学方法和关键的评价方法作一综述。而另一个更为复杂同时也许更为有意义的问题是,为何近来如此重视循证医学。将循证医学阐述为一种新的临床实践模式,则意味着传统的方法并不遵循证据,当然这只是间接的评判,主流的观点中,没有人将西方医学和巫术、占卜等同起来。然而,这也提示以往的医学实践确实缺乏一种基于科学的模式。
认为医学缺乏科学的依据,最为有力的一种论调主要来之有些研究报道的临床实践上的差异要远远大于疾病发病率上的差异。例如,圣巴巴拉(加州)的医保患者中脊柱手术的比率约为布朗克斯(纽约)的5倍。因为不太可能有某种因素会导致疾病的发病率相差5倍,那么大概存在这样的患者,加州的医生表面上根据他们科学的见解,认为应该手术,而布朗克斯的医生,应用同样的科学理论,则认为不必手术。这样要么加州的医生在科学上是正确的,要么是布朗克斯的医生,但不可能两者都正确。
在临床实践中相关的见解差异很大,而由此证明医学并不是以科学为依据的观点则应该进行反驳。反驳这些观点需要说明做出医学决策时是如何应用医学证据的,即使具有最佳的证据为何也只能使不确定性和差异变得最小,而无法消除。
循证医学的定义
“循证医学”这一术语是指通过应用和评价信息做出医学决策的明确的方法。通常引用Sackett等[3]提出的定义“循证医学是指认真、明确、审慎地应用现有最佳的证据,针对患者个体的治疗做出决策的方法,应用循证医学的方法必须综合医生自身的临床专业知识以及现有最佳的来自系统研究的临床证据。”这一定义没有提到随机对照试验,也没有提到成本效益研究、规则系统或操作方法。然而,该定义的言外之意,做出医学决策是一个较为艰难的过程。另外,也是医生为何必须“明确地、审慎地”的原因。
做出医疗决策的艰难主要因为所有的临床医生都必须面对这样的两难境地:做出医疗决策的依据的信息既不完美也不充分。称之为临床决策不确定性原则:无法同时获得既准确又完整的信息是不太可能的。要理解这样的两难窘境,我们必须考虑到医学知识的本质。
康乃尔大学医学院的院长曾在迎接新生致欢迎词时很遗憾地说道:“我们即将教给你们的有一半是不正确的,问题是我们并不知道是那一半。”虽然这种说法很显然有说笑的成分,和很多玩笑话一样,而他的歉意则是来自与他所说的事实。如果以历史为标,我们当前的认识其实很多都会被替换或修正。
考虑到我们的信息至少有一部分是错误的,我们应该怎么做呢?将医疗实践活动局限在已经证明、既定事实的范围内是无法保证安全的:规避所有未经证实的信息,则同时也会使我们必须拒绝一些真实的,但尚未被证实的观点。在下面的示意图中描绘了医学知识的总体情况,途中阐明了这一现象(图2)。在这一整体中,有一个子集为事实上真实的观点,图示为A圈之内的范围。另外有一个子集为已经经过验证的观点,B圈,A和B的交集也就是C所示的面积表示已经经过试验证实为真实的观点,也就是临床医生所需要的真实有效的信息。但是很显然C所示的面积并不包括所有真理;C区域只是A区域的一个子集。其中有很多困惑。临床医生如果将自己的观点仅仅局限于C区域,那么他就无法应用那些尚未证明的真理,也就是D所示的区域。但是如果临床医生希望从D区域获取一些尚未被证实的观点,则同样面临着应用A区域以外相关谬误观点的风险。鉴于此,我们的选择是,要么只应用已被确认的信息,尽管可能很少,或者冒险去应用未被证实的甚至有可能是错误的观点。
图2,医学知识总体(U)示意图。A区域表示所有的真命题,B为所有经过验证的命题,C表示所有有效的(经验证的真实的)命题,但并不包括所有真理:其没有包括的区域D所示为尚未被证明的真理(是真理但尚未验证)。E区域为不正确的知识,即所有经证实的伪命题。F区域为既不真实也没有被验证的命题。临床医生应用未经验证的知识时希望他所应用的命题属于D区域,但实际上也可能来自于F区域。
存在不少未经证实而可能是真理的命题,这很多是由于资源缺乏,:并没有足够的时间和钱去证实所有的一切。但是更为根本的问题是,即使拥有无限的资源,也仍然有些真理我们无法确定其真实性。正如1930年Kurt G?del开创的不完全性理论所言[4],用他本国的语言来解释这一原理“并不是所有的真理都能验证其真实性”。因此我们提出了一组不太有吸引力的选项:一方面是有缺陷的,另一方面是不充分的。但我们必须得做出选择。正如寓言中所说的,将一头饥饿的驴子刚好放在两包干草料之间,向两个方向同样地拉,最后它会被饿死。在临床实践中,我们不能寄希望于所有的情况下都有完美的信息供参考。依靠手中的信息我们必须做出决策,这些信息有时甚至是不可靠的。面对这些不确定性,循证医学的方法可以帮助我们做出最明智的选择。
循证医学的应用
假定有一位患者,Smith先生,胫骨开放性骨折,当地医院予夹板固定后,转诊给一位创伤科专科医生,该医生希望运用循证医学的方法来处理。他认为该患者需要手术治疗,然而,他无法确定内固定还是外固定支架更好。如果他的原则是只有经大样本随机双盲对照研究证实了的方法才能用于治疗的话,那么这两个方法都不能选用,因为可能永远不会有这样的研究(由于有或没有一个庞大的外固定支架,这一点至少不可能对研究者实施盲法)。但如果这位医生按照这个原则两个治疗方案都不选用,那么他就实际上选择了第三个方案:对该患者继续进行夹板固定。也就是说他必须做出选择。为了做出明智的而不是随意的选择,Sackett和Haynes[5]推荐参照以下五个步骤应用循证医学的方法:(1)列出可回答的问题;(2)搜集证据;(3)评价证据;(4)实施这些证据;(5)评价整个过程。
第一步:列出可回答的问题
医生不能查阅文献后直接问“我该对Smith先生做些什么?”这一问题必须转化成一个可回答的形式,可能包括三个问题:谁是Smith先生(hotstone注:按照我理解,也就是“Smith先生的病情如何”)?治疗的选项有哪些?如果我选择其中一个选项的话会得到什么样的结果?像这样例出这些可回答的问题后,则必须注意明确患者(疾病状况)、可能的治疗方案以及密切相关的治疗结果。
明确患者的状况须先做出诊断,然后明确患者的特征,一般认为这和治疗是密切相关的。一名患者的情况应该包括年龄、性别、病史,和其他信息,比如骨折的部位和程度以及合并损伤等。检索是不可能有针对Smith先生本身的研究的,只有患者的一些共有的属性。这样临床医生应用其“个人的临床专业知识”,必须决定哪些属性是决定性的。例如,大多数临床医生都认同,一项成年女性胫骨骨折的研究与Smith先生的病情是相关的,而有关未成年男性胫骨骨折的研究则是无关的。这样看起来相比性别,年龄似乎是更为决定性的属性,但这种认识实际上就是个人临床专业知识的体现:小儿骨折相关研究的作者不太可能提供明确的警告,指出其研究结果不适用于成年患者。
接下来再确定可能的治疗方案。这也是一个个性化的决策过程,因为文献中的那些选项可能无效或者不切实际:资源缺乏,医生自身技能的局限,存在其他的合并损伤可能限制其做出的选择(这样的概念是合适的:“文献中建议的方法为X,但对我们来说,Y更好”。当然,医生必须意识到,如果受他的限制而不得不做出让步,那么可能最好将患者转诊给其他医生)。
最后再确定相关的治疗结果。并不是研究人员报道的所有的治疗结果都对确定Smith先生的治疗方案有用。一项研究报道治疗胫骨骨折后的结果,可能会探讨骨折愈合的时间,患者获得骨折愈合的百分比,住院时间的长度,并发症的发生率或其他结果。哪一个是重要的,重要的程度如何,这都必须针对每一个病例做出个性化的决定。
第二步:搜集证据
针对某一专题搜集大量的研究文章相对简单。而从另一方面来讲,收集“收集现有最佳的来自系统研究的临床证据”则要困难得多。如果处理不当,文献检索则可能会被不相干的文献完全掩盖(这一点正如英国诗人对古代水手的悼词所说的“水,到处是水,但没有任何一滴是可以喝的”)。面对大量的研究,如果识别“最佳的”则成了一项艰巨的任务。
本文的目的并不是讲授如何有效地检索文献,可能也无法仅仅通过一篇来阐明这一问题。这些技能通常须通过指导和培训,然后自身实际训练才能获得。从某种意义上而言,学习如何检索文献,类似于关节镜手术的学习过程:从接受培训教程开始,但必须不断地改进,精益求精。
第三步:评价证据
循证医学要求临床医生必须对医学证据进行评判,正如法院处理法律证据一样。打这个比方也提醒我们对医学证据进行评价时也意味着人们试图打开谬误之门(相关附件请参考
http://www.jaaos.org/cgi/content/full/12/2/e1)。有关法律的这个比方也使一些错误的评论更加突出,有人仅仅因为有些医学观点没有被理想的证据所证实就,认为医学并不是以证据为理论基础的。毕竟我们也不能仅仅因为只有极少数的判决有照片作为依据,就认定大多数凶手的审判都是没有证据的。相反,我们接受各种类型的法律证据,采信更好的一部分。(诚然,目击者的辨认,甚至供词都已经被证明是不完善的)医学和法律类似,这一环节的重要性是由证据所决定的,当然也会影响到我们要求的把握度[6]。因此,这一问题不是“证据是否完美?”而是“证据好到什么程度?”。
在临床研究中,并不是所有的证据来源都是均衡的。在报道治疗结果的研究中,大多数流行病学家都认同以下金字塔形的证据等级:
随机对照研究
前瞻性队列研究
回顾性队列研究
病例对照研究
病例系列
病例报告
专家意见
个人观察
各种研究各自的特征见表1
表1临床研究中常用研究类型的定义
研究类型 定义
病例报告 单一患者的报告。
病例系列 治疗方式相同的多例患者的研究报告,但没有对照组和比较组。
病例对照 选定一组患有某种疾病的患者和一组未患有某病的受试者,检查其之前暴露的相关因素对该疾病的影响。
回顾性队列研究 按照暴露或治疗不同将患者非随机地分组进行比较研究,暴露发生在开始研究之前。
前瞻性队列研究 按照暴露或治疗不同将患者非随机地分组进行比较研究,暴露发生在开始研究之后。
随机对照试验 将患者随机分配到治疗组或对照组,并进行前瞻性的随访。
这一金字塔其实是各种研究的分级系统,每一个层次所代表的方法都比其下一层具有更高的证据等级。例如,一项队列研究显示的X比一个病例系列显示出相反的结果更有价值。然而,所有形式的证据,甚至包括那些低等级的,都是合理的。因此,如果缺乏其他证据,将一个病例报告作为依据来应用也是合适的。不充分的证据与无证据并不一样。
考虑到证据的分级系统如金字塔形——其结构越到顶部越尖——这也提示了重要的一点:最佳形式的证据通常最罕见。例如,在一篇骨科文献样本的综述中,纳入了近500篇临床研究文献,仅有33篇为随机对照试验,并且其中很多都由于统计学处理不当而存在缺陷[7]。(图3)
图3 JBJS(A卷和B卷)和CORR一年内所有临床文献中各个研究类型的分布情况[7]。
随机对照试验与病例系列研究
随机对照试验的研究结果通常是最有说服力的医学证据。为了评价随机对照试验的优势,我们将其与较弱的研究方法作一对比,比如更为常见的病例系列研究。假设有一个病例系列研究报告了50例膝关节骨关节炎的治疗结果,所有患者均报告通过关节镜清理术治疗后获得成功。那么这一研究能证明手术的效果吗?可能不能。我们必须考虑到该研究可能受到以下多种偏倚的干扰,例如:
患者的选择:如果仅仅纳入通过手术治疗更倾向于取得较好结果的患者,这样的报告其最终的效果就会被夸大。
缺乏背景(对照):手术可能取得成功,但它是和什么相比?如果要说明一项治疗是有效的,那么至少必须与不同治疗方法处理的第二组进行对比。甚至通过客观的评价,其改善程度尚不足以说明这一治疗方法确实有效,或许骨关节炎的自然病程中也有偶然改善的时期。那么必须另外设置一组没有接受治疗(甚至连安慰剂也没有)的患者,以确定该治疗实际的疗效。
数据丢失:回顾性研究可能无法纳入所有接受治疗的患者。有的相关记录可能已经丢失。并且,现在询问患者他们多年前的症状,这样未必能想得起来所有相关情况,并且可靠性通常也不同。
排除标准不严谨:一项关于手术治疗的回顾性研究通常特征性地不会纳入计划进行手术治疗但最终没有接受手术的病例,其实这也是一种偏倚。患者很希望手术,而最终接受非手术,因此被排除出手术组,但这样选择性地剔除这些患者也会影响最终的结果
认知偏差:愿意手术治疗的患者,对于自己经历的所有手术相关的不适,他都会说服自己坚信手术是有益的——即使可能并非如此——以证实其当初决策的正确性。同样,对于外科医生来说,评价自己做的手术也很难做到公平。
双盲前瞻性随机对照试验则可以避免这些偏倚。在这样的试验中,所有符合纳入标准的患者都被随机分配到不同的治疗组,这种随机分配可以防止只进行疗效可能最佳的治疗方法导致的偏倚,并可以与对照组进行对比。前瞻性的试验中,研究人员可以预先确定相关的变量,并可以明确地从所有患者中全面地收集相关资料。而对于分配到某组的患者最终没有接受相应的治疗,则其退出的偏倚也可通过意向治疗分析来进行矫正。此外,让患者和评价者都不知道给予的是何种治疗方式(所谓的双盲)可以限制由于心理作用导致的偏倚yi3。
随机对照试验的价值就在于其对偏倚的控制,但这些试验也并不都是绝对可靠的。在一些极端的情况,随机对照试验据说证实顺势疗法是有益的[8],对于该方法,Park[9]证实不仅不符合医学原则,并且同生物学、化学和物理学的规律也是相冲突的。此外,这样的试验可能存在错误,或者至少存在统计误差。(设定P=0.05作为有统计学意义的标准,我们预先必须接受该研究有5%的机会可能会看到根本不存在的差异。)
随机对照试验提供了良好的证据,当然也并不完美。如果你怀疑这一点,则可以想一想Skrabanek 和McCormick[10]讲述的轶事。一例患者纳入了一项双盲随机对照试验,以研究某个药物的疗效。有一天,他突然问他的医生,为什么他的药变了?这位医生,由于盲法也不知道该患者到底属于哪个治疗组,他答复该患者说他也不知道患者所说的情况,但他仍然问道“你怎么知道你的药变了”。该患者答道“之前我把这些口服避孕丸扔到厕所里时,它们都会下沉;而这周我发现它们都浮在上面。”
病例对照研究
除了其局限性,甚至一些缺点以外,小的随机对照试验也可能并不是最佳的证据形式。有些问题通过其他方法来证实可能更为有效。比如评价“损害”的长期风险,病例对照研究或许是最合适的。例如,为了明确长跑是否会导致髋关节的骨关节炎,要对患者进行随机试验那几乎是不可能的,这得要求他们中的一部分去跑马拉松,然后等过了几十年后再评价两组患关节炎的比率。而病例对照研究或许是一个更好的办法,研究人员从患有骨关节炎的患者中搜集相关数据,将这组患者中之前进行长跑的患者的数量,与没有患关节炎的对照组的相关数值进行比较。
当然,病例对照的方法无疑是不完善的,因为出现症状的受试者可能更容易回想起其之前的暴露因素。同样,相关的因果关系也会受到明显的暗示,而不是证明。然而,通常如果在暴露和发病存在很长一段时间,或者相关疾病在研究中较为罕见的话,病例对照研究可能是最好的方式。
专家意见
专家意见位于证据金字塔的底部,这一位置也表明了其意义:专家的教学是其他知识的基础,好的学生变成老师,教科书(不是期刊文献)成为他们特定领域的学习、研究内容。但作为证据的一种形式,专家意见则居于系统研究之下。其理由是以往有很多例子,专家的观点都存在显著的错误[11]。例如,William Harvey的血液循环的基本概念就曾被“专家”严厉地批判过。Scott[12]指出,骨科领域也有其自身的例子。
在一些不太严密的领域,听取专家的意见则是最高形式的证据。例如,不久之前心理分析的很多成功的论证都是以“正如弗洛伊德自己所说……”而开场的。骨科领域相比心理分析则是以更加客观的理论基础作为依据,但我们的专业训练方法也与之类似,初学者都是向老师学习技能的,因为就其基础理论而言我们通常适应于接受专家的讲授,而当他们变成推测时,我们可能发现也很难拒绝他们的观点。然而,我们必须,我们必须记得证据的等级:专家意见肯定超过非专家的意见,但却低于高质量的临床研究。
个人观点
个人观点是最弱的证据类型,我们很容易被我们自己的个人观点所迷惑,即使我们认识到相关事实并设法补偿也还是如此。首先,个人观点是以小样本研究为依据的。让我们来思考一下临床医生全膝关节置换术后不使用抗凝剂的情况。如果他观察到一个系列共10例患者没有进行药物干预也没有发生肺栓塞,他可能会错误地下结论认为抗凝剂是不必要的。而事实上,如果没有进行预防是肺栓塞的风险,比如为3%,那么临床医生在10这种未经处理的患者中,不会遇到1例栓塞的可能性仍为3:1。由于这样的并发症很少,抗凝剂是必须的这一事实可能只有在较大样本的病例中才能被证实。
此外,个人观点也是一种没有对照的研究形式,正如Redelmeier和Tversky所说,人们认为世间的事都是有合理的,并且可能会虚构很多说法来解释他们所看到的,而不管这些说法是否有依据。如果一例患者进行治疗后取得了良好的疗效,人们处于本性都会简单地认为是这种治疗方法将疾病治愈了,因为治疗之后接着就痊愈了。这导致后其后面的错误观点,混淆了与时间的因果关系。如果在对照组中也观察到类似的改善,那么我们就不太会犯这样的错误。
最后,个人观点通常存在回忆方面的偏倚,如果一例踝关节扭伤的患者,我们没能发现其胫后肌腱的腱鞘还存在滑膜肉瘤,那么我们此后遇到踝关节扭伤的患者则可能会高估这一罕见疾病的诊断。
假设有以下这样一个病例,21岁的运动员膝关节扭伤2天,存在疼痛、肿胀、关节线压痛,收集病史、体格检查、影像学检查并抽取关节液等等证据,并进行评价后,临床医生做出结论,该患者的内侧半月板在半月板-滑膜结合部(即所谓的红区)存在撕裂,并且没有其他的损伤。
对此,有三种治疗选择:半月板修补,半月板切除以及非手术治疗。在三种方案中做出最佳选择,其情形如图4的决策树状图所示,在这一树状图中,例出了所有的选项,从这些选项发出的分支,表示这些治疗结果导致的可能的治疗结果。这些分支分配的权重与可能获得的相应的治疗结果的概率正比,各分支的终点所分配的值相当于相应治疗结果的价值。
图4 半月板红区撕裂相关治疗选项和治疗结果的简化决策树状图。右侧的方框代表治疗结果。指向它们的线条按照可能获得的特定疗效状态的比重赋以相应权重。P1是指获得结果1的概率。如图中所示,每种治疗方案只有两种结果,虽然有更多的可能性。治疗的值为P1?UO1该治疗方法所有治疗结果的总和.px=获得某个治疗结果x的可能性.UOx=实际的治疗结果x
这样就可以对选择的治疗方案所导致的治疗结果的加权平均数进行计算,从而明确相关治疗选项预期的效果。预期的效果是指每个终点(结果状态)的效果值乘以相应结果发生的可能性的总和。因此,选择最佳的治疗方案实际上就是选择期望值最高的选项。
为了填充该病例的决策树状图,可应用下面有关结果的信息(假定)。红区撕裂<1cm通过非手术治疗有90%的几率可以获得痊愈,在这样的患者人群中,半月板切除术6周内症状几乎肯定(99%)都会缓解,但是与此相关,10年内有40%的几率可能会发展成关节炎。红区半月板修补有75%的几率获得成功。那么现在可以根据这些数据确定最佳的治疗选择,但是事实上大多数关键的信息都是错误的:可能的治疗结果对患者有多少价值,或许治疗的价值会因患者而异。
对于半月板红区撕裂的病例来说,看来修补是较为合适的答案。但是设想有这样的情况,一位大学四年级的学生作为篮球队的成员希望2月份参加国家锦标赛,而半月板切除术则是最为可靠的,有可能使其6周内重返赛场,这一点可能会引诱她忽视发展成关节炎的风险,并且会高估半月板切除术的短期效果。相反,如果某患者的父亲死于手术台上,则可能会使其对非手术治疗产生过高的评价,即使这样做将使其膝关节面临风险。
由于骨科的很多手术都是为了缓解症状,决定推荐进行手术时的决定因素通常是其治疗潜在的结果相关的效用。而确定这样的效用是非常困难的。我们必须确保所有的结果没有偏倚并且相关的效用值也都确切地记录在案。我们必须确定一个标尺以明确地标示各种形式的合适度。例如,“围手术期死亡”以及“能在高尔夫球场上走18洞”都是全髋关节置换术所关节的治疗结果。虽然这些结果看起来没有一点可比性,患者事实上得冒着前者的风险以获得后者的效果。我们同时还必须解释风险转移,以及为了实现当前的价值,要忽视将来的效用。因此,半月板外周缘撕裂的“合适”的治疗要视患者的偏好而定,即使你掌握了良好治疗结果的证据也仍然如此。因此,圣巴巴拉(加州)比布朗克斯(纽约)的脊柱手术更多,可能仅仅因为各地的民众有不同的价值取向和个人偏好(当然,肯定也还有其他合理的解释)。
此外,有关半月板治疗结果的证据清单存在关键性的缺陷。对于患者撕裂的大小或者基于影像学的确切的评价没有相关的信息。虽然确定了撕裂<1cm的治愈率,但是大的撕裂的治愈率,或大小与治愈率的关系等却没有提及。如果组织没有愈合又是一种什么情况。最后,手术的并发症如何,发生并发症的可能性如何?
对于这一病例要做出正确的决策,必须要有其他的资料,因此,需要一个比图4中所示的还要复杂的决策树状图。非手术治疗失败的治疗结果必须要展开来,例如,由于非手术治疗失败后或许还需要进行半月板切除或修补。同时,要做出更为准确的手术选择,还应考虑进行诊断性的关节镜检查,因为对一个小的撕裂本来准备进行修补的则可能没有必要,或者发先存在无法修补的大的撕裂,则不得不进行半月板切除术。最后这种两分法类似于“治愈”或“修补失败”其实实际上并没有这么泾渭分明。
这个例子显示,即使简单明了的病例,有明确的广泛的治疗结果数据,也可能导致很复杂, Eddy的说法很贴切“远远超出单个人的思维能力”[15]。直到发明出更好的工具能辨别什么样的患者需要,直到提出相应的指南能适应这些偏好,搜集的医学证据不可能总是发挥其最大的优势。
第五步:评价整个过程
应用循证医学的方法时对整个过程进行评价是必不可少的,虽然有可能出现问题。主要的困难在于,通常评价都是以个人观点为依据的,并且这些证据本身也可能存在偏倚。同时,在处理一些小样本证据时,由于统计学上的偏差也可能使我们做出错误的判断。由于个人观点存在的局限性,最好将评价作为大型监测工作的一部分。例如,对关节置换手术进行登记注册可能会有帮助。即使管理组织搜集的数据可能会提供有益的正反馈。考虑到初级诊疗中心的临床医生一年进行一次骨密度测定的医嘱也不会下,回顾该医生的有效数据,可能通常他的建议都不会充分考虑骨质疏松症的预防。当然,对这一过程的评价必须由其合作的临床异常来继续进行。
克服对循证医学的阻力
对实施循证医学的阻力在临床医生中还是经常存在的,他们遵循的理论通常都不如循证医学,但尽管如此,他们也不愿接受。这些临床医生可能担心,应用循证医学需要较高的数学水平,然而实际上,循证医学无须应用专门的工具对数据进行处理,应用循证医学的医生也不必成为统计学家;他们唯一需要的技能就是如何应用统计学家做出的结果。按照Greenhalgh的有用推论,医生不要求会制造汽车,只要知道如何驾驶汽车即可。
更大的阻力则可能是有的医生认为循证医学是侵犯临床医生专业自主权的借口,由于循证医学规程的限制,临床医生自主操作的权力会被削减。正如19世纪卢德派分子在诺丁汉市砸碎棉花织布机以保护其工作的行为一样,这些临床医生在“错误”的方向上以发展不完善的名义试图抵制循证医学。
而最令人担忧的阻力则可能是出于善意的,临床医生出于善意认为循证医学在临床实践中认为其难于操作。这一担心有其合理性,医生们比以往任何时候可自由支配的时间被剥夺的情况更严重,而阅读和评价文献又是很耗费时间的。例如,2000年一年spine杂志MEDLINE的文献有479篇,即使简单地关注这一种杂志也可能比其他医生花在看书上的时间要多一些。循证医学的创建者认识到这一问题后,鼓励医生们以研究组为单位对文献进行系统评价,然后以这些评价为基础再发展为临床指南。系统评价并不是某个专家的观点,然后通过引用的文献来加以支持。而其更像是一个参考书目,按照预定的方案收集起来,并参考相关的标准进行评价。因此,系统评价并不一定要有专家来写,或许根本不应该由他们来写。
系统评价理论上形成临床指南。临床指南通常以系统评价为基础,综合循证医学的前三个步骤:提出可回答的问题,搜集证据和评价证据。这样可以提供给临床医生一个周密的综述,而无须亲自查阅相关的初始文献。关键的是治疗必须充分可信,能够弥补医生的技能和患者的喜好带来的差异。对于医生而言,应用其指南不可采用严格强制的方式,正如14世纪法国医生Henri de Mondeville说的那样:“相信同样的东西能够适用于所有人的观点是愚蠢的,因为医学实践并不是针对人类总体,而是每一个特异性的个体。”
概要
循证医学可能是一个新名词,但它却是源于一个老概念:经验的结果问题。这一观点可以追溯到100年前的骨科医生Codman,他强调对最终结果的评价。事实上,我们发现19世纪的巴黎就曾应用循证医学的方法,Pierre Louis提出放血疗法是不足信的,纽约时报描述了Louis进行的第一个临床试验:“他治疗肺炎患者,要么早期进行侵袭性的放血疗法,要么采取侵袭性较小的措施,在实验结束时,Louis博士测量身体,发现他们比放血治疗的患者明显要高一些”[18]。这一结果——与某些想当然的理论不同——导致临床实践从此放弃放血疗法。
循证医学尽管有着古老的传统,而它也随时准备着回答当代的要求。随着信息的增加,主要是由于互联网的扩张[19],并且随着传统期刊的发展,因此要求临床医生重新定位,搜集并评价相关的情报信息。问题并不是缺乏资料而是太多了,我们必须在混乱的信息中找出低劣的部分,循证医学允许我们这样做。
最后,对于科学可以告知我们的内容,我们必须考虑到其局限性。剧作家Berthold Brecht(偶尔也关注医科学校)写道:“科学的主要目的不在于打开无限的知识之门,而在于限制无限的错误”(伽利略时代)。因此当我们说循证医学是以医学科学的基础,我们的意思并不是说循证医学并不是一项使你始终正确的策略——可能也不可能产生这样的作用——而可以说它是一个是我们减少犯错几率的工具。将错误最小化的目标必须牢牢掌握,在我们的能力范围内努力进取。
产科学科带头人 福建某沿海宜居地级市
发布于 2010-01-08 04:32 quality reply
来学习hotstone兄的精彩论述。
一点一滴的进步最重要。循证的核心在于临床。是一种新的临床思维模式。有循证的思维,可以擦亮我们的眼睛,让我们明辨是非,做出更好的临床决策。
也希望在临床诊疗的循证思维运用上,和兄弟板块一起,夯实每一个脚步。有感而发,说说我的观点,给兄做个小小的补充。
期待思想的碰撞和引起的交流,讨论和共鸣。
循证是一个浩瀚的海洋,也是我们的综合医力。临床思维的闪光,需要我们冷静客观的头脑。
医学的复杂性和不确定性是她的魅力,让我们充满了探索的期待和迷茫,虽然人类走到今天,对很多事物,甚至几万光年之外的宇宙都有了了解,能让山河让路,让卫星上天,可以,对于自己的了解,还是远远的不够,表现在身体方面,最主要的就是疾病的治疗。
任何一个名医或者明医,对于任何一种疾病的诊疗,永远都没有100%肯定的把握,新出现的情况层出不穷,不停地更新着我们的观念。而且我们坚信,我们不知道的,远远多于我们知道的。
正是在这种情况下,循证的思维应运而生,她告诉我们医学的真谛和我们应该有的循证思维。让客观冷静目光面对瞬息万变的医学现象,逐渐一步一步的接近真理。
虽然循证并没有自己土生土长的方法,然而,循证的思维,让这些方法成为综合医力的展现,一个国家的实力需要多个方面和层面的评估,而一个医生的医力,同样也需要掌握更多的技能和敏锐进取的思维。
首先综合医力首先表现在你的临床技能,这和循证要求的个人经验丝丝入扣,所有的目的都是为临床诊治病人所服务的,无论多么精彩的世界,都是围绕临床的电子,都不能让我们偏离了临床诊治的这个电子核。
第二,循证的综合医力,要求医生要熟知临床流行病学的内涵,这可以擦亮我们循证的眼睛,就要知道擦亮的方法,让我们不人云亦云,准确的判断汗牛充栋的研究,孰真孰假,保持清晰的头脑。
第三,循证文献检索,这是医生应当具备的综合医力之一,如同综合国力的人文素质。循证检索是基于普通检索的进一步发展,寻找最新的临床证据,准确定位临床问题,这一能力,可以广泛的了解相同领域的世界顶级研究,促进相同疾病的资源共享和交流,利于疾病的深入研究和应对措施的探讨进步。
第四,循证综合医力之医学统计学,涵盖在meta分析之中,在临床流行病学中也能见到她的影子,这个说起来就让我们头痛,但是没办法,循证需要我们了解的仅是一点点,一点点的统计知识,然而原理还是应该了解的,WMD,OR,RR,可信区间,P值,循证医学之森林图的意义,非常重要,我们需要读懂她。
第五,综合医力,就是要我们整体把握循证理念。这个境界需要你跳出循证繁琐的计算和亚组分析,从整体看待循证的目光。就像临床医师治疗疾病,各种理化指标是机器告诉你的,我们治疗的面对的是病人,不看到病人,不和他沟通是不能够诊疗的,循证也一样,这些数字是不能够给我们判断和决策的,决策的是我们医生的智慧。因为你必须具有循证的综合医力。
循证是我们的综合医力的体现,目的就是把这一切都运筹帷幄,综合分析,为患者制定最合理的诊疗方案。每一次诊疗,我们都应当发挥我们的循证综合医力,让诊疗更加科学,合理,人性化和充满智慧的美丽。
让我们用平静的心,努力提高自己的循证综合医力,展开循证的翅膀,一起在医学的天空翱翔!