网站导航

24小时服务热线:19103801095

欢迎来到北京飞速度医疗科技有限公司【官网】

浅谈随机对照试验的设计

当前位置:首页 > 资讯中心 > 基础知识

来源:飞速度医疗器械咨询  发布时间:2021-04-16  浏览:

新闻资讯

NEWS CENTER

联系我们

contact us

请备注医疗器械注册咨询
业务咨询:19103801095(施先生,微信同)
市场合作:15577402464
周一至周日 8:00~22:00

在线客服
周一至周日8:00-22:00
QQ在线客服

  随机对照试验(randomized controlled trial, RCT)是一种对医疗卫生服务中某种疗法或药物的效果进行检测的手段,特别常用于医学、药学、护理学研究中。此外,RCT在司法、教育、社会科学等其他领域也有所应用。随机对照试验的基本方法是将研究对象随机分组,对不同组实施不同的干预,以对照效果的不同。

  设计原则

  设计原则随机对照试验的设计遵循三个基本原则,即对研究对象进行随机化分组,设置对照组,以及应用盲法。随机分组是双盲设计的前提条件,双盲设计导致研究者和受试者双方均无法知晓分组结果,又保护了随机化不被破坏。正因为以上的设计原则,随机对照试验被公认为评价干预措施的金标准。

  1. 随机化原则(randomization)

  随机化是临床科研的重要方法和基本原则。对于随机化最简单的理解就是使所有的参与者(患者)有相同的机会被分配到干预组或是对照组。相比于与其他对照组的选择方法,随机对照试验有三个优势,而这些优势恰恰是由于随机化而体现。首先,随机化可以在分配治疗方案时消除偏倚;第二,随机化有利于对研究者、参加者和评价者进行干预措施的设盲,包括可能使用安慰剂;第三,随机化允许用概率来表示各组之间的结局差异仅仅是由机遇造成的可能性。

  2. 对照原则(control)

  对照组的选择分为阳性对照(活性药物或其他有效干预手段)和阴性对照(安慰剂)。需要注意的是,根据伦理学原则参与者必须知晓有关治疗目的、方法、预期风险和疗效的全面、精确的信息,并且参与者在任何时候都有权退出试验。如果设计阴性对照组,参与者势必知晓安慰剂组的存在,而自己也有一定概率接受安慰剂的治疗,因此设置阴性对照存在着较大的局限性。更为常用的对照方式是阳性对照,但阳性对照的选择也有一定局限性,它必须是相关领域内公认的对研究的适应症疗效最为肯定并最安全的药物。并且原则上必须与治疗药物的药理作用类似,此外剂型、给药途径等因素也需保证较好的同质性。

  3. 盲法原则(blinding)

  设计良好的随机对照试验通常采用双盲设计(double blind),意味着所有参与者——无论是患者还是研究者都不知道具体的干预措施,从而避免数据收集和评价过程中带来的可能的偏倚。如果由于客观条件限制(如手术、针灸等干预)无法采用双盲设计,则采用单盲设计和其他方法降低偏倚的产生。

  设计模式

  1. 两组平行随机对照试验(parallel-)

  随机对照试验是采用随机分配的方法,将符合纳排标准的研究对象分别分配到试验组与对照组,然后接受相应的试验措施,在一致的条件环境中,同步地进行研究和观察试验效应,并用客观的效应指标,对试验结果进行测量和评价的试验设计。正因为有了随机化的概念,所以这种试验设计是临床研究中避免选择偏倚和混杂因素的唯一方法。

  2. 非等量随机对照试验(unequal-)

  在临床研究中,常常会遇到实际的情况是当与“标准治疗”作为对照时,参加试验组(新药组)的研究对象不会很多,或者由于对照组设计为“安慰对照”,则参加对照组的人数也不会很多,并且可能会长期无人问津。出于加快试验完成进度或节约经费的目的,可以考虑设计试验组或对照组较少的纳入对象比例,即非等量随机对照试验。需要注意的是,通常接受组间疗效差异的显著水平为P<0.05,所以随着组间样本量比例的差距增大,则检验效能也随之降低,因此应当选择合适比例以保证统计学的检验效能和正确的结论,通常可按照2:1或3:2的样本量比例,随机地分配于试验组和对照组,以保证非均衡比例对于检验效能的影响可以接受。

  3. 群组随机对照试验(cluster-)

  在单个个体不适宜被作为试验的个体单位的情况时(如同病房内或同社区内的试验对象),群组随机对照试验是一种可以整个医院或者社区作为随机对照试验的一个对象单位,将其随机地分配在试验组或对照组,分别接受试验措施的研究。除了研究单位的不同,其试验设计和要求基本一般随机对照试验相同,需要注意的是群组随机对照试验一般需要的样本含量比普通随机对照试验要大的多,此外,群组随机对照试验的准备和组织实施也更为复杂。

  4. 单个患者随机对照试验(n of 1-)

  与群组相反的是针对单个患者的研究,某些患者由于慢性疾病困扰,长期同时服用多种药物。然而其所服用的全部药物中可能有部分确实对控制疾病有效的药物,也有部分是无效甚至具有严重毒副作用的药物。此时作为临床医师可对于单个个体患者,开展多种药物作随机对照试验,筛选出对该患者确有疗效的药物用于本身的治疗,以便于做出正确的、高质量的临床决策。

  5. 析因设计随机对照试验(factorial-)

  析因设计的随机对照试验得以在一个研究内比较多种干预措施,整合两个或数个研究为一个研究,与常规随机对照试验相比,析因设计是一种更高效且经济的研究方法。最简单的析因设计通常为2×2的形式,即如果在该试验中有A和B两种干预措施,则1/4的研究对象分配至试验组A,1/4的研究对象分配至试验组B,1/4的研究对象分配至安慰对照组,1/4的研究对象分配至试验组A+B。这样设计的好处是试验组A可以与非试验组A的组别如试验组B、试验组A+B以及安慰剂对照组进行比较。同样,试验B组也可以与非试验组B的组别如试验组A、试验组A+B以及安慰剂zhong对照组进行比较。更为复杂的析因设计为2×3,3×3,2×2×2甚至2×2×2×2×2×2或2×2×2×2×3×2的形式。在I×J形式中,I和J均为剂量等级。而决定I和J数字的则是其各自所分的级数,如在AB两种干预措施中,可根据是/否给予A干预措施而分为两级,此时I=2,而根据是否给予B干预措施低/中/高剂量而被分为三级,此时J=3,则为2×3形式的析因设计。如果A干预措施也有低/中/高剂量,那么此时I=3,则为3×3形式的析因设计。如果现在有ABC三种干预措施,此时则为I×J×K的析因设计,若每种干预措施为固定剂量,即根据是/否给予A、B、C而分为两级,此时I=2,J=2,K=2,为2×2×2析因设计。尽管析因设计随机对照试验看上去很完美,但需要注意的是在析因设计中,通常预先假设干预措施之间彼此相互独立,即假设干预措施间不存在交互效应。而现实情况是,正如研究者无法识别出所有混杂因素一样,研究者也很难检测出所有的交互效应。

  6. 交叉设计随机对照试验(crossover-)

  与普通随机对照试验不同的是,交叉设计的随机对照试验包含两个阶段,第一阶段中试验组和对照组的试验对象将会在第二阶段中交换位置,并且两个阶段之间还设计洗脱期用以消除第一阶段中的治疗效果,也避免患者的心理效应影响第二阶段的结果。因为此种设计是在同一个体内进行两种干预方式的效果比较,所以可以消除个体差异,具有更好的一致性,并且在一定意义上增大了样本含量。但需要注意的是由于交叉设计不仅包含两个阶段的干预时长且还需要设计结合药物半衰期而制定洗脱期,所以研究时间较长,影响试验对象的依从性,增加脱落情况的发生率。

  7. 实用性随机对照试验(pragmatic controlled trial,PCT)

  传统随机对照试验的目的是确证干预措施的生物学效应,通常在理想条件下,对某一种或几种精确定义的干预措施在严格筛选的研究人群中实施的效果。尽管来自设计良好的随机对照试验的结果是临床证据体系中的I级证据也是金标准,但正如前文所述,它在获得结果的同时也因为严格的纳排标准,精确定义的干预措施和较为理想的研究环境下造成了其结果的外推性受限,而实用性随机对照试验着眼于指导现实中的临床和卫生服务决策,其纳入的研究对象通常更为宽松,以临床表现而不是确诊实验为纳排标准,通常比较的是临床上可行的两种或多种干预措施,对照组常选用常规治疗而非安慰对照,且干预措施也可不完全一样,根据实际情况及研究手册进行调整。结局指标的选择通常能够反映患者真正关心的结局,包括整体健康状况、预后及生活质量而不仅着眼于实验室检查或特定症状体征的改变。此外,卫生经济学评价也通常作为结局指标。尽管PCT的优势弥补了RCT的部分不足,但需要注意的是PCT由于一般不对研究对象和试验人员实施盲法,会影响其内部真实性。由于常展开多中心大样本的研究,且伴随长时间随访,需要更多资源支持完成。

  8. Zelen设计随机对照试验(Zelen design/prerandomized controlled trial)

  在随机对照试验的招募阶段,受试者必须了解试验情况,在签署知情同意书后方可参与研究。知情同意书的签署至关重要。但知情同意本身也会影响试验结果,因其可影响临床医师及研究对象的参与积极性,其次影响研究对象的心理和行为(如霍桑效应,失望偏倚)。为解决RCT中由于知情同意和随机化带来的一系列问题Zelen设计应运而生,即先进行随机化,后完成知情同意。它主要适合在当受试者对某一组干预措施有明显偏好或受试者病情危重且目前尚无成熟有效的治疗方法的情况,此外Zelen设计可避免霍桑效应。Zelen设计分为单组同意设计和双组同意设计。其中,单组同意设计中,试验组试验对象在被征求意见后,如选择同意则进行试验组干预措施,如选择不同意,则进行常规处理。而对照组试验对象则不征求意见,进行常规处理。在双组同意设计中,试验组试验对象在被征求意见后如选择同意则进行试验组干预措施,如选择不同意则进行常规处理;对照组试验对象在被征求意见后如选择同意则按常规处理,如选择不同意则进行试验组干预措施。这样设计优势在于所有符合纳入标准的患者均可被纳入研究,且不受到医生倾向或受试者特征等因素的影响,研究样本更具有代表性。且随机分组在签署知情同意之前,医生无需解释随机对照研究的概念和流程,更接近现实。同时试验组的对象可以权衡利弊做出自己的选择,而对照组的受试者也可接受常规治疗。但需要注意的两点是Zelen设计中存在换组率(拒绝率)数据,两组换组率之和与稀释效应及样本增量因子的大小成正比。此外,更为重要的是单组同意设计存在医学伦理学问题,尽管对照组的研究对象并不会因为参与研究而受到任何不公平对待,且因为参与研究反而可能受到更多便利。但对照组的研究对象甚至不知道自己成为研究对象,这与医学研究中知情同意的原则相违背。而双组同意设计面临的伦理压力则相对较小。

  9. 阶梯设计随机对照试验(stepped-wedge-)

  阶梯设计多用于群组随机对照试验,也可用于个体随机对照试验中,该方法适用于评价“利大于弊”的干预措施,或者由于现实条件所限而无法全面开展研究的情况。阶梯设计近年来开始受到研究者的关注和重视,其基本原理是根据研究目的将研究对象分为若干小组,并对其进行编号,按照时间先后顺序将干预过程划分为不同阶段(步长)。研究开始后按照事先确定的编号顺序给予对应小组干预,已纳入的小组将在研究过程中持续接受干预,而未纳入的小组将在研究过程中保持等待状态可看做空白对照,随着时间的推移,直至所有小组均接受完干预措施则宣告研究结束。在这种设计研究中,其随机化与群组随机对照试验相同,但没有专门的对照组,但随着试验的进行,所有入组个体均会接受干预,这样既符合卫生决策者的目标,也能在很大程度上减轻试验的医学伦理学负担。这种设计可以最大限度地使受试者受到接受到有益的处理,在不违背医学伦理的前提下又保证了研究中的随机和对照两个重要因素。需要注意的是阶梯设计无法做到双盲,只能对评价者设盲;存在阶梯效应,当样本量大小相同时,阶梯设计的效能只能达到传统RCT的70%左右,这会增加出现II类错误的概率;此外,由于某一时段的干预措施所产生的效果可能在一个或几个步长后才会完全显示,这种延迟的治疗效应会造成统计效能的损失。需要在设计之初充分考虑干预措施的延迟效应,相应地设计合适的步长,但同时因此造成的试验周期显著延长也应当被谨慎考虑。

  10. 适应性设计随机对照试验(adaptive)

  具体定义是指在临床试验中后,根据试验内部及外部积累的信息,动态地修改试验设计中的某些方面,而不破坏试验的有效性、科学性和完整性的一种设计。它主要用于新药研发及药物剂量探索研究,目的是尽可能将受试者分配到疗效较好的一组,尽早停止试验减少受试者总数,同时也可用于罕见疾病的临床试验研究。目前适应性设计的定义、方法和应用尚未达成共识,除adaptive design及对应的适应性设计翻译外,也有文献称之为self-design(自适应设计)、internal pilot design(内部预实验)以及flexible design(可变性设计)。适应性设计随机对照试验依旧拥有随机对照试验的随机化原则,也需要提前根据参数和假设进行样本含量的估算,但不同的是其随机化原则是使新加入的试验对象有更大几率分配到疗效较好的组别从而增加受试者的临床获益(如在肿瘤研究中的应用),在样本量方面可以根据期中分析的结果来确定下一阶段各剂量组的样本量。具体包括适应性剂量探索研究、无缝II/III期设计、样本量重新估计、适应性随机化和其他方面(如改变结局指标,统计方法,等效试验和不等效试验的转换,增加或减少期中分析等)。尽管适应性设计近年来也开始受到广泛关注并得到发展,但其受到很多因素的制约,如实际操作过于复杂,可能增加潜在偏倚导致原假设和后期统计检验的矛盾以及增大发生I类错误的风险使得最终分析结果无法解释最初的实验目的。此外,随机化的完整性在适应性设计中可能被破坏造成组间不均衡以及研究对象特征的改变。在适应性设计中,常规统计分析方法的选择也面临挑战,频率学派统计可能无法对个体治疗方案的调整进行预测,面对此情况需引入贝叶斯统计利用先验信息对个体治疗方案进行预测,这可能造成研究结果不便于被多数研究者所理解。最重要的一点是,在研究过程中出现的研究方案的改变可能会产生新的伦理学问题,如何判别这些问题并且如何确立方案的变化标准也是适应性设计所面临一大挑战。

  小结:以上的10种类型并未涵盖所有的RCT设计模式,RCT设计中最常见的是两组平行随机对照试验,确定使用何种设计模式取决于具体的研究目的和实际情况。

  设计内容

  设计一个好的临床研究并不是一件容易的事情,对于随机对照试验来说,在试验开始之前需要进行大量的准备工作。设计临床研究方案需要团队合作,不同背景的专家进行讨论,不断完善才能最终启动一项研究。下面简要介绍随机对照试验所涉及的设计内容。具体细节请参见临床试验报告的统一标准(CONsolidated Standards Of Reporting Trials,CONSORT),有空我会专门介绍一下CONSORT声明,它是随机对照试验的报告标准,有助于医务人员了解试验背景、原理、目的、研究人群、干预措施、随机方法、统计分析,有助于相关医务人员对试验的科学性和严谨性进行评估,有助于研究者提高临床研究设计水平。CONSORT声明的最终目的在于提高外部真实性、确保内部真实性和设计正确的随机对照试验方法以保证随机化。

图片

  CONSORT随机对照试验流程图(2010版)需要报告随机分配到各组的受试者例数,接受已分配治疗的例数,以及纳入主要结局分析的例数;还需要报告随机分组后,各组脱落和被剔除的例数,并说明原因

  1. 研究目标及研究假设

  任何研究在开始之前都需要有明确的研究目标和研究假设,随机对照试验也不例外。通常情况下随机对照试验的研究目标是评价某种干预措施的有效性和安全性(如第二节的实例)。研究假设基于研究目标,假设是研究者对于结果的一种尝试性的猜测,但它的正确性犹未可知。要注意研究假设必须包含以下特征:单一性;可验证性;与已知知识有联系;以及可操作性。下表以之前发布的研究为例,总结了研究目标、研究假设和研究问题。

图片

  2. 随机化方法

  包括产生随机分配序列的方法,分配隐藏的方法以及具体的实施过程。

  3. 干预及对照的选择

  各个干预及对照组的详细内容以及何时、如何实施。

  4. 样本量计算

  需要提供样本量计算的具体方法。由于样本量计算的公式复杂多样,目前有各种软件(如收费软件PASS、SAS中调用proc power语句等;免费软件WinPepi)可以方便准确的完成这一任务。但值得注意的是,在计算前研究者需要准备好所需的条件参数,包括预期疗效(组间差异),统计参数(显著性和把握度)。如使用了非劣效性设计、等效性设计、优效性设计,相应地还需提供计算样本量所需的界值。

  5. 结局指标的选择以及统计分析方法

  明确定义主要和次要结局指标以及其测量时间和方法,对具体的结局指标选用的统计分析方法进行说明。

  小结:RCT作为一种行之有效的临床试验设计,在医学研究中有着不可替代的重要作用。医学的四大顶级杂志皆对大样本RCT青睐有加,循证医学也十分重视来自于高质量RCT的结论,并大量参考。但要注意无法保证正确、可靠的随机化和盲法的实施以及缺乏合适对照的低质量RCT的泛滥问题。此外,开展大样本RCT需要大量的人力、资金支持和长时间投入,研究者开展一项高质量的RCT会面临很多困难;RCT人群外推性常常受到限制也是它的局限性之一。

  作者简介

  秦宗实,香港大学李嘉诚医学院中药学专业在读博士,研究方向为天然药物与神经疾病的转化医学研究。曾参与“十二五”国家科技支撑计划项目、国家重点研发计划“中医药现代化研究”重点专项等临床研究,参与研究方案及统计分析计划制定。在J Urol、Am J Med、Mayo Clinic Proc、Brain Behav Immun等期刊发表论文20多篇。

  参考文献

  Lawrence M. Frideman, Curt D. Furberg, David L. Demets. Fundamentals of Clinical Trials 4th Edition. Springer
  Kenneth J. Rothman, Sander Greenland, Timothy L. Lash. Modern Epidemiology 3rd Edition. Wolters Kluwer
  Kenneth F. Schulz, David A, Grimes. The Lancet Handbook of Essential Concepts in Clinical Research. Elsevier
  Mollison JA, Simpson JA, Campbell MK, et al. Comparison of analytical methods for cluster randomized trials: an example from a primary care setting. J Epidemiol Biostat 2000;5:339–485.
  Nikles CJ, Glasziou PP, Del Mar CB, et al. N-of-1 trials. Practical tools for medication management. Aust Fam Physician 2000;29:1108-11126.
  Rosing J, Middeldorp S, Curvers J, et al. Low-dose oral contraceptives and acquired resistance to activated protein C: a randomised crossover study. Lancet 1999;354:2036–407.
  Apfel CC, Korttila K, Abdalla M, et al. A factorial trial of six interventions for the prevention of postoperative nausea and vomiting. N Engl J Med 2004;350:2441–518.
  Montgomery AA, Peters TJ, Little P. Design, analysis and presentation of factorial randomized controlled trials. BMC Med Res Methodol 2003;3:269.
  Green S, Liu PY, O’Sullivan J. Factorial design considerations. J Clin Oncol 2002;20:3424–3010.
  Dolor RJ, Magid DJ, Hellkamp AS, et al. Comparison of cefuroxime with or without intranasal fluticasone for the treatment of rhinosinusitis. The CAFFS Trail: a randonmized controlled trail. JAMA, 2001, 286: 3097-310511.
  Glasgow RE, Whitlock RP, Eakin EG, et al. A brief smoking cessation intervention for women in low-income planned parenthood clinics. AM J Public Health, 2000, 90:786-78912.
  Simon GE, Vonkorff M, Heiligenstein JH, et al. Initial antidepressant choice in primary care. Effectiveness and cost of fluoxetine vs tricyclic antidepressants. JAMA, 1996, 275: 1897-1902.13.  Koning HJDE,Auvinen A, Sanchez AB, et al. Large-scale randomized prostrate cancer screening trials:program performances in the European randomized screening for prostate cancer trial and the prostate, lung, colorectal and ovary cancer trail. Int J Cancer, 2002, 97: 237-24414.
  Schellings R, Kessels AGH, Riet GT, et al. The Zelen design may be the best choice for a Heroin-provision experiment. J Clin Epidemiol, 1999,52:503-50715.
  UK collaborative ECMO Trial Group. UK collaborative randomized trial of neonatal extracorporeal membrane oxygenation. Lancet, 1996, 348: 75-8216.
  Torgerson DJ, Thomas RF, Campbell MK, et al. Randomized trail of osteoporosis screening: HRT uptake and quality of life results. Arch Intern Med, 1997,157 :2121-212517.
  Gambia Hepatitis Study Group. The Gambia Hepatitis Intervention Study. Cancer Research, 1987,47; 5782-578718.
  Grant AD, Charalambous S, Fielding KL, et al. Effect of routine Isoniazid preventiative therapy on Tubervulosis incidence among HIV-infected men in South Africa. JAMA, 2005, 22; 2719-272519.
  Jahn-Eimermacher A, Ingel K. Adaptive trial design: a general methodology for censored time to event data. Contempoaraty Clinical Trials, 2009, 30: 171-177 20.
  ZS Qin, ZW Zang, KH Zhou, et al. Acupuncture for Chronic Prostatitis/Chronic Pelvic Pain Syndrome: A Randomized, Sham Acupuncture Controlled Trial. The Journal of Urology. 10.1016/j.juro.2018.05.00121.
  JH Abramson. WINPEPI (PEPI-for-Windows): computer programs for epidemiologists. Epidemiol Perspect Innov. 2004;1:6

医疗器械注册咨询

站点声明:

本网站所提供的信息仅供参考之用,并不代表本网赞同其观点,也不代表本网对其真实性负责。图片版权归原作者所有,如有侵权请联系我们,我们立刻删除。如有关于作品内容、版权或其它问题请于作品发表后的30日内与本站联系,本网将迅速给您回应并做相关处理。
北京飞速度医疗科技有限公司专注于医疗器械、诊断试剂产品政策与法规规事务服务,提供产品注册申报代理、临床合同(CRO)研究、产品研发、GMP质量辅导等方面的技术外包服务。