观察性流行病学研究方法

2020-12-07 来源：榕意旅游网

.实用文档.

观察性流行病学研究方法

中国医学科学院北京协和医学院王丽

各位同学，大家好！今天我们要给大家介绍的是观察性流行病学研究的方法、队列研究和病例对照研究。

大家知道，流行病学研究设计方法有两类：第一类是观察性研究，第二类是实验性研究。

这两种方法它的本质区别在于实验性研究它可以人为确实定暴露因素。比方我们将病人随机分为两组，那么一组进入实验组，一组进入对照组。然后来观察实验组和对照组它的疾病的发生或在研究的结局上是有显著的差异，那么这种研究从而来推断了这个干预因素它跟研究疾病之间的关系。那么大家想一想，这样的一种研究设计方法它有什么问题？当干预因素是有害的时候，比方说我们要研究铅中毒对于胎儿发育的影响，那么我们这个时候就不能采用实验性研究了，因为它不符合伦理学的要求。也就是说，对于实验性要求，我们对一个实验性研究来说，我们必须要求暴露因素是无害的，必须要符合伦理要求。

那么因此也就是说，当暴露因素有害的时候，那么这个时候我们只能采取观察性研究。也就是说，观察自然发生的一个结局，以及影响这个自然发生结局的一个影响因素。那么这样的一个研究设计方法我们称为观察性研究。观察性研究设计方法有三种：第一种是队列研究〔Cohort study)，第二种是病例对照研究〔Case-control study)，第三种是横断的研究〔Cross-sectional study)。那么今天我们要给大家介绍的是队列研究和病例对照研究。

.实用文档.

首先我们给大家介绍一下什么叫队列研究？也就是cohort Study。

说起队列研究，那么首先大家要了解什么是队列？也就是cohort。队列它是指的是一组有共同经历并且随访一定时间的这样一组人群。比方说我们通常会谈到一个出生队列。那我们来举个例子，比方说我们要研究1959年到1961年那么在三年自然灾害出生的这三年他们的这个人群。那么这个人群，这个出生队列他的一个共同特征是什么呀？在他们的生长发育期他们暴露于饥饿，因此我们可以对这组人群进行随访，然后来看他成年之后，他的一些糖尿病，比方说心血管疾病它的发病跟一般人群有什么差异。那么这是出生队列。那么还有比方说职业队列，举个例子。比方说我们要对大庆的石油工人来做一个研究对象，那么这样的一个队列人群他的一个共同特征是什么？比方说他可能是暴露于一些苯等有机溶剂，那么我们同样我们也可以对这样的一个队列人群来进行随访，来看他在一些特殊的疾病，比方说白血病等等，他上面的发生率跟一般人群有没有差异。那么这是一个队列。

那么下面我们来通过一个动态图来进一步的理解什么是队列？首先我们来看他是一组具有共同特征的人群，在我们这个蓝色的框里头这是一个队列人群，那么所有的人都具有共同特征，我们都以蓝色的这样的一个空白圈来表示、空心圈来表示。那么经过一段时间的随访，那我们看有一些人变成了红色了，那我们代表他已经发病了。

到随访结束的时候我们可以来计算这组人群他你所研究的这个疾病或者是研究的结局它事件发生的一个频率。那么包括了累计发生率或者是以人员为根底的这样的一个发病率，我们都可以计算出来。那么这个就是队列。那么是什么是队列研究？

我们基于队列我们可以延伸出了队列研究的这样一个方法。那么它的特点，大家看这个图例，他包含了两组或者是说两组以上的队列人群。也就是说，在我们研究之初、随访之初，我们可把这个人群分析他目前的暴露状态，我们可以把他分为暴露组和非暴露组。

.实用文档.

那我们以吸烟与冠心病这样的一个关系研究为例，那我们可以在队列之初，根据这些队列人群他是否吸烟,我们把他分为吸烟者和不吸烟者。那么这两个人群吸烟队列和不吸烟的队列，他们在除了吸烟状态之外，那么其他的方面我们希望他都有共同的特征，而且大家看，在进入队列的时候，同样他都是蓝色的空心圈，我们代表他没有发病，也就是说在进入队列之初的时候都没有患他所要研究的这个疾病。同时他需要具有发生此法研究疾病的一个可能性。那么对于这样的两个队列人群，也就是说暴露组和非暴露组，我们经过一段时间的随访之后，我们可以看到在暴露队列和非暴露队列人群当中，分别有不同的个体发病了。

那么最后到了研究终点的时候，也就是随访结束的时候，我们可以来计算出暴露组的一个发病率和非暴露组的发病率。我们还是以吸烟者，吸烟与冠心病的这样的一个关系研究为例。那我们可以看到，吸烟者他的冠心病的发生率是千分之二十八，而非吸烟者他的冠心病发病率是千分之十七点四。那么我们假设暴露组和非暴露组，这两组人群在暴露因素，也就是吸烟之外的其他因素方面具有可比性的话，那么这个时候我们是不是就可以推断吸烟它可能会增加冠心病的发生风险，那么这样的一个研究就是队列研究。那我们首先是在先确定了暴露状态，而且在确定暴露状态的时候所有人都没有发病，然后经过随访来观察不同的暴露组人群他发生所要研究的这个疾病的一个风险是不是有差异。因此它是先有暴露后有结局，是一个由因到果的研究。

下面我们对队列研究的定义进行一个总结。大家可以回忆一下刚刚我们给大家显示的这个图例，它首先是根据在研究起点的时候没有患研究疾病的这个研究对象的暴露状态，分为暴露组和非暴露组。或者是说不同暴露水平组。然后经过一段时间的随访，就是追踪观察之后，然后我们来比拟各组之间它研究疾病的发病率或者是死亡率的一个差异。从而来推断暴露因素和疾病之间是否存在这样的关联。那么它是一个由因及果的研究，所以又称为定群研究，前瞻性研究或者是一个纵向研究。那么这是队列研究的定义。

.实用文档.

那么根据队列研究的定义，我们可以知道队列研究它的实施步骤了，那首先第一步肯定是确定队列人群，那么包括暴露人群和非暴露人群，之后来随访确定每个个体的结局。计算暴露人群和非暴露人群它的一个发病率，并比拟这两组人群它的发病率之间是否有差异。那我们下面来分别的来看一下这四步我们是怎么来完成的。

那么首先确定队列人群。

那么队列人群确实定通常有两种途径：第一种是根据暴露的时机来选择队列，那么最常见有两类：第一类是职业队列人群。比方说石油工人的这样队列，我们可以来判断石油工人他们发生肺癌或者间皮瘤等等，它的发生率是否高于一般人群，我们这是一个职业队列。那么还有一类就是特殊人群队列。那么特殊人群队列指的是那些意外事故或者是战争时候才会存在的一些暴露，那我们把暴露于这种特殊的暴露因素的人群，我们把它选择出来，确定这样一个队列人群。那么比方有名的，比方说前苏联切尔诺贝利核泄露的时候这样的一个暴露人群，那么形成的一个暴露队列，还有，在日本的广岛和长崎原子弹爆炸幸存者，我们也可以把它确定这样一个队列。那我们看，对于这样的一个队列人群，就是说根据暴露状态来确定这样一个队列人群，我们是否通常只能来分析是哪一个暴露因素，因为它就是一种某一个特定的特殊暴露状态，因此它是研究一个暴露因素和多个结局之间的关联。同时我们刚刚也谈到了，那么对于一个队列人群来说了，我们是要研究暴露者和非暴露者之间他们的发生的差异，那我们想一想，对这样一个根据暴露状态来确定的这样一个队列人群，我们通常和谁进行比拟？对，我们通常是需要在这个人群之外来建立一个对照组。比方说一般人群，那我们可以比拟石油工人发生肺癌的发生率跟一般人群是否有显著性差异。那么这是一种队列人群，就是根据暴露状态来确定队列人群。

那么第二种队列人群的选择是指的是一般人群的队列。也就是说，它在建立队列之初的时候，我们尚没有确定它的一个暴露状态。那么最常用的是一些，比方说具有不同人口

.实用文档.

学特征，那么不同地区或者不同种族的全体居民的这样一个样本。比方说在美国有一个特别有名的队列人群，就是黑人妇女队列，那么它就是基于黑人妇女，然后根据这样的一个种族和性别来建立的这样一个队列人群，那么还有，一个非常有名的队列人群，Framingham的一个队列，那么它就是选择居住在Framingham的这样一个小镇的人群来建立一个队列，那么这个就是基于地区为根底建立的队列。那么还有，比方说我们可以针对一些特殊人群，比方说我们考虑到护士比拟容易随访，那么我们可以利用护士来建立这样一个队列，然后来探讨那么女性当中的一些疾病的一些发生及其影响因素。那么这是一般人群队列。那我们大家想一想，对一般人群队列来说，因为它建立队列之初的时候没有确定暴露状态，因此，它有一个很大的优点，它可以研究多个暴露因素和多个疾病结局之间的关联。而且它可以在同一个研究人群当中选择没有暴露或者暴露水平最低的人来做一个对照，也就是说它的一个暴露组和非暴露组就可以同时在一个队列人群当中完成了，这是选择队列人群的两种途径。

下面我们来看一个非常有名的Framingham的一个队列研究。那么这个队列研究始于1948年，那我们刚刚已经谈到了，它是基于地区为根底建立的这样一个队列人群。那么Framingham它是位于美国Massachusetts的一个小镇。那么距离Boston只有20公里，而人口只有3万左右。非常重要的一点，就是说它只有一所医院，因此所有患病的人都回到这个医院去看病，所以特别适合进行什么队列研究和随访。也就是说，这是一个一般的一个人群队列。那么当时队列的入选标准是随机抽取了，随机抽样的方法选择了30—62岁的居民，那么最终是5000人入选。那么这是一个一般人群的队列。

那么其中它关于暴露人群和非暴露人群确实定，那么是依赖于什么？它的基线特征上面以及它的随访过程当中收集的多个暴露因素，那么包括年龄、性别、家族史、职业、文化水平、国籍、血压、血脂、体力活动、吸烟、饮酒等等的很多因素。然后这个时候我们就可以根据不同的人，那么他在每一种因素上面的一个不同的暴露水平，其实把他归到不

.实用文档.

同的暴露组，Framingham的研究它主要关系的是一些心血管疾病，然后在分别比拟暴露组和非暴露组他们的心血管疾病的它的发生率有没有什么差异。那么这是一个

Framingham的研究，那么它怎么去选择队列人群？那么它怎么去确定暴露人群和非暴露人群？

那么确定完了队列人群之后，下一步就是要随访确定每个个体的结局。

那我们需要确定的首次的随访时间以及以后每次随访的一个时间间隔，那么这个时间确实定主要是依据于你所要研究的这个具体的疾病的自然史以及从暴露到发病的这样一个间隔时间。比方说我们以Framingham研究为例，因为它主要是开始关注的是心血管疾病，因为它是确定的每隔两年进行一个随访。那么随访的时候主要是根据Framingham的唯一的一家医院的医院登记来确定新发冠心病。那么确定了随访时间以及随访间隔之后，我们还要确定观察终点，那么观察终点它指的是研究对象出现了预期结果。比方说我们以Framingham这个研究为例，它的一个观察终点就是冠心病，同时我们还要确定观察终点的时间。另外对于队列研究当中来说，它非常棘手的一个问题，就是一个失访的问题。因此在队列研究当中，尤其队列研究的随访当中，我们要适当的处理失访。那么我们可以比拟失访者和未失访者的一个特征，或者说来比拟暴露组和非暴露组它的一个失访的情况，来估计失访对于这个整个研究它的一个结论的一个影响。那么通常我们应该保证失访率不影响高过10%，也就是说我们应该保证的随访率至少有90%。

那么随访确定的每个个体的结局之后，那么下一步我们就是要计算暴露组和非暴露组的发病率，并比拟他们之间的差异。

那我们通常是可以把队列研究的资料归纳成这样的一个模式。我们可以看到，首先我们暴露人群有n1，非暴露人群有n0个。那么经过一段时间随访以后，在n1个暴露人群

.实用文档.

当中，我们有a个人发病了。由此我们就可以计算出暴露组的发病率是a/n1，那我们在n0个非暴露组人群当中，我们看到有c个人发病了，因此我们可以计算出非暴露组的发病率是c/n0。并基于这两个结果，我们可以计算出它的一个相对危险度，就是称为relative risk，又简写成为RR。那么相对危险度是队列研究当中用来评价暴露因素和疾病关联强度的这样一个指标。它的定义，是指的是暴露组的发病率与非暴露组的发病率之比。那对于我们这个例子来说它是不是就应该等于a/n1，再除以c/n0，然后我们就可以计算出它的一个相对危险度。

那么当相对危险度等于1的时候，提示暴露因素跟疾病的发生没有关联。那么当相对危险度也就是RR大于1的时候，那么提示暴露因素可能是疾病发生的一个危险因素。那么RR越大，那么关联强度就越大。那么当RR小于1的时候，提示暴露因素可能是疾病发生的一个保护因素，那么RR越小，提示关联强度就越小。

那我们还是回到刚刚的这个吸烟与冠心病发生风险这样一个队列研究的例子，那我们看到我们有两组人群，一组是吸烟人群，一组是不吸烟的这样的一个队列人群。那么吸烟的人群观察3000的一个人员数之后，有84个人发生了冠心病。由此我们可以计算出它的一个发病率是多少？84/3000人员，然后就是千分之二十八。而不吸烟的人当中，它总共是观察了5000个人员数，其中发生冠心病的人数有87个，那么发病率是多少？是87/5000，千分之十七点四。由此我们就可以计算出它的相对危险度，RR就等于吸烟者的发病率千分之二十八除以不吸烟者的发生率，也就是千分之十七点四，那么等于1.61。这个RR值是大于1，那么提示吸烟可能是冠心病发生的一个危险因素。

那么以上是介绍了队列研究它的一个定义以及它的一个步骤，以及我们如何来根据队列研究来评价暴露因素和疾病之间的一个关联强度。下面我们来介绍队列研究它的类型。那么队列研究它根据研究对象以及观察终点的时间的不同可以分为三类。

.实用文档.

一类指前瞻性的队列研究，也就是说我们刚刚给大家讲的这种Framingham研究的例子。那么它是一个前瞻性队列研究。那我们来看对于前瞻性队列研究，通过这个图式我们可以看到，它在研究开始的时候，我们就得到了是暴露资料，也就是收集了它的暴露状态。然后之后来随访，观察疾病结局的发生。因此它的观察起点是在现在，而终点是在将来，那么这是一个前瞻性的队列研究。那么还有一种研究，队列研究的方式是回忆性的队列研究。那我们来看一下，对于回忆性的队列研究，它的暴露状态确定和研究结局确实定都是在你的研究起点之前，也就是说它的暴露状态以及研究疾病的结局的发生是根据各自的记录来获得的。还有观察终点它是在现在。那么还有一种研究设计方法，是将前瞻性的队列研究和回忆性的队列研究结合起来一种队列设计，那么称为双向队列研究。那么对于双向的队列研究，大家看它的暴露状态是在研究起点之前，那么这个时候我们是根据它各自的记录来获得的，但是它的随访以及结局的测量要持续到将来。那么这是三种队列研究的设计方法，那么包括前瞻性队列研究、回忆性队列研究以及双向队列研究。

那么无论是哪一种队列研究的类型，那么队列研究它都具有共同的一个性质。首先第一个，它是一个由“因〞到“果〞的观察性研究，我们回忆一下我们前面讲的那个内容，那么它都是保证的是这个队列人群刚进入队列的时候是先确定它的一个暴露状态，而且所有人都没有发生疾病的结局，所以它是先确定暴露状态，然后再观察疾病的结局，它是一个由“因〞到“果〞的观察性研究。而且因为它在研究开始的时候，所有的研究对象都不患病，最后在随访的过程当中，那么所有的这个患病的这些研究对象它都属于新发病例，因此它的疾病的诊断也易于实现标准化。同时对于一个队列研究来说，我们可以看到，我们可以计算出暴露组和非暴露组它的一个发病率，我们是通过比拟暴露组和非暴露组人群它的发病率的差异来确定暴露对发病的影响，因此它符合暴露因素在前，疾病发生在后的这样一个科学逻辑。因此可提供确定因果关系的一个强有力的一个证据。那么这是队列研究它的一个性质。

.实用文档.

那么根据它的这个性质，实际上我们也想象得到，队列研究它的一个缺点。因为它要经过随访，所以它肯定不适合什么？不适合罕见疾病，以及从暴露到疾病的发生需要很长时间的这样的一个疾病的研究，不然的话这样就会要求随访很多人，随访相当长的时间，而这个实际上是很难实现的，那么这是它的第一个缺点。第二个缺点，实际上比方说我们来研究吸烟与冠心病的发生风险。那我们在什么时候，根据什么数据来判定这个人是吸烟还是不吸烟？大家想想这个人他可能在一生当中，他可能一开始吸烟后来不吸烟了，或者是开始不吸烟后来又吸烟，然后中间又戒烟然后再吸烟。所以这个时候研究者的暴露状态随时就可能随时间发生改变，那么这个时候对我们确定这个研究个体，他到底是属于哪一种暴露状态，就会产生一定的困难。第三个，我们刚刚说了队列研究它是对于队列人群然后进行随访，然后所以如果随访时间比拟长的话，那么这个时候研究对象就可能不容易保持依从性，容易产生失访这样一个偏倚。当然因为涉及到随访，所以它要消耗大量的人力、物力、财力，以及所花费的时间也比拟多。那么这是队列研究它的一个缺点。

但是它也有它的一个非常独到的优点，因为它是一个从因到果的一个研究，而且是一个观察性的一种研究，所以它是研究疾病自然史的一个最好的方法。暴露和疾病结局它的一个时序关系非常清楚。那么它可以同时研究多个研究暴露和多个结局，那么这是什么呀？一般人群队列，同时也可以研究一个暴露和多个结局。比方说我们这个职业队列，他们之间这样的一个关联。尤其适用于什么？罕见暴露的研究。比方说我们刚刚说了，那个特殊的这样一个队列人群，那么它适合这种罕见暴露研究，能够计算发病率和相对危险度。

因此，有的书上会这么说，好的队列研究它是观察性流行病学研究的一个金标准。大家看，一定要强调它是一个好的队列研究，那么因为它有以上这些优点，那么我们可以认为它是观察性流行病学研究的一个金标准。那可能有的同学就会问了，那么既然一个好的队列研究是观察性流行病学研究的金标准。

.实用文档.

那么是不是队列研究它适合所有的研究？那么要答复同学们这个问题，我们下面再来看一个例子。

那么这是美国Boston Vincent Memorial医院有个妇产科医生叫Dr.Arther Herbst。那么他发现什么？发现了1966年到1969年4南的时间，他们医院诊断了7例阴道腺癌的病人，而且都是15—22岁的年轻女性。那么可能有的同学就会说了，这不就是4年的时间发生7例的癌症病人吗，那有什么好奇怪的？那么要答复同学这个问题，我们来看一下历史记录。首先流行病学研究显示阴道腺癌它是一个非常罕见的肿瘤，年发病率才百万分之一。那么百万分之一是个什么概念？我们一个具体的数字来说话，那么就是1930年到1965年，那么Vincent Memorial所在的这个Boston它的一个州立总医院36年间只诊断了2例的阴道腺癌病人，而且都是50岁以上的妇女。那么这个时候我们就可以比拟，一个是4年间发生了7例的阴道腺癌，一个是36年间只诊断了2例，一个是年轻妇女，一个是50岁以上的妇女。那么看到这样的一个比拟以后，我想同学们和Herbst一样，有同样的困惑了。也就是说，那么为什么这个阴道腺癌的发生要高于历史水平？

答复这个问题首先我们要是不是要进行一个描述性研究啊？我们看看这个7例阴道腺癌病人有什么特征。那么既然是阴道腺癌，所以首先我们要考虑到是什么？它有没有什么共同的阴道的一个刺激史，结果发现了这7例病人都没有使用过阴道局部刺激物，也没有阴道冲洗史，而且除了一例已婚以外，其他的都否认性交史，而且也没有使用避孕药。那么面对这样的一个情况Herbst学说里这样说，那么这7个阴道腺癌的病人发生，她是否与胚胎期或她母亲孕期暴露于某些因素有关？

要答复Herbst的这个问题，我们是否能够用队列研究？大家想一想，答案是否认的，百万分之几的一个发病率，大家想一想，我们要想通过队列研究来找到这么足够的人来做一个研究的话，是不是要花费大量的人力、物力和时间，而且现在大家面临的这样一个新

.实用文档.

的问题，你不可能重新等着我们经过20年随访、30年随访来答复这个问题，也就是说，队列研究对答复这样一个罕见疾病是不是无能为力了呀，至少在目前的根底上我们要答复这样一个非常应急的这样一个问题，它现在是不太适宜了。那我们来看一Herbst是怎么答复这个问题的？

那么这是Herbst做的一项关于年轻妇女的阴道腺癌的病因学研究。那么他首先选择的是8例的阴道腺癌病人，这里头除了那7例的，他们医院诊断的这7例病人之外，他还选择同期在Boston另外一所医院诊断了一名阴道腺癌病人。同时他选择32例对照。那么他们怎么选择对照的？当然首先肯定是女性了，因为只有女性才可能得阴道腺癌，然后，第二就是所有的对照都是非阴道腺癌的病人，而且他选择与病例在同一医院、同等级病房出生时间不超过5天的这样的非阴道腺癌的女性来作为一个对照。然后通过病案查询、问卷调查的方式来收集这40个人，还有她母亲孕期的暴露史，那么包括了既往流产史、怀孕时的年龄、出血史、以及怀孕时是否使用了已烯雌酚。那么什么是已烯雌酚？实际上是当时用于保胎的一个药，也就是预防流产的一个药。

那么结果发现，在这8例的阴道腺癌病人当中有7个人她的母亲在怀孕期间使用了DES，而32例对照当中所有母亲的暴露没有使用过DES。由此我们可以推断出病例组和对照组，它暴露DES的一个比值，因为这个对照里头使用DES的人是0，那么为了防止对分母出现0，因此我们在把每一个，这个表当中每一个值加大一个0.5，，由此我们可以推断出，病例组，那么它暴露DES的比值是7.5/1.5=5。而对照组它暴露DES的比值是0.5/32.5=0.015。然后进一我们可以把病例组的暴露DES的比值和对照组的暴露DES的比值再进行比拟，那么5/0.015就等于333。那么提示暴露于DES的这个年轻妇女她发生阴道腺癌的可能性是未暴露组的333倍。也就是说，DES可能与阴道腺癌发生有关。那么这篇文章，当时Herbst在1971年发表在公共卫生的一个新英格兰杂志上面。

.实用文档.

那么上述的研究实例大家想一想它能告诉我们什么？

对，上述研究实例告诉我们说，首先第一个，我们不需要采用一个队列的研究，我们在较短的时间内就可以得到研究结论。我们除了选择那7例的、8例的阴道腺癌病例之外，我们使用的是没有患该病的人作为对照，同时高度强调了病例组和对照组的一个可比性。大家想想，怎么强调的？他选择了与病例在同家医院、同一等级的病房出生时间不超过正负5天这样的没有患阴道腺癌的这样的女性作为一个对照，那么他保证了什么？实际上保证了病例组和对照组她们的母亲有同样的可能使用DES的这样的一个可能性，也就是强调的是病例组和对照组在暴露上面的一个可比性。同时他们采用的是问卷调查和病案查询的方式来调查暴露史。并采用暴露比值来推断暴露和疾病之间的关联。

那么这个研究设计实际上就是我们今天要给大家讲的第二种观察性的研究设计方法，病例对照研究〔Case-control study)。

我们对刚刚这个例子我们来进行一个设计的小结。我们来看一下病例对照研究是怎么设计的？大家回想一下，那么首先他是选择一组病例，我们以红色的人代表病例。然后来选择一组对照，那么我们以绿色的人代表对照。然后让病例组和对照组回忆他们既往的暴露史，那么这里头带有蓝色阴影的代表她既往暴露了。然后通过比拟，病例组和对照组它的一个暴露差异来推论暴露和疾病之间的关联。因此，我们想想他是首先确定疾病状态，然后再来让她回忆既往的暴露史，因此是一个由“果〞及“因〞的这样一个回忆性的研究。

再见一下文字小结。那么首先是确定病例，然后确定一组对照，收集她既往的暴露史，然后比拟了病例组和对照组它的一个暴露史的差异，从而来推测疾病和暴露之间的关联，因此它是一个由“果〞及“因〞的一个研究。他们这个就是病例对照研究。那么根据它的定义我们就来看一下，实际上它就几件事。

.实用文档.

第一个你确定病例，那么在病例确实定的时候，我们一定要有明确的入选标准和排除标准。那么这个入选标准里头一方面就包含了什么？这个本身这个疾病的一个诊断标准。第二个，就是针对你这个具体的研究问题来说，它的入选标准又是什么？那么这个时候就要保证这跟所有的入选的病例都要有暴露的可能性。那么怎么理解这个问题？我们来举这样一个例子。比方说我们要研究口服避孕药与心肌梗死的这样一个关系，我们要采用这样一个病例对照研究。那么这个时候我们在确定入选的心肌梗死病人的标准的时候，我们要保证所有入选的心肌梗死的病人都有可能使用什么呀？使用口服避孕药。所以那么就是，那么要是这样的话，我们是不是就要应该剔除掉那些比方说她已经切除了子宫的，她不需要口服避孕药，或者她已经绝经的这样的一个人，她就不需要服用口服避孕药了，那么这个就是说我们要把那种不可能暴露于你要所研究的暴露因素的那局部人剔除掉。这是第一，就是病例要有明确的入选和排除标准。第二，你要尽可能选择新发病例。那么为什么这么说？因为我们一个病例对照研究的目的，最终还是要来确定与疾病的发生有关，也就是说新发病例有关的一个危险因素，而假设你选择现患病例的话，那么现患病例她很可能在得病之后她可能改变她的一个生活习惯。那么也就是说，那么这个时候你再让她回忆她既往的暴露史的时候，实际上你就很难判定什么呀？这个暴露因素和疾病哪个在前面哪个在后面？这是第二条，你要尽可能选择新发病例。第三点，就是病例要能够代表目标人群当中所有的病例。

那么病例的来源有几类？第一类我们可以选择社区当中所有的病例，也就是我们可以选择研究期间，在你研究社区内新发生的所有的病例。那么这种社区为根底的这样的病例，通常用于以人群为根底的病例对照研究当中。那么第二种，我们同样也可以选择来医院就诊和住院的病人来作用病例。那么这是病例的两种类似。那么我们说完了病例确实定和它的来源之后，那么第二步是什么呀？对，我们要根据你选择的病例的标准，然后我们来选择什么呀？来选择对照病例。

.实用文档.

那么对照确实定，实际对一个病例对照研究来说，它的一个最大的方法学挑战是来自于对照的一个选择。首先我们要保证对照组的成员必须是没有患所要研究疾病的这个人，那么他当然包括可以是正常人，也可以是患有其他疾病的人。那么理想状态下我们应该保证什么？应该保证对照是目标人群的这样一个随机抽样的样本。也就是说，对照的报告水平应该与目标人群当中的一个暴露水平相同。那我们来举这样一个例子，比方说我们要来研究吸烟与冠心病的这样的一个风险。那我们要采用一个病例对照研究。那么这个时候我们在选择对照的时候我们应该选择选择一个没有患冠心病的人，那我们希望在这个对照人群当中，我们选择这个对照人群，他的吸烟的一个暴露水平，能够与一般人群他的吸烟率应该相同或者相近。也就是说，对照它应该是一个目标人群的这样的一个随机的一个抽样样本。同时我们应该保证对照与病例组在研究因素以外的其他因素方面具有可比性。那么这是对照的一个确定，它的一个标准。

那么同样它的来源也有两类：第一类，我们可以在社区当中随机抽取对照，也就是说，我们可以在产生病例的这样一个社区当中，从没有患这个研究疾病的人当中随机抽取一个对照。那么通常用于以人群为根底的这样一个病例对照研究当中。那么同样我们也可以到选择医院就诊或者住院病人当中来随机抽取患有其他疾病的这样的一个住院病人或者就诊病人来作为一个对照。那么通常用于以医院为根底的这样一个病例对照研究。

那么选择完了病例和对照之后，那么下一步要干什么？我们就应该收集病例组和对照组它的一个既往的暴露史，并根据病例组和对照组它的既往暴露史整理成这样一个模式。那我们来看，在这样一个四格表当中首先我们选择是A+C一个病例，在这a+c个病例当中有a个人既往暴露过你要所研究的因素，c个人没有暴露。同时我们选择病案对照，在这个对照当中有b个人既往有过暴露，而d个人没有暴露。由此我们就可以计算出病例组的一个暴露比值，和对照组的一个暴露比值。那么这里头有一个非常重要的概念，就是什么叫比值？那么比值指的是某事物发生的可能性与不发生的可能性之比。那么具体到这个

.实用文档.

病例对照研究当中，那么病例组的暴露比值就应该等于病例组暴露的可能性与它没有暴露的可能性之比，那这应该等于什么呀？a/a+c，除以c/a+c，也就等于a/c，同理，那么对照组的暴露比值就应该等于对照组暴露的可能性，如b/b+d，那么除以对照组它不暴露的可能性，也就是d/b+d，也就是等于b/d，之后我们进一步来计算了病例组和对照组的暴露比值之比，也就是我们所说的用于评价暴露与疾病关联强度的一个指标，odds ratio，比值比。它的定义，指的是病例组的暴露比值与对照组的暴露比值之比，那么就应该等于a/c÷b/d，那么也就是等于ab/dc。那么这就是计算出来的一个OR值，也就是比值比。

对OR值的它的解释，同理跟我们前面讲的R值的解释是一样的。也就是它等于1的时候，提示暴露因素与疾病没有关联。那么大于1的时候，提示它可能是疾病发生的一个危险因素，那么小于1的时候，提示暴露因素可能是疾病发生的一个保护因素。那么解释跟相关危险度RR值它是一样的。

那么以上是介绍了一个病例对照研究它的定义以及如何来评价，如何通过病例对照研究来评价了暴露因素和疾病之间的关联强度，也就是非常重要的一个概念，比值比，就是odds ratio这样一个概念。那么病例对照研究它的一个性质特点是什么？我们来进行一个总结。首先大家回忆一下，我们一个对照研究它是首先先确定病例，然后再确定对照，也就是先确定了一个疾病状态，然后让他再回忆既往的暴露水平，所以它是一个由“果〞及“因〞的一个观察性研究。那么它可以在一个时点上完成，那么可以同时探讨多种因素和同一个疾病发生关联性，大家回忆一下，刚刚这个阴道腺癌这个例子。那么我们是选择一组阴道腺癌病人，然后选择一组对照，然后让她们回忆母亲孕期的多个暴露因素跟阴道腺癌发生之间的关联，因此，它特别适合于一个罕见疾病的一个病例研究、病因研究，耗时短，费用低。那么这是它的特点。

那么它的优点实际上我们讲特点大家就应该能够知道它的优点了。首先它简便、快速、

.实用文档.

省费用、效率高，那么这是远远强过对照研究的，第二个，它所需要的调查对象比拟少。那我们看刚刚这个例子，总共就调查了8例的病例，32例对照，然后最后得出一个非常可靠的结论。第三个，就是同一项调查可以识别一个以上的危险因素。那么尤其适用于什么呀？罕见的、潜伏期长的这样的一个疾病结局，而这个正好是什么呀？是一个队列研究它所望尘莫及的。因此，它特别适合一个探索性研究。

那么当然病例对照研究肯定也有它的缺点。首先，大家看，它是先选择一组病例然后再选择一组对照，因此这个时候它不像队列研究那样，它很难保证你这个病例和对照是来自于同一个目标人群，尤其你要选择以医院为根底的这样一个病例对照研究的时候，是很难保证病例和对照来自同一个人群的。而且它是先确定疾病结局，然后再让他既往回忆他的一个暴露史，因为它是一个回忆性研究，它没法得到一个什么呀？因果关联的一个结论。同时，它没有方法计算发病率。也就是说，我们没有方法计算这个病例组和对照组它的一个暴露率，这是没有方法计算的，我们只能计算它的一个比值，同理，我们也只能计算出一个暴露人群当中它的病例和非病例的这样的一个发病和没有发病的这样一个比值而不能估计它的一个发病率或者患病率，那么这是它的第三个缺点。同时因为他要回忆既往的一个暴露史，因为特别容易产生偏移。另外当人群当中他暴露因素的这个暴露率比拟低的时候，它的研究效率是比拟低的。他们这是病例对照研究它的一个缺点。

最后我们对今天给大家介绍的病例对照和队列研究的这两种观察性研究方法我们来进行一个比拟。首先从研究人群来说，那么队列研究它的研究人群是一组暴露人群，然后和非暴露人群来进行比拟。而病例对照研究它是通过病例和非病例，也就是对照来进行比拟。那么对结局测量指标来说，队列研究它要计算的是暴露组和非暴露组的一个发病率，而病例对照研究只能得到病例组和对照组的一个暴露比值，那么由于它们得到的一个测量指标不同，因此它用来评价关联强度的一个指标也是不一样的，那么对于队列研究我们是通过相对危险度来评价关联向度，那么相对危险度是一个什么概念？它应该是暴露组的发病率

.实用文档.

和非暴露组的发病率之比，而病例对照研究是用比值比来评价暴露因素和疾病的这样一个关联强度指标，就等于病例组的暴露比值和对照组的暴露比值之比。那对于暴露和疾病之间的持续关系来说？队列研究它是能够确定暴露和疾病之间的是北京时续关系的，它是“因〞在前“果〞在后，而病例对照研究是一个由“果〞及“因〞的一个回忆性研究，因此它建立一个时续关系。另外与队列研究来说，它可以评价一种暴露和多种结局，或者是多种暴露和多种结局之间的关联。大家可以回忆一下我们刚刚讲的，那么对于一个职业队列来说，我们只能评价一种暴露和多种结局之间的关联，但是对于一个一般人群队列来说，我们可以评价多种暴露和多种结局之间的关联。但是病例对照研究它只能评价一种结局和多种暴露之间的关联。另外对于所需要的时间和研究本钱来说，那么对于队列研究来说，尤其是前瞻性队列研究，它是一个非常耗时长、本钱高的这样一个研究，而且所需要的样本量很大。而病例对照研究它的耗时很短，而且相对廉价，所需要的样本量也相对小。因此，队列研究它适用的条件是一个罕见暴露常见疾病，我们更多的来用队列研究。而对于一个病例对照研究来说，它的适用条件是什么呀？常见疾病常见暴露。那么以上就是我们今天给大家介绍的一个病例对照研究和队列研究。那么通过它的一个比拟，我们可以看出，实际上它是各有优缺点的。

那么因此，我们是不是可以这么说，实际上世界没有最好的研究方法，虽然我们前面说了一个好的队列研究是观察性研究的一个金标准，但是它并不适用所有的研究，那么也就是说，世界上没有最好的研究方法，那么它只有最适宜的研究方法。

那么今天的课程就到这里，谢谢大家！

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

观察性流行病学研究方法