流行病学
第一章绪论
一、定义
1.流行病学是研究疾病(包括伤害)与健康状况在人群中的分布及其影响因素,借以制订和评价预防、控制和消灭疾病及促进健康的策略和措施的科学。
2.流行病学定义的基本内涵:
A研究对象是研究所关注的具有某种特征的人群
B研究内容是疾病(包括伤害)和健康状态
C研究方法的重点是研究疾病与健康状态的分布及其影响因素
D研究目的是为控制和消灭疾病及促进健康提供科学的决策依据
二、流行病学研究方法
1.观察性研究其特点是没有人为干预或者控制暴露,而是客观搜集暴露和疾病的资料。包括描述性研究和分析性研究。理论流行病学属于观察性流行病学范畴。
2.实验性研究其特征是需要人为地控制某些处理因素,故又称为干预性研究。包括随机对照试验(临床试验)和非随机对照试验(如类实验、某些现场实验和社区干预试验),完整的现场研究应该具备4个条件(设立对照、随机分组、人为干预、前瞻追踪)。
第二章疾病的分布
疾病分布的概念:流行病学研究可通过观察疾病在人群中的发生、发展和消退,描述疾病不同时间、不同地区和不同人群中的频率与分布的现象,这就是疾病的分布。
一、疾病频率测量指标
率:一定条件下,某现象发生的实际例数与可能发生该现象的总例数之比(用百分率、千分率、万分率或10万分率表示)---说明单位时间内某现象发生的频率或强度。
比:两数相除的比值。---说那个两者的相对水平(用倍率或者百分数表示)
(一)发病指标
1.发病率(incidencerate)在一定时期内,特定人群中某病新病例出现的频率。
分子:对于发病时间不易确定的一些疾病,如高血压,以初次诊断时间作为发病时间。
分母:观察期内观察人群中可能发生该病的人,如传染病应该排除获得特异免疫的人;但实际工作较难获得准确的暴露人口数,多用年平均人口数(某年7月1日零时人口数,或{年初+年末人口数}/2)
2.罹患率(attackrate)新病例数出现频率的指标。一般用于小范围、短时间的发病频率,多用于描述食物中毒、职业中毒及传染病的暴发流行。
3.患病率(prevalencerate)在特定时间内,一定人群中某病新旧病例数所占的比例。与发病率的区别:a.新旧病例/新病例;b.横断面调查获得的疾病频率,静态指标/发病报告或队列研究获得疾病频率,动态指标;患病率(P)=发病率(I)x病程(D)
4.感染率(infectionrate)在所检查的人群中,某病现有感染者人数所占的比率。
5.续发率(secondaryattackrate,SAR)一定观察期内某种传染病在家庭易感接触者中二代病例的百分率,又称家庭二代发病率。
表示原发病例出现后,在该病最短潜伏期至最长潜伏期之间发生的续发病例,即二代病例.
(二)死亡指标
1.死亡率(mortalityrate)指某人群在一定期间内死于所有原因的人数在该人群中所占的比例。是衡量死亡危险最常用的指标。(千分率、10万分率)
粗死亡率/死亡专率;死亡专率中婴儿死亡率很重要---某年周岁婴儿死亡数占同年活产儿数的比值,一般千分率表示。反映社会经济和卫生状况的敏感指标,不同国家或地区可直接比较
2.病死率(fatalityrate)在一定时期内患某病的全部病人中因该病而死亡的比例。
3.生存率(survivalrate)指患某种疾病的人(或接受某种治疗措施的病人)经n年的随访,到随访结果时仍存活的病例数占观察病例总数的比例。
4.潜在减寿年数某病某年龄组人群死亡者的期望寿命与实际死亡年龄之差的总和
5.伤残调整寿命年从发病到死亡所损失的全部健康寿命年。
二、疾病流行强度
1.散发某病在某地区人群呈现历年的一般发病率水平,病例在人群中散在出现,病例间无明显联系,称为散发。
2.流行某病、某地区在某时间的发病率显著超过历年该病散发发病率水平,称为流行。
3.暴发(outbreak)在一个局部地区或集体单位的人群中,短时间内突然发生很多临床症状相似的病人。
三、疾病分布的形式
(一)人群分布特征
(二)时间分布特征
1.短期波动一个集体或者固定人群中短时间内某病发病数突然增多的现象。
2.季节性疾病在一定季节内发病率升高的现象。可分为三种情况:严格季节性、季节性升高、无季节性。
3.周期性
4.长期趋势(长期变异、长期变动)
(三)地区分布特征
1.描述疾病地区分布的常用术语:
1)地方性:由于自然环境和社会因素的影响,一些疾病(传染病或者非传染病)在某一地区发病率增高或者只在该地区存在,即~
a自然地方性:指某些传染病受自然因素的影响,仅存在于一定地区,而不见于其他地区。
B统计地方性:生活习惯、卫生条件、宗教信仰--该病在某些地区发病率显著高于其他地区,与自然无关。
c自然疫源性:这些地区存在该传染病的动物传染源、传播媒介及病原体生存传播的自然条件,可在自然界生存繁衍后代。人进入该地区能遭受感染,人畜共患的传染病。
2)地方病
3)外来性或者输入性
⑵判断地方性疾病的依据:
①该病在当地居住各人群组中的发病率均高,并可随着年龄的增长而上升;
②在其他地区居住的相似的人群组,该病的发病率均低,甚至于不发病;
③外来的健康人,到达当地一定时间后发病,其发病率和当地居民相似;
④迁出该地区的居民,该病发病率下降,患者症状减轻或呈自愈趋向;
⑤当地对该病易感的动物,可能发生类似疾病。
第三章描述性研究
描述性研究常用的方法:个例调查与病例报告、现况调查(最常用)、生态学研究等。
病例报告是对罕见病的的单个病例或者少数病例进行研究的主要形式,也是唯一方法。
现况调查(prevalencesurvey)
1.概念是按照事先设计的要求,在某一特定人群中,应用抽样或者普查等方法收集特定时间内某种疾病或者健康状况及有关变量的资料,以描述该疾病或者健康状况的分布及与疾病分布有关的因素。又叫横断面研究、患病率研究或现患研究。
特点a常用的流行病学调查方法;b时序上属于横断面研究;c不能得出有关因果关系的结论;d一般不用于病程较短的疾病;e相关因素的选择与解释有一定的限制。
2.种类
⑴普查:为了了解某病的患病率或健康状况,于一定时间内对一定范围的人群中每一成员所作的调查或检查。
⑵抽样调查:在特定时间、特定范围,通过对一部分有代表性个体组成的样本进行调查,推测其全人群总体中患病或健康状况的一种调查。
基本原理---随机抽样、样本足够大,调查材料分布均匀获得有代表性样本,通过样本推断总体的特征。
抽样方法---单纯随机抽样、系统抽样、分层抽样、多级抽样和整群抽样。
系统抽样:按照一定顺序,机械地每隔一定数量的单位抽取一个单位进入样本。
分层抽样:先按照某些特征将研究人群分为若干个组,然后从每组抽取一个随机样本。
多级抽样:从总体中先抽取范围较大的单元,即一级抽样单元,再从一级抽样单元中抽取范围较小的二级单元,再依次抽取范围更小的单元,即多级抽样。
3.方法
面访、信访、电话访问、自填式问卷调查、体格检查和实验室检查
4.实施步骤:
A明确调查目的;B确定研究对象;C确定调查类型和方法;
D估计样本含量;
根据以下因素确定样本大小:
1)总体的疾病患病率π:π越小,样本越大;反之,样本量可小些。
2)对调查结果精确性高低的要求,精确性越高,即允许误差d越小,样本越大;反之,样本量不必过大
3)显著性水平(a):a越小,样本量越大,通常取0.05或0.01
E确定研究变量和设计调查表
问卷包括题目、调查与填表说明、问卷主体内容、核查项目
F资料收集;G资料整理、分析及结果解释;
H质量控制(选择偏倚、信息偏倚)
第四章队列研究
一、概念及特点
队列研究:某一特定人群按照是否暴露于可疑因素或按不同暴露水平分为亚组,追踪观察一段时间,比较两组或者各组发病率或死亡率的差异,以检验该因素与某种疾病有无因果关联及关联强度的大小的一种观察性研究方法。
暴露:研究对象接触过某种待研究的物质、具备某种待研究的状态或特征,这些因素、状态、特征即~。
基本特点:
1.属于观察性研究,所研究的可疑暴露因素不是人为给予的,是客观存在或自然形成的;
2.时序上是由前向后的,入选的研究对象不患所研究的疾病,通过随访、前瞻性观察来发现病例。
3.研究对象按暴露与否或暴露等级进行分组。
4.是由“因”到“果”的研究,能确证暴露与结果的因果联系。
目的:检验病因假设、评价预防效果、研究疾病自然史
二、类型
⑴前瞻性队列研究
⑵历史性队列研究
⑶历史前瞻性队列研究
三.常用术语
⑴结局:研究者预期的结果事件,包括发病、死亡和各种化验指标。
⑵观察终点:观察对象出现了预期的结果。
⑶观察终止时间:整个研究工作可以得出结论的时间。
四、设计与实施
1.确定研究目的
2.确定研究因素
3.确定研究结局
4.确定研究现场和研究人群
暴露人群的选择:职业人群、特殊暴露人群;一般人群;有组织的人群团体。
对照人群的选择:内对照;外对照;总人口对照;多重对照。
5.确定样本含量
样本计算的四个参数:随访期内对照人群的估计发病率;暴露人群的估计发病率;显著性水平(α);把握度(1-β)。
6.资料的收集和分析
发病 | 未发病 | 合计 | 发病率 | |
暴露组 | a | b | N1 | a/N1 |
非暴露组 | c | g | N0 | c/N0 |
合计 | M1 | M0 | T |
相对危险度RR:【率比】暴露组发病或者死亡的危险是非暴露组的多少倍。a/N1/(c/N0)
RR>1暴露因素为危险因素;=1两组发病率或死亡率无差别;<1暴露因素为保护因素
RR的95%可信区间
归因危险度AR【率差、特异危险度】暴露组发病率与非暴露组发病率绝对值之差。
a/N1-(c/N0)
归因危险度百分比AR%暴露人群中归因于暴露的发病或者死亡部分占全部发病或死亡的百分比。(a/N1-c/NO)/(a/N1)=1-1/RR
人群归因危险度百分比PAR%:It-I0/It---表示全人群中归因于暴露部分的占全体发病或死亡的百分比。
六、偏倚及其控制
(1)常见偏倚选择偏倚、失访偏倚、信息偏倚、混杂偏倚(性别、年龄等)。
(2)偏倚控制严格按规定的标准选择研究对象;尽可能提高研究对象的依从性;提高设计水平和调查质量,做好质量控制工作。
七、优点和局限性
1.优点:
1)由于研究对象暴露资料的搜集在结果发生之前,并且都是有研究者亲自观察得到的,回忆偏倚较小;
2)可以直接获得暴露组和非暴露组人群的发病率或死亡率,直接计算相对危险度等反映暴露与疾病关联强度的指标,可充分分析暴露的病因作用;
3)病因在前,疾病在后,因果关系明确,偏倚较少,又可直接计算测量疾病危险关联的指标,检验病因假说的能力较强;
4)有助于了解人群疾病的自然史;
5)可分析一种原因与多种疾病的关系,也可以分析多种原因与一种疾病的关系。
2.局限性:不适于发病率很低的疾病的病因研究;研究耗费人力、物力、财力和时间多、实施难度大;随访时间较长,容易产生失访偏倚;随访过程中,未知变量引入人群,或人群中已知变量的变化,影响结果,使分析复杂化。
第五章病例对照研究
一.概念及特点
定义:按照疾病状态将研究对象分为病例和对照,分别追溯既往(发病前)所研究因素的暴露情况,并进行比较,以推测疾病与暴露之间有无关联及关联强度大小的一种观察性研究。这是一种回顾性从果及因的研究方法。
基本特点:
1.属于观察性研究,搜集的暴露资料是客观存在的,而不是人为控制的;
2.设立对照,为病例组提供用于比较的危险因素的暴露率;
3.从果到因的追溯调查;
4.不能确立因果关系,为队列研究和实验性研究提供线索和方向。
二.研究目的
1.广泛探索和深入研究疾病发生的影响因素;
2.研究健康状态的事件发生的影响因素;
3.研究疾病预后影响因素;
4.研究临床疗效的影响因素。
三.研究类型
1非匹配病例对照研究
2匹配病例对照研究---所选择的对照在某些因素或者特征与病例组一致,目的是消除这些因素或特征对结果的干扰。这些因素或特征即匹配变量。
1)成组匹配病例对照研究(频数匹配):对照组具有某些特征或者因素所占的比例与病例组一致。
2)个体匹配病例对照研究:以个体为单位使病例和对照在某些因素或特征方面相同或接近。
z.B.1:1配对病例对照研究
四.设计与实施
1.确定研究目的;
2.确定研究因素;
3.确定研究对象;
① 基本原则:所调查病例足以代表总体中该病的病例,对照足以代表产生病例的总体;
② 病例的选择要求:诊断可靠;新发病例、现患病例、死亡病例,尽量选择新发病例;
③ 对照的选择要求:能代表产生病例的总体;
4.样本含量影响样本大小的因素包括:
1)研究因素在对照组中的估计暴露率(P0);
2)研究因素与疾病关联强度的估计值,相对危险度RR或暴露的比值比OR;
3)假设检验的显著性水平,即第一类错误的概率(α);
4)检验把握度(1-β),β为第二类错误的概率。
5.资料收集
五、资料分析
1.描述性分析:均衡性检验,常用t检验、卡方检验、方差分析。
2.推断性分析:计算χ2值、OR、OR的可信区间、病因分值。
暴露因素 | 病例组 | 对照组 | 合计 |
有 | a | b | N1 |
无 | c | d | N0 |
合计 | M1 | M0 | T |
X2 ={(ad-bc)^2}T/M1M0N1NO
1)X2 →P,结果表明病例组和对照组暴露比例有无统计学差异。
2)关联强度分析
RR→暴露组发病率或死亡率与非暴露组发病率或死亡率之比
OR→病例组中某因素的暴露比例与对照组中该因素的暴露比例之比=ad/bc(>1研究因素与疾病呈“正”联系;=1研究因素与疾病无关联;<1研究因素与疾病呈“负”联系)
当疾病率小于5%,OR可反映RR。如书上实例5-2,OR=2.06--表明有暴露因素的母亲,子女患癌症的危险性是母亲无此暴露因素子女患癌症的2.06倍,暴露因素与疾病呈正联系,是疾病的危险因素。
OR可信区间--OR95%CI表示95%的把握说明总体OR所在的范围。
六.偏倚及其控制
1.常见偏倚及控制
【选择偏倚】:入院率偏倚、现患病例-新发病例偏倚、检出症候偏倚、---随机抽样、设立对照、严格诊断标准、提高应答率
【信息偏倚】:回忆偏倚、调查偏倚---收集客观指标的资料、严格培训调查员、采用盲法调查、科学的研究态度
【混杂偏倚】:混杂所带来的偏倚---随机化、限制、匹配、分层分析、多因素分析。
七、优点和局限性
【优点】:
1.尤其适用于研究罕见的、潜伏时间长的疾病结局,也适用于研究新出现的或原因不明的疾病,有助于迅速进行公共卫生干预;
2.相对于队列研究需要的样本量小,相对更省力、省钱、省时间,易于组织实施;
3.适用于多种暴露因素与某一种疾病关联的研究,也可进行多种因素间交互作用的研究
4.不仅应用于病因的探索,也适用于研究药物的不良反应、疫苗免疫学效果的考核及暴发调查等。
【局限性】:
1.不适用于研究人群中暴露比例很低的因素,因为需要的样本量很大;
2.容易出现各种偏倚,包括选择偏倚、信息偏倚和混杂偏倚,尤其难避免的回忆偏倚和选择偏倚;
3.难以确定暴露与疾病的时间先后顺序,无法直接得到因果关系的结论;
4.不能直接计算疾病率,只能估计相对危险性。