卫生部临床检验中心 蔡剑平 杨振华
人类基因组计划(Humangenome project,HGP)是从1990年开始的,它的战略目标是建立人类基因组的结构图谱,并最终绘制出人类的基因图。因此人类基因组计划被喻为是继曼哈顿原子弹计划,阿波罗登月计划之后20世纪人类三大科学工程之一。
经过十多年全球科学家的不懈努力,2000年4月6日,美国塞莱拉(Celera)基因公司的首席科学家克雷格·文特尔(Craig Ven-ter)正式告知美国政府“我们已经完成了对人类DNA片断的分析,未来几个月里,在组装完所有片断之后,我们就能够全部破译人类基因组密码"。6月26日参与国际人类基因组计划的美、英、日、德、法、中国等国科学家和塞莱拉基因公司同时宣布人类基因组草图完成。
人类基因组计划的完成将揭开人类遗传信息的秘密,为现代医学的发展带来不可估量的重大贡献。随着人类基因组计划研究的深入,人类基因组单核苷酸多态性(SNP,single nucleotide poly-morphism)的研究应运而生,并且得到异常迅猛的发展。人类基因组单核苷酸多态性的认识和研究,已经成为人类基因组计划的精髓部分,其科学意义及应用价值也是难以估量的。
人类基因组单核苷酸多态性研究,所揭示的人种、人群和个体之间DNA序列的差异以及这些差异所表现的意义将对疾病的诊断、治疗和预防带来革命性的变化。
一、第三代DNA边传标记一一SNP
人类基因组是指由单倍体细胞所代表的遗传信息,是由30亿个核苷酸组成的,据推测,人类基因组中含有5~10万个基因(gene),它们决定了人体的遗传特性。
遗传学研究发现,在同一生物集团中明显存在二种以上不同的遗传性状,而且出现频率较高,称为遗传的多态性(polymorphism)。我们熟知的血型就是最早被发现的遗传多态性,在很长的一段时间内,检验医学中常用的检查遗传多态性的遗传标记是蛋白质标记,如ABO血型位点标记,白细胞HLA位点标记
等。随着分子生物学的发展,新一代的遗传标记——DNA遗传标记于1980年登场,DNA水平遗传基因多态性的研究从此拉开了序幕。到目前为止,DNA水平遗传多态性标记物的研究已经历了三个阶段。
1.限制性片段长度多态性标记(RFLP,restriction fragmentlength polymorphism),这是第一代DNA遗传标记,是D.Botstein于1980年提出的。当DNA序列上出现变异时,可改变某一限制酶的识别位点,使一个限制酶切点丢失或产生,而导致相应限制性片段的长度发现变化。RFIP的出现频率很高,远远高于蛋白质的多态性,在世代遗传中较稳定,但RFLP的缺陷也是非常明显的,首先是必须要有酶切点的变化才能得到两个不同长度的酶切片段(等位基因)的遗传信息,而且需要Southern杂交技术,操作烦琐。
1987年H.Donis-Keller等人建立了第一张以RFLP为遗传标记的遗传图。
2.DNA重复序列的多态性标记,人类基因的多态性较多的是由重复序列造成的,这也是人类基因组的重要特点之一。重复序列的多态性有小卫星DNA多态性或VNTR的多态性和微卫星的DNA多态性等多种。(1)小卫星DNA重复序列(minisatellite)或不同数目的串联重复(VNTR,vari-able number of tandem repeats)的多态性,是基因组DNA中有数十到数百个核苷酸片段的重复,重复的次数在人群中有高度变异,总长不超过2OKb,是一种遗传信息量很大的标记物。小卫星DNA的多态性或VNTR的多态性,可以用Southern杂交技术检出,部分可用PCR法检出。(2)微卫星DNA重复序列(microsatellite)或为简短串联重复(STR,short tandem re-peats)是基因组中由1-6个碱基的重复,如(CA)n,(GT)n等产生的,以CA重复序列的利用度为最高。微卫星DNA重复序列在染色体DNA中散在分布,其数量被认为可达五到十万,是目前最有用的遗传标记。在包含各种微卫星DNA重复序列的数百个碱基对的上下游,设定特异的单拷贝序列为引物,用PCR法可检出STR的多态性。因此第二代DNA遗传标记多指STR标记。
1996年已完成了由6000多个STR为遗传标记所组成的连锁图。
3.单核苷酸多态性标记(SNP,single nucleotide polymorphism),是1996年被美国MIT的E.Lander提出的,被称为“第二代DNA遗传标记"。这种遗传标记的特点是单个碱基的置换,与第一代的RFLP及第二代的STR以长度的差异作为遗传标记的特点不同,而且SNP的分布密集,根据从序列标记部(STS,sequencetagged site)中确定SNP的经验,每千个核苷酸中可出现一个SNP标记位点,在人类基因组中被认为有300万个以上的SNP遗传标记,这可能达到了人类基因组多态位点数目的极限。这些SNP标
记以同样的频率存在在基因组编码区或非编码区,存在在编码区的SNP约有20万个,称为cSNP(coding SNP)。
每个SNP位点通常仅含两种等位基因——双等位基因(Biallelic),其变异不如STR繁多,但SNP在整个人类基因组的分布密集,数目比STR高出数十倍到近百倍,因此被认为是应用前景最好的遗传标记物。目前用于SNP筛选和检出的技术种类繁多,限于本文篇幅,在此不做论述。SNP的研究将帮助我们寻找新的遗传病的原因基因,认识人种、人群,个体间的遗传差异,疾病与个体差异的关系,以及个体差异对药物的耐药性存在的不同的反应能力等。
二、SNP标记物的产生
如果没有人类基因组计划在世界规模进行大量的DNA测序工作,是很难认识到单核苷酸多态性这一事实的。
单核苷酸多态性标记物的产生有赖于人类基因组测序的精确度。在以往DNA测序的过程中,往往存在这样的情况,对某一cDNA克隆只进行过一次测序工作时,其精确度仅有90-99%,也就是说在100个cDNA碱基序列中就有大约1一10个错误出现。因此用目前国际基因库中的表达序列标记(EST,expressed sequencetag)的碱基序列,直接推测出氨基酸序列的话,有相当部分会产生错误的结果。为了得到某一蛋白质所具有的正确的氨基酸序列,对它的cDNA 进行反复的测序和精确的解析是必要的。
同样,在对碱基信息量更加庞大的基因组进行测序的过程中为了达到0.01%高精确的程度,必须对同一部分的DNA进行反复的测序,在得到DNA双链的全部碱基信息后,再进行细微的修正是关键的。与cDNA的测序-样在人类基因组的测序过程中,不达到高精确的程度,其碱基序列的结果是没有意义的。目前的研究已经表明,与人类最接近的灵长类动物的碱基序列与人类碱基序列相比,仅差1%左右,而我们人类个体之间碱基序列的差异则为0.1%,因此,人类基因组碱基序列解析的精确度被要求达到0.01%,即一万个碱基对中只允许出现一个误差。否则,单核苷酸多态性标记物的产生是不可能的。
另外,单核苷酸多态性标记物的产生必须要求在群体中有很高的出现频率。根据遗传多态性的概念,等位基因在群体中的出现频率需高于1%,(也有研究者定为10%)。因此在筛选SNP标记的时候,如果以SNP标记在被筛选对象的群体中出现频率为10%计算,则至少在10个被筛选对象中有一个单核苷酸多态性标记,才被认为是SNP标记。以这样的出现频率,在筛选SNP时,必须对10个个体的全基因组进行精确度达到0.01%的直接测序。这一方法,相当于对一个人类基因组进行10次的反复测序。事实上,使用这种方法筛选SNP标记工作量相当巨大,除美国的Celera基因公司有能力进行这项工作外,一个单独的研究机构是难以完成的。除了直接测序进行SNP标记的筛选外,用STS部分来筛选SNP标记是早被实行的有效方法。
2、SNP产生的意义及对未来医学检验学的影响
SNP标记作为遗传信息量最大的遗传标记物的确立,其意义是非常深远的。一是对基础生命科学会产生深远影响,人类基因组计划的DNA测序工作的完成,提供了研究遗传信息秘密的平台,把人类的全基因研究列入了视野范围,大大方便了基因家族的研究,基因结构的研究等。而SNP标记的确立,不仅便利了遗传病的原因基因的克隆工作,也便利了单基因、多基因病等各种遗传病的研究工作。二是SNP标记对临床医学的重大意义。SNP标记首先应该是作为一种有效的遗传多态性标记物为临床医学服务的,比其它的遗传标记物更能真实的反映人种,人群,及个体之间的遗传差异。我们人类的祖先被认为诞生在非洲大陆,他们的后代,经过了漫长的岁月而移居到了世界各地,产生了不同的人种,人群,经过漫长岁月而产生的突然变异也在不同的人种,人群中固定,形成了遗传的多态性。因此,对SNP标记的分析可以追踪人类进化的过程。另外,利用基因分型还可以帮助解释不同的人种、人群、个体对疾病易感性的不同,以及对药物的不同反应能力。
那么,SNP的产生对未来的检验医学会有什么影响呢?
1.现代医学,特别是分子遗传学的进步已经使人们认识到,除了外伤以外,几乎所有的人类疾病都有一定的遗传因素参与,在一定程度上都可以称为遗传病。而现代的检验医学在对疾病的诊断中,因为无法直接鉴定与疾病相关基因的异常或缺陷,只能通过变异基因的表达所导致的表型症状,从蛋白质、血清水平对疾病作出诊断,称为表型诊断。SNP标记的确立,将与现有的遗传标记物结合,与现有的基因诊断体系接轨,加速检验医学从表型诊断向基因型诊断的过渡。
2.SNP标记的确立可望在基因分型为基础的治疗方面发挥巨大的作用。各种不同的人种、人群、个体由于有相同的遗传学背景,而对某些药品产生了不同的反应性,据美国1994年的报告,因药物副作用而入院患者达二百万人,因药物副作用而死亡的人数达10万人,占死亡原因的第四位,比因交通事故死亡人数多得多。因此,在投入某种药物之前,进行个体基因型的分析,是预防药物副作用,提高疗效的关键,这种以基因型为基础的医疗将随着后基因组时代的到来而向我们一天天走近。
3.SNP标记的确立,将对遗传病的预防起到积极地作用。对于医学工作者来说,认识每一个遗传标记的意义,已成为当务之急。
四、中间人特有的基因多态性解析必要性
为了有效地筛选出SNP标记位点,目前国际SNP解析组织,使用了24个民族的450人作为研究对象,用这些研究材料筛选出的SNP标记,作成的SNP遗传图,是人类的标准SNP遗传图。但是人种之间,遗传标记的位点及意义都有所不同。如白种人表现的多态性标记位点在中国人中可能没有多态性。从1998年开始,很多国家都倾注了数以亿计的资金开发本国的SNP标记,特别是美国、日本组织了强大的阵容,开发本国人特有的SNP、cSNP标记物。
中国是一个幅员广大,由56个民族组成的多民族国家,一般采集的群体确实很难具有广泛的代表性,因此要获得中国人特有的基因多态性标记,必须要有一个综合的规划,考虑各民族和各地区的情况,选择最佳的群体。作为占世界人口五分之一的中国,有责任走在世界前列,确立中国人的SNP标记物,为我国的临床医学服务。
结束语
21世纪被称为生命科学世纪,人类基因组图谱将是科学界献给21世纪的第一个大礼物。人类基因组计划的最大受益者,应该是整个医学界,特别是检验医学界。单核苷酸多态性标记物的产生是人类基因组计划的结晶,在此基础上建立的基因分型,基因诊断科学将带动和促进整个现代医学的进步。


