
人类基因识别不易 NCBI有错误?
电子克隆“揭短”美国人类基因模式研究
北京大学人类疾病基因研究中心博士后张德礼等人日前撰文指出,美国国家生物技术信息中心(NCBI)基因组注释项目公布的人类基因模式参考序列(约15000个)可能存在着各种类型的多处错误,他们的论文——《人类新基因的电子克隆、实验确认与功能研究》在不久前举行的第七届国际人类基因组大会获Poster奖,这也是中国科学家首次在国际人类基因组大会上获奖。
张德礼博士向记者介绍说,今年2月他们用自己克隆的3 个人类新基因(C17orf32, SPRYD1和C1orf31)上网查新发现,NCBI所注释的模式基因参考序列的4个中就有3个是错误的,其中包括SPRYD1的开放读码框架(ORF)提前终止错误, 以及C17orf32错误地插入一个碱基而导致ORF移位或错误拼接,除实际ORF中间一小段外,两端侧翼区都是错误的。因此,张德礼认为,应当慎重看待计算机注释可能存在的各种类型错误的人类基因组编码序列,而利用电子克隆技术并结合实验验证完全能够纠正或避免现有的人类基因组编码序列中出现的错误。
新基因的搜寻和蛋白质功能分析是人类基因组图谱公诸于世后的研究热点,电子克隆技术将成为加速基因克隆的一条有效途径。电子克隆就是以数学算法为手段,以计算机和互联网为工具,利用现有的表达序列标签(EST)和生物信息数据库,在未注释的人类基因组序列上发掘未知功能的新基因,并通过生物学实验进行编码序列和功能验证,为人类功能基因组学与蛋白质组学研究提供新的线索和基础。张德礼等人建立的将生物信息学分析与实验确认相结合的技术策略将有助于发现更多的人类新基因,特别是3个人类新基因(RABL3, ZNF362和C17orf32)的成功克隆及其小鼠和大鼠同源基因的克隆,对促进新基因电子克隆技术和软件的开发具有重要的理论指导意义。
“人类新基因的电子克隆与实验确认”研究开始于1999年秋天,历时三年完成。使用电子克隆技术发现的100个人类新基因,多为疾病相关基因、细胞因子基因和信号传导基因等功能活性强的人类小分子肽类基因,其中已被国际基因库接受并使用了标准化基因命名符号的人类基因有23个。首批选择的10个人类新基因经生物学实验和cDNA测序验证,确认均是真实的基因,其中半数基因是具有特定重要功能结构域的高效基因。这些与细胞增殖及分化相关的癌基因和转录因子的初步克隆成功,标志着我国人类基因组深层次的研究已取得了重要阶段性成果,并将有助于加深人们对基因功能和表达调控机制的了解。
张德礼说,以往国内外公开发表的文献和各种会议论文中都没有指出NCBI人类基因模式参考序列中存在错误,而这次他们用确认的两个人类新基因纠正了NCBI基因组注释项目公布的3个不同类型的错误模式基因参考序列的事实说明,人类基因识别并不像公众想像的那么容易,人类新基因的正确识别和注释仍是一项长期而繁重的任务,即使目前被认为最可靠的NCBI公布的15000个人类基因模式参考序列,除有充分实验证据的1/3外,其余2/3仍可能存在各种类型序列错误,只有经理论与实验确认后才是可靠的。因此,将来人体组织细胞与生物功能的电子模拟难度便可想而知,揭开生命奥秘与分子医学机制全貌的人类功能基因组学与蛋白质组学研究更是整个新世纪的工作任务,只有依靠理论、实验与计算生物学三者的相互配合才有可能圆满完成。
- 众说风云 (已有0条评论)

