当前位置: 首页 > 期刊 > 《数理医药学杂志》 > 1999年第3期
编号:10283974
生物数据库与生物医学研究
http://www.100md.com 《数理医药学杂志》 1999年第3期
     作者:戴军 王捷 谢建群 郑文岭

    单位:戴军 王捷 谢建群 郑文岭(广州军区广州总医院分子肿瘤研究室 广州 510010)

    关键词:生物信息学;生物医学;数据库

    990344

    摘 要 采用分子生物信息学方法,通过计算机技术建立生物数据库,对大量、复杂的生物分子资料数据进行收集储存、加工整理和归类分析非常必要。生物数据库可随时通过计算机检索,找到研究所需的资料数据,并可进行横向比较和分子流行病学研究,从中找出疾病发生的分子机制和治疗靶子,为人类弄清疾病的病因,彻底征服疾病起巨大的推动作用。

    现代生物医学研究已向着基因分子水平方向发展,运用分子生物学方法进行研究已越来越普遍。随着生物医学研究水平的提高,对研究资料的储存、管理和分析应用都提出了更高的要求。因此,采用分子生物信息学(Molecular Bioinformatics)方法,通过计算机技术建立生物数据库,对大量、复杂的生物分子资料数据进行收集储存、加工整理和归类分析是非常必要的。
, 百拇医药
    生物数据主要有两个特点:一是数量大,二是图形数据较多。因此,构建生物数据库相对较复杂。随着计算机技术的迅速发展,应用计算机建立数据库技术日趋成熟,使得在国内构建较具规模的生物资料数据库也成为可能。生物数据库建立的主要流程图为:相关生物资料数据收集数据整理、验证数据归类运用计算机数据库应用软件建立数据库框架数据格式转换与录入数据库调试、试运行数据库运行正常、稳定、推广、应用及对新的资料数据的吸纳。

    在生物医学研究中应用的生物数据库主要有两类:一类是基因(组)核苷酸序列数据库,另一类是蛋白质氨基酸一级线状序列和三级结构数据库。下面列举几个目前国际上主要的相关生物数据库。

    1 欧洲分子生物学实验室(European Molecular Biology Lab, EMBL)核苷酸序列数据库(Nucleotide Sequence Database)、欧洲基本核苷酸序列数据库(Europes Primary Nucleotide Sequence Database)、WSISS-PROT蛋白序列数据库(SWISS-PROT Protein Sequence Database)、美国基因组数据库(American Genome Sequence Database, GSDB)、日本DNA数据库(Japanese DNA Database DDBJ) 这几个数据库是EMBL分支结构-欧洲生物信息学会(The European Bioinformatics Institute, EBI)、美国生物技术信息中心、日本生物技术信息中心下较全面的生物资料数据库,也是目前世界上生物医学研究核苷酸、蛋白质和开展基因组计划最有价值、最具权威的资料来源,标志着欧、美、日在应用生物信息学技术研究生物医学方面已处于国际最前沿。
, http://www.100md.com
    2 HSSP Database 主要收集了蛋白质一维氨基酸序列和三维结构的数据资料,它不仅可以提供蛋白质家族线状排列的信息,而且能够提示SWISS-PROT数据库中蛋白质序列33%的二级、三级结构。

    3 印迹蛋白指纹数据库(PRINTS Protein Fingerprint Database) 收集了800种基本指纹,可编码约4500种有关球蛋白和膜蛋白基本模块的信息。该数据库对促进人类家族遗传性疾病的研究和人类基因组的分析起重要帮助作用。

    4 人类基因突变数据库(The Human Gene Mutation Database) 主要收集人类遗传疾病核基因生殖突变数据资料,包含有633个不同基因的1200种突变损害,并以每年约2000个新突变数据积累扩增。它还收集了458个参考cDNA序列作为检查数据之用,是目前人类遗传性疾病基因突变的中心核库。

    5 雄激素受体基因突变数据库(The Androgen Receptor Gene Mutation Database) 目前已收集了309种突变数据资料。它属于EMBL-EBI机构,主要对前列腺癌、乳腺癌的预测研究提供信息资料。
, http://www.100md.com
    6 IARC p53基因突变数据库(IARC p53 Mutation Database) 隶属于EMBL-EBI机构,它收集了8000个p53突变数据资料,并且每年要更新两次。由于约50%的肿瘤会发生p53突变,说明p53基因突变和肿瘤的发生有密切关系。因此,该数据库是研究肿瘤发生、发展分子机制最重要的资料库。

    各数据库所在单位均有因特网址,目前对公众开放,可通过因特网接口进行搜索、检索、分析,并获得所需的遗传基因和蛋白质数据。

    某些微生物、动物和人的基因组计划在欧、美、日等国正在迅速开展。因此,三方的DNA数据库每天收集了大量的世界范围的基因核苷酸研究资料,计算机及时进行处理,然后三方互为交流、共享。使得DNA数据库为这三方的基因组计划的研究、实施提供了很好的保障。

    我国目前尚未见到有关建立生物数据库为生物医学研究服务的文献报道。这对于我国的生物医学发展非常不利。随着生物资料数据库内含量越来越大,管理费用也越来越高,同时鉴于生物数据库对人类疾病研究和人类基因组研究具有重要的应用前景的作用,使得它的商业价值也很高。因此,将来要使全世界共享这些资源会越来越难,欧美国家正在考虑在适当的时候关闭基因等相关数据库,美国一些研究机构的基因数据库已开始只进不出了。这些情况应该引起我国生物医学界的高度重视。如不尽快开展生物信息学在生物医学中的应用研究,建立中国自己的生物资料数据库,这不仅将丢失我国人种特色丰富的基因资源优势,而且会拉大我国生物医学研究水平同国际间的距离,影响我国人类基因组计划的实施。基因组计划的实施,关系到疾病相关基因得到阐明,这对攻克肿瘤和心脑血管疾患等严重威胁人类健康疾病具有重要的实际意义。以上趋势已引起我国生物医学研究者和计算机专家的注意,双方积极的合作,将有利于建立起我国自己的生物医学资料数据库,并开展相关研究。
, 百拇医药
    参考文献

    1 Stoesser G, Moseley MA, Sleep J et al. The EMBL nucleotide sequence database. Nucleic Acid Research, 1998,20(1):8~15.

    2 Dodge C, Schneider R, Sander C. The HSSP database of protein structure-sequence aligments and family profiles. Nucleic Acid Research, 1998,20(1):313~315.

    3 Attwood TK, Beck ME, Flower DR et al. The PRINTS protin fingerprint database in its fifth year. Nucleic Acid Research, 1998,20(1):304~308.
, http://www.100md.com
    4 Cooper DN, Ball EV, Krawczak M. The human gene mutation database. Nucleic Acid Research, 1998,20(1):285~287.

    5 Gotlieb B, Lehvaslaiho H, Beitel LK et al. The Androgen Receptor Gene Mutation Database. Nucleic Acid Research, 1998,20(1):234~238.

    6 Cariello NF, Douglas GR, Gorelick NJ et al. Database and software for the analysis of mutation in the human p53 gene, human hprt gene and both the lacl and lacZ gene in transgenic rodents. Nucleic Acid Research, 1998,20(1):198~199.
, 百拇医药
    7 Beroud C, Soussi T. p53 gene mutation:software and database. Nucleic Acid Research, 1998,20(1):200~244.

    8 Hernandez PHT,Robinson A,Rodriguez-Tome P et al. IARC Database of p53 gene mutation in human tumors and cell lines: updated compilation, revised formats and new visualisation tools. Nucleic Acid Research, 1998,20(1):205~213.

    9 Sedlacek Z,Kodet R,Poustka A et al. A database of germline p53 mutation in cancerprone families. Nucleic Acid Research,1998,20(1):214~215.
, 百拇医药
    10 Tateno Y,Fukami-Kobayashi K, Miyazaki S et al. DNA Data Bank of Japan at work on genome sequence data. Nucleic Acid Research, 1998,20(1):16~20.

    11 Barillot E, Guyon F, Cussat-Blanc C et al. HuGeMap:a distributed and integrated Human Genome Map database. Nucleic Acid Research, 1998,20(1):106~107.

    12 Blake JA, Eppig JT,Richardison JE et al. The Mouse Genome Database(MGD):a community resource. Status and enhancements. Nucleic Acid Research, 1998,20(1):130~137.

    收稿日期:1998-12-15

    , 百拇医药