当前位置: 首页 > 中医药 > 中医思考 > 访谈
编号:190058
解读“生物信息学” ——访著名学者陈润生
http://www.100md.com 2002年7月15日 《中国中医药报》 第1785期
     中科院物理所研究员陈润生是我国较早开展生物信息学研究的科学家之一,现为国际人类基因组组织会员;国际数据库组织生物大分子专业组委员;国际纯粹应用生物物理学会生物信息学专业委员会委员;同时担任我国人类基因组研究北方中心委员。1980年以来他主要从事蛋白质空间结构模拟和分子设计以及基因组信息学方面的研究工作。1996年,他因在该领域的研究成就而荣获“小谷正雄”奖。

    在第二届中国生物信息学大会上,他在大会报告中介绍了他的研究小组在生物信息学研究的更高级阶段——系统生物学方面的研究和探索,引起与会代表的强烈反响。

    这位谦和的科学家在接受记者采访时,用尽可能浅显易懂的语言向我们介绍了应当怎样认识生物信息学。他表示,希望有更多的人了解这门新兴学科,也希望有更多的年轻学者投入到这个充满希望的研究领域来,共同开创我国生命科学研究的美好未来。

     1.什么是生物信息学?
, http://www.100md.com
    生物信息学是一门新兴的交叉学科。很多人会认为,生物信息学既涉及生物又涉及物理,一定是一个内容十分广泛的学科领域。其实它的内涵十分具体,范围非常广泛。生物信息学是伴随着基因组研究而产生的,因此它的研究内容就紧随着基因组研究而发展。

    广义地说,生物信息学从事对基因组研究相关生物信息的获取、加工、储存、分配、分析和解释。这一定义包括了两层含义,一是对海量数据的收集、整理与服务,也就是管好这些数据;另一个是从中发现新的规律,也就是用好这些数据。

    具体来讲,生物信息学是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA基因的编码区;同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律;在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化的规律。

    生物信息学还利用基因组中编码区的信息进行蛋白质空间结构和蛋白质功能的预测,并将此类信息与生物体和生命过程的生理生化信息相结合,阐明其分子机理,最终进行蛋白质,核酸的分子设计、药物设计和个体化医疗保健设计。
, http://www.100md.com
    2.为什么基因组研究需要依赖生物信息学?

    海量生物数据的产生和基因组数据的复杂性决定了基因组研究必须依赖生物信息学。

    首先,伴随着基因组研究,相关信息出现了爆炸性增长,迫切需要对海量生物信息进行处理。自1995年科学家破译了全长为180万核苷酸的嗜流感杆菌基因以为,到目前已有近百个微生物和若干真核生物如酵母、果蝇等的完整基因组完成测序。人类基因组工作草图的公布,也意味着基因组的研究将全面进入信息提取和数据分析的崭新阶段。据国际数据库的统计,1999年12月DNA碱基数目为30亿,2001年已超过140亿,大约每14个月翻一番。同时,电子计算机芯片对于数字处理能力的增长也相当于每18个月翻一番。因此,计算机能够有效地管理和运行海量数据。

    但是,更为本质的原因是基因组数据的复杂性。所谓某种生物的基因组就是指该生物所有遗传物质的总和。生物的遗传物质是一类称为脱氧核糖核酸(DNA)的生物大分子,它是由4种核苷酸串接起来组成的,通常用字符A、T、G、C代表。通俗地说,生物的遗传密码就是这4个字符连接起业的线状长链。这种链往往很长,比如,人的遗传密码就含有32亿个字符,将它们堆起来就构成了一部100多万页,每页有3000字符的“天书”。这本天书包含了人体的结构和功能以及生命活动过程的大量信息,却仅仅由4个字符组成,既无词法,又无句法,还没有标点符号,看起来每一页都是相似的。如何读懂它是个极大的难题。基因组研究最终是要把生物学问题转化成对数字符号的处理问题。要解决这样的问题就必须发展新的分析理论、方法、技术、工具,就必须依赖计算机的信息处理。
, http://www.100md.com
    3.从事生物信息学研究应该具备哪些方面的科学基础

    从事生物信息学研究应具备多方面的科学基础。首先,它需要一定的计算能力,包括相应的软、硬件设备。要有各种数据库或者能与国际、国内的数据库系统进行有效的交流。要有发达、稳定的互联网络系统;同时,生物信息学需要强有力的创新算法和软件。没有算法创新,生物信息学就无法获得持续的发展。最后,它要与实验科学,特别是与自动化的大规模高通量的生物学研究方法与平台技术建立广泛、紧密的联系。这些技术,既是产生生物信息数据的主要方法,又是验证生物信息研究结果的关键手段。因此,从事生物信息学研究的人员也必须具备多学科交叉的知识。

    4.生物信息学要解决的基因组研究相关问题主要有哪些

    总的来说,需要用生物信息学来解决的与基因组研究相关的问题包括三个方面,它们是基因组信息学、蛋白质的结构计算与模拟和以基因组为基础的药物设计。这三者紧密地围绕着遗传信息传递的中心法则,因而必须有机地连接在一起。
, 百拇医药
    基因组信息学是生物信息学的第一个组成部分,也是最基础的部分。它的核心内容是破译遗传密码。我们知道,人的遗传密码有32亿个碱基,而现在的DNA测序仪每个反应只能读取几百到上千个碱基。也就是说,要得到人的全部遗传密码首先要把人的基因组打碎,测完一个个小段的序列后再把它们重新拼接起来。这个庞大的数据处理过程单纯依靠生物学家很难完成,必须有计算机学家的参与,完成从分段测序到恢复基因组的本来面目的整个过程就是基因组信息学。

    在破译了人的遗传密码后我们发现,其中有的部分是基因,有的部分并非基因。基因部分通过编码变成蛋白质并最终构造人体和完成人体的功能。那么,不同的基因所表达的蛋白质将各完成什么功能?基因和蛋白质之间到底有什么关联?要弄清楚这个由一维的遗传密码,转变成三维的蛋白质功能的过程,我们必须解决第二个核心问题:蛋白质空间结构的模拟和预测。

    进一步来说,当我们发现有些蛋白可能对人体有害,则需要对这部分进行干预,也就是进行关联的药物设计,这一药物设计是在了解功能基因和关键性部位的基础上进行的,是以基因组的知识为基础的药物设计。这就是生物信息学需要解决的第三个问题。, 百拇医药(陆静)