当前位置: 首页 > 新闻 > 信息荟萃
编号:10178901
创建标准化的“生物信息王国”
http://www.100md.com 2003年5月12日 中国中药材GAP网
     作者:于宁

    在生物信息领域中,信息系统的创造环境极为复杂,这对于想最大限度地开发庞大生物信息价值的生物学家而言,是一个不小的障碍。如果世界各种生物信息资源能采用一种普遍且通用的管理代码,使其互通简捷,构成强大而稳固的“生物信息王国”,将会大大促进生物信息学领域的发展。

    难以避免的“屏幕创伤”

    一些网上的数据资源可为生物学家们提供丰富优质的使用界面和紧密联系的数据库。然而,目前每个生物信息数据库的界面是不同的,研究人员需要耗费大量的时间用于调整存在于各个数据库之间的不同情况。如把人类基因与另一个物种进行比较时,生物信息学家常常需要从网上的不同信息库中收集数据以建立一个数据程序用于进一步的分析。当这些数据库存在于不同的服务器、使用不同的数据格式和进入方法时,研究人员则首先需要使用一系列的软件调整它们,进行格式化,以便提取必要的数据存入自己的数据库中。这些做法并不容易,因为网上的许多生物信息数据库是不允许其他机器进入的。
, 百拇医药
    生物信息学家发现他们在编写生物信息程序和提取数据的同时,一些相关图表和注释说明会丢失,这种屏幕信息的不完整性通常被称为“屏幕创伤”。这种“屏幕创伤”缘于多种原因。首先,屏幕信息不稳定———数据库管理者总是为用户界面进行一定的修改,以提高使用简捷性,但是每次修改均会引起一系列的屏幕创伤。其次,屏幕信息的非标准化———目前还没有颁布有关数据资源网页所包含内容的录入标准。

    设立“生物工程图书馆”

    为了改善生物信息的混乱局面,国际生物信息学委员会提出设立“生物工程图书馆”的设想。它可使研究人员轻松获取开放资源。目前,来自世界各地的数百名软件工程师已投入到这项设计中,他们用不同的程序语言编制了一套可重复使用的代码图书馆。这些图书馆不仅可使诸如基因排序等一些生物信息任务自动化,而且可对数据资源或文档格式之间的数据输入、输出提供各种方法。如生物学家从数据库中提取一条数据,可通过生物工程图书馆将所需信息切换为标准格式,然后再把数据存入自己的文档中。但是,这个生物工程图书馆并不能自动维护在线数据资源的完整性,只要其中的一个网页发生改变,该图书馆就会遭到破坏,程序技术员必须即刻进行修缮,以维持一系列的转换器控制在线的每一个生物信息网络数据库正常运行。此外,生物工程图书馆也不能迅速解决数据提供者本身的矛盾。当两个数据提供者想交换数据时,他们必须就交换的项目及格式进行调整。
, 百拇医药
    搭建生物信息交流平台

    如果数据库的提供者能使用相同方法提供生物信息数据,使用同一标准的界面和信息采集方法,那么收集综合不同数据资源的问题将迎刃而解。

    解决这一问题的方法依赖于网络技术服务。这种网络技术服务是一种公开的界面。它使用简单易懂的数据形式和进入方法,并附有便于查找的目录。现代生物信息网络服务应允许不同的数据资源提供同一种服务形式。例如NCBI(美国国立生物技术信息中心)、EBI(欧洲生物信息学研究所)都可以提供一种程序相似的服务。尽管这两个网址提供服务的方式截然不同,但进入任何一种服务程序便能够进入另一种服务。

    决定采用何种数据库履行何种服务是对网络服务的一个挑战,解决方法是进行服务登记。当一种程序需要进入特殊服务时,它将参考登记簿来查找其所需的服务。如果有多个数据库提供同一种服务,可寻求使用者的帮助,或应用其固有的标准选择数据库。国际互联网正在筹划建立一些数据标准,例如使用分类注释系统和书目查询服务的整组基因注解数据。同时,国际互联网也在研制一种极有开发前景的生物信息数据库整体平台INTEGR8。而美国国立癌症研究院的CABIO设计是一个综合性的开放资源设计,它将使人们通过网络服务设施利用该研究院的肿瘤数据库。, 百拇医药