前沿生物技术处
概述
国内外研究概况
基因组学
功能基因组学
蛋白质组学
结构基因组学
生物信息学
其它
大事记
新闻
相关网站链接
生物信息学

生物信息学是综合运用生物学、信息学、数学以及计算机科学等诸多学科的理论和方法,处理和分析大规模复杂生物信息的交叉学科。生物信息学越来越受到国内外科技工作者的重视,成为当前生命科学和生物技术领域研究开发的热点之一。

一、发展回顾

从20世纪80年代开始,人类和其他生物物种基因组学研究的兴起正飞速发展,要求运用新的技术手段对复杂的海量生物信息进行储存、管理、分析和研究,生物信息学应运而生。

随着基因组学进入功能研究阶段和数据的进一步大量产生,以及转录体组学、蛋白质组学,和其他大规模、高通量、自动化实验方法的相继涌现,对生物信息学提出了更高的要求,使之得到了迅速的发展。目前,生物信息学研究已经成为现代生命科学研究中不可分割的一部分,在生命科学研究的众多领域,包括基因组的组装、基因组注释、比较基因组学、单核苷酸多态性、基因表达分析、蛋白质的结构与功能、药物靶标的发现与功能分析、药物的发现与设计等都发挥着越来越重要的作用。

由于生物信息学的重要作用和巨大的市场需求,对于生物信息学的重视和大量投入,已经成为各国政府和企业的共识。国际上自80年代起相继成立了三大公共生物信息中心并各负责管理一个大型数据库,即美国的GenBank, 欧洲的 EMBL和日本的DDBJ。据Nucleic Acids Research(核酸研究)杂志统计,全世界已有353个相关的生物数据库。其中,核酸数据库中序列数总数已近1360万,约含144亿碱基;蛋白质序列数据库SwissProt中的序列数已达10万多个;三维结构数据库PDB中已有17082套原子坐标等等。另外,从90年代初开始美国排行前20名的大型制药厂均对生物信息学加大投入,以期在基因组和后基因组研究方面获得丰厚回报。据《Nature-Biotechnology》杂志预测,到2005年生物信息的全球市场价值将达到400亿美元。

二、主要进展

我国的生物信息学研究起步较早。八十年代末,我国学者就在《Nature》上报道了免疫球蛋白基因超家族计算机分析的工作。目前,多家大学和研究机构,如清华大学、北京大学、复旦大学、天津大学、中国科学院上海生命科学研究院、中国科学院计算所、军事医学科学院、中山大学、东南大学、西北大学、西安交通大学、哈尔滨医科大学等相继成立了生物信息中心或研究所。各种原始数据库、镜像数据库和二级数据库,也在国家人类基因组南、北研究中心、北京华大基因研究中心、清华大学、北京大学、军事医学科学院等单位建立,为中国国内以及与国际生命科学合作研究和数据共享做出了重要贡献。

在以上单位的共同努力下,我国生物信息学有了长足的发展。建立了与相关的工作站和网络服务器,实现了与国际主要基因组数据库及研究中心的网络连接,可以涵盖与生物信息学相干的各种网络结点。国内单位,如军事医学科学院、中科院生物物理所、天津大学等开发了用于核酸、蛋白结构、功能分析的计算工具、蛋白质三维结构预测、并行化的高通量基因拼接和基于群论方法开发的基因预测等多种软件。

我国学者运用自主开发的电脑克隆的计算机程序(siclone),开展了大规模EST数据分析,获得了4000多条cDNA并在此基础上克隆了一批新基因,建立了一系列基因组序列分析新算法和新技术,例如基因组全信息集分析方法、基于模型的分析技术、复杂神经系统网络方法和技术等,应用这些技术和软件对已经完成基因组测序的古细菌、细菌、真核生物的几十个物种进行了系统比较,发现了一些新的进化规律。开展了蛋白质三维构像的模建及其与功能关系的研究,直接从通过电脑克隆技术获得的新基因的DNA序列推测蛋白质的一、二级结构和可能的三级结构,并通过同源性比较、功能结构域识别等预测了新基因的可能功能。还开展了一种基于原子对距离距阵的蛋白质结构域划分方法,提高了模建的速度和精度。应用密度泛函方法,对数种蛋白的电子结构进行了大规模计算,探讨了一级结构相同而三级结构不同的微观机制,为研究蛋白质折叠机制开辟了新的视角。在可变剪切位点分析、蛋白质二级结构预测和基因调控网络分析等方面在国内外著名科学杂志上发表了一系列论文,取得了引人注目的进展,尤其在人类基因组基因数目的预测上获得了与目前的实验事实相当精确吻合的结果,在国际上获得普遍承认。

近年来中国生物信息学的蓬勃发展与中国基因组学的发展密不可分。我国在国际人类基因组计划、水稻基因组计划和其它物种基因组测序等工作中所产生的大量数据对生物信息学的研究提出了迫切的要求,国家南、北方基因组研究中心、华大基因组研究中心、中科院基因组研究中心开发了大量针对基因组数据进行组装、分析、功能注释和数据管理的软件, 建立了卓有成效的生物信息学技术支撑体系,对完成千万碱基对的1%人类基因组测序、4.6亿对碱基的水稻基因组以及其他基因组测序任务和相应的功能分析起到了关键的作用。基因组测序中最常用的是全基因组鸟枪法,北京华大基因研究中心进行中国水稻(籼稻)基因组测序与组装即采用这一方法,其中生物信息学起着关键的作用,包括序列数据的存贮、管理、组装,都是生物信息学的结晶。

生物信息学复杂大量的计算同时对计算机硬件和配套软件提出了更高的要求。目前生物信息学研究部门成为高性能曙光、神威计算机的主要用户,直接催生了曙光2000,3000系列,促进了国内高性能计算系统的研发。

“十五”以来国家高技术研究发展计划(863)将生物信息技术单独列为主题,在生物信息的获取与开发、生物信息加工和利用、结构基因组和蛋白质组学研究、高通量药物筛选及相关技术、小分子药物设计和分子设计、生物芯片、化学创新药物与新剂型等七个领域开展研究。