生物信息学综述_生物信息学概述

2020-02-28 其他范文 下载本文

生物信息学综述由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“生物信息学概述”。

2008级临床学院(生殖专业)陈涛200822159

3生物信息学综述

摘要: 主要是对生物信息学的起源及概念进行论述,以及区别基因组信息学,重点对生物信息学的研究内容进行综述,并对国内外研究的热点问题进行讨论,最后是对发展前景提出未来展望。由于人类基因组计划的胜利完成与生物信息学的发展密切相关,使生物信息学的发展为生命科学的发展和研究带来了很多的帮助,并对其进行一般性的分析。

一、生物信息学的起源

生物信息学是80年代开始于人类基因组计划的启动,而兴起的一门边缘学科。随着生物科学和计算机科学的迅猛发展,由此而诞生的生物信息学逐渐发展成为一门独立的学科。其名字来源更早,生物信息学的概念是在1956年美国田纳西州盖特林堡召开的 “ 生物学中的信息理论研讨会 ” 上产生的。并由林华安博士在1987年正式为这一领域定下”生物信息学”这一称谓。生物信息学主要是一门运用生物学、数学、统计学、物理学、化学、信息科学以及计算机科学等诸多学科的理论方法研究生物学系统和生物学过程中信息流的综合系统科学,通过其独特的桥梁作用和整合作用 , 使人们能够从各生物学科众多分散的观测资料中, 获得对生物学系统和生物学过程运作机制的理解, 最终达到自由应用于实践的目的。生物信息学的实质就是利用计算机科学和网络技术来解决生物学问题。

生物信息并不仅限于基因组信息,生物信息学也并不等同于基因组信息学。我们普遍认为生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,找到代表蛋白质和DNA基因的编码区,特别是阐明非编码区的实质,从而认识生物有机体代谢、发育、分化和进化的规律;同时在发现了新基因信息之后进行蛋白质空间结构的模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。因此,现代生物信息学主要包括3个重要内容,它们分别是基因组信息学、蛋白质的结构模拟以及药物设计。基因组信息学是指从基因组水平研究遗传的学科。随着各种生物基因组测序计划的展开与分子结构测定技术的突破以及因特网的普及,无数的生物学数据如雨后春笋般迅速涌现。到目前为止,已经测出了上百种生物体的完整基因组序列。如何分析这些从实验过程中获得的大量原始数据,并从中获得与生物结构、功能相关的有用信息是当前困扰理论生物学家的一个棘手问题。解决这些问题又可以带来新技术的进步,推动生命科学的发展。.二、生物信息学与基因组研究的关系

利用数学模式和计算机处理数据的功能来处理和分析大量增加的人类基因组信息的结果,使人类基因组计划和生物信息学紧紧地结合起来了,而且随着两者的紧密结合和互相渗透,人类基因组计划的前进步伐会大大加快,从而提前完成计划,为人类造福。

生物信息学以基因组信息学为核心,主要任务是收集、储存、分发基因组的数据和信息,管理和分析、处理基因组及相关的蛋白质、mR NA 的信息,根据基因组数据和信息的比较分析,发现新的基因,并对基因结构和功能进行研究。在此基础上, 归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据 , 从而认识生物代谢、发育、分化、进化的规律。因此生物信息学的研究内容是伴随着基因组研究的不断成功而发展的。也就是说 , 生物信息学从事对基因组研究相关生物信息的获取、加工、储存、分配、分析和解释。这个定义的含义是双重的: 一是对海量数据的收集、整理与服务, 即管理好这些数据;二是从中发现新的规律 ,用好这些数据。

人类基因组信息为药物发展提供了新的候选分子和新的候选药靶基因,基因组信息学提供的大量信息为这类技术的发展提供了广阔的天地。产生了许多新技术,其中有利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。

三、生物信息学的主要研究内容

如今生物信息学界的大部分研究人员都把注意力都集中在序列比对、序列分析、基因组、蛋白质组、蛋白质结构以及与此密切相关的药物设计上方面。

1、序列比对

生物学中的序列是指核酸或氨基酸序列,而序列比对的基本问题是比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BALST和FASTA。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。多重序列比较是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列比较,以确定该序列与其它序列间的同源性大小。根据序列同源性分析的结果,重建反映物种间进化关系的进化树。多重序列比对是当前一个研究热点,常用算法有分治法,HMM及聚类法等。目前基因组比对也引起研究者们的关注。不同物种间的基因组比对既能够解释和预测他们蛋白质功能的相似性,又能够揭示不同物种间的联系。基因组比对由于涉及上亿的核酸,计算量很耗时,Delcher提出一种后缀树的方法比较两个基因组。研究基因组比对算法也是一个研究方向。

2、序列分析

序列分析主要是获知DNA序列对应的基因和基因调控序列。而DNA有很多重复的区域,相同的片段可能属于不同的区域。由于基因组中并非所有的核酸都构成基因,所以序列分析的另一个研究内容是对基因组中的基因和基因调控序列进行自动识别。基因识别是给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置。目前在基因识别方面的算法大体可分为基于统计的方法、基于同源性的方法和基于机器学习(如人工神经网络)方法。同时对非编码区域的识别也很重要。

3、基因组

基因组表示一个生物体所有遗传信息的总和.一个生物体基因组所包含的信息决定了该生物体的生长、发育、繁殖和消亡等几乎所有的生命现象.3.1、获取人和各种生物的完整基因组

基因组研究的首要目标是获得人的整套遗传密码。人的遗传密码有 32 亿个碱基 , 要得到人的全部遗传密码首先要把人的基因组打碎 , 测完一个个小段的序列后再把它们重新拼接起来。迄今为止 , 人们对人类基因组真正掌握规律的只有 DNA 上 的编码蛋白质的区域 , 最新资料表明这部分序列只占基因组的 1.1%。在高等生物和人的基因组中非编码序列已占到基因组序列的绝大部分。这表明非编码序列具有重要的生物功能。由于它们并不编码蛋白质 , 一般认为 , 它们的生物学功能可能体现在对基因表达的时空调控上。

3.2、发现新基因和新的单核普酸多态性

发现新基因是当前国际上基因组研究的热点 , 使用生物信息学的方法是发现新基因的重要手段。

利用EST数据库发现新基因称为基因的电脑克隆。EST序列是基因表达的短 CDNA 序列 , 它们携带着完整基因的某些片段的信息。通过计算分析从基因组 DNA 序列中确定新基因编码区 , 已经形成许多分析方法 , 如根据编码区具有的独特序列特征、根据编码区与非编码区在碱基组成上的差异等。此外, 还可以从基因组序列预测新基因 , 其本质是把基因组上编码蛋白质的区域和非编码蛋白质的区域区分开。从方法上讲就是找出在编码区和非编码区有哪些数学和物理学特征是不一样的 , 将这些序列与已知基因数据库进行比较 , 就可以发现新基因。

单核苷酸的多态性(SNP)表现为单个碱基上的变异。在人群中的表现有差异,如有的人吸烟喝酒长寿, 有的人自幼病痛缠身;还有同一种治疗肿瘤的药物对某些人非常有效 , 对其他热门则完全无效等等现象。一般认为 ,SNP的研究是人类基因组计划走向应用的重要步骤。这主要是因为 SNP 将提供一个强有力的工具 , 用于高危群体的发现、疾病相关基因的鉴定、药物的设计和测试以及生物学的基础研究等。SNP 在基因组中分布相当广泛。近年来的研究表明 , 在人类基因组中每 300 个碱基对就出现一次。大量存在的 SNP 位点 , 使人们有机会发现与各种疾病相关的基因组突变。

3.3、功能基因组

功能基因组就是进行基因组功能的注释,了解基因的功能,认识基因与疾病的关系,掌握基因的产物及其在生命活动中的作用。包括以下几个方面:(1)进一步识别基因,识别基因转录调控信息,分析遗传语言。(2)注释所有基因产物的功能。序列同源性分析、生物信息关联分析、生物数据挖掘是进行功能注释的主要生物信息学手段。(3)研究基因的表达调控机制,研究基因在生物体代谢途径中的地位,分析基因、基因产物之间的相互作用关系,绘制基因调控网络图。(4)比较基因组学研究。它是识别和建立不同生物体的基因或其他基因组特征的联系。在基因组水平对各个生物进行对照比较,可以揭示生命的起源和进化、发现蛋白质功能。

(5)功能基因组相关信息分析。

4、蛋白质组

蛋白质组是指一个基因组、一种生物或一种细胞/组织所表达的整套蛋白质.而有关蛋白质组的研究称为蛋白质组学。蛋白质组学的核心内容包括蛋白质组研究体系的建立、完善和与重要生物学问题有关的功能蛋白质组研究两个部分。基因组对生命体的整体控制必须通过它所表达的蛋白质来执行 , 由于基因芯片技术只能反映从基因组到 RNA 的转录水平上的表达情况 , 而从 RNA 到蛋白质还有许多中间环节的影响,这样,仅凭基因芯片技术人们还不能最终掌握生物功能的具体执行者一一蛋白质的整体表达状况。因此,近年在发展基因芯片的同时 , 人们还发展了一套研究基因组所有蛋白质产物表达情况的技术一一蛋白质组研究技术,包括二维凝胶电泳技术和质谱测序技术。

5、蛋白质结构及新药设计

基因组和蛋白质组研究的迅猛发展,使许多新蛋白序列涌现出来。然而,要了解它们的功能 , 只有氨基酸序列是远远不够的,因此出现蛋白质结构比对和功能预测。比对是通过比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。蛋白质的结构与功能是密切相关的,具有相似功能的蛋白质结构一般相似。目前通过X 射线晶体结构分析、多维核磁共振波谱分析和电子显微镜二维晶体三维重构等物理方法可以获得蛋白质的三维结构,还有一种方法是通过计算机辅助预测的方法。蛋白质结构预测的目的是利用已知的一级序列来构建出蛋白质的立体结构模型.对蛋白质进行结构预测需要具体问题具体分析,不同的已知条件下对于不同的蛋白质需要采取不同的策略。了解蛋白质的功能从而找到其致病的分子机理,知道它们的空间结构,再设计药物对这些疾病进行治疗。生物信息学中的理论模拟与结构预测相当的重要,基于生物大分子结构知识的药物设计也成了当前药物研究的一个热点 ,它根据药物分子与大分子之间作用的互补原理,在受体结构的基础上反过来设计药

物分子。而且生物信息学可用于药物靶标基因的发现和验证。

四、国内外生物信息学的现状和未来展望

生命科学与信息科学是目前发展最为迅速的两大领域,作为这两大学科交叉的产物之

一,生物信息学同样发展迅速,并在基因组学研究中发挥巨大的作用。

国外一直非常重视生物信息学的发展, 各种专业研究机构和公司涌现很多, 生物科技公司和制药工业内部的生物信息学部门的数量也与日俱增。由于对生物信息学的人才需求迅猛,发达国家也面临着供不应求、人才匮乏的局面。

国内对生物信息学领域也越来越重视,取得了一定成绩 , 甚至在国际上还占有一席之地,如北京的罗静初和顾孝诚教授在生物信息学网站建设方面、中科院生物物理所的陈润生研究员在 EST 序列拼接方面以及在基因组演化方面、天津大学的张春霆院士在 DNA 序列的几何学分析方面都取得重要成果。北京大学研究建立起一个EMBL的镜像数据库,并提供数据检索服务。在复旦大学遗传学研究所,为克隆新基因而建立的一整套生物信息系统也已初具规模。中科院上海生化所、生物物理等在结构生物学和基因预测研究方面也有相当的基础,中科院计算所作为我国计算机科学的顶尖机构,利用自身优势,也开始在生物信息方面投入大量的人力物力,从事相关的研究。但从全国总体来看与国际水平差距很大,需要努力。

目前,绝大部分的核酸和蛋白质数据库由美国、欧洲和日本的 3 家数据库系统产生 , 他们共同组成了 DDBJ/EMBL/GenBank国际核酸序列数据库 , 每天交换数据 , 同步更新。其他一些国家 , 如德国、法国、意大利、瑞士、澳大利亚、丹麦和以色列等 , 在分享网络共享资源的同时 , 也分别建有自己的生物信息学机构、二级或更高级的具有各自特色的专业数据库以及自己的分析技术 , 服务于本国生物(医学)研究和开发 , 有些服务也对全世界开放。此外 , 国内生物(医药)科学研究与开发对生物信息学研究和服务的需求市场非常广阔。但是 , 真正开展生物信息学具体研究和服务的机构或公司却相对较少 , 仅有的几家科研机构主要开展生物信息学理论研究 , 生物信息学服务公司提供的服务仅局限于简单的计算机辅助分子生物学实验设计 , 而且服务体系也不完善。

生物信息学积极倡导的全球范围的资源共享将对整个人类社会的发展产生深远的影响,其研究领域和应用范围也将得到进一步的拓展。那时它不仅具有重要的学术价值,还有很大的商业价值,有着广阔的发展前景。随着后基因组时代的到来,它将发挥着越来越不可替代的作用。将成为生物医学、生物工程、农学、遗传学、制药和高科技产业的巨大推动力。可以毫不夸张地说,生物信息学将是21世纪生物科学发展的核心领域。

参考文献:

刘秀艳,滕胜--应用计算机识别蛋白质功能[J ].生命的化学

田云,卢向阳--生物信息学[J ].生物学杂志

陈新 《生物信息学概论》

百度百科--生物信息学

Stein LD et al.Gene1998

Lim HA,Batt tR.TIBTECH,1998

生物信息学

刚刚接触生物信息的时候,大家都比较迷茫,我觉得它是一个交叉学科,要想学好得有一定的毅力。我的导师要求我至少作到以下几个方面:1,数学基础要好点。线代,高数,统计等。2,计算机知识......

生物信息学

浅谈对生物信息学的认识摘要生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、储存、传递、检索、分析和解读的科学, 是现代生命科学与信......

生物信息学

生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然......

生物信息学

生物信息学是上世纪90年代初人类基因组计划(HGP)依赖,随着基因组学、蛋白组学等新兴学科的建立,逐渐发展起来的生物学、数学和计算机信息科学的一门交叉应用学科。目前生物信......

生物信息学简介

1、简介生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21......

《生物信息学综述.docx》
将本文的Word文档下载,方便收藏和打印
推荐度:
生物信息学综述
点击下载文档
相关专题 生物信息学概述 信息学 生物 生物信息学概述 信息学 生物
[其他范文]相关推荐
[其他范文]热门文章
下载全文