生物信息学期末复习题_生物信息学复习题
生物信息学期末复习题由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“生物信息学复习题”。
生物信息学复习题
名词解释
1、生物信息学 : 广义指生命科学与数学、计算机科学和信息科学等交汇融合所形成的一门交叉学科。它应用先进的数据管理技术、数学分析模型和计算软件对各种生物信息(特别是分子生物学信息)进行提取、储存、处理和分析,旨在掌握复杂生命现象的形成于演化规律。狭义专指应用信息技术储存和分析分子生物学数据,尤其是基因组序列产生的分子序列机器相关数据,也被称为分子生物信息学。
2、人类基因组计划 :是由美国科学家于1985年率先提出,于1990年正式启动的。美国、英国、法兰西共和国、德意志联邦共和国、日本和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。
3、基因芯片: 又叫DNA芯片,是一种高密度的寡聚核苷酸阵列。它采用原位组合合成化学和微电子芯片的光蚀刻技术等方法,将大量特定序列的DNA片段直接固定在玻璃或硅衬底上,从而构成存储有大量信息的DNA芯片。
4、中心法则 :是指遗传信息从DNA传递给RNA,再从RNA传递给蛋白质,即完成遗传信息的转录和翻译的过程。也可以从DNA传递给DNA,即完成DNA的复制过程。
5、一级数据库 :记录实验结果和做一些初步解释的数据库。
名词辨析
1)信息技术与生物信息学 :信息技术(information science)是研究信息的获取、传输和处理的技术,由计算机技术、通信技术、微电子技术结合而成,即是利用计算机进行信息处理,利用现代电子通信技术从事信息采集、存储、加工、利用以及相关产品制造、技术开发、信息服务的新学科。生物信息学是研究生物信息的采集,处理,存储,传播,分析和解释等各方面的一门学科,它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。信息技术和生物信息学都是高新技术,二者在新经济中并非此消彼长的关系,而是相辅相成,共同推进21世纪经济的快速发展。
2)基因与基因组 :基因是指具有遗传效应的DNA片段。而基因组指的是单倍体细胞中的全套染色体,或是单倍体细胞中的全部基因。
3)相似性与同源性 :相似性是指不同染色体之间基因序列的相似或相异程度。同源性是指两个核酸分子的核苷酸序列或两个蛋白质分子的氨基酸序列间的相似程度。
4)Blastn与Tblastn :blastn方法是用检测序列核酸搜索核酸序列数据库,它适合寻找分值较高的匹配,不适合远源关系。而tblastn是用检测序列蛋白质搜索由核酸序列数据库按6条链翻译成的蛋白质序列数据库。它适合寻找数据库中尚未标注的编码区。
5)CDS与cDNA :CDS是内容分发服务的缩写,内容分发服务是互联网的一项
新技术。与RNA链互补的单链DNA,以其RNA为模板,在适当引物的存在下,由RNA与DNA进行一定条件下合成的,就是cDNA。
6)直系同源与旁系同源 :直系同源指的是不同物种之间的同源性,例如蛋
白质的同源性,DNA序列的同源性。旁系同源是那些在一定物种中的来
源于基因复制的蛋白,可能会进化出新的与原来有关的功能。用来描述
在同一物种内由于基因复制而分离的同源基因。
7)敏感性与特异性 :昆虫对某些低剂量的化学物质或其他物理因子能迅速地
引起反应的特性。特异性是指成对、成组对象相互之间的必然对应选择关
系。
8)序列相似性比较与序列同源性分析 :
9)数据库搜索和数据库查询 :数据库搜索在生物信息学中有特定的含义,它
是指通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检
测序列具有一定程度相似性的序列。而所谓数据库查询,是指对序列、结构
以及各种二次数据库中的注释信息进行关键词匹配查找。数据库查询有时也
称为数据库检索,它和互联网上通过搜索引擎查找需要的信息是一个概念。
简答题
1)生物信息学数据库的组成包括哪些部分?数据库有哪些类型?答案:生
物信息学数据库的组成包括一级数据库和二级数据库。数据库的类型包括核
算和蛋白质一级结构序列数据库、基因组数据库、生物大分子三维空间结构
数据库、以上述3类数据库和文献资料为基础构建的二次数据库。
2)简要介绍 GenBank中的DNA序列格式。答案:GenBank中的DNA序列格式
可以分成三个部分,第一部分为描述符,从第一行LOCUS行到ORIGIN行,包含了关于整个记录的信息;第二部分为特性表,从FEATURES行开始,包
含了注释这一纪录的特性,是条目的核心,中间使用一批关键字;第三部分
是核苷酸序列的本身。
3)简要介绍FASTA序列格式答案:FASTA格式,又叫Pearson格式,是最
简单的,使用最多的格式。它的基本形式分为三个部分:⑴第一行:大于号
(﹥)表示一个新的序列文件的开始,为标记符。后面可以加上文字说明,gi号,GenBank检索号,LOCUS名称等信息。⑵第二行:序列本身,为DNA的标准符号,通常大小写均可。⑶结束:无特殊标志,但建议多留一个空行,以便将序列和其他内容区分开。
4)生物信息学数据库的要求和基本特征是什么?答案:
5)生物信息学的基本方法有哪些?答案略
6)生物信息学的目标和任务?答案:收集和管理生物分子数据;数据分析和挖
掘;开发分析工具和实用软件:生物分子序列比较工具、基因识别工具、生
物分子结构预测工具、基因表达数据分析工具。
7)生物信息学主要研究内容。答案(1)生物分子数据的收集与管理;(2)数
据库搜索及序列比较 ;(3)基因组序列分析;(4)基因表达数据的分析与
处理 ;(5)蛋白质结构预测。
8)为什么要构建生物分子数据库。答案:(1)生物分子数据高速增长(2)分
子生物学及相关领域研究人员迅速获得最新实验数据。
9)预测基因的一般步骤是什么?答案:⑴获取DNA目标序列⑵查找ORF
并将目标序列翻译成蛋白质序列,利用相应工具查找ORF并将DNA序列翻
译成蛋白质序列⑶在数据库中进行序列搜索,利用BLAST进行ORF核苷酸序
列和ORF翻译的蛋白质序列搜索⑷进行目标序列与搜索得到的相似序列的全局对比⑸查找基因家族进行多序列比对,获得比对区段的基因家族信息⑹
查找目标序列中的特定模序,分别在Prosite、BLOCK、Motif数据库中进行
profile、模块(block)、模序(motif)检索⑺预测目标序列蛋白质结构,利
用PredictProtein(EMBL)、NNPREDICT等预测目标序列的蛋白质二级结构。
10)生物信息学所用的方法和技术。答案(1)数学统计方法;(2)动态规划方
法 ;(3)机器学习与模式识别技术 ;(4)数据库技术及数据挖掘 ;(5)
人工神经网络技术;(6)专家系统 ;(7)分子模型化技术;(8)量子力学
和分子力学计算 ;(9)生物分子的计算机模拟;(10)因特网(Internet)技
术。
11)国际上权威的核酸序列数据库有那些?答案(1)欧洲分子生物学实验室的EMBL。(2)美国生物技术信息中心的GenBank。(3)日本遗传研究所的DDBJ。
12)生物信息学在基因芯片中的应用有哪些?答案:(1)确定芯片检测目标。(2)
芯片设计。(3)实验数据管理与分析。
13)生物信息学分析的数据对象主要有哪几种?这些数据之间存在着什么关系?
答案:其研究重点主要落实在核酸和蛋白质两个方面,包括它们的序列、结
构和功能。生物信息学以基因组DNA序列信息分析作为出发点,破译遗传语
言,认识遗传信息的组织规律,辨别隐藏在DNA序列中的基因,掌握基因调
控信息,对蛋白质空间结构进行模拟和预测,依据蛋白质结构和功能的关系
进行药物分子设计。
14)基因芯片对于生物分子信息检测的作用和意义?答案:在生命科学领域中,基因芯片为分子生物学、生物医学等研究提供了强有力的手段。利用基因芯
片技术,可研究生命体系中不同部位、不同生长发育阶段的基因表达,比较
不同个体或物种之间的基因表达,比较正常和疾病状态下基因及其表达的差
异。基因芯片技术也有助于研究不同层次的多基因协同作用的生命过程,发
现新的基因功能,研究生物体在进化、发育、遗传过程中的规律。
15)在基因组序列分析方面,科学家关注哪些信息?答案:就人类基因组而言,编码区域在人类基因组所占的比例不超过3%。其余97%是非编码序列。对
于非编码序列,人们了解得比较少,尚不清楚其含义或功能。然而,非编码
区域对于生命活动具有重要的意义。这部分序列主要包括内含子、简单重复
序列、移动元件(mobile element)及其遗留物、伪基因(pseudo gene)等。
16)为什么要进行序列片段组装?在进行序列片段组装时会遇到哪些问题?答
案:大规模基因组测序得到待测序列的一系列序列片段,这些序列片段覆盖
待测序列,序列片段之间也存在着相互覆盖或者重叠。遇到的问题:碱基标
识错误;不知道片段的方向;存在重复区域;缺少覆盖。
17)序列分析的任务和目的分别是什么?答案:任务(1)发现序列之间的相似
性;(2)辨别序列之间的差异。目的:(1)相似序列:相似的结构,相似的功能(2)判别序列之间的同源性(3)推测序列之间的进化关系
18)PCR引物设计有哪些原则?答案:⑴产物不能形成二级结构;⑵引物长度一
般在15~30个碱基之间;⑶G+C含量在40%~60%之间;⑷碱基要随机分布;
⑸引物自身不能有连续4个碱基互补;⑹引物之间不能有连续4个碱基的互
补;⑺引物5‘端可以修饰;⑻引物3’不可修饰;⑼引物3’端要避开密码子的第三位。
19)生物分子数据类型有哪些?答案:DNA序列数据、蛋白质序列数据、生物分
子结构数据、生物分子功能数据、20)基因识别:答案:基因识别,是生物信息学的一个重要分支,使用生物
学实验或计算机等手段识别DNA序列上的具有生物学特征的片段。基
因识别的对象主要是蛋白质编码基因,也包括其他具有一定生物学功能的因子,如RNA基因和调控因子。
1)生物信息学研究意义?
答案:
(1)认识生物本质
了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系。
(2)改变生物学的研究方式
改变传统研究方式,引进现代信息学方法
(3)在医学上的重要意义
为疾病的诊断和治疗提供依据,为设计新药提供依据
2)DNA双螺旋结构模型的意义
(1)为合理解释遗传物质的各种功能、解释生物的遗传和变异、揭示自然界色彩
纷纭的生命现象奠定了理论基础;
(2)揭示了生命世界多样性和生命本质的一致性的辨正统一;
(3)现代生命科学的里程碑。
3)什么是序列比对?及其基本分类?
答案:序列比对(Sequence Alignment)是通过在序列中搜索一系列单个性状或性状
模式来比较2个(双序列比对)或更多(多重序列比对)序列的方法。
序列比对的分类:A、双序列比对:两条序列的比对。B、多序列比对:三条或
以上序列的比对
论述题
1)简述人类基因组计划与生物信息学之间的相互促进关系。
答案:
人类基因组计划(Human Genome Project, HGP)是美国在1990年提出实施的一项
伟大的科学计划,与阿波罗登月计划、曼哈顿原子弹计划同称为人类自然科学史
上的三大计划。自实施以来,该计划在世界各国引起了很大反响。在人类基因组
计划中,人们准备用15年时间,投入30亿美元,完成人类全部24条染色体中
3×109个碱基对(bp,base pair)的序列测定,其主要任务包括作图(遗传图谱、物
理图谱的建立及转录图谱的绘制)、测序和基因识别,还包括模式生物(如大肠杆
菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。
随着人类基因组计划的提出和实施,实验数据和可利用信息急剧增加,人类基因
组计划提供了以往不可想象的巨量的生物学信息资源。基因组信息的收集、储存、分发、分析显得越来越紧迫和重要,信息的管理和分析成为人类基因组计划实施
过程中的一项重要工作,人类基因组计划向信息学提出了巨大的挑战。值得庆幸的是,人类基因组计划一开始就与计算机技术、信息高速公路同步发展,信息技
术为生物信息学的发展提供了非常好的条件,为生物信息学的研究和应用提供了
非常好的支撑。生物信息学与人类基因组计划紧密结合,互相渗透,生物信息学
成为基因组计划不可分割的一部分。事实证明,人类基因组计划在生物信息学的支持下,前进步伐大大加快,已经提前完成计划,功能基因组研究也已经全面展
开。而人类基因组计划反过来又大大促进了生物信息学的发展,HGP丰富了生物
信息学的研究内容,促进生物信息学新思想、新方法的产生,生物信息学在最近
10年迅速发展的历程证明了这一点。
2)生物序列相似性搜索的blast程序包括那些版本?各自有何区别?介绍各自的分析过程。
答:
程序数据库查询简述方法
Blastp蛋白质蛋白质可能找到具有远源进化关系的用检测序列蛋白质搜索蛋白质序列数据库的匹配序列
Blastn核酸核苷酸适合寻找分值较高的匹配,用检测序列核酸搜索核酸序列数据库不适合远源关系
Blastx蛋白质核酸(翻译)适合新DNA序列和EST序列将核酸序列按6条链翻译成蛋白质序列后搜索蛋白的分析质序列数据库
Tblastn核苷酸(翻译)蛋白质适合寻找数据库中尚未标注用检测序列蛋白质搜索由核酸序列数据库按6条的编码区链翻译成的蛋白质序列数据库
Tblastx核 酸(翻译)核酸(翻译)适合分析EST序列将核酸序列按6条链翻译成蛋白质序列后搜索由核
酸序列数据库按6条链翻译成的蛋白质序列数据
库
3)掌握蛋白质结构有什么意义?为什么要进行蛋白质结构预测?
答案(1)研究蛋白质的结构意义重大,分析蛋白质结构、功能及其关系是蛋白
质组计划中的一个重要组成部分。研究蛋白质结构,有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质(或其它分子)之间的相
互作用,这无论是对于生物学还是对于医学和药学,都是非常重要的。(2)对于
未知功能或者新发现的蛋白质分子,通过结构分析,可以进行功能注释,指导设
计进行功能确认的生物学实验。通过分析蛋白质的结构,确认功能单位或者结构
域,可以为遗传操作提供目标,为设计新的蛋白质或改造已有蛋白质提供可靠的依据,同时为新的药物分子设计提供合理的靶分子结构。
刚刚接触生物信息的时候,大家都比较迷茫,我觉得它是一个交叉学科,要想学好得有一定的毅力。我的导师要求我至少作到以下几个方面:1,数学基础要好点。线代,高数,统计等。2,计算机知识......
浅谈对生物信息学的认识摘要生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、储存、传递、检索、分析和解读的科学, 是现代生命科学与信......
生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然......
生物信息学是上世纪90年代初人类基因组计划(HGP)依赖,随着基因组学、蛋白组学等新兴学科的建立,逐渐发展起来的生物学、数学和计算机信息科学的一门交叉应用学科。目前生物信......
这是期末复习题:八年级上学期历史期末试卷(时间:60分钟分值:60分)一、单项选择题(本大题共17小题,1—10题每题1分,11—17题每题2分,共计24分)1. 每年6月26日是世界禁毒日,我们应珍爱生命......
