生物信息技术第二次作业_生物信息技术作业
生物信息技术第二次作业由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“生物信息技术作业”。
实用生物信息技术课程第2次作业
人、小鼠、大鼠血红蛋白及其编码基因序列分析
1.认真阅读NCBI书架(Bookshelf)、PDB分子月报(Molecule of the Month)、UniProt蛋白质精选(Protein Spotlight)以及维基百科(Wikipedia)等网站中有关血红蛋白的介绍,了解血红蛋白的生理功能、空间结构、亚基组成等基本知识。
血红蛋白是高等生物体内负责运载氧的一种蛋白质,具有四聚体蛋白质四级空间结构。人体内的血红蛋白由四个亚基构成,分别为两个α亚基和两个β亚基,每个亚基由一条肽链和一个血红素分子构成。
血红蛋白的每个亚基由一条肽链和一个血红素分子构成,肽链在生理条件下会盘绕折叠成球形,把血红素分子抱在里面,这条肽链盘绕成的球形结构又被称为珠蛋白。血红素分子是一个具有卟啉结构的小分子,在卟啉分子中心,由卟啉中四个吡咯环上的氮原子与一个亚铁离子配位结合,珠蛋白肽链中第8位的一个组氨酸残基中的吲哚侧链上的氮原子从卟啉分子平面的上方与亚铁离子配位结合,当血红蛋白不与氧结合的时候,有一个水分子从卟啉环下方与亚铁离子配位结合,而当血红蛋白载氧的时候,就由氧分子顶替水的位置。
2.查阅ENSEMBL基因组数据库中已经或正在进行基因组测序的物种树,了解人、小鼠、大鼠三个物种之间演化关系;检索物种分歧时间数据库TimeTree,了解人和小鼠、小鼠和大鼠之间的分歧时间。
3.从UniProt数据库中检索并提取人、小鼠、大鼠血红蛋白alpha亚基蛋白质序列,利用WebLab或JEMBOSS软件包中的序列比对程序Needle,选择默认计分矩阵BLOSUM62和默认空位罚分进行序列比对,将比对结果填入表1。分析比对结果,说明得到上述结果的原因和进一步分析思路。
表1 人、小鼠、大鼠血红蛋白alpha亚基蛋白质序列比对结果 物种 Species 人/小鼠 人/大鼠 登录号 Acceion NP_000549/NP_032244 NP_000549/NP_037228
得分 Score 653 587
相同氨基酸 Identity 123/142(86.6%)111/142(78.2%)
相同和相似氨基酸
Similarity 131/142(92.3%)120/142(84.5%)
空位 Gaps 0 0
实用生物信息技术课程第2次作业
小鼠/大鼠 NP_032244/NP_037228
632 120/142(84.5%)127/142(89.4%)0 4.检索RefSeq数据库中人、小鼠、大鼠血红蛋白alpha亚基编码基因的mRNA序列,下载其编码区序列和所编码的氨基酸序列,进行序列比对,将结果填入下面表2中。
表2 人、小鼠、大鼠血红蛋白编码基因序列比对结果 物种 人 基因名 HBA1/HBA2
编码区序列 登录号
编码区序列 差异位点
氨基酸序列 登录号
氨基酸序列 差异位点
NM_000558/NM0 NP_000549/N
0
_000517 P_000508 小鼠 Hba-a1/Hba-a2 NM_008218/NM1 NP_032244/N
0
_001083955 P_001077424 大鼠 Hba1/Hba2 NM_013096/NM5 NP_037228/N
_001007722 P_001007723 5.对上述人HBA1、小鼠Hba1-a1、大鼠Hba1编码区序列进行序列比对(注意选择恰当的计分矩阵和r),将比对结果填入表3。
表3 人、小鼠、大鼠血红蛋白编因编码区序列比对结果
编码区序列 编码区序列 氨基酸序列 登录号 相同位点 相同位点
人/小鼠 HsHBA1/MmHba-a1 NM_000558/NM_0354/432 127/142
08218 人/大鼠 HsHBA1/RnHba1 NM_000558/NM_0342/430 111/142
13096 小鼠/大鼠 MmHba-a1/RnHba1 NM_008218/NM_0386/430 127/142
13096 6.分析上述人、小鼠、大鼠血红蛋白基因区序列比对结果,阅读血红蛋白基因家族演化论文(Hardison R, 2012),说明人、小鼠和大鼠alpha血红蛋白基因家族基因结构和演化。7.将上述数据库检索、序列比对、结果分析的方法、思路、策略用于和你研究课题相关或你熟悉的蛋白质及其编码序列,分析比对结果,说明原因。
表4 人、小鼠、大鼠胃蛋白酶(PGA5)蛋白质序列比对结果
物种 基因名
得分
1146
相同氨基酸总数(百分比)
219/390(56.2%)
相同及相似氨基酸总数(百分比)
282/390(72.3%)人P0DJD9/ 小鼠Q9D106 人P0DJD9/ 大鼠Q9JJX2
小鼠Q9D106/ 大鼠Q9JJX2 1213 222/422(52.6%)245/422(58.1%)
2742 364/387(94.1%)368/387(95.1%)表5 人、小鼠、大鼠胃蛋白酶(PGA5)mRNA编码区序列比对结果
人NM_014224.2 /小鼠NM_021453.4 人NM_014224.2 /大鼠NM_021753.1 小鼠NM_021453.4/4876.0
1028/1094(94.0%)
0/1094(0.0%)2193.5
748/1179(63.4%)
167/1179(14.2%)得分
2190.0
相同核苷酸总数(百分比)
748/1200(62.3%)
空位数(百分比)
209/1200(17.4%)
实用生物信息技术课程第2次作业
大鼠NM_021753.1
通过对人、小鼠、大鼠胃蛋白酶(PGA5)蛋白质序列和mRNA序列比对,结果如表3和表4。显示,小鼠和大鼠的胃蛋白酶蛋白质序列及其编码的mRNA序列都具有更高的同源性,可能与二者的膳食结构有关系,而人是杂食性的且结构复杂,所以用于初级消化的蛋白酶差距会与小鼠、大鼠相差很大。进一步分析,通过多三者的mRNA序列比对,结果也进一步的验证蛋白质序列比对的结果。
参考文献:
Hardison RC.Evolution of hemoglobin and its genes.Cold Spring Harb Perspect Med.2012 Dec 1;2(12):a011627.