19第十八章 基因表达调控_第18章基因表达调控

2020-02-28 其他范文 下载本文

19第十八章 基因表达调控由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“第18章基因表达调控”。

第十八章

基因表达调控

20世纪50年代末,生物科学家们揭示了遗传信息从DNA传递到蛋白质的规律—中心法则。此后,科学家们一直在探索着究竟是何种机制调控着遗传信息的传递。1961年,F.Jacob和J.Monod提出了著名的操纵子学说,开创了基因表达调控研究的新纪元。

基因表达调控的研究使得人们了解到多细胞生物是如何从一个受精卵及所具有的一套遗传基因组,最终形成了具有不同形态和功能的多组织、多器官的个体;也使得人们初步知晓:为何同一个体中不同的组织细胞拥有相同的遗传信息,却可以产生各自专一的蛋白质产物,因而具有完全不同的生物学功能。因此,对基因表达调控的了解是认识生命体不可或缺的重要内容。

框18-1操纵子的发现

1961年,法国科学家F.Jacob和J.L.Monod在研究大肠杆菌乳糖代谢的调节机制中发现有些基因不是作为合成蛋白质的模板发挥作用,而只是起到调节或操纵作用,故提出操纵子学说。从此根据基因功能把基因分为结构基因、调节基因和操纵基因。1965年,F.Jacob和J.Monod荣获诺贝尔生理学/医学奖。1969年,J.R.Beckwith从大肠杆菌的DNA中分离出乳糖操纵子,证实了F.Jacob;fv J.L.Monod的模型及理论。

第一节基因表达与基因表达调控的基本概念与特点

原核生物体系和真核生物体系在基因组结构以及细胞结构上的差异使得它们的基因表达方式有所不同。原核细胞没有细胞核,遗传信息的转录和翻译发生在同一空间,并以偶联的方式进行。真核细胞具有细胞核,’使得转录和翻译不仅具有空间分布的特征,而且还有时间上的先后顺序。尽管如此,原核生物体系和真核生物体系在基因表达调控上都遵循一些共同的基本规律。

一、基因表达是基因转录和翻译的过程

基因表达(gene expreion)就是基因转录及翻译的过程,也是基因所携带的遗传信息表现为表型的过程,包括基因转录成互补的RNA序列,对于蛋白质编码基因,mRNA继而翻译成多肤链,并装配加工成最终的蛋白质产物。在一定调节机制控制下,大多数基因经历、转录和翻译过程,产生具有特异生物学功能的蛋白质分子,赋予细胞或个体一定的功能或形态表型。但并非所有基因表达过程都产生蛋白质。rRNA, tRNA编码基因转录产生RNA的过程也属于基因表达。

不同生物的基因组含有不同数量的基因。细菌的基因组约含4000个基因;多细胞生物的基因达数万个,人类基因组含约2万一2.5万个基因(见第十三章)。在某一特定时期或生长阶段,基因组中只有小部分基因处于表达状态。例如,大肠杆菌通常只有约5%的基因处于高水平,转录活性状态,其余大多数基因不表达或表达水平极低,即:生成很少的RNA或蛋白质。基因{表达水平的高低不是固定不变的。例如,平时与细菌蛋白质生物合成有关的延长因子编码基因

356

第十八章 基因表达调控

357 表达十分活跃,而参与DNA损伤修复有关的酶分子编码基因却极少表达;当有紫外线照射引起DNA损伤时,这些修复酶编码基因的表达就变得异常活跃。可见,生物体中具有某种功能的基因产物在细胞中的数量会随时间、环境而变化。

二、基因表达具有时间特异性和空间特异性

所有生物的基因表达都具有严格的规律性,即表现为时间特异性和空间特异性。生物物种愈高级,基因表达规律愈复杂、愈精细,这是生物进化的需要。基因表达的时间、空间特异性由特异的基因启动子(序列)和(或)增强子与调节蛋白相互作用决定。

(一)时间特异性是指墓因表达按一定的时间顺序发生

按功能需要,某一特定基因的表达严格按一定的时间顺序发生,这就是基因表达的时间特异性(temporal specificity)。如噬菌体、病毒或细菌侵人宿主后,呈现一定的感染阶段。随感染阶段发展、生长环境变化,这些病原体以及宿主的基因表达都有可能发生改变。有些基因开启,有些基因关闭。例如霍乱弧菌在感染宿主后,44种基因的表达上调,193种基因表达受到抑制,而相伴随的是这些细菌呈现出高传染状态。编码甲胎蛋白(alpha fetal protein,AFP)的基因在胎儿肝细胞中活跃表达,因此合成大量的甲胎蛋白;在成年后这一基因的表达水平很低,几乎检测不到AFP。但是,当肝细胞发生转化形成肝癌细胞时,编码AFP的基因又重新被激活,大量的AFP被合成。因此,血浆中AFP的水平可以作为肝癌早期诊断的一个重要指标。

多细胞生物从受精卵发育成为一个成熟个体,经历很多不同的发育阶段。在每个不同的发育阶段,都会有不同的基因严格按照自己特定的时间顺序开启或关闭,表现为与分化、发育阶段一致的时间性。因此,多细胞生物基因表达的时间特异性又称阶段特异性(stage specificity)。

(二)空间特异性是指多细饱生物个体在特定生长发育阶段,同一基因在不同的组织器官表达不同

在多细胞生物个体某一发育、生长阶段,同一基因产物在不同的组织器官表达水平也可能不同。在个体生长、发育过程中,一种基因产物在个体的不同组织或器官表达,即在个体的不同空间出现,这就是基因表达的空间特异性(spatial specificity)。如编码胰岛素的基因只在胰岛的日细胞中表达,从而指导生成胰岛素;编码肌浆蛋白的基因在成纤维细胞和成肌细胞中几乎不表达,而在肌原纤维中有高水平的表达。基因表达伴随时间或阶段顺序所表现出的这种空间分布差异,实际上是由细胞在器官的分布所决定的,因此基因表达的空间特异性又称细胞特异性(cell specificity)或组织特异性(tiue specificity)。

同一个体内的不同器官、组织、细胞的差异性的基础是特异的基因表达或称为差异基因表达(differential gene expreion)。细胞的基因表达谱(gene expreion profile),即基因表达的种类和强度决定了细胞的分化状态和功能。换言之,在个体内决定细胞类型的不是基因本身,而是基因表达模式(gene expreion pattern)。

三、基因表达的方式存在多样性

不同种类的生物遗传背景不同,同种生物不同个体生活环境不完全相同,不同的基因功能和性质也不相同。因此,不同的基因对生物体内、外环境信号刺激的反应性不同。有些基因在生命全过程中持续表达,有些基因的表达则受环境影响。基因表达调控(regulation of gene ex-preion)就是指细胞或生物体在接受内外环境信号刺激时或适应环境变化的过程中在基因表达水平上做出应答的分子机制,即位于基因组内的基因如何被表达成为有功能的蛋白质(或RNA),在什么组织表达,什么时候表达,表达多少等。按照对刺激的反应性,基因表达的方式或调节类型存在很大差异。358 第三篇

遗传信息的表达

(一)有些基因几乎在所有细胞中持续表达

有些基因产物对生命全过程都是必需的或必不可少的。这类基因在一个生物个体的几乎所有细胞中持续表达,不易受环境条件的影响,或称基本表达。这些基因通常被称为管家基因(house-keeping gene)。例如,柠檬酸循环是一中枢性代谢途径,催化该途径各阶段反应的酶的编码基因就属这类基因。管家基因的表达水平受环境因素影响较小,而是在生物体各个生长阶段的大多数、或几乎全部组织中持续表达,或变化很小。我们将这类基因表达称为基本(或组成性)基因表达(constitutive gene expreion)。基本的基因表达只受启动序列或启动子与RNA聚合酶相互作用的影响,而基本不受其他机制调节。但实际上,基本的基因表达水平并非绝对“一成不变”,所谓“不变”是相对的。

(二)有些基因的表达受到环境变化的诱导和阻通

与管家基因不同,另有一些基因表达很容易受环境变化的影响。随外环境信号变化,这类基因表达水平可以出现升高或降低的现象。

在特定环境信号刺激下,相应的基因被激活,基因表达产物增加,即这种基因表达是可诱导的。可诱导基因(inducible gene)在一定的环境中表达增强的过程称为诱导(induction)。例如在有DNA损伤时,修复酶基因就会在细菌体内被激活,使修复酶被诱导而反应性地增加。

相反,如果基因对环境信号应答时被抑制,这种基因称为可阻遏基因(repreible gene)。可阻遏基因表达产物水平降低的过程称为阻遏(repreion)。例如,当培养基中色氨酸供应充分时,细菌体内与色氨酸合成有关的酶编码基因表达就会被抑制。可诱导或可阻遏基因除受到启动序列或启动子与RNA聚合酶相互作用的影响外,尚受其他机制调节,这类基因的调控序列通常含有针对特异刺激的反应元件。

诱导和阻遏是同一事物的两种表现形式,在生物界普遍存在,也是生物体适应环境的基本途径。乳糖操纵子机制是认识诱导和阻遏表达的经典模型(详见本章第二节)。

(三)生物体内不同墓因的表达受到协调调节

在生物体内,一个代谢途径通常是由一系列化学反应组成,需要多种酶参与;此外,还需要很多其他蛋白质参与作用物在细胞内、外区间的转运。这些酶及转运蛋白等的编码基因被统一调节,使参与同一代谢途径的所有蛋白质(包括酶)分子比例适当,以确街划弋谢途径有条不紊地‘进行。在一定机制控制下,功能上相关的一组基因,无论其为何种表达方式,均需协调一致、共同表达,即为协同表达(coordinate expreion)。这种调节称为协同调节(coordinate regulation)。基因的协调表达体现在多细胞生物体的生长发育全过程。

四、基因表达受顺式作用元件和反式作用因子共同调节

一个生物体的基因组中既有携带遗传信息的基因编码序列,也有能够影响基因表达的调节序列。一般说来,调节序列与被调控的编码序列位于同一条DNA链上,被称为顺式作用元件(cis-acting element)。另外一些调节序列远离被调控的编码序列,实际上是其他分子的编码基因,只能通过其表达产物来发挥作用。这样的调节基因产物不仅能对处于同一条DNA链上的结构基因的表达进行调控,而且还能对不在一条DNA链上的结构基因的表达起到同样的作用。因此,这些蛋白质分子被称为反式作用因子(trans-acting factor)。这些反式作用因子以特定的方式识别和结合在顺式作用元件上,实施精确的基因表达调控。

作为反式作用因子的调节蛋白具有特定的空间结构,通过特异性地识别某些DNA序列与顺式作用元件发生相互作用。例如,DNA双螺旋结构的大沟是调节蛋白最容易与DNA序列发生相互作用的部位。真核生物基因组结构比较复杂,使得有些调节蛋白不能够直接与DNA相互作用,而是首先形成蛋白质一蛋白质的复合物,然后再与DNA结合参与基因表达的调控。蛋白质一DNA以及蛋白质一蛋白质的相互作用是基因表达调控的分子基础。

第十八章 基因表达调控

359

五、基因表达调控呈现多层次和复杂性

无论是原核生物还是真核生物,基因表达调控体现在基因表达的全过程中,即在RNA转录合成和蛋白质翻译两个阶段都有控制其表达的机制。因此基因表达的调控是多层次的复杂过程,改变其中任何环节均会导致基因表达的变化。

首先,遗传信息以基因的形式贮存于DNA分子中,基因拷贝数越多,其表达产物也会越多,因此基因组DNA的部分扩增(amplification)可影响基因表达。在多细胞生物,某一特定类型细胞的选择性扩增可能就是通过这种机制使某种或某些蛋白质分子高表达的结果。为适应某种特定需要而进行的DNA重排(DNA rearrangement),以及DNA甲基化(DNA methylation)等均可在遗传信息水平上影响基因表达。

其次,遗传信息经转录由DNA传向RNA过程中的许多环节,是基因表达调控最重要、最复杂的一个层次。在真核细胞,初始转录产物需经转录后加工修饰才能成为有功能的成熟 RNA,并由细胞核转运至细胞质,对这些转录后加工修饰以及转运过程的控制也是调节某些基因表达的重要方式,例如:对mRNA的选择性剪接,RNA编辑等。近年来,以而RNA为代表的非编码RNA对基因表达调控的作用也日益受到重视,使我们可以在一个新的层面上理解基因表达调控。

蛋白质生物合成即翻译是基因表达的最后一步,影响蛋白质合成的因素同样也能调节基因表达。并且,翻译与翻译后加工可直接、快速地改变蛋白质的结构与功能,因而对此过程的调控是细胞对外环境变化或某些特异刺激应答时的快速反应机制。总之,在遗传信息传递的各个水平上均可进行基因表达调控。

尽管基因表达调控可发生在遗传信息传递过程的任何环节,但发生在转录水平,尤其是转·录起始水平的调节,对基因表达起着至关重要的作用,即转录起始是基因表达的基本控制点。

六、基因表达调控是生物体生长和发育的基础

基因表达是一个非常复杂的过程,尤其在高等真核生物体内。因此对于基因表达的精确调控具有重要的意义。

(一)生物体调节基因表达以适应环境、维持生长和增殖

生物体所处的内、外环境是在不断变化的。所有生物的所有活细胞都必须对内、外环境的变化做出适当反应,以使生物体能更好地适应变化着的环境状态。生物体这种适应环境的能力总是与某种或某些蛋白质分子的功能有关。细胞内某种功能蛋白质分子的有或无、多或少的变化则由编码这些蛋白质分子的基因表达与否、表达水平高低等状况决定。通过一定的程序调控基因的表达,可使生物体表达出合适的蛋白质分子,以便更好地适应环境,维持其生长。

生物体调节基因表达、适应环境是普遍存在的。原核生物、单细胞生物调节基因的表达就是为适应环境、维持生长和细胞分裂。例如,当葡萄糖供应充足时,细菌中与葡萄糖代谢有关的酶编码基因表达增强,其他糖类代谢有关的酶基因关闭;当葡萄糖耗尽而有乳糖存在时,与乳糖代谢有关的酶编码基因则表达,此时细菌可利用乳糖作为碳源,维持生长和增殖。高等生物也普遍存在适应性表达方式。经常饮酒者体内醇氧化酶活性较高即与相应基因表达水平升高有关。

(二)生物体调节基因表达以维持细饱分化与个体发育

在多细胞生物,基因表达调控的意义还在于维持细胞分化与个体发育。在多细胞个体生长、发育的不同阶段,细胞中的蛋白质分子种类和含量变化很大;即使在同一生长发育阶段,不同组织器官内蛋白质分子分布也存在很大差异,这些差异是调节细胞表型的关键。例如,果蝇幼虫(蛹)最早期只有一组“母亲效应基因(maternal effect genes)”表达,使受精卵发生头尾轴和 360 第三篇 遗传信息的传递

背腹轴固定,以后有三组“分节基因”顺序表达,控制蛹的“分节”发育过程,最后这些“节”分别发育为成虫的头、胸、翅膀、肢体、腹及尾等。高等哺乳类动物的细胞分化,各种组织、器官的发育都是由一些特定基因控制的。当某种基因缺陷或表达异常时,则会出现相应组织或器官的发育异常。

第二节

原核基因表达调控

原核生物基因组是具有超螺旋结构的闭合环状DNA分子,在结构上有以下特点:①基因组中很少有重复序列;②编码蛋白质的结构基因为连续编码,且多为单拷贝基因,但编码rRNA的基因仍然是多拷贝基因;③结构基因在基因组中所占的比例(约占50%)远远大于真核基因组;④许多结构基因在基因组中以操纵子为单位排列。此外,原核生物的细胞结构也比较简单,它的基因组的转录和翻译可以在同一空间内完成,并且时间上的差异不大。在转录过程终止之前口丑入A就已经结合在核糖体上,开始了蛋白质的生物合成。

一、操纵子是原核基因转录调控的基本单位

前已述及,大肠杆菌的RNA聚合酶由a亚基(或称a因子)和核心酶构成,其中a亚基的作用是识别和结合在DNA模板上的启动序列,启动转录过程。原核生物在转录水平的调控主要取决于转录起始速度,即主要调节的是转录起始复合物形成的速度。

原核生物大多数基因表达调控是通过操纵子机制实现的。操纵子由结构基因与调控序列组成。结构基因通常包括数个功能上有关联的基因,它们串联排列,共同构成编码区。这些结构基因共用一个启动子和1个转录终止信号序列,因此转录合成时仅产生一条mRNA长链,为几种不同的蛋白质编码。这样的mRNA分子携带了几个多肤链的编码信息,被称为多顺反子(polycistron)mRNA o而调控序列包括启动子、操纵元件(叩erator)以及一定距离外的调节基因。

启动子是RNA聚合酶和各种调控蛋白作用的部位,是决定基因表达效率的关键元件。各种原核基因启动序列特定区域内,通常在转录起始点上游一10及一35区域存在一些相似序列(见第十六章),称为共有序列。E.coli及一些细菌启动序列的共有序列在一10区域是TATAAT,又称Pribnow盒,在一35区域为TTGACA(图18-1)。这些共有序列中的任一碱基突变或变异都会影响RNA聚合酶与启动子的结合及转录起始。因此,共有序列决定启动子的转录活性大小。

操纵元件并非结构基因,而是一段能被特异的阻遏蛋白识别和结合的DNA序列。操纵序列与启动序列毗邻或接近,其DNA序列常与启动子交错、重叠,它是原核阻遏蛋白

第十八章 基因表达与调控

361(repreor)的结合位点。当操纵序列结合有阻遏蛋白时会阻碍RNA聚合酶与启动子的结合,或使RNA聚合酶不能沿DNA向前移动,阻遏转录,介导负性调节。原核操纵子调节序列中还有一种特异DNA序列可结合激活蛋白(activator),结合后RNA聚合酶活性增强,使转录激活,介导正性调节。

调节基因(regulatory gene)编码能够与操纵序列结合的调控蛋白,可以分为三类:特异因子、阻遏蛋白和激活蛋白。这些调控蛋白的作用分别是:①特异因子决定RNA聚合酶对一个或一套启动序列的特异性识别和结合能力;②阻遏蛋白可以识别、结合特异DNA序列—操纵序列,抑制基因转录,所以阻遏蛋白介导负调节(negative regulation)。阻遏蛋白介导的负性调节机制在原核生物中普遍存在;③激活蛋白可结合启动子邻近的DNA序列,提高RNA聚合酶与启动序列的结合能力,从而增强RNA聚合酶的转录活性,是一种正调控(positive regulation)。分解(代谢)物基因激活蛋白(catabolite gene activator protein,CAP)就是一种典型的激活蛋白。有些基因在没有激活蛋白存在时,RNA聚合酶很少或根本不能结合启动子,所以基因不能转录。

特异因子、阻遏蛋白和激活蛋白等原核调节蛋白都是一些DNA结合蛋白。凡是能够诱导基因表达的分子称为诱导剂,而凡是能够阻遏基因表达的分子称为阻遏剂。

二、乳糖操纵子是典型的诱导型调控

操纵子机制在原核基因表达调控中具有普遍意义。大多数原核生物的多个功能相关基因串联在一起,依赖同一调控序列对其转录进行调节,使这些相关基因实现协调表达。以大肠杆菌的乳糖操纵子(lac operon)为例介绍原核生物的操纵子调控模式。乳糖代谢酶基因的表达特点是:在环境中没有乳糖时,这些基因处于关闭状态;只有当环境中有乳糖时,这些基因才被诱导开放,合成代谢乳糖所需要的酶。乳糖操纵子是最早发现的原核生物转录调控模式。

(一)乳枪操纵子的结构

E.coli的乳糖操纵子含Z、Y及A三个结构基因,分别编码p一半乳糖昔酶(p-galactosidase)、通透酶(permease)和乙酞基转移酶(transacetylase),此外还有一个操纵序列0(operator, 0)、一个启动子P(promoter, P)及一个调节基因Io I基因具有独立的启动子(PI),编码一种阻遏蛋白,后者与0序列结合,使操纵子受阻遏而处于关闭状态。在启动子P上游还有一个CAP结合位点。由P序列、0序列和CAP结合位点共同构成乳糖操纵子的调控区,三个酶的编码基因即由同一调控区调节,实现基因产物的协调表达(图18-2)。

(二)乳抢操纵子受到阴沮蛋白和CAP的双盆调节

1.阻遥蛋白的负性调节 在没有乳糖存在时,lac操纵子处于阻遏状态。此时,I序列在PI启动序列作用下表达的Lac阻遏蛋白与0序列结合,阻碍RNA聚合酶与P序列结合,抑制转录启动。阻遏蛋白的阻遏作用并非绝对,偶有阻遏蛋白与0序列解聚。因此,每个细胞中可能会有寥弃数个分子的p一半乳糖昔酶、透酶生成。

当有乳糖存在时,lac操纵子即可被诱导。在这个操纵子体系中,真正的诱导剂并非乳糖本身。乳糖经透酶催化、转运进人细胞,再经原先存在于细胞中的少数卜半乳糖昔酶催化,转变为半乳糖。后者作为一种诱导剂分子结合阻遏蛋白,使蛋白质构象变化,导致阻遏蛋白与0序列解离、发生转录,使p一半乳糖昔酶分子增加可达1000倍。半乳糖的类似物异丙基硫代半乳搪昔(isopropylthiogalactoside, IPTG)是一种作用极强的诱导剂,不被细菌代谢而十分稳定,因此在基因工程领域和分子生物学实验中被广泛应用。

2.CAP的正性调节 CAP是同二聚体,在其分子内有DNA结合区及cAMP结合位点。当培养基中缺乏葡萄糖时,CAMP浓度增高,cAMP与CAP结合,这时CAP结合在loc启动序列附近的CAP位点,可刺激RNA转录活性,使之提高50倍;当有葡萄糖存在时,cAMP浓度降低,cAMP与CAP结合受阻,因此lac操纵子表达下降。362 第三篇 遗传信息的传递

由此可见,对lac操纵子来说CAP是正性调节因素江ac阻遏蛋白是负性调节因素。两种调节机制根据存在的碳源性质及水平协调调节lac操纵子的表达。

3.协同调节

Lac阻遏蛋白负性调节与CAP正性调节两种机制协同合作:当Lac阻遏蛋白封闭转录时,CAP对该系统不能发挥作用;但是如果没有CAP存在来加强转录活性,即使阻遏蛋白从操纵序列上解聚仍几无转录活性。可见,两种机制相辅相成、互相协调、相互制约。由于野生型阮启动子作用很弱,所以CAP是必不可少的。

lac操纵子的负调节能很好地解释在单纯乳糖存在时,细菌是如何利用乳糖作为碳源的。然而,细菌生长环境是复杂的,倘若有葡萄糖或葡萄糖/乳糖共同存在时,细菌首先利用葡萄糖才是最节能的。这时,葡萄糖通过降低CAMP浓度,阻碍cAMP与CAP结合而抑制阮操纵子转录,使细菌只能利用葡萄糖。葡萄糖对Lac操纵子的阻遏作用称分解代谢阻遏(catabolic repres-sion)。lac操纵子强的诱导作用既需要乳糖存在又需缺乏葡萄糖。lac操纵子协同调节机制如图18一所示。

三、色氨酸操纵子通过转录衰减的方式阻遏基因表达

原核生物体积小,受环境影响大,在生存过程中需要以最大限度减少能源消耗,对非必需蛋白质都尽量关闭其编码基因。例如只要环境中有相应的氨基酸供应,大肠杆菌就不会自己去合成,而会将相应氨基酸的合成代谢酶编码基因全部关闭。大肠杆菌色氨酸操纵子(仰。钾ron)就是一个阻遏操纵子。在细胞内无色氮酸时,阻遏蛋白不能与操纵序列结合,因此色氨酸操纵子处于开放状态,结构基因得以表达。当细胞内色氮酸的浓度较高时,色氮酸作为辅阻遏物与阻遏蛋白形成复合物并结合到操纵序列上,关闭色氨酸操纵子,停止表达用于合成色氨酸

第十八章 基因表达调控

363的各种酶。

四、原核基因表达在转录终止阶段有不同的调控机制

大肠杆菌中存在两种主要转录终止机制:只需RNA聚合酶而不需其他蛋白质成分的不依赖Rho因子的转录终止;除RNA聚合酶外需要转录终止因子Rho因子的依赖Rho因子的转录终止(详见第十六章)。

在大肠杆菌存在两种终止调节方式,一种为衰减,另一种为抗终止。前者导致RNA链的过早终止(详见转录与翻译的偶联调节),后者则阻止前者的发生,使下游基因得以表达。

五、原核基因表达在翻译水平的多个环节受到精细调控

与转录类似,翻译一般在起始和终止阶段受到调节,尤其是起始阶段。翻译起始的调节主要靠调节分子,调节分子可直接或间接决定翻译起始位点能否为核糖体所利用。调节分子可以是蛋白质,也可以是RNA.(一)转录与翻译的润联调节提高了基因表达调控的有效性

上述的色氮酸操纵子的有效关闭还有一种属于促进已经开始转录的mRNA合成终止的方式来进一步加强,称为转录衰减(attenuation)。这种作用是利用原核生物中转录与翻译过程偶联进行,翻译时先合成的一段前导序列L来实现的。

前导序列的结构特点及其发挥衰减作用的机制如图18-4所示。前导序列L的结构特点是 364 第三篇

遗传信息的传递

①它可以转录生成一段长度为162bp,内含4个特殊短序列的前导mRNA;②其中序列1有独立的起始和终止密码子,可翻译成为一个有14个氨基酸残基的前导肤,它的第10位和第11位都是色氨酸残基;③序列1和序列2间、序列2和序列3间、序列3和序列4间存在一些互补序列,分别都可以形成发夹结构。形成发卡结构的能力依次是1/2发夹>2/3发夹>3/4发夹;④序列4的下游有一个连续的U序列,是一不依赖于P因子的转录终止信号。

转录衰减的机制是:①色氨酸的浓度较低时,前导肤的翻译因色氮酸量的不足而停滞在第10/11的色氮酸密码子部位,核糖体结合在序列1上,因此前导mRNA倾向于形成2/3发夹结构,转录继续进行;②色氮酸的浓度较高时,前导肤的翻译顺利完成,核糖体可以前进到序列2,因此发夹结构在序列3和序列4形成,连同其下游的多聚U使得转录中途终止,表现出转录的衰减。原核生物这种在色氮酸浓度高时,通过阻遏作用和转录衰减机制共同关闭基因表达的方式,保证了营养物质和能t的合理利用。

前导序列发挥了随色氮酸浓度升高而降低转录的作用,故将这段序列称为衰减子(attenua-for)。在仰操纵子中,阻遏蛋白对结构基因转录的负调控起到粗调的作用,而衰减子起到精调的作用。细菌中其他氛基酸合成系统的操纵子(如phe, his, leu, thr等)中也有类似的衰减调控机制。

(二)蛋白质分子结合于启动子或启动子周圈进行自我调节

无论是单顺反子还是多顺反子mRNA,许多体系应用了类似的机制,即调节蛋白结合mRNA靶位点,阻止核糖体识别翻译起始区,从而阻断翻译的机制。调节蛋白一般作用于自身mRNA,抑制自身的合成,因而这种调节方式称自我控制(sutogenous control)o细菌mRNA起始密码子上游约10个核昔酸之前的SD序列与16S rRNA序列互补的程度以及从起始密码子AUG到嗓岭.片段的距离也都强烈地影响翻译起始的效率(详见第十七章)。不同基因的mRNA有不同的SD

第十八章

基因表达调控

365 序列,它们与16S rRNA的结合能力也不同,从而控制着单位时间内翻译过程中起始复合物形成的数目,最终控制着翻译的速度。

(三)翻译阴遏利用蛋白质与自身mRNA的结合实现对翻译起始的调控

翻译起始与转录起始相类似,也受调节蛋白的作用,但与转录不同,RNA在翻译起始过程中有重要的作用。编码区的起始点可与调节分子(蛋白质或RNA)直接或间接地结合来决定翻译起始。在此调控机制中,调节蛋白可以结合到起始密码子上,阻断与核糖体的结合。例如S8是组成核糖体小亚基的一个蛋白质,可以与16S rRNA的茎环结构结合;15是组成核糖体大亚基的一个蛋白质,它的mRNA的5'末端也能形成一个与16S rRNA的茎环结构相类似的结构。因此,S8也能与15的mRNA结合。当16S rRNA含量充足时,可以与所有的S8蛋白结合,不影响功蛋白的合成;而当16S rRNA含量不足时,多余的S8则与IS mRNA结合,阻遏15蛋白质的合成,防止15合成过量。

(四)反义RNA结合mRNA翻译起始部位互补序列以调节翻译起始

此外,在一些细菌和病毒中还存在一类调节基因,能够转录产生反义RNA(antisense RNA)。反义RNA含有与特定mRNA翻译起始部位互补的序列,通过与mRNA杂交阻断30S小亚基对起始密码子的识别及与SD序列的结合,抑制翻译起始。这种调节称为反义控制(antisense con-trol)。反义RNA的调节作用具有非常重要的理论意义和实际意义。

(五)mRNA密码子的编码频率形响翻译速度

遗传密码表显示,除色氨酸和甲硫氨酸外,其他的氨基酸都有2个或2个以上的遗传密码子。有些是使用频率较高的常用密码子,而有些则是使用频率较低的稀有密码子。当基因中的密码子是常用密码子时,mRNA的翻译速度快,反之,mRNA的翻译速度慢。大肠杆菌dnaG基因是引物酶的编码基因,含有较多的稀有密码子,使得mRNA的翻译速度缓慢,防止引物酶合成过多。

第三节

真核基因表达调控

原核细胞的基因表达调控机制已经十分复杂,与之相比,真核生物的基因组结构要复杂得多,加之个体内细胞间广泛存在的信号通讯网络,其基因表达调控的多样性和复杂性远非原核生物所能比拟。

一、真核细胞基因表达特点

多细胞真核生物的基因表达调控具有以下特点:①真核基因组比原核基因组大得多;②原核基因组的大部分序列都为编码基因,而哺乳类基因组中只有10%的序列编码蛋白质rRNA,tRNA等,其余900k的序列,包括大量的重复序列功能至今还不清楚,可能参与调控;③真核生物编码蛋白质的基因是不连续的,转录后需要剪接去除内含子,这筑增加了基因表达调控的层次;④原核生物的基因编码序列在操纵子中,多顺反子mRNA使得几个功能相关的基因自然协调控制;而真核生物则是一个结构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),许多功能相关的蛋白、即使是一种蛋白的不同亚基也将涉及多个墓因的协调表达;⑤真核生物DNA在细胞核内与多种蛋白质结合构成染色质,这种复杂的结构直接影响着基因表达;⑥真核生物的遗传信息不仅存在于核DNA上,还存在线粒体DNA上,核内基因与线粒体基因的表达调控既相互独立而又孺要协调。

由于真核基因组的这些特点,真核基因表达的调控过程较原核生物要复杂许多(图18-5)。该过程包括了染色质激活、转录起始、转录后修饰、转录产物的细胞内转运、翻译起始、翻译后修饰等多个步骤。在上述过程的每一个环节都可以对基因表达进行千预,从而使得基因表达调控 366 第三篇

遗传信息的传递

呈现出多层次和综合协调的特点。但是,转录起始的调控是基因表达调控的较为关键的环节。

二、染色质结构与真核基因表达密切相关

以染色质形式组装在细胞核内的DNA所携带的遗传信息表达直接受到染色质结构的制约。当基因被激活时,可观察到染色质相应区域发生某些结构和性质变化,这些具有转录活性的染色质被称为活性染色质(active chromatin)。

(一)转录活化的染色质对核酸酶极为故感

当染色质活化后,常出现一些对核酸酶(如DNase I)高度敏感的位点,称之超敏位点(场-persensitive site)。超敏位点通常位于被活化基因的5'侧翼区1kp内,但有时也会在更远的5’侧翼区或3'侧翼区出现一些超敏位点。这些转录活化区域是缺乏或没有核小体结合的“裸露”DNA链。

(二)转录活化染色质的组蛋白发生改变

转录活跃区域的染色质中的组蛋白的特点是:①富含赖氨酸的Hl组蛋白含量降低;)H2A-HZB组蛋白二聚体的不稳定性增加,使它们容易从核小体核心中被置换出来;③核心组蛋白H3、H4可发生乙酞化、磷酸化以及泛素化等修饰。这些都使得核小体的结构变得松弛而不稳定,降低核小体对DNA的亲和力,易于基因转录。

在真核细胞中,核小体是染色质的主要结构元件,四种组蛋白(H2A,H2B,H3和H4各2个分子)组成的八聚体构成核小体的核心区(core particle),其外面盘绕着DNA双螺旋链。每个组蛋白的氨基端都会伸出核小体外,形成组蛋白尾巴(图18-6)o这些尾巴可以形成核小体间相互作用的纽带,同时也是发生组蛋白修饰的位点。这些修饰包括对组蛋白中富含的赖氨酸、精氮酸、组氨酸等带有正电荷的碱性氨基酸进行的乙酞化、磷酸化和甲基化等修饰过程。

一般来说,乙酞化修饰能够中和组蛋白尾巴上碱性氨基酸残基的正电荷,减弱组蛋白与带有负电荷的DNA之间的结合,选择性地使某些染色质区域的结构从紧密变得松散,有利于转录因子与DNA的结合,从而开放某些基因的转录,增强其表达水平。而组蛋白甲基化通常不会在整体上改变组蛋白尾巴的电荷,但是能够增加其碱性度和疏水性,因而增强其与DNA的亲和力。乙酞化修饰和甲基化修饰都是通过改变组蛋白尾巴与DNA之间的相互作用发挥基因表达

第十八章

基因表达调控

367

调控的功能,而乙酞化修饰和甲基化修饰往往又是相互排斥的。组蛋白的磷酸化修饰在细胞有丝分裂和减数分裂期间染色体浓缩以及基因转录激活过程中发挥重要的调节作用。

组蛋白乙酞化、磷酸化和甲基化修饰对染色质结构和功能的影响总结于表18-1。此外,组蛋白修饰还包括泛素化修饰和ADP一核糖基化。各种不同修饰的效应可能是协同的,也可能是相反的;可能是同时发生,也可能是在不同时刻;修饰的组蛋白底物可能相同,也可能不同。组蛋白修饰对于基因表达影响的机制也包括两种相互包容的理论,即组蛋白的修饰直接影响染色质或核小体的结构,以及化学修饰募集了其他调控基因转录的蛋白质,为其他功能分子与组蛋

368 第三篇 遗传信息的传递

白结合搭建了一个平台。这些理论构成了“组蛋白密码”的假说。当然,组蛋白修饰对基因表达调控的研究还刚刚开始,许多问题仍有待于解决。

发挥组蛋白共价修饰作用的一些蛋白质分子,如组蛋白乙酞化酶(histone acetyltransferase,HAT)和组蛋白去乙酞化酶(histone deacetylase, HDAC),在DNA水平的基因表达调控中具有重要作用。HAT使组蛋白发生乙酞化,促使染色质结构松弛,有利于基因的转录,被称为转录辅激活因子(co-activator),而HDAC促进组蛋白的去乙酞化,抑制基因的转录,被称为转录辅抑制因子(co-repreor)。

(三)CpG岛甲基化水平降低

DNA甲基化是真核生物在染色质水平控制基因转录的重要机制。真核基因组中胞嚓吮的第5位碳原子可以在DNA甲基转移酶(DNA methyltransferase)的作用下被甲基化修饰为5一甲基胞啥吮,并且以序列CG中的胞啥陡甲基化更加常见。但是这些甲基化胞啥咤在基因组中并不是均匀分布,有些成簇的非甲基化CG存在于整个基因组中,人们将这些GC含量可达60%,长度为300一3000bp的区段称作CpG岛(CpG island)。CpG岛主要位于基因的启动子和第一外显子区域,约有60%以上基因的启动子含有CpG岛。业已发现处于转录活跃状态的染色质中,CpG岛的甲基化程度下降,例如管家基因的CpG岛中胞嗜吮甲基化水平较低。CpG岛的高甲基化促进染色质形成致密结构,因而不利于基因表达。

染色质结构对基因表达的影响可以遗传给子代细胞,其机制是细胞内存在着具有维持甲基化作用的DNA甲基转移酶,可以在DNA复制后,依照亲本DNA链的甲基化位置催化子链DNA在相同位置上发生甲基化。这种现象称为表观遗传(epigenetic inheritance)。这种遗传信息不是蕴藏在DNA序列中,而是通过对染色质结构的影响及基因表达变化而实现的。表观遗传对基因表达的调控不仅体现在DNA甲基化上,组蛋白的乙酞化、甲基化以及非编码小RNA的调控等都属于表观遗传调控的范畴。

三、基因组中的顺式作用元件是转录起始的关键调节部位

与原核细胞一样,转录起始是真核生物基因表达调控的关键,但是真核生物的基因转录起始过程比原核细胞的复杂得多。这是因为真核生物的RNA聚合酶需要与多个转录因子相互作用,才能完成转录起始复合物的装配,装配速度决定着基因表达的水平。

绝大多数真核基因调控机制几乎普遍涉及编码基因两侧的DNA序列—顺式作用元件。顺式作用元件是指可影响自身基因表达活性的DNA序列(图18-7)。真核生物基因组中每一个基因都有各自特异的顺式作用元件。顺式作用元件通常是非编码序列,但是并非都位于转录起始点上游。根据顺式作用元件在基因中的位置、转录激活作用的性质及发挥作用的方式,可将真核基因的这些功能元件分为启动子、增强子及沉默子等。

(一)真核生物启动子结构和调节远较原核生物复杂

真核生物不同基因的启动子序列间的一致性不像原核生物那样明显,而且RNA聚合酶与DNA的结合需要多种蛋白质因子的相互协调作用。因此,真核生物的启动子序列要比原核生物的复杂得多、序列也更长。

真核生物启动子一般包括转录起始点及其上游约100~200bp序列,包含有若干具有独立功能的DNA序列元件,每个元件约长7一30bpo启动子包括至少一个转录起点以及1个以上的功能组件。在这些功能组件中最具典型意义的就是TATA盒,它的共有序列是TATAAAA(见第十三章)。TATA盒通常位于转录起始点上游一25--30bp区域,控制转录起始的准确性及频率。TATA盒是基本转录因子TFI1D的结合位点。除TATA盒外,GC盒(GGGCGG)和CART盒(GC-CART)也是很多基因中常见的功能组件。此外,还发现很多其他类型的功能组件。由TATA盒及转录起始点即可构成最简单的启动子。典型的启动子则由TATA盒及上游的CART盒和

第十八章

基因表达调控

369

(或)GC盒组成,这类启动子通常具有一个转录起始点及较高的转录活性。

然而,还有很多启动子并不含TATA盒,这类启动子分为两类:一类为富含GC的启动子,最初发现于一些管家基因,这类启动子一般含数个分离的转录起始点,并有数个转录因子Spl结合位点,对基本转录活化有重要作用;另一类启动子既不含TATA盒,也没有GC富含区,这类启动子可有一个或多个转录起始点,大多转录活性很低或根本没有转录活性,而是在胚胎发育、组织分化或再生过程中受调节。

真核生物有三种RNA聚合酶,它们分别结合在三类不同的启动子上负责转录不同的RNA(详见第十三章和第十六章)。

(二)增强子是一种能够提高转录效率的顺式调控元件

增强子的长度大约是200bp,可使旁侧的基因转录效率提高100倍或更多。增强子也是由若干功能组件组成,有些功能组件既可在增强子、也可在启动子中出现。这些功能组件是特异转录因子结合DNA的核心序列。增强子的核心组件常为8-12bp,可以单拷贝或多拷贝串连的形式存在。增强子和启动子常交错覆盖或连续。在酵母,有一种类似高等真核增强子样作用的序列,称为上游激活序列(upstream activator sequence, UAS),其在转录激活中的作用方式与增强子类似。增强子的功能及其作用特征如下: 1.增强子与被调控基因位于同一条DNA链上,属于顺式作用元件。

2.增强子是组织特异性转录因子的结合部位,当某些细胞或组织中存在能够与之相结合的特异转录因子时方能表现括性。

3.增强子不仅能够在基因的上游或下游起作用,而且还可以远距离实施调节作用(通常情况为1一4kb),个别情况下甚至可以调控30kb以外的基因。

4.增强子作用与序列的方向性无关。将增强子的方向倒置后依然能起作用,而方向倒置后的启动子就不能起作用。

5.增强子需要有启动子才能发挥作用,没有启动子存在,增强子不能表现活性。但增强子对启动子没有严格的专一性,同一增强子可以影响不同类型启动子的转录。

(三)沉默子能移抑制基因的转录

沉默子是一类基因表达的负性调控元件,当其结合特异蛋白因子时,对基因转录起阻遏作 370

第三篇

遗传信息的传递

用,最初在酵母中发现。已有的证据显示沉默子与增强子类似,其作用亦不受序列方向的影响,也能远距离发挥作用,并可对异源基因的表达起作用。

四、转录因子是转录调控的关键分子

真核基因的转录调节蛋白又称转录调节因子或转录因子(transcription factor, TF)。绝大多弓数真核转录调节因子由其编码基因表达后,进人细胞核,通过识别、结合特异的顺式作用元件而,增强或降低相应基因的表达。转录因子也被称为反式作用蛋白或反式作用因子。

如本章第一节所述,这些反式作用因子的编码基因与其作用的靶基因之间不存在结构的关联,而顺式作用元件则是在结构上与靶基因串联连接在一起。这种来自于一个基因编码的蛋白质对另一基因的调节作用称为反式激活或反式抑制作用。真核生物转录调控的基本方式就是}反式作用因子对顺式作用元件的识别与结合,即通过DNA一蛋白质的相互作用实施调控。并不是所有真核转录调节蛋白都起反式作用,也有些基因产物可特异识别、结合自身基因的调节序列,调节自身基因的开启或关闭,这就是顺式调节作用。具有这种调节方式的调节蛋白称为顺式作用蛋白(图18-8)。

依据功能特性,可将转录因子分为通用转录因子(general transcription factor)和特异转录因子伽拌cial transcription factor)两大类。

(一)通用转录因子

这些转录因子是RNA聚合酶介导基因转录时所必需的一类辅助蛋白质,帮助聚合酶与启动子结合并起始转录,对所有基因都是必需的。有人将其视为RNA聚合酶的组成成分或亚基,故又称为基本转录因子。正如第十六章中所述,通用转录因子TF II D是由TBP和TAFs组成的复合物。TBP支持基础转录但是不支持诱导所致的增强转录。而TF11D中的TAF日对诱导引起的增强转录是必要的。因此又将TAFs称为辅激活因子(co-activators)。人类细胞中至少有12种TAFs,TF 11 D复合物中不同TAFs与TBP的结合可能结合不同启动子,这可以解释这些因子

第十八章

基因表达调控

371 在各种启动子中的选择性活化作用以及对特定启动子存在不同的亲和力。中介子(mediator)也是在反式作用因子和RNA聚合酶之间的蛋白质复合体,它与某些反式作用因子相互作用,同时能够促进TFIIH对RNA聚合酶梭基端结构域的磷酸化。有时将中介子也归类于辅激活因子。通用转录因子的存在没有组织特异性,因而对于基因表达的时空选择性并不重要。

(二)特异转录因子

这些转录因子为个别基因转录所必需,决定该基因表达的时间空间特异性,故称特异转录因子。此类特异因子有的起转录激活作用,有的起转录抑制作用。前者称转录激活因子(tran-scription activator),后者称转录抑制因子(transcription inhibitor)。

转录激活因子通常是一些增强子结合蛋白(enhancer binding protein,EBP);多数转录抑制因子是沉默子结合蛋白,但也有抑制因子以不依赖DNA的方式起作用,而是通过蛋白质一蛋白质相互作用“中和”转录激活因子或TFI1D,降低它们在细胞内的有效浓度,抑制基因转录。

框18-2关键转录因子可以改变一个细胞的命运

2006年日本京都大学S.Yamanaka课题组在《细胞》杂志上报道了诱导多能干细胞的研究。他们把Oct3/4, Sox2 , c-Myc和Klf4这四种转录因子的基因克隆入病毒载体,然后引入小鼠成纤维细胞,发现可诱导细胞核重新编程并使细胞发生转化,产生的细胞在形态、基因表达、表观遗传修饰状态、细胞倍增能力、类胚体和崎形瘤生成能力、分化能力等方面都与胚胎干细胞相似,因此称其为诱导多能干细胞(induced pluripotent stem cell, iPScell)。2007年11月S.Yamanaka课题组和美国的J.Thompson实验室几乎同时报道,利用这种技术诱导人的皮肤纤维细胞成为iPS细胞。2012年10月8日,S.Yamanaka与英国发育生物学家J.B.Gurdon因在细胞核重新编程研究领城的杰出贡献而获得诺贝尔生理学/医学奖。

因为在不同的组织或细胞中各种特异转录因子分布不同,所以基因表达状态、方式不同。这些组织特异性的转录因子才真正决定着细胞基因的时间、空间特异性表达。特异性转录因子自身的含量、活性和细胞内定位随时都受到细胞所处环境的影响,是使环境变化在基因表达水平得到体现的关键分子。组织特异性转录因子在细胞分化和组织发育过程中具有重要作用。例如,胚胎干细胞的分化方向在相当大的程度上是由细胞内转录因子的种类所决定。阐明各种组织细胞所特有的转录因子种类,就有可能控制细胞的分化方向。诱导多能干细胞(inducedpluripotent stem cell, iPS)的建立说明关键转录因子可以改变一个细胞的命运。科学家们仅用四个转录因子就可以使终末分化的皮肤成纤维细胞转变成为类似于胚胎干细胞样的具有多向分化能力的细胞。

此外,还有与启动子上游元件如GC盒、CART盒等顺式作用元件结合的蛋白质,称为上游因子(upstream factor),如SPl结合到GC盒上,C/EBP结合到CHAT盒上。这些反式作用因子调节通用转录因子与TATA盒的结合、RNA聚合酶与启动子的结合及起始复合物的形成,从而协助调节基因的转录效率。

与远隔调控序列如增强子等结合的反式作用因子有很多。可诱导因子(inducible factor)是与增强子等远端调控序列结合的转录因子。它们能结合应答元件,只在某些特殊生理或病理情况下才被诱导产生,如MyoD在肌细胞中高表达HIF-1在缺氧时高表达。与上游因子不同,可诱导因子只在特定的时间和组织中表达而影响转录。RNA聚合酶II与启动子的结合、启动转录需要多种蛋白质因子的协同作用。这通常包括:可诱导因子或上游因子与增强子或启动子上游元件的结合;通用转录因子在启动子处的组装;辅激活因子和(或)中介子在通用转录因子或 372 第三篇

遗传信息的传递

RNA聚合酶B复合物与可诱导因子、上游因子之间的辅助和中介作用。因子和因子之间互相辨认、结合,以准确地控制基因是否转录、何时转录。应该指出的是,上游因子和可诱导因子等在广义上也可称为转录因子,但一般不冠以TF的词头而各有自己特殊的名称。

(三)转录因子作用的结构特点 大多数转录因子是DNA结合蛋白,至少包括两个不同的结构域:DNA结合域(DNA bindingdomain)和转录激活域(activation domain);此外,很多转录因子还包含一个介导蛋白质一蛋白质相互作用的结构域,最常见的是二聚化结构域。

1.转录因子的DNA结合结构城主要有以下几种

(1)锌指模体(zinc finger)结构是一类含锌离子的形似手指的蛋白模体。每个重复的“指”状结构约含23个氛基酸残基,形成1个。一螺旋和2个反向平行的p一折盛的二级结构。每个卜折亚上有1个半脱氮酸(Cys)残基,而a一螺旋上有2个组氨酸(His)或半胧氮酸(Cys)残基。这4个氮基酸残基与二价锌离子之间形成配位键(图18-9)。整个蛋白质分子可有多个这样的锌指重复单位。每一个单位可将其指部伸人DNA双螺旋的大沟内,接触5个核昔酸。例如与GC盒结合的人成纤维细胞转录因子SP1中就有3个锌指重复结构。

(2)碱性螺旋一环一螺旋(basic helix-loop-helix, bHLH)模体结构至少有两个a一螺旋,由一个短肤段形成的环所连接,其中一个a一螺旋的N一末端富含碱性氨基酸残基,是与DNA结合的结合域(图18-10)。bHLH模体通常以二聚体形式存在,而且两个a一螺旋的碱性区之间的距离大约与DNA双螺旋的一个螺距相近(3.4nm),使两个a一螺旋的碱性区刚好分别嵌人DNA双螺旋的大沟内。(3)碱性亮氨酸拉链(basic leucine zipper, bZIP)模体结构的特点是在蛋白质C一末端的氮基酸序列中,每隔6个氨基酸是一个疏水性的亮氨酸残基。当C一末端形成a一螺旋结构时,肤链每旋转两周就出现一个亮氨酸残基,并且都出现在。一螺旋的同一侧。这样的两个肤链能以疏水力结合成二聚体,形同拉链一样(图18-11)。该二聚体的N一末端是富含碱性氨基酸的区域,可以借助其正电荷与DNA骨架上的磷酸基团结合。

2.转录因子的转录激活结构域

不同的转录因子具有不同的转录激活结构域,根据氨基酸的组成特点,转录激活结构域可分为三类:(1)酸性激活结构域(acidic activation domain)是一段富含酸性氨基酸的保守序列,常形成带负电荷的p一折盈,通过与TFIID的相互作用协助转录起始复合物的组装,促进转录。如醉母转录因子GAL4的转录激活域。

第十八章

基因表达的调控

373

(2)谷氨酷胺富含结构域(glutamxne-rich domain)的N一末端的谷氮酞胺残基含量可高达25%左右,通过与“盒结合发挥转录激活作用。

(3)脯氨酸富含结构城(proline-rich domain)的C床端的脯纸酸残基含量可高达20%-30%,通过与CAAT盒结合来激活转录。

(四)二报化是常见的资白质·受白质相互作用方式

介导蛋白质一蛋白质相互作用最常见的结构域是二聚化结构域。二聚化作用与bZIP的亮氮酸拉链、bHLH的螺旋一环.螺旋结构有关。

以上介绍的各种转录因子的功能结构形式都是最典型、最常见的。此外尚有一些独特的结构形式。

五、转录起始复合物的动态构成是转录调控的主要方式

DNA元件与调节蛋白对转录激活的调节最终是由RNA聚合酶活性体现的,其中的关键环节是转录起始复合物的形成。真核生物有三种RNA聚合酶,分别负贵催化生成不同的RNA分 374

第三篇

遗传信息的传递

子(详见第十六章)。其中RNA Pol II参与转录生成所有mRNA前体及大部分snRNAs。参与RNA Pol 11转录起始的DNA调控序列及转录因子要复杂得多,以满足RNA Pol 11转录成千上万种处于不同表达水平的基因的需要。

(一)启动子与RNA聚合醉活性

与原核启动子一样,真核启动子也是由转录起始点、RNA聚合酶结合位点及控制转录活性的调节元件组成。启动子的核昔酸序列会影响其与RNA聚合酶的亲和力,而亲和力大小则直接影响转录起始的频率。但是,真核RNA聚合酶单独存在时与启动子的亲和力极低或无亲和力,必须与基本转录因子形成复合物才能与启动子结合。因此,对真核RNA聚合酶活性来说,除启动子序列,尚与所存在的转录调节因子有关。

(二)调节蛋白与RNA双合醉活性

真核RNA聚合酶11不能单独识别、结合启动子,而是先由基本转录因子与RNA聚合酶B形成一个功能性的转录前起始复合物。在几种基本转录因子中,TFIID是唯一具有位点特异的DNA结合能力的因子,在上述有序的组装过程中起关键性指导作用。这样形成的前起始复合物’尚不稳定,也不能有效启动mRNA转录。在迂回折叠的DNA构象中,结合了增强子的转录激活因子与前起始复合物中的TBP接近,或通过特异的TAF与TBP联系,形成稳定的转录起始复合物(图18-12)。此时,RNA聚合酶11才能真正启动mRNA转录。TAF也是细胞特异的,与转录激活因子共同决定组织特异性转录。

也正是由于这些基本转录因子和特异性转录因子决定了RNA聚合酶11的活性,这些调节蛋白的浓度与分布将直接影响相关基因的表达。如前所述,特异性转录因子的表达具有时间或 空间特异性,因此,由它们所参与组成的转录起始复合物也将呈现一种动态变化。

六、转录后调控主要影响真核mRNA的结构与功能

真核生物的基因表达调控在转录后层次不同于原核生物。这一方面是由于两者的转录产物的剪接、修饰等成熟加工过程有很大的差异,另一方面是由于真核生物的RNA产物要被运送至细胞质中去执行功能,其稳定性如何以及其降解过程都可以影响基因表达的最终结果。

(一)mRNA的稳定性影晌真核生物基因表达

mRNA是蛋白质生物合成的模板,因此它的稳定性将直接影响到基因表达最终产物的数量,是转录后对基因表达进行调控的一个重要因素。真核生物mRNA分子的半衰期差别很大,有的可长达数十小时以上,而有的则只有几十分钟或更短。一般而言,半衰期短的功RNA多编码调节蛋白,因此,这些蛋白的水平可以随着环境的变化而迅速变化,达到调控其他基因表达的第十八章 基因表达调控

375 目的。影响细胞内mRNA稳定性的因素很多,主要有下面几点:

1.5'-端的帽子结构可以增加mRNA的稳定性

该结构可以使得mRNA免于在5'一核酸外切酶的作用下被降解,从而延长了mRNA的半衰期。此外,帽子结构还可以通过与相应的帽子结合蛋白结合而提高翻译的效率,并参与mRNA从细胞核向细胞质的转运。

2.3'-端的poly(A)尾结构防止mRNA降解

Poly(A)及其结合蛋白可以防止3'-核酸外切酶降解mRNA,增加mRNA的稳定性。如果3‘一端poly(A)被去除,mRNA分子将很快降解。此外,3'-poly(A)尾结构还参与了翻译的起始过程。实验证明,mRNA的胞质定位信号有些也位于3'一非翻译序列上。组蛋白mRNA没有3'-poly(A)尾的结构,但它的3‘一端会形成一种发夹结构,使其免受核酸酶的攻击。一些mRNA的3’非翻译区存在一个约50核昔酸长的AU富含序列(AU-rich sequence, ARE)区,可以与ARE结合蛋白结合,促使poly(A)核酸酶切除poly(A)尾,使mRNA降解(见第十六章)。因此含有ARE区的mRNA通常都不稳定。

RNA无论是在核内进行加工、由胞核运至胞质,还是在胞质内停留(至降解),都是通过与蛋白质结合形成核蛋白颗粒(ribonucleopmtein, RNP)进行的。mRNA运输、在胞质内的稳定性等均与某些蛋白质成分有关。

所有类型RNA分子中,mRNA寿命最短。mRNA稳定性是由合成速率和降解速率共同决定的(见第十六章)。大多数高等真核细胞mRNA半衰期较原核为长,一般为几个小时。mRNA的半衰期可影响蛋白质合成的量,通过调节某些功RNA的稳定性,即可使相应蛋白质合成量受到一定程度的控制。例如,mRNA 5’末端的帽子结构和3‘末端的尾结构的删除可直接影响mRNA的稳定性。

蛋白质产物也可调节mRNA的降解,如铁转运蛋白受体(transferrin receptor, TfR)mRNA的降解速率受胞质内某些蛋白质成分的调节,并与mRNA自身结构有关。当细胞内铁足量时,TfRmRNA降解速度加快,致使TfR水平很快下降。当细胞内铁不足时,TfR mRNA稳定性增加,受体蛋白合成增多。TfR mRNA稳定性的调节取决于mRNA分子中特定的重复序列,它位于3'UTR,称为铁反应元件(iron response element,IRE)。每个IRE大约30bp长,可形成柄一环结构,环上有5个特异的核昔酸,并富含A-U序列。当铁浓度高时,A-U富含序列通过目前尚不得知的机制促进TfR mRNA降解;当铁浓度下降时,一种IRE结合蛋白(IRE-binding protein, IRE-BP)通过识别环的特异序列及柄的二级结构结合IRE。IRE-BP的结合可能破坏了某些机制对TfRmRNA的降解作用,使TfR mRNA的寿命延长。这一发现提示,其他稳定性可调节的mRNA可能也含有与特异蛋白质相互作用的反应元件,致降解速率变慢。

(二)一些非编码小分子RNA可引起转录后基因沉默

与原核基因表达调节一样,某些小分子RNA也可调节真核基因表达。这些RNA都是非编码RNA(noncoding RNA,ncRNA)。除了我们在前几章谈到过的具有催化活性的RNA(核酶)、细胞核小分子RNA(snRNA)以及核仁小分子RNA(snoRNA)以外,目前人们广泛关注的非编码RNA有miRNA和siRNA。小分子RNA对基因表达的调节十分复杂,将在真核基因表达在翻译及翻译后调控部分再做阐述。

(三)mRNA前体的选择性剪接可以调节真核生物基因表达

真核生物基因所转录出的mRNA前体含有交替连接的内含子和外显子。通常状态下,mRNA前体经过剔除内含子序列后成为一个成熟的mRNA,并被翻译成为一条相应的多肤链。但是,参与拼接的外显子可以不按照其在基因组内的线性分布次序拼接,内含子也可以不完全被切除,由此产生了选择性剪接(见第十六章)。选择性剪接的结果是由同一条mRNA前体产生了不同的成熟mRNA,并由此产生了完全不同的蛋白质。这些蛋白质的功能可以完全不同,显示了基因调控对生物多样性的决定作用。值得指出的是,被切除的内含子是否具有功能目前成为 376 第三篇

遗传信息的传递

研究的热点。有学者认为:内含子是在进化中出现或消失的,其功能可能是有利于物种的进化;选择。例如细菌丢失了内含子,可以使染色体变小和复制速度加快。真核生物保留内含子,则叫可以产生外显子移动,有利于真核生物在适应环境改变时能合成功能不同而结构上只有微小差异的蛋白质。但也有学者认为内含子具有基因表达调控的功能。例如:现在已知道某些遗传性;疾病,其变异是发生在内含子而不在外显子。有些内含子在调控基因表达的过程中起作用,有{些内含子还编码核酸内切酶或含有微RNA序列等。

七、真核基因表达在翻译及翻译后仍可受到调控

蛋白质生物合成过程复杂,涉及众多成分。通过调节许多参与成分的作用可使基因表达在翻译水平以及翻译后阶段得到控制。在翻译水平上,目前发现的一些调节点主要在起始阶段和延长阶段,尤其是起始阶段。如对起始因子活性的调节、Met-tRNA叫与小亚基结合的调节、mRNA与小亚基结合的调节等。其中通过磷酸化作用改变起始因子活性这一点备受关注。.mRNA与小亚基结合的调节对某些mRNA的翻译控制也具有重要意义。近年来,包括小分子_RNA在内的非编码RNA对基因表达调控的影响成为新的研究热点。

(一)对翻译起始因子活性的调节主要通过麟酸化修饰进行 1 .翻译起始因子eIF-2a的磷酸化抑制翻译起始

蛋白质合成速率的快速变化在很大程度上取决于起始水平,通过磷酸化调节真核翻译起始因子(eukaryotic initiation factor, eIF)的活性对起始阶段有重要的控制作用。eIF一主要参与起始Met-tRNAi的进位过程,其。亚基的活性可因磷酸化(cAMP依赖性蛋白激酶所催化)而降低,导致蛋白质合成受到抑制。如血红素对珠蛋白合成的调节就是由于血红素能抑制cAMP依赖性蛋白激酶的活化,从而防止或减少了eIF一的失活,促进了蛋白质的合成。在病毒感染的细胞中,细胞抗病毒机制之一即是通过双链RNA(double-stranded RNA, dsRNA)激活一种蛋白激酶,使eIF-2。磷酸化,从而抑制蛋白质合成的起始。

2.eIF-4E及eIF-4E结合蛋白的磷酸化激活翻译起始

帽结合蛋白eIF-4E与mRNA帽结构的结合是翻译起始的限速步骤,磷酸化修饰及与抑制物蛋白的结合均可调节eIF-4E的活性。磷酸化的eIF-4E与帽结构的结合力是非磷酸化的eIF-4E的4倍,因而可提高翻译的效率。胰岛素及其他一些生长因子都可增加eIF-4E的磷酸化从而加快翻译,促进细胞生长。同时,胰岛素还可以通过激活相应的蛋白激酶而使一些与eIF-4E结合的抑制物蛋白磷酸化,磷酸化后的抑制物蛋白会与eIF-4E解离,激活eIF-4E o

(二)RNA结合蛋白参与了对.译起始的调节

所谓RNA结合蛋白(RNA binding protein, RBP),是指那些能够与RNA特异序列结合的蛋白质。基因表达的许多调节环节都有RBP的参与,如前述转录终止、RNA剪接、RNA转运、RNA胞质内稳定性控制以及翻译起始等。铁蛋白相关基因的mRNA翻译调节就是RBP参与基因表达调控的典型例子。

如前所述.IRE结合蛋白(IRE-BP)作为特异RNA结合蛋白,在调节铁转运蛋白受体(TfR)mRNA稳定性方面起重要作用。同时,它还能调节另外两个与铁代谢有关的蛋白质的合成,这两种蛋白质是铁蛋白和s氨基,酮戊酸(ALA)合酶。铁蛋白与铁结合,是体内铁的贮存形式,ALA合酶是血红素合成的限速酶。与TfR mRNA不同,IRE位于铁蛋白及ALA合酶mRNA的5'UTR,而且无A-U富含区,不促进mRNA降解。当细胞内铁浓度低时,IRE-BP处于活化状态,结合IRE而阻碍40S小亚基与功mm'端起始部位结合,抑制翻译起始;铁浓度偏高时,IRE-BP不能与IRE结合,两种mRNA的翻译起始可以进行。

(三)对.译产物水平及活性的调节可以快速调控基因表达

新合成蛋白质的半衰期长短是决定蛋白质生物学功能的重要影响因素。因此,通过对

第十八章

基因表达调控

377 新生肤链的水解和运输,可以控制蛋白质的浓度在特定的部位或亚细胞器保持在合适的水平。此外,许多蛋白质需要在合成后经过特定的修饰才具有功能活性。通过对蛋白质的可逆的磷酸化、甲基化、酞基化修饰,可以达到调节蛋白质功能的作用,是基因表达的快速调节方式。

(四)小分子RNA对舀因表达的调节十分汉杂.miRNA miRNA是一大家族,属小分子非编码单链RNA,长度约22个碱基,由一段具有发夹环结构的前体加工后形成。编码miRNA的基因与编码蛋白质的基因一样,转录合成是由RNA聚合酶B负责催化的。

它们在细胞内首先形成长度为70一90个碱基的单链RNA前体(pre-miRNA),再经一种称为Dicer酶的RNA酶进行剪切后形成。这些成熟的miRNA与其他蛋白质一起组成RNA诱导的沉默复合体(RNA-induced silencing complex,RISC),通过与其靶mRNA分子的3‘端非翻译区域(3'UTR)互补匹配,再以目前尚不清楚的机制抑制该口RNA分子的翻译。

最早被确认的miRNA是1993年在线虫中发现的lin-4。这种单链RNA的表达具有阶段性,通过碱基配对的方式结合到靶功RNA lin-14的3'UTR,从而抑制lin-14的翻译,但并不影响其转录。2000年,另一个促进线虫幼虫向成虫转变的基因let一被发现,它的转录产物为21个碱基RNA分子,也具有明显的阶段表达特异性,对线虫的发育具有重要的调控作用。

miRNA具有一些鲜明的结构与功能特点:①其长度一般为20一25个碱基,个别也有20个碱基以下的报道;②在不同生物体中普遍存在,包括线虫、果蝇、家鼠、人及植物等;③其序列在不同生物中具有一定的保守性,但是尚未发现动植物之间具有完全一致的miRNA序列;④具有明显的表达阶段特异性和组织特异性;⑤miRNA基因以单拷贝、多拷贝或基因簇等多种形式存在于基因组中,而且绝大部分位于基因间隔区。miRNA的广泛性和多样性提示它们可能具有非常重要的生物学功能。

378

第三篇 遗传信息的传递

2.siRNA

干扰小RNA(siRNA)是细胞内的一类双链RNA(double-stranded RNA,dsRNA),在特定情况下通过一定酶切机制,转变为具有特定长度(21一23个碱基)和特定序列的小片段RNA。

双链siRNA参与RISC组成,与特异的靶mRNA完全互补结合,导致靶mRNA降解,阻断翻·译过程。这种由siRNA介导的基因表达抑制作用被称为RNA干扰(RNA interference, RNAi)(图18-13)。

RNAi实际上是通过降解特异'mRNA、在转录后水平发生的一种基因表达调节机制,是生物体本身固有的一种对抗外源基因侵害的自我保护现象。它能识别、清除外源dsRNA或同源单链RNA,提供了一种防御外源核酸人侵的保护措施。同时,由于外源dsRNA导人细胞后也可以引起与dsRNA同源的mRNA降解,进而抑制其相应的基因表达,RNAi又被作为一种新技术广泛应用于功能基因组研究中。通常认为,siRNA及其介导的RNAi具有很高的特异性,但也有报道显示siRNA序列中一个或几个碱基的改变并不影响siRNA的活性。

框18-3 RNA干扰现象的发现

科学家们最早在植物中发现了dsRNA诱导的RNA沉蔽现象。1995年,S.Guo和K.Kemphues在线虫中利用反义RNA技术特异性地F-WT Par-I基因的表达的同时,在对照实验中给线虫注射正义RNA以期观察到基因表达的增强。但发现二者都同样抑制了par-1基因的表达。A.Fire和C.C.Mello等后来通过实验阐明了这一反常现象:将反义RNA和正义RNA同时注射到秀丽隐杆线虫(Caenorhabditis elegans)比单独注射反义RNA或正义RNA能够更有效的诱导基因沉蔽。由此推断,反义RNA和正义RNA形成的dsRNA触发了高效的基因沉默机制并极大降低了靶mRNA水平。这一现象被称为RNA干扰(RNAinterference, RNAi)。1998年,他们将其研究成果发表在浑碗“、期刊上。这一发现揭示了双链RNA基因剪切的原理。为此,A.Fire和C.C.Mello荣获2006年度诺贝尔生理学/医学奖。

siRNA和miRNA都属于非编码小分子RNA,它们具有一些共同的特点:均由Dicer切割产生;长度都在22个碱基左右;都与RISC形成复合体,与mRNA作用而引起基因沉默。它们之间的差异见表18一2。

(五)长链非编码RNA在基因表达调控中的作用不容忽视

长链非编码RNA(IncRNA)是一类转录本长度超过200个核昔酸的RNA分子,不直接参与基因编码和蛋白质合成,但是可在表观遗传水平、转录水平和转录后水平调控基因的表达。尽管我们目前对IncRNA的种类、数量、功能都不明确,但InCRNA在很多生命活动中发挥了举足轻

第十八章

基因表达调控

379 重的作用,与机体的生理和病理过程均有密切的关系,因此对IncRNA的研究成为当今分子生物学最热门的前沿研究领域之一。

从上述内容中我们可以看到,蛋白质、特别是组蛋白的修饰对基因表达调控的影响虽然是显而易见,但是真正的作用机制仍有待于揭示。长久以来,人们一直关注着编码RNA,却突然发现非编码RNA也有着重要的作用。因此,全面了解非编码RNA的时空表达谱及生物学意义的"RNA组学”应运而生;人们也只有在对核酸(DNA和RNA)和蛋白质进行了全面深人的研究之后,才有可能破解生命之谜。

小结

基因表达就是墓因转录及翻译的过程。个体内不同细胞的基因表达具有严格时空特异性,这种特异性由特异基因的启动子(序列)和(或)增强子与调节蛋白相互作用决定。

基因表达的方式有组成性表达及诱导/阻遏之分。某些基因产物对生命全过程都是必需的或必不可少的。这类墓因在一个生物个体的几乎所有细胞中持续表达,称为管家墓因;另有一些基因表达随外环境信号变化:有些基因对环境信号应答时被激活,墓因表达产物增加,这种基因表达方式称为诱导;有些基因对环境信号应答时被抑制,墓因表达产物水平降低,这种基因表达方式称为阻遏。

基因表达调控是在多级水平上进行的复杂事件。其中,转录起始是基因表达的基本控制点。基因转录激活调节基本要素涉及DNA序列、调节蛋白以及这些因素对RNA聚合酶活性的影响。

大多数原核基因调控通过操纵子机制实现。E.coli的乳糖操纵子的Z,Y及A三个结构墓因在缺乏乳糖时,可借助阻遏蛋白结合于操纵序列而被关闭,又可因乳糖的存在失去阻遏能力而开放。CAP与调控区结合位点的结合可进一步提高乳糖操纵子的转录效率。色氨酸操纵子存在一类特殊的衰减调控作用,可使RNA的转录提前终止。

真核基因表达调控的某些机制与原核存在明显差别。处于转录激活状态的染色质结构会发生明显变化,如对核酸酶敏感,DNA碱基的甲墓化修饰和组蛋白的乙鱿化、甲基化或磷酸化修饰改变等。

真核基因转录激活受顺式作用元件与反式作用因子相互作用调节。顺式作用元件按功能特性分为启动子、增强子及沉默子。真核基因启动子就是决定RNA聚合酶转录起始位点的DNA序列。增强子是远离转录起始点、决定基因的时间空间特异性表达、增强启动子转录活性的DNA序列,其发挥作用的方式通常与方向、距离无关。

真核转录因子可分为基本转录因子和特异转录因子。基本转录因子是RNA聚合酶结合启动子所必需的一组蛋白质,决定三种RNA(tRNA,mRNA及rRNA)转录的类别。特异转录因子通过结合相应的调节序列而激活或阻遏相应基因的转录。所有墓因的转录调节都涉及包括RNA聚合酶在内的转录起始复合物的形成。真核生物RNA转录后的加工修饰、翻译起始蛋白的活性、mRNA分子的寿命、mRNA的5'一非翻译区以及3忆非翻译区结构都会影响细胞蛋白质合成的速度。此外,miRNA和长链非编码RNA对真核基因表达调控的影响也日益受到重视。380 第三篇 遗传信息的传递

思考题

1,何谓基因表达?基因表达有哪些方式,其特点或规律走什么? 2..何谓顺式作用元件?顺式作用元件在基因表达调控中有何作用? 3.真核生物染色质活化有哪些主委表现?.何谓反式作用因子?简述真核生物转录因子的基本结构及作用。

5.何谓反义RNA,微RNA,干扰小RNA,长链非编码RNA和RNA干扰?

(周春燕)

《19第十八章 基因表达调控.docx》
将本文的Word文档下载,方便收藏和打印
推荐度:
19第十八章 基因表达调控
点击下载文档
相关专题 第18章基因表达调控 十八章 基因 第18章基因表达调控 十八章 基因
[其他范文]相关推荐
    [其他范文]热门文章
      下载全文