Novagen公司出品的pET系列载体是目前应用最为广泛的原核表达系统,已经成功地在大肠杆菌中表达了各种各样的异源蛋白。pET系列载体是利用大肠杆菌T7噬菌体转录系统进行表达的载体。
T7噬菌体具有一套专一性非常强的转录体系,利用这一体系中的元件为基础构建的表达系统称为T7表达系统。T7噬菌体基因编码的T7RNA聚合酶选择性的激活T7噬菌体启动子的转录。它是一种高活性的RNA聚合酶,其合成mRNA的速度比大肠杆菌RNA聚合酶快5倍左右,并可以转录某些不能被大肠杆菌RNA聚合酶有效转录的序列。在细胞中存在T7RNA聚合酶和T7噬菌体启动子的情形下,大肠杆菌宿主本身基因的转录竞争不过T7噬菌体转录体系,最终受T7噬菌体启动子控制的基因的转录能达到很高的水平。
T7噬菌体启动子的转录完全依赖于T7 RNA聚合酶,因此T7RNA聚合酶的转录调控模式就决定了表达系统的调控方式。噬菌体DE3是λ噬菌体的衍生株,一段含有lacⅠ,lacUV5启动子和T7RNA聚合酶基因的DNA片段插入其int基因中,用噬菌体DE3的溶源菌,如BL21(DE3)、HMS174(DE3)等作为表达载体的宿主菌,调控方式为化学信号诱导型,类似于Lac表达系统。
从开始涉及表达的时候可以根据是否要用基因本身的起始密码子进行选择,Novagen公司仅提供三个载体:pET-21(+),pET-24(+)和pET-23(+)。如果你打算利用载体的起始密码子,那么就有许多选择:根据是否要可溶性表达,选择加有不同标记的载体。一般说来在大肠杆菌中不加标记外源蛋白都会以不溶的包涵体形式表达。为了让外源蛋白融合表达一般说来有三个策略:
1:与一个高度可溶的多肽联合一起表达,比如:谷胱甘肽S转移酶(glutathione S transferase,GST)、硫氧还蛋白(thioredoxin, Trx)和N利用质A(Nutilization substance A, NusA)。
2:转入一个酶催化二硫键的形成,如:硫氧还蛋白,DsbA,DsbC。
3:插入一个定位到周质空间的信号序列。
不同载体提供不同的标记,有的可以同时带有多个标记。如果你不希望在蛋白的N末端加入任何的多肽,你也可以选择用NdeⅠ直接从起始密码子后插入外源片断,或者在得到表达产物后利用蛋白氨基酸的酶切位点把多余的多肽切除。在重组技术上,Novagen除了传统的酶切、连接方式外,还有不需要连接的克隆方式:Ligation-independentcloning,简称LIC。采用LIC方法的pET载体是线性化的,在末端有12-15个突出的碱基以在退火时和目的片断互补。在设计PCR扩增引物时加入与LIC载体互补的序列,PCR产物用3’→5’的内切酶消化出单链与载体互补的序列。通过这种方式就可以把目的片断定向、高效地插入LIC载体上。
一般的pET载体是先在不含DE3片段的菌株中进行克隆筛选,之后再把阳性克隆转化进入表达菌株,如BL21(DE3)中,通过IPTG诱导进行表达。而pETcoco载体它引入了低拷贝控制元件,F附加体上的oriS和repE元件与parABC共同作用下使质粒在细菌中保持单拷贝,这样即可以使质粒在细菌内稳定存在又可以减少外源蛋白对细胞的毒害作用。当我们需要大量表达时加入树胶醛醣诱导trfA基因表达,质粒在细胞内的拷贝数就可以增加到25-50。pETcoco载体同时兼容了DE3调控模型,在加入IPTG后诱导表达量达升高2500倍。在保证质粒稳定性这一点上除了pETcoco的方法还有另一种方法就是将重组质粒转化进入含有T7RNA聚合酶抑制剂的T7溶菌酶表达基因的菌株中,在含有pLysS的pLysE宿主菌内重组质粒的本底表达被进一步抑制,质粒可以更稳定地存在。
Novagen提供多种表达使用的菌株,为了提高表达量做出了各种改造,它们大致分为以下几个种类:
1:蛋白酶缺陷型:所有B菌株的衍生株都是lon蛋白酶和ompT蛋白酶缺陷型的,这包括有B834,BL21,BLR,Origami,Rosetta和Tuner。因此在纯化时可以保持蛋白的稳定不被降解。BL21(DE3)是应用最多的表达的表达菌株。另外它的衍生株BLR(DE3)是recA-,RecA是大肠杆菌中介导同源重组的重要蛋白之一。它的缺失,可以保证质粒的稳定。
2:保证所有细胞以同样量进行表达:Tuner株及它的衍生株(Origami 和Rosetta)是BL21菌株的lacY1缺失突变型,在这些菌株中可以使蛋白以同样水平在所有细胞中表达。Lac渗透酶的突变使进入每个细胞的IPTG量都是一致的,这样使蛋白表达浓度可以随着IPTG浓度而改变。通过对IPTG浓度的控制可以使细胞微量表达或者大量表达。一般说来,低浓度表达有利于蛋白的可溶性和活性。
3:二硫键形成与溶解性增强二硫键的形成对某些蛋白的可溶性起到重要的作用,而Novagen也专门设计了一些菌株是谷胱甘肽还原酶(gor)和/或硫氧还蛋白还原酶(trxB)缺陷型的,包括AD494,BL21trxB,Origami,
OrigamiB和Rosetta-gami。在这些菌株中表达蛋白,可以更大程度促进二硫键的形成,并使蛋白以可溶形式和有活性形式出现的可能增加。
4:稀有密码子的补给不同物种有不同的密码子偏爱性,如果外源蛋白中含大量大肠杆菌的稀有密码子,特别当这些稀有密码子呈连续分布的时候,就会造成蛋白表达量极低,或者翻译提前终止。Rosetta是为了表达真核蛋白而特别设计的,它含有大肠杆菌稀有的密码子tRNA,包括AUA,AGG,AGA,CUA,CCC和GGA。它们以氯霉素抗性的质粒形式存在。Rosetta系列是来自BL21lacY1,所以它具有BL21lacY1的所有特性。
5:硒蛋氨酸标记B834是来源于BL21的蛋氨酸(met)营养缺陷型菌株。它在高度特异活性35S-met标记和晶体成像蛋氨酸标记中非常有用。
我们常用的培养基有LB、TB、M9、M9ZB,LB因为其成本低廉所以应用最为广泛,而Novagen有提供特殊的培养基OvernightExpress" AutoinductionSystem。使用这种培养基不需要按照传统方法先培养一段时间再加IPTG进行诱导,它可以直接进行过夜培养。在这种培养基中含有痕量金属,可以满足合成蛋白时对金属的需求。同时提供除了各种氨基酸,这其中蛋氨酸是另外加入的。这样培养基可以满足细菌生长的各种需求,使细菌密度更高;可以自动诱导无需自己加IPTG;使蛋白更加容易溶于培养基中;并且如果需要的话,可以对蛋氨酸进行硒标记。同时,Novagen还有表达双外源蛋白的载体pCDFDuet-1DNA 、pETDuet"-1 DNA 、pRSFDuet-1DNA。这些载体含有两个不同多克隆位点,可以插入两个外源蛋白基因,利用单独的T7启动子,乳糖操纵子和核糖体结合位点进行表达。载体转化进入合适的菌株中最多可以同时表达8个外源蛋白。人们合成与生物相关的物质是从尿素开始的,1828年,德国化学家维勒人工合成了存在于生物体的这种有机物。在1960年我国科学家采用化学方法首次成功地合成了具有生物活性的蛋白质——胰岛素。随着内切酶的发现和基因工程技术的发展,人们发现用各种不同的载体在原核、真核系统中进行蛋白表达更为行之有效。而这其中大肠杆菌表达系统发展得最为迅速、成熟。原核表达具有操作方便、快捷,需时较短,表达量大,适合工业化生产等优点。虽然也有缺少糖基化和表达后加工等问题,当有了其它多种表达系统后,原核系统仍是我们合成外源蛋白的首选。
在网上看到有人把原核表达技术分成四个等级:初次尝试扫盲、乱棍打枣入门、系统优化中级和自成一体高手,觉得十分有意思。但是根据笔者自己的经验以及耳闻目睹的一些经历告诉我:做表达,那是谋事在人,成事在天。有时候你把克隆做出来了,双酶切鉴定没问题,测序没问题,可是就是看不到表达带。原因当然可以分析,实验也是可以改进,但是窜改一下戈尔泰的话:“成功的实验都是一样的,失败的实验各有各的不幸。”在实验遇到瓶颈的时候要如何进行分析,找到问题的症结是我们的实验关键所在。在准备进行原核表达的时候需要考虑的因素很多,市面上可供选择的载体、菌株也很多,要如何进行正确的选择,找到适合自己的载体是十分重要的。首先来一些大肠杆菌表达的基本概念:一个完整的表达系统通常包括配套的表达载体和表达菌株,如果是特殊的诱导表达还包括诱导剂,如果是融合表达还包括纯化系统或者Tag检测等等。选择表达系统通常要根据实验目的来考虑,比如表达量高低,目标蛋白的活性,表达产物的纯化方法等等。主要归结在表达载体的选择上。
表达载体:我们关心的质粒上的元件包括启动子,多克隆位点,终止密码,融合Tag(如果有的话),复制子,筛选标记/报告基因等。通常,载体很贵,我们可以通过实验室之间交换得到免费的载体。但是要小心,辗转多个实验室和多个实验室成员之手的载体是否保持原来的遗传背景?MCS是否还是原来那个MCS?是我们要特别注意的。
复制子:通常表达载体都会选用高拷贝的复制子。pSC101类质粒是严谨方式复制,拷贝数低,pCoE1,pMBI(pUC)类的复制子的拷贝数高达500以上,是表达载体常用的。通常情况下质粒拷贝数和表达量是非线性的正相关,当然也不是越多越好,超过细胞的承受范围反而会损害细胞的生长。如果碰巧需要2个质粒共转化,就要考虑复制元是否相容的问题。
筛选标记和报告基因:氨苄青霉素抗性是最常见的筛选标记,卡那霉素或者是新霉素次之,通常是另一个载体的筛选标记用。四环素,红霉素和氯霉素等已经日渐式微。抗性基因的选择要注意是否会对研究对象产生干扰,比如代谢研究中要留意抗性基因编码的酶是否和代谢物相互作用。在表达筛选中要注意的问题应该就是LB倒板前加抗生素的温度,温度过高容易导致抗生素失效。
对于做表达来说,如果不是要研究启动子的强弱,通常比较少关心或者用到报告基因吧。绿色荧光蛋白是最常用的报告基因了(注意选择适用原核表达版本的GFP),其他还有半乳糖苷酶啊,荧光素酶啊等等。一些融合表达Tag也有报告基因的功能。
启动子、终止子和核糖体结合位点
启动子:启动子的强弱是对表达量有决定性影响的因素之一。从转录模式上看有组成型表达和诱导调控型表达。lac和Tac,PL和PR,T7是最常用的启动子。组成型表达:表达载体的启动子为组成型启动子,也就是一直努力不停表达目的蛋白的启动子,如pMAL系统。持续性表达通常表达量比较高,成本低,但是不适合表达一些对宿主细菌生长有害的蛋白。因为过量或者有害的表达产物会影响细菌的生长,反过来影响表达量的积累。
诱导调控型表达:表达载体采用诱导型启动子,只有在诱导剂存在的条件下才能表达目的产物。这种方法有助于避免菌体生长前期高表达对菌体生长的影响,又可减少菌体蛋白酶对目标产物的降解。特别适合解决有毒蛋白的表达。另外也有启动子是组成型的,但是启动子所依赖的转录酶是诱导表达的,也属于诱导表达系统。
融合表达:表达载体的多克隆位点上有一段融合表达标签(Tag),表达产物为融合蛋白(有分N端或者C端融合表达),方便后继的纯化步骤或者检测。对于特别小的分子建议用较大的Tag(如GST)以获得稳定表达;而一般的基因多选择小Tag以减少对目的蛋白的影响。His-Tag是最广泛采用的Tag。
分泌表达:在起始密码和目的基因之间加入信号肽,可以引导目的蛋白穿越细胞膜,避免表达产物在细胞内的过度累积而影响细胞生长,或者形成包涵体,而且表达产物是可溶的活性状态不需要复性。通常这种分泌只是分泌到细胞膜和细胞壁之间的周质空间。
可溶性表达:大肠杆菌表达效率很高,特别是强启动子,目的蛋白来不及折叠而形成不溶的包涵体颗粒,包涵体容易纯化但是复性效率不高。分泌表达可以得到可溶的产物,也有部分融合Tag有助于提高产物的可溶性,比如Thio,pMAL系统。
转录终止子对外源基因在大肠杆菌中的高效表达有重要作用——控制转录的RNA长度提高稳定性,避免质粒上异常表达导致质粒稳定性下降。放在启动子上游的转录终止子还可以防止其他启动子的通读,降低本底。转录终止子有两类,Rho因子作用下使转录终止mRNA和根据模版上的对称序列形成发夹结构而终止mRNA。常见的是rrnBrRNA操纵子的T1T2串连转录终止子。
核糖体结合位点:启动子下游从转录起始位点开始延伸的一段碱基序列,其中能与rRNA16S亚基3'端互补的SD序列对形成翻译起始复合物是必需的,多数载体启动子下游都有SD序列,也有些载体没有,适合自带SD序列的基因表达,要留意。
表达菌株:我们往往最容易忽视的一点。不同的表达载体对应有不同的表达菌株。一些特别设计的菌株更有助于解决一些表达难题。
几个常用的启动子和诱导调控表达系统
最早应用于的表达系统是Lac乳糖操纵子,由启动子Plac + 操纵基因lacO +结构基因组成。其转录受CAP正调控和lacI负调控。lacUV5突变能够在没有CAP的存在下更有效地起始转录,该启动子在转录水平上只受lacI的调控,因而随后得到了更广泛采用。lacI产物是一种阻遏蛋白,能结合在操纵基因lacO上从而阻遏转录起始。乳糖的类似物IPTG可以和lacI产物结合,使其构象改变离开lacO,从而激活转录。这种可诱导的转录调控成为了大肠杆菌表达系统载体构建的常用元件。tac启动子是trp启动子和lacUV5的拼接杂合启动子,且转录水平更高,比lacUV5更优越。trc启动子是trp启动子和lac启动子的拼合启动子,同样具有比trp更高的转录效率和受lacI阻遏蛋白调控的强启动子特性。在常规的大肠杆菌中,lacI阻遏蛋白表达量不高,仅能满足细胞自身的lac操纵子,无法应付多拷贝的质粒的需求,导致非诱导条件下较高的本底表达,为了让表达系统严谨调控产物表达,能过量表达lacI阻遏蛋白的lacIq突变菌株常被选为Lac/Tac/trc表达系统的表达菌株。现在的Lac/Tac/trc载体上通常还带有lacIq基因,以表达更多lacI阻遏蛋白实现严谨的诱导调控。IPTG广泛用于诱导表达系统,但是IPTG有一定毒性,有人认为在制备医疗目的的重组蛋白并不合适,因而也有用乳糖代替IPTG作为诱导物的研究。另外一种研究方向是用lacI的温度敏感突变体,30度下抑制转录,42度开发。热诱导不用添加外来的诱导物,成本低,但是由于发酵过程中加热升温比较慢而影响诱导效果,而且热诱导本身会导致大肠杆菌的热休克蛋白激活,一些蛋白酶会影响产物稳定。
以λ噬菌体再起转录启动子PL、PR构建的载体也为大家所熟悉。这两个强启动子受控于λ噬菌体cI基因产物。cI基因的温度敏感突变体cI857(ts)常常被用于调控PL、PR启动子的转录。同样也是30度下阻遏启动子转录,42度下解除抑制开发转录。同样的,PL、PR表达载体需要携带cI857(ts)菌株作为表达载体,现在更常见的做法是在载体上携带cI857(ts)基因,所以可以有更大的宿主选择范围。另外一种思路是通过严谨调控cI产物来间接调控PL、PR启动子的转录。比如Invitrogen的PL表达系统,就是将受trp启动子严谨调控的cI基因溶源化到宿主菌染色体上,通过加入酪氨酸诱导抑制trp启动子,抑制cI基因的表达,从而解除强大的PL启动子的抑制。
T7启动子是当今大肠杆菌表达系统的主流,这个功能强大兼专一性高的启动子经过巧妙的设计而成为原核表达的首选,尤其以Novagen公司的pET系统为杰出代表。强大的T7启动子完全专一受控于T7RNA 聚合酶,而高活性的T7 RNA聚合酶合成mRNA的速度比大肠杆菌RNA聚合酶快5倍——当二者同时存在时,宿主本身基因的转录竞争不过T7表达系统,几乎所有的细胞资源都用于表达目的蛋白;诱导表达后仅几个小时目的蛋白通常可以占到细胞总蛋白的50%以上。由于大肠杆菌本身不含T7RNA 聚合酶,需要将外源的T7 RNA 聚合酶引入宿主菌,因而T7 RNA聚合酶的调控模式就决定了T7系统的调控模式——非诱导条件下,可以使目的基因完全处于沉默状态而不转录,从而避免目的基因毒性对宿主细胞以及质粒稳定性的影响;通过控制诱导条件控制T7RNA 聚合酶的量,就可以控制产物表达量,某些情况下可以提高产物的可溶性部分。有何高招?且看生物通为你一一道来:
有几种方案可用于调控T7 RNA 聚合酶的合成,从而调控T7表达系统。
1:噬菌体DE3是lambda噬菌体的衍生株,含有lacI抑制基因和位于lacUV5启动子下的T7 RNA聚合酶基因。DE3溶源化的菌株如BL21(DE3)就是最常用的表达菌株,构建好的表达载体可以直接转入表达菌株中,诱导调控方式和lac一样都是IPTG诱导。
2:另一种策略是用不含T7RNA聚合酶的宿主菌克隆目的基因,即可完全避免因目的蛋白对宿主细胞的潜在毒性而造成的质粒不稳定。然后用λCE6噬菌体侵染宿主细胞——CE6是lambda噬菌体含温度敏感突变(cI857ts)和pL/pR启动子控制T7RNA 聚合酶的衍生株,在热诱导条件下可以激活T7 RNA 聚合酶的合成。
此了噬菌体之外,还可以通过共转化质粒提供T7 RNA聚合酶。比如有人用受溶氧浓度控制的启动子调控T7 RNA 聚合酶合成,据说这比较适合工业化发酵的条件控制。
由于T7 RNA聚合酶的调控方式仍有可能有痕量的本底表达,控制基础表达的手段之一是培养基外加葡萄糖,有助于控制本底表达水平。2.是采用带有T7lac启动子的载体——在紧邻T7 启动子的下游有一段lacI操纵子序列编码表达lac 阻遏蛋白(lacI),lac阻遏蛋白可以作用于宿主染色体上T7 RNA 聚合酶前的lacUV5 启动子并抑制其表达,也作用于载体T7 lac启动子,以阻断任何T7 RNA聚合酶导致的目的基因转录。pLacI工转化也是同样的原理。
如果这还不够,更为严谨调控手段还有——在宿主菌中表达另一个可以结合并抑制T7RNA聚合酶的基因——T7融菌酶,降低本底。常用的带溶菌酶质粒有pLysS和pLysE,相容的ori都不会影响后继的表达质粒转化,前者表达的溶菌酶的水平要比后者低得多,对细胞生长影响小,而pLysE会明显降低宿主菌的生长水平,容易出现过度调节,增加蛋白表达的滞后时间,从而降低表达水平。
通过几种不同方法来巧妙调控T7聚合酶合成,T7启动子发展出了史上功能最强大,最丰富的表达系统。生物通在下面首先进行主流表达系统介绍:了解各种产品的特色,是选择合适的表达系统的关键哦。优化基因表达的关键因素之:基因的重新设计和合成
密码子最佳化(codon optimization)
遗传密码有64种,但是绝大多数生物倾向于利用这些密码子中的一部分。那些被最频繁利用的称为最佳密码子(optimalcodons),那些不被经常利用的称为稀有或利用率低的密码子(rare or low-usagecodons)。实际上用做蛋白表达或生产的每种生物(包括大肠杆菌,酵母,哺乳动物细胞,Pichia,植物细胞和昆虫细胞)都表现出某种程度的密码子利用的差异或偏爱。大肠杆菌、酵母、果蝇、灵长类等每种生物都有独特的8个密码子极少被利用[1]。有趣的是,灵长类和酵母有6个同样的利用率低的密码子。大肠杆菌、酵母和果蝇中编码丰度高的蛋白质的基因明显避免低利用率的密码子。因此,重组蛋白的表达可能受密码子利用的影响(尤其在异源表达系统中)的事实并不很奇怪。你的基因利用的密码子可能不是你正在利用的蛋白生产系统进行高水平表达所偏爱的密码子,这种情况是可能的。利用偏爱密码子(preferredcodons)并避免利用率低的或稀有的密码子可以合成基因,基因的这种重新设计叫密码子最佳化。
在同源表达系统中,同较低水平表达的基因相比,较高表达的基因可能有很不同的密码子偏爱。通过对密码子利用的归类分析,人们可以真正预测任何基因在酵母中的表达水平[2]。在诸如Zeamays的其他生物中,大量高表达基因强烈偏爱以G或C结尾的密码子[3]。而且,在Dictyostelium中,同低水平表达的基因比较,高表达基因有较大数目的偏爱密码子。
在大肠杆菌中表达哺乳动物基因是不可预测和具有挑战的。例如直到最近才实现了人血红蛋白的过表达[5]。为了达到血红蛋白的好的表达水平,Alpha-球蛋白cDNA不得不用大肠杆菌偏爱的密码子进行重新合成。在异源宿主中实现象血红蛋白这样复杂的蛋白质的过表达可能需要最佳化密码子,这些研究者为此提供了令人信服的资料。成簇的低利用率的密码子抑制了核糖体的运动,这是基因不能以合适水平表达的一个明显机制。核糖体翻译由九个密码子组成的信使(含几个低利用率密码子或全部为低利用率密码子)时的运动速度要比翻译不含低利用率密码子的同样长的信使的速度慢。即使低利用率密码子簇位于3’端,信使最后也会被核糖体”拥挤”而损害,核糖体又回到5’端。3’端低利用率密码子簇的抑制效应可以和全部信使都由低利用率密码子组成的抑制效应一样大。如果低利用率密码子簇位于5’端,其效应是起始核糖体数目的全面减少,导致蛋白合成中信使的低效率。散在分布的稀有密码子对翻译的效应还未很好地研究,但是有证据表明这种情况的确对翻译效率有负面效应[6]。
其他因素也可以影响蛋白表达,包括使mRNA去稳定的序列。重新设计合成基因可以去除或改变这些序列,导致高水平表达。消除稀有密码子、去除任何去稳定序列和利用最佳密码子的基因的重新设计都可能增加蛋白产量,使的蛋白生产更有效和经济。
翻译终止效率
蛋白表达水平受许多不同因素和过程影响。蛋白稳定性、mRNA稳定性和翻译效率在蛋白生产和积累中起主要作用。翻译过程分为起始、延伸和终止三个期。对于翻译的起始,原核mRNA需要5’端非翻译前导序列中有一段叫Shine-Dalgarno序列的特异核糖体结合序列。在真核细胞,有效的起始依赖于围绕在起始密码子ATG上下游的一段叫Kozak序列的序列。密码子利用或偏爱对延伸有深刻的影响。例如,如果mRNA有很多成簇的稀有密码子,这可能对核糖体的运动速度造成负面影响,大大减低了蛋白表达水平。翻译终止是蛋白生产必须的一步,但其对蛋白表达水平的影响还没有被研究清楚。但是最近的科学研究表明终止对蛋白表达水平有很大的影响。总的来说,更有效的翻译终止导致更好的蛋白表达。
绝大多数生物都有偏爱的围绕终止密码子的序列框架[7]。酵母和哺乳动物偏爱的终止密码子分别是UAA和UGA。单子叶植物最常利用UGA,而昆虫和大肠杆菌倾向于用UAA。翻译终止效率可能受紧接着终止密码子的下游碱基和紧靠终止密码子的上游序列影响。在酵母中通过改变围绕终止密码子的局部序列框架,翻译终止效率可能被减低几个100倍[8]。对于UGA和UAA,紧接着终止密码子的下游碱基对有效终止的影响力大小次序为G>U,A>C;对于UAG是U、A>C>G。
对于大肠杆菌,翻译终止效率可因终止密码子及临近的下游碱基的不同而显著不同,从80%(UAAU)到7%(UGAC)[9]。对于UAAN和UAGN系列,终止密码子下游碱基对翻译的有效终止的影响力大小次序为U>G>A、C。UAG极少被大肠杆菌利用,相比UAAN和UGAN,UAG表现了有效的终止,但其后的碱基对有效终止的影响力为G>U,A>C。对于哺乳动物,偏爱的终止密码子为UGA,其后的碱基可以对invivo翻译终止有8倍的影响(A、G>>C、U)。对于UAAN系列,invivo终止效率可以有70倍的差别,UGAN系列为8倍[10]。如果终止密码子附近序列没有最佳化,可能发生明显增加的翻译通读,因此减少了蛋白表达。例如,在兔网状细胞无细胞翻译系统里,UGAC的翻译通读可以高达10%,而第四个碱基如果为A,G或C,翻译通读为<1%。
总的来说,翻译起始框架、翻译终止序列框架和密码子利用应该仔细选择,以利于蛋白的最高水平表达。翻译终止序列框架能几倍地改变蛋白生产水平。真核细胞中的异源蛋白表达
异源蛋白质在细菌中表达是目前使用的主要的蛋白生产系统。大肠杆菌一直是最经济的系统之一。然而为了生产需要特异修饰、胞外分泌或有特异折叠需要的蛋白质,其他表达系统也是需要的。真核细胞在表达原核来源的基因、真核基因的cDNA拷贝或其他无内含子的基因时可能表现很多特异问题。富含AT的基因在很多真核细胞中表达时会遭遇很剧烈的障碍。主要的真核信号序列如加poly-A的位点、酵母转录终止位点和真核mRNA去稳定序列都是富含AT的。内含子序列也趋向于富含AT,尽管他们有参与剪切过程的很特异的识别序列。虽然绝大多数原核基因没有剪切或聚腺苷过程,但这些真核过程需要的保守序列可能存在于原核基因中,因此当这些基因在真核细胞中表达时可能引起特异的问题。而且诸如哺乳动物和单子叶植物细胞的特异真核表达系统可能不能有效地表达无内含子的基因。
真核mRNA在离开细胞核进而在胞浆的核糖体上被翻译前需要特异的处理和修饰。这些过程包括去除内含子、5’端甲基化帽子形成和3’端加poly-A。内含子去除需要5’剪切位点、G75/G100U100A65AG65U保守序列、3’剪切位点、富含密啶NC66A100G100/G56保守序列和C72T98R77A100Y75保守序列[12]。有效的加poly-A和mRNA剪切需要一个由两个部分组成的信号:加poly-A保守序列AAUAAA和在切割位点内的50个碱基的富含GT的序列。酵母真核转录终止序列(几个不同的富含AT序列,如含TTTTTATA[13],TATATA,TACATA,TAGTAGTA[14]的一个38bp区域)被研究的最清楚。这些结果来自对酵母突变体CYCImRNA的mRNA水平和相对长度的确定的实验。近期用invivo质粒稳定性分析的研究结果证明:TATATA似乎和原始的38bp野生型区域一样有效地终止转录,而TAGATATATATGTAA和TACATA效率差些,TTTTTTTATA几乎没有效率[15]。所有这些序列在反方向时没有终止转录功能。不幸的是几乎没有其他真核表达系统转录终止序列方面的信息。
内含子对几个哺乳动物基因的正常表达是必需的[12],包括Beta-球蛋白、SV40 latemRNA和二氢叶酸还原酶基因。单子叶植物细胞充分表达乙醇脱氢酶的cDNA拷贝[16]、报告基因氯霉素乙酰转移酶、Beta葡萄糖苷酸酶和其他缺乏内含子的基因[12]时也依赖内含子。转录区域内引入内含子可以通过未确定的转录后机制增强表达。(免疫球蛋白基因)内含子可能也包含转录增强子,因此通过转录机制增强表达。
总的来讲,如果存在某些DNA序列,真核异源蛋白表达可能是个难题。为避免剧烈的表达减少,需要对基因进行扫描,确认是否含上述提及的富含AT的序列。而且,在几个真核系统表达无内含子基因可能需要引入内含子以实现外源蛋白的充分表达。原核表达个人秘笈:表达前的分析比什么都重要
生物通原核表达技术专辑:表达不同于其它一些实验,比如:提取质粒、PCR、电镜切片,这些人为控制的因素比较多,出问题相对来说也比较好分析。表达呢,你把质粒克隆好啦,交给细胞,然后有些事情就不全是你要怎样就怎样了。原核表达在表达当中来说还是比较简单,细菌培养条件简单、生长速度快,需要的仪器和培养基都比较便宜。当然,它也存在一些缺乏高级修饰、细胞内部还原性过高等缺点。
原核表达从一开始的设计就非常重要,所谓好的开始是成功的一半。做足准备功夫,可是省去很多将来后悔的事情。首先,我们要根据是否要求可溶将载体分成两大类,如果希望可以同时尝试多种表达系统,也有许多商业化的系统供选择。
前面已经介绍过许多公司的商业化载体、菌株和多系统表达体系,现在我想先从自己的蛋白分析讲起。同样的载体、同样的系统,很可能表达这个蛋白表达量奇高,但是另外一个就是做不出来,所以没有万能的载体,只有永恒的分析。当然如果你的蛋白曾经在原核系统中成功表达出来那是最好的,选择同样的载体表达成功率会高很多。如果没有也最好尝试找一些曾经表达过和你的蛋白拥有相类似结构的文献。比如大部分含有哺乳动物src同源的SH2蛋白相互作用域的蛋白都是用pGEX系列载体表达出来的。根据经验而言,含有较少半胱氨酸和脯氨酸的、平均大小为60kD的单体蛋白较容易表达。
在下面将列出几个影响表达的因素,大家可以在表达前根据这几个因素自己分析一下:
1. 翻译起始位点
现在大部分的表达载体都提供起始位点,所以它已经把起始密码子与核糖体结合位点的距离进行优化了,一般情况下不需要自己再加,不过还是要留意载体图谱上是否注明有起始密码子和终止密码子
2. GC含量
表达序列中的GC含量超过70%的时候可能会降低蛋白在大肠杆菌中的表达水平。GC含量可以利用DNA STAR、Vector NTISuite等软件进行预测。
3. 二级结构
在起始密码子附近的mRNA二级结构可能会抑制翻译的起始或者造成翻译暂停从而产生不完全的蛋白。如果利用软件分析DNA或RNA结构上有柄(stem)结构,并且结合长度超过8个碱基,这种结构会因为位点专一突变等因素而变得不稳定。
4. 基因或者蛋白的大小
一般说来小于5kD或者大于100kD的蛋白都是难以表达的。蛋白越小,越容易被降解。在这种情况下可以采取串联表达,在每个表达单位(即单体蛋白)间设计蛋白水解或者是化学断裂位点。如果蛋白较小,那么加入融合标签GST、Trx、MBP或者其它较大的促进融合的蛋白标签就较有可能使蛋白正确折叠,并以融合形式表达。
对于另一个极端,大于60kD的蛋白建议使用较小的标签,如6×组氨酸标签。对于结构研究较清楚的蛋白可以采取截取表达。当然表达时要根据目的进行截取,如果是要进行抗体制备而截取,那么一定要保证截取的部位抗原性较强。对于抗原性也可以利用软件分析,比如VectorNITSuite或者一些在线软件,不过在分析之余也要认识到这是一种数据统计的结论,如果蛋白和免疫动物亲缘关系较远的话还是不妨一试的。
5. 亲疏水性
这也是一种经验之谈,相信经常做表达的人都发现表达亲水区域时表达量会比较高,如果你要表达一个膜蛋白,那么劝你做好长期抗战的准备吧。有许多软件可以对氨基酸的亲疏水性进行分析,比如VectorNIT Suite,除此之外还可以利用在线跨膜区预测软件http://www.cbs.dtu.dk/services/TMHMM/ 对跨膜区进行预测。
乳糖操纵子是应用最广泛的调控模式,除了IPTG这种化学诱导方式之外还有利用吲哚丙烯酸和阿拉伯糖的化学诱导。如果你害怕这些化学物质会损害细菌的生长,那么你可以尝试利用温度诱导的载体,如:pDH2。它利用PL启动子,在温度上升到42℃后进行诱导表达。
可以看到在所有启动子里属T7启动子最强,它可以将大肠杆菌的资源最大程度地调用过来表达外源蛋白。这样一些难表达的蛋白都可以在pET系统里面表达出来,但是是不是越强就越好呢?如果你需要表达蛋白是可溶的,那么T7启动子就不那么适合了。较弱的启动子转录速度较慢,这样对于表达可溶、稳定、完整的蛋白比较有利。
Novagen可以说是的pET系统是最王牌的T7启动子表达系统,可是当T7启动子的强启动效应不受欢迎的时候怎么办呢?在这里给读者留个小小的疑问,看看大家有没有仔细看笔者写的Novagen篇。提示一下,虽然它转录速度快,但是可以控制它的拷贝数,又或者是……利用这些原理Novagen载体也可以毒性高的外源蛋白。
载体上除了启动子这个需要注意之外,另外一个就是标签了。很多标签是为了增加蛋白的可溶性,也有一些是为了方便鉴定表达产物,所以在表达时可以选择加标签。是否加标签要看个人需要,笔者认为如果是表达一个人家没表达过的蛋白最好还是加标签,这样方便将来鉴定。如果从经济角度考虑最好加入6×组氨酸标签,笔者曾经以为加什么标签都无所谓(前提是不需要融合表达),结果加了个Novagen的T7"Tag,等到鉴定的时候发现单抗那么贵。而且还不好买的,一些较少人用的标签会让你很伤脑筋。这也是表达前要准备的功课之一哦。
好了,如果你选好了载体,那么下一步就是设计引物的。相信大多数人都是利用PCR把目的基因调出来的吧。设计引物可以使用一下两个软件,PrimerPremier或者Oligo。如果要表达全长,其实也就没那么多要考虑,从一头一尾找至少8个匹配序列在加上与载体匹配的序列就可以了。
不过,我还是有以下几点提醒一下各位:
1. 这一点其实很容易理解,但是有时也容易被遗忘。那就是先查查表达外源片段中含有什么内切酶位点,不要设计重了,否则酶切时发现怎么老是有预期外的小片段出现。
2. 根据载体上的酶切位点设计引物,现在许多类似T载原理的克隆方法也可以应用到原核表达中了,如果T载克隆方法要定向很多时候要多加4个碱基,设计引物时候可别忘了加。在设计酶切位点的5’端不要忘了加保护碱基,不同内切酶所需的保护碱基不同,SalⅠ不需要保护碱基,EcoRⅤ需要1个,NotⅠ需要2个,HindⅢ最好有3个。一般情况下,都设计2个。
3. 注意启始密码子和终止密码子的读码框。如果载体上有ATG可以不另外加了,但是通常ATG后不是紧跟外源片段的,如果中间含有载体序列,务必确定中间这段序列不会造成你外源序列的移码。按情况需要,可以加1到2个碱基在引物中使读码框正确。有始有终,同样正常的终止密码子才能保证蛋白的产出。大部分载体也有终止密码子,如果你对载体的不放心,也可以在引物中设计上终止密码子,这样万无一失。
4. 还有就是设计一对引物需要注意的地方:一对引物之间Tm值相差不宜过大,能一样最好;一对引物不宜形成发夹结构、互相配对,若配对时最好不要是G-C的结合(可以用软件分析);3'端以G、C结尾为宜等等。如果要详细研究可以看一下PCR技术的相关书籍,很厚。还有就是记得把上游引物设计成有义链,下游设计成反义链,否则就没有片段出现了。虽然这是很小的地方,可是经常会被忽略。
5. 如果你是进行截取表达,那么除了之前提到的要注意截取亲水区,还有一点就是对密码子的使用频率进行分析。如果在大肠杆菌中使用较少的密码子在外源片段中连续出现,还是避开它为上策。原核表达在路上:遇到瓶颈怎么办
生物通原核表达技术专题:我想表达遇到的第一个瓶颈估计就是为什么我的外源片段插到载体里面,PCR鉴定没问题,双酶切也OK,可是就是不见表达。一般我们是如何判断没有表达呢?大多都是首先进行SDS-PAGE。在跑胶的时候一定要设对照,比较严谨的电泳对照,应该是:Marker,标准品阳性对照(如果有,且打算做Western的话),以及空白载体(诱导)和重组载体(不诱导)2个阴性对照,再加上诱导不同时间的表达结果。Marker用于判断条带大小,标准品用于判断Western体系包括抗体显色剂和操作的可靠性,以及精确判断大小;空白载体(诱导)负对照有助于判断在非诱导条件下的本底表达;而重组载体(不诱导)负对照则有助于判断诱导的效果以及排除诱导剂对宿主菌潜在的干扰,或者是区分细菌内源和外源表达产物——偷懒可不是好习惯,会影响结果判断。注意,接种表达和接种做感受态都类似,一定要用挑单克隆、加足量抗生素、过夜培养的新鲜菌液转种最好,在筛选压力下生长旺盛的种子液远比经过4℃保存的菌液要好得多,也许是因为保存时间长会导致抗生素失效部分细菌丢失质粒或者其他变化。反正就是一种经验做法。
跑SDS-PAGE的话可以用考马斯亮兰染,它灵敏度在100ng左右;但是不能跟着做Western了。银染的灵敏度在0.1~1ng;有钱还可以用SyproRed,灵敏度高还可以继续做Western。WesternBlot是蛋白质定性和半定量的最通用的技术,具体细节可参考生物通WesternBlot技术专题,我们有详细介绍的。
在做过WesternBlot仍没有检测到表达带,那么就要开始进行下一步的分析了。首先,看看载体的多克隆位点和片断插入的序列,是否有因为酶切连接而意外引入了转录终止信号。有时载体几经多个实验人员的周转,反复插入片断,或者是粘端相同的不同酶切片断之间的连接,会意外在启动子后面带入终止位点,特别是用到XbaI之类的酶要小心。然后要对测序结果进行确定,确定插入的每个碱基都是正确的,没有意外终止的情况。还有个大家容易忽略的问题:就是要看基因中有没有细菌不常用的密码子——如果有,需要考虑换表达菌株。每种菌株都有自己独特的设计,或者是蛋白酶缺陷,或者是重组酶缺陷,改造的目的都是为了让质粒在细菌中存在更稳定,表达的产物不易被降解。不同的载体要配合一定的菌株使用,像pET系列就一定需要有T7RNA聚合酶片段整合在细菌中的菌株才可用于表达。采用不同调控机制会使用不同的表达菌株,所以换菌株一定要仔细看过载体的调控方式再换。以Novagen为例,如果使用BL21(DE3)表达不成功的话可以换Rosetta系列菌株,它能够由一种氯霉素抗性的、与pET相容的质粒提供AUA,AGG,AGA,CUA,CCC和GGA的tRNA。所以这类菌株能够明显改善大肠杆菌中由于稀有密码子造成的表达限制。有时不明原因的表达蛋白截短(比预期的分子量要小很多)也可能是由于稀有密码子造成的。另外一种可能是不严谨的本底表达产物抑制。
没有发现原则性错误之后,最简单、快捷的就是改变一下表达温度、IPTG浓度。低温、较长时间的表达有利于蛋白稳定、融合表达,低浓度的IPTG可以减少化学物质对细胞的损伤。培养基中的葡萄糖可能会抑制表达。有时表达的蛋白可能比预期的有不同,要认真研究电泳结果。如果尝试改变条件后依然没有表达,可以试试换不同的培养基。除了LB外还有TB、M9等,Novagen公司还有特殊的培养基出售补充各种细菌生长所需营养。
如果还是不行,考虑那么就剩下换换载体或者表达系统了。在换过不同载体,不同菌株之后仍是表达不出来的话,笔者的建议是:放弃吧。有些蛋白是用大肠杆菌无法表达的,或许可以尝试其它的表达系统。毕竟,将构建好的质粒交给细菌后,有些事情是我们不能控制的,未知的。尝试其他的表达系统未尝不是一种办法。不过原核不能表达,转去做真核,也不保险,这时候试试体外表达,会更省事,因为没有细胞生长的限制,更容易得到结果,可能只是花费高些,产量低些。能做出结果是第一需要时,这些就不能计较太多。生物通将随后介绍几个体外表达系统,欢迎留意。
如果你成功表达出来了,首先要恭喜你,之后你仍然可能遇到各种各样的问题。这个很正常,科研的道路是曲折的嘛。
Q1:蛋白表达出来了,但是跑SDS-PAGE时大小不符?
进行SDS-PAGE的时候蛋白的净电荷会影响迁移率。带电量高的蛋白会结合较少的SDS,因此阻碍了蛋白的泳动。富含脯氨酸的蛋白会在SDS-PAGE胶中移动得特别慢。如果蛋白的等电点在5到9之间,并且组成的氨基酸组分没有明显的偏好,那么目的蛋白迁移率与预期相差较远就很有可能不是由于凝胶电泳造成的。我们前面提到过,在很特殊的情况下稀有密码子的问题也会造成表达产物的截短。应加以考虑。
这个时候最好利用C端或者N端的标签进行WesternBlot,看是否由于蛋白被蛋白酶降解而导致多条目的条带或者比预期小很多的条带出现。如果排除以上因素仍是无法找出为何与预期大小相差很远,你只能苦命地重头再来。如果蛋白酶过高可以换个缺陷菌株试试。
Q2:蛋白不可溶,怎么办?
许多外源蛋白在大肠杆菌中表达后都是以包涵体形式存在,包涵体是一种致密、不可溶的颗粒。一般情况下,形成包涵体表达产率都很高,并且容易分离,得到比较纯的包含体。包涵体致密的结构有助于防止蛋白酶对它的降解作用,如果毒性较强的蛋白形成包涵体也就不会对细胞产生太大的损伤。如果你表达蛋白的目的是为了作为抗原制备抗体,那么出现包涵体也不算太坏,可以用PBS将包涵体悬浮,使用佐剂将溶液乳化后注射进入动物体内进行免疫。
包含体的形成据分析原因之一在于表达量过高,表达产物来不及折叠为活性形式——多数以高表达见长的表达系统都会得到包含体产物。如果融合表达含有标签,常用的做法是将包涵体用尿素溶解后在变性的情况下进行纯化,然后复性。复性是表达下游最折磨人的步骤,生物通以后会逐步介绍。但是,在那之前你应该还要确定一下,你的蛋白真的是不可溶吗?细胞裂解是否完全呢?利用相差显微镜或者染色后对细胞裂解物进行观察。是否仍可以看到完整的细胞?裂解后的沉淀是否和之前收集细胞沉淀大小相似?裂解后溶液是否看起来澄清?以上任何一种情况出现都可能意味着细胞没有被彻底裂解而导致裂解上清检测不到产物。如果形成了包涵体,在比较高倍的(>400×)光镜下可以观察到大肠杆菌中有致密的结构。因为包涵体可能会占据细胞一半体积。
Q3:必须要可溶的蛋白,你可以怎么做?
如果你希望得到能行使功能的蛋白,那么就最好还是想办法使蛋白以可溶形式表达,包涵体复性也是一条十分曲折的道路。避免包涵体形成的方法很多,比如:选用表达量不高的表达系统,选择有助于可溶性表达的融合表达系统比如pThio,pMal等等,对于T7系统来说降低或者减少诱导条件(例如降低ITPG浓度减少T7聚合酶)从而降低表达速度,使用基本培养基等也有助于可溶性表达。另外一个容易忽视的问题是大肠杆菌内还原性过高会导致二硫键不能正确形成,同样容易导致表达产物不溶,更换菌株例如Novagen的Origami系列也有助于解决这个问题。生物通将在随后专门介绍几种特殊的用途的大肠杆菌菌株,不妨留意。
一般包涵体可以先使用温和变性剂(如:低浓度的尿素)和去污剂(如:Triton-X100)将包涵体初步洗涤,之后用8M尿素将包涵体溶解。可以通过透析复性、或者是在过柱的时候复性。复性条件每个蛋白都是不一样的,所以是一条需要摸索前进的道路。
有人尝试当蛋白挂在柱子上的时候,在还原和氧化的谷胱甘肽存在的情况下用浓度从6M到0M的盐酸胍过柱,促使蛋白的折叠。在蛋白重新折叠后用咪唑洗脱。
Q4:切除标签时引入的蛋白酶是否一定要切除?
很多时候我们要用蛋白酶除去加入的标签(除了NEB出有内含肽自动断裂这种模式就不需要蛋白酶了),在蛋白酶切除标签后是否一定要去除呢?有人认为蛋白酶与目的蛋白加入的比例是1:500甚至更低,蛋白酶是不会影响到下一步操作的,在一些粗放的生化实验不用去处蛋白酶。严谨的后继实验需要将蛋白酶除去。很多公司已经开发出带有标签的蛋白酶,使得仅通过过亲和柱就可以方便的去除蛋白酶和融合标签,令实验越来越方便了。
乳糖操纵子是应用最广泛的调控模式,除了IPTG这种化学诱导方式之外还有利用吲哚丙烯酸和阿拉伯糖的化学诱导。如果你害怕这些化学物质会损害细菌的生长,那么你可以尝试利用温度诱导的载体,如:pDH2。它利用PL启动子,在温度上升到42℃后进行诱导表达。
可以看到在所有启动子里属T7启动子最强,它可以将大肠杆菌的资源最大程度地调用过来表达外源蛋白。这样一些难表达的蛋白都可以在pET系统里面表达出来,但是是不是越强就越好呢?如果你需要表达蛋白是可溶的,那么T7启动子就不那么适合了。较弱的启动子转录速度较慢,这样对于表达可溶、稳定、完整的蛋白比较有利。
Novagen可以说是的pET系统是最王牌的T7启动子表达系统,可是当T7启动子的强启动效应不受欢迎的时候怎么办呢?在这里给读者留个小小的疑问,看看大家有没有仔细看笔者写的Novagen篇。提示一下,虽然它转录速度快,但是可以控制它的拷贝数,又或者是……利用这些原理Novagen载体也可以毒性高的外源蛋白。
载体上除了启动子这个需要注意之外,另外一个就是标签了。很多标签是为了增加蛋白的可溶性,也有一些是为了方便鉴定表达产物,所以在表达时可以选择加标签。是否加标签要看个人需要,笔者认为如果是表达一个人家没表达过的蛋白最好还是加标签,这样方便将来鉴定。如果从经济角度考虑最好加入6×组氨酸标签,笔者曾经以为加什么标签都无所谓(前提是不需要融合表达),结果加了个Novagen的T7·Tag,等到鉴定的时候发现单抗那么贵。而且还不好买的,一些较少人用的标签会让你很伤脑筋。这也是表达前要准备的功课之一哦。
好了,如果你选好了载体,那么下一步就是设计引物的。相信大多数人都是利用PCR把目的基因调出来的吧。设计引物可以使用一下两个软件,PrimerPremier或者Oligo。如果要表达全长,其实也就没那么多要考虑,从一头一尾找至少8个匹配序列在加上与载体匹配的序列就可以了。
不过,我还是有以下几点提醒一下各位:
- 这一点其实很容易理解,但是有时也容易被遗忘。那就是先查查表达外源片段中含有什么内切酶位点,不要设计重了,否则酶切时发现怎么老是有预期外的小片段出现。
- 根据载体上的酶切位点设计引物,现在许多类似T载原理的克隆方法也可以应用到原核表达中了,如果T载克隆方法要定向很多时候要多加4个碱基,设计引物时候可别忘了加。在设计酶切位点的5’端不要忘了加保护碱基,不同内切酶所需的保护碱基不同,SalⅠ不需要保护碱基,EcoRⅤ需要1个,NotⅠ需要2个,HindⅢ最好有3个。一般情况下,都设计2个。
- 注意启始密码子和终止密码子的读码框。如果载体上有ATG可以不另外加了,但是通常ATG后不是紧跟外源片段的,如果中间含有载体序列,务必确定中间这段序列不会造成你外源序列的移码。按情况需要,可以加1到2个碱基在引物中使读码框正确。有始有终,同样正常的终止密码子才能保证蛋白的产出。大部分载体也有终止密码子,如果你对载体的不放心,也可以在引物中设计上终止密码子,这样万无一失。
- 还有就是设计一对引物需要注意的地方:一对引物之间Tm值相差不宜过大,能一样最好;一对引物不宜形成发夹结构、互相配对,若配对时最好不要是G-C的结合(可以用软件分析);3'端以G、C结尾为宜等等。如果要详细研究可以看一下PCR技术的相关书籍,很厚。还有就是记得把上游引物设计成有义链,下游设计成反义链,否则就没有片段出现了。虽然这是很小的地方,可是经常会被忽略。
看完这么多是不是觉得有点思绪万千呢。以前给我上课的一位教授说过,做试验,那要大胆设计,小心求证。快去合成引物开始表达吧。
生物通原核表达技术专辑:表达不同于其它一些实验,比如:提取质粒、PCR、电镜切片,这些人为控制的因素比较多,出问题相对来说也比较好分析。表达呢,你把质粒克隆好啦,交给细胞,然后有些事情就不全是你要怎样就怎样了。原核表达在表达当中来说还是比较简单,细菌培养条件简单、生长速度快,需要的仪器和培养基都比较便宜。当然,它也存在一些缺乏高级修饰、细胞内部还原性过高等缺点。
原核表达从一开始的设计就非常重要,所谓好的开始是成功的一半。做足准备功夫,可是省去很多将来后悔的事情。首先,我们要根据是否要求可溶将载体分成两大类,如果希望可以同时尝试多种表达系统,也有许多商业化的系统供选择。
除了上面标出的元件外还需要有复制起点,它对于控制质粒的拷贝数非常重要;另外就是筛选标记了,比如蓝白斑筛选的lacZ,各种抗生素标记。在以上几个元件中,我们需要注意的是负责调节与启动的元件,也就是调控子和启动子。其中启动子对于蛋白表达的速度起着举足轻重的作用,它与最终蛋白的表达量、是否可融密不可分。这里,对于世面上广泛销售的几种原核表达载体使用的启动子进行总结。
启动子 来源手段(浓度) 强度
LacUV5 乳糖操纵元 lacI/IPTG(0.1-1mM) 强
Trp 色氨酸操纵元 trpR 3-β-吲哚丙烯酸 强
Tac结合了色氨酸启动子的-35序列和乳糖启动子的-10序列lacI/IPTG(0.1-1mM)强
PL λ噬菌体 λcI阻遏物/温度强
噬菌体T5 T5噬菌体 lacI/IPTG(0.1-1mM) 强
pBAD 阿拉伯糖操纵元 AraBAD/阿拉伯糖(1μm-10mM) 严谨
T7 T7 RNA聚合酶 lacI/IPTG(0.1-1mM) 非常强
乳糖操纵子是应用最广泛的调控模式,除了IPTG这种化学诱导方式之外还有利用吲哚丙烯酸和阿拉伯糖的化学诱导。如果你害怕这些化学物质会损害细菌的生长,那么你可以尝试利用温度诱导的载体,如:pDH2。它利用PL启动子,在温度上升到42℃后进行诱导表达。
可以看到在所有启动子里属T7启动子最强,它可以将大肠杆菌的资源最大程度地调用过来表达外源蛋白。这样一些难表达的蛋白都可以在pET系统里面表达出来,但是是不是越强就越好呢?如果你需要表达蛋白是可溶的,那么T7启动子就不那么适合了。较弱的启动子转录速度较慢,这样对于表达可溶、稳定、完整的蛋白比较有利。
Novagen可以说是的pET系统是最王牌的T7启动子表达系统,可是当T7启动子的强启动效应不受欢迎的时候怎么办呢?在这里给读者留个小小的疑问,看看大家有没有仔细看笔者写的Novagen篇。提示一下,虽然它转录速度快,但是可以控制它的拷贝数,又或者是……利用这些原理Novagen载体也可以毒性高的外源蛋白。
载体上除了启动子这个需要注意之外,另外一个就是标签了。很多标签是为了增加蛋白的可溶性,也有一些是为了方便鉴定表达产物,所以在表达时可以选择加标签。是否加标签要看个人需要,笔者认为如果是表达一个人家没表达过的蛋白最好还是加标签,这样方便将来鉴定。如果从经济角度考虑最好加入6×组氨酸标签,笔者曾经以为加什么标签都无所谓(前提是不需要融合表达),结果加了个Novagen的T7"Tag,等到鉴定的时候发现单抗那么贵。而且还不好买的,一些较少人用的标签会让你很伤脑筋。这也是表达前要准备的功课之一哦。
好了,如果你选好了载体,那么下一步就是设计引物的。相信大多数人都是利用PCR把目的基因调出来的吧。设计引物可以使用一下两个软件,PrimerPremier或者Oligo。如果要表达全长,其实也就没那么多要考虑,从一头一尾找至少8个匹配序列在加上与载体匹配的序列就可以了。
不过,我还是有以下几点提醒一下各位:
1. 这一点其实很容易理解,但是有时也容易被遗忘。那就是先查查表达外源片段中含有什么内切酶位点,不要设计重了,否则酶切时发现怎么老是有预期外的小片段出现。
2. 根据载体上的酶切位点设计引物,现在许多类似T载原理的克隆方法也可以应用到原核表达中了,如果T载克隆方法要定向很多时候要多加4个碱基,设计引物时候可别忘了加。在设计酶切位点的5’端不要忘了加保护碱基,不同内切酶所需的保护碱基不同,SalⅠ不需要保护碱基,EcoRⅤ需要1个,NotⅠ需要2个,HindⅢ最好有3个。一般情况下,都设计2个。
3. 注意启始密码子和终止密码子的读码框。如果载体上有ATG可以不另外加了,但是通常ATG后不是紧跟外源片段的,如果中间含有载体序列,务必确定中间这段序列不会造成你外源序列的移码。按情况需要,可以加1到2个碱基在引物中使读码框正确。有始有终,同样正常的终止密码子才能保证蛋白的产出。大部分载体也有终止密码子,如果你对载体的不放心,也可以在引物中设计上终止密码子,这样万无一失。
4. 还有就是设计一对引物需要注意的地方:一对引物之间Tm值相差不宜过大,能一样最好;一对引物不宜形成发夹结构、互相配对,若配对时最好不要是G-C的结合(可以用软件分析);3'端以G、C结尾为宜等等。如果要详细研究可以看一下PCR技术的相关书籍,很厚。还有就是记得把上游引物设计成有义链,下游设计成反义链,否则就没有片段出现了。虽然这是很小的地方,可是经常会被忽略。
5. 如果你是进行截取表达,那么除了之前提到的要注意截取亲水区,还有一点就是对密码子的使用频率进行分析。如果在大肠杆菌中使用较少的密码子在外源片段中连续出现,还是避开它为上策。
生物通原核表达技术专题:我想表达遇到的第一个瓶颈估计就是为什么我的外源片段插到载体里面,PCR鉴定没问题,双酶切也OK,可是就是不见表达。一般我们是如何判断没有表达呢?大多都是首先进行SDS-PAGE。在跑胶的时候一定要设对照,比较严谨的电泳对照,应该是:Marker,标准品阳性对照(如果有,且打算做Western的话),以及空白载体(诱导)和重组载体(不诱导)2个阴性对照,再加上诱导不同时间的表达结果。Marker用于判断条带大小,标准品用于判断Western体系包括抗体显色剂和操作的可靠性,以及精确判断大小;空白载体(诱导)负对照有助于判断在非诱导条件下的本底表达;而重组载体(不诱导)负对照则有助于判断诱导的效果以及排除诱导剂对宿主菌潜在的干扰,或者是区分细菌内源和外源表达产物——偷懒可不是好习惯,会影响结果判断。注意,接种表达和接种做感受态都类似,一定要用挑单克隆、加足量抗生素、过夜培养的新鲜菌液转种最好,在筛选压力下生长旺盛的种子液远比经过4℃保存的菌液要好得多,也许是因为保存时间长会导致抗生素失效部分细菌丢失质粒或者其他变化。反正就是一种经验做法。
跑SDS-PAGE的话可以用考马斯亮兰染,它灵敏度在100ng左右;但是不能跟着做Western了。银染的灵敏度在0.1~1ng;有钱还可以用SyproRed,灵敏度高还可以继续做Western。WesternBlot是蛋白质定性和半定量的最通用的技术,具体细节可参考生物通WesternBlot技术专题,我们有详细介绍的。
在做过WesternBlot仍没有检测到表达带,那么就要开始进行下一步的分析了。首先,看看载体的多克隆位点和片断插入的序列,是否有因为酶切连接而意外引入了转录终止信号。有时载体几经多个实验人员的周转,反复插入片断,或者是粘端相同的不同酶切片断之间的连接,会意外在启动子后面带入终止位点,特别是用到XbaI之类的酶要小心。然后要对测序结果进行确定,确定插入的每个碱基都是正确的,没有意外终止的情况。还有个大家容易忽略的问题:就是要看基因中有没有细菌不常用的密码子——如果有,需要考虑换表达菌株。每种菌株都有自己独特的设计,或者是蛋白酶缺陷,或者是重组酶缺陷,改造的目的都是为了让质粒在细菌中存在更稳定,表达的产物不易被降解。不同的载体要配合一定的菌株使用,像pET系列就一定需要有T7RNA聚合酶片段整合在细菌中的菌株才可用于表达。采用不同调控机制会使用不同的表达菌株,所以换菌株一定要仔细看过载体的调控方式再换。以Novagen为例,如果使用BL21(DE3)表达不成功的话可以换Rosetta系列菌株,它能够由一种氯霉素抗性的、与pET相容的质粒提供AUA,AGG,AGA,CUA,CCC和GGA的tRNA。所以这类菌株能够明显改善大肠杆菌中由于稀有密码子造成的表达限制。有时不明原因的表达蛋白截短(比预期的分子量要小很多)也可能是由于稀有密码子造成的。另外一种可能是不严谨的本底表达产物抑制。
没有发现原则性错误之后,最简单、快捷的就是改变一下表达温度、IPTG浓度。低温、较长时间的表达有利于蛋白稳定、融合表达,低浓度的IPTG可以减少化学物质对细胞的损伤。培养基中的葡萄糖可能会抑制表达。有时表达的蛋白可能比预期的有不同,要认真研究电泳结果。如果尝试改变条件后依然没有表达,可以试试换不同的培养基。除了LB外还有TB、M9等,Novagen公司还有特殊的培养基出售补充各种细菌生长所需营养。
如果还是不行,考虑那么就剩下换换载体或者表达系统了。在换过不同载体,不同菌株之后仍是表达不出来的话,笔者的建议是:放弃吧。有些蛋白是用大肠杆菌无法表达的,或许可以尝试其它的表达系统。毕竟,将构建好的质粒交给细菌后,有些事情是我们不能控制的,未知的。尝试其他的表达系统未尝不是一种办法。不过原核不能表达,转去做真核,也不保险,这时候试试体外表达,会更省事,因为没有细胞生长的限制,更容易得到结果,可能只是花费高些,产量低些。能做出结果是第一需要时,这些就不能计较太多。生物通将随后介绍几个体外表达系统,欢迎留意。