1. 亲和标签是否会影响到目标蛋白的结构和功能
亲和标签与目标蛋白之间的作用是相互的,需要综合的考虑,既要考虑到对目标蛋白结构功能的影响,又要考虑到对标签与其配体亲和作用的影响,以及实际的用途。大多数情况首选短的多肽标签,这是因为短的肽标签对目标蛋白的结构影响最小,在某些应用中,短肽不必要去除,因为重组蛋白已经具有完全的生物学功能,这也是6 个组氨酸标签比GST标签应用更广的原因,而且短肽不具有免疫原性,融合蛋白可直接的用于抗体的制备;而大的亲和标签可能限制重组蛋白的折叠,影响蛋白质的生物学功能。从另一方面来讲目标蛋白可能会干扰短肽标签与其配体的结合,与小的短肽标签相比,大的多肽和蛋白质标签也在实验室作为常规选择,它们的亲和配体大多是低分子化合物,可以降低目标蛋白对结合的影响,增强纯化的特异性(111),许多情况下,重组融合蛋白去除亲和标签后,目标蛋白可形成正确的结构。
2. 蛋白质的稳定性
含有多对二硫键的蛋白质或某些蛋白在进行非融合表达时,常容易形成包涵体,或有降解发生。降解的原因有两种情况,一是目标蛋白的不正确折叠,那么加入亲和标签如果能够促进目标蛋白的正确折叠将有助于防止蛋白质的降解,第二种情况是末端氨基酸不稳定,这时的原则是,N端融合有助于保护目标蛋白的N端,而C 端融合有助于保护目标蛋白的C 端,从而可以获得全长的目标蛋白。亲和标签对蛋白质包涵体的形成可以促进,也可以减少,不同的标签有不同的特性,多数情况还与表达系统相关。如麦芽糖结合蛋白(MBP)具有分子伴侣样的特性,进行N端融合,常有助于蛋白质的正确折叠和活性蛋白的获得,目的蛋白的MBP融合已成功用于晶体结构的研究(95)。
3. 亲和标签所融合的位置
亲和标签可以加在N端,可以加在C端,也进行串联,如图5 所示,在选择融合位置的时候,要考虑所处位置对标签亲和性的影响,如GST适合加在N端,还要考虑融合可能对目标蛋白的影响,如果目标蛋白的C端序列包埋在蛋白的内部,那么进行C端融合就不合适。多数情况下蛋白质的N端区域对蛋白质的功能不是太重要,所以在N端进行融合标签的融合常常能保留蛋白质的生物学功能。由于N端DNA序列对蛋白质的转录翻译影响较大,所以标签加在N端对蛋白质的表达水平影响更大,优化标签的mRNA结构可使表达水平提高。N端标签对表达蛋白的溶解性影响更大,如在N端使用天然HAT标签比6×His标签有助于目标蛋白的可溶性表达,而N端进行MBP融合表达也常用来提高目标蛋白的溶解性。进行分泌表达时,常选用可分泌的亲和标签,有些亲和标签不适合于放在N端,如6×His标签放在N端会影响重组蛋白信号肽的处理和目标蛋白的分泌,这是因为6×His标签具有多个带电咪唑残基。在选择融合位置时,另一个方面的考虑是,C端融合在去除融合标签后在目标蛋白的C端会有几个氨基酸残留,而小心的选择剪切特异性的氨基酸序列就可以在去除N端亲和标签后得到天然的目标蛋白。
图 5 进行载体构建时亲和标签相对目标蛋白所处的位置。
4. 是否需要在变性条件下进行亲和纯化
如果融合蛋白以包涵体的形式存在,由于大多数的亲和标签不适于在变性剂存在条件下进行亲和纯化,只能先进行包涵体的溶解和复性,再在非变性条件下进行亲和纯化,其中有些亲和标签可以促进蛋白的折叠复性,如来源于蛋白A的ZZ标签,可使胰岛素样生长因子Ⅰ(IGF-Ⅰ)融合蛋白在比非融合蛋白高100倍的浓度下成功折叠复性,并且不会形成沉淀(98),在选择亲和表达纯化系统时需要考虑。组氨酸标签在非变性和变性条件下通常均可进行亲和纯化,除了前面的这种方法可以使用,大多数情况下直接在变性条件下进行亲和纯化或亲和层析复性,而且亲和层析复性常常可以提高折叠的效率。
5. 亲和标签对表达水平的影响
亲和标签对表达水平的影响不仅与亲和标签和目标蛋白相关,还与可用的表达纯化系统密切相关,需根据具体情况进行分析。
6. 是否需要标签具有鉴定功能
首先要看针对目标蛋白是否有方便有效的分析鉴定方法,如果没有可选择能够进行重组蛋白检测的亲和标签。
7. 亲和洗脱的条件
表4 列出了亲和洗脱的条件,有些条件比较温和,而有些条件较为剧烈,选择的亲和表达系统应该不使目标蛋白变性。
8. 亲和介质和缓冲液的费用
9. 是否在亲和纯化后去除标签
融合蛋白是否需要去除标签,由目标蛋白的用途和标签的特点来确定,如果用于免疫动物生产抗体,则不需要,如果不影响蛋白的功能研究,也不需要,如果影响了蛋白的功能研究或用于临床治疗,则需要去除标签。
表 4 常用的亲和融合表达/纯化系统
|
亲和标签 |
分子大小 |
结合配体 |
融合部位 |
洗脱条件 |
注释 |
|
谷胱甘肽巯基转移酶(GST) |
26 kDa ( |
谷胱甘肽 |
N 端 |
还原型谷胱甘肽 |
载体:pGEX, pET41, pET42, 可进行表达蛋白的检测,融合蛋白形成二聚体 |
|
金葡菌蛋白A(Protein A) IgG结合结构域 |
30 kDa |
hIgG |
N 端 |
低pH |
载体:pRIT2T, 具有Protein A信号序列可进行分泌表达,可在弱变性条件下纯化(0.5M盐酸胍) |
|
ZZ 结构域 |
14 kDa |
hIgG |
N 端 |
低pH |
载体:pEZZ18, 具有Protein A信号序列可进行分泌表达,可使目标蛋白获得正确的折叠 |
|
链球菌蛋白G(Protein G) |
28 kDa |
白蛋白(HSA) |
N 端或C端 |
低pH |
具有Protein G信号序列可进行分泌表达 |
|
白蛋白结合结构域(ABD) |
5-25 kDa |
白蛋白(HSA) |
C 端 |
低pH |
|
|
几丁质结合结构域 |
|
几丁质 |
N 端或C端 |
诱导剪切 |
pTYB,pTWIN |
|
纤维素结合结构域(CBD) |
|
纤维素 |
N 端或C端 |
乙二醇 |
载体:pET 34, pET 35, pET 36, pET 37, pET 38,可增强表达蛋白的热稳定性,具有信号肽序列可进行分泌表达 |
|
麦芽糖结合蛋白(MBP) |
41 kDa ( |
直链淀粉 |
N 端或C端 |
麦芽糖 |
载体:pMAL, 具有MBP信号序列可进行分泌表达,可改善溶解性 |
|
PinPoint(可生物素化蛋白) |
13 kDa |
单体抗生物素蛋白 |
N 端 |
生物素 |
载体:PinPoint, 可进行表达蛋白的检测 |
|
Biotin Avitag (可生物素化的短肽) |
|
单体抗生物素蛋白 |
N 端或C端 |
生物素 |
载体:pAN, pAC, 可进行表达蛋白的检测,可进行目标蛋白的固定化,可在变性条件下纯化 |
|
Strep tag Ⅱ(非生物素化亲和) |
|
链霉抗生物素蛋白变体Strep-Tactin |
N 端或C端 |
脱硫生物素 |
载体:pPR-IBA, pASK-IBA,具有OmpA信号序列可进行分泌表达, 可进行表达蛋白的检测, 可进行目标蛋白的固定化,可在变性条件下纯化 |
|
钙调蛋白结合肽(CBP) |
|
钙调蛋白 |
N 端或C 端 |
EGTA/EGTA和 |
pCAL |
|
组氨酸标签(Poly His) |
6,8,10, |
螯和金属离子Ni2+或Co2+ |
N 端或C 端 |
咪唑/低pH |
载体: pET, pHAT, pQE,pProEx,pTrcHis,可在变性条件下纯化 |
|
表位标签FLAG |
|
单抗M1/M2 |
使用M1单抗进行N 端融合,使用M2单抗N端或C 端融合 |
融合蛋白与M1单抗的结合是钙依赖的,使用EDTA, M2单抗是非钙依赖的, 使用低pH或合成的FLAG肽 |
载体;p-FLAG,p3×FLAG,已具有肠激酶酶切位点 |
|
S 标签 |
|
RNase A的S片段 |
N 端或C 端 |
低pH |
载体:pET,可进行表达水平的监测 |
|
T7 标签 |
|
单抗 |
N 端 |
低pH |
载体:pET,可增强表达水平,可在弱变性条件下纯化 |
|
精氨酸标签(Poly Arg) |
5 |
强酸性阳离子基团 |
C 端 |
氯化钠梯度 |
|
|
苯丙氨酸标签(Poly Phe) |
|
疏水苯基 |
N 端 |
乙二醇 |
|
