Categories
Articles

(03245) Efficient Approach to the Synthesis of a High-quality RandomPrptide Repertoire

https://www.abbs.info e-mail: [email protected]

 

ISSN
0582-9879                  
 
        ACTA BIOCHIMICA et
BIOPHYSICA SINICA 2003, 35(10):
921924
  
 

CN 31-1300/Q

 

An Efficient Approach to the
Synthesis of a High-quality Random Peptide Repertoire

 

YIN Chang-Cheng, WANG Shang-Zi, LIN Zheng-Hong, WANG
Xiang-Bin, LIU Jing, HUANG Hua-Liang*

( Institute of Genetics and Developmental
Biology, the Chinese Academy of Sciences,
Beijing 100101, China
)

 

Abstract        During
the construction of a random peptide repertoire using degenerate models,
unexpected amino acids or stop codons are almost unavoidable. To conquer this
shortcoming, a new split-mix-split method of oligonucleotide synthesis was
developed. A 13-amino acids random peptide library had been constructed by
using this method. The sequencing results of 16 clones indicated that neither
stop codon nor codon for cysteine appeared as designed. The occurrence rations
of 19 amino acids were also calculated and no obvious amino acid bias had been
observed. By using this method, the type and quantity of amino acid at certain
position of a peptide could be controlled well, so this split-mix-split method,
combined with degenerate could meet the needs of a high diversity random
peptide library.

 

Key
words
     antibody
library; synthesis; genetic engineering; peptide repertoire

_______________________________________

Received: July
4, 2003
   Accepted: July
25, 2003

This work was supported by a grant from the
National High Technology Research and Development Program of China (863
Program) (No. 2001AA215381)

*Corresponding author: Tel, 86-10-64857285;
Fax, 86-10-64857285; e-mail, [email protected]

 

一种构建高质量随机肽库的有效方法

 

尹长城     王尚资     林正红     王祥斌     刘晶    黄华樑**

 

中国科学院遗传与发育生物学研究所, 北京100101

 

摘要       为构建完全随机化的基因工程肽库,
克服现有简并方案中终止密码子和序列组成偏歧的不足, 提出了一种新的简并DNA文库合成方式。 通过这种分组式合成方式构建的肽库可以避免终止密码子的出现和氨基酸组成偏歧的发生,
还可以控制随机化过程中不同氨基酸的参入比例。 以一个13肽库的合成过程为例对分组式合成法进行了实验, 测序结果和对19种氨基酸出现频率的统计表明没有终止密码子和半胱氨酸密码子出现, 各氨基酸的出现频率接近均值, 表明这种分组混合分组, 辅以简并合成的方法是行之有效的,
能满足各类高容量基因工程随机肽库要求。

 

关键词   抗体库; 合成; 基因工程; 肽库

 

在分子生物学研究领域,
构建定点突变或随机突变的肽库或寡核苷酸库已成为常规内容[1,2] 对于库容要求低, 突变位点少的情况, 利用简并合成结合有效的筛选手段即可实现。
当需要连续突变多个位点, 或简并位点涉及的氨基酸种类较多,
甚至要求连续完全随机化时, 常规方法就不敷实用了, 因为常规的简并合成会引入无关突变或终止密码子, 序列加长时肽库质量明显下降。
为此, 相应提出了一些改进方案, 其中(NNKn、(NNBn和(VNNn方案都是使用较广的[3,4] 其中N=ATCG K=TG B=GCT V=AGC
这些改进方案试图获得最大的多样性并参入最少的终止密码子, 但因各种氨基酸密码子在上述各方案中出现的频率差异较大,
加之各单体在合成中的竞争活性存在差异, 使得序列的氨基酸组成偏歧难以控制,
随目的片段的长度增加, 这种偏歧会更为明显。 另一类方法是利用双核苷酸或三核苷酸代替单核苷酸单体合成的方法, 尤以三核苷酸方式优点突出, 它以三联体密码子为单位进行合成[5,6] 利用20种三联体合成单元就可以随意调控特定位点参入氨基酸的种类和数量,
达到序列随机化和避免无关氨基酸和终止密码子参入的目的[7,8] 但这种方法要求特殊原料, 一般实验室很难实现, 而且三联体在合成过程中竞争活性数据有限,
由此产生的序列的偏歧性不可预知。

为解决在常规条件下构建随机肽库的问题, 本研究借鉴多肽化学合成中分组合成的策略[9] 开发出一种可移植性和灵活性更优秀的基因工程肽库合成方法,
可广泛应用于小分子肽库, 合成抗体库、体外定点突变及其他组合化学研究中。

1    材料和方法(Materials and Methods)

 

1.1   仪器及原料

 

DNA合成仪为美国ABI公司394型,
合成中所用的载体及核苷酸单体均为CruachemUK)公司产品,
合成和测序均由上海博亚生物技术有限公司协助完成。

1.2   分组式合成的策略

 

DNA的固相亚磷三酯合成过程包括活化连接封闭氧化脱保护四个步骤。 分组组合分组(split-mix-split)策略的做法要求在无简并时按常规方式合成, 遇有简并时将载体收集混匀后分组,
各组按不同的氨基酸密码子加入其后的三个碱基, 合并所有添加了三个碱基的载体, 混匀,
视序列需要继续分组或合并合成, 直至完成。
为减少分组数目, 合成中引入了9种简并模式, 每种模式为两种氨基酸密码子。
9种简并模式及其代表的氨基酸分别是GA(T,G)=DE, AA(T,G)=NK, CA(T,G)=HQ, A(G,C)C=ST, (G,C)CG=AP, (A,C)TG=M L, (C,G)GT=RG, (A,G)TT=IV, T(A,T)C=YF

 

Table 1   The
degenerate and split models of CDR3 of VH synthesized in antibody library

Position

Vector (mg)

 

Degenerate model

1

110

 

5’-GTATTATTGCGCGCGT

2

121

 

GA(T,G);AA(T,G);CA(T,G);A(G,C)C;(G,C)CG;(A,C)TG;(G,C)GT;(A,G)TT;T(A,T)C;TGG

3

131

 

GA(T,G);AA(T,G);CA(T,G);A(G,C)C;(G,C)CG;(A,C)TG;(G,C)GT;(A,G)TT;T(A,T)C;TGG

4

130

 

GA(T,G);AA(T,G);CA(T,G);A(G,C)C;(G,C)CG;(A,C)TG;(G,C)GT;(A,G)TT;T(A,T)C;TGG

5

127

 

GA(T,G);AA(T,G);CA(T,G);A(G,C)C;(G,C)CG;(A,C)TG;(G,C)GT;(A,G)TT;T(A,T)C;TGG

6

134

 

GA(T,G);AA(T,G);CA(T,G);A(G,C)C;(G,C)CG;(A,C)TG;(G,C)GT;(A,G)TT;T(A,T)C;TGG

7

135

 

GA(T,G);AA(T,G);CA(T,G);A(G,C)C;(G,C)CG;(A,C)TG;(G,C)GT;(A,G)TT;T(A,T)C;TGG

8

145

 

GA(T,G);AA(T,G);CA(T,G);A(G,C)C;(G,C)CG;(A,C)TG;(G,C)GT;(A,G)TT;T(A,T)C;TGG

9

150

 

GA(T,G);AA(T,G);CA(T,G);A(G,C)C;(G,C)CG;(A,C)TG;(G,C)GT;(A,G)TT;T(A,T)C;TGG

10

154

 

GA(T,G);AA(T,G);CA(T,G);A(G,C)C;(G,C)CG;(A,C)TG;(G,C)GT;(A,G)TT;T(A,T)C;TGG

11

160

 

GA(T,G);AA(T,G);CA(T,G);A(G,C)C;(G,C)CG;(A,C)TG;(G,C)GT;(A,G)TT;T(A,T)C;TGG

12

168

 

TTT;ATG

13

152

 

GAT

14

158

 

GTT;TAT

15

120

 

TGGGGCCAAGGCAC-3’

 

以人抗体库重链可变区CDR3的序列合成为例, CDR3序列的高度多样性对于抗体的多样性和亲和力起着重要作用,
框架区则相对保守。 根据Kabat数据库公布的抗体序列分类结果统计, 重链可变区分为七个胚系(germline)序列, CDR3区存在两种长度多态性, 其中一种包含10个除去半胱氨酸外完全随机的位点和两个双氨基酸简并位点[8] 待合成序列的氨基酸序列用单字母氨基酸正规表达式(regular expression)表示为:Y-Y-C-A-R-{C}10-[FM]-D-[VY]-W-G-Q-G
其含义为前5个氨基酸序列为YYCAR, 后随10个随机氨基酸, 正规表达式中{C}表示此位置为除去半胱氨酸(C)以外的任意氨基酸, [FM]则表示此位置为苯丙氨酸(F)和甲硫氨酸(M 中的任意一种, 一般各氨基酸平均分配, 但也可视需要以特定比例参入,
将上述序列按表1的简并方式编码后开始合成, 合成过程的分组方式和载体质量列于表1

1.3   合成过程

 

用大量载体从3′端无简并部分开始固相合成, 可同时使用多个柱合成。 无简并部分合成完后停止在第14T, 在完成T的氧化后不脱去其5′端保护基团, 收集各柱上的载体, 混匀后称重, 均分为两组, 按其后简并序列分别继续加上TATTTG三个核苷酸, 获得17核苷酸产物仍不脱氧化,
将两组载体收集后充分混匀后称重, 按简并模式分为10组, 分别继续添加3个核苷酸, 其中编码色氨酸的TGG组质量为其他组的1/2 以保证各氨基酸的几率均等。
重复操作至完成合成, 收集最后的10组载体进行一致序列的合成, 由柱上洗脱合成产物, PAGE纯化后用作PCR的模板。

1.4   合成序列的克隆

 

扩增使用的引物为VH1: 5-GATACGGCCGTGTATTATTGCGCGCGT-3′和VH2: 5-CAGGGTGCC-TTGGCCCCA-3′。 40 μL扩增体系中加入5 μmol/L的引物VH1VH22 μL3 μL, 加入合成的5 μmol/L正向单链模板1 μL 10×PCR 缓冲液 4 μL 2 mmol/L
dNTPs 4
μL Pfu DNA 聚合酶或Taq DNA 聚合酶 3 U, H2O补至40 μL 94 ℃预变性5 min 94 ℃变性30 s, 50 ℃退火40 s, 72 ℃延伸40 s的条件扩增25个循环, 最后在72 ℃延伸5 min 扩增产物用1% 琼脂糖凝胶电泳检测, 柱离心回收, BssHIIStyI双酶切消化, 连入相应载体, 测序。

2    结果(Results)

 

2.1   序列组成分析

 

引物VH1VH2扩增的电泳结果见图1 使用Pfu酶和Taq酶扩增此复杂模板时效率和特异性都很好。 对连入载体的序列进行测序,
其中16个克隆的测序结果及比对见图2 由测序结果分别推定其氨基酸序列,
各序列的氨基酸比对结果见图3 对所测序列进行考察, 未发现在简并区外有其他点突变, 对简并区的位点进行统计也未发现有意外突变产生,
这表明在合成阶段及随后的PCR过程中没有无关随机突变产生, 对由测序结果推导的氨基酸序列的比对结果也证实了这一点。

 

 

Fig.1       Amplification
of CDR3 of VH synthesized with split-mix-split method

M molecular marker; 1 products amplified with
Pfu DNA polymerase; 2
products amplified with Taq DNA polymerase.

 

Fig.3       Alignment
of the sixteen putative amino acid sequences of randomed CDR3

 

AASEQ116, putative amino acid sequences of S1S16, sequences
in shadow are random synthesized CDR3.

 

 

Fig.2       Alignment
of the randomed CDR3 sequences of the VH of antibody

 

S1S16, sequences of
sixteen sequenced clones, sequences in shadow are random synthesized CDR3.

 

 

2.2   氨基酸组成分析

 

为评价此肽库的多样性和效率,
10个编码位点的氨基酸出现频率进行了统计,
出现率为出现次数与氨基酸总数的比值。 因为上述简并区域各序列之间以及位置间的关系都是对等的,
所以可以将16条序列的10个位点进行统一计数,
19种氨基酸在160个位点的出现频率统计结果如图4所示。由图419种设计的氨基酸都已出现, 且终止密码子和在CDR3区域中要避免的半胱氨酸都未出现,每种氨基酸的计算平均频率应为0.05319种氨基酸中的大多数出现频率都接近均值,
数值多在0.0440.063之间,
个别氨基酸的出现频率有些差别, 其中的A的频率偏高, 0.069 L的频率为0.038 低于均值。 整体上看, 19种氨基酸的出现频率接近随机分布方式, 未出现明显的组成偏歧。
在上述10个简并位点之后还设计有FM以及VY的等量简并, 实际统计的结果分别为8:89:7 与设计相符。

Fig.4 Distribution and occurrence ration of 19 amino
acids in putative amino acids sequences

 

Occurrence ration=amino acid
occurrence/total number of amino acids.

 

 

3    讨论 (Discussion)

 

与常规的简并合成方式相比,
分组式合成在完全随机化以及选择性参入或规避个别氨基酸密码子等方面的优点是显而易见的。 无论是NNKNNB的简并方案, 都不能完全避免终止密码子; VNN的方式虽没有终止密码子, 却缺少了对4种氨基酸的编码。
在序列较长时, 上述方案都会引起严重的氨基酸组成偏歧,
难以实用。 分组式与以三联体核苷酸为原料的合成方法相比,
因成本低更易于推广。 序列分析表明, 分组式合成法可以克服单纯的简并设计引入的氨基酸组成偏歧, 特别是从根本上避免了终止密码子的出现,
还可以有目的地规避无关氨基酸的出现, 如在本设计中,
因为半胱氨酸间易于形成不适当二硫键, 且在所统计的抗体序列内出现频率极低而采取了排除设计[8] 测序结果证明这种规避方法是有效的。
因为分组式合成可以视需要通过控制分组时载体的质量来控制各种氨基酸参入的比例, 所以能更好地反映各种肽库的天然性质, 体现出分组法的灵活性和可控性。

16个克隆的序列统计结果显示19种氨基酸出现频率并不完全相同, 究其原因,
首先可能与测定序列的数量有关, 预期随样本数量的增加,
所反映的库容特性会更加客观; 另一个可能的原因就是合成中以9个简并模式代替18种氨基酸的密码子, 每组简并模式内部可能产生核苷酸单体参入的竞争差异,
这种差异可以通过调整不同核苷酸单体的浓度比例来校正, 或通过取消组内简并而完全避免。

在实际应用分组法构建随机肽库时,
如目的序列较长或需要较多的分组, 应该考虑适当加大起始载体的数量,
1提供的是合成5OD长度为69个核苷酸的合成实例。 为保证产物的多样性和有效性,
要确保分组合成后载体要充分混匀; 在按比例分组时更要做到尽量准确。
利用分组式合成基因工程肽库的方法除可用于噬菌体展示的全(半)合成抗体库构建外, 还可通过与其他蛋白质编码序列融合而用于以下研究: 1)酶类分子体外进化[10] 2)全()合成抗体库的构建[8,11] 3)通过定点、定向突变研究蛋白质结构关系中的关键位点。 此外, 分组式合成方法构建的随机肽库可以利用其有效性和高度的多态性更方便地与核糖体展示技术结合,
短时间内完成完全在体外进行的高通量突变和筛选过程[12]

References

1     English
LB. Combinatorial library methods and protocols, In: Methods in Molecular Biology
Vol.201
New Jersey:
Humana Press, 2002

2     Braunagel
M. Construction of semisynthetic antibody libraries. Methods Mol Biol, 2003,
207: 123
132

3     Cárcamo J, Ravera MW, Brissette R,
Dedova O, Beasley JR, Mogh
é AA, Wan C et al. Unexpected frameshifts from gene to expressed
protein in a phage-displayed peptide library. Proc Natl Acad Sci USA, 1998,
95(19): 11146
11151

4     Wang
Y, Hua B, Liu QY, Chen YP, Zhu YC. Construction of a semisynthetic phage
antibody library. Chin J Microbiol Immunol, 1999, 19(3): 238
241

5     Virneka¨ SB, Ge L, Plückthun A, Schneider KC, Wellnhofer
G, Morney SE. Trinucleotide phosphoramidites: Ideal reagents for the synthesis
of mixed oligonucleotides for random mutagenesis. Nucleic Acids Res, 1994,
22(25): 5600
5607

6     Kayushin
AL, Korosteleva MD, Miroshnikov AI, Kosch W, Zubov D, Piel N. A convenient
approach to the synthesis of trinucleotide phosphoramidites-synthons for the
generation of oligonucleotide/peptide libraries. Nucleic Acids Res, 1996,
24(19): 3748
3755

7     Braunagel
M, Little M. Construction of a semisynthetic antibody library using
trinucleotide oligos. Nucleic Acids Res, 1997, 25(22): 4690
4691

8     Knappik
A, Ge L, Honegger A, Pack P, Fischer M, Wellnhofer G, Hoess A et al. Fully
synthetic human combinatorial antibody libraries (HuCAL) based on modular
consensus frameworks and CDRs randomized with trinucleotides. J Mol Biol, 2000,
296: 57
86

9     Hanes
J, Schaffitzel C, Knappik A, Pluckthun A. Picomolar affinity antibodies from a
fully synthetic naive library selected and evolved by ribosome display. Nat
Biotechnol, 2000, 18(12): 1287
1292

10    Ting
AY, Witte K, Shah K, Kraybill B, Shokat KM, Schultz P. Phage-display evolution
of tyrosine kinases with altered nucleotide specificity. Biopolymers, 2001, 60:
220
228

11    Krebs
B, Rauchenberger R, Reiffert S, Rothe C, Tesar M, Thomassen E, Cao M et al.
High-throughput generation and engineering of recombinant human antibodies. J
Immunol Methods, 2001, 254(1-2): 67
84

12    Pluckthun
A, Hanes J. In vitro seletion and evolution of functional protein by using
ribosome display. Proc Natl Acad Sci USA, 1997, 94(10): 4937
4942

 

Updated at: 2003-10-09