CN102533800A

CN102533800A - A marine Streptomyces halogenase gene and its product, and a biosynthetic gene cluster of its modified product

Info

Publication number: CN102533800A
Application number: CN2011103330758A
Authority: CN
Inventors: 赵心清; 杨天虹; 王玉梅; 陈亮宇
Original assignee: Dalian University of Technology
Current assignee: Dalian University of Technology
Priority date: 2011-10-28
Filing date: 2011-10-28
Publication date: 2012-07-04

Abstract

The present invention relates to the field of genetic engineering. The invention discloses a nucleotide sequence of a marine streptomyces halogenase gene, which is characterized in that nucleic acid containing a nucleotide sequence shown by SEQ ID NO.1 and an amino acid sequence shown by SEQ ID NO. 2; and (b) a nucleic acid having at least 75% sequence identity to the nucleic acid of while retaining the function of a halogenase. The invention adopts a method for establishing a Fosmid genome library, and utilizes a conservative probe of a halogenase gene to carry out PCR screening on the library to obtain a new halogenase gene. Compared with the traditional SuperCos vector, the Fosmid library is constructed without restriction enzyme cutting, so that the preference of enzyme cutting sites is avoided, and the Fosmid library is low in copy number and more stable. And (3) rapidly screening the Fosmid library by utilizing PCR (polymerase chain reaction), and successfully obtaining the full length of the halogenase gene and the gene cluster in which the halogenase gene is located. The gene cluster comprises 11 protein synthesis genes, and the sequences of the protein synthesis genes have higher homology with genes such as non-ribosomal polypeptide synthetase gene, regulatory gene, transfer protein gene and the like.

Description

A marine Streptomyces halogenase gene and its product, and a biosynthetic gene cluster of its modified product

技术领域 technical field

本发明涉及基因工程领域，特别是海洋链霉菌卤化酶基因及其产物，另外还涉及卤化酶修饰产物的生物合成基因簇。 The invention relates to the field of genetic engineering, in particular to the marine streptomyces halogenase gene and its product, and also to the biosynthetic gene cluster of the halogenase modified product. the

背景技术 Background technique

海洋链霉菌(Streptomyces xinghaiensis)是大连理工大学分离鉴定的一个海洋链霉菌新种（一株具有广谱抗菌活性的海洋链霉菌S187，中国发明专利200710158478.7），该菌种具有良好的抗耐药金黄色葡萄球菌MRSA菌株活性，同时对绿脓假单胞菌、大肠杆菌、鲍曼不动杆菌以及白色念珠菌等也具有较好的活性，而其抗绿脓假单胞菌活性在所分离的所有菌株中比较突出。海洋链霉菌的16S rDNA序列与两个亲缘关系较近的标准菌种S. flavofuscus NRRL B-8036^T和S. albiaxialis DSM 41799^T同源性分别为98.1% 和97.5%，但基因组DNA-DNA杂交分析显示该菌种与两个标准菌种的相关性只有31.4%和46.9%。对海洋链霉菌进行深入研究，发现了一个卤化酶基因及其修饰产物的完整基因簇。 Streptomyces xinghaiensis is a new species of Streptomyces xinghaiensis isolated and identified by Dalian University of Technology (a strain of Streptomyces xinghaiensis with broad-spectrum antibacterial activity, Chinese invention patent 200710158478.7), this strain has good resistance to drug-resistant gold Staphylococcus aureus MRSA strain activity, also has good activity to Pseudomonas aeruginosa, Escherichia coli, Acinetobacter baumannii and Candida albicans etc. prominent among all strains. The 16S rDNA sequence of Streptomyces marine has 98.1% and 97.5% homology with two closely related standard strains , S. flavofuscus NRRL B-8036 ^T and S. albiaxialis DSM 41799 ^T , respectively, but the genomic DNA-DNA hybridization The analysis showed that the correlation between this strain and the two standard strains was only 31.4% and 46.9%. In-depth research on marine Streptomyces found a complete gene cluster of halogenase genes and their modified products.

卤化酶是修饰很多抗生素的重要修饰酶，对很多抗生素的活性具有重要的作用。由于FADH₂依赖型的卤化酶是许多抗生素生物合成基因簇中的后修饰酶，因此编码这类卤化酶的基因序列与多种抗生素的生物合成基因簇偶联。在生物合成的过程中，催化合成反应的中间进行卤代反应，从而对最终产物的生物活性产生影响。利用卤化酶作为新型生物催化剂，可产生新的药物分子用于临床治疗。 Halogenase is an important modifying enzyme for modifying many antibiotics, and plays an important role in the activity of many antibiotics. Since FADH _2- dependent halogenases are post-modifying enzymes in many antibiotic biosynthetic gene clusters, the gene sequences encoding such halogenases are coupled to the biosynthetic gene clusters of various antibiotics. In the process of biosynthesis, the halogenation reaction is carried out in the middle of the catalytic synthesis reaction, thereby affecting the biological activity of the final product. Using halogenase as a novel biocatalyst, new drug molecules can be produced for clinical treatment.

卤化酶可修饰多种抗生素，包括四环素类，安莎类，β内酰氨类、糖肽类等。其中complestatin (chloropeptin II) 是含有卤化修饰结构的一种特殊的糖肽类化合物，与万古霉素、替考拉宁结构不同之处是其不含有糖基，它是由线性非核糖体多肽(non-ribosomal peptide, NRPS)进一步通过NRPS合成酶进行酚氧化偶联形成的刚性交联结构。早在1980年人们就发现complestatin具有较强的抑制人补体旁路途径的活性。作为人体重要的免疫防御系统之一，补体系统过度激活与类风湿性关节炎等多种疾病相关，而重症非典型性肺炎（SARS）也和补体系统的过度激活有关，因此开发高效低毒的抗补体药物对于相关疾病的治疗具有重要意义。研究者还发现complestatin具有较强的抑制艾滋病毒HIV-1整合酶的活性。此外，complestatin还可促进纤溶酶原自溶，也可作为阻止缺氧缺血等急性脑损伤造成的兴奋毒性细胞死亡的神经保护分子。由于complestatin的多种独特的生物活性，也吸引着人们进行化学合成研究，但直到2010年才报道了其化学全合成，但化学合成步骤多，难度较大。此外，complestatin溶解性不好，可能也是限制其药物开发的因素，因此其类似物的开发具有重要研究意义。 Halogenase can modify a variety of antibiotics, including tetracyclines, ANSAs, β-lactams, glycopeptides, etc. Among them, complestatin (chloropeptin II) is a special glycopeptide compound containing a halogenated modified structure. It is different from vancomycin and teicoplanin in that it does not contain a sugar group. It is composed of a linear non-ribosomal polypeptide ( non-ribosomal peptide, NRPS) is further formed by NRPS synthetase for phenol oxidation coupling to form a rigid cross-linked structure. As early as 1980, it was discovered that complestatin has a strong activity of inhibiting the alternative pathway of human complement. As one of the important immune defense systems of the human body, the overactivation of the complement system is related to many diseases such as rheumatoid arthritis, and severe atypical pneumonia (SARS) is also related to the overactivation of the complement system, so the development of high-efficiency and low-toxicity Anticomplement drugs are of great significance for the treatment of related diseases. The researchers also found that complestatin has a strong inhibitory activity of HIV-1 integrase. In addition, complestatin can also promote the autolysis of plasminogen, and also act as a neuroprotective molecule to prevent excitotoxic cell death caused by acute brain injury such as hypoxia-ischemia. Due to the variety of unique biological activities of complestatin, it also attracts people to carry out chemical synthesis research, but its chemical synthesis was not reported until 2010, but the chemical synthesis steps are many and difficult. In addition, the poor solubility of complestatin may also be a factor limiting its drug development, so the development of its analogues has important research significance. the

发明内容 Contents of the invention

本发明的目的是提供一种海洋链霉菌卤化酶基因，另外还提供其产物；本发明还提供利用卤化酶基因修饰产物的生物合成基因簇，其基因序列与complestatin的生物合成基因序列具有较高的同源性，但又具有其自身独特的基因组成。 The object of the present invention is to provide a kind of marine Streptomyces halogenase gene, also provide its product in addition; The present invention also provides the biosynthetic gene cluster that utilizes halogenase gene modification product, its gene sequence and the biosynthetic gene sequence of complestatin have higher homology, but has its own unique genetic composition. the

本发明公开一种海洋链霉菌卤化酶基因核苷酸序列，其特征为： The invention discloses a nucleotide sequence of a marine Streptomyces halogenase gene, which is characterized by:

（a）、含有SEQ ID NO. 1所示核苷酸序列的核酸；和 (a), nucleic acid containing the nucleotide sequence shown in SEQ ID NO. 1; and

（b）、与（a）所述核酸具有至少75％序列相同性、同时保留了卤化酶功能的核酸。 (b) A nucleic acid having at least 75% sequence identity with the nucleic acid of (a) while retaining the halogenase function.

本发明一种包括编码基因序列的海洋链霉菌卤化酶蛋白质： A marine Streptomyces halogenase protein comprising a coding gene sequence of the present invention:

（a）、含有SEQ ID NO. 2所示的氨基酸序列的蛋白质；和 (a), a protein containing the amino acid sequence shown in SEQ ID NO. 2; and

（b）、在（a）的蛋白质的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有卤化酶功能的由（a）衍生的蛋白质。 (b) A protein derived from (a) that undergoes substitution, deletion or addition of one or several amino acids in the amino acid sequence of the protein in (a) and has a halogenase function.

本发明还公开所获得的海洋链霉菌卤代酶修饰产物基因簇序列，以已及分离获得该序列的方法，包括以下步骤： The present invention also discloses the obtained gene cluster sequence of the modified product of marine Streptomyces halogenase, and a method for isolating and obtaining the sequence, including the following steps:

1）用Fosmid 载体构建插入片段约为35-40kb 的海洋链霉菌基因组文库； 1) Use the Fosmid vector to construct a marine Streptomyces genome library with an insert fragment of about 35-40kb;

2）将所获得的文库转染细菌，平板涂布，经鉴定文库合格后挑取平板上的单克隆于培养基中培养； 2) Transfect bacteria with the obtained library, spread on the plate, and pick the single clone on the plate to culture in the culture medium after the qualified library is identified;

3）提取培养的单克隆的DNA，PCR 扩增，并对PCR 扩增产物进行检测，获得含有卤代酶基因的阳性克隆；和对该阳性克隆进行测序，获得该卤代酶基因全长以及修饰产物基因簇序列； 3) Extract the DNA of the cultured single clone, amplify it by PCR, and detect the PCR amplification product to obtain a positive clone containing the halogenase gene; and sequence the positive clone to obtain the full length of the halogenase gene and Modify product gene cluster sequence;

4）海洋链霉菌complestatin类似物基因簇功能预测，以及卤化酶修饰产物结构预测：包括非核糖体多肽合成酶蛋白功能域的分析，以及编码complestatin类似物的基因簇测序结果分析。 4) Prediction of function of Streptomyces marine complestatin analogue gene cluster, and structure prediction of halogenase modification products: including analysis of non-ribosomal polypeptide synthetase protein functional domains, and analysis of gene cluster sequencing results encoding complestatin analogues.

所述分析海洋链霉菌修饰产物基因簇合成产物结构预测的方法，包括： The method for analyzing the structure prediction of the synthetic product of the modified product gene cluster of Streptomyces marine comprises:

,1）海洋链霉菌卤化酶测序结果分析； ,1) Analysis of the sequencing results of halogenase of Streptomyces marinum;

,2）海洋链霉菌Fosmid文库卤代酶阳性质粒的序列结果分析； ,2) Sequence analysis of the halogenase-positive plasmid of the marine Streptomyces fosmid library;

,3）海洋链霉菌非核糖体多肽合成酶进行蛋白功能域的分析； ,3) Analysis of protein functional domains by non-ribosomal polypeptide synthetase of Streptomyces marine;

4）海洋链霉菌中编码卤化酶修饰产物的基因簇测序结果分析。 4) Analysis of the sequencing results of gene clusters encoding halogenase modified products in Streptomyces marinum.

本发明采用建立Fosmid基因组文库的方法，利用卤化酶基因的保守探针进行文库的PCR筛选，获得了新的卤化酶基因。与传统的SuperCos载体相比，Fosmid文库构建时不采用限制性酶切，避免了酶切位点的偏好性，而且其拷贝数低，更具有稳定性。利用PCR快速筛选Fosmid文库，成功获得了卤化酶基因的全长及其所在的基因簇。该基因簇共包括11个生物合成酶，分别为非核糖体多肽合成酶基因，调节基因和转运蛋白基因等基因具有较高同源性。 The invention adopts the method of establishing a Fosmid genome library, uses the conserved probe of the halogenase gene to carry out PCR screening of the library, and obtains a new halogenase gene. Compared with the traditional SuperCos vector, the Fosmid library construction does not use restriction enzymes, which avoids the preference of enzyme cutting sites, and its copy number is lower and more stable. Using PCR to quickly screen the Fosmid library, the full length of the halogenase gene and its gene cluster were successfully obtained. The gene cluster includes a total of 11 biosynthetic enzymes, which are non-ribosomal polypeptide synthetase genes, regulatory genes and transporter genes and other genes with high homology. the

附图说明： Description of drawings:

图1是显示海洋链霉菌与已知晶体结构的蛋白氨基酸序列的同源比对； Figure 1 is a homologous alignment showing the amino acid sequences of Streptomyces marine and proteins with known crystal structures;

图2是显示海洋链霉菌卤代酶氨基酸序列系统发育树； Figure 2 is a phylogenetic tree showing the amino acid sequence of the marine Streptomyces halogenase;

图3是海洋链霉菌中complestatin-like 化合物基因簇与S. lavendulae中complestatin基因簇的对比； Figure 3 is a comparison of the complestatin-like compound gene cluster in marine Streptomyces and the complestatin gene cluster in S. lavendulae ;

图4是显示海洋链霉菌非核糖体多肽合成酶（NRPS）的结构模块与S. lavendulae的比对； Figure 4 shows the alignment of the structural modules of Streptomyces marine non-ribosomal polypeptide synthase (NRPS) with S. lavendulae ;

图5是显示海洋链霉菌非核糖体多肽合成酶（NRPS）一级结构的预测。 Figure 5 shows the prediction of the primary structure of the non-ribosomal polypeptide synthase (NRPS) of Streptomyces marinum.

图6是海洋链霉菌卤化酶修饰产物生物合成基因簇的功能注释表。 Fig. 6 is a functional annotation table of the biosynthetic gene cluster of halogenase modified products of Streptomyces marinum.

具体实施方式 Detailed ways

以下结合具体实施例，对本发明作进一步说明。 The present invention will be further described below in conjunction with specific embodiments. the

本发明将海洋链霉菌的基因组用DNA破碎仪（Hydro-Shear 0703,美国GeneMachine）将基因组DNA打断，获得主要条带在35～40kb的片断，使用Klenow片段进行末端补平，并通过酚氯仿抽提乙醇沉淀精制DNA片断，精制后的DNA片段经过脉冲场电泳确认，连入Copycontrol Fosmid Library Production Kit (Epicentre,USA)提供的Fosmid载体。用噬菌体包装蛋白（Copycontrol Fosmid Library Production Kit, Epicentre）体外包装，转染大肠杆菌EPI300，使用碱裂解法提取DNA，NotI酶切鉴定，脉冲场电泳检测插入片断的长度。判断文库是否合格，从而构建并获得海洋链霉菌基因组文库。 In the present invention, the genome of Streptomyces marinum is interrupted by a DNA breaker (Hydro-Shear 0703, GeneMachine, USA) to obtain a fragment with a main band of 35-40kb, and the Klenow fragment is used to fill in the end, and the phenol-chloroform The purified DNA fragments were extracted and precipitated with ethanol, and the purified DNA fragments were confirmed by pulse-field electrophoresis, and then ligated into the Fosmid vector provided by Copycontrol Fosmid Library Production Kit (Epicentre, USA). In vitro packaged with phage packaging protein (Copycontrol Fosmid Library Production Kit, Epicentre), transfected into Escherichia coli EPI300, DNA was extracted by alkaline lysis, identified by Not I enzyme digestion, and the length of the inserted fragment was detected by pulse field electrophoresis. Determine whether the library is qualified, so as to construct and obtain the marine Streptomyces genome library.

使用卤化酶特异性引物对海洋链霉菌基因组文库进行筛选，最终得到13个阳性单克隆，对这13个阳性单克隆的双向进行末端测序，并选择其中一个进行全测序。在对序列结果进行分析后，获得海洋链霉菌卤化酶基因及其修饰的Complestatin类似基因簇。 The marine Streptomyces genome library was screened with halogenase-specific primers, and 13 positive single clones were finally obtained. The bidirectional end sequencing of these 13 positive single clones was performed, and one of them was selected for full sequencing. After analyzing the sequence results, the streptomyces marinum halogenase gene and its modified Complestatin similar gene cluster were obtained. the

实施例1：海洋链霉菌卤化酶基因的分离，以及其修饰产物基因簇的获得。 Example 1: Isolation of the halogenase gene of Streptomyces marinum and the acquisition of its modified product gene cluster. the

提取海洋链霉菌基因组DNA： Extraction of marine Streptomyces genomic DNA:

用TBS培养基（以g/L计, 胰蛋白胨 17，大豆蛋白胨 3，氯化钠 3，葡萄糖 2.5，磷酸氢二钾2.5，pH 7.5）在28℃，150rpm中培养48小时。收集放线菌菌体细胞10ml以上，将菌体细胞重悬于5ml SET缓冲液，加入适量0.1mm的玻璃珠进行漩涡震荡。用1ml 20mg/ml的溶菌酶，37℃消化2h以上，再加入500 μl 15mg/ml的蛋白酶K，37℃反应30min。之后加入1/10体积的20%SDS溶液，55℃反应1h。用1/3体积的5 M NaCl溶液, 室温反应 30 min，然后加入 1 : 1体积比的饱和酚/氯仿，混匀后置于室温反应30min。以8000 r/min 4℃ 离心20min ，弃蛋白沉淀，并向上清其中加入等体积的异丙醇，室温放置30min。用枪头或毛细管将析出的DNA绕出，并以70%乙醇洗涤DNA数次。最后将乙醇挥发干，将得到的DNA溶于ddH2O中。 Use TBS medium (in g/L, tryptone 17, soybean peptone 3, sodium chloride 3, glucose 2.5, dipotassium hydrogen phosphate 2.5, pH 7.5) at 28°C, 150rpm for 48 hours. Collect more than 10ml of actinomycetes cells, resuspend the cells in 5ml SET buffer, add an appropriate amount of 0.1mm glass beads and vortex. Digest with 1ml of 20mg/ml lysozyme at 37°C for more than 2h, then add 500 μl of 15mg/ml proteinase K, and react at 37°C for 30min. Then add 1/10 volume of 20% SDS solution and react at 55°C for 1h. Use 1/3 volume of 5 M NaCl solution, react at room temperature for 30 min, then add saturated phenol/chloroform at a volume ratio of 1:1, mix well, and react at room temperature for 30 min. Centrifuge at 8000 r/min at 4°C for 20 minutes, discard the protein precipitate, and add an equal volume of isopropanol to the supernatant, and place it at room temperature for 30 minutes. Use a pipette tip or capillary to detach the precipitated DNA, and wash the DNA several times with 70% ethanol. Finally, the ethanol was evaporated to dryness, and the obtained DNA was dissolved in ddH2O.

海洋链霉菌卤代酶基因序列的获得： Acquisition of the marine Streptomyces halogenase gene sequence:

由于海洋链霉菌基因组中的编码卤化酶的基因簇序列未知，所以尝试用兼并引物调取基因，在NCBI美国国家生物信息中心搜索已发布的放线菌卤化酶的氨基酸序列，利用Clustal W软件进行同源比对。根据比对结果，在这一类卤代酶的两个保守区，即FAD 结合位点(GGGXXG) 和色氨酸残基结合位点(GWTWXIP)的位置上，利用在线CODEHOP引物设计软件http://bioinfo.weizmann.ac.il/blocks/codehop.html上，设计简并引物。 Since the sequence of the gene cluster encoding halogenase in the Streptomyces marine genome is unknown, an attempt was made to retrieve the gene with an amalgamative primer, and the amino acid sequence of the published actinomycete halogenase was searched at the NCBI National Center for Biological Information, and the Clustal W software was used to carry out the analysis. homologous comparison. According to the comparison results, the online CODEHOP primer design software http: http://bioinfo.weizmann.ac.il/blocks/codehop.html, Designing degenerate primers.

表1 扩增海洋链霉菌卤代酶基因所用的CODEHOP简并引物引物名称引物序列 Halo-F* 5’-GACGTGGTGGTGGTCggnggnggncc -3' Halo-R* 5’-CATGGCGGAGTAGGTGgcnarrtgnac-3’ Table 1 CODEHOP degenerate primers used to amplify Streptomyces marine halogenase gene Primer name Primer sequence Halo-F* 5'-GACGTGGTGGTGGTCggngggnggncc-3' Halo-R* 5'-CATGGCGGAGTAGGTGgcnarrtgnac-3'

*注：简并引物中y代表CT；w代表AT；s代表CG; r代表AC；n代表 ACGT。 *Note: In degenerate primers, y stands for CT; w stands for AT; s stands for CG; r stands for AC; n stands for ACGT.

合成CODEHOP简并引物后，以海洋链霉菌基因组DNA为模板，进行Touchdown PCR扩增卤化酶基因并对PCR产物测序，获得约960bp的海洋链霉菌卤代酶基因序列。 After synthesizing CODEHOP degenerate primers, Genomic DNA of Streptomyces marine was used as a template to perform Touchdown PCR to amplify the halogenase gene and sequence the PCR product to obtain a sequence of about 960 bp of Streptomyces marine halogenase gene. the

PCR反应体系如表2&3： The PCR reaction system is shown in Table 2&3:

表2 PCR反应体系 Table 2 PCR reaction system

*注1：Primer F*代表Halo- F或sinH-F；Primer R*代表Halo-R或sinH-R； *Note 1: Primer F* stands for Halo-F or sinH-F; Primer R* stands for Halo-R or sinH-R;

*注2：加入DMSO的目的是减少高G+C %含量DNA之间的二级结构，使DNA变性充分。 *Note 2: The purpose of adding DMSO is to reduce the secondary structure between DNA with high G+C % content and fully denature DNA.

表3 Touchdown PCR反应程序温度时间循环次数 94℃ 3min 1 94℃ 30sec 64-56℃* 40sec 30 72℃ 1min 72℃ 10min 1 Table 3 Touchdown PCR reaction program temperature time Cycles 94°C 3min 1 94°C 30sec 64-56°C* 40sec 30 72°C 1min 72°C 10min 1

*注：Touchdown退火温度由64℃开始，每6个循环降低2℃，直至56℃。 *Note: The Touchdown annealing temperature starts at 64°C and decreases by 2°C every 6 cycles until it reaches 56°C.

制备基因组文库插入片段： Prepare Genomic Library Inserts:

取适量海洋链霉菌的基因组DNA，用DNA破碎仪（Hydro-Shear 0703,美国GeneMachine）将基因组DNA打断，然后将片断化的基因组DNA通过脉冲场电泳分离，在避免紫外照射的条件下切胶回收35～40kb的片断。 Take an appropriate amount of genomic DNA of Streptomyces marinum, and use a DNA fragmentation instrument (Hydro-Shear 0703, GeneMachine, USA) to break up the genomic DNA, then separate the fragmented genomic DNA by pulse-field electrophoresis, and recover by cutting the gel under the condition of avoiding ultraviolet radiation 35 ~ 40kb fragments.

DNA片断末端补平与Fosmid载体连接： The ends of the DNA fragments are blunted and ligated with the Fosmid vector:

将回收后的DNA片断用Klenow片段进行末端补平，并通过酚氯仿抽提乙醇沉淀精制DNA片断，精制后的DNA片段经过脉冲场电泳确认，连入Copycontrol Fosmid Library Production Kit (Epicentre,USA)提供的Fosmid载体。 The recovered DNA fragments were blunted with Klenow fragments, and the DNA fragments were purified by phenol-chloroform extraction and ethanol precipitation. The purified DNA fragments were confirmed by pulse-field electrophoresis and connected to Copycontrol Fosmid Library Production Kit (Epicentre, USA). Fosmid carrier.

文库的包装、转染、平板涂布、鉴定： Library packaging, transfection, plate coating, identification:

用噬菌体包装蛋白（Copycontrol Fosmid Library Production Kit, Epicentre）体外包装，转染大肠杆菌EPI300，然后涂布于含有氯霉素的LB平板中。随机挑取24个单克隆接种，过夜培养，用碱裂解法提取DNA，再用NotI作酶切鉴定，脉冲场电泳检测插入片断的长度。根据涂平板的结果和插入片断的长度，判断文库是否合格。 In vitro packaged with phage packaging protein (Copycontrol Fosmid Library Production Kit, Epicentre), transfected into Escherichia coli EPI300, and spread on LB plates containing chloramphenicol. Randomly pick 24 single clones to inoculate, cultivate overnight, extract DNA by alkaline lysis, then use NotI for enzyme digestion identification, and pulse field electrophoresis to detect the length of the inserted fragment. Judge whether the library is qualified or not according to the results of plate plating and the length of the inserted fragment.

基因组文库的筛选： Screening of Genomic Libraries:

由于简并引物有一定与模板DNA非特异性结合和产生二聚结构的几率，因此重新设计一对用于基因组文库筛选的特异性引物。PCR产物大小约为580bp, 在提高筛选的灵敏性和准确性的同时，也可以减少PCR扩增时所用的时间。 Since the degenerate primers have a certain chance of non-specific binding to the template DNA and producing a dimerization structure, a pair of specific primers for genomic library screening was redesigned. The size of the PCR product is about 580bp, which can reduce the time spent in PCR amplification while improving the sensitivity and accuracy of screening.

表4 海洋链霉菌基因组文库筛选用的特异性引物引物名称引物序列 sinH-F 5’- TGACGGCCATGCAGGGACA-3' sinH-R 5’- TCGAACGCCACCGACAGGA-3’ Table 4 Specific primers used for screening of Streptomyces marine genome library Primer name Primer sequence sinH-F 5'-TGACGGCCATGCAGGGACA-3' sinH-R 5'-TCGAACGCCACCGACAGGA-3'

用无菌牙签挑取单克隆，加入1.5mL含有氯霉素12.5μg/mL的LB培养基37℃振荡过夜培养。每个样品取适量，加入终浓度为20%的甘油，在-70℃保存。同时每个样品再取25 μL，每24个单克隆混合成一个小组，再将每8个小组混合成一个大组，将混合后的样品99℃煮沸10min破菌，取适量做模板，按表2和表3中的PCR反应体系进行Touchdown PCR，PCR产物进行凝胶电泳检测。 Pick a single clone with a sterile toothpick, add 1.5 mL of LB medium containing chloramphenicol 12.5 μg/mL and shake overnight at 37 °C. Take an appropriate amount of each sample, add glycerol with a final concentration of 20%, and store at -70°C. At the same time, take another 25 μL of each sample, mix every 24 single clones into a group, and then mix every 8 groups into a large group, boil the mixed sample at 99°C for 10 minutes to destroy the bacteria, take an appropriate amount as a template, and follow the table The PCR reaction systems in Table 2 and Table 3 were subjected to Touchdown PCR, and the PCR products were detected by gel electrophoresis.

在15个大组样品中，检测出10个能够扩增出PCR产物的样品组，进一步将阳性样品的大组下的8个小组分别做PCR检测，再将阳性样品的小组中的24个单克隆分别做PCR检测，最后得到13个阳性单克隆，并对这13个阳性单克隆的双向进行末端测序，并选择其中一个进行全测序。 Among the 15 large groups of samples, 10 sample groups capable of amplifying PCR products were detected, and the 8 groups under the large group of positive samples were further tested by PCR, and the 24 groups of the positive samples were tested separately. The clones were tested by PCR, and finally 13 positive single clones were obtained, and the two-way terminal sequencing of these 13 positive single clones was performed, and one of them was selected for full sequencing. the

实施例2：海洋链霉菌中编码Complestatin-like Compound的基因簇测序结果分析 Example 2: Analysis of sequencing results of gene clusters encoding Complestatin-like Compound in marine Streptomyces

海洋链霉菌卤化酶测序结果及分析 Sequencing Results and Analysis of Halogenase from Streptomyces marinum

卤化酶基因序列 Halogenase gene sequence

>sinH SEQ ID NO. 1 > sinH SEQ ID NO. 1

ATGACCCGCCGGGTGACAAGGGGAGGAGGGATGGCCTTGCCGGATTCCGAGGAATTCGATGTGGTGGTCGTCGGTGGAGGGCCCGCCGGATCGACGCTGGCCGCGTTGACGGCCATGCAGGGACACCGGGTGCTGGTCCTGGAGAAGGAGTTCTTCCCCCGTCACCAGATCGGGGAGTCGCTCCTGCCGGCCACCGTGCACGGCGTGTGCCGGCTGACCGGCGTGGCGGACGAGCTCGCCGCCGCGGGCTTCCCGCGCAAGCGCGGCGGCACGTTCAAGTGGGGCGCCAACCCCGAGCCGTGGACCTTCTCCTTCTCCGTCTCCCCGCGCATGACCGGGCCGACGTCCTACGCCTACCAGGTCGAGCGGGCCAAGTTCGACGAGATCCTGCTCAACAACGCCCGCCGGGTGGGCGCCGAGGTGCGCGAGGGCTGTGCCGCCGTCGACGTCGTCGAGGACGGGGAGCGGGTCCGGGGCGTCCGGTACACCGACGCCGACGGCCGCGAGCACCGGGCGTCGGCCACGTTCGTCGTGGACGCCTCCGGCAACGGAAGCCGGCTGTACCGGCGGGTGGGCGGAACCCGGGAGTACTCGGAGTTCTTCCGCAGCCTGGCCCTGTACGGCTACTTCGAGGGCGGCAAGCGGCTGCCGGAACCGAACTCGGGCAACATCCTGTCGGTGGCGTTCGAGAGCGGCTGGTTCTGGTACATCCCGCTGAGTCCGGACCTCACCAGCGTCGGTGCCGTGGTCCGCCGGGAGATGGCCGGCAAGATCCGGGGCGACTCCGGCAAGGCGCTGGCGGCGCTCATCGCCGAGTGCCCCCTGATCTCCGAGTACCTGGCGGACGCGCGGCGGGTCACCGAGGGCCCGTACGGGAAGCTCCGGGTCCGCAAGGACTACTCGTACCACCACACGACCTTCTCGCGGCCCGGCATGATCCTGGTCGGCGACGCTGCCTGCTTCGTGGACCCGGTGTTCTCCTCCGGCGTCCACCTGGCCACCTACAGCGCCCTGCTGGCGGCCCGCTCCATCAACAGCGTGCTCGCCGGGCTGGTCGGCGAGGACCGGGCCCTGCGGGAGTTCGAGTCCCGTTACCGCCGCGAGTACGGCGTCTTCTACGAGTTCCTGCTCTCCTTCTACGAGATGCACCAGGACGAGAACTCCTACTTCTGGCAGGCCAAGAAGGTCACCCGGGCCAACCGCCCGGAGCTGGAGTCGTTCGTCGAGCTCATCGGCGGGGTCTCCTCCGGCGAGCGGGTCCTGACGGACGCCGAGGTGCTGGCGAAGCGCTTCAGCTCGGGCTCCGCGGAGTTCGCCGCGGCCGTCGACGAACTCGCGGGCAGCGAGGACGGCAGCATGGTGCCGCTGTTCAAGTCCTCGGTGGTGCGCGAGGTCATGCAGGAGGGCGGCCAGGTCCAGATGCGCGCCCTGCTCGGCGAGGACGCCGAACCCGAGGCCCCCCTGTCCGCGGACGGCCTGGTGCCGTCCCCCGACGGCATGTTCTGGCTGCCCGCCCAGGGCACCGGCGAGTAG ATGACCCGCCGGGTGACAAGGGGAGGAGGGATGGCCTTGCCGGATTCCGAGGAATTCGATGTGGTGGTCGTCGGTGGAGGGCCCGCCGGATCGACGCTGGCCGCGTTGACGGCCATGCAGGGACACCGGGTGCTGGTCCTGGAGAAGGAGTTCTTCCCCCGTCACCAGATCGGGGAGTCGCTCCTGCCGGCCACCGTGCACGGCGTGTGCCGGCTGACCGGCGTGGCGGACGAGCTCGCCGCCGCGGGCTTCCCGCGCAAGCGCGGCGGCACGTTCAAGTGGGGCGCCAACCCCGAGCCGTGGACCTTCTCCTTCTCCGTCTCCCCGCGCATGACCGGGCCGACGTCCTACGCCTACCAGGTCGAGCGGGCCAAGTTCGACGAGATCCTGCTCAACAACGCCCGCCGGGTGGGCGCCGAGGTGCGCGAGGGCTGTGCCGCCGTCGACGTCGTCGAGGACGGGGAGCGGGTCCGGGGCGTCCGGTACACCGACGCCGACGGCCGCGAGCACCGGGCGTCGGCCACGTTCGTCGTGGACGCCTCCGGCAACGGAAGCCGGCTGTACCGGCGGGTGGGCGGAACCCGGGAGTACTCGGAGTTCTTCCGCAGCCTGGCCCTGTACGGCTACTTCGAGGGCGGCAAGCGGCTGCCGGAACCGAACTCGGGCAACATCCTGTCGGTGGCGTTCGAGAGCGGCTGGTTCTGGTACATCCCGCTGAGTCCGGACCTCACCAGCGTCGGTGCCGTGGTCCGCCGGGAGATGGCCGGCAAGATCCGGGGCGACTCCGGCAAGGCGCTGGCGGCGCTCATCGCCGAGTGCCCCCTGATCTCCGAGTACCTGGCGGACGCGCGGCGGGTCACCGAGGGCCCGTACGGGAAGCTCCGGGTCCGCAAGGACTACTCGTACCACCACACGACCTTCTCGCGGCCCGGCATGATCCTGGTCGGCGACGCTGCCTGCTTCGTGGACCCGGTGTTCTCCTCCGGCGTCCACCTGGCCA CCTACAGCGCCCTGCTGGCGGCCCGCTCCATCAACAGCGTGCTCGCCGGGCTGGTCGGCGAGGACCGGGCCCTGCGGGAGTTCGAGTCCCGTTACCGCCGCGAGTACGGCGTCTTCTACGAGTTCCTGCTCTCCTTCTACGAGATGCACCAGGACGAGAACTCCTACTTCTGGCAGGCCAAGAAGGTCACCCGGGCCAACCGCCCGGAGCTGGAGTCGTTCGTCGAGCTCATCGGCGGGGTCTCCTCCGGCGAGCGGGTCCTGACGGACGCCGAGGTGCTGGCGAAGCGCTTCAGCTCGGGCTCCGCGGAGTTCGCCGCGGCCGTCGACGAACTCGCGGGCAGCGAGGACGGCAGCATGGTGCCGCTGTTCAAGTCCTCGGTGGTGCGCGAGGTCATGCAGGAGGGCGGCCAGGTCCAGATGCGCGCCCTGCTCGGCGAGGACGCCGAACCCGAGGCCCCCCTGTCCGCGGACGGCCTGGTGCCGTCCCCCGACGGCATGTTCTGGCTGCCCGCCCAGGGCACCGGCGAGTAG

卤化酶编码的氨基酸序列 Amino acid sequence encoded by halogenase

>SinH SEQ ID NO. 2 >SinH SEQ ID NO. 2

MTRRVTRGGGMALPDSEEFDVVVVGGGPAGSTLAALTAMQGHRVLVLEKEFFPRHQIGESLLPATVHGVCRLTGVADELAAAGFPRKRGGTFKWGANPEPWTFSFSVSPRMTGPTYAYQVERAKFDEILLNNARRVGAEVREGCAAVDVVEDGERVRGVRYTDADGREHRASATFVVDASGNGSRLYRRVGGTREYSEFFRSLALYGYFEGGKRLPEPNSGNILSVAFESGWFWYIPLSPDLTSVGAVVRREMAGKIRGDSGKALAALIAECPLISEYLADARRVTEGPYGKLRVRKDYSYHHTTFSRPGMILVGDAACFVDPVFSSGVHLATYSALLAARSINSVLGLVGEDRALREFESRYRREYGVFYEFLLSFYEMHQDENSYFWQAKKVTRANRPELESFVELIGGVSSGERVLTDAEVLAKRFSSGSAEFAAAVDELAGSEDGSMVPLFKSSVVREVMQEGGQVQMRALLGEDAEPEAPLSADGLVPSPDGMFWLPAQGTGE MTRRVTRGGGMALPDSEEFDVVVVGGGPAGSTLAALTAMQGHRVLVLEKEFFPRHQIGESLLPATVHGVCRLTGVADELAAAGFPRKRGGTFKWGANPEPWTFSFSVSPRMTGPTYAYQVERAKFDEILLNNARRVGAEVREGCAAVDVVEDGERVRGVRYTDADGREHRASATFVVDASGNGSRLYRRVGGTREYSEFFRSLALYGYFEGGKRLPEPNSGNILSVAFESGWFWYIPLSPDLTSVGAVVRREMAGKIRGDSGKALAALIAECPLISEYLADARRVTEGPYGKLRVRKDYSYHHTTFSRPGMILVGDAACFVDPVFSSGVHLATYSALLAARSINSVLGLVGEDRALREFESRYRREYGVFYEFLLSFYEMHQDENSYFWQAKKVTRANRPELESFVELIGGVSSGERVLTDAEVLAKRFSSGSAEFAAAVDELAGSEDGSMVPLFKSSVVREVMQEGGQVQMRALLGEDAEPEAPLSADGLVPSPDGMFWLPAQGTGE

对测序结果进行分析，其中DNA序列分析开放阅读框架（ORF）分析是使用美国国家生物信息中心提供的ORF Finder 功能（http://www.ncbi.nlm.nih.gov/gorf/gorf.html）。DNA同源性分析是使用美国国家生物信息中心提供的世界范围的Blast引擎（http://www.ncbi.nlm.nih.gov/BLAST/）与各DNA数据库中进行对比。 The sequencing results were analyzed, and the DNA sequence analysis open reading frame (ORF) analysis was performed using the ORF Finder function provided by the National Center for Biological Information (http://www.ncbi.nlm.nih.gov/gorf/gorf.html) . The DNA homology analysis was compared with various DNA databases using the worldwide Blast engine (http://www.ncbi.nlm.nih.gov/BLAST/) provided by the National Center for Bioinformatics of the United States.

对氨基酸序列分析，其中分析目的蛋白氨基酸序列同源性分析是使用美国国家生物信息中心提供的世界范围的Blast引擎（http://www.ncbi.nlm.nih.gov/BLAST/）与各氨基酸序列数据库中的氨基酸序列进行对比。目的蛋白氨基酸序列保守结构域的分析是通过美国国家生物信息中心NCBI Conserved Domain Database search（http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi）。不同蛋白之间的氨基酸序列比对分析使用软件BioEdit。 For amino acid sequence analysis, the amino acid sequence homology analysis of the target protein is carried out using the worldwide Blast engine (http://www.ncbi.nlm.nih.gov/BLAST/) provided by the National Center for Biological Information of the United States and each amino acid The amino acid sequences in the sequence database were compared. The analysis of the conserved domain of the amino acid sequence of the target protein was carried out through the NCBI Conserved Domain Database search of the National Center for Bioinformatics (http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi). The amino acid sequence alignment analysis among different proteins uses the software BioEdit. the

海洋链霉菌卤化酶SinH与已知晶体结构的蛋白之间的比较（图1），其与FADH₂依赖型卤代酶的氨基酸十分相近，并且其第30-35个氨基酸为FAD 结合位点(GGGXXG)，在第243-249位氨基酸为色氨酸残基结合位点(GWTWXIP)。由此可以确认其为FADH₂依赖型卤代酶基因片段。通过与已知晶体结构的卤化酶氨基酸序列的同源比对可以看出，海洋链霉菌的卤化酶与chondrochloren生物合成基因簇中卤化酶CndH的同源性最高，有75%的同源性。海洋链霉菌卤化酶与氯霉素生物合成基因簇中卤化酶基因CmlS的同源性不高只有较低的55%，并且与研究较多的PrnA亚类卤化酶同源性更低，只有37.6%。因此，海洋链霉菌 S187的卤化酶序列普遍不同于已知晶体结构卤化酶序列，推测是一个新的卤代酶基因。 The comparison between the streptomyces marinum halogenase SinH and the protein with known crystal structure (Fig. 1), which is very similar to the amino acid of FADH ₂ -dependent halogenase, and its 30th-35th amino acid is the FAD binding site ( GGGXXG), the 243-249th amino acid is the tryptophan residue binding site (GWTWXIP). Thus, it can be confirmed that it is a fragment of the FADH _2- dependent halogenase gene. According to the homology comparison with the amino acid sequence of halogenase with known crystal structure, the halogenase of Streptomyces marinum has the highest homology with the halogenase CndH in the chondrochloren biosynthesis gene cluster, with 75% homology. The homology between Streptomyces marinum halogenase and the halogenase gene CmlS in the chloramphenicol biosynthesis gene cluster is not high, only 55%, and the homology with the more studied PrnA subclass halogenase is even lower, only 37.6% %. Therefore, the halogenase sequence of Streptomyces marinum S187 is generally different from the known crystal structure halogenase sequence, and it is presumed to be a new halogenase gene.

海洋链霉菌卤化酶氨基酸序列的系统发育树见图2，所选取的卤化酶为近期报道的抗生素生物合成基因簇中的卤化酶基因表达产物，黑色表示有晶体结构的蛋白。可以看出，SinH与complestatin基因簇中的蛋白ComH最相近。 The phylogenetic tree of the amino acid sequence of Streptomyces marinum halogenase is shown in Figure 2. The selected halogenase is the expression product of the halogenase gene in the recently reported antibiotic biosynthesis gene cluster, and the black color represents the protein with crystal structure. It can be seen that SinH is most similar to the protein ComH in the complestatin gene cluster. the

实施例3 Example 3

对实施例2的基因及其产物进行检测分析如下： The gene and product thereof of embodiment 2 are detected and analyzed as follows:

（1）海洋链霉菌Fosmid文库卤代酶阳性质粒的序列结果分析： (1) Sequence analysis of the halogenase-positive plasmid of the marine Streptomyces fosmid library:

将卤代酶阳性的Fosmid质粒测序结果与前述海洋链霉菌进行454和Solexa高通量测序相结合，对序列进行分析，其中DNA序列分析开放阅读框架（ORF）分析是使用美国国家生物信息中心提供的ORF Finder 功能（http://www.ncbi.nlm.nih.gov/gorf/gorf.html）。DNA同源性分析是使用美国国家生物信息中心提供的世界范围的Blast引擎（http://www.ncbi.nlm.nih.gov/BLAST/）与各DNA数据库中进行对比。 Combining the halogenase-positive Fosmid plasmid sequencing results with the 454 and Solexa high-throughput sequencing of the aforementioned marine Streptomyces, the sequence was analyzed, and the DNA sequence analysis open reading frame (ORF) analysis was provided by the National Center for Bioinformatics of the United States. ORF Finder function (http://www.ncbi.nlm.nih.gov/gorf/gorf.html). The DNA homology analysis was compared with various DNA databases using the worldwide Blast engine (http://www.ncbi.nlm.nih.gov/BLAST/) provided by the National Center for Bioinformatics of the United States.

对42.81kB测序信息进行注释后（表2）与S. lavendulae中Complestatin的基因簇进行比对（图3），可以预测海洋链霉菌中存在合成与具有抗补体活性的化合物complestatin的基因簇同源性极高的基因簇。 After annotating the 42.81kB sequencing information (Table 2) and comparing it with the gene cluster of complestatin in S. lavendulae (Figure 3), it can be predicted that there is a gene cluster homologous to the compound complestatin that synthesizes and has anti-complement activity in Streptomyces marine Highly sexed gene clusters.

海洋链霉菌卤化酶修饰的化合物的基因序列 Gene sequences of compounds modified by halogenase from Streptomyces marinum

>Complestatin-like gene cluster from S. xinghaiensis SEQ ID NO. 3 >Complestatin-like gene cluster from S. xinghaiensis SEQ ID NO. 3

ATGGTCGTCGAAGTCGAGATCAGCTCGCTGTCGACGGCCGGCTCGCCGCGGACCTCCGGAGCGGATCCGGAGCACGTGGAAACGCTGGCGGAGGCGCAGACTCCGCTGCCGCCCATCACCGTGCACCGCTCGACGATGCGGGTCATCGACGGGCTGCACCGGGTACGGGCCGCCGAACTCCGGGGGCAACGCAAGATCGCGGCAAGGTTCTTCGAGGGGGACGAGGCCGATGCCTTCGTCCTCGCCGTGGAATCCAACGTCACCCACGGTCTGCCGCTGACGACGGCGGACCGGAAGCGCGCGGCCGGGCGGATCATCGCCTCGCATCCGCAATGGTCGGACCGGATGATCGCCTCGGTCACCGGCATCGCCCCCGGAACGGTCGCGGAGATCCGCAGGCGCCGGCCCGAGGCCCAGGTCGGCGAGGTGAGCCGTATCGGGCAGGACGGCCGGGTCCGCCCGGTCAACGGGACCGAGGGCCGCAAGTTGGCCAGCCGGCTCATCGCCCAGGACCCGAGTCTGTCGCTCCGTCAGGTGGCGCGGGCCGCGTCCATCTCCCCGGAGACGGTCCGCGACGTACGGAACCGGATGATGCGCGGCGAGGATCCGCTGCCGGGGCCGCGGCGCGGGAACAAGAAGCGGGCGAACGGCACGGAGGTCCCCGCCGCGGGCCGCGGCGGACTCCGCCCCGCCGCGGTGGCCTGCCGGAACCCGGTCCAGGACCGTGCGGCGGTCCTGGACCGGCTCAGGGCGGATCCCGCGCTGCGGTTCAGCGAGACCGGGCGCACCTTGCTCCGGCTGCTCACCGTCCACATGATGAGTCCCGAGGAGTGGGACGCGATCATCGACAAGGTTCCGCCGCACTGCGGTGGCGTCGTGGCCCGGCTGGCGGGCGAATGCGCCGAGATGTGGGCGGAGTTCGCCCAGCGGGTCGAGCGCAAGGTCGCCGAGACGGCATAGCCGTCCGGGTGTCCGAGTGAGAAATCTGCCCGGTTGGACGCCGGGGGGCGGGCATCCGGCCGGGCGCTCCGGCCGGGCGCTCCGCCCGTCCAGCGGGCGGGACTTGCACCACTTCCCGGGCTCTGAGAAAGTCCCTCAGCGCGGCGCCGTCCACCGCACACCACCGTTTCCCGGTGGCCGCGCCCGCGGAATTCCCTCCGCCCCGTGAAAAGCGCGACGCGCGGCATCCGGTCCCCCGGACGGATAATCCGGGGGCATTGCACCGCCGTTCTCACACTTCGGTCCGGCCGGCCCTCCATTCCTCTTTCCGTCGGCGTGGTAACGGCCCTGTTCATCCCGTCCAATTCTCCGGACCGTCCGTCATACCTGGCCGGCGGTAAATGCAGAACGGTATGGTCCTCGTGCGGGGGGAATCGATGGAAGCAATTGATCGCTGTGCTGTAACCGGCCCCGTTCCGGCCCGCCGTCACCGCAAACCGCAGGCCCGCGGACCATTCCGTGACATGGCAGCCAAGAGAGCAGAAGAGCCGACGCAGGAGGTTTCCGTCGCGTGTTGATAACCCAAGGCCCTGGTGGCCCCACTGTCGGGGGGCCGCATTCCGCCGCGGCGCAGAAACAGACGCTCCGGCCGGGGACCGTGCGCAGGGCGCTGGCTTATATGAGGCCGCACCGGAGTGCGCTGTTCCTGCTGCTGGCCGTCACCGCGGTGGATTCCCTCATCATCGTGTCCACGCCACTGCTGCTGAAGAAGATCATCGATGACGGCATTCTCAGGGACGACATGGCCGTGGTCACGACCATCGCCCTCGTCGTCGCCGGACTCGCCGTCGTCGACGCCTTCGCGCAGCTCGGGCAGAGCTACATCTCCGGGCGCATCGGACAGGGCGTCAGCCACGATCTGCGGGTCGAGACGTTCAAGCACGTCCAGCGGCAGCCGATGGCGTTCTTCACCCGGACCCAGATCGGTCTGCTCGCCAGCCGGCTGAACGGTGACGTCATGCTGGCGCAGCAGGCTCTCAGCACCCTGCTGACGTCGGTGACCAGCGTGCTGACCGTGGTCCTCGTACTCGCCGAGATGTTCTATCTGTCCTGGCTCATCAGCCTGATCGCCGTGTGCATGCTGCCGCTGTTCGTCATCCCGGCCATCTACGTCGGACGGCGCCTCCAGCGCTACTCCCGCGAGCAGATGCAGGCCAACGGCGAGCTGGGCGGCATCATCAGCGAACGCTTCAACGCGGGCGGCGCCATGCTCGCCAAGCTCTACGGCCGCCCGCGCGAGGAGGCGGACGCCTTCGAGACCCGGGCGCGCACCGTGCGCGAGGTCGGCGTGGTCTGGACGGTCTACAGCCGGCTGTCGTTCATCTTCATGGCGCTGCTCGCCTCGCTCACCACCGCGCTCGTCTACGGCGTCGGCGGCGGCCTGGTCCTGAACGACGTCTTCCAGATCGGCACGCTGGTGGCCCTGGCCGCTCTTCTCGGCCGGCTCTACGGGCCGATCACCCAGCTCTCCGCCATGCAGTCCAACGCGCTGACCGCGATGGTCAGTTTCGACCGGCTCTTCGAGATCCTCGATCTCAAGCCGCTCATCGAGGAGAGCCCGGACGCCGTCGCCCTGCCCGCGCCGGGCGGCGGGCCCGCGCCGGAGATCGAGTTCGAGGGGGTGTCGTTCCGGTATCCGCGCGCCGGCGACGTCTCCCTGGTCTCCCTGGAGTCCAGCGCGCTCTCCCCGGCCGAGCGGGAGAAGGAGACGGCGGAAGTCCTCCACGACCTCAGCTTCCGGGCGCCGGCCGGCAAACTCACGGCCCTCGTCGGCCCGTCGGGCGGGGGCAAGACGACCACCACCCACCTGGTGTCCCGGCTCTACGACCCGACCTCGGGCACCGTCCGCATCGACGGCCACGACCTGCGCGACGTCACCCTCGACTCCCTGCGCGACGTTGTGGGCGTGGTCAGCCAGGACGCCCACTTCTACCACGACACGATCCGGGCAAACCTCCTCTACGCCCGTCCCGAGGCCACCGAGCGGGAACTGCTCGACGCCTGCCGGTCCGCGCGGATCGGCGATCTCGTCGCCTCGCTCCCGAGCGGCCTCGACACCGTGGTCGGCGACCGCGGGTACCGGCTCTCGGGCGGGGAGAAGCAGCGGCTCGCCCTGGCCAGACTGCTGCTGAAGGCCCCCTCCGTCGTGGTGCTCGACGAGGCCACCGCGCACCTGGACTCCGAGTCCGAGGCGGCCATCCAGCGGGCGCTGACCACCGCGCTGCGCGACCGGACCTCGCTGGTCATCGCCCACCGGCTGTCCACCATCCGCGAGGCCGACCAGATCCTCGTCATCGACGGGGGCCGGGTGCGCGAGAGCGGGACGCACGAGGAACTGCTGGCGGGGGGCGGGCTCTACGCCGAGCTCTACCACACCCAGTTCAACCGGCCGGGCGCCAACGGCACCGGCTCCGACGGCGGGGGACACGCCCACGAGGCGCTGGTTCCCGCACCGGTTGCCGGGGACGGCGACCTCGCGGCCCGTCAGCCGGTCGCCGGAGGCTCCCTCGCCCTGGGCGGAACCGTGCCGCCGGGGGCCGGCGGCGACCTCGTCGTCCGCCGCCATTCCGAAGAGCACTAGCGCCTTCCGGCCGGCCGCGGGGCCGGCCGGGAGGGGCCGACGACCGGCGAAGACCGACGAAAAGCAGCGGGCACCCGCTGAAGGGGGAATGTGATGAACGGCCAGGAGGGTTCCACCCTGCCCCTGTCCGAATGCCAGGAGGGAATCTGGCTGGCACAGCGGATAGAGAGCTCTCGAGGGCTCTACCACATCGGCCAGTACATCGAAATCCTCGGCCCCGTGGACACCCGGGTCTTCGAACTCGCGTTGCGCCGGGCCGTCGAGGAAACCGACATCCTGCGGGTGCGTTTCGTCGAGGATTCCGCGGGCCGGGTCTCCCAGTGGATCGGCCCCCCGCCGGAATGGAGCATGCCGGTCGTCGACCTCAGCGGGGAAAAGGATCCGTGGCAGGCCGCCGGGACGTGGATGCGCGGCGAGCTGGGCCGGGTGAACGATCCCACCGAGGGCGGACTTTTCGCTCATGCGCTGTTCACGCTCGCGGCCGACCGCCATATCTGGTACCAGCGCTACAACCATCTGCTGATGGACGGCTTCGCCTGTTCCCTGATGGGGCGGCGCGTCGCCGACCTCTACACGGCGATGCTGCGCGGAGAGCCGTTACGGGCACCCGGATACGCCCCGCTCGGCGAACTGCTGGCCCAGGAATCCGCCTACCGTGCGTCCGAGCAGTGCGCACGCGACCGGCAGTACTGGCACGACCGCTTCGCCGACCGCCCCGATCCGGCGGCCGTTCCCGGCCACCGTCCGTGCCACGGGCCATCTGCCGCCCCCCGAGGTGGCGGCCCTGCACGCGGCCGCGGCCGGCGCGAAGGTGAGCTGGCCCCGGTTCCTCGTCGCCGCGGTGGCGGCCTTCACCAGCCGGATGACCGGTGCGGACGAGGCCGTGCTCAGCATCCCCGTCGCCGGGCGCACGAGCGCCCAGGCGCGGCGGACCCCCTGCACGATGGCGAACATGCTGCCGTTCCGGCTGCCCGCCGGCCCCTCGGCGAACCCGGCCGAACTGGCGCGGGAGGCGGAGCGGGAGGCCACCGGGCTCCTCGGGCACCAGCGCTTCCGGGGCGAGCGGCTGCGCCAGGAGCTCGACTGGCCGAGTGGGGGCCGGTGGCATTTCGGCCCCTCCGTGAACATCCTGCCCCTCGGTGCCAACCTGCGTTTCGGAGAGTGCCGGGGGATCGTCCGCGACCTGTCGAGCCGGCGCGTCGAGGAAGTGGGCGTGGTGGTCAGCGGCTGGTCGGACGACCGGGGCATGGCGGTGGCCCTGGAGGCCAACGCGGCGCACTACGACGAGGACTGGGCGCGTGCGGGCCACCGGTCCCTTCTCTCGTTCATGGAGCGGGTGGTCGCTGACCCGTCGGTGCCGGTGGGCCGGATCGGTGTGCTGGACGCGGCCGGACACGGGCGGATCGTCGGGGGCTGGAGTGCGACGGCTGGTGAGCCGCCGGGGCTGTCCGTGCCGGAGCTGGTGGCGGGGCGGGTGCGGGAGGCGCCGGGCGCGGTGGCGGTGGTGGAGGGTGAACGGTCGCTGTCGTACGGGGAGTTGGACGGGGCAGCGGGTCGTCTGGCGGGGTTTCTGTCCTCGCTGGGTGTGGGGCGTGGTGAGCGGGTCGCGGTGGTGATGGAGCGGTCGGCGGATCTGCTGGTGGCGCTGCTCGGGGTGTGGAGGGCCGGGGCAGCGTATGTGCCGGTGGACGCCGGTTCTCCGGTGGAGCGGGTGGCGTTCGTGCTGGCCGATGCCGCTCCGGTGGTGGTGCTGTGTACGGAGGCGACGCGGGGTGTGATCCCGGAGGACAGCGCCGTGCGGGTGCTGGTATGGGACGACCCGGCCCTGGCGGTCGAACTGGCCGCCGTGGAGGTGCCGTTGTCCGTTCCGGTGGGTCCGCGGGACGTGGCGTATGTGATGTACACGTCCGGTTCGACGGGGGTGCCGAAGGGTGTGGCGGTGCCGCACGGCGGTGTGGCGGCGCTGGTCGGGGAGCGGGAGTGGTCGGTCGGGCGGGATGACGCGGTGCTGATGCACGCCCCGCACGCGTTCGACGTATCGCTGTTCGAGGTGTGGGTTCCGCTCGCCGCCGGCGCCCGGGTCGTCGTCGCCGAGCCGGGAGCGGTCGAGGCCGCACGGCTGCGGGAGGGCGTCGCCGGTGACGGGCTGACAGCGGTGCACCTGACCGCCGGTTCGTTCCGCGTCCTCGCGGCCGAGGCGCCGGAGTGTTTCCGAGGCCTGCGCCAGGTGCTGACCGGCGGTGACGTCGTGCCGCCGGAGGCGGTGGCCCGGGTGCGGGAGGCGTGCCCGGAGGTGTCCGTCCGTCATCTGTACGGGCCCACGGAGACCACGCTCTGCGCGACCTGGCACGAGCTGCGTCCCGGTGGCGTGCTGGGGGAGGTGCTGCCGATCGGCCGCCCGCTGCCCGGCCGGCGCACCTTCGTCCTCGACGCCTTCCTCCAGCCGGTACCGCCCGGTGCGGTGGGGGAGCTGTACGTCGCAGGGCCCGGCCTCGCCCGGGGCTACTGGGACCGGCCGGGCCCGACGGCCGAGCGGTTCCTCGCCTGCCCGTTCCTCCCCGGCGAGCGGATGTACCGCACCGGCGACCTGGTCCGCTGGACCGGCACCGGCGAACTCCTCTTCGTGGGCCGCGCGGACGGCCAGGTCAAGCTGCGCGGGTTCCGGGTGGAGCCGGGCGAGGTGGAGGCGGCCCTGGCCACCCACCCGGCCGTCGCGCAGGCGGTGGTGGTGGCCCGTGAGGACCGTCCGGGCGAACGCCGCCTGGTCGGCTACGTCGTCCCGGACGGAACCGGCACCCCGGACGGAACCGGAGCCCCCGACCCGCGGGCCGTGCGCGAGCATGCCGCCGGCATCCTGCCGGAGTACATGGTCCCGGCCGCCGTCCTCGTCCTGGACGCGCTCCCGGTCACCGCCAACGGCAAGGTGGACCGCAGGGCGCTGCCCGCCCCGGACTTCGCCGAGCGGGTCTCCGGCCGTGCGCCCCGGACCGCCGTCGAGGAGACGCTGTGCCGGCTCTCCGCCGAGGTGCTGGGCCTGGAGCGGGTCGGCGCCGAGGACAGCTTCTTCTCCCTGGGCGGGGACTCGATCATGGCGATGCAGCTCGCCGCCCGCGCCCGCCGCGCCGGCCTGCTCTTCAAGCCGCAGGACGTGTTCGAGCACGAGACCCCCGCCGGCCTGGCGGCGGTGGCCGCCGCCGGGCCGCTCCCCGCGGAGTCCGGGCCCGCCGGCGGCCACCGTGCGGGCGACGGCTCCCTCCTGGCGTCCCTGCGCCCCGGCGAACTCGACGACTTGCGGGCCAGGGTGCCCGGTCTGGTGGACGTCTGGCCGCTGTCGCCACTGCAGGAGGGCATGCTCTTCCACGCCACCTCCCACGACCGGGGCCCGGACGTGTACACGAGCCGGCGCATGCTGGCCCTGGACGGGCCGCTGGACACGGACCGGCTCCGGGCGTCCTGGCAGACGCTGCTGGACCGGCACGAGGTGCTGCGCGCCGGTTTCCACCGGCGCGAGTCCGGAGAGACCGTGCAGGTCATCGCCCGGGACGTGGCACTGCCCTGGCGGGAGGCCGACCTGTCGCACCTCCCGGAGGACACCGCCCGGGAGGAACTCGCGCGGCTCGCCCGCGCCGAGCGGGCGGAACGTTTCGACCTCGCGGCCGCCCCGCTGCTGCGGCTCCTGCTGGTCCGTCTCGGCGCGGACCGGTACCGCCAGATCATCACCGCCCACCACACGCTCATCGACGGCTGGTCCATGTCCGTCCTCTTCGCCGAGCTGGCCGAGGTGTACGCGGCCGACGGCGACGGGCGGGCGCTGCCGGCGCCGGCCTCGTACCGGGAGTACCTGGCCTGGCTGGAACGGCAGGACCGGGACGCGGCACGGGAGGCCTGGCGGGCGGAGCTCGCGGACACGGCGGAGCCGACCCTGGTGGCCCCCGAGGACCGGGTGAGCACACCGGTGCTGCCGGAGCCGGTGTCCTTCGAGTTCACCGAGGAGCTCACCCGCGGCGTGACGGAACTGGCCCGCACCCACGGGGTGACCGTGAACACCGTCATACAGGCCGCCTGGGCCCTGGTGCTGGCACGTCTGGTGGGGCGCACCGACGTGGTGTTCGGCACCACGGTGGCCGGCCGTCCCGCGGACCTGCCCGGGGCCGAGTCGGCGGTCGGCCCTTTCATCAACACCCTGCCGGTGAGGGTCGGACTGGTGCCGGAACAGCCCGTCGCGGAGCTGCTGGCCGGTCTCCGGGACCGGCAGGTGGCGCAGATGGGCCGCCAGTTCACCGGGCTCCAGGAGATCCGCCGGCTCGCCGGCCCCGGCGCCGTCTTCGACACGCTCGTCGTGTACGAGAACCTGCCCCGGACGGCGCGGGACACCGCCTCCCCGGCCATCCGTCCCGTCGGGGAGCCCACGGACATGGGCCACTTCCCGCTGGCGCTGATCGTGGTGCCCGACGAGCGGCTGCGCGGCCACCTCGTCCACCGCCCGGACGCGGTCGGGCGGAGCCGTGCCCGGGAACTGGTCTCCTGGCTGACGCGGGTGCTGGAACGGATGACGGCGGACCCGGCGTCCCCGGTGGGCCGGGTCGGCGTCCTGGACACGGCGGAGCGCGCCCTCGTCCTGGACACGTGGAACCCCCCGGCCACGGCGGAACCGGACGTGCCGGCACCGGAGCTGTTCGCCCGTGCGGCCGCGGCCGTGCCCGGCGCCGTGGCGGTCGAGGACGGCCGCCGCTCCCTGACCTACCGCGAACTCTCCGCGGAGACCCGGCGCCTGGCGCACCACCTGGCCGGCGCGGGCGTGGGCCCGGAGACCCGAGTCGGCGTCATCGCGGACCGTTCGGCGGAACTCGTCACGGCCCTGCTGGCGATCTCCCTGGCGGGCGGCGTCTACGTGCCCATGGACCCGGCCCACCCCCCGGCCCGGCTGCGCCTGATGCTGGACGACGTCGCCCCGCCGGTACTGCTGTGCACCCGGGACACCCGCGCCGTGGTGCCGGCGGCGTTCCCCGGCCGCATCGTGGTCCTCGGCGAGGCCGGCGCCGGCAGCGCGGAGGCCGGGCGTACCGGCGGTGACGGCCCGGACGCCTGGCGCCCGCCACGGCTGAGCCCGGCGAACGCGGCCTACGTGATCCACACCTCCGGGTCGACCGGAACCCCCAAGGGCGTGGTCACCTCCCACCGCGGACTGGCCAACCTCGTGGCCGTCCACATCGATCGGTACGCCCTCGGCACCGGCAGCCGGGTGCTGCAACTGCTCTCGCCCGGCTTCGACGTCTCGATGGCCGACATCTGGCCGGTGCTGTGCGCGGGCGGGCGGCTGGTGCTGGCCCCGCCGGGACGGCTCCACGCGACCGGTGAGGAACTGGTCGGGCTGATGCGCGACCGGCGGATCACCCGCGTCGCGATGACCCCGACCCTGCTGGCGCAGCTCCCCCCGGAGGACCTGCCCGACCTGCGCACGCTGGTCCTCGGCGGCGAGCCCGCGCCCGAGGACGTGCGCCGGCGCTGGTCGGCCGGCCGGGAGATGTACAACGAGTACGGGGTCACCGAGGCGACCGTCACCTCCACCCTGTACCGGACCCCGGACGGCCCCGGCACGCCGCCGATCGGCCGCCCCGTCGGCAACACCCGGGCCTATGTGCTCGACGGCTTCCTGCAGCCCGTACCGCCGGGCACGGCGGGCGAGCTGTACCTCGCGGGCGCGGGCCTGGCCCGCGGCTACCTGGGGCGGGCGCGGCTGACGGCCGAGCGGTTCGTCGCCTGCCCGTTCGCCCCCGGGGAGCGGATGTACCGCACCGGCGACCTCGCGCACTGGACCGCCGACGGCCGGCTCGTCTACGCGGGCCGCGCCGACGCCCAGGTGAAGGTCCGCGGCTTCCGCGTGGAACTCGGCGAGATCGAGGCGGCCCTCTCCGCTCACCCGGCCGTCGAACGGGCCGTGGTCGTCGCCCGCGAGGACCGCCCGGGCGAGCGCCGCCTGGTCGGCTACGCGGTCCCGTACGGAGGTGCGGTGGACGGGCGGTCCCTGCGCGAGCACCTCGCCGGGACGCTTCCGGAGTACATGGTGCCCGCGGCCGTGGTGACCCTGGACGCGCTGCCGGTCACCGGCCACGGAAAGATCGACACGAAGGCCCTGCCCGCCCCGGACCTCACCGGCAACGCCTCCGGACGGGCACCGGAAAGCCGGGCCGAGACGATCCTGTGCGCCCTGTTCGCCGAGGTGCTGGGAGCCGGGCGGGTCGGACCCGACGACAATTTCTTCGGGCTCGGCGGGGACTCGATCACCTCGATGCAGCTGGTGAGCCGCGCCCGGAGCGAGGACGTGGTCTTCACCTCCCAGGACGTGTTCGAGCACGAGACCCCCGCGGGACTCGCGGCGATCGCCCGGTTCGGCGACCGCGCCGGGGCCGGCCCGGACCACGGCGTCGGCGAGGTGGAGTGGACCCCCGTCATGCGGCAGCTCGGTGAGCGGGTGACCGGCGGCGCGTTCGCCCAGTGGGTGGTGCTCGGGTCCCCGGCCGGGCTGCGGCGGGATGCCCTGGTGGCCGCCGTGGCCGCGGTCCTCGACACCCACGCCATGCTGCGCCTCCGCGTGCTCCCGGGCGAGAACGGGCCGCGTCTGCTGACCGGCGAACCCGGATCGGCCGACGCCGCGGGCCTGGTCACCCGCGTGGACGCCGCTGGGATCGCGGCCTCCGGCCTGGACGCGCTCGCCGGACGGGTGGCGCGCGACGCGGTGGCGCGCCTGGACCCGGGCGCCGGCGCGGTGTTCCGGGTGGTGTGGGTGGACGCCGGGCCGGAGCGGACCGGCCGGCTCGTGCTGGTGGCGCACCACCTCTCCGTGGACGGCGTGTCCTGGCGCATCCTCGCCCCCGACCTGCGGGCCGCGTACGAGGCGGCCGAGGCCGGCCGGAAACCGGGACTCGAACCCGTCGCCACCTCCTTCCGGCAGTGGGCCGGCCTGCTGGCCGCCCAGGCCGCCCAACCGGCCCGGACCGCCGAACTGGCGTCCTGGACCGCTCTCCTCGACGGCGTCCGGCCGCCCCGCGGCATCGGTGCGCCGGACCCCGTGCGGGACACCGCCGCGACGGTGCGCCGCCGGACCCTGGTGGTGCCCGCGCGGCAGGCGCGGACACTGGTGAGCCGCGCCCCGGCGGTCTTCCACTGCGGTGTGCACGACATCCTGCTCGCCGCCCTCGCCGCCGCCGTCGCCCACTGGTGGCAGGACAGCGGCACCGCGCTGCTCGTCGACGTCGAGGGCCACGGGCGCGAGCCGCTCGACGGCACCGACGTGCTGCGCACGGTGGGCTGGTTCACCGGCGTCCACCCCGTGCGGCTGGACACCTCCGGCACCGACCCGTCCGAAGTGGCGGCCGGCGGCCCGGCGGCCGGCGCGCTGCTGAAGGCGGTCAAGGAGCAGGCCCGCGCGGTGCCCGGGGACGGACTCGGCTACGGGCTGCTGCGCCACCTCAACCCCGCCACCGGACCGGTGCTGGCCGGACTGCCGAGCCCCCGGATCGGCTTCAACTACCTGGGCCGCTTCCCGGCCGGCGCACGGTCCGACGCGGTGAAACCGTGGCAGATGGCCGGCGAGACGGCGATCGGCGGCTCCGCGGACCCCGGCATGCCGGCGGTGCACGCCCTCGAAGCCGGAGCGGCCGTCCGGGACACCGCCGACGGCCCCGAACTCGTCATCACGCTGAGCCGGCCCGCGGCCCTGCTGGACGACGCGTCGGCGGACCGGCTGGGCCGGCTCTGGCTGGACATGCTCGCCGGGCTGGCCGCTCACGCCGTCGACCCCGGAGCGGGCGGGCACACCCCCTCCGACTTCCCGCTCCTCGACCTCGCGCAGGACGAGGTCGAGCAATTCGAAGCGATAGCAGCCCAGCTCGAAGGAGGTCTGTCGCTGTGAACTCACCGGCCGCGGCCAGAGGGTCCGCACTCGCGGAGGTCTGGCCCCTCTCGCCCCTGCAGGAAGGGCTGCTGTTCCACGCGGACTTCGACGCCCAGGGGCCCGACGTCTACACCGTGCAGACGGTCCTGGAGATCGGCGGAACCCTGGACGCCCGCCGCTTCCGCGCCGCCTGGGAGACGGTGGTGGCCCGGCACGCCGCGCTCCGCGCGAGCTTCCACCGGCGCAGGACCGGCGAAGCGGTGCAGATCATCCCCCGGGAGGTGACCCTGCCCTGGCAGGAGGCCGACCTGTCGGACCTGACCGCCGCCGACGCGGAGGCCCGCGTCCGGCGGCTGGCCGGGAGCGAGCGTGACCGCCGGATCGACCCGGCGGTGGCACCGCTGCTGCGGCTGCTCCTCGTCCGGCTCGGCGAGGACCGGCACAGCCTGGTGATGACCAGCCACCACCTGCTGATGGACGGCTGGTCCATGCCTCTGCTGCTCAATGAGCTCACCGCCGCCTACGCGGCCGGTGACCAGGCAGCCCCGCCGGCGCACCCGGCCTCGTACCGCGAATACCTGGCGTGGCTCGGCCGGCAGGACAAGGAGACGGCCCGGGACGCCTGGAAGGCGGAACTGGCCGGGGCCGACGAGCCGACGCTGGTCGCCGGGCCGGGGAACACGGCCCGGGCCGGGGCGCCCCCCAGAAGAAACGCGTCCTGGATCCCGGAGAAGACGGCCGGTGCCATCGGGGACCTGGCCCGCCGGCACGGGCTGACGGTGAACACCGTGCTCCAGGGCGCCTGGGCGCTGGTACTCGCCCGGCTCACCGGCCGGACCGACGTGGTGTTCGGCGCCACCGTCGCCGGGCGGCCCCCGGAACTGCCGCGCGTCGAATCGATGATCGGGCTGTTCATCAACACCCTTCCCGTCCGGGTCCGGCTCGACGGCTCCCGGTCCCTGCTGGAACTCCTCACCCGGGTGCAGGAGCACCAGTCCGCGCTCATGCCCCACCAGCACCTCGGGCTCGCGGAGATCCAGGGCCTCGCCGGGCCCGGCGCCGTCTTCGACACGCTCATGGTCTACGAGAACTACCCGCGCCCGCCCGCCGCGGAGTCCGCCACGGCCGAGACCCTCACGCTCACCGTGGCCGAAGCCCGCCAGGCCACCCACTACCCGCTGACGGTCGGCGTCCTGCCCGGTGAGCGCTTCCGCGTGGACGTGACCTACCGGCCGGACCTCGTCGGTGAGGAGATCGGCGAGGCGGTGGGCGGATGGCTCGTGCGGATCCTGGAGCAGATGGCCGCGGACCCGTCGGTACCGGTGGCACGGCTGGACCTGCTGCCCGCGGACGCACGCGGGCTGGTGCTGGAGGGCTGGAGTGCGACGGCGGGCGAGCCGCCGGGGCTGTCCGTGCCGGAGCTGGTGGCGGGGCGGGTGCGGGAGGCGCCGGGCGCGGTGGCGGTGGTGGAGGGTGAACGGTCGCTGTCGTACGGGGAGTTGGACGACGGGGCGGGGCGTTTGGCGGGGTTTTTGTCCTCGCTGGGTGTGGGGCGTGGTGAGCGGGTCGCGGTGGTGATGGAGCGGTCGGCGGATCTGCTGGTGGCGCTGCTCGGGGTGTGGAGGGCCGGGGCGGCGTATGTGCCGGTGGATGCGGGTTCTCCGGTGGAGCGGGTGGCGCTGGTGCTGGAGGACGCGGCTCCGGTGGTGGTGTTGTGTACGGAGGCGACGCGGGGTGCGGTGCCGGAGGATGCGGCCGTGCGGGTGCTGGTGCTGGACGACCCGGCCGTGGCGGTCGAACTGGCCACCGTGGAGGTGCCGTTGTCCGTCCCGGTGGGTCCGCGGGACGTGGCGTATGTGATGTACACGTCCGGTTCGACGGGGGTGCCGAAGGGTGTGGCGGTGCCGCACGGCGGTGTGGCGGCGCTGGTCGGGGAGCGGGAGTGGTCGGTCGGGTCGGGTGACGCGGTGCTGATGCACGCCCCGCACGCGTTCGACGCCTCGCTGTTCGAGGTATGGGTGCCCCTCGTCGCCGGTGCGCGGGTGGTGGTCGCCGAACCGGGCGCGGTCGAGGCCCAGCAGGTGCGGCAGCACATAGCCGGCGGTGTGACCGCGTTGCATGTGACGGCTGGTTCGTTCCGGGTGCTGGCGGAGGAGTCCCCGGAGTGTTTCCGGGGTCTGCGTCAGGTGCTGACGGGCGGTGACGTGGTGCCGGTCGCCTCGGTGGCGCGGGTGCGGGAGGCGTGTCCGGACGTCTTGGTGCGGCATCTGTACGGGCCGACGGAGACGACGCTGTGCGCGACCTGGCACGAGTTGCGTCCCGGTGACGTGCTGGGGGAGGTGCTGCCGATCGGCCGCCCGCTGCCCGGCCGGCGCACCTTCGTCCTCGACGCCTTCCTGCAGCCGGTGCCTCCGGGTGTGACCGGTGAACTGCACGTGGCCGGTGCGGGGTTGGCGCGCGGTTACTGGGGCGGGCCGGGCCCGACGGGCGAGCGGTTCGTGGCCTGCCCGTTCCTCCCGGGCGAGCGGATGTACCGCACCGGCGACCTGGTGCGCTGGACCCGGGACGGTGAGCTTCTCTTCGCCGGCCGCGCCGATACACAGGTCAAGATCCGGGGCTACCGTGTCGAACTCGGCGAGGTGGAGGCCGCCCTGGCCGCGTCCCCGGGCGTCGCCCAAGCGGTGGTGGTGGCACGGGAGGACCGGCCGGGTGAACGCCGGCTGGTCGGCTACGTCGTCCCGGACGGAACCGGCGGCCCCGACCCGCAGGCCGTGCGCGAGCGGGCCGCCGCGGTGCTGCCGGAGTACATGGTCCCCGCCGCCGTCCTCGTCCTGGACACCCTGCCCGTGACCCGTAACGGAAAAGTCGACCGAGCGGCCCTGCCCGCCCCGGACTTCACCGAACGGGTCGCCGGCCGTGAGCCGCGGACGGCGGCGGAGGAGACGCTGTGCCGGCTCTTCGCCGAGGTGCTGGGTGTGGAGCGGGTCGGCGTCGAGGACAGTTTCTTCTCGCTCGGCGGGGACTCGATCATGTCGATGCAGCTCGCCGCCCGTGCCCGCCGCGCGGACCTGCTCTTCAAGGCCCAGGACGTCTTCGAGCGCGAGACCCCCGCCGGACTGGCCGCCGTCGCCCACAGCGCGGCCCGGGAAACCTCCGGGCCGGACACGGGCGCGGGCGAGGTGCCCTGGACACCGGTGATGCGTGAGCTGGGCGAGCACGCCGTCCGGCCGAAGCTGGCGCAGTGGATGACCGTCGGAGCACCGGCGGACCTCGAACAGGACGTTCTGGTGAGCGCCCTGAACGCGGTCGCCGACACCCACGCCATGCTCCGCGCCGTGGTCCTGCCGGGCGAGACGGGGCCACGCCTGGTCGTCGGGGAACGCGGTTCGGTGGACGCGGCCGAGCGGATCGGCCGACTGGACGCCACCGGGGCGGCGGACGGCGATCTGGACGGCATCGCCGGCCGCGCGGCGCGGGAGGCCGCGGAGGGGCTGGACCCCTCCGCGGGCGTGTTGTTCCGGGTGGTGTGGGTGGACGCCGGACCGGACCGCCCGGGCCGGCTCGCGCTGGCGGCGCACCACCTCGCGGTCGACGGCGTCTCCTGGCGCATCCTGCTGCCCGACCTGGAAGCCGCGTACGAGGCGGTCGCGGCCGGGCGGAAGCCGGAACTCGATCCGGTGCCGACCTCGTTCCGGCGGTGGGCCCGCCTGCTGGCCGAGCAGGCGGTACGCGAGGAGCGGACCGCCGAACTGGAGGAGTGGGCCGCACTTCTCGGTGAGCCCGAGGCCCCGCTGGGAGACTCCCCGCTGGACCCGGCGCGGGACACCGCCGCGACCGTGCGCCGCCGTTCCTGGACGGTGCCCGCGGGACCGGCGCGGACGCTGGTGAACAGGACACCGGCGGTGTTCCACTGCGGAGTGCGCGAGGTGCTGCTGGCCGCCCTGGCCGGAGCGGTCGGGCACTGGCGGGGCGGCAACGCCCCCGGGCTGCTCATCGACATCGAGGGGCACGGCCGCGAACCGGTCGGAGACGCCGATCCCGCCCGCACGGTGGGCTGGTTCACCGGCGTGCACCCCGTCCGGCTGGAGCTGTCCGGGGTCCGGACGGCCGAGGTGCCGGCGGGCGGCCCGGCGGCCGGTGAGCTGCTGAAGGCGGTCAAGGAGCAGGCGCGGGCCGTACCGGGCGACGGGCTCGGGCACGGTCTGCTGCGCCACCTCAACCCCGGCACCGGTCCCGTCCTGGCCGCCCTGCCCCGCCCGCAGGTCGGCTTCAACTACCTCGGCCGGTTCGCCGGCGCCGGGACCGGTGGGACGGCCGCCTGGCAGCCGGCCGGTGACGTGGCCCTCGGCGGTTCCGTGGACCCGGACATGCCCGTCCTGCACGCTGTCGAGGCGGGCGCCGTCGTCCGGGACACCCCCGACGGGCCGGAGCTGACCCTCACCCTGAGCCGGCCCGCCGCGCTGCTGGACGACGCCTCGGCCGACCGGCTGGGCCGGCTCTGGCTGGACATGCTCGCCGGTCTGGCCGCGCACACCGCCGACCCGGCCGCGGGCGGGCACACCGCCTCCGATTTCCCCCTTCTCGACCTGGCCCAGGACGAGGTGGACGAACTCGAGGCCGGGTTCGCCGACGACCTTTCGTAACCCGCTCGCAGCAAGCCGCTCTGAGGAGAGAAGCGATGACCCGATCCCTTGTCGAGGACGTGTGGCCGCTGTCGCCGCTGCAGGAGGGGCTGCTGTTCCACGCCGCCTTCGACGACCGGGGGCCCGACGTCTACCAGGGGCAGCGGATGCTCGATCTGACCGGCCCGGTGGAGGCGGGCCGGCTGCGGGTGTCGTGGGAGGCGCTGCTGGCCCGGCACGCGGCGCTGCGGGCGGGCTTCCGCCGGCGCAGGTCCGGGGAGGCCGTGCAGGTCATCGCGCGGGAGGTGGAACTGCCCTGGCGCGAGGCCGATGTCTCCGGACTGGCCGGGGACGAGGCGCGGGCCGAGATGGAGCGGCTGGCCGCGGAGGAGCGGGCCGAGCGGTTCGACCCCGCGGTGGCGCCCCTGCTGCGGCTGCTGCTGATCCGGACCGGCGAGGAGCGGCACCGGCTGGTCGTCACCAGCCACCACGTCCTCATGGACGGCTGGTCCATGCCGGTGCTGCTCGGGGAACTGTCCACGGTGTACGCGGCGGGCGGGACCGCGGACGGCCTCCCTCCGGTCGCGTCCTACCGGGACTACCTGGCGTGGCTGGGACGCCAGGACAAGCAGGCGGCGCGGACGGCGTGGCGGGCCGCGCTGGCCGGTGCCGACGAACCGACGCTCGTGGCACCGGCCGATCCCGGCAGGATGCCCGTGATCCCGGAGAGTCTGATCACCGACTTCCCCGAGGACCTGAGCCGGCGGCTGGTGGAGTTCGCCCGCGCCCGGGGACTCACGGTCAACACGGTGATGCAGGGCGCCTGGGCGCTGGTGCTGGCGCGGCTGGCGGGCCGCACGGACGTGGTCTTCGGCGGCACCGTGGCCGGGCGGCCCGCGGAGTTACCGGGTGTCGAGTCGATGGTCGGCCTGTTCATCAACACCCTTCCCGTGCGGGTGCCGCTCGACGCGGAGCAGCCGGTGGCGGAGATGCTGGCCGCACTGCAGGAGCGCCAGTCCGCGCTGATGGCCCACCAGCACCTCGGGTTGCCGGAGGTCCAGCAGCTCGCGGGTGCCGGAGCGGTGTTCGACACGCTCGTCGTGTACGAGAACTATCCGCGTCCCCCCGCCGGCCCGCCCGCCCCGGACACCTTCACCCTGGGCTTCGCCGAGGGGCGGGAGACCGCGCACTACCCGTTCACGCTGGTCGTCGCGCCCGGCGACCGCATGCGCTGCAAGCTCGACTACCGGCCCGACCTCTTCGACCGGGACACCGCCGGGTCGGTCTTCCGGCGGCTGGAGCTGGTGCTGGAGCAGATGGCCGCGGACCCGTCGGTCCCGGTGGGCCGGATCGGCGTGGTGGACGGCCTGGAGCGCGGGCTGGTGCTGGAGGGCTGGAGTGCGACGGCGGGTGAGCCGCCGGAGGTGCCGGTGCCGGAGCTGGTGGCGGTGCGGGTGCGGGAGGCGCCGGGCGCGGTGGCGGTGGTGGACGGTGAACGGTCGCTGTCGTACGGGGAGTTGGGTGAGGCGGCGGGTCGTCTGGCGGGGTGTCTCCACGGGCTGGGTGTGCGGCGTGGTGACCGGGTCGCGGTGGTGATGGAGCGGTCGGCGGATCTGCTGGTGGCGCTGCTGGCGGTGTGGAAGGCCGGGGCGGCCTATGTGCCGGTGGACGCCGGTTCTCCGGTGGAGCGGGTGGCGTTCGTGCTGGAGGACGCGGCTCCGGTGGTGGTGCTGTGCACGGAGGAGACGCGCGGTGTGATCCCGGAGGACAGCGCCGCGCGGGTGCTGGTATCGGACGACCCGGCCCTGGCGGTCGAACTGGCCGCCGTGGAGGTGCCGTTGTCCGTTCCGGTGGGTCCGCGGGACGTGGCGTACGTGATGTACACGTCCGGTTCGACGGGGGTGCCGAAGGGTGTGGCGGTGCCGCACGGCAGTGTCGCGGCGCTGGTCGGCGAAGCAGGCTGGTCGGTCGGGCCGGACGACTCGGTGCTGATGCACGCCCCGCACGCGTTCGACGTATCGCTGTTCGAGGTGTGGGTTCCGCTCGCCGCCGGAGGCCGTGTGGTCGTGGCGGAGCCCGGCGTGGTGGACGCCCAGCGGGTGCGCGCGGAGATCACGGACAGGGGTGTCACGGCGGTGCACCTGACCGCCGGTTCGTTCCGCGTCCTCGCGGCCGAGACGCCGGACTGCTTCCGCGGCCTGCGGGAGGTGCTGACCGGCGGCGACGTGGTGCCGGTCGCCTCGGTGGCCCGGGTGCGGGAGGCGTGCCCGGAGGTCTCCGTGCGCCATCTGTACGGGCCCACGGAGACCACACTGTGCGCGACCTGGCGGGTGTGGAGGCCGGGCGCGGAGCGCGTCGGTCCGGTGCTGCCCATCGGGCGTCCGCTGCCCAGCCGCCAGGTGTTCGTGCTGGACGCCTTCCTCCAGCCGGTCCCGCCCGGTGTGACCGGCGAACTCTATGTCTCCGGCGCCGGGTTGGGGCAGGGCTACTGGGACCGGCCGGCTCCGAGCGCCGAGCGGTTCGTCGCCTGCCCGTTCGTCCCCGGGGAGCGGATGTACCGCACCGGCGACCTGGTGCGCTGGACCGACGACGGGGAACTCCTCTTCGCCGGACGGGTCGACGCGCAGGTCAAGATCCGCGGATTCCGGGTGGAGCCGGGCGAGGTGGAGGCGGCCCTGGCCACACACCCCGCCGTCGCCCAGGCCGTGGTGGTGGCACGGGAGGACCGGCCGGGCGAGCGCCGCCTGGTCGGCTACGTCGTCCCGGACGGAGACGCGGAGAAGCCGGCCGGGGAAGCCGTGCGCGAGCACGCCGTCGAACTGCTGCCCGAGTACATGGTGCCCGCGGTGGTGCTGGTGCTGGACGCGCTGCCCGTGACCCGTAACGGCAAGGTCGACCGCGCGGCCCTGCCCGCCCCCGACTTCGCCGGACGCGTGTCCGGACGGGAACCCCGGACGGAGAACGAGACCGTGCTGTGCGGGCTCTTCGCGGACGTCCTGGGTCTGGAGCGGGTCGGTGCCGAGGACGGCTTCTTCACGCTGGGCGGTGACTCGATCTCCTCCATGCAGCTCGTCGCCCGGGCCCGCCGCGCGGGACTGGTGCTCACACCGCGGCAGGTGTTCGACGAGAAGACCCCCGAGCGGCTGGCGCTCGTGGCGCGGAGGCCCGGGACCGCGGGCCGCGGAGCGGGGAACGCGCGGGACACGGGCGTAGGCGAGGCGCCCTGGACACCGGTGATGCGGGAACTGGGCGAACGGGCCGCCCGTCCGCGGTTCGCGCAGTGGGCGGTGGTCGGCGCCCCCGCCGGGCTCGACCCCGGGACGCTGGCGGCCGGGCTGGCCGCCCTCCTCGACCATCACGCCATGCTGCGGGCCCGTGCGGTACTCGACGGCGGGGAACCCCGCTTCACGGTCGGCCGGCCCGGATCCGCCGATGCCGCCGCCCTGGTCGGCCGGGTGGACGCCACCGGAGCGGAACCCGGCGCGCTGGACGGGATCGCCGCCCGGGCGGCGCGGGAGGCCGCCGAGCGGCTGGACCCCTCGGCGGGCGCGATGGTCCGGGCGGTGTGGGTGGACGCCGGGCCGGAGCGGACCGGCCGGCTCGCGCTGGTGATCCACCATCTGGTGGTCGACGGCGTCTCCTGGCGCATCCTGCTGCCGGATCTGCGGGCCGCGTACGAGGCCGCGGCGGCCGGCCGGAAGCCGGAACTGGACCCGGTGGGCACCTCGTTCCGGCGGTGGGCCGGCCTGCTGGCCGGACAGGCGGCCTCCGGAGACCGGCTCGCCGAACTGGGCGACTGGGCGGCCCTGCTCGGCGGCGAACGGCTCCCCGTCGGGCGGCGCGCGCCGGACCCGGCGCGGGACACCGCCGCGACCATGCGCCACCGCTCATGGGTGGTGCCGCAGCACGAGGCGGCCGTCCTCACCGGCAGGACACCGGAGGCGTTCCACTGCGGGGTGCAGGACGTCCTGCTGGCGGGACTCGCGGGCGCGGTCGCGCACCGGTACGACGGCGGCACCGGCCACGGCGGTGACGGCAGCGGCACTGGCGCCGCGCTCGTGGTGGACGTGGAGGGCCACGGCCGCGAACCGCTGGAGGGAGCCGACCTGTCCCGCACGGTGGGCTGGTTCACCCGGTCCCACCCGGTCCGGCTGGACCTGTCCGGCATCGGAACCGGCGAGGTCCCGGCCGGGGGCGCCGCGGCCGGGGAGCTGCTGAAGACGGTCAAGGAGCAGGCACGCGCGGTGCCGGGCGACGGGCTCGGCCACGGGCTGCTGCGCCACCTCGACCCCACTGCCGGCCCCGCCCTCGCCGCCCTGCCGGGCGCGCAGATCGGCTTCAACTATCTCGGCCGGTTCGCCGCCGGACCGCGGGAGGAACCGGTCGCCGCCTGGCAGTTGGCCGGTGAGACGGCGATCGGCGGCTCGGCCGACCCGGGCCTGCCCGCCCCGCACGCCGTCGAGGCGAACGCGGCCGTCCGCGACACCCCCGGAGGTCCCGAGCTGACCCTCACCCTGAGCTGGCCCGGCGGGATTCTGGACGAGTCCGAGGCGGAGGAACTGGGGCGCTCCTGGCGGCGGATGCTGAGCGGCCTGGCCGCCCACTCCGCCCGCCCCGGGGCCGGCGGGCACACCCCGTCCGACTTCCCGCTGGCCGGCCTGACGCGGGACGGCCTGGCGGAACTGGAGGCGTGCGTCCCGGAACCGGCGGACGTGTGGCCGCTGTCGCCGCTCCAGGAGGGCATGCTCTTCCACGCCACCTTCAACCAGGAGGGGCCGGACGTCTACCAGAGCCAGCGCCTGCTGGGGCTCGACGGGCCGCTGGACACCGCCCGGCTCCGGGCGGCCTGGGAGGAGCTGCCGGCCCGGCACGCGGTCCTGCGGGCGGGCTTCCACCGCCTGACCTCCGGCGAGGCCGTGCAGGTCGTCGCCCGGCGGGTGGAACTGCCCTGGCGCGAGGCCGATCTGTCCGGCCTGCCGGAGACCGAGGCCCTGGCGGAGGCGGAGCGGCTGGCCGCGAACGAACTGGCGGAGCGCTTCGACCTGGCGAAGCCGCCGCTGCTGCGGCTGCTGCTCGTCCGGCTCGCCCGAAACCGGTACCGGCTGGCCATCACCAGCCACCACATCCTGATCGACGGCTGGTCCATGCCGGTCGTCCTCAACGAGGTGTCCGCGCTGTACGCGGCGGGCCGAGGCACGGACGCCGCCCTGCGGCCGGCCGCCTCCTACCGGAACCACCTGGCCTGGCTGGCGGGGCAGGACAAGGAGGCGGCCCGGGCCGCGTGGCGCGCGGAACTGTCCGGGGTCGCCGAACCGGTACTGGTGGCCCCGGCGGACCCGGGCCGGGCCCCCGTGACACCGGTCGTGAGCTCCGCGGAGCTGTCCGCGGAGAGCACCCGGGCACTGACCGGGCGGGCGCGCGCCCACGGACTGACGGTGAACACCCTGGTGCAGGGCGCCTGGGCGCTGGTGCTCGCGCGGCTGACGGGCCGTACGGACGTGGTGTTCGGCGGCACCGTCGCCGGGCGGCCGCCCGAACTGCCCGACGTCGAGTCGATGGTCGGCCTGTTCATCAACACGCTGCCCGTGCGGGTACGGCTGGACGGGGCCCAGCCGGTGCGGGACATGCTCCGGGAACTGCAGGAGCACCAGTCGGCGCTGATCGCGCACCAGCACCTCGGGCTGCCGGAGATCCAGCAACTCGCGGGGCCGGGCGCGGTCTTCGACACGATGCTGATGTTCGAGAACTACCCGCGGAACGCGCCCGAGCTCTCCGGCCCCGCGGGGACGGACGGCGGAGTGGCGATCAGGCAGCTGAAGACCCTGGCCGGCACCCACTACCCCCTGGCGGTGGGGGCCGTTCCCGGAGAGCACCTCCGGGTCCATGTCACCTACCGGCCGGATCTGTTCGGCCACGAGAGCGCCGCCAGGATCGCGCGGGGCGTCGTGCGGGTGCTGGAGCAGATCGCGGCGGACCCGTCGGTGCCGCTGGGACGGCTGGACGTGGTGGACCCGGTCGAGCGCGGCCGGACCGTCGAGGGCTGGAGCGCGTCGGCCGACCGGCCGCCGGAGCCGGCGGTGCCGGAGCTGGTCGCGGCGCGGGCGCGGACGACGCCGGACGCGGTGGCCGTCGTCGATGGCGAACGGCCGCTGTCCTACGGGGAGTTGGACGACGGGGCGGGGCGTCTGGCGGCGTATCTCTCCTCGTTGGGTGTGGGGCGTGGTGAGCGGGTCGCGGTGGTGATGGAGCGGTCGGCGGATCTGCTGGTGGCGCTGCTGGGGGTGTGGAAGGCCGGTGCGGCGTATGTGCCGGTGGAGGCCAGTACTCCGGTGGAGCGGGTGGCGTTCGTGCTGGCCGATGCCGCTCCGGTGGTGGTGCTGTGCACGGAGACGACGCGGGGTGTGATCCCGGAGGACACCGCCGCCCCGGTGGTGGTGCTGGACAGTGTGTCGGTGGCGGCCGAGGTCACCGCCCGGGAGCCCTGGCCGGGCGCTCCCGTGAGTGCCGGGGACGTGGCGTATGTGATGTACACGTCCGGCTCGACGGGGGTGCCGAAGGGTGTGGCGGTGCCGCACGGCGGTGTGGCGGCGCTGGTCGGGGAGCGGGAGTGGTCGGTCGGGTCGGGTGACGCGGTGCTGATGCACGCCCCGCACGCGTTCGACGCCTCGCTGTTCGAGGTGTGGGTGCCCCTCGTCGCCGGTGCGCGGGTGGTGGTCGCCGAACCGGGCGCGGTCGAGGCCCAGCAGGTGCGGCAGCACATAGCCGGCGGTGTGACCGCGTTGCATGTGACGGCTGGTTCGTTCCGGGTGCTGGCGGAGGAGTCCCCGGAGTGTTTCCGGGGTCTGCGTCAGGTGCTGACGGGCGGTGACGTGGTGCCGGTCGCCTCGGTGGCGCGGGTGCGGGAGGCGTGCCCGGAGGTGTCGGTGCGGCATCTGTACGGGCCGACGGAGACGACGTTGTGCGCGACCTGGCACGAGTTGCGTCCCGGGGAGGTGCTGGGGGAGGTGCTGCCGATCGGCCGTCCGCTGCCGGGGCGGCGGGTGTTCGTGCTGGACGCCTTCCTGCAGCCGGTGCCGCCGGGTGTGACCGGTGAACTGTACGTATCCGGTGCGGGGTTGGCGCGCGGTTACTGGGGCGGGCCGGGCCCGACGGGCGAGCGGTTCGTGGCCTGCCCGTTCCTCCCGGGCGAGCGGATGTACCGCACCGGCGACCTGGTCCGCTGGACCGAGGACGGTGAGCTTCTCTTCGCCGGCCGCGCGGACGAGCAGGTGAAGATCCGGGGCTACCGTGTCGAACCCGGCGAGGTGGAGGCGGTGTTGGCCGCCCACCCGGCTGTCGCGCAGGCGGTGGTGGTGGCACGGGAGGACCGGCCGGGTGAACGCCGGCTGGTCGGCTACGTGGTGCCCGAGGGGCCCGAGGGCGTGGACCCGCAGGCCGTGCGCGAGCGGGCCGCCGCGGTGCTGCCGGAGTACATGGTCCCGGCCGCCGTCCTCGTCCTGGACGCGCTTCCGGTCACGGAGAACGGCAAGGTGGACCGCAAGGCGCTCCCCGCCCCGGAGTTCGAGGGCGCCGCCGCCGGCCGTGAGCCGCGGACGGTGGCGGAGGAGACGCTGTGCCGGCTCTTCGCCGAGGTGCTGGGTGTGGAGCGGGTCGGCGTCGAGGACAGTTTCTTCTCGCTCGGCGGGGACTCGATCATGTCGATGCAGCTGGCCGCCCGTGCCCGCCGCGCGGACCTGCTGTTCAAGGCCCAGGACGTCTTCGAGCACGAGACCCCCGCCGGACTGGCTGCCGTCGCCCGCAGCGCGGCCCGGGAAACCTCCGCGCCCGGCGCGGACACGGGCACGGGCGCGGGCGAGGTGCCCTGGACACCGGTGATGCGGGAGCTCGGTGACCGGGCCGCCCGGCCCGGCCTCGCGCAGTGGGCGATCGTCGGGGCACCGGCCGGACTGCGGCGCGACGCCCTCGTGGCCGCTGTCGGCGCCGTGCTGGACACGCACGACATGCTGCGGGCCCGGGTGAGCGGGGACGGGACGGAGCGCGTGCTGGCCGTCGGCGAGCGCGGCTCGGTGGACGCGGCCGGGCGGATCGGCCGGCTGGACGCCACCGGGGCGGCGGACGGCGATCTGGACGGCATCGCGGGCCGCGCGGCGCGGGAGGCCGCGGAAGGGCTCGACCCCACGCTCGGAGCGGTCTTCCGGGTGGTGTGGGTGGACGCCGGCCCCGACCGCCCCGGCCGGCTCGTCCTGGCGGCACATCACCTCGTCGTGGACGGCGTCTCCTGGCGCATCCTGCTGCCCGACCTGGAAGCCGCGTACGAGGCCGTGGCGGCCGGGCGCGAGCCGTCGCTCGACCCGGTGGAAACACCGTTCCGCCGATGGGCCGGCCTCCTCGCCGAGCAGGCGGTCTCGGAGGAGCGGACCGCCGAACTCGATGCCTGGACCGCCCTGCTCGGAGAGGAGACGGCCCCCGTCGGGCGGCGCGCCCCGGACCCGGCGCGGGACACCGCCGCGACCGTGCGCCGCCGCTCGTGGACGGTGCCCGCGGAACAGGCCGGGGTGCTGGCGGGCCGGATGCCGGCGGCCTTCCACTGCGGGGTGCGCGAGGTGCTGCTGGCCGCCCTGGCCGGAGCGGTCGCCCGCTGGCGCCCGGACACCGGCTCCGCGACGCTGATCGACATCGAGGGGCACGGCCGCGAACCGCTGGAGGGAGCCGACCTGTCCCGCACCGTGGGCTGGTTCACCAGTACCCACCCGGCCCGTCTGGACCCGGCGGGCGTCGACCTGGACGCCGTGCTCACCGGCGGTCCCGCGGCCGGCGAACTGCTGAAGACCGTCAAGGAGCAGCTCCGGGCGGTGCCCGGCGACGGACTCGGCCACGGACTGCTGCGCCACCTCAACCCCGGCACCGGGCCCGCCCTGGCCGCCCTGCCCGGCCCGCAGATCGCGTTCAACTATCTGGGGCGGTTCGCCGCCGGACCGCGGGCCGGCGAGGACACCGCGGTCTCCGCCTGGCAGATGGCCGGTGACGCGGCGATCGGCGGCTCCGTCGACCCGGACATGCCCGCCCGGCACGCACTGGAAGCGGGCGCGGCCGTCCTGGACACCGCCGGGGGACCGGAGCTGACACTGACGCTGAGCTGGCCGGAACAGGTGCTCGACGAGACGGAGGCGGACCGGCTGGGCCGGCTCTGGCTGGACCTGCTCGCCGGCCTGGCCGCGCACACCGCCGACCCCGCCGCGGGCGGGCACACCCCCTCCGACTTCCCCCTCGTGGATCTCGCCCGGGAGAGCGTGGAGCGGCTGGAGGCCGCGGTGCCGGGCCTGGTGGACATCTGGCCGCTCTCCCCGCTGCAGGAAGGGCTGCTCTTCCACGCCGGCTTCGACGACCGCGGCCCGGACCTCTACGAGGGGCAGCGCGTCCTGGCCCTGGACGGGCCGCTCGACGCGGACCGGCTGCGGTCCGCGTGGCGGACGCTGACGGACCGGCACCCGGTGCTGCGGGCGAGCTTCCACCGCCTGGAGTCCGGCGAGGCCGTGCAGGTCATCGCGGGGGAGGTGGAACTGCCCTGGCACGAGTCCGATCTCTCCGGGCTGCCGGAGGACGAGGCGCGGGCGGGCCTGGACCGGCTGGTCCGGGAGGAGCGGGCCCGGCGGCTCGACGTCACCCGGGCACCGCTGCTGCGCCTGCTGCTGGTCCGGCTCGGCCGGGACCGGCACGTCCAGGTCGTCACCAGCCATCACATCGTCACGGACGGCTGGTCCCTGCCGGTGATCATCGGTGAACTGTCCGTGCTGTACGAGGCGGGCGGCGACGACGCCCGGGCCCTGCCGCCGGCGACCTCGTACCGGGAGTACCTCGCCTGGCTGGAACGGCAGGACAAGGAGGCGGCCCGGGAGGCGTGGCGCGCGGAGTTCGCCGGCCTGGACGAGCCGACGCTGGCCGTGCCCGGGGACGCGGCCCTGGCCCCGGCGGTGCCGGACCGCGTCCCGTTCGCGTTCCCGGAGGACCTCACCCGCGCCGTGGACGCCCTGACGCGCGCCACGGGCTGACCGTCAACACGGTGGTCCAGGGCGCGTGGGCGCTGCTGCTGGCGCGGCTGGCGGGCCGGACGGACGTGGTGTTCGGCGCGACGGTGGCGGGGCGGCCCGAGGAACTGCCGCGCGTGGAGTCCATGGTCGGCCTGTTCCTCAACACCCTGCCGGTGCGGGTCGACCCGGCGGGGGAGGAGTCCGTCGCCGCGATGCTCACCGGCCTGCGGGACCGGCAGGTCGCGCTGATGTCCCATCAGCACGTCGGTCTCCCCGAGATCCGCCGGCTCGCCGGTCCGGGTGCCGTCTTCGACACGCTCGTGGTGTACGAGAACTACCCCCGCCCCGCTCTCCGGGAGCCCTCGCCCGGCACGCTGACCATCCGGCCCGGCGGCAAGCCGGAGGACACCGGCCACTACCCGCTGACGCTGATCGCGGTGCCCGGCGAGCGGATGCGCGGCGAACTCGTCTACCGGCCCGACGTGTTCCCGCGCGCCTGGGCCGAGGACCTGGTGGCCTCGCTCGCCCGGGTCCTGGAGCAGATGGCCGCGGACCCCTCCGCGCCCGTGGCGCGGGTGGGCGTACTGGGGCCGGAGCAGCGCACGCTCACCCTGGACACCTGGAACCGGACCGCGGCGCCGTCCGCCGCCGCTCCGCTGCCGGAGTTGTTCCGCCGGCAGGCGGAGCGGTCACGGGACGCGGTGGCCGTGGCGGACGGCGAGCGGACGCTGACCTACGGCGAGCTGGAGGCCGGGACGAACCGGCTGGCCCGTCATCTGACCCGTGCGGGCGTCGGCCCGGAGGACGCGGTGGCCGTCATGGTGCCGAGGTCCGCGGCGCTGGTGACGTCCGTGCTGGCGGTGTCCGCGGCCGGCGGGGCCTTCGTACCGGTGGACCCGGCCCACCCCGCCGAGCGCATCGCGTTCGTGTTCCGCGACACGGAGCCGGCGGTGGTGGTGTGCACCCGGGAGACCCGGGAGGCGGTACCGCCGGACTTCCCGGGCCGGCTGGTCGTCCTGGACGACCCGGAGACCGCCGGGGCCGTCGCCGCCCGCCCGCCCGGCCCGCTGTCGGACGGGGAGCGCCGCGCACCGCTGGACGTCCGCAACGCCGCCTACGTCATCCACACCTCCGGATCGACCGGTGTGCCGAAGGGTGTGGTGGTGTCCCACCGGGGACTGGGCAACCTGGCCCGGGCACAGATCGAGCGGTTCGCGGTGGAACCCGGCTCCCGGGTGCTCCAGTTCGCCTCGCTCAGCTTCGACGCGGCCGTCTCCGAACTCTGCATGGCGCTGCTGTCCGGCGCCGCACTGGTGCTGACCGGCCCGGAGGGTCTGCCGCCGCAGGTGCCGCTGGGCGAGGCGCTGCGCGCGACGGGTGCCACCCATGTGACGGTGCCGCCGAGCGTGCTGGCCACGGAGGAGGAGCTGCCCGGCGGCCTGGAGACCCTGGTGGTCGCCGGCGAGGCCTGCCCGGCGGCCCTGGCGGACCGCTGGTCCGCCGGGCGGCGGATGGTGAACGCGTACGGCCCCACCGAGGTGACGGTGTGCGCGGCGATGAGCGCGCCCCTGTCACCCGGCGGTGCCGAGGTGCCGGTCGGACGCCCGATGGCGAACACGCGGGCCTACGTCCTCGACGGCTTCCTGCAACCCGTACCGCCGGGGGCGGTCGGCGAGCTGTACGTCACCGGCCCCGGACTGGCCCGCGGCTACCGGGGGCGCCCGGACCTGACGGCGGAGCGGTTCGTCGCCTGCCCCTTCGTCCCCGGGGAGCGGATGTACCGCACCGGCGACCTGGCGCGCTGGACCGGGGACGGCGAACTCGTCTTCACCGGCCGCGCCGACACCCAGGTCAAGGTGCGCGGCCACCGGATCGAACCGGGAGAGGTCGAGGCGGTGCTGTCCGCGCATCCCGGGGTCGCCGGGGCCGTGGTCGTGGCGCGCCGGGACGGCCCCGGCGGCGACCGCCTCGTCGGCTATGTCGTCCCCGCCCCGCCCCGGCCGGGCGACGGCCCCGCCGAGGCGCGGCCCGTCGAGGAACTGCTCGGCGCGCTGCGCGAGTTCACCGCTGAGCGCCTTCCGGACCCCATGGTGCCGTCGGTGTTCGTACCGCTGGACCGGCTGCCGCTCACCGCGAACGGCAAGGTGGACCGCCGGGCCCTGCCGGCCCCCGACTACGACGGGAAGGTTTCCGGGCGGGAGCCGCGGACGGCGGCCGAGACGGTGTTCTGCGACCTGTTCGCCGAGGTGCTGGGGCTGGAGCGGGCCGGGGCCGACGACAGCTTCTTCGAACTGGGCGGCGACTCCATCTCCTCGATGCAGCTCGCGTCCCGCGCCCGGCGCGCCGGCTATGCGGTGACGCCACGGCAGGTCTTCGAGGAGAAGACGCCCGAACGGCTGGCCGCCGTGGCCGGACCGGCCGGCGCCGCCGCGGAGGACGTGGACGACATCGGCACCGGCGAGGTGCCCCGGACCCCCGTCATGCTGGCACTCGGCGAACGCGCCCTCCGGCCCCGGTTCGCGCAGTGGGCGGTGGTCGGCGCACCGGGCGGCCTGGGACGCGAGGTGCTGACGGCCGGCCTGGTCGCCGTCCTCGACCGCCACGACATGCTGCGGGCCCGGGTGGAGACCGGCGACGACGGGGAGCCGCTCCTCGTGGCCGGCGAGCCCGGCACGGCCGACCCCGCGGACCTCGTCACGCGGGTGGACGCCGGCGGCGCGGACGACGGCTCGCTGGACGCCGTCGCCGGCCGGGCCGCGCGGGAGGCCGTGGAACGGCTCGACCCCCGCGCGGGCGTAATGCTGCAAGCCGTCTGGGTCGACGCCGGGCCCGGACGGACCGGGCGGCTGGTCCTCGTCGTCCACCACCTGGCCGTCGACGGGGTGTCCTGGCGGGTGCTGGTACCGGACCTGGCCATGGCCTGCGAGGCCGCGGCGGCGGGACGCGAACCGGTGCTCGACCCCGTCGGAACCTCCTTCCGGCGGTGGGCGAACCTGCTGGCCGCCCAGGCCGGCGACCCCGGCCGGGTCGCCGAACTCCCGGCCTGGAAAGCCCTGCTGGGCGATCCTGACCCGCTGCCGTTCACCCGCGCGCTGGACCCGGCCCGGGACACCGCGGAGACCCTGCGCCGCCGGTCCTGGACGGTTCCCGCGCGAGAGGCCGCCATCCTGGCCGGCCGCACCCCGGCCGCGTTCCACTGCGGGGTGCACGAGGTACTGCTGGCCGGGCTGGCGGGCGCCGTGGCACGGACCCGGCAGGACGGCCGCACCGCCGTCCTGGTGGAGGTGGAGGGCCACGGCCGGGAACCGGTCGAGGGCACCGATCTGTCCCGCACGGTGGGCTGGTTCACCAGTACCCACCCGGTCCGGCTCGACGCCGCCGGTGTGGACCTCGCCGGCGCGGCCGCGGGCGGCCCCGCGGCCGGCGCGCTGCTGAAGGCCGCCAAGGAACAGGTGCGGGCGGTGCCGGGTGACGGGCTCGGCCACGGGCTGCTGCGCCATCTCAACGCCGGGACCGGACCGGTGCTGGCGGCCCTCCCCGGCCCGCAGATCGGCTTCAACTACCTGGGGCGCTTCACCGCCGGCAGCCGCCGGGGCCCGGTCGGCCCCTGGCAGATGGCCGGTGACACGGCCATCGGCGGCTCGGCCGACCCCGGCATGCCCTGCGAGCACGCTCTCGAAGCGGCCGCGGCCATCGTGGACACTCCCGTGGGCCCGGAGCTGACGCTTACGCTGAGCTGGCCCGCCGCCGTGCTGGACGAAGCCGCGGCGGAGCGACTGGGCCGGGCATGGCTGGACCTGCTGGGCGGCTTGGCCGCCCACACCGCCGATCCCGCCGCCGGCGGCCACACGCCCTCCGACTTCCCCCTCCTCGACCTCGCGCAGAACCAGATCGAGGAGCTCGAAGCCGGGCTCGCCGATGAGAAGGCACAGCCGACGCACCGCAAGCTCTGGTGAGGAGAGACACGATGACCCGATCCCCTGTCGAGGACGTGTGGCCGCTGTCGCCGCTGCAGGAGGGGCTGCTGTTCCACGCCGCCTTCGACGACCGGGGCCCCGACGTCTACACCGTCCAGTCCGCCCTCGCGCTGGAAGGCCCGCTGGACCCGGGGAGGCTGCGGAGGTCGTGGGAGGCGCTGCTGGACCGGCACGCCGCGCTGCGCGCCTGCTTCCGCCAGGTGAGCGGGGCACAGATGGTGCAGGTCATCGCACGGGACGTGGCGCTGCCCTGGCGCGAGGAGGACGTGTCGGGGCTCCCCGCGGCCGACGCGCTCGCCGCCGCGGACCGGCTGGCGGAGAGCGAACGGGCGGAGCGCTTCGACCCGGCGGTGGCGCCCCTGCTGCGGCTGCTGCTCGTCCGCCTCGGCGAGAACCGTCACCGCCTGGTGATGACCAGTCACCACATCCTCATGGACGGCTGGTCGGCCCCCGTCCTGATCGGAGAGCTCTCCGCGGTCTACGCGGCGGGCGGCGACGCCTCCGTACTCCCCGGCACCACCTCCTACCGCGAGTACCTGGCCTGGCTCAACCGGCAGGACAAAGAGGCCGCGCACGCCGCCTGGAAGGCGGAGCTCGCCGGGGCCGGCGAGCCGACGCTGGTCGCCCCCGCCGTCCCCGACCGGCTCCCCGTCTTCCCCGGGAGCGTCAGCGGCGACCTACCGGAAGCGCTGACCCGCGGCCTGGCGGAGCTGGCCCGCACGGCGGGCGTGACCGTCAACACCGTGGTGCAGGGCGCCTGGGCGCTGGTGCTGGCGCGCCTCGCGGGCCGTACGGACGTGGTCTTCGGCGCCACCATGGCGGGGCGTCCCCCGGAACTGCCCGGGGTCGAATCGATGGTGGGGCTGCTCATCAACACCCTGCCGGTACGGGTACCGCTCGACGGCGCCCAGCCGGTGCGGGAGATGCTCCAGCGGCTCCAGGACCGGCAGTCCGCGCTGATGGCCCACCAGCACCTGGGCATCCTGGAGATCCAGAAGACCGCGGGGCCGGGAGCGGTGTTCGACACGCTCCTGGTGTACGAGAGCTTCCCCCGTCCGCCCGCCGCACCGGCACCGGACCGGGACGCCCTGGTCATCAGGCCCGACGGGTTCTCCCGCGAGGCGGCGCACTACCCGTTCACCCTGGTCGTCGCGCCCGGCGACCGGATGCACCTCAAGCTCGAACACCGGCCGGACCTCTTCGACCGCGCCACGGCCGAGTCCGTCCTCCGCGCACTGACGCGGGTGCTGGGACGGATGGTGGCGGAACCCTCCGCGCCGGTCGGACGGATCGGAGTGCTCGACGGACCCGTGCGGGGCACCGCCCGGGAGGAGCGCGGCGGGGCGCCGGTGGCGCCGGGGCCGTCGGTGCCGGAGCTGGTGGCGGGGCGGGTGCGGGAGGCGCCGGGCGCGGTGGCGGTGGTGGAGGTTGAACGGTCGCTGACGTACGGGGAGTTGGACGGGGCGGCGGGGCGCCTCGCGGGGTATCTGTCCTCGCTGGGTGTGGGGCGTGGTGACCGGGTCGCGGTGGTGATGGAGCGGTCGGCGGATCTGCTGGTGACCCTGCTCGGGGTGTGGAGGGCTGGGGCGGCCTACGTGCCGGTGGATACGGGTTCTCCGGTGGAGCGGGTGGCGTTCGTGCTGGCCGATGCCGCTCCGGTGGTGGTGCTGTGCACGGAGGCGACGCGGGGCGCGGTGCCGAAGGATGCCGCCGCGCGGACGGTGGTCCTCGACGATCCCGGGTCGCTGTCCGAACTCGCTGCGCACAAAGGTGAGGTGGCGGCCGAGGTGAACCCCGGGGACGTGGCGTATGTGATGTACACGTCGGGTTCGACGGGGGTGCCGAAGGGTGTGGCGGTGCCGCACGGCGGTGTGGCGGCGCTGGTCGGCGAAGCCGCCTGGTCGGTCGGGCCGGACGATGCGGTGCTGATGCACGCCCCGCACGCGTTCGACGCCTCGCTGTTCGAGGTGTGGGTGCCCCTCGTCGCCGGTGCGCGGGTGGTGGTCGCCGAACCGGGCGTCGTGGACGCCGGGCAGGTACGCCGCCATGTGACCGGCGGTGTGACCGCGTTGCATGTGACGGCTGGTTCGTTCCGGGTGCTGGCGGAGGAGTCCCCGGAGTGTTTCCGGGGTCTGCGTCAGGTGCTGACCGGTGGTGATGTCGTGCCGCCGGGGGCGGTGGCGCGGGTGCGGGAGGCGTGCCCGGAGGTGTCGGTGCGGCATCTGTACGGGCCGACGGAGACGACGTTGTGCGCGACCTGGCACGAGTTGCGTCCCGGGGAGGTGCTGGGGGAGGTGCTGCCGATCGGCCGTCCGCTGCCGGGGCGGCGGGTGTTCGTGCTGGACGCCTTCCTCCACCCGGTGCCGCCGGGCGTGACCGGCGAACTGTACGTATCCGGTGCGGGGTTGGCGCGCGGTTACTGGGACCGGCCGGGCCCGACGGCCGAGCGGTTCGTGGCCTGCCCGTTCCTCCCGGGCGAGCGGATGTACCGCACCGGCGACCTGGTGCGCTGGACCCGGGACGGTGAGCTTCTCTTCGCCGGCCGCGCGGACGAGCAGGTCAAGATCCGCGGGTTCCGCGTGGAGCCCGGCGAGGTGGAGGCGGCCCTGGCCGCGTACCCGGGCGTCGCCCAGGCTGTGGTGGTGGCCCGTGACGACGGCCCGGGTGAGCGCCGGCTGGTCGGCTACGTGGTGCCCGAGGGGCCCGAGGGCGTGGACCCGCAGGCCGTGCGCGAGCGGGCCGCCGCGGTGCTGCCGGAGTACATGGTCCCGGCCGCCGTGCTGGCGATGGCCGCGCTCCCCGTGACCGCCAACGGCAAGGTGGACCGCAGGGCGCTGCCCGCCCCCGACTTCGCCGAACGGGTCTCCGGCCGTGCGCCCCGGACCGCCGTCGAGGAGACGCTGTGCCGGCTCTTCGCCGAGGTGCTCGACCTCGAACGGGTGGGCCCCGACGACAACTTCTTCGACCTGGGCGGCGACTCGGGGCTGGCCATGCGGCTCGCCGGCCGGGTCCGCGAGGAGTTCGGCGCCGAGCCGGCCGTCCGCCAGTTCTTCGGCTCCCCGACCCCGGTCGGTGTGGCCCGGCTGCTGGCCACGAAGGCCCGCCCCGTGCTCGAAGCGGCCGCCCGGCGGGAGGACGTCCCCGTCACCGCGGGCCAGTTGCGCACCTGGCTGATGTCCCGGCTCGGTGACGAGGCGGGCGTGCACCGGATCCCCGTCGCGCTGCGCCTCGGCGGCGATCTGGACCACCGGGCGCTGTGGGCCGCGCTGGGGGACGTCGCGGCGCGGCACGAGATCCTGCGGACGACCTTCGACGGAACCCGGGGCGGTGACCTGCGCCAGCGCGTCCTGGACGCCGACGCCGCGCGCCCCGCCCCGGCCGTCACGGCGGCGACCGAGGAGGAGCTGCCGGACCTGCTGTCCGCCCACGCCGCGCACGCGTTCGATCTCAGCCGTGAGACACCGTGGACCCAGCACCTCTTCGCGCTGTCGGACACCGAGCACGTCCTGCTCCTGGTGGTGCACCGGATCGCCGCCGACGACGCGTCCGTGGACGTCCTCGTCCGCGACCTGGCCACCGCCTACGGCGCGCGCCGCGAGGGCCGGATGCCCGAACGGGCCCCGCTGCCCGTGCAGTTCTCCGACTACGCGCTCTGGGAGCGGGAGCTGCTCCGGGGCGAGCGGGAACCGGAGAGCCTGGTCAACGACCAGCTCGGGTACTGGAAGGACACCCTGGCGGGTCTGGACGCCGAGCTGCCCCTGCCGGCCGACCGGCCGCGGCCCTCCGTGGCCTCCCACCGGGCCGGCTCCGTACCGCTGCGCATCGGCGCGGATCTGCACACCCGCCTGGCCGACCTGGCCGACGACGCCGGCACGACGACCTTCACGGTGGTGCAGGCCGCGCTCGTGACGCTGCTCGCCCGGCTCGGCGCCGGCACCGACGTCACCGTCGGAACGGTGATCCCGCGCCGCGACGAGGCCGGTCTGGAAGGGCTGGTGGGACCCTTCGCCGGGCCCCTGGCGCTGCGTACGGACGCCTCCGGCGATCCCGCCTTCCGCGACCTGCTCGGCCGGGCGCAGGCGGGCGGCCAGGAAGCGCGCGAGCACCGGGACGTGCCGTTCGAGCGCGTGGCGGACGCGCTGCGGCTGCCTCCCTCGCTGGCGCGCCACCCGGTGTTCCAGGTCGTCCTGGAACTGGACGACAGTGTCGAGGAGGCGTGGGACCCCTGGGAACTGCCCGGGCTGCGCACCAGCCGCCTGGACGTGGACCCCGAGTCCACCGAACTCGACCTGTCGGTCGTCCTCACCGAGCTGTACCGGCCCGACGGGGATCTCGGCGGCATCGAGGGCCGGCTCCGCTACGCCGCGGAACTCTTCGACCGGGCCACCGCGGAGGAGCTGGCGCGGCGGCTGACGACGGTCCTGGAGCAGGTGGCGGCCGACCCGGACCGGCGGCTGAGCGCGGTGGACGTCCTGCTCGGCGCGGACGAGCACCGGCGGCTCCTGGAGACGGGGCACGGTGCGGCGGCGGACGTTCCGTGGCCCACGGTCGTGGCGGCTGTGGCCGCGCAGGCCGCACGGACCCCCGGCGCCGTCGCCGTCAGCGGACCGGACGGCTCACTGACGTACCGTGAGCTGCGCTCCGCGACGGATCTGCTCGCCCGGCGGCTGACCGCCCTGGGCGCCGGTCCGGACACCGCCGTCCTGGTGGCGCAGCCCCCCGCCACCGCGCTGGTGGTCGCGCTCCTCGCGGCGTGGGAGTCCGGGGCCGCCTGCCGCCTGGCCGATCCGACGCGGCCCCTGGACGGCGTGGACCCGGGACCCGGACGGATGCCGATCGCGGCCCTGGTGTGCGACGCGGCGCGGGGCGGGCGGACACCGGACGGCCCCGGCGTGCCCGTCGTGGCGACCGGCGGTCCGGCCCCGGCCGGACCGGACGCCGCGCCCGGCAGCGGCACACCCGGCGCAGCCGCGGCCGGCGGTGGCGCGCCCGGCGCCGCGGCGGCCGGGCCCCTCGCCGCCGTGCCGGACCGCGCGCCGCCGCTGCCCGGTCACCCGGCGCTCCTCCTTCCCGGCCCGGCCGGCGCGGACCTGGTCGTCGAACACCACACCCTGGCCGGCCACGCGGCGCACCGGGCGCGGGCATCGGCGGTGGCCGGCTCGGAGACGGTGCTCGACACCCGCGCTCCGCTCCCCCTGCTGCTCGTCCCGCTGCTCGCGGCGCTGTGCGCGGGGGGCAGCGTCCGCCTGGGCCTGCCGGACGGGGACCGGCAGCAGCCAGCCGCCGGAACCCTCACGAGCCCGGAACGCGCACGGCGGCTGCTGGTCACCACCCGTGCGCTGCTGCCGAGCGCGCTGCCGGAGCCGCCGGACGGCGGACCGTCCGCGTCCGTACCCGGCGCGGGCGGCCCGGGAGCGGGTGAACGGCCCGTCCCCGCAGCGGAGTTCGCGGAGGCCCTGGTCATGGACGCGGGCGGGCCGGCGGAGGCGGACGGCGCCCCGGACGCGCCCGGGCGCCCCCACGGGGCCGTCACGGTGTCCTGCCACGGCGCCGCGGAGACGGGCGGCGCCTGGCTGGAGAGCCGCACCGGCCCGGGCGAGGCCGCCCCGGCGGACCTCCGGGCCGGCCGGCCGGTGGCGAACACCCGAGCCTACGTGCTCGACGACCGCCTCCGGCCCGTACCGCCGGGCGCCACGGGCGACCTCTATCTGGCGGGAGTCCCGGTGGCGCGCGGCTATGCGGACCGTCCGGGCCTCACCGCCGGACGGTTCACCGCCTGCCCCTTCGGCCCGCCGGGGGAACGGATGTTCCGCACCGGCGAGCGGGCCCGGCGCACCCGCACCGGGCTGCTCGCGGTGAGCTCCGCGGACGCCGGCCGGGAGCGTGCGGCCGGAGCCCGCCGTGCCGGCGGCAGCCGCGGCGACCTGGGTGTGCTGCTGCCGCTGCGGCCCGGGGGCAGCCGCCCGCCGCTGTTCTGCGTCCATCCCGGCATGGGCCTGAGCTGGGGATACGGCGCTCTGCTGCCGTATCTCCCGGCCGACCTGCCGGTGTACGGGGTGCAGGCGCGGGGACTCGCGCGGCCGGAGCCGCTGCCGGGCAGTGTCGAGGAGATGGCCCGCGACTACGCGGACGAGATCCGCTCCGTGCAGCCGTCCGGCCCCTACCACCTCCTGGGCTGGTCCATCGGCGGCGTCATCGCCCAGGCCGTCGCCGTCCGGCTGGAGGAACTGGGCGAGGAGGTGGCGCTGCTGGCGCTGCTCGACGCCTATCCCGGCAGCGCCGCCACGTCCCGCTTCCGGAACGGGGACGGGCGGCGGGAGGACGGCTACTCCGTGCTCCGGGACGGCGGGGAGGGCGCCATGGCCGACCTCTACCGCTCCACGGGCCTGAGCGACCGGGCCCGGGCGAACCTGGAGAAGGTGCTGCGCAACATGTCCGGTTTCGCGCCGGACCACACCCCGCGCCGCTTCGGCGGGGATCTGCTGCTCTTCGTCGCCACCGCCGACCGGCCCGGTGAACCGCCGGTACGGCAGGCGGTGGAGAGCTGGCGTCCCCACATCGGGGGCGGAATCGAGCCGCACGAGGTGCGGGCCGGCCATTACGACCTGCTGCGGCCCGCGCATCTGCCGGGCATCGGACACGTCGTCACGGAAAAGCTCCGGGCGGCTGAGGAAAAGACATCGGAAAGGACCGAGTCATGACCAATCCGTTCGACAACGAGAACGGCACCTTCCTGGTTCTCGTCAACGACGAGGGGCAGTACTCGCTGTGGCCCGCGTTCGCCGAGAAGCCCGAGGGATGGACGGTCGTTCACGAGGAGGGCAGCCGCCGGGAATGCCTCGAATTCATCGAGGAGACCTGGACGGACATGCGCCCCAAGAGCCTGGTCGAGGAAATGGACCGGCAGGAGACCGCGGCACCCTGACAACAGCCTCTGACGCAACCCGGACAACGCCCCGGCGGACACCACAGGGCGGCCGCACCGGTGGCCGTCTCCTCCGGAAAGGGAACAGGTGGACACCGAAGCACTGGTGACCGTGGCCCTCGGCGACGTCGCGCTGATCGTCATCGCCTCGCGGCTGCTCGGGGCGGCGGCGCGCCGGTGCGGCCAGCCGGCCGTCGTCGGCCAGATCGTGGCCGGCATCGCCCTGGGCCCCACCCTGCTCGGCCGGCTGCCCGGCGATCCGACCGCCCGGCTCTTTCCCCCGGACGTGCTGCCGTTCCTCACCGTGCTGTCCCAGATCGCCATCGTCCTCTTCATGTTCGTGGTCGGCTACGAGACCGACCGGCGGCAGCTCCGCCGGGGCGGCGGGGCCGCGGCGGCCGTGGCGCTCGCGGCGCTGCTGGTCCCGGCGGCACTGGGGGCGGGCGTGGTCGGGCTGTTCCCCGGAGCGTTCTCCGCGGTGCGGCCCCAGCACGCGGACGGCCGGGTGTTCTGGCTCCTCATGGCCGTGGTCATGTCGGTGACCGCTCTTCCCGTCCTCGCCGCCATCGTCCGGGAGCGCGGCCTGGCGGGCACCCCCGCGGGCACCGTGGCCACGAGCGCCGCCGGGCTCATGGACGTCGCCGCCTGGCTCGTCCTGGCCGCGGCGCTGGCCGGCACCGGGCATGCCACCGCCCGGTCGTGGCCGGTGACCCTGCTCCTGCTGTCCCTCTTCACGGCCGCGCTGTTCCTGCTGGTCCGCCCGCTGCTCGCCCGGTGGCTCGAACGGTCCGGCGCCCTGGCGGCGCATCAGCTGACCATCGCGCTCGGTCTCGCGCTGGGCAGCGCCTGGGCCACCGCCGAGCTGGGGCTGCACCCGGTGTTCGGCGGTCTGCTCGCGGGCCTCGCCATGCCCCGTCCGGGCGGGGTGCCGGACGCCGGTGTGCTGCGGCCGATGGAGCAGACGGCCGGACTGCTGCTGCCGTTGTTCTTCGTGACGACCGGGCTGTCGTTCGACATCGGCTCGCTGGACGCCGACGGCGGGATCCTGCTGGCGCTGATCCTGGCGGTGGCCGTCTCGGGGAAGCTCCTCCCGGGGTACGCGGCCGCCCGGATCAGCGGCATGGACCCGCCCCAGTCGGCCGTGGTCGCCGTCCTGGTGAACACCCGCGGGCTCACGGAGCTCATCGTGCTCGACGTGGCGCTCGACGCCGGGGTCATCGGGCCCGGGCTCTTCACCGTGCTCGTGCTCATGGCCCTGACCACCACCTTCATGACGGGCCCGCTGCTGGCCCTGGCCGGCCGCCGGTGGGGGTTCCCGCCGCCACCGGCGGAACATCCCGGTAAACATCCGCGGAGGAATTCCGTGAAGCGCCGGGAGAGTCTTCACGGGAAACGCCGGGAGGGCGCCGCGGAAAGCTCCTGACGGCCCGTTCCGGCGGCGCGGACGGAAGATTTCTCCGGAATCCGGAGACGTGGTCTGCGGCGCCGTGACGCGGAATATCGGAATCCGCCCGGTGACCCGGTTGTCCGGTGATTCCGTGATCCCGTGCTTCCGTGATTCCGCCTCGCGCCGGCCGGTTGGACACCGCTTGACTCCGGCGCGGGGCGAAATCAGACTCGATCCGGCGACCGGAAATGCGGGAACCAGAAATACGGGGGCGGGAATGACCCGCCGGGTGACAAGGGGAGGAGGGATGGCCTTGCCGGATTCCGAGGAATTCGATGTGGTGGTCGTCGGTGGAGGGCCCGCCGGATCGACGCTGGCCGCGTTGACGGCCATGCAGGGACACCGGGTGCTGGTCCTGGAGAAGGAGTTCTTCCCCCGTCACCAGATCGGGGAGTCGCTCCTGCCGGCCACCGTGCACGGCGTGTGCCGGCTGACCGGCGTGGCGGACGAGCTCGCCGCCGCGGGCTTCCCGCGCAAGCGCGGCGGCACGTTCAAGTGGGGCGCCAACCCCGAGCCGTGGACCTTCTCCTTCTCCGTCTCCCCGCGCATGACCGGGCCGACGTCCTACGCCTACCAGGTCGAGCGGGCCAAGTTCGACGAGATCCTGCTCAACAACGCCCGCCGGGTGGGCGCCGAGGTGCGCGAGGGCTGTGCCGCCGTCGACGTCGTCGAGGACGGGGAGCGGGTCCGGGGCGTCCGGTACACCGACGCCGACGGCCGCGAGCACCGGGCGTCGGCCACGTTCGTCGTGGACGCCTCCGGCAACGGAAGCCGGCTGTACCGGCGGGTGGGCGGAACCCGGGAGTACTCGGAGTTCTTCCGCAGCCTGGCCCTGTACGGCTACTTCGAGGGCGGCAAGCGGCTGCCGGAACCGAACTCGGGCAACATCCTGTCGGTGGCGTTCGAGAGCGGCTGGTTCTGGTACATCCCGCTGAGTCCGGACCTCACCAGCGTCGGTGCCGTGGTCCGCCGGGAGATGGCCGGCAAGATCCGGGGCGACTCCGGCAAGGCGCTGGCGGCGCTCATCGCCGAGTGCCCCCTGATCTCCGAGTACCTGGCGGACGCGCGGCGGGTCACCGAGGGCCCGTACGGGAAGCTCCGGGTCCGCAAGGACTACTCGTACCACCACACGACCTTCTCGCGGCCCGGCATGATCCTGGTCGGCGACGCTGCCTGCTTCGTGGACCCGGTGTTCTCCTCCGGCGTCCACCTGGCCACCTACAGCGCCCTGCTGGCGGCCCGCTCCATCAACAGCGTGCTCGCCGGGCTGGTCGGCGAGGACCGGGCCCTGCGGGAGTTCGAGTCCCGTTACCGCCGCGAGTACGGCGTCTTCTACGAGTTCCTGCTCTCCTTCTACGAGATGCACCAGGACGAGAACTCCTACTTCTGGCAGGCCAAGAAGGTCACCCGGGCCAACCGCCCGGAGCTGGAGTCGTTCGTCGAGCTCATCGGCGGGGTCTCCTCCGGCGAGCGGGTCCTGACGGACGCCGAGGTGCTGGCGAAGCGCTTCAGCTCGGGCTCCGCGGAGTTCGCCGCGGCCGTCGACGAACTCGCGGGCAGCGAGGACGGCAGCATGGTGCCGCTGTTCAAGTCCTCGGTGGTGCGCGAGGTCATGCAGGAGGGCGGCCAGGTCCAGATGCGCGCCCTGCTCGGCGAGGACGCCGAACCCGAGGCCCCCCTGTCCGCGGACGGCCTGGTGCCGTCCCCCGACGGCATGTTCTGGCTGCCCGCCCAGGGCACCGGCGAGTAGAGGGGGACCCGTGGCACGGCCGTCGGACGTCTCCCCGCACAACCGGCGCGACCGGTTGGACCCGCTGCCCGAACTCAGCCGGCTGAGCATCCGCGCACCGGTCTCCGAGGCCGTCCTCACCGAGGAGCCCGCCACCACCGGCTGGCTGGTCACCGGCCCCGAGGAGGTACGGGCGGTCCTCGGCGACGCGGACCGGTTCAGCACGGCCCTGGCCGCGGGCGGCGGACCCGGCGCCCGGCGGCCGGCCCAGCCGGGCAACCTCATCCAGTACGACCCGCCCGACCACTCCCGGCTCCGGCAGATGCTCACACCCGAGTTCACGGTCCGCCGGATGCGCGCCCTGGAACCGGCCGTCGAGGCCATCGTCGAGGACGCCCTGGACTCCCTGGAGAAGGACGGCCGGCCCGCGGACTTCATGCGGCACGTCGCCTGGACCGTGCCGGGCCTGGTGATGTGCGAGCTCTTCGGCGTGCCCCGCGACGACCGGGCCGAACTGGCCCGGGTCCTCAAGGTCAGCCGGCCGGCCTTCCGCGGACGGCGGCTGCAGGTCACCGCGGGCGCCAACTACCTCGCGTACATGGCCCGGCTCGTGGAGCGCAAGCGCCGCGAGCCCGGTGACGACCTGCTCGGCCGGGTGGTGCGCGAGCACGGCGCGGACACCGATGACGAGGAACTCGTCGGGCTCAGCGCCTTCGTGATGGGCTCCGGCGTCGAGAACATGGCCAGCATGCTGGGCCTCGGCATCCTCGCCCTGCTGGAGCACCCGGCCCAGCTCGCCCTCCTCCGTGAACGGCCCGGACTGATCGACGGCGCCGTGGAGGAACTCGTCCGCCACCTCTCGGTCATCCCGACCGCCTCGCCCCGCGTCGCCCGCGAGGACGTGAACCTCGGCGGCCGGACGGTCAAGGCGGGCGACCGCGTGGCCTGCTCCCTGCTCGCGGCCAACCGCGCACGCCGTCCGGGACAGCCGCCCGACCGCCTCGACATCACGCGCGAACCCACCGCCCATGTGGCGCTCGGCCACGGCGTCCACTACTGCGTCGGCGCGTCGCTGGTCAGGATGGAGCTCAGAGCCGCCTACCCGGCGGTACTGCGCCGCTTCCCCGCACTGCGGCTCGCGGTGCCCGCCGAGGAGATCCGCTTCCGTCCGCAGGCGCCCTACGGCCTGGAAACACTGCCCATCGCCTGGTAGGGGAGCCATGCCACCCACACCCACACCCACGCCCACGCCCACCACGCCCACCACGCCCACCCCGCCCGCCTACGCCCGCCGCGACCGGTTCGACCCCGCCGCGGAACTCCGCCGGCTGACCGCCGGGAGAACCGTCACCGCGATCGACGTCGGCCCGGGAACGGACGGGGTGCCCGTCTGGCTCGTGACCGGCCACGCCGAGGTGCGCCAAGTCCTCGGCGACCACCGCCGGTTCTCCACCCGCCGCCGCTTCGGGCCGCGCTCACCGTCCGGCCGCGCCGACGGCCCCCGGCCCGACGAGATGGCCGGGCAGCTCATGGACTACGACCCGCCCGAGCACACCCGGCTCCGGCAGATCCTCACGCCCGAGTTCACCGTGCGCCGGATGCGGCGGCTGGAGCCGCTGGTCGAGGGCATCGTCACGGAACGCCTCGACGCCATGGAACGCGGCGGGCCCCCGGCCGACCTGGTGCGGTCCTTCTGCTCGCCCGTGCCCGGCGCGGTGCTGTGCGAACTGATCGGGGTGCCCCGGGACGACCGCGGCGGCTTCCTGCGCCGCTGCCACGCGTTCCTCGCCCCCGGACGCGGCCGGCAGCGGCGGGCGGCGGCCGGCGACGCGCTGTCGCGCTACCTCGCCGAGATGGTGCGGCGCGCCCGCAGGGACCCCGGCGACGGCTTCCTCGGCGCACTGGTCCGCGACCACGGCGACGAGATCACCGATCAGGAACTGCGCGGCGTCTGCGTCCTGCTGGTCCTCGCCGGCCTCGACAACGTCTCGGGCATGCTCGGCCTGGGCACCCTGCTGCTCCTGGACCACCCCGCCCAGCTCGCCGCCGTGCGCGACGACCCCGGAGCGGTGGACGGCGCGGTCGACGAACTGCTCCGCTACCTGACGGTGCCGCACGCCCCCACGCCGCGCACCGCCCTGGAGGACGTCACCGTCGGAGACCGGCTCGTCCGGGCCGGGGAGCACGTCATCTGCTCGCTGCCGATGGCCAACCGCGACCCCGCCCTGCTCCCCGAGCCCGACCGGTTCGACATCACCCGGGAGCCCACCGCCCACGTGGCCTTCGGCCACGGCGTCCACCACTGCCTGGGCGCGGCCCTGGCCCGGATGGAACTGCGGACCGCGTACCCGGCGCTGCTGCGCCGCTTCCCCCGGCTCGCCGTGGCGGTGCCCGGCGAGGAGGTTCCGTTCCGCGTCCACGCCCTCGCGCACGGCGTGGACCGGCTGCCGGTGACCTGGTGA TAG

（2）海洋链霉菌非核糖体多肽合成酶进行蛋白功能域的分析： (2) Analysis of protein functional domains by Streptomyces marine non-ribosomal polypeptide synthetase:

将海洋链霉菌 Complestatin-like Compound基因簇中编码非核糖体多肽合成酶的序列提交到英国 Sanger学院Pfam蛋白质家庭数据库的在线分析系统中（http://pfam.sanger.ac.uk/search），对海洋链霉菌的非核糖体多肽合成酶进行蛋白功能域的分析。通过与薰衣草链霉菌S. lavendulae中Complestatin基因簇中的非核糖体多肽合成酶进行比对的结果（图4），发现海洋链霉菌中的非核糖体多肽合中的SinC基因较Complestatin基因簇中的ComC基因缺少一个甲基化功能域，初步预测海洋链霉菌中的非核糖体多肽合成酶有别于S. lavendulae中Complestatin基因簇中的非核糖体多肽合成酶，可能合成一级结构不同于Complestatin的Complestatin-like Compound。 Submit the sequences encoding non-ribosomal polypeptide synthetases in the Complestatin-like Compound gene cluster of Streptomyces marine to the online analysis system of the Pfam protein family database of Sanger College, UK (http://pfam.sanger.ac.uk/search), Protein domain analysis of a non-ribosomal polypeptide synthase from Streptomyces maritimus. By comparing with the non-ribosomal polypeptide synthetase in the Complestatin gene cluster in Streptomyces lavender S. lavendulae (Figure 4), it was found that the SinC gene in the non-ribosomal polypeptide complex in Streptomyces marine The ComC gene lacks a methylation functional domain, and it is preliminarily predicted that the non-ribosomal polypeptide synthase in Streptomyces marine is different from the non-ribosomal polypeptide synthase in the Complestatin gene cluster in S. lavendulae , and the primary structure may be different from that of Complestatin-like Compound of Complestatin.

（3）海洋链霉菌 Complestatin-like Compound基因簇合成产物结构预测 (3) Structure prediction of the synthetic product of the Complestatin-like Compound gene cluster of Streptomyces marinum

为进一步确定海洋链霉菌中基因簇编码产生的中Complestatin-like Compound的结构，我们将海洋链霉菌 Complestatin-like Compound基因簇中编码非核糖体多肽合成酶的序列提交到在线NRPS&PKS产物结构预测网站http://dna.sherman.lsi.umich.edu/上，对海洋链霉菌 Complestatin-like Compound基因簇可能合成的产物结构进行一级结构预测。并通过ChemDraw软件打开和查看预测结果（图5）。 In order to further determine the structure of the Complestatin-like Compound produced by the gene cluster in Streptomyces marine, we submitted the sequence encoding the non-ribosomal polypeptide synthase in the Complestatin-like Compound gene cluster of Streptomyces marine to the online NRPS&PKS product structure prediction website http ://dna.sherman.lsi.umich.edu/, the primary structure prediction of the possible synthetic product structure of the marine Streptomyces Complestatin-like Compound gene cluster. And open and view the predicted results through ChemDraw software (Figure 5).

预测结果显示，海洋链霉菌 Complestatin-like Compound基因簇合成产物的多肽氨基酸排列为Hpg→Trp→Ala→Hpg→Leu→Tyr→Hpg，有别于Complestatin一级多肽结构（图6）的Hpg→Trp→Hpg→Hpg→Hpg→Tyr→Hpg 。这可以说明海洋链霉菌中的基因簇可能编码合成一种一级结构不同于Complestatin。 The prediction results show that the amino acid sequence of the polypeptide synthesized by the Complestatin-like Compound gene cluster of Streptomyces marine is Hpg→Trp→Ala→Hpg→Leu→Tyr→Hpg, which is different from the Hpg→Trp of the Complestatin primary polypeptide structure (Figure 6). →Hpg→Hpg→Hpg→Tyr→Hpg. This may indicate that the gene cluster in marine Streptomyces may encode a primary structure different from Complestatin. the

SEQUENCE LISTING SEQUENCE LISTING

the

<110> 大连理工大学 <110> Dalian University of Technology

the

<120> 一种海洋链霉菌卤化酶基因及其产物，以及其修饰产物的生物合成基因簇 <120> A biosynthetic gene cluster of a marine Streptomyces halogenase gene and its product, and its modified product

the

<130> 201110333075.8 <130> 201110333075.8

the

<140> 201110333075.8 <140> 201110333075.8

<141> 2011-10-28 <141> 2011-10-28

the

<160> 1 <160> 1

the

<170> PatentIn version 3.3 <170> PatentIn version 3.3

the

<210> 1 <210> 1

<211> 508 <211> 508

<212> PRT <212> PRT

<213> Streptomyces xinghaiensis) <213> Streptomyces xinghaiensis)

the

<220> <220>

<221> SITE <221> SITE

<222> (30)..(35) <222> (30)..(35)

<223> FAD 结合位点(GGGXXG) <223> FAD binding site (GGGXXG)

the

<220> <220>

<221> SITE <221> SITE

<222> (243)..(249) <222> (243)..(249)

<223> 色氨酸残基结合位点(GWTWXIP) <223> Tryptophan residue binding site (GWTWXIP)

the

<400> 1 <400> 1

the

Met Thr Arg Arg Val Thr Arg Gly Gly Gly Met Ala Leu Pro Asp Ser Met Thr Arg Arg Val Thr Arg Gly Gly Gly Met Ala Leu Pro Asp Ser

1 5 10 15 1 5 10 15

the

Glu Glu Phe Asp Val Val Val Val Gly Gly Gly Pro Ala Gly Ser Thr Glu Glu Phe Asp Val Val Val Val Gly Gly Gly Pro Ala Gly Ser Thr

20 25 30 20 25 30

the

Leu Ala Ala Leu Thr Ala Met Gln Gly His Arg Val Leu Val Leu Glu Leu Ala Ala Leu Thr Ala Met Gln Gly His Arg Val Leu Val Leu Glu

35 40 45 35 40 45 45

the

Lys Glu Phe Phe Pro Arg His Gln Ile Gly Glu Ser Leu Leu Pro Ala Lys Glu Phe Phe Pro Arg His Gln Ile Gly Glu Ser Leu Leu Pro Ala

50 55 60 50 55 60 60

the

Thr Val His Gly Val Cys Arg Leu Thr Gly Val Ala Asp Glu Leu Ala Thr Val His Gly Val Cys Arg Leu Thr Gly Val Ala Asp Glu Leu Ala

65 70 75 80 65 70 75 80

the

Ala Ala Gly Phe Pro Arg Lys Arg Gly Gly Thr Phe Lys Trp Gly Ala Ala Ala Gly Phe Pro Arg Lys Arg Gly Gly Thr Phe Lys Trp Gly Ala

85 90 95 85 90 95

the

Asn Pro Glu Pro Trp Thr Phe Ser Phe Ser Val Ser Pro Arg Met Thr Asn Pro Glu Pro Trp Thr Phe Ser Phe Ser Val Ser Pro Arg Met Thr

100 105 110 100 105 110

the

Gly Pro Thr Tyr Ala Tyr Gln Val Glu Arg Ala Lys Phe Asp Glu Ile Gly Pro Thr Tyr Ala Tyr Gln Val Glu Arg Ala Lys Phe Asp Glu Ile

115 120 125 115 120 125

the

Leu Leu Asn Asn Ala Arg Arg Val Gly Ala Glu Val Arg Glu Gly Cys Leu Leu Asn Asn Ala Arg Arg Val Gly Ala Glu Val Arg Glu Gly Cys

130 135 140 130 135 140

the

Ala Ala Val Asp Val Val Glu Asp Gly Glu Arg Val Arg Gly Val Arg Ala Ala Val Asp Val Val Glu Asp Gly Glu Arg Val Arg Gly Val Arg

145 150 155 160 145 150 155 160

the

Tyr Thr Asp Ala Asp Gly Arg Glu His Arg Ala Ser Ala Thr Phe Val Tyr Thr Asp Ala Asp Gly Arg Glu His Arg Ala Ser Ala Thr Phe Val

165 170 175 165 170 175

the

Val Asp Ala Ser Gly Asn Gly Ser Arg Leu Tyr Arg Arg Val Gly Gly Val Asp Ala Ser Gly Asn Gly Ser Arg Leu Tyr Arg Arg Val Gly Gly

180 185 190 180 185 190

the

Thr Arg Glu Tyr Ser Glu Phe Phe Arg Ser Leu Ala Leu Tyr Gly Tyr Thr Arg Glu Tyr Ser Glu Phe Phe Arg Ser Leu Ala Leu Tyr Gly Tyr

195 200 205 195 200 205

the

Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Asn Ser Gly Asn Ile Leu Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Asn Ser Gly Asn Ile Leu

210 215 220 210 215 220

the

Ser Val Ala Phe Glu Ser Gly Trp Phe Trp Tyr Ile Pro Leu Ser Pro Ser Val Ala Phe Glu Ser Gly Trp Phe Trp Tyr Ile Pro Leu Ser Pro

225 230 235 240 225 230 235 240

the

Asp Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu Met Ala Gly Lys Asp Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu Met Ala Gly Lys

245 250 255 245 250 255

the

Ile Arg Gly Asp Ser Gly Lys Ala Leu Ala Ala Leu Ile Ala Glu Cys Ile Arg Gly Asp Ser Gly Lys Ala Leu Ala Ala Leu Ile Ala Glu Cys

260 265 270 260 265 270

the

Pro Leu Ile Ser Glu Tyr Leu Ala Asp Ala Arg Arg Val Thr Glu Gly Pro Leu Ile Ser Glu Tyr Leu Ala Asp Ala Arg Arg Val Thr Glu Gly

275 280 285 275 280 285

the

Pro Tyr Gly Lys Leu Arg Val Arg Lys Asp Tyr Ser Tyr His His Thr Pro Tyr Gly Lys Leu Arg Val Arg Lys Asp Tyr Ser Tyr His His Thr

290 295 300 290 295 300

the

Thr Phe Ser Arg Pro Gly Met Ile Leu Val Gly Asp Ala Ala Cys Phe Thr Phe Ser Arg Pro Gly Met Ile Leu Val Gly Asp Ala Ala Cys Phe

305 310 315 320 305 310 315 320

the

Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala Thr Tyr Ser Ala Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala Thr Tyr Ser Ala

325 330 335 325 330 335

the

Leu Leu Ala Ala Arg Ser Ile Asn Ser Val Leu Gly Leu Val Gly Glu Leu Leu Ala Ala Arg Ser Ile Asn Ser Val Leu Gly Leu Val Gly Glu

340 345 350 340 345 350

the

Asp Arg Ala Leu Arg Glu Phe Glu Ser Arg Tyr Arg Arg Glu Tyr Gly Asp Arg Ala Leu Arg Glu Phe Glu Ser Arg Tyr Arg Arg Glu Tyr Gly

355 360 365 355 360 365

the

Val Phe Tyr Glu Phe Leu Leu Ser Phe Tyr Glu Met His Gln Asp Glu Val Phe Tyr Glu Phe Leu Leu Ser Phe Tyr Glu Met His Gln Asp Glu

370 375 380 370 375 380

the

Asn Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr Arg Ala Asn Arg Pro Asn Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr Arg Ala Asn Arg Pro

385 390 395 400 385 390 395 400

the

Glu Leu Glu Ser Phe Val Glu Leu Ile Gly Gly Val Ser Ser Gly Glu Glu Leu Glu Ser Phe Val Glu Leu Ile Gly Gly Val Ser Ser Gly Glu

405 410 415 405 410 415

the

Arg Val Leu Thr Asp Ala Glu Val Leu Ala Lys Arg Phe Ser Ser Gly Arg Val Leu Thr Asp Ala Glu Val Leu Ala Lys Arg Phe Ser Ser Gly

420 425 430 420 425 430

the

Ser Ala Glu Phe Ala Ala Ala Val Asp Glu Leu Ala Gly Ser Glu Asp Ser Ala Glu Phe Ala Ala Ala Val Asp Glu Leu Ala Gly Ser Glu Asp

435 440 445 435 440 445

the

Gly Ser Met Val Pro Leu Phe Lys Ser Ser Val Val Arg Glu Val Met Gly Ser Met Val Pro Leu Phe Lys Ser Ser Val Val Arg Glu Val Met

450 455 460 450 455 460

the

Gln Glu Gly Gly Gln Val Gln Met Arg Ala Leu Leu Gly Glu Asp Ala Gln Glu Gly Gly Gln Val Gln Met Arg Ala Leu Leu Gly Glu Asp Ala

465 470 475 480 465 470 475 480

the

Glu Pro Glu Ala Pro Leu Ser Ala Asp Gly Leu Val Pro Ser Pro Asp Glu Pro Glu Ala Pro Leu Ser Ala Asp Gly Leu Val Pro Ser Pro Asp

485 490 495 485 490 495

the

Gly Met Phe Trp Leu Pro Ala Gln Gly Thr Gly Glu Gly Met Phe Trp Leu Pro Ala Gln Gly Thr Gly Glu

500 505 500 505

Claims

1. marine streptomyces chlB4 gene nucleotide series is characterized in that:

(a), the nucleic acid that contains nucleotide sequence shown in the SEQ ID NO. 1; With

(b), have at least 75% sequence homogeny, kept the nucleic acid of chlB4 function simultaneously with (a) said nucleic acid.

2. marine streptomyces chlB4 protein that comprises coding gene sequence is characterized in that:

(a), the protein that contains the aminoacid sequence shown in the SEQ ID NO. 2; With

(b), in the proteinic aminoacid sequence of (a) through replacement, lack or add one or several amino acid and have the chlB4 function by (a) deutero-protein.

3. obtain marine streptomyces halo enzyme full length gene with and the method for modified outcome gene cluster sequence, it is characterized in that: may further comprise the steps:

Insert the marine streptomyces genomic library that fragment is about 35-40kb with the Fosmid vector construction;

With the library transfection bacterium that is obtained, dull and stereotyped coating, the mono-clonal after the evaluation library is qualified on the picking flat board is cultivated in substratum;

Extract the monoclonal DNA that cultivates, PCR increases, and the PCR amplified production is detected, and obtains to contain the positive colony of halo enzyme gene; With this positive colony is checked order, obtain this halo enzyme full length gene and modified outcome gene cluster sequence;

Marine streptomyces complestatin analogue gene bunch function prediction, and chlB4 modified outcome structure prediction: comprise the analysis of non-ribosomal polypeptide synthetase albumen domain, and the gene cluster sequencing result of coding complestatin analogue is analyzed.

4. acquisition marine streptomyces halo enzyme full length gene according to claim 3 with and modified outcome gene cluster sequence method, it is characterized in that, comprising:

Marine streptomyces chlB4 sequencing result is analyzed;

The sequence results analysis of marine streptomyces Fosmid library halo enzyme positive plasmid;

Marine streptomyces non-ribosomal polypeptide synthetic enzyme carries out the analysis in protein function territory;

The gene cluster sequencing result of coding chlB4 modified outcome is analyzed in the marine streptomyces.

5. the gene cluster of coding chlB4 modified outcome in the marine streptomyces is characterized by:

(a), the nucleic acid that contains nucleotide sequence shown in the SEQ ID NO. 2; With

(b), have at least 75% sequence homogeny, kept the nucleic acid of synthetic similar structures compound simultaneously with (a) said nucleic acid.