[go: up one dir, main page]

CN1578678B - 猿猴腺病毒的核酸和氨基酸序列,含有它们的载体以及用法 - Google Patents

猿猴腺病毒的核酸和氨基酸序列,含有它们的载体以及用法 Download PDF

Info

Publication number
CN1578678B
CN1578678B CN02823023XA CN02823023A CN1578678B CN 1578678 B CN1578678 B CN 1578678B CN 02823023X A CN02823023X A CN 02823023XA CN 02823023 A CN02823023 A CN 02823023A CN 1578678 B CN1578678 B CN 1578678B
Authority
CN
China
Prior art keywords
thr
leu
ala
asn
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN02823023XA
Other languages
English (en)
Other versions
CN1578678A (zh
Inventor
J·M·威尔森
G·高
S·罗伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Pennsylvania Penn
Original Assignee
University of Pennsylvania Penn
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Pennsylvania Penn filed Critical University of Pennsylvania Penn
Publication of CN1578678A publication Critical patent/CN1578678A/zh
Application granted granted Critical
Publication of CN1578678B publication Critical patent/CN1578678B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/235Adenoviridae
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5256Virus expressing foreign proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10321Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10322New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10361Methods of inactivation or attenuation
    • C12N2710/10362Methods of inactivation or attenuation by genetic engineering
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/20011Papillomaviridae
    • C12N2710/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16111Human Immunodeficiency Virus, HIV concerning HIV env
    • C12N2740/16122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/17011Spumavirus, e.g. chimpanzee foamy virus
    • C12N2740/17022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/14011Filoviridae
    • C12N2760/14111Ebolavirus, e.g. Zaire ebolavirus
    • C12N2760/14134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16111Influenzavirus A, i.e. influenza A virus
    • C12N2760/16134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/20011Rhabdoviridae
    • C12N2760/20111Lyssavirus, e.g. rabies virus
    • C12N2760/20122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/001Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
    • C12N2830/002Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/55Vector systems having a special element relevant for transcription from bacteria

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Virology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

一种含猿猴腺病毒序列和在调控序列控制下的异源基因的重组载体。还公开了一种能表达猿猴腺病毒基因的细胞系。提供了利用此载体和细胞系的方法。

Description

猿猴腺病毒的核酸和氨基酸序列,含有它们的载体以及用法
发明背景
腺病毒是一种基因组大小36千碱基(kb)的双链DNA病毒,由于其能在各种靶组织实现高效基因转移和大的转基因容量,已广泛用于基因转移用途。通常,缺失腺病毒的E1基因,用含有所选的启动子、感兴趣基因的cDNA序列和聚A信号序列的转基因盒替代,产生复制缺陷性重组腺病毒。
腺病毒的形态特征是具有由三种主要蛋白质、六邻体(II)、五邻体碱基(III)和缠绕纤维(IV)、以及许多其它小蛋白VI、VIII、IX、IIIa和IVa2组成的二十面体衣壳(W.C.Rurreii,J.Gen.Virol.,81:2573-2604.2000)。其病毒基因组是线性双链DNA,具有共价结合于有着倒置末端重复序列的5’端的一末端蛋白质。腺病毒DNA与高碱性蛋白质工程VII和一小肽终端mu密切相联。此DNA-蛋白质复合物包装了另一蛋白质V,并通过蛋白质VI提供了与衣壳的结构连接。此病毒还含有加工某些结构性蛋白质产生成熟传染性病毒所需的一种病毒编码的蛋白酶。
用于向细胞输送分子的重组腺病毒已有描述,见美国专利6,083,716所述的两种黑猩猩腺病毒。
本领域需要能避开人群中对所选腺病毒血清型预先存在的免疫力的和/或可用于反复给药和如果需要经二次疫苗接种能提高效价的更有效的载体
发明概述
本发明提供六个猿猴腺病毒的分离的核酸序列和氨基酸序列、含这些序列的载体和能表达猿猴腺病毒基因的细胞系。还提供采用本发明载体和细胞的一些方法。  本发明方法包括给予本发明的载体向哺乳动物输送一种或多种所选的异源基因。因为各种载体构建物衍生自猿猴而非人,非猿病人或病兽的免疫系统不能将此载体视作外源抗原立刻对其发生应答。因此采用本发明的组合物当给予非猿受试者时,得以更稳定地表达所选项的转基因。采用本发明的组合物作疫苗接种得以提供所选的抗原以引发保护性免疫应答。不希望受理论的束缚,本发明的腺病毒转导人树突状细胞的能力至少部分导致本发明的重组构建物能够引发免疫应答。本发明的重组猿猴腺病毒也可用于体外产生异源基因产物。这种基因产物本身的多种多样可用于如本文所述的各种目的。
本发明的这些和其它实施例及优点将在以下作更详细描述。
附图简述
图1提供了本发明黑猩猩腺病毒C1(SEQ ID NO:13)、黑猩猩腺病毒C68(Pan-9)(SEQ ID NO:14)和新的Pan5(SEQ ID NO:15)、Pan6(SEQ ID NO:16)、Pan7(SEQ IDNO:17)黑猩猩腺病毒序列的衣壳蛋白六邻体的L1换和部分L2环的氨基酸序列排列对比。相关的保守区是腺病毒各血清型之间保守的基础结构域部分。
图2提供了黑猩猩腺病毒C68(Pan-9)(SEQ ID NO:18)、Pan-6(SEQ ID NO:19)、Pan-7(SEQ ID NO:20)、Pan-5(SEQ ID NO:21)和人腺腺病毒血清型2(SEQ ID NO:22)和5(SEQ ID NO:23)的纤维瘤结构域的氨基酸序列的排列对比。
发明详述
本发明提供了最初分离自黑猩猩淋巴结的Ad Pan5(SEQ ID NO:1-4、15和21)、Ad Pan6(SEQ ID NO:5-8,16,19)和Ad血清型Pan7(SEQ ID NO:9-12,17,20)的新的核酸和氨基酸序列。本说明书的几个例子中,这些腺病毒分别以本文的C5,C6和C7为末端。本发明还提供最初分离自猕猴肾细胞的腺病毒SV1的序列(SEQ IDNO:24-28)。本发明还提供最初分离自猕猴肾细胞的腺病毒SV-25(SEQ ID NO:19-33)和SV-39(SEQ ID NO:34-37)的序列。
本发明提供新型腺病毒载体和产生这些载体的包装细胞系,用于在体外产生重组蛋白质或片段或其它制剂。本发明还提供用于输送治疗或疫苗目的的异源分子的组合物。这些治疗性或疫苗组合物含有携带插入的异源分子的腺病毒载体。此外,本发明的新型序列可用于提供产生重组腺病毒相关病毒(AAV)载体所需的辅助功能。因此本发明提供在此种产生方法中利用这些序列的辅助构建物、方法和细胞系
术语“基本上同源”或“基本上相似”指核酸或其片段时,表示当任选地将含相应核苷酸插入或缺失的序列与另一核酸(或其互补链)排列对比时,对比的序列至少约95-99%核苷酸序列相同。
术语“基本上同源”或“基本上相似”指氨基酸或其片段时,表示当任选地将含相应氨基酸插入或缺失的序列与另一氨基酸(或其互补链)排列对比时,对比的序列至少约95-99%核苷酸序列相同。优选同源性指蛋白质的全长序列,或其长度至少8个氨基酸,更佳至少15个氨基酸的片段。本文将描述合适片段例子。
本文核酸序列所用术语“序列同一性百分率”或“相同”指当作最大排列对比时两个序列中的残基相同。序列同一性比较的长度可包括全长基因组(如约36kb)、基因、蛋白质、亚基或酶开放阅阅读框的全长(例如见表中提供的腺病毒编码区),或者,需要的话,至少约500-5000个核苷酸的片段。然而,也可能需要比较较小片段,如至少约9个核苷酸,通常至少约20-24个核苷酸,至少约28-32个核苷酸,至少约36个或更多核苷酸的同一性。类似的,可不难确定某蛋白质全长或其片段的氨基酸序列的“序列同一性百分率”。一片段宜至少长约8个氨基酸,可长达700个氨基酸。本文将描述合适片段的例子。
用缺省设置,采用本文的算法和计算机程序不难测定同一性。优选这种同一性指蛋白质、酶、亚基或其至少长约8个氨基酸的片段。然而,这种同一性可基于较短的区域,适合产生相同的基因产物的区域。
如本文中所述,可用各种已发表的或可商品购得的多个序列排列对比程序,如“Clustal W”,通过inter网服务获得,进行此排列对比。或者,也可采Vector NTI公用事业公司的程序。本领域已知许多算法可用于测定核苷酸序列的同一性,包括上述程序中所含有的那些。另一例子,可采用Fasta(GCC第6.1版中的程序)比较多核苷酸的序列。Fasta提供了询问和检索之间最佳重叠区域的对比和序列同一性百分率。例如,可利用Fasta的缺失参数(六个字大小和评分矩阵的NOPAM系数),如GCC第6版中提供的(纳入本文参考文献),来测定核酸序列之间的序列同一性百分率。可获得类似的程序来进行氨基酸的排列对比。通常这些程序采用缺省设置,虽然如果需要本领域技术人员可换用其它设置。或者,本领域技术人员可采用至少能提供如上述算法和程序同样的同一性或对比水平的其它算法或计算机程序。
如本说明书和权利要求书所用,术语“包含”及其异体词,其中包括“含有”、“包括”等,包括其它组分、元件、整数、步骤等。术语“由…组成”不包括其它组分、元件、整数、步骤等。
I.猿猴腺病毒序列
本发明提供了分离自与腺病毒天然相关的其它病毒材料的Pan5、Pan6、Pan7、SV1、SV25和SV39的核酸序列和氨基酸序列。
A.核酸序列
本发明的Pan5核酸序列包括SEQ ID NO:1的核苷酸1-36462。本发明的Pan6核酸序列包括SEQ ID NO:5的核苷酸1-36604。本发明的Pan7核酸序列包括SEQ IDNO:9的核苷酸1-36535。本发明的SV1核酸序列包括SEQ ID NO:24的核苷酸1-34264。本发明的SV25核酸序列包括SEQ ID NO:29的核苷酸1-31044。本发明的SV39核酸序列包括SEQ ID NO:34的核苷酸1-34115。见纳入本文参考文献中的序列表。
本发明的核酸序列还包括SEQ ID NO:5、9、24、29和34序列互补的链,以及相应于这些序列图中序列及其互补链的RNA和cDNA。本发明还包括与序列表有95-98%以上,更优选约99-99.9%同源性或同一性的核酸序列。本发明的核酸序列还包括SEQ ID NO:5、9、24、29和34中提供的序列和它们的互补链的天然变种和基因I程修饰。这种修饰例如包括本领域已知的标记、甲基化和一个或多个天然核苷酸被简并核苷酸所取代。
本发明还包括Pan5、Pan6、Pan7、SV1、SV25和SV39序列的片段、它们的互补链、互补的cDNA和RNA。合适的片段至少长15个核苷酸并含有功能性片段,如生物学感兴趣的片段。例如,功能性片段可表达所需的腺病毒产物,或用于产生重组病毒载体。这种片段包含下表所列的基因序列和片段。
下表提供了本发明猿猴腺病毒序列的转录区和开放阅读框。对于某些基因,其转录区和开放阅读框(ORFs)位于与SEQ ID NO:5、9、24、29和34序列互补的链上。见例如E2b,E4和E2a。还显示了其编码蛋白的分子量。注意,E1a开放阅读框Pan5(SEQ ID NO:1的核苷酸576-1436)、Pan6(SEQ ID NO:5的核苷酸576-1437)和Pan7(SEQ ID NO:9的核苷酸576-1437)含有内部剪接位点。这些剪接位点在下表中标出:
Figure G02823023XD00071
Figure G02823023XD00111
Pan5、Pan6、Pan7、SV1、SV25和SV39腺病毒核酸序列可用于治疗制剂和构建各种载体系统和宿主细胞。如本文所用,载体所包含的适合的核酸分子包括,裸DNA、质粒、粘粒或游离体。这些序列和产物可单独应用,或与其它腺病毒序列或片段联用,或与其它腺病毒或非腺病毒的元件联用。本发明的腺病毒序列还可作为反义输送载体、基因治疗载体或疫苗载体应用。因此,本发明还提供含有本发明Ad序列的核酸分子、基因输送载体和宿主细胞。
例如,本发明包括含有本发明猿猴Ad ITR序列的核酸分子。另一实施例中,本发明提供含有本发明猿猴Ad序列编码所需Ad基因产物的核酸分子。本领域技术人员在阅读了本文提供的信息后不难明白采用本发明序列构建其它核酸分子。
一实施例中,本文鉴定的猿猴Ad基因区域可用于载体向细胞输送异源分子。例如,产生用于表达腺病毒衣壳蛋白(或其片段)的载体,目的是在包装宿主细胞中产生病毒载体。可设计顺式表达的这类载体。或者,可设计这类载体来提供稳定含有能表达所需腺病毒功能序列,如E1a、E1b、末端重复序列、E2a、E2b、E4、E4ORF6a区域的细胞。
此外,所述腺病毒基因序列或其片段可用于提供产生辅助依赖性病毒(如缺失了必须功能的腺病毒载体或腺相关病毒AAV)所必须的辅助功能。对于这种产生方法,本发明的猿猴腺病毒序列以类似于人Ad所述的方式用于此方法中。然而,由于本发明猿猴腺病毒和人Ad序列之间的序列差异,采用本发明的序列必须消除在带有人Ad E1功能的宿主细胞中与辅助功能同源重组的可能性,如在rAAV产生时可产生传染性腺病毒污染物的293细胞中。
在许多关于人腺病毒血清型的文献中已描述了利用腺病毒辅助功能产生rAAV的方法。见例如美国专利6,258,595和本文所引用参考文献。这些方法也可用于产生非人血清型AAV,包括非人灵长动物AAV血清型。本发明提供必须的辅助功能的猿猴腺病毒序列(如E1a、E1b、E2a和/或E4ORF6),在提供必须的腺病毒功能,同时尽量减少或消除与人类来源的rAAV-包装细胞中存在的任何其它腺病毒重组的可能性中,可能特别有用。因此这些rAAV产生方法中,可采用本发明选出的腺病毒序列的基因或开放阅读框。
或者,这些方法中可采用本发明的重组猿猴腺病毒载体。这类重组猿猴腺病毒载体可包括,例如杂交的黑猩猩Ad/AAV,其中黑猩猩Ad序列侧接由AAV 3’和/或5’ITR组成的rAAV表达盒,和在控制其表达的调控序列控制下的转基因。本领域技术人员会懂得本发明的其它猿猴腺病毒载体和/或基因序列还可用于产生依赖腺病毒辅助的rAAV和其它病毒。
在另一实施例中,设计了用于能在宿主细胞中输送和表达所选腺病毒基因产物以实现所需生理效应的核酸分子。例如,可将含有编码本发明腺病毒E1a蛋白序列的核酸分子输送给患者,用于癌症治疗。任选地,可用液体载体配制此分子,优选靶向癌细胞。这类制剂可与其它癌症治疗剂(如顺氯氨铂、紫杉醇等)联用。本领域技术人员不难明白,本文提供的腺病毒序列还有其它用途。
此外,本领域技术人员不难理解,可容易地采纳本发明的Ad序列用于各种病毒和非病毒载体系统以在体外、活体外或体内输送治疗性和免疫原性分子。例如,在各种rAd和非rAd载体系统中可采用本发明的Pan5、Pan6、Pan7、SV1、SV25和SV39猿猴Ad基因组。这些载体系统查包括,如质粒、慢病毒、逆转录病毒、痘病毒、痘苗病毒和腺病毒相关病毒系统。选择这些载体系统不是限制本发明。
本发明还提供用于产生本发明的猿猴和猿猴病毒衍生的蛋白质。载有多核苷酸的这种分子可包括裸DNA、质粒、病毒或其它基因元件形式的本发明猿猴Ad DNA序列。
B.本发明的腺病毒蛋白质
本发明还提供上述腺病毒的基因产物,如本发明腺病毒核酸编码的蛋白质、酶、及其片段。本发明还包括具有用其它方法产生的这些核酸序列编码的Pan5、Pan6、Pan7、SV1、SV25和SV39蛋白、酶及其片段。这些蛋白包括上表、图1和图2所鉴定的开放阅读框所编码的蛋白。
因此,本发明一方面提供基本纯的,即没有其它病毒和蛋白质的独特猿猴腺病毒蛋白质。优选这些蛋白质至少10%同源,更优选60%同源,最优选95%同源。
一实施例中,本发明提供独特的猿猴腺病毒衣壳蛋白。如本文所用,猿猴腺病毒衣壳蛋白包括上述含Pan5、Pan6、Pan7、SV1、SV25和SV39衣壳蛋白或其片段的任何腺病毒衣壳蛋白,包括但不限于,嵌合性衣壳蛋白、融合蛋白、人造衣壳蛋白、合成的衣壳蛋白和重组衣壳蛋白,不限于产生这些蛋白的方法。
适当地,这些猿猴腺病毒衍生的衣壳蛋白含有与这里所述的不同腺病毒血清型衣壳区或其片段,或修饰的猿猴衣壳蛋白或片段组合的一个或多个Pan5、Pan6、Pan7、SV1、SV25和SV39区域或及片段(如五邻体、六邻体、纤维或其片段)。“与嗜性改变相关的衣壳蛋白的修饰”在这里包括改变的衣壳蛋白,即五邻体、六邻体或纤维蛋白区域或其片段,如纤维区的球形突出区,或编码它们的多核苷酸,因此其特异性被改变。可用酏发明的一个或多个猿猴Ad或人或非人来源的其它Ad血清型来构建猿猴腺病毒衍生的衣壳。这类Ad可获自各种来源,包括ATCC、商业来源和学术来源,或此Ad序列可获自GenBank或其它合适来源。
本文提供本发明的猿猴腺病毒五邻体蛋白的氨基酸序列。SEQ ID NO:2中提供了Ad Pan5五邻体蛋白。SEQ ID NO:6中提供了Ad Pan7五邻体蛋白。SEQ ID NO:10中提供了Ad Pan6五邻体蛋白。SEQ ID NO:25中提供了SV1五邻体蛋白。SEQ ID NO:30中提供了SV25五邻体蛋白。SEQ ID NO:35中提供了SV39五邻体蛋白。任何这些五邻体蛋白或其特定片可用于各种目的。合适片段的例子包括根据以上提供的氨基酸编号和SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:25、SEQID NO:30或SEQ ID NO:35中的N-端和/或C-端截短的约50,100,150,或200个氨基酸的五邻体。其它合适的片段包括较短的内部片段、C-端或N-端片段。也可修饰该五邻体蛋白用于本领域技术人员已知的各种目的。
本发明还提供Pan5(SEQ ID NO:3)、Pan6(SEQ ID NO:7)、Pan7(SEQ ID NO:11)、SV1(SEQ ID NO:26)、SV25(SEQ ID NO:31)和/或SV39(SEQ ID NO:36)六邻体蛋白的氨基酸序列。适合的该六邻体蛋白或其特定片段可用于各种目的。合适片段的例子包括根据以上提供的氨基酸编号和SEQ ID NO:3,7,11,26,31和36中的N-端和/或C-端截短的约50,100,150,200,300,400或500个氨基酸的六邻体。其它合适的片段包括较短的内部片段、C-端或N-端片段。例如,一个合适的片段是该六邻体蛋白的环区(结构域),命名为DE1和FG1,或其超变区。这些片段包括跨越该猿猴病毒六邻体蛋白的氨基酸残基约125-443;约138-441;或较小片段如跨越残基约138-163;170-176;195-203;223-246;253-264;287-297;和404-430的区域,参见SEQ ID NO:3、7、11、26、31或36。本领域技术人员不难鉴定其它合适的片段。也可修饰该六邻体蛋白用于本领域技术人员已知的各种目的。因为该六邻体蛋白是腺病毒血清型的决定簇。人造六邻体蛋白可产生具有人造血清型的腺病毒。其它人造衣壳蛋白也可用本发明的黑猩猩Ad五邻体序列和/或纤维序列和/或其片段构建。
一实施例中,可能需要用本发明六邻体蛋白序列产生具有改变的六邻体蛋白的腺病毒。改变六邻体蛋白的一种适宜方法见美国专利5,922,315中所述,纳入本文参考文献。此法中,用另一腺病毒血清型至少一个环区改变此腺病毒的至少一个环区。因此被改变的腺病毒六邻体蛋白至少一个环区是本发明猿猴Ad六邻体的环区(如Pan7)。一实施例中,Pan7六邻体蛋白的一个环区被另一腺病毒血清型的一不区所替代。另一实施例中,用Pan7六邻体的该环区来替代另一腺病毒血清型的环区。合适的腺病毒血清型如本文所述不难从人或非人血清型中选择。选择Pan7目的只是为了说明,也同样选择本发明其它猿猴Ad六邻体蛋白,或用于改变另一Ad六邻体。选择合适的血清型不是限制本发明。本领域技术人员不难明白本发明的六邻体蛋白还有其它用途。
本发明还包括本发明的猿猴腺病毒的纤维蛋白。Ad Pan5的纤维蛋白具有SEQ IDNO:4的氨基酸序列。Ad Pan6的纤维蛋白具有SEQ ID NO:8的氨基酸序列。Ad Pan7的纤维蛋白具有SEQ ID NO:12的氨基酸序列。SV1具有两种纤维蛋白,纤维2具有SEQ ID NO:27的氨基酸序列;纤维1具有SEQ ID NO:28的氨基酸序列。SV-25也有两种纤维蛋白,纤维2具有SEQ ID NO:32的氨基酸序列;纤维1具有SEQ IDNO:33的氨基酸序列。SV-39纤维蛋白具有SEQ ID NO:37的氨基酸序列。
此纤维蛋白或其特定片段可适当的用于各种目的。一种合适的片段是跨越SEQID NO:4、8、12、28、32、33和37的氨基酸约247-425的纤维瘤。见图2。其它合适的片段例子包括具有根据以上提供的氨基酸编号和SEQ ID NO:4、8、12、28、32、33和37的约50、100、150或200个氨基酸的N-端和/或C-端截短的纤维。其它合适的片段包括内部片段。也可用本领域技术人员熟知的各种技术修饰此纤维蛋白。
本发明还包括本发明至少长8个氨基酸的独特蛋白片段。此外,本发明包括被引入后能提高Pan5、Pan6、Pan7、SV1、SV25或SV39基因产物产量和/或表达的此类修饰,如融合分子构建物,该构建物中,Pan5、Pan6、Pan7、SV1、SV25或SV39基因产物的全部或某片段融合(直接或通过一接头)于一融合伴侣而得到增强。其它合适的修饰包括但不限于截短一编码区(如一蛋白或酶)以去除通常被切断的前蛋白或原蛋白产生成熟的蛋白或酶。和/或突变编码区以提供分泌性基因产物。本领域技术人员不难明白还可进行其它修饰。本发明还包括与本文提供的Pan5、Pan6、Pan7、SV1、SV25或SV39蛋白同一性至少约95%-99%的蛋白质。
如本文所述,本发明的含本发明腺病毒衣壳蛋白的载体特别适合于以下应用,即用中和抗体来去除其它Ad血清型载体以及其它病毒载体的作用。本发明的rAd载体在反复基因治疗或为加强免疫应答(疫苗的效价)的重复给药中有特殊优点。
某些情况下可能需要采用Pan5、Pan6、Pan7、SV1、SV25或SV39基因产物(如衣壳蛋白或其片段)的一种或多种来产生抗体。术语“抗体”本文用于指能特异性结合某表位的免疫球蛋白分子。本发明的抗体能优先特异性结合Pan5、Pan6、Pan7、SV1、SV25或SV39表位而无交叉反应。本发明的抗体可有各种形式,如高亲和力多克隆抗体、单克隆抗体、合成抗体、嵌合性抗体、重组抗体和人源化抗体。这些抗体有免疫球蛋白IgG,IgM,IgA,IgD和IgE类型。
这些抗体也可采用本领域已知许多方法这之一产生。可用熟知的常规技术如Kohler和Milstein及其众多已知改进的技术来产生适合的抗体。可用已知的重组技术开发针对这些抗原的多在隆或单克隆抗体,以产生类似的所需高效价抗体(见例如PTC专利申请No.PTC/GB85/00392;英国专利申请公开号GB2188638;Amit等,Science.233:747-753,1986;Queen等,Proc.Nat’l.Acad.Sci.USA.86:10029-10033,1989;PTC专利申请PTC/WO9007861;和Riechmann等,Nature.332:323-327,1988;Huse等,Science.246:1275-1281,1998a)。或者,通过操作针对本发明抗原的动物或人抗体的互补决定区产生这类抗体,见例如,E Mark和Padlin的“单克隆抗体的人源化”(Humanization of Monoclonal Antibodies),第四章,实验药物手册,第13卷,单克隆抗体的药理学,Springer-Verlag(1994年6月);Harlow等,“抗体使用实验室手册”(Using Antibodies:A Laboratory Manual),Cold Spring Harbor Laboratory Press.NY;Harlow等,1989,“抗体实验室手册”(Antibodies:A Laboratory Manual).Cold Spring Harbor,New York:Harlow等,Proc.Natl.Acad.Sci.USA 85:5879-5883,1988;和Bird等,Science.242:423-426,1988。本发明还提供抗独特型抗体(Ab2)和抗-抗-独特型抗体(Ab3)。例如参见M.Wettendorff等,“用抗独特型抗体调节抗肿瘤免疫力”(Modulation of anti-tumor immunity by anti-idiotypic antibodies),收录在“独特型网络和疾病”(Idiotypic Network and Diseases),J.Cerny和J.Hiernaux编,1990,J.Am.Soc.Microbiol.,华盛顿特区:203-229页)。可用本邻域技术人员所熟知的技术生产这些抗独特型和抗-抗-独特型抗体。这些抗体可用于各种目的,包括诊断和临床方法及试剂盒。
在某些情况下可能需要在本发明的Pan5、Pan6、Pan7、SV1、SV25或SV39基因产物、抗体或其它构建物上引入一可检测标志可一个尾部。本文所用的可检测标志是单独或与另一分子反应时能提供可检测信号的分子。最理想的是该标志可肉眼检测,如通过荧光,便于在免疫组化分析或免疫荧光显微镜中使用。例如,合适的标志包括:异硫氰基荧光系(FITC)、藻红蛋白(PE)、别藻兰蛋白(APC)、coriphosphine-0(CPO)或串联染料,PE-花青-5(PC5)和PE-得克萨斯红(ECD)。所有这些荧光染料可从商品获得,它们的用途是本领域知道的。其它有用的标志是胶体金标志。其它有用的标志还包括放射活性化合物或元系。此外,标记还包括各种酶系统,它们能在试验中产生有色信号,如葡萄糖氧化酶(利用葡萄糖作底物)可释放过氧化氢,存在过氧化物酶和氢供体如四甲基联苯胺(TMB)时,此产物可产生呈兰色可见的氧化TMB。其它例子包括辣根过氧化物酶(HRP)、碱性磷酸酶(AP)、已糖激酶和能与葡萄糖-6-磷酸脱氢酶的结合,后者能与ATP、葡萄糖和NAD+反应,在其它产物中产生NADH,其因340nm波长吸光值增加而可检测。
本发明方法所用的其它标记系统可通过其它方法,如着色的乳胶微粒(Bangs实验室,印第安纳州)来检测,该微粒中包埋有染料用于代替酶与靶序列形成偶联物,从而提供可视信号,表明应用试验中存在所述复合物。
将标记与所需分子偶联或结合的方法是类似的常规方法,为本领域技术人员所知道标记物结合的已知方法已有描述(见例如,“荧光探针和研究用化学制剂手册”(Handbook of Fluorescent probes and Research Chemicals),第六版,R.P.M.Haugland,Molecular Probes有限公司,Eugene,OR,1996;“Pierce目录和手册之生活科学和分析研究产品”(Pierce Catalog and Handbook,Life Scienceand Analytical Research Products),Pierce Chemical公司,Rockford.IL,1994/1995)。标记和偶联方法的选择不限制本发明的范围。
本发明的序列、蛋白和片段可用任何适当的方法产生,包括重组产生、化学合成或其它合成方法。合适的生产技术是本领域技术人员报熟知的,见例如,Sambrook等,“分子克隆实验室手册”(Molecular Cloning:A Laboratory Manual),ColdSpring Harbor Press(纽约,冷泉港)。或者也可用熟知的固相肽合成法(Merrifield,J.Am.Chem.Soc.,85:2149,1962:Stewart和Young,“固相肽合成”(Solid Phase Peptide Synthesis)(Freeman,旧金山,1969),27-62页)来合成肽。这些和其它合适的生产方法都在本领域技术人员知识范围内,不限制本发明。
此外,本领域技术人员不难理解,查容易地采纳本发明的Ad序列用于各中病毒和非病毒载体系统,在体外、活体外或体内输送治疗和免疫原性分子。例如,一实施例中,可将本文所述猿猴Ad衣壳蛋白和其它腺病毒蛋白,用于基因、蛋白质和其它所需的诊断性、治疗性和免疫原性分子的基于非病毒性蛋白的输送。一个这样的实施例中,将本发明的蛋白质直接或间接连接于能靶向带有腺病毒受体的细胞的分子。优选可作为细胞表面受体的配体的衣壳蛋白,如六邻体、五邻体、纤维蛋白或其片段。可从本文所述治疗分子和它们的基因产物中选择适合用于输送的分子。各种接头,包括脂质、聚赖氨酸等可用作接头。例如,为了用类似于Medina-Kauwe LK等,Gene Ther.2001 May;8(10):795-803和Medina-Kauwe LK等,Gene Ther.2001 Dec;8(23):1753-1761。所述方法用猿猴五邻体序列产生一种融合蛋白,而容易地利用该猿猴五邻体蛋白。或者,可利用猿猴Ad蛋白IX的氨基酸序列作为向细胞表面靶向输送的载体,见美国专利申请20010047081。合适的配体包括CD40抗原、含RGD或含多聚赖氮酸的序列等。其它猿猴Ad蛋白,包括例如,六邻体蛋白和/或纤维蛋白,可用于这些目的和类似目的。
本发明的其它腺病毒蛋白可单独或与其它腺病毒蛋白联用于各种目的,本领域技术人员不难明白这一点。此外本领域技术人员不难理解本发明的腺病毒蛋白还有其它用途。
II重组腺病毒载体
本发明的组合物包括用于治疗或疫苗目的的能向细胞输送异源分子的载体。本文所用的载体包含的基因元件有,包括但不限于裸DNA、噬菌体、转座子、粘粒、游离体、质粒或病毒。这些载体含有猿猴腺病毒Pan5、Pan6、Pan7、SV1、SV25和/或SV39和小基因的DNA。“小基因”指所选异源基因和在宿主细胞中发生翻译、转录和/或基因产物表达所必须的其它调控元件的组合。
通常设计本发明腺病毒载体,以使该小基因位于核酸分子中含有与所选腺病毒基因天然在一起的其它腺病毒序列的区域中。如需要,可将该小基因插入现有基因区域中以破坏该区域的功能。或者,可将该小基因插入已部分或全部缺失腺病毒基因的区域。例如,可将该小基因置于功能性E1缺失或功能性E3缺失的部位,也可从其它部位选择。术语“功能性缺失”或“功能性缺省”指通过突变或修饰去除或损伤了该基因区足够数量的核苷酸,因而该基因区不再能产生功能性基因表达产物。如需要,可去除整个基因区域。基因破坏或缺失的其它合适部位在本申请其它地方讨论。
例如,为了产生能用于产生重组病毒的载体,该载体可含此小基因,和腺病毒基因组的5’端或3’端,或5’和3’端。所述腺病毒基因组的5’端含有包装和复制所必须的5’顺式元件,即5’反式末端重复(ITR)序列(其功能是复起点)和天然5’包装增强功能域(含有包装线性Ad基因组所需的序列和E1启动子的增强子元件)。所述腺病毒的3’端包含包装和衣壳化所必须的3’-顺式元件(包括ITRs)。重组腺病毒宜含有5’和3’-腺病毒顺式元件,该小基因宜位于5’和3’-腺病毒序列之间。本发明的任何腺病毒载体也可含其它腺病毒序列。
本发明的腺病毒载体宜含衍生自本发明腺病毒基因组的一种或多种腺病毒元件。一实施例中,该载体含腺病毒Pan5、Pan6、Pan7、SV1、SV25或SV39的ITR和同一腺病毒血清型的其它腺病毒序列。另一实施例中,该载体含不同腺病毒血清型而非提供此ITR腺病毒衍生的腺病毒序列。如本文所述,假型腺病毒指其衣壳蛋白来自不同血清型而非提供此ITR血清型的腺病毒。选择载体中存在的ITR血清型和其它腺病毒序列的血清型不意味限制本发明。各种腺病毒株可从美国模式培养物保藏所(马纳萨斯,弗吉尼亚)获得,或通过咨询各种商业和学术来源而获得。此外,许多菌株的序列可从各种数据库,包括例如,PubMed和GenBank获得。发表的文献中已描述了从其它猿猴或人的腺病毒制备的同源性腺病毒载体(见例如,美国专利5,240,846)。许多类型腺病毒的DNA序列可获自GenBank,包括Ad5(GenBank登录号M73260)。可获得任何已知腺病毒血清型。如血清型2.3.4.7.12和40的腺病毒序列,还包括目前已鉴定的人类型。在本发明的载体构建中也可采用已知能感染非人动物(如猿猴)的相似腺病毒。见例如,美国专利6,083,716。
在构建本文所述载体中所用的病毒序列、辅助病毒,如需要还有重组病毒颗粒、其它载体成分和序列可如上所述来获得。本发明的Pan5、Pan6、Pan7、SV1、SV25或SV39猿猴腺病毒序列可用于构建此类载体和用于制备此载体的细胞系。
对形成本发明载体的核酸序列的修饰,包括序列缺失、插入和可用标准分子生物学技术产生的其它突变,这些修饰属于本发明的范围。
A.“小基因”
采用方法来选择转基因,克隆并构建该小基因,将其插入病毒载体中是本领域的技术,本文说明如下:
1.转基因
转基因是一种编码多肽、蛋白质或其它感兴趣产物的核酸序列,与侧接该转基因的其它载体序列异源。可将该核酸编码序列以允许转基因在宿主细胞中转录、翻译和/或表达的方式,可操作性连接于调控成分。
转基因序列的组成取决于将要产生的载体的用途。例如,一种转基因序列含有一报告序列,其表达时产生一可检测信号。此类报告序列包括但不限于:编码β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、荧光素酶、膜结合蛋白,包括例如CD2、CD4、CD8、流感血凝素蛋白和其它本领域熟知的、对其存在着有或可用常规方法产生的高亲和力抗体的报告分子,以及含有适当融合于血凝素或Myc的抗原标志结构域的膜结合蛋白的融合蛋白质。这些编码序列当与能趋使其表达的调控元件连接时,可提供能用常规方法检测的信号,这些方法包括酶试验、放射图象、比色、荧光试验或其它光谱试验、荧光激活细胞选拣试验和免疫试验,包括酶连免疫吸附试验(ELISA)、放射免疫试验(RIA)和免疫组织化学。例如,当该标志序列是LacZ基因时,存在携带该信号的载体可用β-半乳糖苷酶活性检测。当该转基因是GFP或荧光素酶时,携带该信号的载体可在发光仪中通过观察颜色或发光产物来检测。
然而,需要的转基因是一种无标志序列,其编码的产物可用于生物学和医学,如蛋白质、肽、RNA、酶或催化性RNA。需要的RNA分子包括tRNA、dsRNA、核糖体RNA、催化性RNA和反义RNA。有用RNA序列的一个例子,是能抑制经治疗动物中的靶向核酸序列表达的序列。
该转基因可作为癌症治疗或疫苗,引发免疫应答和/或作为预防性疫苗,用于治疗例如遗传缺陷。本文所述免疫应答的引发指一种分子(如基因产物)引发对该分子的T细胞和/或体液免疫应答反应的能力。本发明还包括用多个转基因来纠正或减轻多亚基蛋白质所致疾病。某些情况下,可用不同的转基因来编码某蛋白质的各亚基,或编码不同的肽或蛋白质。当编码该蛋白的DNA分子很大时,如编码免疫球蛋白、血小板生长因子或肌营养不良性蛋白时。为了使细胞能产生此多亚基蛋白,可用含不同亚基每一种的重组病毒感染细胞。或者,可用同一转基因编码某蛋白的不同亚基。此时,一个转基因就包含了编码各亚基的DNA,编码各亚基的DNA被一内部核糖体进入位点(IRES)分隔。当编码各亚基的DNA分子很小时,如编码诸亚基和IRES的DNA总分子小于5kd时需要这样。作为IRES的替代物,可用含2A肽(翻译后其可自身切断)的序列来分隔此DNA。见例如,M.L.Donnelly等,J.Gen.Virol.,78(Pt 1):13-21(1997.1);Fueler,S.等,Gene Ther.,8(11):864-73(2001.6);Klump H.等,Gene Ther.,8(11):811-17(2001.5)。此2A肽明显小于IRES,使其在间隔为有限因素时很适用。然而,所选的转基因可编码任何生物活性产物或其它产物,如研究所需的产物。
本领域技术人员不难选出适合的转基因。转基因的选择不应认为是对本发明的限制。
2.调控元件
除了上述微基因的主要元件外,该载体还包含操作性连接于此转基因的必须的常规调控元件,它们以允许此转基因在该质粒转染的细胞中,或在用本发明产生的病毒感染的细胞中转录、翻译和/或表达的方式调控。本文所用的“操作性相连接的”序列包括与感兴趣基因毗邻连接的表达调控序列和反式作用或远距离调控感兴趣基因的表达调控序列。
表达调控序列包括适当的转录启始、终止、启动子和增强子序列;有效的RNA加工信号如剪切和聚腺苷酸(polyA)信号;稳定胞浆mRNA的序列;增强翻译效率的序列(即Kozak共有序列);提高蛋白质稳定性的序列;以及当需要时能提高编码产物分泌的序列。大量的表达调控序列包括天然的、组成型、诱导型和/或组织特异性启动子,是本领域已知,可利用的。
组成型启动子的例子包括但不限于逆转录病毒罗斯肉瘤病毒(RSV)LTR启动子(任选地含RSV增强子)、巨细胞病毒(CMV)启动子(任选地含CMV增强子)(见例如,Boshart等,Cell.41:521-30,1985)SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子(Invitrogen)。
可诱导启动子可调节基因的表达,并受外源提供的化合物、环境因素如温度或存在的特定生理状态如急性期、细胞的特定分化阶段的调控,或只在复制性细胞中受调节。可诱导启动子和可诱导系统可从各种商业来源获得,包括但不限于Invitrogen、Clontech和Ariad。已报导了许多其它系统,本领域技术人员不难选择。例如,可诱导启动子包括锌-可诱导绵羊金属硫蛋白(MT)癖动子和地塞米松(Dex)可诱导小鼠乳腺瘤病毒(MMTV)启动子。其它可诱导系统包括T7聚合酶启动子系统(WO98/10088);蜕皮激素插入启动子(No等,Proc.Natl.Acad.Sci.USA,93:3346-3351,1996)、四环素阻抑系统(Gossen等,Proc.Natl.Acad.Sci.USA,89:5547-5551,1992),也见Harvey等,Curr.Opin.Chem.Biol.,2:512-518,1998)。其它系统包括FK506双体、采用castradiol、二酚基murislerone的VP16或p65、RU486-可诱导系统(Wang等,Nat.biotech.15:239-243,1997)和Wang等,Gene Ther.,4:432-441,1997)和雷帕霉素可诱导系统(Magari等,J.Clin.Invest.,100:2865-2872,1997)。某些可诱导启动子的作用随时间而提高。此种情况时,可通过插入多个串联阻抑物,如TetR经IRES连接于TetR,来提高此系统的效果。或者,可等侍至少三天再筛选所需功能。可通过已知能增强此系统效果的方法来提高所需蛋白质的表达。例如,采用鸭肝炎病毒转录后调节元件(WPRE)。
另一实施例中,采用该转基因的天然启动子。当需要该基因的表达要模拟天然表达时可优选天然启动子。当该转基因的表达必须受温度或发育的调节时,或以组织特异性方式,或以对特异性转录剌激应答的方式时,可采用天然启动子。另一实施例中,可采用其它天然表达调控元件,如增强子元件、聚腺苷酸位点或Kozak共有序列来模拟天然表达。
转基因的另一实施例包括与组织特异性启动子操作性连接的转基因。例如,如需要在骨骼肌中表达,应采用在肌肉中有活性的启动子。这些启动子包括:编码骨骼β-肌动蛋白、肌球蛋白轻链2A、肌营养不良蛋白、肌酸激酶的启动子,以及活性比天然启动子高的合成性肌肉启动子(见Li等,Nat.Biotech.17:241-245,1999)。其它之中,启动子的例子有:已知的肝组织特异性启动子(白蛋白,Miyatake等,J.Viol.,71:5124-5132,1997);乙肝病毒核启动子(Sandig等,Gene Ther.,3:1002-1009,1996);甲胎蛋白(AFP)(Arbuthnot等,Hum.Gene.Ther.,7:1503-1514,1996);骨钙蛋白(Stein等,Mol.Biol.Rep.,24:185-196,1997);骨涎蛋白(Chen等,J.Bone.Miner.Res.,11:654-664,1996);淋巴细胞(CD2,Hansal等,J.Immunol.,161:1063-1068,1998);免疫球蛋白重链;T细胞受体链;神经特异性烊烯醇化酶(NSE)启动子(Andersen等,Cell.Mol.Neurobiol.,13:503-515,1993);神经纤丝轻链(Piccioli等,Proc.natl.Acad.Sci.USA,88:5611-5615,1991);和神经元特异性vgf基因(Piccioli等,neuron.15:373-384,1995)。
任选地,含编码治疗用和免疫原性产物转基因的载体,可包含可检测标记,或报告报告基因可含有编码遗传霉素、潮霉素或嘌呤霉素抗性序列。这些可选择性报告或标记基因(优选位于被包装入病毒粒子之中的病毒基因组之外)可用作信号,表明细菌细胞中存在该质粒。该载体的其它组分包括复制起点。这些和其它启动子与载体的选择是常规工作,许多这样的序列可以得到(见例如,Sambrook等及本文引用的参考文献)。
可用本文提供的序列,结合本领域技术人员已知的技术产生这些载体。这些技术包括cDNA的常规克隆技术,如教课书中所述(Sambrook等,“分子克隆实验手册”,Cold Spring Harbor Press,纽约冷泉港),采用腺病毒基因组重叠的寡核苷酸序列、聚合酶链反应和能提供所需核苷酸序列的任何适合方法。
III.重组病毒粒子的产生
一实施例中,用猿猴腺病毒质粒(或其它载体)来产生重组腺病毒颗粒。一实施例中,该重组腺病毒功能性缺失E1a或E1b基因,任选地含其它突变,如温度敏感性突变或其它基因缺失。其它实施例中,需要保留此重组腺病毒中的E1a和/或E1b区。完整的E1区可位于腺病毒基因组中其天然所位于的位置,或置于天然腺病毒基因组中的缺失部位(如E3区中)。
构建向人(或其它哺乳动物)细胞输送基因的有用的猿猴腺病毒载体时,此载体中可采用某范围的腺病毒核酸序列。例如,可从形成该重组病毒一部分的猿猴腺病毒序列中去掉腺病毒的延迟早期基因E3。猿猴E3的功能据信与该重组病毒颗粒的功能和产生无关。也可构建具有E4基因的至少ORF6区域缺失的猿猴腺病毒载体,更理想是缺失整个E4区,因为该区域功能过剩。本发明另一载体含缺失的延迟早期基因E2a。也可在猿猴腺病毒基因组中制作晚期基因L1-L5之一的缺失。类似的,中期基因IX和IVa2的缺失可用于某些目的。可在腺病毒的其它结构性或非结构性基因中制作其它缺失。上述缺失可单独应用,即用于本发明的腺病毒序列可只含一个区域的缺失。或者,可联合利用能破坏其生物活性的整个基因或其部分的缺失。例如,一示范性载体中,腺病毒序列缺失了E1基因和E4基因,或缺失E1,E2和E3基因,或E1和E3基因,或E1,E2a和E4基因以及缺失或不缺失E3基因等。如上所述可上联合利用这种缺失与其它突变,如温度敏感性突变,以达到所需结果。
可在缺乏病毒传染力和腺病毒粒子增殖所需的腺病毒基因产物时培养缺失任何必须的腺病毒序列(如E1a、E1b、E2a、E2b、E4 ORF6、L1、L2、L3、L4和L5)的腺病毒载体。在存在一种或多种辅助性构建物(如质粒或病毒)时或包装的宿主细胞中,培养所述腺病毒载体可提供这些辅助功能。见例如,1996.5.9公布的国际专利申请WO96/13597(纳入本文参考)中制备:“最小”人Ad载体所述技术。
1.辅助性病毒
因此,取决于所用的携带小基因的病毒载体中的猿猴腺病毒基因组成,辅助性腺病毒或非复制性病毒片段可能是必须的,以提供产生含该小基因的传染性重组病毒粒子所需的充分猿猴腺病毒基因序列。有用的辅助性病毒所含经过挑选的腺病毒基因序列在所述腺病毒载体构建物中不存在和/或不为转染此载体的包装细胞系所表达。一实施例中,该辅助病毒是复制缺陷型,含除上述序列以外的各种腺病毒基因。这类辅助病毒与E1表达细胞系联用为理想。
也可使辅助病毒形成聚阳离子偶联物,如Wu等,J.Biol.Chem.,264:16985-16987,1989;K.J.Fisher和J.M.Wilson.,Biochem.J.,299;49(1994.4.1)所述。辅助病毒可任选含第二报告小基因。许多这类报告基因是本领域已知的。辅助病毒上存在与腺病毒载体上转基因不同的报告基因,使得能独自监测Ad载体和辅助病毒。利用此第二报告子得以在纯化时分离产生的重组病毒与辅助病毒。
2.互补细胞系
为了产生缺失上述任一基因的重组猿猴腺病毒(Ad),如果此缺失基因区的功能为病毒复制和传染力所必须,应通过辅助病毒或细胞系,如互补或包装细胞系,补充此重组病毒。许多情况下可用表达人E1的细胞系反式互补此黑猩猩Ad载体。这有特殊优点,因为在目前可得的包装细胞中发现本发明黑猩猩Ad序列和人AdE1序列之间存在多样性,采用目前的含人E1细胞阻止了复制和生产过程中产生复制活性腺病毒。然而,某些情况下,需要利用能表达E1基因产物的细胞系,可用于产生E1缺失的猿猴腺病毒。已描述了这类细胞系,见美国专利6,083,716。
如需要,可采用本文提供的序列来产生包装细胞或细胞系,这些细胞在一启动子的转录控制下,能在所选亲代细胞系中,以最小程度表达Pan5、Pan6、Pan7、SV1、SV25或SV39的腺病毒E1基因。为此目的可采用诱导型或组成型启动子。选择能产生表达任何所需Ad Pan5、Pan6、Pan7、SV1、SV25或SV39基因的新细胞系。不受限制,此类亲代细胞系可以是其中的Hela(ATCC登录号CCL2)、A549(ATCC,CCL185)、HEK 293、KB(CCL17)、Detroit(如Detroit510、CCL72)和WI-38(CCL75)细胞。这些细胞可从美国模式培养物保藏所,10801 University Boulevard,马纳萨斯,弗吉尼亚,20110-2209获得。其它适合的亲代细胞系可从其它来源获得。
这种E1表达细胞系可用于产生重组猿朱病毒E1缺失载体。此外,或者,本发明提供的能表达一种或多种猿猴腺病毒基因产物,如E1a、E1b、E2a和/或E4ORF6,的细胞系可用产生重组猿猴病毒载体基本相同的方法构建。可用此细胞系反式互补缺失了编码这些产物所必须基因的腺病毒载体,或提供辅助依赖性病毒(如腺相关病毒)包装所必须的辅助功能。制备本发明宿主细胞涉及安装所选DNA序列等技术。这种安装可用常规技术进行。此类技术包括cDNA和基因组克隆,是众所周知的,见上述Sambrook等。利用腺病毒基因组的重叠寡核苷酸序列,结合聚合酶链反应、合成方法和其它合适的方法,可提供所需的核苷酸序列。
或者,通过腺病毒载体和/或辅助病毒反式提供必须的腺病毒基因产物。例如,可从生物中,包括原核细胞(如细菌)和真核细胞,包括昆虫细胞、酵母细胞和哺乳动物细胞。选择合适的宿主细胞。特别理想的宿主细胞选自哺乳动物细胞,包括但不限于A549、WEHI、3T3、10T1/2、HEK293细胞或PERC6(这二者表达功能性腺病毒E1)(Fallaux,FJ等,Hum Gene Ther,9:1909-1917,1998)、saos、C2C12、L细胞、HT1080、HepG2和原代成纤维细胞、肝细胞和衍生自哺乳动物,包括人、猴、小鼠、大鼠、家兔和仑鼠的成肌细胞。提供此细胞的哺乳动物种类选择不限于本发明,也不限于成纤维细胞、肝细胞、肿瘤细胞等哺乳动物细胞。
3.病毒粒子的安装和细胞系的转染
通常,当用转染输送含小基因的载体时,该载体输送量约5-100μg DNA,优选约10-50μg DNA,向约1x104-1x1013个细胞,优选向约105个细胞提供。然而,考虑所选载体、输送方法和所选宿主细胞等因素,可调整向宿主细胞输送的载体DNA相对量。
此载体可以是本领域已知的或上述的任何载体,包括裸DNA、质粒、噬菌体、转座子、粘粒、游离体、病毒等。将此载体引入宿主细胞可用本领域已知或上述方法进行,包括转染和感染。将一种或多种腺病毒基因稳定整合入宿主细胞有基因组中,作为游离体稳定表达,或短时表达。可在游离体上,或稳定整合的基因组中表达基因产物,某些基因产物可稳定表达,而其它短时表达。而且可独立地从组成型启动子、诱导型启动子或腺病毒天然启动子中为各腺病毒基因选择启动子。例如,生物或细胞的特定生理状态(即分化状态或复制或静止状态细胞),或外加因子可调节这些启动子。
可用本领域技术人员已知的技术和如本说明书所述,将该分子(质粒或病毒)引入宿主细胞。优选实施例中,采用标准技术,如CaPO4转染或电穿孔。
将所选腺病毒DNA序列以及转基因和其它载体元件装配入各种中间质粒和用此质粒和载体产生重组病毒颗粒,均可用常规技术进行。这类技术包括如教课书所述的常规cDNA克隆技术(Sambrook等,见上述)。利用腺病毒基因组的重叠寡核苷酸序列、聚合酶链反应、合成方法组,可提供所需的核苷酸序列。可采用标准的转染和共转染技术,如CaPO4沉淀技术。其它可用的常技术包括病毒基因的同源性重组、琼脂叠层病毒空斑、测定信号产生的方法等。
例如,构建和装配含所需小基因的病毒载体后,在存在辅助病毒时将此载体转染入包装细胞系中。辅肋和载体序列之间发生同源重组,使该载体中的腺病毒-转基因序列得以复制并包装入病毒粒子衣壳中,产生重组病毒载体颗粒。产生此类病毒颗粒的现有方法以转染为基础。然而,本发明不限于这类方法。可用产生的重组猿猴病毒将所选转基因转移到所选细胞中。重组病毒在包装细胞系中增殖的体内实验中本发明E1缺失重组猿猴腺病毒载体证明可用于将转基因转移到非猿猴,优选人的细胞中。
IV.重组腺病毒载体的用途
可用本发明的重组猿猴腺病毒载体将基因体外、活体外、的体内输送给病人或非猿猴病兽。
本文所述重组腺病毒载体可用作表达载体,来体外产生异源基因编码的产物。例如,可将含插入到E1缺失部位某基因的重组腺病毒载体,转染入上述E1表达细胞系中。或者,在其它所选细胞系中采用复制活性腺病毒。然后以常规方法培养转染细胞,使该重组腺病毒表达此启动子的基因产物,然后用蛋白分离和培养回收的常规技术,从培养液中回收基因产物。
本发明Pan5、Pan6、Pan7、SV1、SV25或SV39衍生的猿猴腺病毒载体提供了有效的基因转移载体,可在体外或活体外,将所选转基因输送给所选宿主细胞,甚至在该生物已有一种或多种AAV血清型的中和抗体时。一实施例中,在活体外混合rAAV和细胞,用常规方法培养已感染的细胞,将转导细胞重输回给病人。这些组合物特别适合治疗基因的输送和免疫接种,诱导保护性免疫力。
更常见,本发明的Pan5、Pan6、Pan7、SV1、SV25或SV39重组腺病毒载体用作输送治疗性和免疫原性分子,见以下所述。不难理解这两种用途。本发明的重组腺病毒特别适合反复输送重组腺病毒载体的治疗方案。此方案通常包括输送一系列病毒衣壳已改变的病毒载体。每次后续给药,或给予具体血清型衣壳预定次数(一、二、三、四或五次)后,病毒的衣壳都可能改变。此给药方案包括输送含第一猿猴腺病毒衣壳的rAd,输送含第二衣壳的rAd和输送含第三衣壳的rAd。本领域技术人员明白,有各种单独采用本发明Ad衣壳,联合采用,或与其它血清型Ad联用的方案。任选地,这种方案包括给予含其它非人灵长类动物腺病毒、人腺病毒衣壳或本文所述人造血清型衣壳的rAd。此给药方案的每一期包括给予一系列注射(或其它途径)一种Ad血清型衣壳,然后注射一系列另一Ad血清型衣壳。或者,本发明重组Ad载体可用于涉及其它非腺病毒介导的输送系统,包括其它病毒系统、非病毒输送系统、蛋白质、肽和其它生物活性分子。
以下章节集中描述可通过本发明腺病毒载体输送的示范性分子。
A.治疗分子Ad-介导的输送
一实施例中,按已发表的基因治疗方法给予人上述重组载体。可给予人的携带所选转基因的猿猴腺病毒载体,优选悬浮于生物相容性液体或药学上可接受的输送载体中。一种合适的载体包括灭菌盐水。本领域技术人员熟知的其它水性和非水性等渗灭菌注射液和水性与非水性灭菌悬药学上可接受的载体,可用于此目的。
给予足够量的猿猴腺病毒载体转导靶细胞,并提供足够水平的基因转移和表达,以年供治疗效益而无过多副作用,或医学上可接受的生理作用,这可由医疗领域技术人员来决定。常规的和药学上可接受的给药途径包括但不限于,直接输送给视网膜和其它眼内输药方法、输送给肝脏、吸入、鼻内、静脉内、肌肉内、气管内、皮下、皮内、直肠内、中服和其它非肠胃道给药途径。如需要,可联用给药途径,或根据转基因或病况调整。给药途径主要取决于所治疾病的性质。
病毒载体的剂量主要取决于所治疾病、患者年龄、体重和健康状况,患者之间可能不同。例如,成人或病兽此病毒载体的治疗有效量一般为100微升-100毫升含浓度约1x106-1x1015颗粒、约1x1011-1x1013颗粒、约1x109-1x1012颗粒病毒的载体。剂量范围取决于动物大小和给药途径。例如,肌内注射人和兽(约80kg)的适合剂量范围是一部位每毫升约1x109-5x1012颗粒。任选可多部位给药。另一实施例中,中服给药人和兽的适合剂量范围是一部位每毫升约1x1011-5x1015颗粒。本领域技术人员可根据给药途径确定这些剂量,此重组载体可用于治疗或疫苗应用。可监测转基因或免疫原的表达水平、特循环抗体水平,以给药的频率。本领域技术人员不难明白确定给药的时间和频率。
较优的给药方法包括给予该病毒载体的同时、之前、之后,给予合适量的短时作用免疫调节剂。所选的免疫调节剂本文定义为:能抑制针对本发明重组载体的中和性抗体产生的制剂,或能抑制可消除该载体的溶细胞性T淋巴细胞(CTL)的制剂。此免疫调节剂可干扰T辅助细胞亚组(Th1或Th2)和B细胞之间的相互反应,从而抑制中和抗体的形成。各种有用的免疫调节剂和其使用剂量已公开,见例如,Yang等,J.Viol.,70(9)(1996.9);1996.5.2公开的国际专利申请WO96/12406;和国际专利申请PCT/US96/03035,均纳入本文作参考。
1.治疗性转基因
此转基因编码的有用治疗性产品包括激素和生长分化因子,包括但不限于胰岛素、胰高血糖素、生长素(GH)、副甲状腺素(PTH)、生长激素释放因子(GRF)、促滤泡激gxi(FSH)、黄体生成素(LH)、人绒毛膜促性腺激素(hCG)、血管内皮生长激素(VEGF)、血管生成素、血管、粒细胞集落剌激因子(GCSF)、红细胞生成素(EPO)、结缔组织生长因子(CTGF)、碱性成纤维细胞生长因子(bFGF)、酸性成纤维细胞生长因子(aFGF)、表皮生长因子(EGF)、转化生长因子(TGF)、血小板生长因子(PDGF)、胰岛素生长因子I和II(IGF-I和IGF-II)、转化生长因子超家族之一包括TGF、活化素、抑制素、骨形态发生蛋白(BMP)之一BMP1-15、生长因子的调蛋白(heregluin)/神经调节蛋白/ASIA/神经分化因子(NDF)家族之一、神经生长因子(NGF)、脑衍生神经营养因子(BDNF)、神经营养素NT-3和NT-4/5、睫状神经营养因子(CNTF)、胶质细胞神经养顺子(GDNF)、neurturin、集聚蛋白、脑信号蛋白/脑衰蛋白家族之一、导蛋白-1和导蛋白-2、肝细胞生长因子(HGF)、肝配蛋白、头蛋白、sonic hedgehog和酪氨酸羟化酶。
其它有用的转基因产物包括能调节免疫系统的蛋白质,包括但不限于,细胞因子和淋巴因子,如血小板生成素(TPO)、白介素IL1-25(包括IL-2、IL-4、IL-12和IL-18)、单核细胞趋化蛋白、白血病抑制因子、粒细胞-巨噬细胞集落剌激因子、flk-2/flk3配体。本发明也采用免疫系统产生的基因产物,这包括但不限于,免疫球蛋白IgG、IgM、IgA、IgD和IgE、嵌合性免疫球蛋白、人源化抗体、单链抗体、T细胞受体、嵌合性T细胞受体、单链T细胞受体、MHCI类和II类分子、以及工程化免疫球蛋白和MHC分子。有用的基因产物还包括补体调节蛋白,如实补体调节蛋白、膜共因子蛋白(MCP)、衰变加速因子(DAF)、CR1\CF2和CD59。
有用的基因产物还包括激素、生长因子、细胞因子、淋巴因子、调节蛋白和免疫系统蛋白任何一种的受体。本发明的胆固醇调节受体包括低密度脂蛋白(LDL)受体、高密度脂蛋白(HDL)受体、极低密度脂蛋白(VLDL)受体和清除剂受体。本发明还包括基因产物,如类固醇激素受体超家族的成员,包括糖皮质激素受体和雌激素受体、维生素D受体和其它核受体。此外,有用的基因产物包括转录因子,如jun、fos、max、mad、血清反应因子(SRF)、AP-1、AP2、myb、MyoD、ZF5、NFAT、CREB、HNF-4、C/EBP、SP1、CCAAT-盒结合蛋白、干扰素调节因子(IRF-1)、Wilms肿瘤蛋白、ETS-结合蛋白、STAT、GATA-盒结合蛋白如GATA-3和翼状螺旋蛋白的forkhead家族。
其它有用的基因产物包括,氨甲酰基合成酶I、鸟氨酸转氨甲基酶、精氨琥珀酸合成酶、精氨琥珀酸裂解酶、精胺酶、富马酰乙酰乙酸氢化酶、苯丙氨酸羟化酶、α-抗胰蛋白酶、葡萄糖-6-磷酸酶、胆色素原脱氨酶、因子VIII、因子IX、胱硫胺β-合成酶、支链酮酸脱羧酶、白蛋白、异价辅酶A脱氢酶、丙酰辅酶A羧化酶、甲基丙二酸单酰辅酶A岐化酶、谷胺酰辅酶A脱氢酶、胰岛素、β-葡萄糖苷酶、丙酮酸羧化酶、磷酸化酶、磷酸化酶激酶、甘氨酸脱羧酶、H-蛋白、T-蛋白、囊性纤维化跨膜调节(CFTR)序列和营养不良蛋白cDNA序列。
其它有用的基因产物包括非天然存在多肽,如具有非天然氨基酸序列含有插入、缺失或氨基酸取代的嵌合性或杂交多肽。例如,单链工程化免疫球蛋白可用于某些免疫力低下患者。其它类型的非天然基因序列包括反义分子和催化性核酸,如能用于降低靶分子过度表达的核糖酶。
治疗以高度增殖细胞为特征的高增殖疾病,如癌症和牛皮癣特别需要降低和/或调节基因的表达。靶多肽包括与正常细胞相比在高增殖细胞中单独或以较高水平产生的多肽。靶抗原包括致癌基因,如myb、myc、fyn和转位基因如ber/abl、ras、src、P53、neu、trk和EGRF编码的多肽。除了癌基因产物可作为靶抗原外,抗癌治疗和保护性方案所用靶多肽包括B细胞淋巴瘤产生的抗体的可变区和T细胞淋巴瘤的T细胞受体的可变区,其在某些实施例中,也可用作身免疫病的靶抗原。可用作靶多肽的其它肿瘤相关多肽,例如肿瘤细胞中水平较高的多肽,包括单克隆抗体17-1A所识别的多肽和叶酸结合多肽。
其它适合用于治疗的多肽和蛋白质包括可用于治疗自身免疫疾病患者的多肽和蛋白质,机理是通过赋予对与自身免疫相关靶组织(包括细胞受体和产生自身抗体的细胞)广泛的保护性免疫应答。T细胞介导的自身免疫病包括类风湿关节炎(RA)、多发性硬皮病(MS)、斯耶格伦综合征、结节病、胰岛素依赖性糖尿病(IDDM)、自身免疫甲状腺炎、反应性关节炎、关节强硬性脊椎炎、硬皮病、多肌炎、皮肌炎、牛皮癣、脉管炎、韦格纳肉芽肿病、Crohn病和溃疡性结肠炎。这些疾病的每一种都以能结合内源性抗原并引起与自身免疫病相关的炎症性级联反应的T细胞受体(TCR)为特征。
本发明的猿猴腺病毒载体特别适合用于多次腺病毒输送转基因的治疗方案,如反复输送同一转基因的方案,或联合输送其它转基因的方案。这些方案包括给予Pan5、Pan6、Pan7、SV1、SV25或SV39猿猴腺病毒载体,随后再给予同一血清型腺病毒的载体。特别理想的方案包括给予本发明Pan5、Pan6、Pan7、SV1、SV25或SV39猿猴腺病毒载体,其中第一次给予的病毒载体血清型不同于后续一次或多次所用病毒载体的血清型。例如,治疗方案包括给予Pan5、Pan6、Pan7、SV1、SV25或SV39载体,并反复给予相同或不同血清型的一种或多种腺病毒载体。另一实施例中,治疗方宁包括给予一种腺病毒载体,随后反复给予本发明不同于第一次输送的腺病毒载体的Pan5、Pan6、Pan7、SV1、SV25或SV39载体,任选地还给予另一种相同的,或优选不同于前一次给药载体血清型的载体。这些方案不限于用本发明Pan5、Pan6、Pan7、SV1、SV25或SV39猿猴血清型载体构建的腺病毒载体。而且,这些方案可容易地采用其它血清型的载体,包括但不限于其它猿猴腺病毒血清型(如Pan9或C68,C1等),其它非人灵长动物腺现毒血清型或人腺病毒血清型,与本发明的Pan5、Pan6、Pan7、SV1、SV25或SV39载体联用。此说明书中讨论了这种猿猴、其它非人灵长动物主人腺病毒血清型。另外,这些治疗方案包括同时或依次输送本发明Pan5、Pan6、Pan7、SV1、SV25或SV39腺病毒载体,联用非腺病毒载体、非病毒载体和/或各种其它有用的治疗化合物或分子。本发明不限于这些治疗方案,本领域技术人员不维明白这些方案的不同。
B.Ad介导的免疫原性转基因输送
该重组猿猴腺病毒也可用作免疫原性组合物。本文的免疫组合物是将其输送给哺乳动物,优选灵长动物后,能对其输送的转基因产物产生体液(如抗体)或细胞(如细胞毒T细胞)免疫应答的组合物。本发明提供的重组猿猴Ad在其腺病毒序列中可含有编码所需免疫原基因的缺失。与人来源的腺病毒相比,这种猿猴腺病毒可能更适合作为不同种动物的重组活病毒疫苗,但不仅限于此用途。该重组腺病毒可作为预防或治疗疫苗,所针对的病原是其抗原对诱导免疫应答是决定性的并能限制该病原(已得到鉴定并且其cDNA可获得)传播。
如上所述以适当的输送载体配罅这种疫苗(或免疫原性)组合物。通常,该免疫原性组合物的剂量范围如以上治疗性组合物。可监测所选基因产物的免疫力水平以确定是否需要加强免疫。评估血清抗体效价后可能需要加强免疫。
任选地,配制本发明的疫苗组合物含有其它组合物,包括佐剂、稳定剂、PH调节剂、防腐剂等。这些组合物是疫苗领域技术人员所熟知的。适当的佐剂包括但不限于脂质体、铝盐、单磷酰脂质A和生物活性因子如细胞因子、白介素、趋化因子、配体及它们的优化组合。这些生物活性因子的某些可通过质粒或病毒在体内表达。例如,与只用编码某抗原的DNA疫苗首次免疫产生的免疫应答相比,给予佐剂和编码该抗原的首次DNA疫苗免疫,提高了抗原特异性免疫应答。
以“免疫原性剂量”给予该重组腺病毒,即重组腺病毒的剂量给药后能有效转染所需细胞并导致所选基因足够水平的表达而引发免疫应答。当提供保护性免疫力时,该重组腺病毒可作为疫苗组合物用于预防传染和/或复发疾病。
或者,或此外,本发明的载体可含有编码能引发对所选免疫原产生免疫应答的肽、多肽或蛋白质的转基因。预计本发明的重组腺病毒在诱导针对插入的该载体表达的异源抗原蛋白的溶细胞性T细胞和抗体就答中高度有效。
例如,可从各种病毒科选择免疫原。可产生理想免疫应答的理想病毒科的例子,包括小RNA病毒科,其包括引起普通感冒50%病例的鼻病毒属;肠病毒属包括脊髓灰质炎病毒、柯萨奇病毒、艾柯病毒;和人肠道病毒如甲肝病毒;和主要在非人动物中引起口足疾病的口疮病毒(apthovirus)属。小RNA病毒科中靶抗原包括VP1、VP2、VP3、VP4和VPG。另一病毒科包括calcivirus科,其包括流行性胃肠炎重要致病因子的Norwalk病毒群。其它用于靶向抗原诱导人和非人动物产生免疫应答的病毒科是披膜病毒科,其包括α-病毒属新培斯病毒、罗斯河病毒、委内瑞那西方和东方马脑炎病毒以及风疹病毒。黄病毒科包括登革热、黄热病、日本脑炎、圣露易斯脑炎和蜱传脑炎病毒。其它靶抗原可产生自丙肝病毒科或冠状病毒科,包括非人病毒如传染性支气管炎病毒(家禽)、猪传播胃肠炎病毒(猪)、猪血凝性脑脊髓炎病毒(猪)、猪传染性腹膜炎病毒(猫)、猪小肠冠状病毒(猫)、犬冠状病毒(狗)和引起普通感冒和/或非甲非乙或丙肝的人呼吸道冠状病毒。冠状病毒科中,靶抗原包括E1(也称为M或基质蛋白)、E2(也称为S或Spike蛋白)、E3(也称为HE或血凝素-elterose)、糖蛋白(不存在于所有冠状病毒中)或N(核衣壳)。其它抗原可靶向弹状病毒科,包括水泡病毒属(如水泡性口炎病毒)和狂犬病毒属(如狂犬病毒)。弹状病毒科中合适的抗原可衍生自G蛋白或N蛋白。线状病毒科包括出血热病毒如马堡和埃博拉病毒可能是适合的抗原来源。副粘病毒科包括I型副流感病毒、3型副流感病毒、牛3型副流感病毒、风疹病毒(腮腺炎病毒)、2型副流感病毒、4型副流感病毒、新城堡病毒(鸡)、引起麻疹和犬瘟病的牛瘟麻疹病毒和肺病毒包括呼吸道合胞病毒。流感病毒分类属于正粘病毒中合适的抗原来源(如HA蛋白、N1蛋白)。布尼亚病毒科包括布尼亚病毒属(加利福尼亚脑炎,La Crosse)、白蛉热病毒(里夫特裂谷热)、汉坦病毒(出血热病毒)、内罗必病毒(内罗必绵羊病)和各种未命名的bungaviruses。沙拉病毒科提供了LCM和拉沙热病毒的抗原来源。呼肠弧病毒科包括呼肠弧病毒属、轮状病毒(引起儿童急性胃肠炎)、环状病毒和cultivirus(科洛拉多蜱传热,Lebombo(人)、马退行性脑病、兰舌症)。
逆转录病毒科,包括人类和兽类疾病如猪白血病病毒、HTLVI、HTLVII、慢病毒属(包括人免疫缺陷病毒(HIV)、猿猴免疫缺陷病毒(SIV)、猪免疫缺陷病毒(FIV)、马传染性贫血病毒和泡沫病毒)等致肿瘤病毒亚科。慢病毒科中已报道了许多合适的抗原,不难选择。合适的HIV和SIV抗原例子包括但不限于:gag、pol、Vif、Vpx、VPR、Env、Tat、Nef和Rev蛋白,以及它们的各种片段。例如,合适的Env蛋白片段可包括如gp120、gp160、gp41等亚单位,或它们更小的至少长8个氨基酸的片段。类似地,可选择Tat蛋白的片段。(见美国专利5,891,994和6,193,981)。HIV和SIV蛋白还可见D.H.Barouch等,J.Viol.,75(5):2462-2467(2001年3月)和R.R.Amara等,Science.,292:69-74(2001.4.6)。另一实施例中,可用HIV和/或SIV免疫原性蛋白主产生融合蛋白或其它免疫原性分子。见例如,2001.8.2公布的WO01/54719和1999.4.8公布的WO99/16884中所述的HIV-1Tat和/或Nef融合蛋白和免疫方案。本发明不限于本文所述HIV和/或SIV免疫原性蛋白或肽。此外,已报道了这些蛋白的各种修饰,本领域技术人员不难制备。见例如,美国专利5,972,596所述的修饰的gag蛋白。另外,可单独或联合输送理想的HIV和/或SIV免疫原。这种联合可包括从一个载体或从多个载体表达。任选地,另一种组合可包括输送一种或多种表达的免疫和输送蛋白形式的一种或多种免疫原。下面将更详细讨论这种组合。
乳多空病毒科包括多瘤病毒亚科(BKU和JCU病毒)和乳头瘤病毒亚科(与癌症或乳头瘤恶变有关)。腺病毒亚科包括引起呼吸道和/或肠道疾病的病毒。细小病毒科包括猫细小病毒(猫肠炎)、猫传染性粒细胞减少症病毒、犬细小病毒和猪细小病毒。疱疹病毒科包括α-疱疹病毒亚科单纯疱疹病毒(HSVI,HSVII)属、水痘病毒属(假性狂犬病、水痘带状疱疹)和β-疱疹病毒亚科巨细胞病毒(HCMV,muromegalovirus)属和γ-疱疹病毒亚科淋巴隐病毒属、EBV(Burkitts淋巴瘤)、传染性鼻气管炎、Marek病病毒和鼻病毒。痘病毒科包括脊髓动物痘病毒亚科正痘病毒属(天花(Smallpox)和牛痘(Cowpox))、副痘病毒、禽痘病毒、羊痘病毒、兔痘病毒、猪痘病毒和虫媒痘病毒亚科。肝DNA病毒科包括乙肝病毒。查能是抗原适当来源的一种未分类病毒是δ-肝炎病毒。其它病毒来源包括禽传染性法氏囊病病毒和猪呼吸道生殖道综合征病毒。α-病毒属包括马动脉炎病毒和各种脑炎病毒。
本发明还包括可用于免疫人类和非人类动物的免疫原,以抵抗包括细菌、真菌、寄生性微生物或多细胞寄生虫(感染人和非人脊椎动物或形成癌细胞或肿瘤细胞)的其它病原。
病原菌包括致病性革兰阳性球菌,有肺炎球菌、葡萄球菌和链球菌。致病性革兰阴性球菌包括脑膜炎球菌,淋球菌。致病性肠道革兰阴性杆菌包括肠杆菌科、假单胞菌属、不动杆菌属和埃肯菌属、类鼻疽菌、沙门菌、志贺菌、嗜血杆菌属、莫拉菌属、杜克雷嗜血杆菌属(引起软下疳)、布鲁菌属、土拉热弗拉西丝氏菌(引起兔热病)、耶尔森菌科(巴斯德菌属)、链杆菌属、念珠棘虫属和螺菌属;阳性杆菌包括李斯特单核细胞增多症菌、猪红斑丹毒丝菌、白喉棒状杆菌属(白喉)、霍乱弧菌、炭疽杆菌(炭疽)、杜诺凡菌病菌(腹股沟肉芽肿)和巴尔通体病菌。致病性厌氧菌引起的疾病包括破伤风、肉毒、其它梭菌属病、结核病、麻风和其它分枝杆菌病。致病性螺旋体疾病包括梅毒、密螺旋体病、雅司、品他病和地方流行性梅毒及钩端螺施体病。高等病原菌和病原性真菌引起的其它感染疾病包括放线菌病、诺卡放线菌病、隐球菌病、芽生菌病、组织胞浆菌病、球孢子菌病、念珠菌病、曲霉菌病、毛霉菌病、孢子丝菌病、副球孢子菌病、petrielliiosis、球拟酵母菌病、足分枝菌病、着色芽生菌病和皮肤真菌病。立克氏体感染包括斑疹伤寒热、洛基山斑疹热、Q热和立克氏体痘。支原体和衣原体感染的例子包括支原体肺炎、性病性淋巴肉芽肿、鹦鹉热和围生期衣原体感染。致病性真核细胞包括致病性原虫和蠕虫,其产生的感染包括阿米巴虫病、疟疾、利什曼虫病、锥虫病、弓形虫病、卡氏肺囊虫病、Trichans、鼠弓形虫病巴贝虫病、梨形鞭毛虫病、旋毛虫病、丝虫病、血吸虫病、线虫病、吸虫病和绦虫感染。
疾病控制中心(CDC,美国卫生和人类服务部)已鉴定了可用于生物攻击潜在因子的许多这样的微生物和/或它们产生的毒素。例如,一些这样的生物因子包括:炭疽杆菌(炭疽)、梭状肉毒菌(肉毒)及其毒素;鼠耶尔森菌属(鼠疫)、天花、土拉热弗朗西丝菌(土拉热)、病毒性出血热(纤丝病毒属,如埃博拉、马堡病毒)和沙粒病毒(如拉沙热,Machupo),以上这些病原目前发类为A类因子:伯纳特柯克斯立克氏体(Q热)、布鲁菌(波状热)、鼻疽菌(马鼻疽)、假鼻疽菌、蓖麻(Ricinus communis)及其毒素(蓖麻毒素)、产气荚膜梭菌及其毒素(ε毒素)、葡萄球菌及其毒素(肠毒素B)、鹦鹉热衣原体(鹦鹉热)、水安全性威胁(如霍乱弧菌、细小隐孢子菌)、斑疹伤寒(普氏立克氏体)和病毒性脑炎(如α-病毒如委内端拉马脑炎、东方马脑炎、西方马脑炎;所有这些目前分类为B类病原;和日本病毒与汉坦病毒,其目前分类为C类病毒。此外,可鉴定这样分类或不同分类的其它生物并用于将来这种目的。不难理解本文所述的病毒载体和其它构建物可用于输送这些生物、病毒、其毒素或副产物的抗原,来治疗和预防这些生物因子的感染或其它不良反应。
给予本发明的载体来输送T细胞可变区的免疫原,以诱导针对包括CTL的免疫应答来消灭这些T细胞。在RA中,已特征鉴定到几个参与此病的TCR特定可变区。这些TCR包括V-3、V-14、V-17和Vα-17。因此输送编码至少这些多肽之一的核酸序列将诱导针对参与RA的靶T细胞的免疫应答。在MS中,已鉴定到几个参与此病的TCR特定可变区。这些TCR区包括V-7和Vα-10。因此输送编码至少这些多肽之一的核酸序列将诱导针对参与MS的靶T细胞的免疫应答。硬皮病中,,已特征鉴定到几个参与此病的TCR特定可变区。这些TCR包括V-6、V-8、V-14、Vα-16、Vα-3C、Vα-7、Vα-14、Vα-15、Vα-16、Vα-28和Vα-12。因此输送编码至少这些多肽之一的重组腺病毒将诱导针对参与硬皮病的靶T细胞的免疫应答。
C.Ad介导的输送方法
可监测所选基因的治疗水平或免疫力水平以确定是否需要加强免疫评估CD8+T细胞应答后,或任选的血清抗体效价后,可能需要任选地进行加强免疫。任选地,单独给予或以各种联合方案,如与涉及其它活性成分的治疗方案或程序,或初免-加强方案联合,输送本发明的重组猿猴腺病毒。本专业已描述了各种这样的方案,可不难选择。
例如,初免-加强方案可能包括给予DNA载体(如质粒)初步激发免疫系统,第二次加强免疫给予传统抗原台蛋白质可携带编码该抗原序列的重组病毒。见例如,纳入参考文的2000.5.2发表的WO 00/11140。或者,一免疫接种方案包括给予本发明的重组猿猴腺病毒载体以加强对携带抗原或蛋白的载体的免疫应答。另外,一免疫接种方案包括给予蛋白质然后编码该抗原的载体加强。
一实施例中,本发明通过输送载有所选抗原的质粒DNA载体作初次免疫,然后用本发明的重组猿猴腺病毒载体加强诱导对该抗原的初次和加强免疫应答。一实施例中,该初免-加强方案包括表达初免和/或加强载体携带的多种蛋白质。见例如,R.R.Amara,Science,292:69-74(2001.4.6)所述用于产生对HIV、SIV免疫应答而表达蛋白亚单位的多种蛋白方案。例如,DNA初免可输送一个转录物的Gag、Pol、Vif、VPX、Vpr和Env、Tat和Rev。或者,可在本发明重组腺病毒构建物中输送SIV Gag、Pol和HIV-1Env。其它方案见WO 99/16884和WO 01/54719。
然而,初免-加强方案不仅限于HIV免疫或输送这些抗原。例如,初免可包括输送要发明第一种黑猩猩载体,然后用第二种黑猩猩载体或用含蛋白形式的该抗原组合物加强。一实施例中,该初免-加强方案可提供对产生该抗原的病毒、细菌或其它生物的保护性应答。另一理想的实施例中,该初免-加强方案提供的治疗效果可用常规试验检测,检测是否还存在给药所治疗的疾病。
可在机体各种部位以剂量依赖方式给予初免组合物,这取决于诱导所需免疫应答的目标抗原。本发明不限于上述注射量或部位或药物载体。而且,该方案可包括初免和/或另强步骤,每一步骤可包括一次剂量给药,每小时、每天、每周、每月或每年一次。例如,哺乳动物可接受含载体中约10-50μg的质粒一剂或二剂。所需DNA组合物的剂量范围约1-10,000μg DNA载体。剂量可根据患者体重不同每公斤约1-1000μg DNA。输注量或部位根据哺乳动物种类和病况按需选择。
本文描述了输送抗原给哺乳动物的载体的合适的剂量单位。通过将载体悬浮或溶于药学上或生理上可接受的载体如等渗盐水、等渗盐溶液可其域它本领域技术人员知道和制剂中制备该载体用于给药。合适的载体是本领域技术人员知道的,主要取决于给药途径。按上述途径给予哺乳动物本发明的组合物,采用生物可降解性和生物相容性聚合物缓释剂型,或用微胶团、凝胶和脂质体定位输送。任选地,本发明的初免步骤还包括给予初免组合物和适当量的本文定义的佐剂。
优选在给予哺乳动物受试者初免组合物后2-27周给予加强组合物。采用有效剂量的含有能够输送与初免DNA疫苗相同抗原的加强组合物,进行加强组合物的给药。此加强组合物可含衍生自同一病毒来源(如本发明的腺病毒序列)的可另一来源的重组病毒载体。可者,该“加强组合物”可以是含有初免DNA疫苗编码的但为蛋白或多肽形式的同一抗原的组合物,此组合物可在宿主中诱导免疫应答。另一实施例中,该加强组合物含有编码此抗原的DNA序列,该序列在调控序列的控制下指导其在哺乳动物中的表达,如众所周知的细菌载体或病毒载体。此加强组合物的主要要求是,其抗原应是初免组合物所编码的同一抗原,或交叉反应抗原。
另一实施例中,本发明的猿猴腺病毒载体也适合用于各种其它免疫和治疗方案。此方案可包括同时或依次输送本发明猿猴腺病毒载体和不同血清型衣壳的Ad载体。此方案中,同时或依次输送本发明的腺病毒载体和非Ad载体。。此方案中,同时或依次输送本发明的腺病毒载体和蛋白质、肽和/或其它生物学有用的治疗或免疫原性组合物。本领域技术人员不难懂得这些用途。
以下实施例将阐明猿猴腺病毒的克隆和本发明示范性的重组腺病载体。这些实施例只是为了说明而非限制本发明的范围。
实施例1-病毒增殖
Pan5(ATCC登录号VR-591)、Pan6(ATCC登录号VR-592)、Pan7(ATCC登录号VR-593)病毒最初分离自黑猩猩淋巴结,在293细胞(ATCCCRL1573)中增殖。通常,这些细胞培养在含10%胎牛血清(FCS)(Sigma或Hyclone,Logan,UT)和1%青、链霉素(Sigma)的Dulbecco改进的Eagle培养基(DMEM,Sigma,St.Louis,MO)中。在含2%FCS的DMEM中培养24小时进行293细胞的感染。当100%细胞显示出病毒诱导的细胞病变作用(CPE)时离心收集并浓缩感染细胞。在10mM Tris(PH8.0)中重悬细胞团并经三轮冻融裂解。经二次氯化铯密度梯度超离心后获得现毒制品,将病毒贮存液用10mM Tris/100mM NaCl/50%甘油稀释至1-5x1012颗粒/ml,并-70℃保存。
293细胞增殖这些腺病毒的能力出乎依据其它非人腺病毒血清型作出的预计。
病毒              产量(8x10 8 细胞产生的病毒颗粒数)
Pan5              8.8x1013
Pan6              1.6x1014
Pan7              8.8x1013
实施例2-病毒基因组DNA的特征
分离实施例1纯化病毒制品的基因组DNA,按制造商说明用HindIII或BamH1限制性酶消化。结果(未显示)表明本发明的Pan5、Pan6、Pan7基因组和发表的Pan9(C68)基因组显示了不同的限制性酶切模式,表明彼此不同。
测定了Pan5、Pan6和Pan7的核苷酸序列。SEQ ID NO:1中报告了Pan5DNA上链的核苷酸序列。SEQ ID NO:5中报告了Pan6DNA上链的核苷酸序列。SEQ ID NO:9中报告了Pan57DNA上链的核苷酸序列。
用上述常设置的”Clustal W”程序,测定与已知腺病毒序列的同源性鉴定了此病毒DNA序列中的调控和编码区。见上表提供的腺病毒序列。翻译开放读码框并与前已报导的腺病毒蛋白序列Ad4、Ad5、Ad7、Ad12主Ad40比较同源性,检验预测的氨基酸序列。
此序列的分析表明基因组的结构类似于人腺病毒,与人Ad4最相似。然而注意到黑猩猩腺病毒和其它已知腺病毒,包括AdHu4之间在六邻体超变区中存在实质性差异。这些差异与已获得的血清交叉反应数据很相符(见下)。
图1显示六邻体一部分序列的排列对比。所示部分是六邻体相应于向外倾延伸环DE1和FG1的区域,此地发现为血清型之间变异最大部分。也存在对六邻体(相应于发表的AdC68序列的残基308-368,见美国专利6,083,716)的基础有贡献的介入部分和血清型之间高保守部分。下表小结六邻体蛋白中氨基酸的配对比较:
分析了黑猩猩腺病毒的纤维瘤区(负责受体结合)显示结构上整体类似(图2)。
人Ad5和C68的E1蛋白之间(见下表)序列同一性程度与人Ad5和Pan5、Pan6和Pan7之间相似。
用以下实施例所述分子克隆方法产生了复制缺陷性AdC5、AdC6和AdC7,它产中间的小基因盒被插入到E1a和E1b基因位置。挽救该重组病毒的分子克隆并培养在293细胞中作大规模纯化,采用已发表的CsCI半沉淀方法(K.Fisher等,J.Virol.,70:520,1996)。将50块平板约1x109个293细胞产生的载体用相应的病毒感染。分光光度法测定病毒颗粒浓度确定产量。构建E1缺陷载体后,决定用HEK293细胞(表达人腺病互血清型5E1功能)反式互补该新型病毒载体的E1缺失,以产生高效价贮存液。一些这种重组病毒的病毒产量举例见下表。
通过巨细胞病毒启动子表达了这些载体、β-半乳糖苷酶(LacZ)、绿荧光蛋白(GFP)、α-1-抗胰蛋白(AIAT)、埃博拉糖蛋白(ebo)、缺少跨膜和胞浆结构域的埃博拉可溶性糖蛋白变体(sEbo)和埃博拉糖蛋白的三个缺失突变(EboΔ2、EboΔ3和EboΔ4)的转基因。下一中ND表示该项研究没做。
人腺病毒E1反式互补本发明E1缺失黑猩猩病毒有很大优点,因为它得以产生本发明的E1缺失黑猩猩腺病毒,同时减少或消除了同源重组的风险,因为如本文所述人Ad和黑猩猩腺病毒之间存在序列差异。
实施例3-Pan5、6和7病毒的血清学研究
因为六邻体超变区中的差异,预测C5、C6和C7病毒在血清学上与人腺病毒包括AdHu4不同。
1.野生型病毒的交叉反应性
为了筛选野生型病毒以测定抗体交叉反应,采用了复制活性病毒并测定了对细胞病变作用(CPE)的抑制。简言之,将贮存的5x1012颗粒/ml的腺病毒制品(Adhu5、Pan-5、Pan-6、Pan-7和Pan-68)作1/600稀释用于试验。选此病毒浓度是因为无中和时48小时内它可产生100%CPE。将病毒加到293细胞(4x104细胞/孔,96孔板)前,加入1∶20稀释血清。读取存在与不存在CPE时的试验数据,完全中和为无细胞病变。结果小结于下表中。事实上9/36份人血清可中和Adhu5诱导的CPE,这与先前对人群中和抗体的估计相一致。表中数字表明有中和作用的个体数(分子)和受筛检总数(分母),ND为未测。
用1∶20稀释的血清中和
            人          猴          黑猩猩
            (N=36)     (N=52)     (N=20)
Adhu5       9/36        ND          ND
AdC68       1/36        0/52        12/20
Pan5        0/36        0/52        10/20
Pan6        0/36        0/52        9/20
Pan7        0/36        0/52        12/20
筛检所有人血清中35/36为AdC68中和阴性,而36/36为Pan-5、Pan-6和Pan-7中和阴性;筛检的52只猴中没有一只显示可中和黑猩猩腺病毒;优选这些猴子作为评价HIV疫苗的临床前模型。20只黑猩猩有9-12只可基本中和黑猩猩的一种或另一种腺病毒,这与它们确实是流行性黑猩猩特定病原体的事实相符。令人囊兴趣的是黑猩猩的中和抗体只针对Pan-5、Pan-6或AdC68,从而支持以下假设:几种这些黑猩猩腺病毒载体彼此无中和作用,在血清型上不同。
对20只黑猩猩血清样品进行了相同试验。50%样品血清学上有反应,对Pan-5反应程度不同;对Pan-6为40%;对pan-7为55%;对C68为60%。阳性血清样品中,一只对所有四种黑猩猩病毒有强中和活性。
2.与重组病毒的交叉中和作用
获得各猿猴腺病毒的高效价我克隆抗体以更精确地估计不同血清型间交叉中和的程度。用含前述C68黑猩猩腺病毒作为辅佐的GFP重组病毒肌内免疫接种家兔。然后测定血清对本发明三种黑猩猩腺病毒AdC5、AdC6和AdC7每一种的中和活性。给家兔每公斤肌内注射5x1012病毒颗粒的C68CMVGFP质粒,五周后用相同剂量加强免疫。9周时间点内收集的血液显示对C68及Pan-5和Pan-7而非Pan-6有极强的中和活性(见下表),表明给予C68(或Pan-5和Pan-7)疫苗,然后用Pan-6载体加强可能有效。然而,已现此内在相关性水平不一定能用再给予来防止,抗病毒抗体效价不如此家兔达到的那样高。下表中,+表示33%CPE;++表示66%CPE;+++表示100%CPE。
3.检测中和性抗体的定量试验
用一种更具定量性的试验检测依据GFP载体转导产生的中和抗体来验证以上结果。简言之,用5x1010颗粒/ml的Pan-5、Pan-6、Pan-7和C68肌内或静脉内免疫C57BL/6小鼠。测定第28天血清1/20和1/80稀释度对C68CMVGFP的交叉中和活性。结果,当测定人免疫球蛋白药物制品对Pan5、6和7,及C68的血清反应性时,检测到一些低水平的抗Pan7和C68中和活性。36份人血清样品作了相同测试,以1/20稀释度测定血清样品。结果表明只有一个人具有对C68的明显中和活性。未测到对Pan5、Pan6或Pan7的中和活性。
4.体外交叉中和测定
测定了针对腺病毒Pan-5、Pan-6、Pan-7和C68各自高效价兔多克隆抗体对猿猴腺病毒的交叉中和作用。能
肌内注射1013全颗粒的每种黑猩猩腺病毒免疫家兔,40天后用同样剂量加弗氏不完全佐剂加强。将系列倍比稀释的血清液与表达GFP的各相应黑猩猩腺病毒109基因组拷贝一起培育,并当加入到293细胞时测定GFP表达的减弱,来分析血清中是否存在中和抗体。记录能导致GFP表达减少50%的血清稀释度,作为抗该具体病毒的中和抗体效价。
结果见表中所示。此数据与对六邻体氨基酸序列分析所得预测相符,表明与黑猩猩其它腺病毒相比,Ad Pan-6可能是最常见的血清型。
Figure G02823023XD00431
为了确定以与猿猴腺病毒起交叉反应的抗体是否可能在人中低流行,测定了猿猴腺病毒SV1、SV39和SV25当与商品化合并的人免疫球蛋白一起培育时能否能抵抗中和作用。也用Adhu5和黑猩猩腺病毒Pan-5、Pan-6、Pan-7和C68进行了同一试验。进一步研究中,测定了用黑猩猩腺病毒C5、C6、C7和C68之一免疫小鼠的血清交叉中和猿猴腺病毒SV-15、SV-23、SA-17和狒狒腺病毒的能力。任何情况下没发现交叉反应。
实施例4-重组E1-缺失Pan5载体的产生
用定点诱变破坏pX(Clontech)的bla基因区中的FspI位点制备了修饰的pX质粒。该修饰质粒称为pX’,是一种3000bp的环形质粒,含f1起始序列和氨苄表霉素抗性基因(AmpR-cds)。
A.Pan-5腺病毒质粒的产生
产生能将Pan5DNA片段依次克隆入pX’的多聚接头。用MluI和EcoRI消化后,此多聚接头替代了原来的pX’多聚接头。将Pan5的钝端FseI片段插入多聚接头的Smal和FseI位点。此片段含腺病毒基因组(bp1-3606,SEQ ID NO:1)的5’端。用侧接pShuttle(Clontech)的I-Ceu和PI-Sce位点的一短序列置换Pan5(bp455-3484,SEQ ID NO:1)的SnaBI-FspI片段,以消除所述腺病毒基因组中的E1区。将EcoRI-平头片段(bp28656-36462,SEQ ID NO:1)插入该多聚接头的EcoRI和EcoRV位点(提供所述腺病毒基因组的3’端,将FseI-MlnI片段(bp3606-15135,SEQ IDNO:1)插入此多聚接头中,并将MluI-EcoRI片段插入此多聚接头(bp15135-28658,SEQ ID NO:1)。任选地,将一需要的转基因插入该新产生的pX’Pan5ΔE1载体的I-CeuI和PI-SceI位点。
B.产生pX’Pan5ΔE1的另一方法
如上所述从Clontech获得衍生自pAdX腺病毒质粒的初始质粒pX。然后,缺失掉pX’的PacI-XhoI区并将该平头Pan5多聚接头插入FspI位点产生pX’PLNK(2994bp)。将Pan5r的5’端FseI区(bp1-3607,SEQ ID NO:1)插入pX’LNK的SmaI和FseI位点,产生pX’Pan5-5’质粒(6591bp)。切下pX’Pan5-5’的SnaBi-NdeI区并用Ceu/Sce盒代替,经PCR扩增从pRCS产生pX’Pan5-5’ΔE1(4374bp)。简言之,PCR扩增pRCS(3113bp)的含I-CeuI和PI-SceI罕见刻纹头位点的序列。此3’PCR引物将NdeI位点引入该PCR产物中。
为延伸pX’Pan5ΔE1(4374bp)中的Pan5DNA,加入Pan5的FseI-MluI区(bp3607-15135,SEQ ID NO:1),产生pX’Pan5-5’Mlu(15900)。将Pan5序列的残留MluI-3’端(bp 15135-36462,SEQ ID NO:1)加到该载体多聚接头的MluI和EcoRV位点之间,形成pX’Pan5ΔE1,其含E1区缺失的全长Pan5序列。
C.重组病毒的产生
为了从pX’Pan5ΔE1产生重组腺病毒,将质粒与辅助病毒表达的E1共转染,或从E1-表达包装细胞系,如293细胸系或上述制备的细胞系产生。包装细胞中的E1表达得以复制Pan5ΔE1并将其包装入病毒粒子衣壳中。另一实施例中,已被pX’Pan5ΔE1转染的包装细胞用上述带有感兴趣转基因的腺病毒载体转染。在辅助病毒与质粒之间发生同源重组,使得载体中的腺病毒转基因被置换并包装入病毒粒子衣壳中,产生该重组腺病毒。
转染后琼脂覆盖2周,病毒形成空斑,扩大,筛检转基因的表达。再经几轮空斑纯化,然后再扩增培养物。最后收获细胞,制备病毒提取物,含所需转基因的该重组黑猩猩腺病毒用CsCi梯度浮力密度超离心纯化,或用本领域技术人员已知的其它方法纯化。
实施例5-重组E1缺失Pan6载体的产生
A.构建Pan-6腺病毒质粒的方法
1.未端片段的克隆
用链霉蛋白酶和蛋白酶K处理及酚抽提除去Pan-6病毒的蛋白质。如Berkner和Sharp,NucleiCAcids Rasearch,11:6003,1983所述,将合成的12bp Pme I接头连接于此病毒DNA。然后用XbaI消化此病毒DNA分离得到5’未端片段(6043bp)。将Ad6XbaI5’片段连接在SmaI和XbaI位点处的pX接头,形成pX-Ad Pan6-0-16.5。带PmeI接头的病毒DNA也用PacI消化,分离得到6475bp的3’端片段并克隆入连接在PacI和SmaI位点的pX中,得到pXAd Pan6-82-100。
2.缺失5’克隆的E1
为了缺失掉E1(m.u.1.2-9),用跨越经BsiWi和XbaI处理的m.u.9-16.7片段的PCR片段代替pX-Ad Pan6-0-16.5中的BsiWi-XbaI片段,产生pX-Ad-Pan6m.u.0-1,9-16.5。
3.融合5’和3’克隆并产生一锚着位点以接受中等大小HindIII片段
首先,将Pan6基因组的2ndXbaI片段(4350bp,m.u.16.5-28)插入pX-Ad-Pan6m.u.0-1,9-16.5中的XbaI位点,进一步扩大5’克隆pX-Ad-Pan6m.n.0-1,9-16.5。此构建物命名为pXAd-Pan6-mu 0-1,9-28。
其次,将覆盖Pan6基因组m.u.41-82的15026bp MluI/PacI片段插入pXAdPan6-82-100的MluI/PacI位点,产生pXAd Pan6-m.u.41-100。
然后,分离pXAd-Pan6-mn 0-1,9-28的8167bp HindIII/Eco 47III Pan6片段,并亚克隆入HindIII和XbaI平头位点处的pXAd Pan6-m.u.41-100。此5’和3’融合克隆称为pXAd Pan6mu0-1,9-19.5,64-100。
4.该基因组的中等大小片段插入此融合克隆
将Pan6的16335bp HindIII片段(m.u.19.5-64)插入pXAd Pan6mu0-1,9-19.5,64-100的HindIII位点,形成pXAd Pan6-0-1,9-100。
5.将PKGFP可选择标记引入最终构建物中,指导感兴趣基因的克隆和重组转化物的绿/白选择。
用SapI和DrAIII消化然后经补平反应,分离pShuttle-pKGFP(bare)的表达GFP的小基因盒,此盒在Lac启动子控制下并侧接编码限制酶PI-SceI和I-CeuI的罕见内含子的识别位点。pShuttle-pKGFP(bare)质粒长4126bp,含ColE1-ori、卡那霉抗性基因、plac、lacZ启动子-GFPmut3-1cds(Clontech)。将此盒亚克隆入SrfI cut和平头pXAd Pan6-0-1,9-100中。该最终构建物称为pX-Pan6-pKGFPm.u.0-1,9-100,可通过直接和绿/白选择与pShuttlepKGFP基因载体结合,用于产生携带感兴趣基因的E1缺失重组pan6分子克隆。
B.产生Pan-6质粒的另一种方法
1.5’未端片段的克隆
如上所述用链霉蛋白酶和蛋白酶K处理及酚抽提除去Pan-6病毒的蛋白质,并如所述将合成的12bp PmeI接头连接于此病毒DNA。分离Ad Pan5’XbaI片段并连接入pX,形成A部分所述的pX-Ad Pan6-0-16.5(9022bp)。
2.缺失5’克隆的E1
为了缺失E1(m.u.1.2-9),用SnaBI和NdeI消化pX-Ad Pan6-0-16.5,除去编码E1a和E1b蛋白的区域(3442-6310bp)。然后有BriWI消化制品中的此载体,用携带可选择标记的小基因盒补平。
3.引入可选择标记
如上所述分离pShuttle-pKGFP(bare)的表达GFP的小基因盒,此盒在Lac启动子控制下并侧接编码限制酶PI-XceI和I-CeuI的罕见内含子的识别位点。然后将DraIII-SapI片段连接于消化的pX-Ad Pan6-0-16.5,形成pX-Ad Pan6 MU 0-16.5ΔE1(7749bp)。
4.延长Pan-6腺病毒序列
使pX-Ad Pan6 MU 0-16.5ΔE1经XbaI消化得以插入XbaI-RsrII接头。分离Ad Pan6基因组的XbaI/RsrII消化片段(mu 28-100,26240bp)并连接入XbaI/RsrII消化的pX-Ad Pan6 MU 0-16.5ΔE1,提供pX-Ad Pan6 MU 0-1,9-16.5,28-100。然后将Pan6基因组(mu 16.5-28,4350bp)的第二个XbaI片段连接入此质粒中,形成pX-Ad Pan6 MU 0-1,9-100(38551bp)。
C.重组腺病毒的产生
为了从部分A和B所述制备的E1缺失Pan6质粒产生重组腺病毒,,将该质粒与辅助病毒表达的E1共转染,或从E1-表达包装细胞系,如293细胸系或上述制备的细胞系产生。包装细胞中的E1表达得以复制和将Pan6-pKGFP mu.0-1,9-100包装入病毒粒子衣壳中。或者,将已经pX-Pan6-pKGFP mu.0-1,9-100转染的该包装细胞,用上述携带另一感兴趣转基因的腺病毒载体转染。
实施例6-组E1-缺失Pan7载体的产生
A.Pan7质粒的产生
将含限制位点paCI-SmaI-FseI-MluI-EcoRV-PacI的合成接头克隆入已经EcoRI和NdeI切割的pBR322中。将Ad Pan7的左端(bp 1-3618)克隆到SmaI和FseI位点之间的接头中。然后用SnaBI和NdeI切割从此克隆左端切下腺病毒E1,并在此位置插入pShuttle(Clontech)的I-CeuI-GFP-PI-SceI盒。所得质粒用FseI和MluI切割,插入Ad Pan7的片段FseI(bp 3618)至MluI(bp 155114),以延长其左端。将21421bp的Ad Pan7右端片段(从MluI位点bp 15114开始)插入到上述质粒的MluI和EcoRV位点之间,产生缺失腺病毒Pan7E1的完全分子克隆,完成此构建物(pPan7pGFP),其适合于产生重组腺病毒。任选地,将所需转基因插入此新建pPan7载体质粒的I-ceuI和PI-SceI位点。
B.构建E1-缺失的Pan7病毒载体
为了从pPan7ΔE1产生此重组腺病毒,将该质粒与辅助病毒表达的E1共转染,或从E1-表达包装细胞系,如293细胸系或上述制备的细胞系产生。包装细胞中的E1表达得以复制和将Pan7ΔE1包装入病毒粒子衣壳中。另一实施例中,将已经pX’-Pan7ΔE1转染的该包装细胞,用上述携带感兴趣转基因的腺病毒载体转染。在辅助病毒与质粒之间发生同源重组,使得载体中的腺病毒转基因被置换并包装入病毒粒子衣壳中,产生该重组腺病毒。如上所述进行转染和纯化。
实施例7-生表达E1基因的质粒载体
构建编码PanE1区基因的质粒载体,利用这些质粒产生表达病毒E1蛋白的稳定细胞系。基本上如实施例4所述,将Pan5的E1区克隆入pX’中,再用pShuttle(Clontech)的片段置换此区。该表达质粒含Pan5腺病毒基因组序列,此序列跨越Pan5基因组序列中的至少bp 1-3959。因此,该表达质粒含编码黑猩猩在异源启动子控制下的Ad Pan5的E1a和E1b序列。可利用上表确定的Ad Pan6和Ad Pan7E1区产生类似的表达质粒。
实施例8-生表达黑猩猩腺病毒E1蛋白的细胞系
用实施例6的质粒转染Hela(ATCCAcc.No.CCL2)产生表达病毒E1蛋白的细胞系。这些细胞系通过共转染上述基因组病毒DNA和表达质粒,用于产生E1缺失重组黑猩猩腺病毒。用其它腺病毒如人腺病毒常规方法,进行这些细胞系的转染以及重组黑猩猩腺病毒的纯化(见例如,Horwitz,见上和其它标准教课书)。
A.表达Pan5E1蛋白的细胞系
采用CellphectTM试剂盒(PharmaciAUppsala,Sweden)按厂家程序用10μg pX-Pan51-E1DNA转染10cm平皿中的Hela细胞。转染22小时后,使细胞经历3分钟甘油休克(15%甘油,以Hepes缓冲盐水配,PH7.5),用含10%FCS,1%Pen-Strep的DMEM(Hela)或F12K(A549;Life Technologies有限公司,Grand Island,NY)培养液洗一次,然后在上述培养液中37℃培养6小时。将转染后的细胞按1∶20,1∶40,1∶80,1∶160和1∶320比率分装在一式二份的15cm平板中。37℃培养过夜,培养液中加入浓度1μg/ml的G418(Life Technologies有限公司)。每五天换液一次,转染后20天分离克隆。
分离HelaE1细胞克隆,并测定其促进腺相关病毒(AVV)感染和下述重组LacZ蛋白表达的能力。
B.筛选有表达细胞系的AAV促进试验
AAV需要腺病毒表达的蛋白质来完成其生命周期。腺病毒的E4蛋白和E4区-编码的ORF6蛋白是促进AAV感染所必须的。采用基于AAV促进的E1表达试验。简言之,鉴定腺病毒有
表达方法包括在分开的培养物中感染推测的腺病毒E1表达细胞和不含腺病毒序列的细胞,与二者一起腺相关病毒(AAV)在适当时间内可表达标记基因,及aAV表达人腺病毒E4基因的ORF6。测定所得细胞中标记基因活性选出具有比对照细胞高得多标记物活性的那些强胞,作为经验证的E1表达细胞。下述实验中,标记基因为LacZ基因,标记物活性为呈现兰色。
例如,用携带标记基因如AV.LacZ(K.Fisher等,J.Virol.,70:520,1996)的AAV载体,或表达人5的ORF6区(AV.orf6)的AAV载体,以每个细胞100个基因组感染上述细胞系及未感染的对照细胞(Hela)。此质粒的DNA序列可产生一种新的重组腺相关病毒(rAAV),其含LacZ转基因和AdE4ORF6的开放阅读框,所表达的产物能促进产生rAAV基因组DNA的单链(ss)转变为双链(ds)。在含2%FCS、1%Pen-Strep的培养液中37℃培养这些载体4小时,此时刻加入含10%FCS的等量培养液。本领域技术人员应理解此试验第一个AAV载体中可采用符何标记基因(或报告基因),如碱性磷酸酶、荧光素酶及其它。也可用抗体酶试验来定量抗原水平,当该标记物表达抗原时。此试验不受标记基因身份的限制。感染后20-24小时用标准方法染色细胞观察LacZ活性。4小时后用显微镜观察细胞,具有比A549或hela对照细胞显著更兰色的细胞系评为阳性。
实施例9-将转基因输送给宿主细胞
然后利用得到的实施例4,5或6所述重组黑猩猩腺病毒将转基因输送给哺乳动物,优选人细胞。例如,纯化该重组病毒后,以每个细胞MOI50感染人胚肾293细胞。感染后24小时验证GFP表达。
A.小鼠模型中通过Pan-6、Pan-7和Pan-9载体的基因转移
比较了小鼠肝定向基因转移,小鼠肺定向基因转移,小鼠肌肉定向基因转移中重组黑猩猩腺病毒的基因转移效率和毒理学图谱。
采用本文技术构建了人Ad5、黑猩猩Pan6、黑猩猩Pan7和黑猩猩Pan9(C68)的含有在CMV控制下LacZ的E1缺失腺病毒载体。如下将此载体输送给免疫缺陷NCR裸鼠(每项研究80只)。对于肝脏研究,在尾静脉内注射100μl(1x1011颗粒)。对于肺研究,气管内输送50μl(5x1010颗粒)。对二肌肉研究,胫动脉内注射25μl(5x1010颗粒)。注射载体后3、7、14和28天年死小鼠(每次每组5只动物),每次处死收集肝/肺/肌肉组织并准备冷冻和石蜡包埋。冷冻切片作X-gal染色,石蜡切片作H&E染色进行组织学分析。每次进行终未取血,血清样品作肝功能试验。
此实验观察到将基因转移至肝和至肺中,黑猩猩腺病毒Pan-6、pan-7和Pan-9效果不如huAd5。然而这在某些情况需减少huAd5所见的肝毒性时,可能是需要的。肌肉中的基因转移效率血清之间差别不大。
B.反复给予血清型在Adhu5、Pan-6、Pan-7和Pan-9载体间转换的腺病毒载体的可行性小鼠研究
尾静脉给予小鼠(C57/B16;4只/组)基于huad5、Pan-6、Pan-7和Pan-9(H5.040CMVLacZ、Pan6.000CMVLacZ、Pan7.000CMVLacZ、Pan9.000CMVLacZ;1011颗粒/注射)的LacZ载体。30天后,小鼠再给予表达α1-抗胰蛋白酶的腺病毒载体(H5.040CMVhA1AT、Pan6.000CMVhA1at、Pan7.000CMVhA1At、Pan9.000CMVhA1At;1011颗粒/注射)。测定再次给药后3天和7天的血清α1-抗胰蛋白酶来监测再给予载体的转导是否成功。
测定了分别基于huAd5、Pan-6、Pan-7和Pan-9的腺病毒载体在存在其它血清型中和抗体时转导小鼠肝脏的能力。结果见下表:
在存在其它血清型中和抗体时,这些载体能转导小鼠肝脏载体。
因此,用huAd5免疫不阻止用黑猩猩腺病毒载体Pan-6、Pan-7或Pan-9(C68)任一种再给药。此实验也表明Pan-7的抗原相关性谱位于Pan-6和Pan-9之间,与二者有交叉反应。然而,Pan-6和Pan-9彼此不能中和。这是基于同源性比较的令人惊奇的结果,表明Pan-6完全不同于Pan-7和Pan-9。产生的抗Pan-9抗血清表明与Pan-6无交叉是和作用,但能某种程度中和Pan-7,更加说明Pan-6不同于其它血清型。
实施例10-重组E1缺失的SV-25载体的产生
构建含除工程化E1缺失之外的完全SV-25基因组。位于E1缺失部位的限制性酶I-CeuI和PI-SceI位点,允许插入穿梭质粒中的转基因,此穿梭质粒中的转基因盒测接插入有此二酶的识别位点。
将含有限制位点SwaI-SnaBI-SpeI-AflII-EcoRV-SwaI的合成接头克隆入已用EcoRI和NdeI切割的pBR322中。通过一起退火二个合成性寡聚物:SV25T(5’-AATTTAAATACGTAGCGCACTATGCGCGCTAAGCGCGGATATCATTTAAA-3’,SEQ ID NO:38)和SV25B(5’-TATTTAAATGATATCCGCGCTTAGCGCGACTAGTGCGCTACGTATTTA-3’,SEQ ID NO:39),并将其插入到已用EcoRI和NdeI消化的pBR22中。将Ad SV25的左端(bp1-1057,SEQ ID NO:29)克隆到SnaBI和SpeI位点之间的上述接头中。将Ad SV25的右端(bp 28059-31042,SEQ ID NO:29)克隆到AflII和EcoRV位点之间的接头中。然后如下在此克隆左端EcoRI位点(bp547)至XhoI(bp 2031)之间切割腺病毒E1。将用PCR从pShuttle(Clontech)产生的I-CeuI-PI-SceI盒插入EcoRI和SpeI位点之间。然后将Ad SV-25的1054bp XhoI片段(bp 2031-12185,SEQ ID NO:29)插入SpeI位点。用HindIII消化得到的质粒,将18344bp Ad SV-25HindIII片段(bp11984-30328,SEQ ID NO:29)插入,完成此构建,产生缺失E1的腺病毒SV25的完整分子克隆,其适合产生重组腺病毒。相同任选地,将所需转基因插入该新建pSV25载体质粒的I-CeuI和PI-SceI位点。
为产生带有标记基因的Ad SV25,用限制性酶I-CeuI和PI-SceI切割质粒pShuttle(Clontech)中先已克隆的GFP(绿荧光蛋白)表达盒,并连接入已用相同酶消化的之SV25(或本文所述另一黑猩猩Ad质粒)中。用SwaI消化得到的质粒(pSV25GFP)以分离细菌质粒骨架,并转染入E1感受态细胞系HEK293中。约10天后观察到细胸病变作用,表明存在复制活性病毒。将转染培养物加到新鲜培养物上,证实成功产生了基于表达GFP的腺病毒载体Ad SV25。观察细胞群中的绿色荧光确定存在次代感染细胞。
实施例11-构建E3缺失的Pan-5、Pan-6、Pan-7和C68载体
为了提高此腺病毒载体的克隆容量,可缺失掉其E3区,因不此区的编码基因为病毒培养增殖所不需要。为此目的,制备了Pan-5、Pan-6、Pan-7和C68的E3缺失版本(缺失含E31-9缺失的3.5kb Nru-AveII片段)。
A.E3缺失的Pan5载体
用AvrII内切核酸酶处理E1缺失的pPan5-pKGFP质粒,分离到含E3区的5.8kb片段,并通过AvrII缺失重环化pPan5-pKGFP,形成构建物pPan5-pKGFP-E3-AvrII。随后将5.8kbAvrII片段亚克隆入pSL-Pan5-E3-AvrII中,为用NruI消化进一步缺失E3区。这导致质粒pSL-Pan5-E3-缺失。从pSL-Pan5-E3-缺失质粒中去除4.3kbAvrII/SpeI片段,并插入到pPan5-pKGFP-E3-AvrIIr AvrII位点,产生最终构建物pPan5-E3-pKGFP。此最终构建物中,实现了E3区的3.1kb缺失。
B.Pan6载体中的E3缺失
用SbfI和NotI消化E1缺失的pPan6-pKGFP分子克隆,分离到19.3kb的片段,将其连回SbfI位点。用Eco47III和SwaI处理得到的构建物pPan6-Sbf I-E3,产生pPan6-E3。最后将pPan6-pKGFP的Sbf I消化后的21kbSbf I片段亚克隆入pPan6-E3中,产生含含E3中4kb缺失的pPan6-E3-pKGFP。
C.E3缺失的Pan7和Pan9载体
用同样方法实现二载体中的E3缺失。首先,将跨越E3区的5.8kb AvrII片段亚克隆为pSL-1180,随后用NruI消化而缺失E3。用SpeI和AvrII处理所得质粒获得4.4kb片段,将其克隆入pPan7-pPKGFP和pPan9-pKGFP的AvrII位点,分别取代原先的含AvrII片段的E3。最终的pPan7-E3-pKGFP和pPan9-E3-pKGFP构物含有3.5kbE3-缺失。
实施例12-构建E3-和E4-缺失的Pan-7载体
虽然腺病毒缺失了E1区(第一代腺病毒载体)使它们复制不完全,但所述腺病毒载体骨架基因的表达未完全消除。缺失E4区大大减弱了此残余基因的表达,可能具有安全性优点。构建了含2.5kb缺失的E4缺失Pan-7载体(缺失含E4ORFI-ORF7的PvuII-Agel片段)。用HEK293-细胞系产生此病毒的高效价贮存液,其除E1外,可表达基本的E4基因(orf6)。
1.Pan7分子克隆中的E4缺失
缺失掉pPan7-pKGFP中的19kb XbaI片段,产生pPan7-XbaI,用AgeI和Pvu II部分消化从其缺失2.5kbE4片段,产生pPan7-XbAI-E4。在二次克隆步骤中,加入来自pPan7-pKGFP构建物的19kb XbAI和15kb I-CeuI/MluI二片段,从pPan7-XbAI-E4产生pPan7-E4-pKGFP质粒。
2.将E3和E4缺失引入Pan9载体
在EcoRI消化和身连接后通过挽回pPan9-pKGFP的11kbEcoRI片段,产生含E4区的11kb质粒pPan9-EcoRI。通过AgeI消化/填充和PvuII部分消化和自身连接,从此构建物缺失掉E4区,产生pPan9-EcoRI-E4。多pPan9-pKGFP分离得到23kb EcoRI片段,并插入到pPan9-EcoRI-E4的EcoRI位点然后加入pPan9-pKGFP的5.8kb AvrII片段,形成最终产物pPan9-E3-E4-pKGF。与野生型Pan9的基因组大小相比,此E1-E3-E4-缺失载体具有高达8kb的转基因容量》
3.将带有感兴趣基因,包括报告基因、Ebo的糖蛋白和核蛋白的小基因盒际入Pan载体的分子克隆中
采用高效定向克隆和绿/白选择程序产生重组病毒的分子克隆。简言之,通过筛选重组物的白色集落,将感兴趣的基因克隆入pShuttlepKGFP中。然后,将此小基因盒转移到黑猩猩腺病含各种缺失的毒骨架质粒pPanX-pKGFP中,便于与pKGFP盒在I-CeuI和PI-SceI位点交换和筛选正确重组体的少数白色集落。
4.挽救早期区域中带多种缺失的Pan载体分子克隆和病毒增殖
为了挽救黑猩猩腺病毒载体E1-E3-缺失的分子克隆,用适当的限制性酶线性化这些克隆,并转染入调节性293细胞中。一但在转染细胞中观察到完全的细胞病变作用,收集粗裂解物并在293细胞中扩增成大规模感染。CsCI半沉降法纯化病毒。
对于E1-E4和E1-E2-E4-缺失的Pan载体,采用10-3细胞、293为基础的1-E4-感受态细胞系来挽救和增殖这些载体。在培养液中加入150μM ZnSO4诱导10-3细胞中的E4ORF6基因表达。
实施例13-用表达野生型和变体EboZ GP的腺病毒载体作疫苗接种
产生含埃博拉包膜嵌合体有AdHu5或AdC7载体,用于C57BL/6小鼠体内免疫实验。用分子克隆方法产生具有不同病毒骨架的重组病毒,其中E1缺失位置插入了小基因盒。挽救所有重组病毒的分子克隆,培养在293细胞中用CsCI半沉降法大规模纯化。选择并产生5个AdHu5或Ad Pan7(C7)编码的EboZ变体,肌内Ad注射后评价它们的相对免疫原性。在初次疫苗研究中评价了wtEbo(一种可溶性Ebo变体)、EboΔ1、EboΔ2、EboΔ3、EboΔ4、EboΔ5、EboΔ6、EboΔ7和EboΔ8。数据小结于下表中,通过分光光度法读数建立了感染的293细胞产生和扩增的病毒颗粒数(每ml,或总数)。
表:产生编码EboZ变体的Adhu5或AdC7腺病毒载体
肌肉内给予C57BL/6小鼠以上载体(1011基因组拷贝/细胞),评价28天后存在的中和抗体(VNAO)作为抗Ebola包膜糖蛋白免疫应答的第一次测量值。VNA此地定义为能抑制具有野生型Ebola包膜伪型的HIV载体所介导的Hela细胞转导的血清抗体(效价)。
检测到抗EboZ伪型的NVA,Ad Pan7(C7)产生的比AdHu5产生的效价更高。就转基因靶子而言,EboZΔ3诱导了最高的VNA。数据小结于下表中,提供了抗HIV-EboZ-GFP伪型的中和抗体效价(稀释度倒数)(N=5只动物/每组)。
实施例14-Pan7介导的Ebola蛋白表达
进行了评价Pan-7载体表达Ebola包膜蛋白和Ebola核抗原的小鼠研究。直接评价了C57BI/6小鼠肌肉注射(IM)表达Ebola env构物之一的Adhu5或Pan-7后的中和抗体。
A.评价IM注射表达Ebola env构建物的Adhu5或Pan-7后C57B1/6小鼠的CTL
1.用Ebola病毒攻击小鼠的实验
通过观察免疫小鼠血清所介导的慢病毒(HIV)载体伪型中和作用分析了对Ebola包膜的中和性抗体(NAB)应答,此伪型载体含Ebola包膜糖蛋白的几种构建物(eEbo、NTD2、NTD3、VTD4)。C57BL/6或BALB/c小鼠接受了一次肌肉注射,每只小鼠注射C7(Ad Pan-7)编码Ebola包膜变体5x1010颗粒。接种疫苗后30天评价中和抗体。简言之,将编码β-半乳糖苷酶的Ebola Zaire伪型HIV载体与不同稀度的热灭活小鼠血清一起37℃培育2小时。与血培育后,用EboZ-HIV-LacZ感染Hela细胞37℃16小时。β-半乳糖苷酶阳性的转导Hela细胞用X-gal染色显示感染性。当观察到β-半乳糖苷酶阳性的兰色细胞数降低50%时的血清稀释度为中和抗体效价。收集一次肌肉注射(IM)5x1010颗粒/每动物免疫后30天的血清。测定所有各组小鼠搞Ebola伪型HIV的中和抗体,抗体效价范围是:Ad-EboZ(Adhu5表达的EboZ)、Ad-NTD3(Adhu5表达的NTD3)和C7-sEbo(Ad Pan-7表达的可溶性EboZ)为20,至C7-NTD3(Ad Pan-7表达的可溶性NTD3)和C7-NTD4(Ad Pan-7表达的可溶性NTD3)为130以上。在BABL/c小鼠中同样免疫方案产生了对Ad-和C7-NTD2和NTD4较低的中和抗体效价。
B.细胞免疫应答
评价了每只小鼠I.M注射5×1010个C7-LacZ或C7-Ebola包膜变体颗粒后8天,C57BL/6小鼠对Ebola包膜的细胞免疫应答。小鼠I.M疫苗注射5×1010个C7编码的LacZ或C7-Ebla包膜变体颗粒。疫苗接种后8天收集免疫小鼠的脾淋巴细胞,体外用饲养细胞(用编码野生型Ebola包膜的人腺病毒血清型5感染的未治疗小鼠的脾淋巴细胞并经放射照光)剌激。用EboZ表达子转染的51Cr-标记的同系C57细胞进行标准5-小时CTL试验。
所有编码Ebola包膜变体的Ad Pan-7观察到阳性MHV-限制性细胞毒T淋巴细胞(CTL),NTD2、NTD3或NTD4免疫小鼠有较高应答。C7编码Ebola包膜变体免疫小鼠的效应细胞能识别EboZ转染的靶细胞并产生回忆性CTL应答,特异性溶解高达30%。而原初或LacZ免疫对照小鼠的效应细胞溶解不到5%,从而证实溶解是Ebola包膜抗原特异性的。
C.保护性研究
评价编码EboZ变体C7(Ad Pan-7)是否为成功的疫苗的大多数方法是评估用小鼠适应性Ebola Zaire病毒致死性攻击后,能否保护小鼠避免失重和死亡。如前所述每只小鼠用一剂5×1010个颗粒免疫BALB/c小鼠,21目寸光天后用200LD50小鼠适应性Ebola Zaire病毒攻击接种疫苗小鼠。攻击后5-9天之间所有对照小鼠(载体和C7-LacZ)死亡。相反,除一只外(C7-sEbo组)所有接种疫苗小鼠用Ebola Zaire攻击后仍存活。
接种C7-sEbo疫苗后4-7天观察到失重。也注意到接种C7-sEbo、NTD2和NTD3疫苗的小鼠在4-7天之间有竖毛和轻至重度呆滞疾病症状。接种C7-EboZ和C7-NTD4的小鼠无疾病症状。总之,一剂C7-EboZ和C7-NTD4完全保护了免疫小鼠避免患病和死亡,可能是由于显著的T细胞介导免疫力。
所有引用的文献纳入本文作参考。对本发明的许多修饰和变化均包括在本说明书的范围内,这是本领哉技术人员明白的。对本发明组合物和方法的修改和变化,如不同小基因的选择或载体或免疫调节剂的选择均在本发明附属权利要地书的范围内。
序列表
<110>宾夕法尼亚州立大学托管会(The Trustees of the University of Pennsylvania)
     J.M.威尔森(Wilson,James M.)
     G.高(Gao,Guangping)
     S.罗伊(Roy,Soumitra)
<120>猿猴腺病毒的核酸和氨基酸序列,含有它们的载体以及用法
<130>UPN-02677PCT
<150>US 60/331,951
<151>2001-1121
<150>US 60/366,798
<151>2002-03-22
<160>39
<170>PatentIn version 3.1
<210>1
<211>36462
<212>DNA
<213>黑猩猩腺病毒血清型Pan5
<220>
<221>CDS
<222>(13898)..(15490)
<223>L2五邻体
<220>
<221>CDS
<222>(18315)..(21116)
<223>L3六邻体
<220>
<221>CDS
<222>(32035)..(33372)
<223>L5纤维
<400>1
catcatcaat aatatacctc aaacttttgg tgcgcgttaa tatgcaaatg aggtatttga      60
atttggggat gcggggcggt gattggctgc gggagcggcg accgttaggg gcggggcggg     120
tgacgttttg atgacgtggc cgtgaggcgg agccggtttg caagttctcg tgggaaaagt     180
gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca     240
ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg     300
aatgaggaag tgaaaatctg agtaattccg cgtttatggc agggaggagt atttgccgag     360
ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtatttt tcacctaaat     420
ttccgcgtac ggtgtcaaag tccggtgttt ttacgtaggt gtcagctgat cgccagggta     480
tttaaacctg cgctctctag tcaagaggcc actcttgagt gccagcgagt agagttttct     540
cctccgcgcc gcgagtcaga tctacacttt gaaagatgag gcacctgaga gacctgcccg     600
gtaatgtttt cctggctact gggaacgaga ttctggaact ggtggtggac gccatgatgg     660
gtgacgaccc tccggagccc cctaccccat ttgaagcgcc ttcgctgtac gatttgtatg     720
atctggaggt ggatgtgccc gagaacgacc ccaacgagga ggcggtgaat gatttgttta     780
gcgatgccgc gctgctggct gccgagcagg ctaatacgga ctctggctca gacagcgatt     840
cctctctcca taccccgaga cccggcagag gtgagaaaaa gatccccgag cttaaagggg     900
aagagctcga cctgcgctgc tatgaggaat gcttgcctcc gagcgatgat gaggaggacg     960
aggaggcgat tcgagctgca gcgaaccagg gagtgaaaac agcgagcgag ggctttagcc    1020
tggactgtcc tactctgccc ggacacggct gtaagtcttg tgaatttcat cgcatgaata    1080
ctggagataa gaatgtgatg tgtgccctgt gctatatgag agcttacaac cattgtgttt    1140
acagtaagtg tgattaactt tagctgggga ggcagagggt gactgggtgc tgactggttt    1200
atttatgtat atgtttttta tgtgtaggtc ccgtctctga cgtagatgag acccccacta    1260
cagagtgcat ttcatcaccc ccagaaattg gcgaggaacc gcccgaagat attattcata    1320
gaccagttgc agtgagagtc accgggcgta gagcagctgt ggagagtttg gatgacttgc    1380
tacagggtgg ggatgaacct ttggacttgt gtacccggaa acgccccagg cactaagtgc    1440
cacacatgtg tgtttactta aggtgatgtc agtatttata gggtgtggag tgcaataaaa    1500
tccgtgttga ctttaagtgc gtggtttatg actcaggggt ggggactgtg ggtatataag    1560
caggtgcaga cctgtgtggt cagttcagag caggactcat ggagatctgg acagtcttgg    1620
aagactttca ccagactaga cagctgctag agaactcatc ggagggagtc tcttacctgt    1680
ggagattctg cttcggtggg cctctagcta agctagtcta tagggccaag caggattata    1740
aggatcaatt tgaggatatt ttgagagagt gtcctggtat ttttgactct ctcaacttgg    1800
gccatcagtc tcactttaac cagagtattc tgagagccct tgacttttct actcctggca    1860
gaactaccgc cgcggtagcc ttttttgcct ttatccttga caaatggagt caagaaaccc    1920
atttcagcag ggattaccgt ctggactgct tagcagtagc tttgtggaga acatggaggt    1980
gccagcgcct gaatgcaatc tccggctact tgccagtaca gccggtagac acgctgagga    2040
tcctgagtct ccagtcaccc caggaacacc aacgccgcca gcagccgcag caggagcagc    2100
agcaagagga ggaccgagaa gagaacctga gagccggtct ggaccctccg gtggcggagg    2160
aggaggagta gctgacttgt ttcccgagct gcgccgggtg ctgactaggt cttccagtgg    2220
acgggagagg gggattaagc gggagaggca tgaggagact agccacagaa ctgaactgac    2280
tgtcagtctg atgagtcgca ggcgcccaga atcggtgtgg tggcatgagg tgcagtcgca    2340
ggggatagat gaggtctcag tgatgcatga gaaatattcc ctagaacaag tcaagacttg    2400
ttggttggag cccgaggatg attgggaggt agccatcagg aattatgcca agctggctct    2460
gaggccagac aagaagtaca agattaccaa actgattaat atcagaaatt cctgctacat    2520
ttcagggaat ggggccgagg tggagatcag tacccaggag agggtggcct tcagatgctg    2580
catgatgaat atgtacccgg gggtggtggg catggaggga gtcaccttta tgaacgcgag    2640
gttcaggggt gatgggtata atggggtggt ctttatggcc aacaccaagc tgacagtgca    2700
cggatgctcc ttctttggct tcaataacat gtgcattgag gcctggggca gtgtttcagt    2760
gaggggatgc agtttttcag ccaactggat gggggtcgtg ggcagaacca agagcatggt    2820
gtcagtgaag aaatgcctgt tcgagaggtg ccacctgggg gtgatgagcg agggcgaagc    2880
caaagtcaaa cactgcgcct ctaccgagac gggctgcttt gtactgatca agggcaatgc    2940
caaagtcaag cataatatga tctgtggggc ctcggatgag cgcggctacc agatgctgac    3000
ctgcgccggt gggaacagcc atatgctagc caccgtgcat gtggcctcgc acccccgcaa    3060
gacatggccc gagttcgagc acaacgtcat gacccgctgc aatgtgcacc tggggtcccg    3120
ccgaggcatg ttcatgccct accagtgcaa catgcaattt gtgaaggtgc tgctggagcc    3180
cgatgccatg tccagagtga gcctgacggg ggtgtttgac atgaatgtgg agctgtggaa    3240
aattctgaga tatgatgaat ccaagaccag gtgccgggcc tgcgaatgcg gaggcaagca    3300
cgccaggctt cagcccgtgt gtgtggaggt gacggaggac ctgcgacccg atcatttggt    3360
gttgtcctgc aacgggacgg agttcggctc cagcggggaa gaatctgact agagtgagta    3420
gtgtttggga ctgggtggga gcctgcatga tgggcagaat gactaaaatc tgtgtttttc    3480
tgcgcagcag catgagcgga agcgcctcct ttgagggagg ggtattcagc ccttatctga    3540
cggggcgtct cccctcctgg gcgggagtgc gtcagaatgt gatgggatcc acggtggacg    3600
gccggcccgt gcagcccgcg aactcttcaa ccctgaccta cgcgaccctg agctcctcgt    3660
ccgtggacgc agctgccgcc gcagctgctg cttccgccgc cagcgccgtg cgcggaatgg    3720
ccctgggcgc cggctactac agctctctgg tggccaactc gagttccacc aataatcccg    3780
ccagcctgaa cgaggagaag ctgctgctgc tgatggccca gctcgaggcc ctgacccagc    3840
gcctgggcga gctgacccag caggtggctc agctgcaggc ggagacgcgg gccgcggttg    3900
ccacggtgaa aaccaaataa aaaatgaatc aataaataaa cggagacggt tgttgatttt    3960
aacacagagt cttgaatctt tatttgattt ttcgcgcgcg gtaggccctg gaccaccggt    4020
ctcgatcatt gagcacccgg tggatctttt ccaggacccg gtagaggtgg gcttggatgt    4080
tgaggtacat gggcatgagc ccgtcccggg ggtggaggta gctccattgc agggcctcgt    4140
gctcgggggt ggtgttgtaa atcacccagt catagcaggg gcgcagggcg tggtgctgca    4200
cgatgtcctt gaggaggaga ctgatggcca cgggcagccc cttggtgtag gtgttgacga    4260
acctgttgag ctgggaggga tgcatgcggg gggagatgag atgcatcttg gcctggatct    4320
tgagattggc gatgttcccg cccagatccc gccgggggtt catgttgtgc aggaccacca    4380
gcacggtgta tccggtgcac ttggggaatt tgtcatgcaa cttggaaggg aaggcgtgaa    4440
agaatttgga gacgcccttg tgaccgccca ggttttccat gcactcatcc atgatgatgg    4500
cgatgggccc gtgggcggcg gcttgggcaa agacgtttcg ggggtcggac acatcgtagt    4560
tgtggtcctg ggtgagctcg tcataggcca ttttaatgaa tttggggcgg agggtgcccg    4620
actgggggac gaaggtgccc tcgatcccgg gggcgtagtt gccctcgcag atctgcatct    4680
cccaggcctt gagctcggag ggggggatca tgtccacctg cggggcgatg aaaaaaacgg    4740
tttccggggc gggggagatg agctgggccg aaagcaggtt ccggagcagc tgggacttgc    4800
cgcagccggt ggggccgtag atgaccccga tgaccggctg caggtggtag ttgagggaga    4860
gacagctgcc gtcctcgcgg aggagggggg ccacctcgtt catcatctcg cgcacatgca    4920
tgttctcgcg cacgagttcc gccaggaggc gctcgccccc aagcgagagg agctcttgca    4980
gcgaggcgaa gtttttcagc ggcttgagcc cgtcggccat gggcattttg gagagggtct    5040
gttgcaagag ttccagacgg tcccagagct cggtgatgtg ctctagggca tctcgatcca    5100
gcagacctcc tcgtttcgcg ggttggggcg actgcgggag tagggcacca ggcgatgggc    5160
gtccagcgag gccagggtcc ggtccttcca ggggcgcagg gtccgcgtca gcgtggtctc    5220
cgtcacggtg aaggggtgcg cgccgggctg ggcgcttgcg agggtgcgct tcaggctcat    5280
ccggctggtc gagaaccgct cccggtcggc gccctgcgcg tcggccaggt agcaattgag    5340
catgagttcg tagttgagcg cctcggccgc gtggcccttg gcgcggagct tacctttgga    5400
agtgtgtccg cagacgggac agaggaggga cttgagggcg tagagcttgg gggcgaggaa    5460
gacggactcg ggggcgtagg cgtccgcgcc gcagctggcg cagacggtct cgcactccac    5520
gagccaggtg aggtctggcc ggtcggggtc aaaaacgagg tttcctccgt gctttttgat    5580
gcgtttctta cctctggtct ccatgagctc gtgtccccgc tgggtgacaa agaggctgtc    5640
cgtgtccccg tagaccgact ttatgggccg gtcctcgagc ggggtgccgc ggtcctcgtc    5700
gtagaggaac cccgcccact ccgagacgaa ggcccgggtc caggccagca cgaaggaggc    5760
cacgtgggag gggtagcggt cgttgtccac cagcgggtcc accttctcca gggtatgcaa    5820
gcacatgtcc ccctcgtcca catccaggaa ggtgattggc ttgtaagtgt aggccacgtg    5880
accgggggtc ccggccgggg gggtataaaa gggggcgggc ccctgctcgt cctcactgtc    5940
ttccggatcg ctgtccagga gcgccagctg ttggggtagg tattccctct cgaaggcggg    6000
catgacctcg gcactcaggt tgtcagtttc tagaaacgag gaggatttga tattgacggt    6060
gccgttggag acgcctttca tgagcccctc gtccatctgg tcagaaaaga cgatcttttt    6120
gttgtcgagc ttggtggcga aggagccgta gagggcgttg gagagcagct tggcgatgga    6180
gcgcatggtc tggttctttt ccttgtcggc gcgctccttg gcggcgatgt tgagctgcac    6240
gtactcgcgc gccacgcact tccattcggg gaagacggtg gtgagcttgt cgggcacgat    6300
tctgacccgc cagccgcggt tgtgcagggt gatgaggtcc acgctggtgg ccacctcgcc    6360
gcgcaggggc tcgttggtcc agcagaggcg cccgcccttg cgcgagcaga aggggggcag    6420
cgggtccagc atgagctcgt cgggggggtc ggcgtccacg gtgaagatgc cgggcaggag    6480
ctcggggtcg aagtagctga tgcaggtgcc cagatcgtcc agcgccgctt gccagtcgcg    6540
cacggccagc gcgcgctcgt aggggctgag gggcgtgccc cagggcatgg ggtgcgtgag    6600
cgcggaggcg tacatgccgc agatgtcgta gacgtagagg ggctcctcga ggacgccgat    6660
gtaggtgggg tagcagcgcc ccccgcggat gctggcgcgc acgtagtcgt acagctcgtg    6720
cgagggcgcg aggagcccgg tgccgaggtt ggagcgctgc ggcttttcgg cgcggtagac    6780
gatctggcgg aagatggcgt gggagttgga ggagatggtg ggcctctgga agatgttgaa    6840
gtgggcgtgg ggcagtccga ccgagtccct gatgaagtgg gcgtaggagt cctgcagctt    6900
ggcgacgagc tcggcggtga cgaggacgtc cagggcgcag tagtcgaggg tctcttggat    6960
gatgtcgtac ttgagctggc ccttctgctt ccacagctcg cggttgagaa ggaactcttc    7020
gcggtccttc cagtactctt cgagggggaa cccgtcctga tcggcacggt aagagcccac    7080
catgtagaac tggttgacgg ccttgtaggc gcagcagccc ttctccacgg ggagggcgta    7140
agcttgcgcg gccttgcgca gggaggtgtg ggtgagggcg aaggtgtcgc gcaccatgac    7200
cttgaggaac tggtgcttga agtcgaggtc gtcgcagccg ccctgctccc agagctggaa    7260
gtccgtgcgc ttcttgtagg cggggttggg caaagcgaaa gtaacatcgt tgaagaggat    7320
cttgcccgcg cggggcatga agttgcgagt gatgcggaaa ggctggggca cctcggcccg    7380
gttgttgatg acctgggcgg cgaggacgat ctcgtcgaag ccgttgatgt tgtgcccgac    7440
gatgtagagt tccacgaatc gcgggcggcc cttgacgtgg ggcagcttct tgagctcgtc    7500
gtaggtgagc tcggcggggt cgctgaggcc gtgctgctcg agggcccagt cggcgaggtg    7560
ggggttggcg ccgaggaagg aagtccagag atccacggcc agggcggtct gcaagcggtc    7620
ccggtactga cggaactgct ggcccacggc cattttttcg ggggtgacgc agtagaaggt    7680
gcgggggtcg ccgtgccagc ggtcccactt gagctggagg gcgaggtcgt gggcgagctc    7740
gacgagcggc gggtccccgg agagtttcat gaccagcatg aaggggacga gctgcttgcc    7800
gaaggacccc atccaggtgt aggtttccac gtcgtaggtg aggaagagcc tttcggtgcg    7860
aggatgcgag ccgatgggga agaactggat ctcctgccac cagttggagg aatggctgtt    7920
gatgtgatgg aagtagaaat gccgacggcg cgccgagcac tcgtgcttgt gtttatacaa    7980
gcgtccgcag tgctcgcaac gctgcacggg atgcacgtgc tgcacgagct gtacctgggt    8040
tcctttgacg aggaatttca gtgggcagtg gagcgctggc ggctgcatct ggtgctgtac    8100
tacgtcctgg ccatcggcgt ggccatcgtc tgcctcgatg gtggtcatgc tgacgaggcc    8160
gcgcgggagg caggtccaga cctcggctcg gacgggtcgg agagcgagga cgagggcgcg    8220
caggccggag ctgtccaggg tcctgagacg ctgcggagtc aggtcagtgg gcagcggcgg    8280
cgcgcggttg acttgcagga gcttttccag ggcgcgcggg aggtccagat ggtacttgat    8340
ctccacggcg ccgttggtgg cgacgtccac ggcttgcagg gtcccgtgcc cctggggcgc    8400
caccaccgtg ccccgtttct tcttgggtgc tggcggcggc ggctccatgc ttagaagcgg    8460
cggcgaggac gcgcgccggg cggcaggggc ggctcggggc ccggaggcag gggcggcagg    8520
ggcacgtcgg cgccgcgcgc gggcaggttc tggtactgcg cccggagaag actggcgtga    8580
gcgacgacgc gacggttgac gtcctggatc tgacgcctct gggtgaaggc cacgggaccc    8640
gtgagtttga acctgaaaga gagttcgaca gaatcaatct cggtatcgtt gacggcggcc    8700
tgccgcagga tctcttgcac gtcgcccgag ttgtcctggt aggcgatctc ggtcatgaac    8760
tgctcgatct cctcctcctg aaggtctccg cgaccggcgc gctcgacggt ggccgcgagg    8820
tcgttggaga tgcggcccat gagctgcgag aaggcgttca tgccggcctc gttccagacg    8880
cggctgtaga ccacggctcc gtcggggtcg cgcgcgcgca tgaccacctg ggcgaggttg    8940
agctcgacgt ggcgcgtgaa gaccgcgtag ttgcagaggc gctggtagag gtagttgagc    9000
gtggtggcga tgtgctcggt gacgaagaag tacatgatcc agcggcggag cggcatctcg    9060
ctgacgtcgc ccagggcttc caagcgctcc atggcctcgt agaagtccac ggcgaagttg    9120
aaaaactggg agttgcgcgc cgagacggtc aactcctcct ccagaagacg gatgagctcg    9180
gcgatggtgg cgcgcacctc gcgctcgaag gccccggggg gctcctcttc ttccatctcc    9240
tcctcctctt ccatctcctc cactaacatc tcttctactt cctcctcagg aggcggcggc    9300
gggggagggg ccctgcgtcg ccggcggcgc acgggcagac ggtcgatgaa gcgctcgatg    9360
gtctccccgc gccggcgacg catggtctcg gtgacggcgc gcccgtcctc gcggggccgc    9420
agcgtgaaga cgccgccgcg catctccagg tggccgccgg gggggtctcc gttgggcagg    9480
gagagggcgc tgacgatgca tcttatcaat tggcccgtag ggactccgcg caaggacctg    9540
agcgtctcga gatccacggg atccgaaaac cgctgaacga aggcttcgag ccagtcgcag    9600
tcgcaaggta ggctgagccc ggtttcttgt tcttcgggta tttggtcggg aggcgggcgg    9660
gcgatgctgc tggtgatgaa gttgaagtag gcggtcctga gacggcggat ggtggcgagg    9720
agcaccaggt ccttgggccc ggcttgctgg atgcgcagac ggtcggccat gccccaggcg    9780
tggtcctgac acctggcgag gtccttgtag tagtcctgca tgagccgctc cacgggcacc    9840
tcctcctcgc ccgcgcggcc gtgcatgcgc gtgagcccga acccgcgctg cggctggacg    9900
agcgccaggt cggcgacgac gcgctcggcg aggatggcct gctggatctg ggtgagggtg    9960
gtctggaagt cgtcgaagtc gacgaagcgg tggtaggctc cggtgttgat ggtgtaggag   10020
cagttggcca tgacggacca gttgacggtc tggtggccgg ggcgcacgag ctcgtggtac   10080
ttgaggcgcg agtaggcgcg cgtgtcgaag atgtagtcgt tgcaggtgcg cacgaggtac   10140
tggtatccga cgaggaagtg cggcggcggc tggcggtaga gcggccatcg ctcggtggcg   10200
ggggcgccgg gcgcgaggtc ctcgagcatg aggcggtggt agccgtagat gtacctggac   10260
atccaggtga tgccggcggc ggtggtggag gcgcgcggga actcgcggac gcggttccag   10320
atgttgcgca gcggcaggaa gtagttcatg gtggccgcgg tctggcccgt gaggcgcgcg   10380
cagtcgtgga tgctctagac atacgggcaa aaacgaaagc ggtcagcggc tcgactccgt   10440
ggcctggagg ctaagcgaac gggttgggct gcgcgtgtac cccggttcga gtccctgctc   10500
gaatcaggct ggagccgcag ctaacgtggt actggcactc ccgtctcgac ccaagcctgc   10560
taacgaaacc tccaggatac ggaggcgggt cgttttggcc attttcgtca ggccggaaat   10620
gaaactagta agcgcggaaa gcggccgtcc gcgatggctc gctgccgtag tctggagaaa   10680
gaatcgccag ggttgcgttg cggtgtgccc cggttcgagc ctcagcgctc ggcgccggcc   10740
ggattccgcg gctaacgtgg gcgtggctgc cccgtcgttt ccaagacccc ttagccagcc   10800
gacttctcca gttacggagc gagcccctct ttttcttgtg tttttgccag atgcatcccg   10860
tactgcggca gatgcgcccc caccctccac cacaaccgcc cctaccgcag cagcagcaac   10920
agccggcgct tctgcccccg ccccagcagc agcagccagc cactaccgcg gcggccgccg   10980
tgagcggagc cggcgttcag tatgacctgg ccttggaaga gggcgagggg ctggcgcggc   11040
tgggggcgtc gtcgccggag cggcacccgc gcgtgcagat gaaaagggac gctcgcgagg   11100
cctacgtgcc caagcagaac ctgttcagag acaggagcgg cgaggagccc gaggagatgc   11160
gcgcctcccg cttccacgcg gggcgggagc tgcggcgcgg cctggaccga aagcgggtgc   11220
tgagggacga ggatttcgag gcggacgagc tgacggggat cagccccgcg cgcgcgcacg   11280
tggccgcggc caacctggtc acggcgtacg agcagaccgt gaaggaggag agcaacttcc   11340
aaaaatcctt caacaaccac gtgcgcacgc tgatcgcgcg cgaggaggtg accctgggcc   11400
tgatgcacct gtgggacctg ctggaggcca tcgtgcagaa ccccacgagc aagccgctga   11460
cggcgcagct gtttctggtg gtgcagcaca gtcgggacaa cgagacgttc agggaggcgc   11520
tgctgaatat caccgagccc gagggccgct ggctcctgga cctggtgaac attctgcaga   11580
gcatcgtggt gcaggagcgc gggctgccgc tgtccgagaa gctggcggcc atcaacttct   11640
cggtgctgag cctgggcaag tactacgcta ggaagatcta caagaccccg tacgtgccca   11700
tagacaagga ggtgaagatc gacgggtttt acatgcgcat gaccctgaaa gtgctgaccc   11760
tgagcgacga tctgggggtg taccgcaacg acaggatgca ccgcgcggtg agcgccagcc   11820
gccggcgcga gctgagcgac caggagctga tgcacagcct gcagcgggcc ctgaccgggg   11880
ccgggaccga gggggagagc tactttgaca tgggcgcgga cctgcgctgg cagcctagcc   11940
gccgggcctt ggaagctgcc ggcggttccc cctacgtgga ggaggtggac gatgaggagg   12000
aggagggcga gtacctggaa gactgatggc gcgaccgtat ttttgctaga tgcagcaaca   12060
gccaccgccg cctcctgatc ccgcgatgcg ggcggcgctg cagagccagc cgtccggcat   12120
taactcctcg gacgattgga cccaggccat gcaacgcatc atggcgctga cgacccgcaa   12180
tcccgaagcc tttagacagc agcctcaggc caaccgactc tcggccatcc tggaggccgt   12240
ggtgccctcg cgctcgaacc ccacgcacga gaaggtgctg gccatcgtga acgcgctggt   12300
ggagaacaag gccatccgcg gcgacgaggc cgggctggtg tacaacgcgc tgctggagcg   12360
cgtggcccgc tacaacagca ccaacgtgca gacgaacctg gaccgcatgg tgaccgacgt   12420
gcgcgaggcg gtgtcgcagc gcgagcggtt ccaccgcgag tcgaacctgg gctccatggt   12480
ggcgctgaac gccttcctga gcacgcagcc cgccaacgtg ccccggggcc aggaggacta   12540
caccaacttc atcagcgcgc tgcggctgat ggtggccgag gtgccccaga gcgaggtgta   12600
ccagtcgggg ccggactact tcttccagac cagtcgccag ggcttgcaga ccgtgaacct   12660
gagccaggct ttcaagaact tgcagggact gtggggcgtg caggccccgg tcggggaccg   12720
cgcgacggtg tcgagcctgc tgacgccgaa ctcgcgcctg ctgctgctgc tggtggcgcc   12780
cttcacggac agcggcagcg tgagccgcga ctcgtacctg ggctacctgc ttaacctgta   12840
ccgcgaggcc atcgggcagg cgcacgtgga cgagcagacc taccaggaga tcacccacgt   12900
gagccgcgcg ctgggccagg aggacccggg caacctggag gccaccctga acttcctgct   12960
gaccaaccgg tcgcagaaga tcccgcccca gtacgcgctg agcaccgagg aggagcgcat   13020
cctgcgctac gtgcagcaga gcgtggggct gttcctgatg caggaggggg ccacgcccag   13080
cgccgcgctc gacatgaccg cgcgcaacat ggagcccagc atgtacgccc gcaaccgccc   13140
gttcatcaat aagctgatgg actacttgca tcgggcggcc gccatgaact cggactactt   13200
taccaacgcc atcttgaacc cgcactggct cccgccgccc gggttctaca cgggcgagta   13260
cgacatgccc gaccccaacg acgggttcct gtgggacgac gtggacagca gcgtgttctc   13320
gccgcgcccc accaccacca ccgtgtggaa gaaagagggc ggggaccggc ggccgtcctc   13380
ggcgctgtcc ggtcgcgcgg gtgctgccgc ggcggtgccc gaggccgcca gccccttccc   13440
gagcctgccc ttttcgctga acagcgtgcg cagcagcgag ctgggtcggc tgacgcggcc   13500
gcgcctgctg ggcgaggagg agtacctgaa cgactccttg cttcggcccg agcgcgagaa   13560
gaacttcccc aataacggga tagagagcct ggtggacaag atgagccgct ggaagacgta   13620
cgcgcacgag cacagggacg agccccgagc tagcagcagc accggcgcca cccgtagacg   13680
ccagcggcac gacaggcagc ggggtctggt gtgggacgat gaggattccg ccgacgacag   13740
cagcgtgttg gacttgggtg ggagtggtgg tggtaacccg ttcgctcacc tgcgcccccg   13800
tatcgggcgc ctgatgtaag aatctgaaaa aataaaagac ggtactcacc aaggccatgg   13860
cgaccagcgt gcgttcttct ctgttgtttg tagtagt atg atg agg cgc gtg tac    13915
                                         Met Met Arg Arg Val Tyr
                                         1               5
ccg gag ggt cct cct ccc tcg tac gag agc gtg atg cag cag gcg gtg     13963
Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Ala Val
            10                  15                  20
gcg gcg gcg atg cag ccc ccg ctg gag gcg cct tac gtg ccc ccg cgg     14011
Ala Ala Ala Met Gln Pro Pro Leu Glu Ala Pro Tyr Val Pro Pro Arg
        25                  30                  35
tac ctg gcg cct acg gag ggg cgg aac agc att cgt tac tcg gag ctg    14059
Tyr Leu Ala Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu
    40                  45                  50
gca ccc ttg tac gat acc acc cgg ttg tac ctg gtg gac aac aag tcg    14107
Ala Pro Leu Tyr Asp Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser
55                  60                  65                  70
gcg gac atc gcc tcg ctg aac tac cag aac gac cac agc aac ttc ctg    14155
Ala Asp Ile Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu
                75                  80                  85
acc acc gtg gtg cag aac aac gat ttc acc ccc acg gag gcc agc acc    14203
Thr Thr Val Val Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr
            90                  95                  100
cag acc atc aac ttt gac gag cgc tcg cgg tgg ggc ggc cag ctg aaa    14251
Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys
        105                 110                 115
acc atc atg cac acc aac atg ccc aac gtg aac gag ttc atg tac agc    14299
Thr Ile Met His Thr Asn Met Pro Asn Val Asn Glu Phe Met Tyr Ser
    120                 125                 130
aac aag ttc aag gcg cgg gtg atg gtc tcg cgc aag acc ccc aac ggg    14347
Asn Lys Phe Lys Ala Arg Val Met Val Ser Arg Lys Thr Pro Asn Gly
135                 140                 145                 150
gtc aca gta aca gat ggt agt cag gac gag ctg acc tac gag tgg gtg    14395
Val Thr Val Thr Asp Gly Ser Gln Asp Glu Leu Thr Tyr Glu Trp Val
                155                 160                 165
gag ttt gag ctg ccc gag ggc aac ttc tcg gtg acc atg acc atc gat    14443
Glu Phe Glu Leu Pro Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp
            170                 175                 180
ctg atg aac aac gcc atc atc gac aac tac ttg gcg gtg ggg cgg cag    14491
Leu Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Ala Val Gly Arg Gln
        185                 190                 195
aac ggg gtg ctg gag agc gac atc ggc gtg aag ttc gac acg cgc aac    14539
Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn
    200                 205                 210
ttc cgg ctg ggc tgg gac ccc gtg acc gag ctg gtg atg ccg ggc gtg    14587
Phe Arg Leu Gly Trp Asp Pro Val Thr Glu Leu Val Met Pro Gly Val
215                 220                 225                 230
tac acc aac gag gcc ttc cac ccc gac atc gtc ctg ctg ccc ggc tgc    14635
Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys
                235                 240                 245
ggc gtg gac ttc acc gag agc cgc ctc agc aac ctg ctg ggc atc cgc    14683
Gly Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg
            250                 255                 260
aag cgg cag ccc ttc cag gag ggc ttc cag atc ctg tac gag gac ctg    14731
Lys Arg Gln Pro Phe Gln Glu Gly Phe Gln Ile Leu Tyr Glu Asp Leu
        265                 270                 275
gag ggg ggc aac atc ccc gcg ctg ctg gac gtg gac gcc tac gag aaa    14779
Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Asp Ala Tyr Glu Lys
    280                 285                 290
agc aag gag gat agc gcc gcc gcg gcg acc gca gcc gtg gcc acc gcc    14827
Ser Lys Glu Asp Ser Ala Ala Ala Ala Thr Ala Ala Val Ala Thr Ala
295                 300                 305                 310
tct acc gag gtg cgg ggc gat aat ttt gct agc gcc gcg aca ctg gca    14875
Ser Thr Glu Val Arg Gly Asp Asn Phe Ala Ser Ala Ala Thr Leu Ala
                315                 320                 325
gcg gcc gag gcg gct gaa acc gaa agt aag ata gtg atc cag ccg gtg    14923
Ala Ala Glu Ala Ala Glu Thr Glu Ser Lys Ile Val Ile Gln Pro Val
            330                 335                 340
gag aag gac agc aag gag agg agc tac aac gtg ctc gcg gac aag aaa    14971
Glu Lys Asp Ser Lys Glu Arg Ser Tyr Asn Val Leu Ala Asp Lys Lys
        345                 350                 355
aac acc gcc tac cgc agc tgg tac ctg gcc tac aac tac ggc gac ccc    15019
Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro
    360                 365                 370
gag aag ggc gtg cgc tcc tgg acg ctg ctc acc acc tcg gac gtc acc    15067
Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Ser Asp Val Thr
375                 380                 385                 390
tgc ggc gtg gag caa gtc tac tgg tcg ctg ccc gac atg atg caa gac    15115
Cys Gly yal Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp
                395                 400                 405
ccg gtc acc ttc cgc tcc acg cgt caa gtt agc aac tac ccg gtg gtg    15163
Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser Asn Tyr Pro Val Val
            410                 415                 420
ggc gcc gag ctc ctg ccc gtc tac tcc aag agc ttc ttc aac gag cag    15211
Gly Ala Glu Leu Leu Pro Val Tyr Ser Lys Ser Phe Phe Asn Glu Gln
        425                 430                 435
gcc gtc tac tcg cag cag ctg cgc gcc ttc acc tcg ctc acg cac gtc    15259
Ala Val Tyr Ser Gln Gln Leu Arg Ala Phe Thr Ser Leu Thr His Val
    440                 445                 450
ttc aac cgc ttc ccc gag aac cag atc ctc gtt cgc ccg ccc gcg ccc    15307
Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro
455                 460                 465                 470
acc att acc acc gtc agt gaa aac gtt cct gct ctc aca gat cac ggg    15355
Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly
                475                 480                 485
acc ctg ccg ctg cgc agc agt atc cgg gga gtc cag cgc gtg acc gtc    15403
Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Arg Val Thr Val
            490                 495                 500
act gac gcc aga cgc cgc acc tgc ccc tac gtc tac aag gcc ctg ggc    15451
Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly
        505                 510                 515
gta gtc gcg ccg cgc gtc ctc tcg agc cgc acc ttc taa aaaatgtcca     15500
Val Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
    520                 525                 530
ttctcatctc gcccagtaat aacaccggtt ggggcctgcg cgcgcccagc aagatgtacg  15560
gaggcgctcg ccaacgctcc acgcaacacc ccgtgcgcgt gcgcgggcac ttccgcgctc  15620
cctggggcgc cctcaagggc cgcgtgcgct cgcgcaccac cgtcgacgac gtgatcgacc  15680
aggtggtggc cgacgcgcgc aactacacgc ccgccgccgc gcccgtctcc accgtggacg  15740
ccgtcatcga cagcgtggtg gccgacgcgc gccggtacgc ccgcgccaag agccggcggc  15800
ggcgcatcgc ccggcggcac cggagcaccc ccgccatgcg cgcggcgcga gccttgctgc  15860
gcagggccag gcgcacggga cgcagggcca tgctcagggc ggccagacgc gcggcctccg  15920
gcagcagcag cgccggcagg acccgcagac gcgcggccac ggcggcggcg gcggccatcg  15980
ccagcatgtc ccgcccgcgg cgcggcaacg tgtactgggt gcgcgacgcc gccaccggtg  16040
tgcgcgtgcc cgtgcgcacc cgcccccctc gcacttgaag atgctgactt cgcgatgttg  16100
atgtgtccca gcggcgagga ggatgtccaa gcgcaaattc aaggaagaga tgctccaggt  16160
catcgcgcct gagatctacg gcccggcggc ggtgaaggag gaaagaaagc cccgcaaact  16220
gaagcgggtc aaaaaggaca aaaaggagga ggaagatgtg gacggactgg tggagtttgt  16280
gcgcgagttc gccccccggc ggcgcgtgca gtggcgcggg cggaaagtga aaccggtgct  16340
gcgacccggc accacggtgg tcttcacgcc cggcgagcgt tccggctccg cctccaagcg  16400
ctcctacgac gaggtgtacg gggacgagga catcctcgag caggcggccg aacgtctggg  16460
cgagtttgct tacggcaagc gcagccgccc cgcgcccttg aaagaggagg cggtgtccat  16520
cccgctggac cacggcaacc ccacgccgag cctgaagccg gtgaccctgc agcaggtgct  16580
gcctggtgcg gcgccgcgcc ggggcttcaa gcgcgagggc ggcgaggatc tgtacccgac  16640
catgcagctg atggtgccca agcgccagaa gctggaggac gtgctggagc acatgaaggt  16700
ggaccccgag gtgcagcccg aggtcaaggt gcggcccatc aagcaggtgg ccccgggcct  16760
gggcgtgcag accgtggaca tcaagatccc cacggagccc atggaaacgc agaccgagcc  16820
cgtgaagccc agcaccagca ccatggaggt gcagacggat ccctggatgc cggcaccggc  16880
ttccaccacc cgccgaagac gcaagtacgg cgcggccagc ctgctgatgc ccaactacgc  16940
gctgcatcct tccatcatcc ccacgccggg ctaccgcggc acgcgcttct accgcggcta  17000
caccagcagc cgccgccgca agaccaccac ccgccgccgc cgtcgtcgca cccgccgcag  17060
cagcaccgcg acttccgccg ccgccctggt gcggagagtg taccgcagcg ggcgcgagcc  17120
tctgaccctg ccgcgcgcgc gctaccaccc gagcatcgcc atttaactac cgcctcctac  17180
ttgcagatat ggccctcaca tgccgcctcc gcgtccccat tacgggctac cgaggaagaa  17240
agccgcgccg tagaaggctg acggggaacg ggctgcgtcg ccatcaccac cggcggcggc  17300
gcgccatcag caagcggttg gggggaggct tcctgcccgc gctgatgccc atcatcgccg  17360
cggcgatcgg ggcgatcccc ggcatagctt ccgtggcggt gcaggcctct cagcgccact  17420
gagacacagc ttggaaaatt tgtaataaaa aatggactga cgctcctggt cctgtgatgt  17480
gtgtttttag atggaagaca tcaatttttc gtccctggca ccgcgacacg gcacgcggcc  17540
gtttatgggc acctggagcg acatcggcaa cagccaactg aacgggggcg ccttcaattg  17600
gagcagtctc tggagcgggc ttaagaattt cgggtccacg ctcaaaacct atggcaacaa  17660
ggcgtggaac agcagcacag ggcaggcgct gagggaaaag ctgaaagagc agaacttcca  17720
gcagaaggtg gtcgatggcc tggcctcggg catcaacggg gtggtggacc tggccaacca  17780
ggccgtgcag aaacagatca acagccgcct ggacgcggtc ccgcccgcgg ggtccgtgga  17840
gatgccccag gtggaggagg agctgcctcc cctggacaag cgcggcgaca agcgaccgcg  17900
tcccgacgcg gaggagacgc tgctgacgca cacggacgag ccgcccccgt acgaggaggc  17960
ggtgaaactg ggtctgccca ccacgcggcc cgtggcgcct ctggccaccg gggtgctgaa  18020
acccagcagc agcagcagcc agcccgcgac cctggacttg cctccgcctg cttcccgccc  18080
ctccacagtg gctaagcccc tgccgccggt ggccgtcgcg tcgcgcgccc cccgaggccg  18140
cccccaggcg aactggcaga gcactctgaa cagcatcgtg ggtctgggag tgcagagtgt  18200
gaagcgccgc cgctgctatt aaaagacact gtagcgctta acttgcttgt ctgtgtgtat  18260
atgtatgtcc gccgaccaga aggaggagga agaggcgcgt cgccgagttg caag atg    18317
                                                            Met
gcc acc cca tcg atg ctg ccc cag tgg gcg tac atg cac atc gcc gga    18365
Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala Gly
            535                 540                 545
cag gac gct tcg gag tac ctg agt ccg ggt ctg gtg cag ttc gcc cgc    18413
Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala Arg
        550                 555                 560
gcc aca gac acc tac ttc agt ctg ggg aac aag ttt agg aac ccc acg    18461
Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro Thr
    565                 570                 575
gtg gcg ccc acg cac gat gtg acc acc gac cgc agc cag cgg ctg acg    18509
Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu Thr
580                 585                 590                 595
ctg cgc ttc gtg ccc gtg gac cgc gag gac aac acc tac tcg tac aaa    18557
Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr Lys
                600                 605                 610
gtg cgc tac acg ctg gcc gtg ggc gac aac cgc gtg ctg gac atg gcc    18605
Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met Ala
            615                 620                 625
agc acc tac ttt gac atc cgc ggc gtg ctg gat cgg ggc cct agc ttc    18653
Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser Phe
        630                 635                 640
aaa ccc tac tcc ggc acc gct tac aac agc ctg gct ccc aag gga gcg    18701
Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly Ala
    645                 650                 655
ccc aac act tgc cag tgg aca tat aaa gct gat ggt gat act ggt aca    18749
Pro Asn Thr Cys Gln Trp Thr Tyr Lys Ala Asp Gly Asp Thr Gly Thr
660                 665                 670                 675
gaa aaa acc tat aca tat gga aat gcg cct gtg caa ggc att agt att    18797
Glu Lys Thr Tyr Thr Tyr Gly Asn Ala Pro Val Gln Gly Ile Ser Ile
                680                 685                 690
aca aaa gat ggt att caa ctt gga act gac act gat gat cag ccc att    18845
Thr Lys Asp Gly Ile Gln Leu Gly Thr Asp Thr Asp Asp Gln Pro Ile
            695                 700                 705
tat gca gat aaa act tat caa cca gag cct caa gtg ggt gat gct gaa    18893
Tyr Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln Val Gly Asp Ala Glu
        710                 715                 720
tgg cat gac atc act ggt act gat gaa aaa tat gga ggc aga gct ctc    18941
Trp His Asp Ile Thr Gly Thr Asp Glu Lys Tyr Gly Gly Arg Ala Leu
    725                 730                 735
aag cct gac acc aaa atg aag ccc tgc tat ggt tct ttt gcc aag cct    18989
Lys Pro Asp Thr Lys Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys Pro
740                 745                 750                 755
acc aat aaa gaa gga ggt cag gca aat gtg aaa acc gaa aca ggc ggt    19037
Thr Asn Lys Glu Gly Gly Gln Ala Asn Val Lys Thr Glu Thr Gly Gly
                760                 765                 770
acc aaa gaa tat gac att gac atg gca ttc ttc gat aat cga agt gca    19085
Thr Lys Glu Tyr Asp Ile Asp Met Ala Phe Phe Asp Asn Arg Ser Ala
            775                 780                 785
gct gcg gct ggc ctg gcc cca gaa att gtt ttg tat act gag aat gtg    19133
Ala Ala Ala Gly Leu Ala Pro Glu Ile Val Leu Tyr Thr Glu Asn Val
        790                 795                 800
gat ctg gaa act cca gat act cat att gta tac aag gcg ggc aca gat    19181
Asp Leu Glu Thr Pro Asp Thr His Ile Val Tyr Lys Ala Gly Thr Asp
    805                 810                 815
gac agc agc tct tct atc aat ttg ggt cag cag tcc atg ccc aac aga    19229
Asp Ser Ser Ser Ser Ile Asn Leu Gly Gln Gln Ser Met Pro Asn Arg
820                 825                 830                 835
ccc aac tac att ggc ttt aga gac aac ttt atc ggg ctc atg tac tac    19277
Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr
                840                 845                 850
aac agc act ggc aac atg ggc gtg ctg gct ggt cag gcc tcc cag ctg    19325
Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu
            855                 860                 865
aat gct gtg gtg gac ttg cag gac aga aac act gaa ctg tcc tac cag    19373
Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln
        870                 875                 880
ctc ttg ctt gac tct ctg ggc gac aga acc agg tat ttc agt atg tgg    19421
Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp
    885                 890                 895
aat cag gcg gtg gac agc tat gac ccc gat gtg cgc att att gaa aat    19469
Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn
900                 905                 910                 915
cac ggt gtg gag gat gaa ctc cct aac tat tgc ttc ccc ctg gat gct    19517
His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asp Ala
                920                 925                 930
gtg ggt aga act gat act tac cag gga att aag gcc aat ggt gct gat    19565
Val Gly Arg Thr Asp Thr Tyr Gln Gly Ile Lys Ala Asn Gly Ala Asp
            935                 940                 945
caa acc acc tgg acc aaa gat gat act gtt aat gat gct aat gaa ttg    19613
Gln Thr Thr Trp Thr Lys Asp Asp Thr Val Asn Asp Ala Asn Glu Leu
        950                 955                 960
ggc aag ggc aat cct ttc gcc atg gag atc aac atc cag gcc aac ctg    19661
Gly Lys Gly Asn Pro Phe Ala Met Glu Ile Asn Ile Gln Ala Asn Leu
    965                 970                 975
tgg cgg aac ttc ctc tac gcg aac gtg gcg ctg tac ctg ccc gac tcc    19709
Trp Arg Asn Phe Leu Tyr Ala Asn Val Ala Leu Tyr Leu Pro Asp Ser
980                 985                 990                 995
tac aag tac acg ccg  gcc aac atc acg ctg  ccg acc aac acc aac      19754
Tyr Lys Tyr Thr Pro  Ala Asn Ile Thr Leu  Pro Thr Asn Thr Asn
                1000                 1005                 1010
acc tac gat tac atg  aac ggc cgc gtg gtg  gcg ccc tcg ctg gtg    19799
Thr Tyr Asp Tyr Met  Asn Gly Arg Val Val  Ala Pro Ser Leu Val
                1015                 1020                 1025
gac gcc tac atc aac  atc ggg gcg cgc tgg  tcg ctg gac ccc atg    19844
Asp Ala Tyr Ile Asn  Ile Gly Ala Arg Trp  Ser Leu Asp Pro Met
                1030                 1035                 1040
gac aac gtc aac ccc  ttc aac cac cac cgc aac  gcg ggc ctg cgc    19889
Asp Asn Val Asn Pro  Phe Asn His His Arg Asn  Ala Gly Leu Arg
                1045                 1050                 1055
tac cgc tcc atg ctc  ctg ggc aac ggg cgc  tac gtg ccc ttc cac    19934
Tyr Arg Ser Met Leu  Leu Gly Asn Gly Arg  Tyr Val Pro Phe His
                1060                 1065                 1070
atc cag gtg ccc caa  aag ttc ttc gcc atc  aag agc ctc ctg ctc    19979
Ile Gln Val Pro Gln  Lys Phe Phe Ala Ile  Lys Ser Leu Leu Leu
                1075                 1080                 1085
ctg ccc ggg tcc tac  acc tac gag tgg aac  ttc cgc aag gac gtc    20024
Leu Pro Gly Ser Tyr  Thr Tyr Glu Trp Asn  Phe Arg Lys Asp Val
                1090                 1095                 1100
aac atg atc ctg cag  agc tcc ctc ggc aac  gac ctg cgc acg gac    20069
Asn Met Ile Leu Gln  Ser Ser Leu Gly Asn  Asp Leu Arg Thr Asp
                1105                 1110                 1115
ggg gcc tcc atc gcc  ttc acc agc atc aac  ctc tac gcc acc ttc    20114
Gly Ala Ser Ile Ala  Phe Thr Ser Ile Asn  Leu Tyr Ala Thr Phe
                1120                 1125                 1130
ttc ccc atg gcg cac  aac acc gcc tcc acg  ctc gag gcc atg ctg    20159
Phe Pro Met Ala His  Asn Thr Ala Ser Thr  Leu Glu Ala Met Leu
                1135                 1140                 1145
cgc aac gac acc aac  gac cag tcc ttc aac  gac tac ctc tcg gcg    20204
Arg Asn Asp Thr Asn  Asp Gln Ser Phe Asn  Asp Tyr Leu Ser Ala
                1150                 1155                 1160
gcc aac atg ctc tac  ccc atc ccg gcc aac  gcc acc aac gtg ccc    20249
Ala Asn Met Leu Tyr  Pro Ile Pro Ala Asn  Ala Thr Asn Val Pro
                1165                 1170                 1175
atc tcc atc ccc tcg  cgc aac tgg gcc gcc  ttc cgc gga tgg tcc    20294
Ile Ser Ile Pro Ser  Arg Asn Trp Ala Ala  Phe Arg Gly Trp Ser
                1180                 1185                 1190
ttc acg cgc ctc aag  acc cgc gag acg ccc  tcg ctc ggc tcc ggg    20339
Phe Thr Arg Leu Lys  Thr Arg Glu Thr Pro  Ser Leu Gly Ser Gly
                1195                 1200                 1205
ttc gac ccc tac ttc  gtc tac tcg ggc tcc  atc ccc tac ctc gac    20384
Phe Asp Pro Tyr Phe  Val Tyr Ser Gly Ser  Ile Pro Tyr Leu Asp
                1210                 1215                 1220
ggc acc ttc tac ctc  aac cac acc ttc aag  aag gtc tcc atc acc    20429
Gly Thr Phe Tyr Leu  Asn His Thr Phe Lys  Lys Val Ser Ile Thr
                1225                 1230                 1235
ttc gac tcc tcc gtc  agc tgg ccc ggc aac  gac cgc ctc ctg acg    20474
Phe Asp Ser Ser Val  Ser Trp Pro Gly Asn  Asp Arg Leu Leu Thr
                1240                 1245                 1250
ccc aac gag ttc gaa  atc aag cgc acc gtc  gac gga gag ggg tac    20519
Pro Asn Glu Phe Glu  Ile Lys Arg Thr Val  Asp Gly Glu Gly Tyr
                1255                 1260                 1265
aac gtg gcc cag tgc  aac atg acc aag gac  tgg ttc ctg gtc cag    20564
Asn Val Ala Gln Cys  Asn Met Thr Lys Asp  Trp Phe Leu Val Gln
                1270                 1275                 1280
atg ctg gcc cac tac  aac atc ggc tac cag  ggc ttc tac gtg ccc    20609
Met Leu Ala His Tyr  Asn Ile Gly Tyr Gln  Gly Phe Tyr Val Pro
                1285                 1290                 1295
gag ggc tac aag gac  cgc atg tac tcc ttc  ttc cgc aac ttc cag    20654
Glu Gly Tyr Lys Asp  Arg Met Tyr Ser Phe  Phe Arg Asn Phe Gln
                1300                 1305                 1310
ccc atg agc cgc cag  gtc gtg gac gag gtc  aac tac aag gac tac    20699
Pro Met Ser Arg Gln  Val Val Asp Glu Val  Asn Tyr Lys Asp Tyr
                1315                 1320                 1325
cag gcc gtc acc ctg  gcc tac cag cac aac  aac tcg ggc ttc gtc    20744
Gln Ala Val Thr Leu  Ala Tyr Gln His Asn  Asn Ser Gly Phe Val
                1330                 1335                 1340
ggc tac ctc gcg ccc  acc atg cgc cag gga  cag ccc tac ccc gcc    20789
Gly Tyr Leu Ala Pro  Thr Met Arg Gln Gly  Gln Pro Tyr Pro Ala
                1345                 1350                 1355
aac tac ccc tac ccg  ctc atc ggc aag agc  gcc gtc gcc agc gtc    20834
Asn Tyr Pro Tyr Pro  Leu Ile Gly Lys Ser  Ala Val Ala Ser Val
                1360                 1365                 1370
acc cag aaa aag ttc  ctc tgc gac cgg gtc  atg tgg cgc atc ccc    20879
Thr Gln Lys Lys Phe  Leu Cys Asp Arg Val  Met Trp Arg Ile Pro
                1375                 1380                 1385
ttc tcc agc aac ttc  atg tcc atg ggc gcg  ctc acc gac ctc ggc    20924
Phe Ser Ser Asn Phe  Met Ser Met Gly Ala  Leu Thr Asp Leu Gly
                1390                 1395                 1400
cag aac atg ctc tac  gcc aac tcc gcc cac  gcg cta gac atg aat    20969
Gln Asn Met Leu Tyr  Ala Asn Ser Ala His  Ala Leu Asp Met Asn
                1405                 1410                 1415
ttc gaa gtc gac ccc  atg gat gag tcc acc  ctt ctc tat gtt gtc    21014
Phe Glu Val Asp Pro  Met Asp Glu Ser Thr  Leu Leu Tyr Val Val
                1420                 1425                 1430
ttc gaa gtc ttc gac  gtc gtc cga gtg cac  cag ccc cac cgc ggc    21059
Phe Glu Val Phe Asp  Val Val Arg Val His  Gln Pro His Arg Gly
                1435                 1440                 1445
gtc atc gag gcc gtc  tac ctg cgc acg ccc  ttc tcg gcc ggc aac      21104
Val Ile Glu Ala Val  Tyr Leu Arg Thr Pro  Phe Ser Ala Gly Asn
                1450                 1455                 1460
gcc acc acc taa gccccgctct tgcttcttgc aagatgacgg cctgtgcggg        21156
Ala Thr Thr
ctccggcgag caggagctca gggccatcct ccgcgacctg ggctgcgggc cctgcttcct  21216
gggcaccttc gacaagcgct tcccgggatt catggccccg cacaagctgg cctgcgccat  21276
cgtcaacacg gccggccgcg agaccggggg cgagcactgg ctggccttcg cctggaaccc  21336
gcgctcccac acctgctacc tcttcgaccc cttcgggttc tcggacgagc gcctcaagca  21396
gatctaccag ttcgagtacg agggcctgct gcgccgcagc gccctggcca ccgaggaccg  21456
ctgcgtcacc ctggaaaagt ccacccagac cgtgcagggt ccgcgctcgg ccgcctgcgg  21516
gctcttctgc tgcatgttcc tgcacgcctt cgtgcactgg cccgaccgcc ccatggacaa  21576
gaaccccacc atgaacttgc tgacgggggt gcccaacggc atgctccagt cgccccaggt  21636
ggaacccacc ctgcgccgca accaggaggc gctctaccgc ttcctcaacg cccactccgc  21696
ctactttcgc tcccaccgcg cgcgcatcga gaaggccacc gccttcgacc gcatgaatca  21756
agacatgtaa accgtgtgtg tatgtgaatg ctttattcat aataaacagc acatgtttat  21816
gccacctttt ctgaggctct gactttattt agaaatcgaa ggggttctgc cggctctcgg  21876
cgtgccccgc gggcagggat acgttgcgga actggtactt gggcagccac ttgaactcgg  21936
ggatcagcag cttcggcacg gggaggtcgg ggaacgagtc gctccacagc ttgcgcgtga  21996
gttgcagggc gcccagcagg tcgggcgcgg agatcttgaa atcgcagttg ggacccgcgt  22056
tctgcgcgcg ggagttgcgg tacacggggt tgcagcactg gaacaccatc agggccgggt  22116
gcttcacgct cgccagcacc gtcgcgtcgg tgatgccctc cacgtccaga tcctcggcgt  22176
tggccatccc gaagggggtc atcttgcagg tctgccgccc catgctgggc acgcagccgg  22236
gcttgtggtt gcaatcgcag tgcaggggga tcagcatcat ctgggcctgc tcggagctca  22296
tgcccgggta catggccttc atgaaagcct ccagctggcg gaaggcctgc tgcgccttgc  22356
cgccctcggt gaagaagacc ccgcaggact tgctagagaa ctggttggtg gcgcagccgg  22416
cgtcgtgcac gcagcagcgc gcgtcgttgt tggccagctg caccacgctg cgcccccagc  22476
ggttctgggt gatcttggcc cggtcggggt tctccttcag cgcgcgctgc ccgttctcgc  22536
tcgccacatc catctcgatc gtgtgctcct tctggatcat cacggtcccg tgcaggcatc  22596
gcagcttgcc ctcggcctcg gtgcacccgt gcagccacag cgcgcagccg gtgcactccc  22656
agttcttgtg ggcgatctgg gagtgcgagt gcacgaagcc ctgcaggaag cggcccatca  22716
tcgtggtcag ggtcttgttg ctggtgaagg tcagcgggat gccgcggtgc tcctcgttca  22776
catacaggtg gcagatgcgg cggtacacct cgccctgctc gggcatcagc tggaaggcgg  22836
acttcaggtc gctctccacg cggtaccggt ccatcagcag cgtcatgact tccatgccct  22896
tctcccaggc cgagacgatc ggcaggctca gggggttctt caccgccgtt gtcatcttag  22956
tcgccgccgc tgaggtcagg gggtcgttct cgtccagggt ctcaaacact cgcttgccgt  23016
ccttctcggt gatgcgcacg gggggaaagc tgaagcccac ggccgccagc tcctcctcgg  23076
cctgcctttc gtcctcgctg tcctggctga tgtcttgcaa aggcacatgc ttggtcttgc  23136
ggggtttctt tttgggcggc agaggcggcg gcggagacgt gctgggcgag cgcgagttct  23196
cgctcaccac gactatttct tcttcttggc cgtcgtccga gaccacgcgg cggtaggcat  23256
gcctcttctg gggcagaggc ggaggcgacg ggctctcgcg gttcggcggg cggctggcag  23316
agccccttcc gcgttcgggg gtgcgctcct ggcggcgctg ctctgactga cttcctccgc  23376
ggccggccat tgtgttctcc tagggagcaa caagcatgga gactcagcca tcgtcgccaa  23436
catcgccatc tgcccccgcc gccgccgacg agaaccagca gcagaatgaa agcttaaccg  23496
ccccgccgcc cagccccacc tccgacgccg ccgcggcccc agacatgcaa gagatggagg  23556
aatccatcga gattgacctg ggctacgtga cgcccgcgga gcacgaggag gagctggcag  23616
cgcgcttttc agccccggaa gagaaccacc aagagcagcc agagcaggaa gcagagagcg  23676
agcagcagca ggctgggctc gagcatggcg actacctgag cggggcagag gacgtgctca  23736
tcaagcatct ggcccgccaa tgcatcatcg tcaaggacgc gctgctcgac cgcgccgagg  23796
tgcccctcag cgtggcggag ctcagccgcg cctacgagcg caacctcttc tcgccgcgcg  23856
tgccccccaa gcgccagccc aacggcacct gcgagcccaa cccgcgcctc aacttctacc  23916
cggtcttcgc ggtgcccgag gccctggcca cctaccacct ctttttcaag aaccaaagga  23976
tccccgtctc ctgccgcgcc aaccgcaccc gcgccgacgc cctgctcaac ctgggtcccg  24036
gcgcccgcct acctgatatc gcctccttgg aagaggttcc caagatcttc gagggtctgg  24096
gcagcgacga gactcgggcc gcgaacgctc tgcaaggaag cggagaggag catgagcacc  24156
acagcgccct ggtggagttg gaaggcgaca acgcgcgcct ggcggtgctc aagcgcacgg  24216
tcgagctgac ccacttcgcc tacccggcgc tcaacctgcc ccccaaggtc atgagcgccg  24276
tcatggacca ggtgctcatc aagcgcgcct cgcccctctc ggatgaggac atgcaggacc  24336
ccgagagctc ggacgagggc aagcccgtgg tcagcgacga gcagctggcg cgctggctgg  24396
gagcgagtag caccccccag agcttggaag agcggcgcaa gctcatgatg gccgtggtcc  24456
tggtgaccgt ggagctggag tgtctgcgcc gcttcttcgc cgacgcagag accctgcgca  24516
aggtcgagga gaacctgcac tacctcttca ggcacgggtt tgtgcgccag gcctgcaaga  24576
tctccaacgt ggagctgacc aacctggtct cctacatggg catcctgcac gagaaccgcc  24636
tggggcagaa cgtgctgcac accaccctgc gcggggaggc ccgccgcgac tacatccgcg  24696
actgcgtcta cctgtacctc tgccacacct ggcagacggg catgggcgtg tggcagcagt  24756
gcctggagga gcagaacctg aaagagctct gcaagctcct gcagaagaac ctgaaggccc  24816
tgtggaccgg gttcgacgag cgcaccaccg cctcggacct ggccgacctc atcttccccg  24876
agcgcctgcg gctgacgctg cgcaacggac tgcccgactt tatgagtcaa agcatgttgc  24936
aaaactttcg ctctttcatc ctcgaacgct ccgggatcct gcccgccacc tgctccgcgc  24996
tgccctcgga cttcgtgccg ctgaccttcc gcgagtgccc cccgccgctc tggagccact  25056
gctacctgct gcgcctggcc aactacctgg cctaccactc ggacgtgatc gaggacgtca  25116
gcggcgaggg tctgctcgag tgccactgcc gctgcaacct ctgcacgccg caccgctccc  25176
tggcctgcaa cccccagctg ctgagcgaga cccagatcat cggcaccttc gagttgcaag  25236
gccccggcga gggcaagggg ggtctgaaac tcaccccggg gctgtggacc tcggcctact  25296
tgcgcaagtt cgtgcccgag gactaccatc ccttcgagat caggttctac gaggaccaat  25356
cccagccgcc caaggccgaa ctgtcggcct gcgtcatcac ccagggggcc atcctggccc  25416
aattgcaagc catccagaaa tcccgccaag aatttctgct gaaaaagggc cacggggtct  25476
acctggaccc ccagaccgga gaggagctca accccagctt cccccaggat gccccgagga  25536
agcagcaaga agctgaaagt ggagctgccg ccgccggagg atttggagga agactgggag  25596
agcagtcagg cagaggagga ggagatggaa gactgggaca gcactcaggc agaggaggac  25656
agcctgcaag acagtctgga agacgaggtg gaggaggagg cagaggaaga agcagccgcc  25716
gccagaccgt cgtcctcggc ggagaaagca agcagcacgg ataccatctc cgctccgggt  25776
cggggtcgcg gcgaccgggc ccacagtagg tgggacgaga ccgggcgctt cccgaacccc  25836
accacccaga ccggtaagaa ggagcggcag ggatacaagt cctggcgggg gcacaaaaac  25896
gccatcgtct cctgcttgca agcctgcggg ggcaacatct ccttcacccg ccgctacctg  25956
ctcttccacc gcggggtgaa cttcccccgc aacatcttgc attactaccg tcacctccac  26016
agcccctact actgtttcca agaagaggca gaaacccagc agcagcagaa aaccagcggc  26076
agcagcagct agaaaatcca cagcggcggc aggtggactg aggatcgcag cgaacgagcc  26136
ggcgcagacc cgggagctga ggaaccggat ctttcccacc ctctatgcca tcttccagca  26196
gagtcggggg caggagcagg aactgaaagt caagaaccgt tctctgcgct cgctcacccg  26256
cagttgtctg tatcacaaga gcgaagacca acttcagcgc actctcgagg acgccgaggc  26316
tctcttcaac aagtactgcg cgctcactct taaagagtag cccgcgcccg cccacacacg  26376
gaaaaaggcg ggaattacgt caccacctgc gcccttcgcc cgaccatcat catgagcaaa  26436
gagattccca cgccttacat gtggagctac cagccccaga tgggcctggc cgccggcgcc  26496
gcccaggact actccacccg catgaactgg ctcagcgccg ggcccgcgat gatctcacgg  26556
gtgaatgaca tccgcgcccg ccgaaaccag atactcctag aacagtcagc gatcaccgcc  26616
acgccccgcc atcaccttaa tccgcgtaat tggcccgccg ccctggtgta ccaggaaatt  26676
ccccagccca cgaccgtact acttccgcga gacgcccagg ccgaagtcca gctgactaac  26736
tcaggtgtcc agctggccgg cggcgccgcc ctgtgtcgtc accgccccgc tcagggtata  26796
aagcggctgg tgatccgagg cagaggcaca cagctcaacg acgaggtggt gagctcttcg  26856
ctgggtctgc gacctgacgg agtcttccaa ctcgccggat cggggagatc ttccttcacg  26916
cctcgtcagg ccgtcctgac tttggagagt tcgtcctcgc agccccgctc gggtggcatc  26976
ggcactctcc agttcgtgga ggagttcact ccctcggtct acttcaaccc cttctccggc  27036
tcccccggcc actacccgga cgagttcatc ccgaacttcg acgccatcag cgagtcggtg  27096
gacggctacg attgaatgtc ccatggtggc gcagctgacc tagctcggct tcgacacctg  27156
gaccactgcc gccgcttccg ctgcttcgct cgggatctcg ccgagtttgc ctactttgag  27216
ctgcccgagg agcaccctca gggcccggcc cacggagtgc ggatcatcgt cgaagggggc  27276
ctcgactccc acctgcttcg gatcttcagc cagcgaccga tcctggtcga gcgcgagcaa  27336
ggacagaccc ttctgaccct gtactgcatc tgcaaccacc ccggcctgca tgaaagtctt  27396
tgttgtctgc tgtgtactga gtataataaa agctgagatc agcgactact ccggactcga  27456
ttgtggtgtt cctgctatca accggtccct gttcttcacc gggaacgaga ccgagctcca  27516
gcttcagtgt aagccccaca agaagtacct cacctggctg ttccagggct ccccgatcgc  27576
cgttgtcaac cactgcgaca acgacggagt cctgctgagc ggccccgcca accttacttt  27636
ttccacccgc agaagcaagc tccagctctt ccaacccttc ctccccggga cctatcagtg  27696
cgtctcggga ccctgccatc acaccttcca cctgatcccg aataccacag cgccgctccc  27756
cgctactaac aaccaaacta cccaccatcg ccaccgtcgc gacctttctg aatctaacac  27816
taccacccac accggaggtg agctccgagg tcgaccaacc tctgggattt actacggccc  27876
ctgggaggtg gtggggttaa tagcgctagg cctagttgtg ggtgggcttt tggctctctg  27936
ctacctatac ctcccttgct gttcgtactt agtggtgctg tgttgctggt ttaagaaatg  27996
gggaagatca ccctagtgag ctgcggtgcg ctggtggcgg tggtggtgtt ttcgattgtg  28056
ggactgggcg gcgcggctgt agtgaaggag aaggccgatc cctgcttgca tttcaatccc  28116
gacaattgcc agctgagttt tcagcccgat ggcaatcggt gcgcggtgct gatcaagtgc  28176
ggatgggaat gcgagaacgt gagaatcgag tacaataaca agactcggaa caatactctc  28236
gcgtccgtgt ggcagcccgg ggaccccgag tggtacaccg tctctgtccc cggtgctgac  28296
ggctccccgc gcaccgtgaa caatactttc atttttgcgc acatgtgcga cacggtcatg  28356
tggatgagca agcagtacga tatgtggccc cccacgaagg agaacatcgt ggtcttctcc  28416
atcgcttaca gcgcgtgcac ggcgctaatc accgctatcg tgtgcctgag cattcacatg  28476
ctcatcgcta ttcgccccag aaataatgcc gaaaaagaga aacagccata acacgttttt  28536
tcacacacct ttttcagacc atggcctctg ttaaattttt gcttttattt gccagtctca  28596
ttactgttat aagtaatgag aaactcacta tttacattgg cactaaccac actttagacg  28656
gaattccaaa atcctcatgg tattgctatt ttgatcaaga tccagactta actatagaac  28716
tgtgtggtaa caagggaaaa aatacaagca ttcatttaat taactttaat tgcggagaca  28776
atttgaaatt aattaatatc actaaagagt atggaggtat gtattactat gttgcagaaa  28836
ataacaacat gcagttttat gaagttactg taactaatcc caccacacct agaacaacaa  28896
caaccaccac cacaaaaact acacctgtta ccactatgca gctcactacc aataacattt  28956
ttgccatgcg tcaaatggtc aacaatagca ctcaacccac cccacccagt gaggaaattc  29016
ccaaatccat gattggcatt attgttgctg tagtggtgtg catgttgatc atcgccttgt  29076
gcatggtgta ctatgccttc tgctacagaa agcacagact gaacgacaag ctggaacact  29136
tactaagtgt tgaattttaa ttttttagaa ccatgaagat cctaggcctt ttaatttttt  29196
ctatcattac ctctgctcta tgcaattctg acaatgagga cgttactgtc gttgtcggaa  29256
ccaattatac actgaaaggt ccagcgaagg gtatgctttc gtggtattgc tggtttggaa  29316
ctgacgagca acagacagag ctctgcaatg ctcaaaaagg caaaacctca aattctaaaa  29376
tctctaatta tcaatgcaat ggcactgact tagtactgct caatgtcacg aaagcatatg  29436
ctggcagcta cacctgccct ggagatgata ctgagaacat gattttttac aaagtggaag  29496
tggttgatcc cactactcca cctccaccca ccacaactac tcacaccaca cacacagaac  29556
aaaccacagc agaggaggca gcaaagttag ccttgcaggt ccaagacagt tcatttgttg  29616
gcattacccc tacacctgat cagcggtgtc cggggctgct cgtcagcggc attgtcggtg  29676
tgctttcggg attagcagtc ataatcatct gcatgttcat ttttgcttgc tgctatagaa  29736
ggctttaccg acaaaaatca gacccactgc tgaacctcta tgtttaattt tttccagagc  29796
catgaaggca gttagcactc tagttttttg ttctttgatt ggcactgttt ttagtgttag  29856
ctttttgaaa caaatcaatg ttactgaggg ggaaaatgtg acactggtag gcgtagaggg  29916
tgctcaaaat accacctgga caaaattcca tctagatggg tggaaagaaa tttgcacctg  29976
gaatgtcagt acttatacat gtgaaggagt taatcttacc attgtcaatg tcagccaaat  30036
tcaaaagggt tggattaaag ggcaatctgt tagtgttagc aatagtgggt actataccca  30096
gcatactctt atctatgaca ttatagttat accactgcct acacctagcc cacctagcac  30156
taccacacag acaacccaca ctacacaaac aaccacatac agtacatcaa atcagcctac  30216
caccactaca acagcagagg ttgccagctc gtctggggtc cgagtggcat ttttgatgtt  30276
ggccccatct agcagtccca ctgctagtac caatgagcag actactgaat ttttgtccac  30336
tgtcgagagc cacaccacag ctacctcgag tgccttctct agcaccgcca atctatcctc  30396
gctttcctct acaccaatca gtcccgctac tactcctacc cccgctattc tccccactcc  30456
cctgaagcaa acagacggcg acatgcaatg gcagatcacc ctgctcattg tgatcgggtt  30516
ggtcatcctg gccgtgttgc tctactacat cttctgccgc cgcattccca acgcgcaccg  30576
caagccggcc tacaagccca tcgttgtcgg gcagccggag ccgcttcagg tggaaggggg  30636
tctaaggaat cttctcttct cttttacagt atggtgattg aattatgatt cctagacaaa  30696
tcttgatcac tattcttatc tgcctcctcc aagtctgtgc caccctcgct ctggtggcca  30756
acgccagtcc agactgtatt gggcccttcg cctcctacgt gctctttgcc ttcatcacct  30816
gcatctgctg ctgtagcata gtctgcctgc ttatcacctt cttccagttc attgactgga  30876
tctttgtgcg catcgcctac ctgcgccacc acccccagta ccgcgaccag cgagtggcgc  30936
ggctgctcag gatcctctga taagcatgcg ggctctgcta cttctcgcgc ttctgctgtt  30996
agtgctcccc cgtcccgtcg acccccggac ccccacccag tcccccgagg aggtccgcaa  31056
atgcaaattc caagaaccct ggaaattcct caaatgctac cgccaaaaat cagacatgca  31116
tcccagctgg atcatgatca ttgggatcgt gaacattctg gcctgcaccc tcatctcctt  31176
tgtgatttac ccctgctttg actttggttg gaactcgcca gaggcgctct atctcccgcc  31236
tgaacctgac acaccaccac agcaacctca ggcacacgca ctaccaccac caccacagcc  31296
taggccacaa tacatgccca tattagacta tgaggccgag ccacagcgac ccatgctccc  31356
cgctattagt tacttcaatc taaccggcgg agatgactga cccactggcc aacaacaacg  31416
tcaacgacct tctcctggac atggacggcc gcgcctcgga gcagcgactc gcccaacttc  31476
gcattcgcca gcagcaggag agagccgtca aggagctgca ggacggcata gccatccacc  31536
agtgcaagaa aggcatcttc tgcctggtga aacaggccaa gatctcctac gaggtcaccc  31596
agaccgacca tcgcctctcc tacgagctcc tgcagcagcg ccagaagttc acctgcctgg  31656
tcggagtcaa ccccatcgtc atcacccagc agtcgggcga taccaagggg tgcatccact  31716
gctcctgcga ctcccccgac tgcgtccaca ctctgatcaa gaccctctgc ggcctccgcg  31776
acctcctccc catgaactaa tcaccccctt atccagtgaa ataaagatca tattgatgat  31836
ttgagtttaa taaaaataaa gaatcactta cttgaaatct gataccaggt ctctgtccat  31896
gttttctgcc aacaccactt cactcccctc ttcccagctc tggtactgca ggccccggcg  31956
ggctgcaaac ttcctccaca ccctgaaggg gatgtcaaat tcctcctgtc cctcaatctt  32016
cattttatct tctatcag atg tcc  aaa aag cgc gtc cgg  gtg gat gat gac  32067
                    Met Ser  Lys Lys Arg Va1 Arg  Val Asp Asp Asp
                        1465                 1470
ttc  gac ccc gtc tac ccc  tac gat gca gac aac  gca ccg acc gtg     32112
Phe  Asp Pro Val Tyr Pro  Tyr Asp Ala Asp Asn  Ala Pro Thr Val
1475                 1480                 1485
ccc  ttc atc aac ccc ccc  ttc gtc tct tca gat  gga ttc caa gag     32157
Pro  Phe Ile Asn Pro Pro  Phe Val Ser Ser Asp  Gly Phe Gln Glu
1490                 1495                 1500
aag  ccc ctg ggg gtg ctg  tcc ctg cgt ctg gcc  gat ccc gtc acc     32202
Lys  Pro Leu Gly Val Leu  Ser Leu Arg Leu Ala  Asp Pro Val Thr
1505                 1510                 1515
acc  aag aac ggg gaa atc  acc ctc aag ctg gga  gat ggg gtg gac     32247
Thr Lys Asn Gly Glu Ile Thr Leu Lys Leu Gly Asp Gly Val Asp
1520                 1525                 1530
ctc  gac tcc tcg gga aaa  ctc atc tcc aac acg  gcc acc aag gcc     32292
Leu  Asp Ser Ser Gly Lys  Leu Ile Ser Asn Thr  Ala Thr Lys Ala
1535                 1540                 1545
gcc  gcc cct ctc agt ttt  tcc aac aac acc att  tcc ctt aac atg     32337
Ala  Ala Pro Leu Ser Phe  Ser Asn Asn Thr Ile  Ser Leu Asn Met
1550                 1555                 1560
gat  acc cct ttt tac aac  aac aat gga aag tta  ggc atg aaa gtc    32382
Asp  Thr Pro Phe Tyr Asn  Asn Asn Gly Lys Leu  Gly Met Lys Val
1565                 1570                 1575
act  gct cca ctg aag ata  cta gac aca gac ttg  cta aaa aca ctt    32427
Thr  Ala Pro Leu Lys Ile  Leu Asp Thr Asp Leu  Leu Lys Thr Leu
1580                 1585                 1590
gtt  gta gct tat gga caa  ggt tta gga aca aac  acc act ggt gcc    32472
Va1  Val Ala Tyr Gly Gln  Gly Leu Gly Thr Asn  Thr Thr Gly Ala
1595                 1600                 1605
ctt  gtt gcc caa cta gca  tcc cca ctt gct ttt  gat agc aat agc    32517
Leu  Val Ala Gln Leu Ala  Ser Pro Leu Ala Phe  Asp Ser Asn Ser
1610                 1615                 1620
aaa  att gcc ctt aat tta  ggc aat gga cca ttg  aaa gtg gat gca    32562
Lys  Ile Ala Leu Asn Leu  Gly Asn Gly Pro Leu  Lys Val Asp Ala
1625                 1630                 1635
aat  aga ctg aac atc aat  tgc aat aga gga ctc  tat gtt act acc    32607
Asn  Arg Leu Asn Ile Asn  Cys Asn Arg Gly Leu  Tyr Val Thr Thr
1640                 1645                 1650
aca  aaa gat gca ctg gaa  gcc aat ata agt tgg  gct aat gct atg    32652
Thr  Lys Asp Ala Leu Glu  Ala Asn Ile Ser Trp  Ala Asn Ala Met
1655                 1660                 1665
aca  ttt ata gga aat gcc  atg ggt gtc aat att  gat aca caa aaa    32697
Thr  Phe Ile Gly Asn Ala  Met Gly Val Asn Ile  Asp Thr Gln Lys
1670                 1675                 1680
ggc  ttg caa ttt ggc acc  act agt acc gtc gca  gat gtt aaa aac    32742
Gly  Leu Gln Phe Gly Thr  Thr Ser Thr Val Ala  Asp Val Lys Asn
1685                 1690                 1695
gct  tac ccc ata caa atc  aaa ctt gga gct ggt  ctc aca ttt gac    32787
Ala  Tyr Pro Ile Gln Ile  Lys Leu Gly Ala Gly  Leu Thr Phe Asp
1700                 1705                 1710
agc  aca ggt gca att gtt  gca tgg aac aaa gat  gat gac aag ctt    32832
Ser  Thr Gly Ala Ile Val  Ala Trp Asn Lys Asp  Asp Asp Lys Leu
1715                 1720                 1725
aca  cta tgg acc aca gcc  gac ccc tct cca aat  tgt cac ata tat    32877
Thr  Leu Trp Thr Thr Ala  Asp Pro Ser Pro Asn  Cys His Ile Tyr
1730                 1735                 1740
tct  gaa aag gat gct aag  ctt aca ctt tgc ttg  aca aag tgt ggc    32922
Ser  Glu Lys Asp Ala Lys  Leu Thr Leu Cys Leu  Thr Lys Cys Gly
1745                 1750                 1755
agt  cag att ctg ggc act  gtt tcc ctc ata gct  gtt gat act ggc    32967
Ser  Gln Ile Leu Gly Thr  Val Ser Leu Ile Ala  Val Asp Thr Gly
1760                 1765                 1770
agt  tta aat ccc ata aca  gga aca gta acc act  gct ctt gtc tca     33012
Ser  Leu Asn Pro Ile Thr  Gly Thr Val Thr Thr  Ala Leu Val Ser
1775                 1780                 1785
ctt  aaa ttc gat gca aat  gga gtt ttg caa agc  agc tca aca cta     33057
Leu  Lys Phe Asp Ala Asn  Gly Val Leu Gln Ser  Ser Ser Thr Leu
1790                 1795                 1800
gac  tca gac tat tgg aat  ttc aga cag gga gat  gtt aca cct gct     33102
Asp  Ser Asp Tyr Trp Asn  Phe Arg Gln Gly Asp  Val Thr Pro Ala
1805                 1810                 1815
gaa  gcc tat act aat gct  ata ggt ttc atg ccc  aat cta aaa gca     33147
Glu  Ala Tyr Thr Asn Ala  Ile Gly Phe Met Pro  Asn Leu Lys Ala
1820                 1825                 1830
tac  cct aaa aac aca agt  gga gct gca aaa agt  cac att gtt ggg     33192
Tyr  Pro Lys Asn Thr Ser  Gly Ala Ala Lys Ser  His Ile Val Gly
1835                 1840                 1845
aaa  gtg tac cta cat ggg  gat aca ggc aaa cca  ctg gac ctc att     33237
Lys  Val Tyr Leu His Gly  Asp Thr Gly Lys Pro  Leu Asp Leu Ile
1850                 1855                 1860
att  act ttc aat gaa aca  agt gat gaa tct tgc  act tac tgt att     33282
Ile  Thr Phe Asn Glu Thr  Ser Asp Glu Ser Cys  Thr Tyr Cys Ile
1865                 1870                 1875
aac  ttt caa tgg cag tgg  ggg gct gat caa tat  aaa aat gaa aca     33327
Asn  Phe Gln Trp Gln Trp  Gly Ala Asp Gln Tyr  Lys Asn Glu Thr
1880                 1885                 1890
ctt  gcc gtc agt tca ttc  acc ttt tcc tat att  gct aaa gaa taa     33372
Leu  Ala Val Ser Ser Phe  Thr Phe Ser Tyr Ile  Ala Lys Glu
1895                 1900                 1905
accccactct gtaccccatc tctgtctatg gaaaaaactc tgaaacacaa aataaaataa  33432
agttcaagtg ttttattgat tcaacagttt tacaggattc gagcagttat ttttcctcca  33492
ccctcccagg acatggaata caccaccctc tccccccgca cagccttgaa catctgaatg  33552
ccattggtga tggacatgct tttggtctcc acgttccaca cagtttcaga gcgagccagt  33612
ctcgggtcgg tcagggagat gaaaccctcc gggcactccc gcatctgcac ctcacagctc  33672
aacagctgag gattgtcctc ggtggtcggg atcacggtta tctggaagaa gcagaagagc  33732
ggcggtggga atcatagtcc gcgaacggga tcggccggtg gtgtcgcatc aggccccgca  33792
gcagtcgctg tcgccgccgc tccgtcaagc tgctgctcag ggggtccggg tccagggact  33852
ccctcagcat gatgcccacg gccctcagca tcagtcgtct ggtgcggcgg gcgcagcagc  33912
gcatgcggat ctcgctcagg tcgctgcagt acgtgcaaca caggaccacc aggttgttca  33972
acagtccata gttcaacacg ctccagccga aactcatcgc gggaaggatg ctacccacgt  34032
ggccgtcgta ccagatcctc aggtaaatca agtggcgccc cctccagaac acgctgccca  34092
tgtacatgat ctccttgggc atgtggcggt tcaccacctc ccggtaccac atcaccctct  34152
ggttgaacat gcagccccgg atgatcctgc ggaaccacag ggccagcacc gccccgcccg  34212
ccatgcagcg aagagacccc gggtcccgac aatggcaatg gaggacccac cgctcgtacc  34272
cgtggatcat ctgggagctg aacaagtcta tgttggcaca gcacaggcat atgctcatgc  34332
atctcttcag cactctcagc tcctcggggg tcaaaaccat atcccagggc acggggaact  34392
cttgcaggac agcgaacccc gcagaacagg gcaatcctcg cacataactt acattgtgca  34452
tggacagggt atcgcaatca ggcagcaccg ggtgatcctc caccagagaa gcgcgggtct  34512
cggtctcctc acagcgtggt aagggggccg gccgatacgg gtgatggcgg gacgcggctg  34572
atcgtgttcg cgaccgtgtt atgatgcagt tgctttcgga cattttcgta cttgctgtag  34632
cagaacctgg tccgggcgct gcacaccgat cgccggcggc ggtcccggcg cttggaacgc  34692
tcggtgttga agttgtaaaa cagccactct ctcagaccgt gcagcagatc tagggcctca  34752
ggagtgatga agatcccatc atgcctgatg gctctaatca catcgaccac cgtggaatgg  34812
gccagaccca gccagatgat gcaattttgt tgggtttcgg tgacggcggg ggagggaaga  34872
acaggaagaa ccatgattaa cttttaatcc aaacggtctc ggagcacttc aaaatgaaga  34932
tcgcggagat ggcacctctc gcccccgctg tgttggtgga aaataacagc caggtcaaag  34992
gtgatacggt tctcgagatg ttccacggtg gcttccagca aagcctccac gcgcacatcc  35052
agaaacaaga caatagcgaa agcgggaggg ttctctaatt cctcaatcat catgttacac  35112
tcctgcacca tccccagata attttcattt ttccagcctt gaatgattcg aactagttcc  35172
tgaggtaaat ccaagccagc catgataaag agctcgcgca gagcgccctc caccggcatt  35232
cttaagcaca ccctcataat tccaagatat tctgctcctg gttcacctgc agcagattga  35292
caagcggaat atcaaaatct ctgccgcgat ccctaagctc ctccctcagc aataactgta  35352
agtactcttt catatcctct ccgaaatttt tagccatagg accaccagga ataagattag  35412
ggcaagccac agtacagata aaccgaagtc ctccccagtg agcattgcca aatgcaagac  35472
tgctataagc atgctggcta gacccggtga tatcttccag ataactggac agaaaatcgc  35532
ccaggcaatt tttaagaaaa tcaacaaaag aaaaatcctc caggtgcacg tttagagcct  35592
cgggaacaac gatggagtaa atgcaagcgg tgcgttccag catggttagt tagctgatct  35652
gtagaaaaaa acaaaaatga acattaaacc atgctagcct ggcgaacagg tgggtaaatc  35712
gttctctcca gcaccaggca ggccacgggg tctccggcac gaccctcgta aaaattgtcg  35772
ctatgattga aaaccatcac agagagacgt tcccggtggc cggcgtgaat gattcgacaa  35832
gatgaataca cccccggaac attggcgtcc gcgagtgaaa aaaagcgccc aaggaagcaa  35892
taaggcacta caatgctcag tctcaagtcc agcaaagcga tgccatgcgg atgaagcaca  35952
aaattctcag gtgcgtacaa aatgtaatta ctcccctcct gcacaggcag caaagccccc  36012
gatccctcca ggtacacata caaagcctca gcgtccatag cttaccgagc agcagcacac  36072
aacaggcgca agagtcagag aaaggctgag ctctaacctg tccacccgct ctctgctcaa  36132
tatatagccc agatctacac tgacgtaaag gccaaagtct aaaaataccc gccaaataat  36192
cacacacgcc cagcacacgc ccagaaaccg gtgacacact caaaaaaata cgcgcacttc  36252
ctcaaacgcc caaactgccg tcatttccgg gttcccacgc tacgtcatca aaattcgact  36312
ttcaaattcc gtcgaccgtt aaaaacgtcg cccgccccgc ccctaacggt cgccgctccc  36372
gcagccaatc accgccccgc atccccaaat tcaaatacct catttgcata ttaacgcgca  36432
ccaaaagttt gaggtatatt attgatgatg                                   36462
<210>2
<211>530
<212>PRT
<213>黑猩猩腺病毒血清型Pan5
<400>2
Met Met Arg Arg Val Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser
1               5                   10                  15
Val Met Gln Gln Ala Val Ala Ala Ala Met Gln Pro Pro Leu Glu Ala
            20                  25                  30
Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg Asn Ser
        35                  40                  45
Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Leu Tyr
    50                  55                  60
Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Gln Asn
65                  70                  75                  80
Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Phe Thr
                85                  90                  95
Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg
            100                 105                 110
Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro Asn Val
        115                 120                 125
Asn Glu Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg Val Met Val Ser
    130                 135                 140
Arg Lys Thr Pro Asn Gly Val Thr Val Thr Asp Gly Ser Gln Asp Glu
145                 150                 155                 160
Leu Thr Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly Asn Phe Ser
                165                 170                 175
Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Ile Asp Asn Tyr
            180                 185                 190
Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val
        195                 200                 205
Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Thr Glu
    210                 215                 220
Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile
225                 230                 235                 240
Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Glu Ser Arg Leu Ser
                245                 250                 255
Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Gln
            260                 265                 270
Ile Leu Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp
        275                 280                 285
Val Asp Ala Tyr Glu Lys Ser Lys Glu Asp Ser Ala Ala Ala Ala Thr
    290                 295                 300
Ala Ala Val Ala Thr Ala Ser Thr Glu Val Arg Gly Asp Asn Phe Ala
305                 310                 315                 320
Ser Ala Ala Thr Leu Ala Ala Ala Glu Ala Ala Glu Thr Glu Ser Lys
                325                 330                 335
Ile Val Ile Gln Pro Val Glu Lys Asp Ser Lys Glu Arg Ser Tyr Asn
            340                 345                 350
Val Leu Ala Asp Lys Lys Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala
        355                 360                 365
Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu
    370                 375                 380
Thr Thr Ser Asp Val Thr Cys Gly Val Glu Gln Val Tyr Trp Ser Leu
385                 390                 395                 400
Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val
                405                 410                 415
Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Leu Pro Val Tyr Ser Lys
            420                 425                 430
Ser Phe Phe Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Ala Phe
        435                 440                 445
Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu
    450                 455                 460
Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro
465                 470                 475                 480
Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly
                485                 490                 495
Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr
            500                 505                 510
Val Tyr Lys Ala Leu Gly Val Val Ala Pro Arg Val Leu Ser Ser Arg
        515                 520                 525
Thr Phe
    530
<210>3
<211>933
<212>PRT
<213>黑猩猩腺病毒血清型Pan5
<400>3
Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala
1               5                   10                  15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
            20                  25                  30
Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro
        35                  40                  45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
    50                  55                  60
Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr
65                  70                  75                  80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
                85                  90                  95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
            100                 105                 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
        115                 120                 125
Ala Pro Asn Thr Cys Gln Trp Thr Tyr Lys Ala Asp Gly Asp Thr Gly
    130                 135                 140
Thr Glu Lys Thr Tyr Thr Tyr Gly Asn Ala Pro Val Gln Gly Ile Ser
145                 150                 155                 160
Ile Thr Lys Asp Gly Ile Gln Leu Gly Thr Asp Thr Asp Asp Gln Pro
                165                 170                 175
Ile Tyr Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln Val Gly Asp Ala
            180                 185                 190
Glu Trp His Asp Ile Thr Gly Thr Asp Glu Lys Tyr Gly Gly Arg Ala
        195                 200                 205
Leu Lys Pro Asp Thr Lys Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys
    210                 215                 220
Pro Thr Asn Lys Glu Gly Gly Gln Ala Asn Val Lys Thr Glu Thr Gly
225                 230                 235                 240
Gly Thr Lys Glu Tyr Asp Ile Asp Met Ala Phe Phe Asp Asn Arg Ser
                245                 250                 255
Ala Ala Ala Ala Gly Leu Ala Pro Glu Ile Val Leu Tyr Thr Glu Asn
            260                 265                 270
Val Asp Leu Glu Thr Pro Asp Thr His Ile Val Tyr Lys Ala Gly Thr
        275                 280                 285
Asp Asp Ser Ser Ser Ser Ile Asn Leu Gly Gln Gln Ser Met Pro Asn
    290                 295                 300
Arg Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr
305                 310                 315                 320
Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln
                325                 330                 335
Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr
            340                 345                 350
Gln Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met
        355                 360                 365
Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu
    370                 375                 380
Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asp
385                 390                 395                 400
Ala Val Gly Arg Thr Asp Thr Tyr Gln Gly Ile Lys Ala Asn Gly Ala
                405                 410                 415
Asp Gln Thr Thr Trp Thr Lys Asp Asp Thr Val Asn Asp Ala Asn Glu
            420                 425                 430
Leu Gly Lys Gly Asn Pro Phe Ala Met Glu Ile Asn Ile Gln Ala Asn
        435                 440                 445
Leu Trp Arg Asn Phe Leu Tyr Ala Asn Val Ala Leu Tyr Leu Pro Asp
    450                 455                 460
Ser Tyr Lys Tyr Thr Pro Ala Asn Ile Thr Leu Pro Thr Asn Thr Asn
465                 470                 475                 480
Thr Tyr Asp Tyr Met Asn Gly Arg Val Val Ala Pro Ser Leu Val Asp
                485                 490                 495
Ala Tyr Ile Asn Ile Gly Ala Arg Trp Ser Leu Asp Pro Met Asp Asn
            500                 505                 510
Val Asn Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser
        515                 520                 525
Met Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro
    530                 535                 540
Gln Lys Phe Phe Ala Ile Lys Ser Leu Leu Leu Leu Pro Gly Ser Tyr
545                 550                 555                 560
Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met Ile Leu Gln Ser
                565                 570                 575
Ser Leu Gly Asn Asp Leu Arg Thr Asp Gly Ala Ser Ile Ala Phe Thr
           580                 585                 590
Ser Ile Asn Leu Tyr Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala
        595                 600                 605
Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe
    610                 615                 620
Asn Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn
625                 630                 635                 640
Ala Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe
                645                 650                 655
Arg Gly Trp Ser Phe Thr Arg Leu Lys Thr Arg Glu Thr Pro Ser Leu
            660                 665                 670
Gly Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly Ser Ile Pro Tyr
        675                 680                 685
Leu Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser Ile
    690                 695                 700
Thr Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr
705                 710                 715                 720
Pro Asn Glu Phe Glu Ile Lys Arg Thr Val Asp Gly Glu Gly Tyr Asn
                725                 730                 735
Val Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu Val Gln Met Leu
            740                 745                 750
Ala His Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Val Pro Glu Gly Tyr
        755                 760                 765
Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg
    770                 775                 780
Gln Val Val Asp Glu Val Asn Tyr Lys Asp Tyr Gln Ala Val Thr Leu
785                 790                 795                 800
Ala Tyr Gln His Asn Asn Ser Gly Phe Val Gly Tyr Leu Ala Pro Thr
                805                 810                 815
Met Arg Gln Gly Gln Pro Tyr Pro Ala Asn Tyr Pro Tyr Pro Leu Ile
            820                 825                 830
Gly Lys Ser Ala Val Ala Ser Val Thr Gln Lys Lys Phe Leu Cys Asp
        835                 840                 845
Arg Val Met Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly
    850                 855                 860
Ala Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala Asn Ser Ala His
865                 870                 875                 880
Ala Leu Asp Met Asn Phe Glu yal Asp Pro Met Asp Glu Ser Thr Leu
                885                 890                 895
Leu Tyr Val Val Phe Glu Val Phe Asp Val Val Arg Val His Gln Pro
            900                 905                 910
His Arg Gly Val Ile Glu Ala Val Tyr Leu Arg Thr Pro Phe Ser Ala
        915                 920                 925
Gly Asn Ala Thr Thr
    930
<210>4
<211>445
<212>PRT
<213>黑猩猩腺病毒血清型Pan5
<400>4
Met Ser Lys Lys Arg Val Arg Val Asp Asp Asp Phe Asp Pro Val Tyr
1               5                   10                  15
Pro Tyr Asp Ala Asp Asn Ala Pro Thr Val Pro Phe Ile Asn Pro Pro
            20                  25                  30
Phe Val Ser Ser Asp Gly Phe Gln Glu Lys Pro Leu Gly Val Leu Ser
        35                  40                  45
Leu Arg Leu Ala Asp Pro Val Thr Thr Lys Asn Gly Glu Ile Thr Leu
    50                  55                  60
Lys Leu Gly Asp Gly Val Asp Leu Asp Ser Ser Gly Lys Leu Ile Ser
65                  70                  75                  80
Asn Thr Ala Thr Lys Ala Ala Ala Pro Leu Ser Phe Ser Asn Asn Thr
                85                  90                  95
Ile Ser Leu Asn Met Asp Thr Pro Phe Tyr Asn Asn Asn Gly Lys Leu
            100                 105                 110
Gly Met Lys Val Thr Ala Pro Leu Lys Ile Leu Asp Thr Asp Leu Leu
        115                 120                 125
Lys Thr Leu Val Val Ala Tyr Gly Gln Gly Leu Gly Thr Asn Thr Thr
    130                 135                 140
Gly Ala Leu yal Ala Gln Leu Ala Ser Pro Leu Ala Phe Asp Ser Asn
145                 150                 155                 160
Ser Lys Ile Ala Leu Asn Leu Gly Asn Gly Pro Leu Lys Val Asp Ala
                165                 170                 175
Asn Arg Leu Asn Ile Asn Cys Asn Arg Gly Leu Tyr Val Thr Thr Thr
            180                 185                 190
Lys Asp Ala Leu Glu Ala Asn Ile Ser Trp Ala Asn Ala Met Thr Phe
        195                 200                 205
Ile Gly Asn Ala Met Gly Val Asn Ile Asp Thr Gln Lys Gly Leu Gln
    210                 215                 220
Phe Gly Thr Thr Ser Thr Val Ala Asp Val Lys Asn Ala Tyr Pro Ile
225                 230                 235                 240
Gln Ile Lys Leu Gly Ala Gly Leu Thr Phe Asp Ser Thr Gly Ala Ile
                245                 250                 255
Val Ala Trp Asn Lys Asp Asp Asp Lys Leu Thr Leu Trp Thr Thr Ala
            260                 265                 270
Asp Pro Ser Pro Asn Cys His Ile Tyr Ser Glu Lys Asp Ala Lys Leu
        275                 280                 285
Thr Leu Cys Leu Thr Lys Cys Gly Ser Gln Ile Leu Gly Thr Val Ser
    290                 295                 300
Leu Ile Ala Val Asp Thr Gly Ser Leu Asn Pro Ile Thr Gly Thr Val
305                 310                 315                 320
Thr Thr Ala Leu Val Ser Leu Lys Phe Asp Ala Asn Gly Val Leu Gln
                325                 330                 335
Ser Ser Ser Thr Leu Asp Ser Asp Tyr Trp Asn Phe Arg Gln Gly Asp
            340                 345                 350
Val Thr Pro Ala Glu Ala Tyr Thr Asn Ala Ile Gly Phe Met Pro Asn
        355                 360                 365
Leu Lys Ala Tyr Pro Lys Asn Thr Ser Gly Ala Ala Lys Ser His Ile
    370                 375                 380
Val Gly Lys Val Tyr Leu His Gly Asp Thr Gly Lys Pro Leu Asp Leu
385                 390                 395                 400
Ile Ile Thr Phe Asn Glu Thr Ser Asp Glu Ser Cys Thr Tyr Cys Ile
                405                 410                 415
Asn Phe Gln Trp Gln Trp Gly Ala Asp Gln Tyr Lys Asn Glu Thr Leu
            420                 425                 430
Ala Val Ser Ser Phe Thr Phe Ser Tyr Ile Ala Lys Glu
        435                 440                 445
<210>5
<211>36604
<212>DNA
<213>黑猩猩腺病毒血清型Pan6
<220>
<221>CDS
<222>(13878)..(15467)
<223>L2五邻体
<220>
<221>CDS
<222>(18284)..(21112)
<223>L3六邻体
<220>
<221>CDS
<222>(32162)..(33493)
<223>L5纤维
<400>5
catcatcaat aatatacctc aaacttttgg tgcgcgttaa tatgcaaatg agctgtttga   60
atttggggag ggaggaaggt gattggctgc gggagcggcg accgttaggg gcggggcggg  120
tgacgttttg atgacgtggc tatgaggcgg agccggtttg caagttctcg tgggaaaagt  180
gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca  240
ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg  300
aatgaggaag tgaaaatctg agtaatttcg cgtttatggc agggaggagt atttgccgag  360
ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtatttt tcacctaaat  420
ttccgcgtac ggtgtcaaag tccggtgttt ttacgtaggc gtcagctgat cgccagggta  480
tttaaacctg cgctctctag tcaagaggcc actcttgagt gccagcgagt agagttttct     540
cctccgcgcc gcgagtcaga tctacacttt gaaagatgag gcacctgaga gacctgcccg     600
gtaatgtttt cctggctact gggaacgaga ttctggaatt ggtggtggac gccatgatgg     660
gtgacgaccc tccagagccc cctaccccat ttgaggcgcc ttcgctgtac gatttgtatg     720
atctggaggt ggatgtgccc gagagcgacc ctaacgagga ggcggtgaat gatttgttta     780
gcgatgccgc gctgctggct gccgagcagg ctaatacgga ctctggctca gacagcgatt     840
cctctctcca taccccgaga cccggcagag gtgagaaaaa gatccccgag cttaaagggg     900
aagagctcga cctgcgctgc tatgaggaat gcttgcctcc gagcgatgat gaggaggacg     960
aggaggcgat tcgagctgcg gtgaaccagg gagtgaaaac tgcgggcgag agctttagcc    1020
tggactgtcc tactctgccc ggacacggct gtaagtcttg tgaatttcat cgcatgaata    1080
ctggagataa gaatgtgatg tgtgccctgt gctatatgag agcttacaac cattgtgttt    1140
acagtaagtg tgattaactt tagttgggaa ggcagagggt gactgggtgc tgactggttt    1200
atttatgtat atgttttttt atgtgtaggt cccgtctctg acgtagatga gacccccact    1260
tcagagtgca tttcatcacc cccagaaatt ggcgaggaac cgcccgaaga tattattcat    1320
agaccagttg cagtgagagt caccgggcgg agagcagctg tggagagttt ggatgacttg    1380
ctacagggtg gggatgaacc tttggacttg tgtacccgga aacgccccag gcactaagtg    1440
ccacacatgt gtgtttactt aaggtgatgt cagtatttat agggtgtgga gtgcaataaa    1500
atccgtgttg actttaagtg cgtgttttat gactcagggg tggggactgt gggtatataa    1560
gcaggtgcag acctgtgtgg tcagttcaga gcaggactca tggagatctg gactgtcttg    1620
gaagactttc accagactag acagttgcta gagaactcat cggagggagt ctcttacctg    1680
tggagattct gcttcggtgg gcctctagct aagctagtct atagggccaa acaggattat    1740
aaggaacaat ttgaggatat tttgagagag tgtcctggta tttttgactc tctcaacttg    1800
ggccatcagt ctcactttaa ccagagtatt ctgagagccc ttgacttttc tactcctggc    1860
agaactaccg ccgcggtagc cttttttgcc tttattcttg acaaatggag tcaagaaacc    1920
catttcagca gggattaccg tctggactgc ttagcagtag ctttgtggag aacatggagg    1980
tgccagcgcc tgaatgcaat ctccggctac ttgccagtac agccggtaga cacgctgagg    2040
atcctgagtc tccagtcacc ccaggaacac caacgccgcc agcagccgca gcaggagcag    2100
cagcaagagg aggaccgaga agagaacccg agagccggtc tggaccctcc ggtggcggag    2160
gaggaggagt agctgacttg tttcccgagc tgcgccgggt gctgactagg tcttccagtg    2220
gacgggagag ggggattaag cgggagaggc atgaggagac tagccacaga actgaactga    2280
ctgtcagtct gatgagccgc aggcgcccag aatcggtgtg gtggcatgag gtgcagtcgc    2340
aggggataga tgaggtctcg gtgatgcatg agaaatattc cctagaacaa gtcaagactt    2400
gttggttgga gcccgaggat gattgggagg tagccatcag gaattatgcc aagctggctc    2460
tgaagccaga caagaagtac aagattacca aactgattaa tatcagaaat tcctgctaca    2520
tttcagggaa tggggccgag gtggagatca gtacccagga gagggtggcc ttcagatgtt    2580
gtatgatgaa tatgtacccg ggggtggtgg gcatggaggg agtcaccttt atgaacacga    2640
ggttcagggg tgatgggtat aatggggtgg tctttatggc caacaccaag ctgacagtgc    2700
acggatgctc cttctttggc ttcaataaca tgtgcatcga ggcctggggc agtgtttcag    2760
tgaggggatg cagcttttca gccaactgga tgggggtcgt gggcagaacc aagagcaagg    2820
tgtcagtgaa gaaatgcctg ttcgagaggt gccacctggg ggtgatgagc gagggcgaag    2880
ccaaagtcaa acactgcgcc tctaccgaga cgggctgctt tgtgctgatc aagggcaatg    2940
cccaagtcaa gcataacatg atctgtgggg cctcggatga gcgcggctac cagatgctga    3000
cctgcgccgg tgggaacagc catatgctgg ccaccgtgca tgtggcctcg cacccccgca    3060
agacatggcc cgagttcgag cacaacgtca tgacccgctg caatgtgcac ctgggctccc    3120
gccgaggcat gttcatgccc taccagtgca acatgcaatt tgtgaaggtg ctgctggagc    3180
ccgatgccat gtccagagtg agcctgacgg gggtgtttga catgaatgtg gagctgtgga    3240
aaattctgag atatgatgaa tccaagacca ggtgccgggc ctgcgaatgc ggaggcaagc    3300
acgccaggct tcagcccgtg tgtgtggagg tgacggagga cctgcgaccc gatcatttgg    3360
tgttgtcctg caacgggacg gagttcggct ccagcgggga agaatctgac tagagtgagt    3420
agtgtttggg gctgggtgtg agcctgcatg aggggcagaa tgactaaaat ctgtggtttt    3480
ctgtgtgttg cagcagcatg agcggaagcg cctcctttga gggaggggta ttcagccctt    3540
atctgacggg gcgtctcccc tcctgggcgg gagtgcgtca gaatgtgatg ggatccacgg    3600
tggacggccg gcccgtgcag cccgcgaact cttcaaccct gacctacgcg accctgagct    3660
cctcgtccgt ggacgcagct gccgccgcag ctgctgcttc cgccgccagc gccgtgcgcg    3720
gaatggccct gggcgccggc tactacagct ctctggtggc caactcgagt tccaccaata    3780
atcccgccag cctgaacgag gagaagctgc tgctgctgat ggcccagctc gaggccctga    3840
cccagcgcct gggcgagctg acccagcagg tggctcagct gcaggcggag acgcgggccg    3900
cggttgccac ggtgaaaacc aaataaaaaa tgaatcaata aataaacgga gacggttgtt    3960
gattttaaca cagagtcttg aatctttatt tgatttttcg cgcgcggtag gccctggacc    4020
accggtctcg atcattgagc acccggtgga tcttttccag gacccggtag aggtgggctt    4080
ggatgttgag gtacatgggc atgagcccgt cccgggggtg gaggtagctc cattgcaggg    4140
cctcgtgctc ggggatggtg ttgtaaatca cccagtcata gcaggggcgc agggcgtggt    4200
gctgcacgat gtccttgagg aggagactga tggccacggg cagccccttg gtgtaggtgt    4260
tgacgaacct gttgagctgg gagggatgca tgcgggggga gatgagatgc atcttggcct    4320
ggatcttgag attggcgatg ttcccgccca gatcccgccg ggggttcatg ttgtgcagga    4380
ccaccagcac ggtgtatccg gtgcacttgg ggaatttgtc atgcaacttg gaagggaagg    4440
cgtgaaagaa tttggagacg cccttgtgac cgcccaggtt ttccatgcac tcatccatga    4500
tgatggcgat gggcccgtgg gcggcggcct gggcaaagac gtttcggggg tcggacacat    4560
cgtagttgtg gtcctgggtg agctcgtcat aggccatttt aatgaatttg gggcggaggg    4620
tgcccgactg ggggacgaag gtgccctcga tcccgggggc gtagttgccc tcgcagatct    4680
gcatctccca ggccttgagc tcggaggggg ggatcatgtc cacctgcggg gcgatgaaaa    4740
aaacggtttc cggggcgggg gagatgagct gggccgaaag caggttccgg agcagctggg    4800
acttgccgca accggtgggg ccgtagatga ccccgatgac cggctgcagg tggtagttga    4860
gggagagaca gctgccgtcc tcgcggagga ggggggccac ctcgttcatc atctcgcgca    4920
catgcatgtt ctcgcgcacg agttccgcca ggaggcgctc gccccccagc gagaggagct    4980
cttgcagcga ggcgaagttt ttcagcggct tgagtccgtc ggccatgggc attttggaga    5040
gggtctgttg caagagttcc agacggtccc agagctcggt gatgtgctct agggcatctc    5100
gatccagcag acctcctcgt ttcgcgggtt ggggcgactg cgggagtagg gcaccaggcg    5160
atgggcgtcc agcgaggcca gggtccggtc cttccagggc cgcagggtcc gcgtcagcgt    5220
ggtctccgtc acggtgaagg ggtgcgcgcc gggctgggcg cttgcgaggg tgcgcttcag    5280
gctcatccgg ctggtcgaga accgctcccg gtcggcgccc tgcgcgtcgg ccaggtagca    5340
attgagcatg agttcgtagt tgagcgcctc ggccgcgtgg cccttggcgc ggagcttacc    5400
tttggaagtg tgtccgcaga cgggacagag gagggacttg agggcgtaga gcttgggggc    5460
gaggaagacg gactcggggg cgtaggcgtc cgcgccgcag ctggcgcaga cggtctcgca    5520
ctccacgagc caggtgaggt cggggcggtt ggggtcaaaa acgaggtttc ctccgtgctt    5580
tttgatgcgt ttcttacctc tggtctccat gagctcgtgt ccccgctggg tgacaaagag    5640
gctgtccgtg tccccgtaga ccgactttat gggccggtcc tcgagcgggg tgccgcggtc    5700
ctcgtcgtag aggaaccccg cccactccga gacgaaggcc cgggtccagg ccagcacgaa    5760
ggaggccacg tgggaggggt agcggtcgtt gtccaccagc gggtccacct tctccagggt    5820
atgcaagcac atgtccccct cgtccacatc caggaaggtg attggcttgt aagtgtaggc    5880
cacgtgaccg ggggtcccgg ccgggggggt ataaaagggg gcgggcccct gctcgtcctc    5940
actgtcttcc ggatcgctgt ccaggagcgc cagctgttgg ggtaggtatt ccctctcgaa    6000
ggcgggcatg acctcggcac tcaggttgtc agtttctaga aacgaggagg atttgatatt    6060
gacggtgccg ttggagacgc ctttcatgag cccctcgtcc atttggtcag aaaagacgat    6120
ctttttgttg tcgagcttgg tggcgaagga gccgtagagg gcgttggaga gcagcttggc    6180
gatggagcgc atggtctggt tcttttcctt gtcggcgcgc tccttggcgg cgatgttgag    6240
ctgcacgtac tcgcgcgcca cgcacttcca ttcggggaag acggtggtga gctcgtcggg    6300
cacgattctg acccgccagc cgcggttgtg cagggtgatg aggtccacgc tggtggccac    6360
ctcgccgcgc aggggctcgt tggtccagca gaggcgcccg cccttgcgcg agcagaaggg    6420
gggcagcggg tccagcatga gctcgtcggg ggggtcggcg tccacggtga agatgccggg    6480
caggagctcg gggtcgaagt agctgatgca ggtgcccaga ttgtccagcg ccgcttgcca    6540
gtcgcgcacg gccagcgcgc gctcgtaggg gctgaggggc gtgccccagg gcatggggtg    6600
cgtgagcgcg gaggcgtaca tgccgcagat gtcgtagacg tagaggggct cctcgaggac    6660
gccgatgtag gtggggtagc agcgcccccc gcggatgctg gcgcgcacgt agtcgtacag    6720
ctcgtgcgag ggcgcgagga gccccgtgcc gaggttggag cgttgcggct tttcggcgcg    6780
gtagacgatc tggcggaaga tggcgtggga gttggaggag atggtgggcc tttggaagat    6840
gttgaagtgg gcgtggggca ggccgaccga gtccctgatg aagtgggcgt aggagtcctg    6900
cagcttggcg acgagctcgg cggtgacgag gacgtccagg gcgcagtagt cgagggtctc    6960
ttggatgatg tcatacttga gctggccctt ctgcttccac agctcgcggt tgagaaggaa    7020
ctcttcgcgg tccttccagt actcttcgag ggggaacccg tcctgatcgg cacggtaaga    7080
gcccaccatg tagaactggt tgacggcctt gtaggcgcag cagcccttct ccacggggag    7140
ggcgtaagct tgcgcggcct tgcgcaggga ggtgtgggtg agggcgaagg tgtcgcgcac    7200
catgaccttg aggaactggt gcttgaagtc gaggtcgtcg cagccgccct gctcccagag    7260
ttggaagtcc gtgcgcttct tgtaggcggg gttaggcaaa gcgaaagtaa catcgttgaa    7320
gaggatcttg cccgcgcggg gcatgaagtt gcgagtgatg cggaaaggct ggggcacctc    7380
ggcccggttg ttgatgacct gggcggcgag gacgatctcg tcgaagccgt tgatgttgtg    7440
cccgacgatg tagagttcca cgaatcgcgg gcggcccttg acgtggggca gcttcttgag    7500
ctcgtcgtag gtgagctcgg cggggtcgct gagcccgtgc tgctcgaggg cccagtcggc    7560
gacgtggggg ttggcgctga ggaaggaagt ccagagatcc acggccaggg cggtctgcaa    7620
gcggtcccgg tactgacgga actgttggcc cacggccatt ttttcggggg tgacgcagta    7680
gaaggtgcgg gggtcgccgt gccagcggtc ccacttgagc tggagggcga ggtcgtgggc    7740
gagctcgacg agcggcgggt ccccggagag tttcatgacc agcatgaagg ggacgagctg    7800
cttgccgaag gaccccatcc aggtgtaggt ttccacatcg taggtgagga agagcctttc    7860
ggtgcgagga tgcgagccga tggggaagaa ctggatctcc tgccaccagt tggaggaatg    7920
gctgttgatg tgatggaagt agaaatgccg acggcgcgcc gagcactcgt gcttgtgttt    7980
atacaagcgt ccgcagtgct cgcaacgctg cacgggatgc acgtgctgca cgagctgtac    8040
ctgggttcct ttggcgagga atttcagtgg gcagtggagc gctggcggct gcatctcgtg    8100
ctgtactacg tcttggccat cggcgtggcc atcgtctgcc tcgatggtgg tcatgctgac    8160
gagcccgcgc gggaggcagg tccagacctc ggctcggacg ggtcggagag cgaggacgag    8220
ggcgcgcagg ccggagctgt ccagggtcct gagacgctgc ggagtcaggt cagtgggcag    8280
cggcggcgcg cggttgactt gcaggagctt ttccagggcg cgcgggaggt ccagatggta    8340
cttgatctcc acggcgccgt tggtggctac gtccacggct tgcagggtgc cgtgcccctg    8400
gggcgccacc accgtgcccc gtttcttctt gggcgctgct tccatgtcgg tcagaagcgg    8460
cggcgaggac gcgcgccggg cggcaggggc ggctcggggc ccggaggcag gggcggcagg    8520
ggcacgtcgg cgccgcgcgc gggcaggttc tggtactgcg cccggagaag actggcgtga    8580
gcgacgacgc gacggttgac gtcctggatc tgacgcctct gggtgaaggc cacgggaccc    8640
gtgagtttga acctgaaaga gagttcgaca gaatcaatct cggtatcgtt gacggcggcc    8700
tgccgcagga tctcttgcac gtcgcccgag ttgtcctggt aggcgatctc ggtcatgaac    8760
tgctcgatct cctcctcctg aaggtctccg cggccggcgc gctcgacggt ggccgcgagg    8820
tcgttggaga tgcggcccat gagctgcgag aaggcgttca tgccggcctc gttccagacg    8880
cggctgtaga ccacggctcc gtcggggtcg cgcgcgcgca tgaccacctg ggcgaggttg    8940
agctcgacgt ggcgcgtgaa gaccgcgtag ttgcagaggc gctggtagag gtagttgagc    9000
gtggtggcga tgtgctcggt gacgaagaag tacatgatcc agcggcggag cggcatctcg    9060
ctgacgtcgc ccagggcttc caagcgttcc atggcctcgt agaagtccac ggcgaagttg    9120
aaaaactggg agttgcgcgc cgagacggtc aactcctcct ccagaagacg gatgagctcg    9180
gcgatggtgg cgcgcacctc gcgctcgaag gccccggggg gctcctcttc catctcctcc    9240
tcttcctcct ccactaacat ctcttctact tcctcctcag gaggcggtgg cgggggaggg    9300
gccctgcgtc gccggcggcg cacgggcaga cggtcgatga agcgctcgat ggtctccccg    9360
cgccggcgac gcatggtctc ggtgacggcg cgcccgtcct cgcggggccg cagcatgaag    9420
acgccgccgc gcatctccag gtggccgccg ggggggtctc cgttgggcag ggagagggcg    9480
ctgacgatgc atcttatcaa ttgacccgta gggactccgc gcaaggacct gagcgtctcg    9540
agatccacgg gatccgaaaa ccgctgaacg aaggcttcga gccagtcgca gtcgcaaggt    9600
aggctgagcc cggtttcttg ttcttcgggt atttggtcgg gaggcgggcg ggcgatgctg    9660
ctggtgatga agttgaagta ggcggtcctg agacggcgga tggtggcgag gagcaccagg    9720
tccttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc gtggtcctga    9780
cacctggcga ggtccttgta gtagtcctgc atgagccgct ccacgggcac ctcctcctcg    9840
cccgcgcggc cgtgcatgcg cgtgagcccg aacccgcgct gcggctggac gagcgccagg    9900
tcggcgacga cgcgctcggt gaggatggcc tgctggatct gggtgagggt ggtctggaag    9960
tcgtcgaagt cgacgaagcg gtggtaggct ccggtgttga tggtgtagga gcagttggcc   10020
atgacggacc agttgacggt ctggtggccg ggtcgcacga gctcgtggta cttgaggcgc   10080
gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggcgc gcacgaggta ctggtatccg   10140
acgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc gggggcgccg   10200
ggcgcgaggt cctcgagcat gaggcggtgg tagccgtaga tgtacctgga catccaggtg   10260
atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca gatgttgcgc   10320
agcggcagga agtagttcat ggtggccgcg gtctggcccg tgaggcgcgc gcagtcgtgg   10380
atgctctaga catacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag   10440
gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag   10500
ccgcagctaa cgtggtactg gcactcccgt ctcgacccaa gcctgctaac gaaacctcca   10560
ggatacggag gcgggtcgtt ttttggcctt ggtcgctggt catgaaaaac tagtaagcgc   10620
ggaaagcggc cgcccgcgat ggctcgctgc cgtagtctgg agaaagaatc gccagggttg   10680
cgttgcggtg tgccccggtt cgagcctcag cgctcggcgc cggccggatt ccgcggctaa   10740
cgtgggcgtg gctgccccgt cgtttccaag accccttagc cagccgactt ctccagttac   10800
ggagcgagcc cctctttttt tttcttgtgt ttttgccaga tgcatcccgt actgcggcag   10860
atgcgccccc accctccacc acaaccgccc ctaccgcagc agcagcaaca gccggcgctt   10920
ctgcccccgc cccagcagca gccagccact accgcggcgg ccgccgtgag cggagccggc   10980
gttcagtatg acctggcctt ggaagagggc gaggggctgg cgcggctggg ggcgtcgtcg   11040
ccggagcggc acccgcgcgt gcagatgaaa agggacgctc gcgaggccta cgtgcccaag   11100
cagaacctgt tcagagacag gagcggcgag gagcccgagg agatgcgcgc ctcccgcttc   11160
cacgcggggc gggagctgcg gcgcggcctg gaccgaaagc gggtgctgag ggacgaggat   11220
ttcgaggcgg acgagctgac ggggatcagc cccgcgcgcg cgcacgtggc cgcggccaac   11280
ctggtcacgg cgtacgagca gaccgtgaag gaggagagca acttccaaaa atccttcaac   11340
aaccacgtgc gcacgctgat cgcgcgcgag gaggtgaccc tgggcctgat gcacctgtgg   11400
gacctgctgg aggccatcgt gcagaacccc acgagcaagc cgctgacggc gcagctgttt   11460
ctggtggtgc agcacagtcg ggacaacgag acgttcaggg aggcgctgct gaatatcacc   11520
gagcccgagg gccgctggct cctggacctg gtgaacattt tgcagagcat cgtggtgcag   11580
gagcgcgggc tgccgctgtc cgagaagctg gcggccatca acttctcggt gctgagtctg   11640
ggcaagtact acgctaggaa gatctacaag accccgtacg tgcccataga caaggaggtg   11700
aagatcgacg ggttttacat gcgcatgacc ctgaaagtgc tgaccctgag cgacgatctg   11760
ggggtgtacc gcaacgacag gatgcaccgc gcggtgagcg ccagccgccg gcgcgagctg   11820
agcgaccagg agctgatgca cagcctgcag cgggccctga ccggggccgg gaccgagggg   11880
gagagctact ttgacatggg cgcggacctg cgctggcagc ccagccgccg ggccttggaa   11940
gctgccggcg gttcccccta cgtggaggag gtggacgatg aggaggagga gggcgagtac   12000
ctggaagact gatggcgcga ccgtattttt gctagatgca gcaacagcca ccgccgccgc   12060
ctcctgatcc cgcgatgcgg gcggcgctgc agagccagcc gtccggcatt aactcctcgg   12120
acgattggac ccaggccatg caacgcatca tggcgctgac gacccgcaat cccgaagcct   12180
ttagacagca gcctcaggcc aaccggctct cggccatcct ggaggccgtg gtgccctcgc   12240
gctcgaaccc cacgcacgag aaggtgctgg ccatcgtgaa cgcgctggtg gagaacaagg   12300
ccatccgcgg tgacgaggcc gggctggtgt acaacgcgct gctggagcgc gtggcccgct   12360
acaacagcac caacgtgcag acgaacctgg accgcatggt gaccgacgtg cgcgaggcgg   12420
tgtcgcagcg cgagcggttc caccgcgagt cgaacctggg ctccatggtg gcgctgaacg   12480
ccttcctgag cacgcagccc gccaacgtgc cccggggcca ggaggactac accaacttca   12540
tcagcgcgct gcggctgatg gtggccgagg tgccccagag cgaggtgtac cagtcggggc   12600
cggactactt cttccagacc agtcgccagg gcttgcagac cgtgaacctg agccaggctt   12660
tcaagaactt gcagggactg tggggcgtgc aggccccggt cggggaccgc gcgacggtgt   12720
cgagcctgct gacgccgaac tcgcgcctgc tgctgctgct ggtggcgccc ttcacggaca   12780
gcggcagcgt gagccgcgac tcgtacctgg gctacctgct taacctgtac cgcgaggcca   12840
tcggacaggc gcacgtggac gagcagacct accaggagat cacccacgtg agccgcgcgc   12900
tgggccagga ggacccgggc aacctggagg ccaccctgaa cttcctgctg accaaccggt   12960
cgcagaagat cccgccccag tacgcgctga gcaccgagga ggagcgcatc ctgcgctacg   13020
tgcagcagag cgtggggctg ttcctgatgc aggagggggc cacgcccagc gcggcgctcg   13080
acatgaccgc gcgcaacatg gagcccagca tgtacgcccg caaccgcccg ttcatcaata   13140
agctgatgga ctacttgcat cgggcggccg ccatgaactc ggactacttt accaacgcca   13200
tcttgaaccc gcactggctc ccgccgcccg ggttctacac gggcgagtac gacatgcccg   13260
accccaacga cgggttcctg tgggacgacg tggacagcag cgtgttctcg ccgcgtccag   13320
gaaccaatgc cgtgtggaag aaagagggcg gggaccggcg gccgtcctcg gcgctgtccg   13380
gtcgcgcggg tgctgccgcg gcggtgcccg aggccgccag ccccttcccg agcctgccct   13440
tttcgctgaa cagcgtgcgc agcagcgagc tgggtcggct gacgcgaccg cgcctgctgg   13500
gcgaggagga gtacctgaac gactccttgt tgaggcccga gcgcgagaag aacttcccca   13560
ataacgggat agagagcctg gtggacaaga tgagccgctg gaagacgtac gcgcacgagc   13620
acagggacga gccccgagct agcagcgcag gcacccgtag acgccagcgg cacgacaggc   13680
agcggggact ggtgtgggac gatgaggatt ccgccgacga cagcagcgtg ttggacttgg   13740
gtgggagtgg tggtaacccg ttcgctcacc tgcgcccccg tatcgggcgc ctgatgtaag   13800
aatctgaaaa aataaaagac ggtactcacc aaggccatgg cgaccagcgt gcgttcttct   13860
ctgttgtttg tagtagt atg atg agg cgc gtg tac ccg gag ggt cct cct      13910
                   Met Met Arg Arg Val Tyr Pro Glu Gly Pro Pro
                   1               5                   10
ccc tcg tac gag agc gtg atg cag cag gcg gtg gcg gcg gcg atg cag     13958
Pro Ser Tyr Glu Ser Val Met Gln Gln Ala Val Ala Ala Ala Met Gln
            15                  20                  25
ccc ccg ctg gag gcg cct tac gtg ccc ccg cgg tac ctg gcg cct acg     14006
Pro Pro Leu Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr
        30                  35                  40
gag ggg cgg aac agc att cgt tac tcg gag ctg gca ccc ttg tac gat    14054
Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp
    45                  50                  55
acc acc cgg ttg tac ctg gtg gac aac aag tcg gca gac atc gcc tcg    14102
Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser
60                  65                  70                  75
ctg aac tac cag aac gac cac agc aac ttc ctg acc acc gtg gtg cag    14150
Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln
                80                  85                  90
aac aac gat ttc acc ccc acg gag gcc agc acc cag acc atc aac ttt    14198
Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe
            95                  100                 105
gac gag cgc tcg cgg tgg ggc ggc cag ctg aaa acc atc atg cac acc    14246
Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr
        110                 115                 120
aac atg ccc aac gtg aac gag ttc atg tac agc aac aag ttc aag gcg    14294
Asn Met Pro Asn Val Asn Glu Phe Met Tyr Ser Asn Lys Phe Lys Ala
    125                 130                 135
cgg gtg atg gtc tcg cgc aag acc ccc aac ggg gtg gat gat gat tat    14342
Arg Val Met Val Ser Arg Lys Thr Pro Asn Gly Val Asp Asp Asp Tyr
140                 145                 150                 155
gat ggt agt cag gac gag ctg acc tac gag tgg gtg gag ttt gag ctg    14390
Asp Gly Ser Gln Asp Glu Leu Thr Tyr Glu Trp Val Glu Phe Glu Leu
                160                 165                 170
ccc gag ggc aac ttc tcg gtg acc atg acc atc gat ctg atg aac aac    14438
Pro Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp Leu Met Asn Asn
            175                 180                 185
gcc atc atc gac aac tac ttg gcg gtg ggg cgg cag aac ggg gtg ctg    14486
Ala Ile Ile Asp Asn Tyr Leu Ala Val Gly Arg Gln Asn GlyVal Leu
        190                 195                 200
gag agc gac atc ggc gtg aag ttc gac acg cgc aac ttc cgg ctg ggc    14534
Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly
    205                 210                 215
tgg gac ccc gtg acc gag ctg gtg atg ccg ggc gtg tac acc aac gag    14582
Trp Asp Pro Val Thr Glu Leu Val Met Pro Gly Val Tyr Thr Asn Glu
220                 225230                 235
gcc ttc cac ccc gac atc gtc ctg ctg ccc ggc tgc ggc gtg gac ttc    14630
Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe
                240                 245                 250
acc gag agc cgc ctc agc aac ctg ctg ggc atc cgc aag cgg cag ccc    14678
Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro
            255                 260                 265
ttc cag gag ggc ttc cag atc ctg tac gag gac ctg gag ggg ggc aac    14726
Phe Gln Glu Gly Phe Gln Ile Leu Tyr Glu Asp Leu Glu Gly Gly Asn
        270                 275                 280
atc ccc gcg ctc ttg gat gtc gaa gcc tac gag aaa agc aag gag gat    14774
Ile Pro Ala Leu Leu Asp Val Glu Ala Tyr Glu Lys Ser Lys Glu Asp
    285                 290                 295
agc acc gcc gcg gcg acc gca gcc gtg gcc acc gcc tct acc gag gtg    14822
Ser Thr Ala Ala Ala Thr Ala Ala Val Ala Thr Ala Ser Thr Glu Val
300                 305                 310                 315
cgg ggc gat aat ttt gct agc gct gcg gca gcg gcc gag gcg gct gaa    14870
Arg Gly Asp Asn Phe Ala Ser Ala Ala Ala Ala Ala Glu Ala Ala Glu
                320                 325                 330
acc gaa agt aag ata gtc atc cag ccg gtg gag aag gac agc aag gac    14918
Thr Glu Ser Lys Ile Val Ile Gln Pro Val Glu Lys Asp Ser Lys Asp
            335                 340                 345
agg agc tac aac gtg ctc gcg gac aag aaa aac acc gcc tac cgc agc    14966
Arg Ser Tyr Asn Val Leu Ala Asp Lys Lys Asn Thr Ala Tyr Arg Ser
        350                 355                 360
tgg tac ctg gcc tac aac tac ggc gac ccc gag aag ggc gtg cgc tcc    15014
Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly yal Arg Ser
    365                 370                 375
tgg acg ctg ctc acc acc tcg gac gtc acc tgc ggc gtg gag caa gtc    15062
Trp Thr Leu Leu Thr Thr Ser Asp Val Thr Cys Gly Val Glu Gln Val
380                 385                 390                 395
tac tgg tcg ctg ccc gac atg atg caa gac ccg gtc acc ttc cgc tcc    15110
Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser
                400                 405                 410
acg cgt caa gtt agc aac tac ccg gtg gtg ggc gcc gag ctc ctg ccc    15158
Thr Arg Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Leu Pro
            415                 420                 425
gtc tac tcc aag agc ttc ttc aac gag cag gcc gtc tac tcg cag cag    15206
Val Tyr Ser Lys Ser Phe Phe Asn Glu Gln Ala Val Tyr Ser Gln Gln
        430                 435                 440
ctg cgc gcc ttc acc tcg ctc acg cac gtc ttc aac cgc ttc ccc gag    15254
Leu Arg Ala Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu
    445                 450                 455
aac cag atc ctc gtc cgc ccg ccc gcg ccc acc att acc acc gtc agt    15302
Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser
460                 465                 470                 475
gaa aac gtt cct gct ctc aca gat cac ggg acc ctg ccg ctg cgc agc    15350
Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser
                480                 485                 490
agt atc cgg gga gtc cag cgc gtg acc gtc act gac gcc aga cgc cgc    15398
Ser Ile Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg
            495                 500                 505
acc tgc ccc tac gtc tac aag gcc ctg ggc gta gtc gcg ccg cgc gtc    15446
Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Val Val Ala Pro Arg Val
        510                 515                 520
ctc tcg agc cgc acc ttc taa aaaatgtcca ttctcatctc gcccagtaat       15497
Leu Ser Ser Arg Thr Phe
    525
aacaccggtt ggggcctgcg cgcgcccagc aagatgtacg gaggcgctcg ccaacgctcc  15557
acgcaacacc ccgtgcgcgt gcgcgggcac ttccgcgctc cctggggcgc cctcaagggc  15617
cgcgtgcgct cgcgcaccac cgtcgacgac gtgatcgacc aggtggtggc cgacgcgcgc  15677
aactacacgc ccgccgccgc gcccgtctcc accgtggacg ccgtcatcga cagcgtggtg  15737
gccgacgcgc gccggtacgc ccgcaccaag agccggcggc ggcgcatcgc ccggcggcac  15797
cggagcaccc ccgccatgcg cgcggcgcga gccttgctgc gcagggccag gcgcacggga  15857
cgcagggcca tgctcagggc ggccagacgc gcggcctccg gcagcagcag cgccggcagg  15917
acccgcagac gcgcggccac ggcggcggcg gcggccatcg ccagcatgtc ccgcccgcgg  15977
cgcggcaacg tgtactgggt gcgcgacgcc gccaccggtg tgcgcgtgcc cgtgcgcacc  16037
cgcccccctc gcacttgaag atgctgactt cgcgatgttg atgtgtccca gcggcgagga  16097
ggatgtccaa gcgcaaatac aaggaagaga tgctccaggt catcgcgcct gagatctacg  16157
gccccgcggc ggcggtgaag gaggaaagaa agccccgcaa actgaagcgg gtcaaaaagg  16217
acaaaaagga ggaggaagat gacggactgg tggagtttgt gcgcgagttc gccccccggc  16277
ggcgcgtgca gtggcgcggg cggaaagtga aaccggtgct gcggcccggc accacggtgg  16337
tcttcacgcc cggcgagcgt tccggctccg cctccaagcg ctcctacgac gaggtgtacg  16397
gggacgagga catcctcgag caggcggtcg agcgtctggg cgagtttgcg tacggcaagc  16457
gcagccgccc cgcgcccttg aaagaggagg cggtgtccat cccgctggac cacggcaacc  16517
ccacgccgag cctgaagccg gtgaccctgc agcaggtgct accgagcgcg gcgccgcgcc  16577
ggggcttcaa gcgcgagggc ggcgaggatc tgtacccgac catgcagctg atggtgccca  16637
agcgccagaa gctggaggac gtgctggagc acatgaaggt ggaccccgag gtgcagcccg  16697
aggtcaaggt gcggcccatc aagcaggtgg ccccgggcct gggcgtgcag accgtggaca  16757
tcaagatccc cacggagccc atggaaacgc agaccgagcc cgtgaagccc agcaccagca  16817
ccatggaggt gcagacggat ccctggatgc cagcaccagc ttccaccagc actcgccgaa  16877
gacgcaagta cggcgcggcc agcctgctga tgcccaacta cgcgctgcat ccttccatca  16937
tccccacgcc gggctaccgc ggcacgcgct tctaccgcgg ctacaccagc agccgccgcc  16997
gcaagaccac cacccgccgc cgtcgtcgca gccgccgcag cagcaccgcg acttccgcct  17057
tggtgcggag agtgtatcgc agcgggcgcg agcctctgac cctgccgcgc gcgcgctacc  17117
acccgagcat cgccatttaa ctaccgcctc ctacttgcag atatggccct cacatgccgc  17177
ctccgcgtcc ccattacggg ctaccgagga agaaagccgc gccgtagaag gctgacgggg  17237
aacgggctgc gtcgccatca ccaccggcgg cggcgcgcca tcagcaagcg gttgggggga  17297
ggcttcctgc ccgcgctgat ccccatcatc gccgcggcga tcggggcgat ccccggcata  17357
gcttccgtgg cggtgcaggc ctctcagcgc cactgagaca caaaaaagca tggatttgta  17417
ataaaaaaaa aaatggactg acgctcctgg tcctgtgatg tgtgttttta gatggaagac  17477
atcaattttt cgtccctggc accgcgacac ggcacgcggc cgtttatggg cacctggagc  17537
gacatcggca acagccaact gaacgggggc gccttcaatt ggagcagtct ctggagcggg  17597
cttaagaatt tcgggtccac gctcaaaacc tatggcaaca aggcgtggaa cagcagcaca  17657
gggcaggcgc tgagggaaaa gctgaaagaa cagaacttcc agcagaaggt ggttgatggc  17717
ctggcctcag gcatcaacgg ggtggttgac ctggccaacc aggccgtgca gaaacagatc  17777
aacagccgcc tggacgcggt cccgcccgcg gggtccgtgg agatgcccca ggtggaggag  17837
gagctgcctc ccctggacaa gcgcggcgac aagcgaccgc gtcccgacgc ggaggagacg  17897
ctgctgacgc acacggacga gccgcccccg tacgaggagg cggtgaaact gggcctgccc  17957
accacgcggc ccgtggcgcc tctggccacc ggagtgctga aacccagcag cagccagccc  18017
gcgaccctgg acttgcctcc gcctcgcccc tccacagtgg ctaagcccct gccgccggtg  18077
gccgtcgcgt cgcgcgcccc ccgaggccgc ccccaggcga actggcagag cactctgaac  18137
agcatcgtgg gtctgggagt gcagagtgtg aagcgccgcc gctgctatta aaagacactg  18197
tagcgcttaa cttgcttgtc tgtgtgtata tgtatgtccg ccgaccagaa ggaggagtgt  18257
gaagaggcgc gtcgccgagt tgcaag atg gcc acc cca tcg atg ctg ccc cag   18310
                             Met Ala Thr Pro Ser Met Leu Pro Gln
                             530                 535
tgg gcg tac atg cac atc gcc gga cag gac gct tcg gag tac ctg agt    18358
Trp Ala Tyr Met His Ile Ala Gly Gln Asp Ala Ser Glu Tyr Leu Ser
    540                 545                 550
ccg ggt ctg gtg cag ttc gcc cgc gcc aca gac acc tac ttc agt ctg    18406
Pro Gly Leu Val Gln Phe Ala Arg Ala Thr Asp Thr Tyr Phe Ser Leu
555                 560                 565                 570
ggg aac aag ttt agg aac ccc acg gtg gcg ccc acg cac gat gtg acc    18454
Gly Asn Lys Phe Arg Asn Pro Thr Val Ala Pro Thr His Asp Val Thr
                575                 580                 585
acc gac cgc agc cag cgg ctg acg ctg cgc ttc gtg ccc gtg gac cgc    18502
Thr Asp Arg Ser Gln Arg Leu Thr Leu Arg Phe Val Pro Val Asp Arg
            590                 595                 600
gag gac aac acc tac tcg tac aaa gtg cgc tac acg ctg gcc gtg ggc    18550
Glu Asp Asn Thr Tyr Ser Tyr Lys Val Arg Tyr Thr Leu Ala Val Gly
        605                 610                 615
gac aac cgc gtg ctg gac atg gcc agc acc tac ttt gac atc cgc ggc    18598
Asp Asn Arg Val Leu Asp Met Ala Ser Thr Tyr Phe Asp Ile Arg Gly
    620                 625                 630
gtg ctg gac cgg ggc cct agc ttc aaa ccc tac tct ggc acc gcc tac    18646
Val Leu Asp Arg Gly Pro Ser Phe Lys Pro Tyr Ser Gly Thr Ala Tyr
635                 640                 645                 650
aac agc cta gct ccc aag gga gct ccc aat tcc agc cag tgg gag caa    18694
Asn Ser Leu Ala Pro Lys Gly Ala Pro Asn Ser Ser Gln Trp Glu Gln
                655                 660                 665
gca aaa aca ggc aat ggg gga act atg gaa aca cac aca tat ggt gtg    18742
Ala Lys Thr Gly Asn Gly Gly Thr Met Glu Thr His Thr Tyr Gly Val
            670                 675                 680
gcc cca atg ggc gga gag aat att aca aaa gat ggt ctt caa att gga    18790
Ala Pro Met Gly Gly Glu Asn Ile Thr Lys Asp Gly Leu Gln Ile Gly
        685                 690                 695
act gac gtt aca gcg aat cag aat aaa cca att tat gcc gac aaa aca    18838
Thr Asp Val Thr Ala Asn Gln Asn Lys Pro Ile Tyr Ala Asp Lys Thr
    700                 705                 710
ttt caa cca gaa ccg caa gta gga gaa gaa aat tgg caa gaa act gaa    18886
Phe Gln Pro Glu Pro Gln Val Gly Glu Glu Asn Trp Gln Glu Thr Glu
715                 720                 725                 730
aac ttt tat ggc ggt aga gct ctt aaa aaa gac aca aac atg aaa cct    18934
Asn Phe Tyr Gly Gly Arg Ala Leu Lys Lys Asp Thr Asn Met Lys Pro
                735                 740                 745
tgc tat ggc tcc tat gct aga ccc acc aat gaa aaa gga ggt caa gct    18982
Cys Tyr Gly Ser Tyr Ala Arg Pro Thr Asn Glu Lys Gly Gly Gln Ala
            750                 755                 760
aaa ctt aaa gtt gga gat gat gga gtt cca acc aaa gaa ttc gac ata    19030
Lys Leu Lys Val Gly Asp Asp Gly Val Pro Thr Lys Glu Phe Asp Ile
        765                 770                 775
gac ctg gct ttc ttt gat act ccc ggt ggc acc gtg aac ggt caa gac    19078
Asp Leu Ala Phe Phe Asp Thr Pro Gly Gly Thr Val Asn Gly Gln Asp
    780                 785                 790
gag tat aaa gca gac att gtc atg tat acc gaa aac acg tat ttg gaa    19126
Glu Tyr Lys Ala Asp Ile Val Met Tyr Thr Glu Asn Thr Tyr Leu Glu
795                 800                 805                 810
act cca gac acg cat gtg gta tac aaa cca ggc aag gat gat gca agt    19174
Thr Pro Asp Thr His Val Val Tyr Lys Pro Gly Lys Asp Asp Ala Ser
                815                 820                 825
tct gaa att aac ctg gtt cag cag tct atg ccc aac aga ccc aac tac    19222
Ser Glu Ile Asn Leu Val Gln Gln Ser Met Pro Asn Arg Pro Asn Tyr
            830                 835                 840
att ggg ttc agg gac aac ttt atc ggt ctt atg tac tac aac agc act    19270
Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr
        845                 850                 855
ggc aat atg ggt gtg ctt gct ggt cag gcc tcc cag ctg aat gct gtg    19318
Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val
    860                 865                 870
gtt gat ttg caa gac aga aac acc gag ctg tcc tac cag ctc ttg ctt    19366
Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu
875                 880                 885                 890
gac tct ttg ggt gac aga acc cgg tat ttc agt atg tgg aac cag gcg    19414
Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala
                895                 900                 905
gtg gac agt tat gac ccc gat gtg cgc atc atc gaa aac cat ggt gtg    19462
Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Val
            910                 915                 920
gag gat gaa ttg cca aac tat tgc ttc ccc ttg gac ggc tct ggc act    19510
Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asp Gly Ser Gly Thr
        925                 930                 935
aac gcc gca tac caa ggt gtg aaa gta aaa gat ggt caa gat ggt gat    19558
Asn Ala Ala Tyr Gln Gly Val Lys Val Lys Asp Gly Gln Asp Gly Asp
    940                 945                 950
gtt gag agt gaa tgg gaa aat gac gat act gtt gca gct cga aat caa    19606
Val Glu Ser Glu Trp Glu Asn Asp Asp Thr Val Ala Ala Arg Asn Gln
955                 960                 965                 970
tta tgt aaa ggt aac att ttc gcc atg gag att aat ctc cag gct aac    19654
Leu Cys Lys Gly Asn Ile Phe Ala Met Glu Ile Asn Leu Gln Ala Asn
                975                 980                 985
ctg tgg aga agt ttc ctc tac tcg aac gtg gcc ctg tac ctg  ccc gac   19702
Leu Trp Arg Ser Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu  Pro Asp
            990                 995                 1000
tcc tac aag  tac acg ccg acc aac  gtc acg ctg ccg acc  aac acc     19747
Ser Tyr Lys  Tyr Thr Pro Thr Asn  Val Thr Leu Pro Thr  Asn Thr
        1005                 1010                 1015
aac acc tac  gat tac atg aat ggc  aga gtg aca cct ccc  tcg ctg    19792
Asn Thr Tyr  Asp Tyr Met Asn Gly  Arg Val Thr Pro Pro  Ser Leu
        1020                 1025                 1030
gta gac gcc  tac ctc aac atc ggg  gcg cgc tgg tcg ctg  gac ccc    19837
Val Asp Ala  Tyr Leu Asn Ile Gly  Ala Arg Trp Ser Leu  Asp Pro
        1035                 1040                 1045
atg gac aac  gtc aac ccc ttc aac  cac cac cgc aac gcg  ggc ctg    19882
Met Asp Asn  Val Asn Pro Phe Asn  His His Arg Asn Ala  Gly Leu
        1050                 1055                 1060
cgc tac cgc  tcc atg ctc ctg ggc  aac ggg cgc tac gtg  ccc ttc    19927
Arg Tyr Arg  Ser Met Leu Leu Gly  Asn Gly Arg Tyr Val  Pro Phe
        1065                 1070                 1075
cac atc cag  gtg ccc caa aag ttt  ttc gcc atc aag agc  ctc ctg    19972
His Ile Gln  Val Pro Gln Lys Phe  Phe Ala Ile Lys Ser  Leu Leu
        1080                 1085                 1090
ctc ctg ccc  ggg tcc tac acc tac  gag tgg aac ttc cgc  aag gac    20017
Leu Leu Pro  Gly Ser Tyr Thr Tyr  Glu Trp Asn Phe Arg  Lys Asp
        1095                 1100                 1105
gtc aac atg  atc ctg cag agc tcc  cta ggc aac gac ctg  cgc acg    20062
Val Asn Met  Ile Leu Gln Ser Ser  Leu Gly Asn Asp Leu  Arg Thr
        1110                 1115                 1120
gac ggg gcc  tcc atc gcc ttc acc  agc atc aac ctc tac  gcc acc    20107
Asp Gly Ala  Ser Ile Ala Phe Thr  Ser I1e Asn Leu Tyr  Ala Thr
        1125                 1130                 1135
ttc ttc ccc  atg gcg cac aac acc  gcc tcc acg ctc gag  gcc atg    20152
Phe Phe Pro  Met Ala His Asn Thr  Ala Ser Thr Leu Glu  Ala Met
        1140                 1145                 1150
ctg cgc aac  gac acc aac gac cag  tcc ttc aac gac tac  ctc tcg    20197
Leu Arg Asn  Asp Thr Asn Asp Gln  Ser Phe Asn Asp Tyr  Leu Ser
        1155                 1160                 1165
gcg gcc aac  atg ctc tac ccc atc  ccg gcc aac gcc acc  aac gtg    20242
Ala Ala Asn  Met Leu Tyr Pro Ile  Pro Ala Asn Ala Thr  Asn Val
        1170                 1175                 1180
ccc atc tcc  atc ccc tcg cgc aac  tgg gcc gcc ttc cgc  gga tgg    20287
Pro Ile Ser  Ile Pro Ser Arg Asn  Trp Ala Ala Phe Arg  Gly Trp
        1185                 1190                 1195
tcc ttc acg  cgc ctg aag acc cgc  gag acg ccc tcg ctc  ggc tcc    20332
Ser Phe Thr  Arg Leu Lys Thr Arg  Glu Thr Pro Ser Leu  Gly Ser
        1200                 1205                 1210
ggg ttc gac  ccc tac ttc gtc tac  tcg ggc tcc atc ccc  tac cta    20377
Gly Phe Asp  Pro Tyr Phe Val Tyr  Ser Gly Ser Ile Pro  Tyr Leu
        1215                 1220                 1225
gac ggc acc  ttc tac ctc aac cac  acc ttc aag aag gtc  tcc atc    20422
Asp Gly Thr  Phe Tyr Leu Asn His  Thr Phe Lys Lys Val  Ser Ile
        1230                 1235                 1240
acc ttc gac  tcc tcc gtc agc tgg  ccc ggc aac gac cgc  ctc ctg    20467
Thr Phe Asp  Ser Ser Val Ser Trp  Pro Gly Asn Asp Arg  Leu Leu
        1245                 1250                 1255
acg ccc aac  gag ttc gaa atc aag  cgc acc gtc gac gga  gag gga    20512
Thr Pro Asn  Glu Phe Glu Ile Lys  Arg Thr Val Asp Gly  Glu Gly
        1260                 1265                 1270
tac aac gtg  gcc cag tgc aac atg  acc aag gac tgg ttc  ctg gtc    20557
Tyr Asn Val  Ala Gln Cys Asn Met  Thr Lys Asp Trp Phe  Leu Val
        1275                 1280                 1285
cag atg ctg  gcc cac tac aac atc  ggc tac cag ggc ttc  tac gtg    20602
Gln Met Leu  Ala His Tyr Asn Ile  Gly Tyr Gln Gly Phe  Tyr Val
        1290                 1295                 1300
ccc gag ggc  tac aag gac cgc atg  tac tcc ttc ttc cgc  aac ttc    20647
Pro Glu Gly  Tyr Lys Asp Arg Met  Tyr Ser Phe Phe Arg  Asn Phe
        1305                 1310                 1315
cag ccc atg  agc cgc cag gtc gtg  gac gag gtc aac tac  aag gac    20692
Gln Pro Met  Ser Arg Gln Val Val  Asp Glu Val Asn Tyr  Lys Asp
        1320                 1325                 1330
tac cag gcc  gtc acc ctg gcc tac  cag cac aac aac tcg  ggc ttc    20737
Tyr Gln Ala  Val Thr Leu Ala Tyr  Gln His Asn Asn Ser  Gly Phe
        1335                 1340                 1345
gtc ggc tac  ctc gcg ccc acc atg  cgc cag ggc cag ccc  tac ccc    20782
Val Gly Tyr  Leu Ala Pro Thr Met  Arg Gln Gly Gln Pro  Tyr Pro
        1350                 1355                 1360
gcc aac tac  ccc tac ccg ctc atc  ggc aag agc gcc gtc  gcc agc    20827
Ala Asn Tyr  Pro Tyr Pro Leu Ile  Gly Lys Ser Ala Val  Ala Ser
        1365                 1370                 1375
gtc acc cag  aaa aag ttc ctc tgc  gac cgg gtc atg tgg  cgc atc    20872
Val Thr Gln  Lys Lys Phe Leu Cys  Asp Arg yal Met Trp  Arg Ile
        1380                 1385                 1390
ccc ttc tcc  agc aac ttc atg tcc  atg ggc gcg ctc acc  gac ctc    20917
Pro Phe Ser  Ser Asn Phe Met Ser  Met Gly Ala Leu Thr  Asp Leu
        1395                 1400                 1405
ggc cag aac  atg ctc tac gcc aac  tcc gcc cac gcg cta  gac atg    20962
Gly Gln Asn  Met Leu Tyr Ala Asn  Ser Ala His Ala Leu  Asp Met
        1410                 1415                 1420
aat ttc gaa  gtc gac ccc atg gat  gag tcc acc ctt ctc  tat gtt    21007
Asn Phe Glu  Val Asp Pro Met Asp  Glu Ser Thr Leu Leu  Tyr Val
        1425                 1430                 1435
gtc ttc gaa  gtc ttc gac gtc gtc  cga gtg cac cag ccc  cac cgc    21052
Val Phe Glu  Val Phe Asp Val Val  Arg Val His Gln Pro  His Arg
        1440                 1445                 1450
ggc gtc atc  gaa gcc gtc tac ctg  cgc acg ccc ttc tcg  gcc ggc      21097
Gly Val Ile  Glu Ala Val Tyr Leu  Arg Thr Pro Phe Ser  Ala Gly
        1455                 1460                 1465
aac gcc acc  acc taa gccgctcttg cttcttgcaa gatgacggcg ggctccggcg    21152
Asn Ala Thr  Thr
        1470
agcaggagct cagggccatc ctccgcgacc tgggctgcgg gccctgcttc ctgggcacct   21212
tcgacaagcg cttccctgga ttcatggccc cgcacaagct ggcctgcgcc atcgtgaaca   21272
cggccggccg cgagaccggg ggcgagcact ggctggcctt cgcctggaac ccgcgctccc   21332
acacatgcta cctcttcgac cccttcgggt tctcggacga gcgcctcaag cagatctacc   21392
agttcgagta cgagggcctg ctgcgtcgca gcgccctggc caccgaggac cgctgcgtca   21452
ccctggaaaa gtccacccag accgtgcagg gtccgcgctc ggccgcctgc gggctcttct   21512
gctgcatgtt cctgcacgcc ttcgtgcact ggcccgaccg ccccatggac aagaacccca   21572
ccatgaactt actgacgggg gtgcccaacg gcatgctcca gtcgccccag gtggaaccca   21632
ccctgcgccg caaccaggaa gcgctctacc gcttcctcaa tgcccactcc gcctactttc   21692
gctcccaccg cgcgcgcatc gagaaggcca ccgccttcga ccgcatgaat caagacatgt   21752
aaaaaaccgg tgtgtgtatg tgaatgcttt attcataata aacagcacat gtttatgcca   21812
ccttctctga ggctctgact ttatttagaa atcgaagggg ttctgccggc tctcggcatg   21872
gcccgcgggc agggatacgt tgcggaactg gtacttgggc agccacttga actcggggat   21932
cagcagcttg ggcacgggga ggtcggggaa cgagtcgctc cacagcttgc gcgtgagttg   21992
cagggcgccc agcaggtcgg gcgcggagat cttgaaatcg cagttgggac ccgcgttctg   22052
cgcgcgagag ttgcggtaca cggggttgca gcactggaac accatcaggg ccgggtgctt   22112
cacgcttgcc agcaccgtcg cgtcggtgat gccctccacg tccagatcct cggcgttggc   22172
catcccgaag ggggtcatct tgcaggtctg ccgccccatg ctgggcacgc agccgggctt   22232
gtggttgcaa tcgcagtgca gggggatcag catcatctgg gcctgctcgg agctcatgcc   22292
cgggtacatg gccttcatga aagcctccag ctggcggaag gcctgctgcg ccttgccgcc   22352
ctcggtgaag aagaccccgc aggacttgct agagaactgg ttggtggcgc agccggcgtc   22412
gtgcacgcag cagcgcgcgt cgttgttggc cagctgcacc acgctgcgcc cccagcggtt   22472
ctgggtgatc ttggcccggt tggggttctc cttcagcgcg cgctgcccgt tctcgctcgc   22532
cacatccatc tcgatagtgt gctccttctg gatcatcacg gtcccgtgca ggcaccgcag  22592
cttgccctcg gcttcggtgc agccgtgcag ccacagcgcg cagccggtgc actcccagtt  22652
cttgtgggcg atctgggagt gcgagtgcac gaagccctgc aggaagcggc ccatcatcgc  22712
ggtcagggtc ttgttgctgg tgaaggtcag cgggatgccg cggtgctcct cgttcacata  22772
caggtggcag atgcggcggt acacctcgcc ctgctcgggc atcagctgga aggcggactt  22832
caggtcgctc tccacgcggt accggtccat cagcagcgtc atcacttcca tgcccttctc  22892
ccaggccgaa acgatcggca ggctcagggg gttcttcacc gccattgtca tcttagtcgc  22952
cgccgccgag gtcagggggt cgttctcgtc cagggtctca aacactcgct tgccgtcctt  23012
ctcgatgatg cgcacggggg gaaagctgaa gcccacggcc gccagctcct cctcggcctg  23072
cctttcgtcc tcgctgtcct ggctgatgtc ttgcaaaggc acatgcttgg tcttgcgggg  23132
tttctttttg ggcggcagag gcggcggcga tgtgctggga gagcgcgagt tctcgttcac  23192
cacgactatt tcttcttctt ggccgtcgtc cgagaccacg cggcggtagg catgcctctt  23252
ctggggcaga ggcggaggcg acgggctctc gcggttcggc gggcggctgg cagagcccct  23312
tccgcgttcg ggggtgcgct cctggcggcg ctgctctgac tgacttcctc cgcggccggc  23372
cattgtgttc tcctagggag caacaacaag catggagact cagccatcgt cgccaacatc  23432
gccatctgcc cccgccgcca ccgccgacga gaaccagcag cagaatgaaa gcttaaccgc  23492
cccgccgccc agccccacct ccgacgccgc ggccccagac atgcaagaga tggaggaatc  23552
catcgagatt gacctgggct acgtgacgcc cgcggagcac gaggaggagc tggcagcgcg  23612
cttttcagcc ccggaagaga accaccaaga gcagccagag caggaagcag agaacgagca  23672
gaaccaggct gggcacgagc atggcgacta cctgagcggg gcagaggacg tgctcatcaa  23732
gcatctggcc cgccaatgca tcatcgtcaa ggacgcgctg ctcgaccgcg ccgaggtgcc  23792
cctcagcgtg gcggagctca gccgcgccta cgagcgcaac ctcttctcgc cgcgcgtgcc  23852
ccccaagcgc cagcccaacg gcacctgtga gcccaacccg cgcctcaact tctacccggt  23912
cttcgcggtg cccgaggccc tggccaccta ccacctcttt ttcaagaacc aaaggatccc  23972
cgtctcctgc cgcgccaacc gcacccgcgc cgacgccctg ctcaacctgg gccccggcgc  24032
ccgcctacct gatatcacct ccttggaaga ggttcccaag atcttcgagg gtctgggcag  24092
cgacgagact cgggccgcga acgctctgca aggaagcgga gaggagcatg agcaccacag  24152
cgccctggtg gagttggaag gcgacaacgc gcgcctggcg gtcctcaagc gcacggtcga  24212
gctgacccac ttcgcctacc cggcgctcaa cctgcccccc aaggtcatga gcgccgtcat  24272
ggaccaggtg ctcatcaagc gcgcctcgcc cctctcggag gaggagatgc aggaccccga  24332
gagttcggac gagggcaagc ccgtggtcag cgacgagcag ctggcgcgct ggctgggagc  24392
gagtagcacc ccccagagcc tggaagagcg gcgcaagctc atgatggccg tggtcctggt  24452
gaccgtggag ctggagtgtc tgcgccgctt ctttgccgac gcggagaccc tgcgcaaggt  24512
cgaggagaac ctgcactacc tcttcaggca cgggttcgtg cgccaggcct gcaagatctc  24572
caacgtggag ctgaccaacc tggtctccta catgggcatc ctgcacgaga accgcctggg  24632
gcaaaacgtg ctgcacacca ccctgcgcgg ggaggcccgc cgcgactaca tccgcgactg  24692
cgtctacctg tacctctgcc acacctggca gacgggcatg ggcgtgtggc agcagtgcct  24752
ggaggagcag aacctgaaag agctctgcaa gctcctgcag aagaacctca aggccctgtg  24812
gaccgggttc gacgagcgta ccaccgcctc ggacctggcc gacctcatct tccccgagcg  24872
cctgcggctg acgctgcgca acgggctgcc cgactttatg agccaaagca tgttgcaaaa  24932
ctttcgctct ttcatcctcg aacgctccgg gatcctgccc gccacctgct ccgcgctgcc  24992
ctcggacttc gtgccgctga ccttccgcga gtgccccccg ccgctctgga gccactgcta  25052
cttgctgcgc ctggccaact acctggccta ccactcggac gtgatcgagg acgtcagcgg  25112
cgagggtctg ctggagtgcc actgccgctg caacctctgc acgccgcacc gctccctggc  25172
ctgcaacccc cagctgctga gcgagaccca gatcatcggc accttcgagt tgcaaggccc  25232
cggcgacggc gagggcaagg ggggtctgaa actcaccccg gggctgtgga cctcggccta  25292
cttgcgcaag ttcgtgcccg aggactacca tcccttcgag atcaggttct acgaggacca  25352
atcccagccg cccaaggccg agctgtcggc ctgcgtcatc acccaggggg ccatcctggc  25412
ccaattgcaa gccatccaga aatcccgcca agaatttctg ctgaaaaagg gccacggggt  25472
ctacttggac ccccagaccg gagaggagct caaccccagc ttcccccagg atgccccgag  25532
gaagcagcaa gaagctgaaa gtggagctgc cgccgccgga ggatttggag gaagactggg  25592
agagcagtca ggcagaggag gaggagatgg aagactggga cagcactcag gcagaggagg  25652
acagcctgca agacagtctg gaggaggaag acgaggtgga ggaggcagag gaagaagcag  25712
ccgccgccag accgtcgtcc tcggcggaga aagcaagcag cacggatacc atctccgctc  25772
cgggtcgggg tcgcggcggc cgggcccaca gtaggtggga cgagaccggg cgcttcccga  25832
accccaccac ccagaccggt aagaaggagc ggcagggata caagtcctgg cgggggcaca  25892
aaaacgccat cgtctcctgc ttgcaagcct gcgggggcaa catctccttc acccggcgct  25952
acctgctctt ccaccgcggg gtgaacttcc cccgcaacat cttgcattac taccgtcacc  26012
tccacagccc ctactactgt ttccaagaag aggcagaaac ccagcagcag cagaaaacca  26072
gcggcagcag cagctagaaa atccacagcg gcggcaggtg gactgaggat cgcggcgaac  26132
gagccggcgc agacccggga gctgaggaac cggatctttc ccaccctcta tgccatcttc  26192
cagcagagtc gggggcagga gcaggaactg aaagtcaaga accgttctct gcgctcgctc  26252
acccgcagtt gtctgtatca caagagcgaa gaccaacttc agcgcactct cgaggacgcc  26312
gaggctctct tcaacaagta ctgcgcgctc actcttaaag agtagcccgc gcccgcccac  26372
acacggaaaa aggcgggaat tacgtcacca cctgcgccct tcgcccgacc atcatgagca  26432
aagagattcc cacgccttac atgtggagct accagcccca gatgggcctg gccgccggcg  26492
ccgcccagga ctactccacc cgcatgaact ggctcagtgc cgggcccgcg atgatctcac  26552
gggtgaatga catccgcgcc caccgaaacc agatactcct agaacagtca gcgatcaccg  26612
ccacgccccg ccatcacctt aatccgcgta attggcccgc cgccctggtg taccaggaaa  26672
ttccccagcc cacgaccgta ctacttccgc gagacgccca ggccgaagtc cagctgacta  26732
actcaggtgt ccagctggcc ggcggcgccg ccctgtgtcg tcaccgcccc gctcagggta  26792
taaagcggct ggtgatccga ggcagaggca cacagctcaa cgacgaggtg gtgagctctt  26852
cgctgggtct gcgacctgac ggagtcttcc aactcgccgg atcggggaga tcttccttca  26912
cgcctcgtca ggccgtcctg actttggaga gttcgtcctc gcagccccgc tcgggcggca  26972
tcggcactct ccagttcgtg gaggagttca ctccctcggt ctacttcaac cccttctccg  27032
gctcccccgg ccactacccg gacgagttca tcccgaactt cgacgccatc agcgagtcgg  27092
tggacggcta cgattgaatg tcccatggtg gcgcagctga cctagctcgg cttcgacacc  27152
tggaccactg ccgccgcttc cgctgcttcg ctcgggatct cgccgagttt gcctactttg  27212
agctgcccga ggagcaccct cagggcccag cccacggagt gcggatcatc gtcgaagggg  27272
gcctcgactc ccacctgctt cggatcttca gccagcgacc gatcctggtc gagcgcgaac  27332
aaggacagac ccttcttact ttgtactgca tctgcaacca ccccggcctg catgaaagtc  27392
tttgttgtct gctgtgtact gagtataata aaagctgaga tcagcgacta ctccggactc  27452
gattgtggtg ttcctgctat caaccggtcc ctgttcttca ccgggaacga gaccgagctc  27512
cagctccagt gtaagcccca caagaagtac ctcacctggc tgttccaggg ctccccgatc  27572
gccgttgtca accactgcga caacgacgga gtcctgctga gcggccctgc caaccttact  27632
ttttccaccc gcagaagcaa gctccagctc ttccaaccct tcctccccgg gacctatcag  27692
tgcgtctcag gaccctgcca tcacaccttc cacctgatcc cgaataccac agcgccgctc  27752
cccgctacta acaaccaaac tacccaccaa cgccaccgtc gcgacctttc ctctgaatct  27812
aataccacta ccggaggtga gctccgaggt cgaccaacct ctgggattta ctacggcccc  27872
tgggaggtgg tggggttaat agcgctaggc ctagttgcgg gtgggctttt ggttctctgc  27932
tacctatacc tcccttgctg ttcgtactta gtggtgctgt gttgctggtt taagaaatgg  27992
ggaagatcac cctagtgagc tgcggtgcgc tggtggcggt gttgctttcg attgtgggac  28052
tgggcggcgc ggctgtagtg aaggagaagg ccgatccctg cttgcatttc aatcccaaca  28112
aatgccagct gagttttcag cccgatggca atcggtgcgc ggtactgatc aagtgcggat  28172
gggaatgcga gaacgtgaga atcgagtaca ataacaagac tcggaacaat actctcgcgt  28232
ccgtgtggca gcccggggac cccgagtggt acaccgtctc tgtccccggt gctgacggct  28292
ccccgcgcac cgtgaataat actttcattt ttgcgcacat gtgcaacacg gtcatgtgga  28352
tgagcaagca gtacgatatg tggcccccca cgaaggagaa catcgtggtc ttctccatcg  28412
cttacagcct gtgcacggcg ctaatcaccg ctatcgtgtg cctgagcatt cacatgctca  28472
tcgctattcg ccccagaaat aatgccgaga aagagaaaca gccataacac gttttttcac  28532
acaccttgtt tttacagaca atgcgtctgt taaatttttt aaacattgtg ctcagtattg  28592
cttatgcctc tggttatgca aacatacaga aaacccttta tgtaggatct gatggtacac  28652
tagagggtac ccaatcacaa gccaaggttg catggtattt ttatagaacc aacactgatc  28712
cagttaaact ttgtaagggt gaattgccgc gtacacataa aactccactt acatttagtt  28772
gcagcaataa taatcttaca cttttttcaa ttacaaaaca atatactggt acttattaca  28832
gtacaaactt tcatacagga caagataaat attatactgt taaggtagaa aatcctacca  28892
ctcctagaac taccaccacc accactactg caaagcccac tgtgaaaact acaactagga  28952
ccaccacaac tacagaaacc accaccagca caacacttgc tgcaactaca cacacacaca  29012
ctaagctaac cttacagacc actaatgatt tgatcgccct gctgcaaaag ggggataaca  29072
gcaccacttc caatgaggag atacccaaat ccatgattgg cattattgtt gctgtagtgg  29132
tgtgcatgtt gatcatcgcc ttgtgcatgg tgtactatgc cttctgctac agaaagcaca  29192
gactgaacga caagctggaa cacttactaa gtgttgaatt ttaatttttt agaaccatga  29252
agatcctagg cctttttagt ttttctatca ttacctctgc tctttgtgaa tcagtggata  29312
gagatgttac tattaccact ggttctaatt atacactgaa agggccaccc tcaggtatgc  29372
tttcgtggta ttgctatttt ggaactgaca ctgatcaaac tgaattatgc aattttcaaa  29432
aaggcaaaac ctcaaactct aaaatctcta attatcaatg caatggcact gatctgatac  29492
tactcaatgt cacgaaagca tatggtggca gttattattg ccctggacaa aacactgaag  29552
aaatgatttt ttacaaagtg gaagtggttg atcccactac accacccacc accacaacta  29612
ttcataccac acacacagaa caaacacGag aggcaacaga agcagagttg gccttccagg  29672
ttcacggaga ttcctttgct gtcaataccc ctacacccga tcagcggtgt ccggggccgc  29732
tagtcagcgg cattgtcggt gtgctttcgg gattagcagt cataatcatc tgcatgttca  29792
tttttgcttg ctgctataga aggctttacc gacaaaaatc agacccactg ctgaacctct  29852
atgtttaatt ttttccagag ccatgaaggc agttagcgct ctagtttttt gttctttgat  29912
tggcattgtt tttaatagta aaattaccag agttagcttt attaaacatg ttaatgtaac  29972
tgaaggagat aacatcacac tagcaggtgt agaaggtgct caaaacacca cctggacaaa  30032
ataccatcta ggatggagag atatttgcac ctggaatgta acttattatt gcataggagt  30092
taatcttacc attgttaacg ctaaccaatc tcagaatggg ttaattaaag gacagagtgt  30152
tagtgtgacc agtgatgggt actataccca gcatagtttt aactacaaca ttactgtcat  30212
accactgcct acgcctagcc cacctagcac taccacacag acaaccacat acagtacatc  30272
aaatcagcct accaccacta cagcagcaga ggttgccagc tcgtctgggg tccgagtggc  30332
atttttgatg ttggccccat ctagcagtcc cactgctagt accaatgagc agactactga  30392
atttttgtcc actgtcgaga gccacaccac agctacctcc agtgccttct ctagcaccgc  30452
caatctctcc tcgctttcct ctacaccaat cagccccgct actactccta gccccgctcc  30512
tcttcccact cccctgaagc aaacagacgg cggcatgcaa tggcagatca ccctgctcat  30572
tgtgatcggg ttggtcatcc tggccgtgtt gctctactac atcttctgcc gccgcattcc  30632
caacgcgcac cgcaagccgg cctacaagcc catcgttatc gggcagccgg agccgcttca  30692
ggtggaaggg ggtctaagga atcttctctt ctcttttaca gtatggtgat tgaactatga  30752
ttcctagaca attcttgatc actattctta tctgcctcct ccaagtctgt gccaccctcg  30812
ctctggtggc caacgccagt ccagactgta ttgggccctt cgcctcctac gtgctctttg  30872
ccttcgtcac ctgcatctgc tgctgtagca tagtctgcct gcttatcacc ttcttccagt  30932
tcattgactg gatctttgtg cgcatcgcct acctgcgcca ccacccccag taccgcgacc  30992
agcgagtggc gcagctgctc aggctcctct gataagcatg cgggctctgc tacttctcgc  31052
gcttctgctg ttagtgctcc cccgtcccgt cgacccccgg tcccccactc agtcccccga  31112
ggaggttcgc aaatgcaaat tccaagaacc ctggaaattc ctcaaatgct accgccaaaa  31172
atcagacatg catcccagct ggatcatgat cattgggatc gtgaacattc tggcctgcac  31232
cctcatctcc tttgtgattt acccctgctt tgactttggt tggaactcgc cagaggcgct  31292
ctatctcccg cctgaacctg acacaccacc acagcagcaa cctcaggcac acgcactacc  31352
accaccacag cctaggccac aatacatgcc catattagac tatgaggccg agccacagcg  31412
acccatgctc cccgctatta gttacttcaa tctaaccggc ggagatgact gacccactgg  31472
ccaataacaa cgtcaacgac cttctcctgg acatggacgg ccgcgcctcg gagcagcgac  31532
tcgcccaact tcgcattcgt cagcagcagg agagagccgt caaggagctg caggacggca  31592
tagccatcca ccagtgcaag agaggcatct tctgcctggt gaaacaggcc aagatctcct  31652
acgaggtcac ccagaccgac catcgcctct cctacgagct cctgcagcag cgccagaagt  31712
tcacctgcct ggtcggagtc aaccccatcg tcatcaccca gcagtcgggc gataccaagg  31772
ggtgcatcca ctgctcctgc gactcccccg actgcgtcca cactctgatc aagaccctct  31832
gcggcctccg cgacctcctc cccatgaact aatcaccccc ttatccagtg aaataaagat  31892
catattgatg atgatttaaa taaaaaaaat aatcatttga tttgaaataa agatacaatc  31952
atattgatga tttgagttta acaaaaataa agaatcactt acttgaaatc tgataccagg  32012
tctctgtcca tgttttctgc caacaccacc tcactcccct cttcccagct ctggtactgc  32072
aggccccggc gggctgcaaa cttcctccac acgctgaagg ggatgtcaaa ttcctcctgt  32132
ccctcaatct tcattttatc ttctatcag atg tcc aaa aag  cgc gtc cgg gtg   32185
                                Met Ser Lys Lys  Arg Val Arg Val
                                            1475
gat  gat gac ttc gac ccc  gtc tac ccc tac gat  gca gac aac gca     32230
Asp  Asp Asp Phe Asp Pro  Val Tyr Pro Tyr Asp  Ala Asp Asn Ala
1480                 1485                 1490
ccg  acc gtg ccc ttc atc  aac ccc ccc ttc gtc  tct tca gat gga     32275
Pro  Thr Val Pro Phe Ile  Asn Pro Pro Phe Val  Ser Ser Asp Gly
1495                 1500                 1505
ttc  caa gag aag ccc ctg  ggg gtg ttg tcc ctg  cga ctg gct gac     32320
Phe  Gln Glu Lys Pro Leu  Gly Val Leu Ser Leu  Arg Leu Ala Asp
1510                 1515                 1520
ccc  gtc acc acc aag aac  ggg gaa atc acc ctc  aag ctg gga gag     32365
Pro  Val Thr Thr Lys Asn  Gly Glu Ile Thr Leu  Lys Leu Gly Glu
1525                 1530                 1535
ggg  gtg gac ctc gac tcg  tcg gga aaa ctc atc  tcc aac acg gcc     32410
Gly  Val Asp Leu Asp Ser  Ser Gly Lys Leu Ile  Ser Asn Thr Ala
1540                 1545                 l550
acc  aag gcc gcc gcc cct  ctc agt att tca aac  aac acc att tcc    32455
Thr  Lys Ala Ala Ala Pro  Leu Ser Ile Ser Asn  Asn Thr Ile Ser
1555                 1560                 1565
ctt  aaa act gct gcc cct  ttc tac aac aac aat  gga act tta agc    32500
Leu  Lys Thr Ala Ala Pro  Phe Tyr Asn Asn Asn  Gly Thr Leu Ser
1570                 1575                 1580
ctc  aat gtc tcc aca cca  tta gca gta ttt ccc  aca ttt aac act    32545
Leu  Asn Val Ser Thr Pro  Leu Ala Val Phe Pro  Thr Phe Asn Thr
1585                 1590                 1595
tta  ggc ata agt ctt gga  aac ggt ctt cag act  tca aat aag ttg    32590
Leu  Gly Ile Ser Leu Gly  Asn Gly Leu Gln Thr  Ser Asn Lys Leu
1600                 1605                 1610
ttg  act gta caa cta act  cat cct ctt aca ttc  agc tca aat agc    32635
Leu  Thr Val Gln Leu Thr  His Pro Leu Thr Phe  Ser Ser Asn Ser
1615                 1620                 1625
atc  aca gta aaa aca gac  aaa ggg cta tat att  aac tcc agt gga    32680
Ile  Thr Val Lys Thr Asp  Lys Gly Leu Tyr Ile  Asn Ser Ser Gly
1630                 1635                 1640
aac  aga gga ctt gag gct  aat ata agc cta aaa  aga gga cta gtt    32725
Asn  Arg Gly Leu Glu Ala  Asn Ile Ser Leu Lys  Arg Gly Leu Val
1645                 1650                 1655
ttt  gac ggt aat gct att  gca aca tat att gga  aat ggc tta gac    32770
Phe  Asp Gly Asn Ala Ile  Ala Thr Tyr Ile Gly  Asn Gly Leu Asp
1660                 1665                 1670
tat  gga tct tat gat agt  gat gga aaa aca aga  ccc gta att acc    32815
Tyr  Gly Ser Tyr Asp Ser  Asp Gly Lys Thr Arg  Pro Val Ile Thr
1675                 1680                 1685
aaa  att gga gca gga tta  aat ttt gat gct aac  aaa gca ata gct    32860
Lys  Ile Gly Ala Gly Leu  Asn Phe Asp Ala Asn  Lys Ala Ile Ala
1690                 1695                 1700
gtc  aaa cta ggc aca ggt  tta agt ttt gac tcc  gct ggt gcc ttg    32905
Val  Lys Leu Gly Thr Gly  Leu Ser Phe Asp Ser  Ala Gly Ala Leu
1705                 1710                 1715
aca  gct gga aac aaa cag  gat gac aag cta aca  ctt tgg act acc    32950
Thr  Ala Gly Asn Lys Gln  Asp Asp Lys Leu Thr  Leu Trp Thr Thr
1720                 1725                 1730
cct  gac cca agc cct aat  tgt caa tta ctt tca  gac aga gat gcc    32995
Pro  Asp Pro Ser Pro Asn  Cys Gln Leu Leu Ser  Asp Arg Asp Ala
1735                 1740                 1745
aaa  ttt act ctc tgt ctt  aca aaa tgc ggt agt  caa ata cta ggc    33040
Lys  Phe Thr Leu Cys Leu  Thr Lys Cys Gly Ser  Gln Ile Leu Gly
1750                 1755                 1760
act  gtg gca gtg gcg gct  gtt act gta gga tca  gca cta aat cca     33085
Thr  Val Ala Val Ala Ala  Val Thr Val Gly Ser  Ala Leu Asn Pro
1765                 1770                 1775
att  aat gac aca gtc aaa  agc gcc ata gtt ttc  ctt aga ttt gat     33130
Ile  Asn Asp Thr Val Lys  Ser Ala Ile Val Phe  Leu Arg Phe Asp
1780                 1785                 1790
tcc  gat ggt gta ctc atg  tca aac tca tca atg  gta ggt gat tac     33175
Ser  Asp Gly Val Leu Met  Ser Asn Ser Ser Met  Val Gly Asp Tyr
1795                 1800                 1805
tgg  aac ttt agg gag gga  cag acc act caa agt  gta gcc tat aca     33220
Trp  Asn Phe Arg Glu Gly  Gln Thr Thr Gln Ser  Val Ala Tyr Thr
1810                 1815                 1820
aat  gct gtg gga ttc atg  cca aat ata ggt gca  tat cca aaa acc     33265
Asn  Ala Val Gly Phe Met  Pro Asn Ile Gly Ala  Tyr Pro Lys Thr
1825                 1830                 1835
caa  agt aaa aca cct aaa  aat agc ata gtc agt  cag gta tat tta     33310
Gln  Ser Lys Thr Pro Lys  Asn Ser Ile Val Ser  Gln Val Tyr Leu
1840                 1845                 1850
act  gga gaa act act atg  cca atg aca cta acc  ata act ttc aat     33355
Thr  Gly Glu Thr Thr Met  Pro Met Thr Leu Thr  Ile Thr Phe Asn
1855                 1860                 1865
ggc  act gat gaa aaa gac  aca acc cca gtt agc  acc tac tct atg     33400
Gly  Thr Asp Glu Lys Asp  Thr Thr Pro Val Ser  Thr Tyr Ser Met
1870                 1875                 1880
act  ttt aca tgg cag tgg  act gga gac tat aag  gac aaa aat att     33445
Thr  Phe Thr Trp Gln Trp  Thr Gly Asp Tyr Lys  Asp Lys Asn Ile
1885                 1890                 1895
acc  ttt gct acc aac tca  ttc tct ttt tcc tac  atc gcc cag gaa     33490
Thr  Phe Ala Thr Asn Ser  Phe Ser Phe Ser Tyr  Ile Ala Gln Glu
1900                 1905                 1910
taa tcccacccag caagccaacc ccttttccca ccacctttgt ctatatggaa         33543
actctgaaac agaaaaataa agttcaagtg ttttattgaa tcaacagttt tacaggactc  33603
gagcagttat ttttcctcca ccctcccagg acatggaata caccaccctc tccccccgca  33663
cagccttgaa catctgaatg ccattggtga tggacatgct tttggtctcc acgttccaca  33723
cagtttcaga gcgagccagt ctcggatcgg tcagggagat gaaaccctcc gggcactccc  33783
gcatctgcac ctcacagctc aacagctgag gattgtcctc ggtggtcggg atcacggtta  33843
tctggaagaa gcagaagagc ggcggtggga atcatagtcc gcgaacggga tcggccggtg  33903
gtgtcgcatc aggccccgca gcagtcgctg ccgccgccgc tccgtcaagc tgctgctcag  33963
ggggttcggg tccagggact ccctcagcat gatgcccacg gccctcagca tcagtcgtct  34023
ggtgcggcgg gcgcagcagc gcatgcgaat ctcgctcagg tcactgcagt acgtgcaaca  34083
caggaccacc aggttgttca acagtccata gttcaacacg ctccagccga aactcatcgc  34143
gggaaggatg ctacccacgt ggccgtcgta ccagatcctc aggtaaatca agtggcgctc  34203
cctccagaag acgctgccca tgtacatgat ctccttgggc atgtggcggt tcaccacctc  34263
ccggtaccac atcaccctct ggttgaacat gcagccccgg atgatcctgc ggaaccacag  34323
ggccagcacc gccccgcccg ccatgcagcg aagagacccc ggatcccggc aatgacaatg  34383
gaggacccac cgctcgtacc cgtggatcat ctgggagctg aacaagtcta tgttggcaca  34443
gcacaggcat atgctcatgc atctcttcag cactctcagc tcctcggggg tcaaaaccat  34503
atcccagggc acggggaact cttgcaggac agcgaacccc gcagaacagg gcaatcctcg  34563
cacataactt acattgtgca tggacagggt atcgcaatca ggcagcaccg ggtgatcctc  34623
caccagagaa gcgcgggtct cggtctcctc acagcgtggt aagggggccg gccgatacgg  34683
gtgatggcgg gacgcggctg atcgtgttct cgaccgtgtc atgatgcagt tgctttcgga  34743
cattttcgta cttgctgtag cagaacctgg tccgggcgct gcacaccgat cgccggcggc  34803
ggtctcggcg cttggaacgc tcggtgttaa agttgtaaaa cagccactct ctcagaccgt  34863
gcagcagatc tagggcctca ggagtgatga agatcccatc atgcctgata gctctgatca  34923
catcgaccac cgtggaatgg gccaggccca gccagatgat gcaattttgt tgggtttcgg  34983
tgacggcggg ggagggaaga acaggaagaa ccatgattaa cttttaatcc aaacggtctc  35043
ggagcacttc aaaatgaagg tcacggagat ggcacctctc gcccccgctg tgttggtgga  35103
aaataacagc caggtcaaag gtgatacggt tctcgagatg ttccacggtg gcttccagca  35163
aagcctccac gcgcacatcc agaaacaaga caatagcgaa agcgggaggg ttctctaatt  35223
cctcaaccat catgttacac tcctgcacca tccccagata attttcattt ttccagcctt  35283
gaatgattcg aactagttcc tgaggtaaat ccaagccagc catgataaaa agctcgcgca  35343
gagcaccctc caccggcatt cttaagcaca ccctcataat tccaagatat tctgctcctg  35403
gttcacctgc agcagattga caagcggaat atcaaaatct ctgccgcgat ccctgagctc  35463
ctccctcagc aataactgta agtactcttt catatcgtct ccgaaatttt tagccatagg  35523
acccccagga ataagagaag ggcaagccac attacagata aaccgaagtc ccccccagtg  35583
agcattgcca aatgtaagat tgaaataagc atgctggcta gacccggtga tatcttccag  35643
ataactggac agaaaatcgg gtaagcaatt tttaagaaaa tcaacaaaag aaaaatcttc  35703
caggtgcacg tttagggcct cgggaacaac gatggagtaa gtgcaagggg tgcgttccag  35763
catggttagt tagctgatct gtaaaaaaac aaaaaataaa acattaaacc atgctagcct  35823
ggcgaacagg tgggtaaatc gttctctcca gcaccaggca ggccacgggg tctccggcgc  35883
gaccctcgta aaaattgtcg ctatgattga aaaccatcac agagagacgt tcccggtggc  35943
cggcgtgaat gattcgagaa gaagcataca cccccggaac attggagtcc gtgagtgaaa  36003
aaaagcggcc gaggaagcaa tgaggcacta caacgctcac tctcaagtcc agcaaagcga  36063
tgccatgcgg atgaagcaca aaattttcag gtgcgtaaaa aatgtaatta ctcccctcct  36123
gcacaggcag cgaagctccc gatccctcca gatacacata caaagcctca gcgtccatag  36183
cttaccgagc ggcagcagca gcggcacaca acaggcgcaa gagtcagaga aaagactgag  36243
ctctaacctg tccgcccgct ctctgctcaa tatatagccc cagatctaca ctgacgtaaa  36303
ggccaaagtc taaaaatacc cgccaaataa tcacacacgc ccagcacacg cccagaaacc  36363
ggtgacacac tcagaaaaat acgcgcactt cctcaaacgg ccaaactgcc gtcatttccg  36423
ggttcccacg ctacgtcatc aaaacacgac tttcaaattc cgtcgaccgt taaaaacatc  38483
acccgccccg cccctaacgg tcgccgctcc cgcagccaat caccttcctc cctccccaaa  36543
ttcaaacagc tcatttgcat attaacgcgc accaaaagtt tgaggtatat tattgatgat  36603
g                                                                  36604
<210>6
<211>529
<212>PRT
<213>黑猩猩腺病毒血清型Pan6
<400>6
Met Met Arg Arg Val Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser
1               5                   10                  15
Val Met Gln Gln Ala Val Ala Ala Ala Met Gln Pro Pro Leu Glu Ala
            20                  25                  30
Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg Asn Ser
        35                  40                  45
Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Leu Tyr
    50                  55                  60
Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Gln Asn
65                  70                  75                  80
Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Phe Thr
                85                  90                  95
Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg
            100                 105                 110
Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro Asn Val
        115                 120                 125
Asn Glu Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg Val Met Val Ser
    130                 135                 140
Arg Lys Thr Pro Asn Gly Val Asp Asp Asp Tyr Asp Gly Ser Gln Asp
145                 150                 155                 160
Glu Leu Thr Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly Asn Phe
                165                 170                 175
Ser Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Ile Asp Asn
            180                 185                 190
Tyr Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly
        195                 200                 205
Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Thr
    210                 215                 220
Glu Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp
225                 230                 235                 240
Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Glu Ser Arg Leu
                245                 250                 255
Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe
            260                 265                 270
Gln Ile Leu Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu
        275                 280                 285
Asp Val Glu Ala Tyr Glu Lys Ser Lys Glu Asp Ser Thr Ala Ala Ala
    290                 295                 300
Thr Ala Ala Val Ala Thr Ala Ser Thr Glu Val Arg Gly Asp Asn Phe
305                 310                 315                 320
Ala Ser Ala Ala Ala Ala Ala Glu Ala Ala Glu Thr Glu Ser Lys Ile
                325                 330                 335
Val Ile Gln Pro Val Glu Lys Asp Ser Lys Asp Arg Ser Tyr Asn Val
            340                 345                 350
Leu Ala Asp Lys Lys Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr
        355                 360                 365
Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr
    370                 375                 380
Thr Ser Asp Val Thr Cys Gly Val Glu Gln Val Tyr Trp Ser Leu Pro
385                 390                 395                 400
Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser
                405                 410                 415
Asn Tyr Pro Val Val Gly Ala Glu Leu Leu Pro Val Tyr Ser Lys Ser
            420                 425                 430
Phe Phe Asn Glu Gln Ala yal Tyr Ser Gln Gln Leu Arg Ala Phe Thr
        435                 440                 445
Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val
    450                 455                 460
Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala
465                 470                 475                 480
Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val
                485                 490                 495
Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val
            500                 505                 510
Tyr Lys Ala Leu Gly Val Val Ala Pro Arg Val Leu Ser Ser Arg Thr
        515                 520                 525
Phe
<210>7
<211>942
<212>PRT
<213>黑猩猩腺病毒血清型Pan6
<400>7
Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala
1               5                   10                  15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
            20                  25                  30
Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro
        35                  40                  45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
    50                  55                  60
Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr
65                  70                  75                  80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
                85                  90                  95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
            100                 105                 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
        115                 120                 125
Ala Pro Asn Ser Ser Gln Trp Glu Gln Ala Lys Thr Gly Asn Gly Gly
    130                 135                 140
Thr Met Glu Thr His Thr Tyr Gly Val Ala Pro Met Gly Gly Glu Asn
145                 150                 155                 160
Ile Thr Lys Asp Gly Leu Gln Ile Gly Thr Asp Val Thr Ala Asn Gln
                165                 170                 175
Asn Lys Pro Ile Tyr Ala Asp Lys Thr Phe Gln Pro Glu Pro Gln Val
            180                 185                 190
Gly Glu Glu Asn Trp Gln Glu Thr Glu Asn Phe Tyr Gly Gly Arg Ala
        195                 200                 205
Leu Lys Lys Asp Thr Asn Met Lys Pro Cys Tyr Gly Ser Tyr Ala Arg
    210                 215                 220
Pro Thr Asn Glu Lys Gly Gly Gln Ala Lys Leu Lys Val Gly Asp Asp
225                 230                 235                 240
Gly Val Pro Thr Lys Glu Phe Asp Ile Asp Leu Ala Phe Phe Asp Thr
                245                 250                 255
Pro Gly Gly Thr Val Asn Gly Gln Asp Glu Tyr Lys Ala Asp Ile Val
            260                 265                 270
Met Tyr Thr Glu Asn Thr Tyr Leu Glu Thr Pro Asp Thr His Val Val
        275                 280                 285
Tyr Lys Pro Gly Lys Asp Asp Ala Ser Ser Glu Ile Asn Leu Val Gln
    290                 295                 300
Gln Ser Met Pro Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe
305                 310                 315                 320
Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala
                325                 330                 335
Gly Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn
            340                 345                 350
Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr
        355                 360                 365
Arg Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp
    370                 375                 380
Val Arg Ile Ile Glu Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr
385                 390                 395                 400
Cys Phe Pro Leu Asp Gly Ser Gly Thr Asn Ala Ala Tyr Gln Gly Val
                405                 410                 415
Lys Val Lys Asp Gly Gln Asp Gly Asp Val Glu Ser Glu Trp Glu Asn
            420                 425                 430
Asp Asp Thr Val Ala Ala Arg Asn Gln Leu Cys Lys Gly Asn Ile Phe
        435                 440                 445
Ala Met Glu Ile Asn Leu Gln Ala Asn Leu Trp Arg Ser Phe Leu Tyr
    450                 455                 460
Ser Asn Val Ala Leu Tyr Leu Pro Asp Ser Tyr Lys Tyr Thr Pro Thr
465                 470                 475                 480
Asn Val Thr Leu Pro Thr Asn Thr Asn Thr Tyr Asp Tyr Met Asn Gly
                485                 490                 495
Arg Val Thr Pro Pro Ser Leu Val Asp Ala Tyr Leu Asn Ile Gly Ala
            500                 505                 510
Arg Trp Ser Leu Asp Pro Met Asp Asn Val Asn Pro Phe Asn His His
        515                 520                 525
Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met Leu Leu Gly Asn Gly Arg
    530                 535                 540
Tyr Val Pro Phe His Ile Gln Val Pro Gln Lys Phe Phe Ala Ile Lys
545                 550                 555                 560
Ser Leu Leu Leu Leu Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe Arg
                565                 570                 575
Lys Asp Val Asn Met Ile Leu Gln Ser Ser Leu Gly Asn Asp Leu Arg
            580                 585                 590
Thr Asp Gly Ala Ser Ile Ala Phe Thr Ser Ile Asn Leu Tyr Ala Thr
        595                 600                 605
Phe Phe Pro Met Ala His Asn Thr Ala Ser Thr Leu Glu Ala Met Leu
    610                 615                 620
Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn Asp Tyr Leu Ser Ala Ala
625                 630                 635                 640
Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala Thr Asn Val Pro Ile Ser
                645                 650                 655
Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg Gly Trp Ser Phe Thr Arg
            660                 665                 670
Leu Lys Thr Arg Glu Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr
        675                 680                 685
Phe Val Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu
    690                 695                 700
Asn His Thr Phe Lys Lys Val Ser Ile Thr Phe Asp Ser Ser Val Ser
705                 710                 715                 720
Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro Asn Glu Phe Glu Ile Lys
                725                 730                 735
Arg Thr Val Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys Asn Met Thr
            740                 745                 750
Lys Asp Trp Phe Leu Val Gln Met Leu Ala His Tyr Asn Ile Gly Tyr
        755                 760                 765
Gln Gly Phe Tyr Val Pro Glu Gly Tyr Lys Asp Arg Met Tyr Ser Phe
    770                 775                 780
Phe Arg Asn Phe Gln Pro Met Ser Arg Gln Val Val Asp Glu Val Asn
785                 790                 795                 800
Tyr Lys Asp Tyr Gln Ala Val Thr Leu Ala Tyr Gln His Asn Asn Ser
                805                 810                 815
Gly Phe Val Gly Tyr Leu Ala Pro Thr Met Arg Gln Gly Gln Pro Tyr
            820                 825                 830
Pro Ala Asn Tyr Pro Tyr Pro Leu Ile Gly Lys Ser Ala Val Ala Ser
        835                 840                 845
Val Thr Gln Lys Lys Phe Leu Cys Asp Arg Val Met Trp Arg Ile Pro
    850                 855                 860
Phe Ser Ser Asn Phe Met Ser Met Gly Ala Leu Thr Asp Leu Gly Gln
865                 870                 875                 880
Asn Met Leu Tyr Ala Asn Ser Ala His Ala Leu Asp Met Asn Phe Glu
                885                 890                 895
Val Asp Pro Met Asp Glu Ser Thr Leu Leu Tyr Val Val Phe Glu Val
            900                 905                 910
Phe Asp Val Val Arg Val His Gln Pro His Arg Gly Val Ile Glu Ala
        915                 920                 925
Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr Thr
    930                 935                 940
<210>8
<211>443
<212>PRT
<213>黑猩猩腺病毒血清型Pan6
<400>8
Met Ser Lys Lys Arg Val Arg Val Asp Asp Asp Phe Asp Pro Val Tyr
1               5                   10                  15
Pro Tyr Asp Ala Asp Asn Ala Pro Thr Val Pro Phe Ile Asn Pro Pro
            20                  25                  30
Phe Val Ser Ser Asp Gly Phe Gln Glu Lys Pro Leu Gly Val Leu Ser
        35                  40                  45
Leu Arg Leu Ala Asp Pro Val Thr Thr Lys Asn Gly Glu Ile Thr Leu
    50                  55                  60
Lys Leu Gly Glu Gly Val Asp Leu Asp Ser Ser Gly Lys Leu Ile Ser
65                  70                  75                  80
Asn Thr Ala Thr Lys Ala Ala Ala Pro Leu Ser Ile Ser Asa Asn Thr
                85                  90                  95
Ile Ser Leu Lys Thr Ala Ala Pro Phe Tyr Asn Asn Asn Gly Thr Leu
            100                 105                 110
Ser Leu Asn Val Ser Thr Pro Leu Ala Val Phe Pro Thr Phe Asn Thr
        115                 120                 125
Leu Gly Ile Ser Leu Gly Asn Gly Leu Gln Thr Ser Asn Lys Leu Leu
    130                 135                 140
Thr Val Gln Leu Thr His Pro Leu Thr Phe Ser Ser Asn Ser Ile Thr
145                 150                 155                 160
Val Lys Thr Asp Lys Gly Leu Tyr Ile Asn Ser Ser Gly Asn Arg Gly
                165                 170                 175
Leu Glu Ala Asn Ile Ser Leu Lys Arg Gly Leu Val Phe Asp Gly Asn
            180                 185                 190
Ala Ile Ala Thr Tyr Ile Gly Asn Gly Leu Asp Tyr Gly Ser Tyr Asp
        195                 200                 205
Ser Asp Gly Lys Thr Arg Pro Val Ile Thr Lys Ile Gly Ala Gly Leu
    210                 215                 220
Asn Phe Asp Ala Asn Lys Ala Ile Ala Val Lys Leu Gly Thr Gly Leu
225                 230                 235                 240
Ser Phe Asp Ser Ala Gly Ala Leu Thr Ala Gly Asn Lys Gln Asp Asp
                245                 250                 255
Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro Ser Pro Asn Cys Gln Leu
            260                 265                 270
Leu Ser Asp Arg Asp Ala Lys Phe Thr Leu Cys Leu Thr Lys Cys Gly
        275                 280                 285
Ser Gln Ile Leu Gly Thr Val Ala Val Ala Ala Val Thr Val Gly Ser
    290                 295                 300
Ala Leu Asn Pro Ile Asn Asp Thr Val Lys Ser Ala Ile Val Phe Leu
305                 310                 315                 320
Arg Phe Asp Ser Asp Gly Val Leu Met Ser Asn Ser Ser Met Val Gly
                325                 330                 335
Asp Tyr Trp Asn Phe Arg Glu Gly Gln Thr Thr Gln Ser Val Ala Tyr
            340                 345                 350
Thr Asn Ala Val Gly Phe Met Pro Asn Ile Gly Ala Tyr Pro Lys Thr
        355                 360                 365
Gln Ser Lys Thr Pro Lys Asn Ser Ile Val Ser Gln Val Tyr Leu Thr
    370                 375                 380
Gly Glu Thr Thr Met Pro Met Thr Leu Thr Ile Thr Phe Asn Gly Thr
385                 390                 395                 400
Asp Glu Lys Asp Thr Thr Pro Val Ser Thr Tyr Ser Met Thr Phe Thr
                405                 410                 415
Trp Gln Trp Thr Gly Asp Tyr Lys Asp Lys Asn Ile Thr Phe Ala Thr
            420                 425                 430
Asn Ser Phe Ser Phe Ser Tyr Ile Ala Gln Glu
       435                 440
<210>9
<211>36535
<212>DNA
<213>黑猩猩腺病毒血清型Pan7
<220>
<221>CDS
<222>(13874)..(15469)
<223>L2五邻体
<220>
<221>CDS
<222>(18288)..(21086)
<223>L3六邻体
<220>
<221>CDS
<222>(32094)..(33425)
<223>L5纤维
<400>9
catcatcaat aatatacctc aaacttttgg tgcgcgttaa tatgcaaatg agctgtttga   60
atttggggag ggaggaaggt gattggccga gagacgggcg accgttaggg gcggggcggg  120
tgacgttttt aatacgtggc cgtgaggcgg agccggtttg caagttctcg tgggaaaagt  180
gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca  240
ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg  300
aatgaggaag tgaaaatctg agtaatttcg cgtttatggc agggaggagt atttgccgag     360
ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtatttt tcacctaaat     420
ttccgcgtac ggtgtcaaag tccggtgttt ttacgtaggc gtcagctgat cgccagggta     480
tttaaacctg cgctctctag tcaagaggcc actcttgagt gccagcgagt agagttttct     540
cctccgcgcc gcgagtcaga tctacacttt gaaagatgag gcacctgaga gacctgcccg     600
gtaatgtttt cctggctact gggaacgaga ttctggaatt ggtggtggac gccatgatgg     660
gtggcgaccc tcctgagccc cctaccccat ttgaggcgcc ttcgctgtac gatttgtatg     720
atctggaggt ggatgtgccc gagaacgacc ccaacgagga ggcggtgaat gatttgttta     780
gcgatgccgc gctgctggct gccgagcagg ctaatacgga ctctggctca gacagcgatt     840
cctctctcca taccccgaga cccggcagag gtgagaaaaa gatccccgag cttaaagggg     900
aagagctcga cctgcgctgc tatgaggaat gcttgcctcc gagcgatgat gaggaggacg     960
aggaggcgat tcgagctgca tcgaaccagg gagtgaaagc tgcgggcgaa agctttagcc    1020
tggactgtcc tactctgccc ggacacggct gtaagtcttg tgaatttcat cgcatgaata    1080
ctggagataa gaatgtgatg tgtgccctgt gctatatgag agcttacaac cattgtgttt    1140
acagtaagtg tgattaactt tagttgggaa ggcagagggt gactgggtgc tgactggttt    1200
atttatgtat atgttttttt atgtgtaggt cccgtctctg acgtagatga gacccccact    1260
tcagagtgca tttcatcacc cccagaaatt ggcgaggaac cgcccgaaga tattattcat    1320
agaccagttg cagtgagagt caccgggcgg agagcagctg tggagagttt ggatgacttg    1380
ctacagggtg gggatgaacc tttggacttg tgtacccgga aacgccccag gcactaagtg    1440
ccacacatgt gtgtttactt aaggtgatgt cagtatttat agggtgtgga gtgcaataaa    1500
atccgtgttg actttaagtg cgtggtttat gactcagggg tggggactgt gggtatataa    1560
gcaggtgcag acctgtgtgg tcagttcaga gcaggactca tggagatctg gacggtcttg    1620
gaagactttc accagactag acagctgcta gagaactcat cggagggggt ctcttacctg    1680
tggagattct gcttcggtgg gcctctagct aagctagtct atagggccaa acaggattat    1740
aaggatcaat ttgaggatat tttgagagag tgtcctggta tttttgactc tctcaacttg    1800
ggccatcagt ctcactttaa ccagagtatt ctgagagccc ttgacttttc tactcctggc    1860
agaactaccg ccgcggtagc cttttttgcc tttatccttg acaaatggag tcaagaaacc    1920
catttcagca gggattaccg tctggactgc ttagcagtag ctttgtggag aacatggagg    1980
tgccagcgcc tgaatgcaat ctccggctac ttgccagtac agccggtaga cacgctgagg    2040
atcctgagtc tccagtcacc ccaggaacac caacgccgcc agcagccgca gcaggagcag    2100
cagcaagagg aggaggagga tcgagaagag aacccgagag ccggtctgga ccctccggtg    2160
gcggaggagg aggagtagct gacttgtttc ccgagctgcg ccgggtgctg actaggtctt    2220
ccagtggacg ggagaggggg attaagcggg agaggcatga ggagactagc cacagaactg    2280
aactgactgt cagtctgatg agccgcaggc gcccagaatc ggtgtggtgg catgaggttc    2340
agtcgcaggg gatagatgag gtctcggtga tgcatgagaa atattccctg gaacaagtca    2400
agacttgttg gttggagcct gaggatgatt gggaggtagc catcaggaat tatgccaagc    2460
tggctctgaa gccagacaag aagtacaaga ttaccaaact gattaatatc agaaattcct    2520
gctacatttc agggaatggg gccgaggtgg agatcagtac ccaggagagg gtggccttca    2580
gatgttgtat gatgaatatg tacccggggg tggtgggcat ggagggagtc acctttatga    2640
acgcgaggtt caggggtgat gggtataatg gggtggtctt tatggccaac accaagctga    2700
cagtgcacgg atgctccttc tttgggttca ataacatgtg catcgaggcc tggggcagtg    2760
tttcagtgag gggatgcagc ttttcagcca actggatggg ggtcgtgggc agaaccaaga    2820
gcaaggtgtc agtgaagaaa tgcctgttcg agaggtgcca cctgggggtg atgagcgagg    2880
gcgaagccaa agtcaaacac tgcgcctcta ctgagacggg ctgctttgtg ctgatcaagg    2940
gcaatgccca agtcaagcat aacatgatct gtggggcctc ggatgagcgc ggctaccaga    3000
tgctgacctg cgccggtggg aacagccata tgctggccac cgtgcatgtg acctcgcacc    3060
cccgcaagac atggcccgag ttcgagcaca acgtcatgac ccgatgcaat gtgcacctgg    3120
ggtcccgccg aggcatgttc atgccctacc agtgcaacat gcaatttgtg aaggtgctgc    3180
tggagcccga tgccatgtcc agagtgagcc tgacgggggt gtttgacatg aatgtggagc    3240
tgtggaaaat tctgagatat gatgaatcca agaccaggtg ccgggcctgc gaatgcggag    3300
gcaagcacgc caggcttcag cccgtgtgtg tggaggtgac ggaggacctg cgacccgatc    3360
atttggtgtt gtcctgcaac gggacggagt tcggctccag cggggaagaa tctgactaga    3420
gtgagtagtg tttgggggag gtggagggct tgtatgaggg gcagaatgac taaaatctgt    3480
gtttttctgt gtgttgcagc agcatgagcg gaagcgcctc ctttgaggga ggggtattca    3540
gcccttatct gacggggcgt ctcccctcct gggcgggagt gcgtcagaat gtgatgggat    3600
ccacggtgga cggccggccc gtgcagcccg cgaactcttc aaccctgacc tacgcgaccc    3660
tgagctcctc gtccgtggac gcagctgccg ccgcagctgc tgcttccgcc gccagcgccg    3720
tgcgcggaat ggccctgggc gccggctact acagctctct ggtggccaac tcgacttcca    3780
ccaataatcc cgccagcctg aacgaggaga agctgctgct gctgatggcc cagctcgagg    3840
ccctgaccca gcgcctgggc gagctgaccc agcaggtggc tcagctgcag gcggagacgc    3900
gggccgcggt tgccacggtg aaaaccaaat aaaaaatgaa tcaataaata aacggagacg    3960
gttgttgatt ttaacacaga gtcttgaatc tttatttgat ttttcgcgcg cggtaggccc    4020
tggaccaccg gtctcgatca ttgagcaccc ggtggatttt ttccaggacc cggtagaggt    4080
gggcttggat gttgaggtac atgggcatga gcccgtcccg ggggtggagg tagctccatt    4140
gcagggcctc gtgctcgggg gtggtgttgt aaatcaccca gtcatagcag gggcgcaggg    4200
cgtggtgctg cacgatgtcc ttgaggagga gactgatggc cacgggcagc cccttggtgt    4260
aggtgttgac gaacctgttg agctgggagg gatgcatgcg gggggagatg agatgcatct    4320
tggcctggat cttgagattg gcgatgttcc cgcccagatc ccgccggggg ttcatgttgt    4380
gcaggaccac cagcacggtg tatccggtgc acttggggaa tttgtcatgc aacttggaag    4440
ggaaggcgtg aaagaatttg gagacgccct tgtgaccgcc caggttttcc atgcactcat    4500
ccatgatgat ggcgatgggc ccgtgggcgg cggcctgggc aaagacgttt cgggggtcgg    4560
acacatcgta gttgtggtcc tgggtgagct cgtcataggc cattttaatg aatttggggc    4620
ggagggtgcc cgactggggg acgaaggtgc cctcgatccc gggggcgtag ttgccctcgc    4680
agatctgcat ctcccaggcc ttgagctcgg agggggggat catgtccacc tgcggggcga    4740
tgaaaaaaac ggtttccggg gcgggggaga tgagctgggc cgaaagcagg ttccggagca    4800
gctgggactt gccgcagccg gtggggccgt agatgacccc gatgaccggc tgcaggtggt    4860
agttgaggga gagacagctg ccgtcctcgc ggaggagggg ggccacctcg ttcatcatct    4920
cgcgcacatg catgttctcg cgcacgagtt ccgccaggag gcgctcgccc cccagcgaga    4980
ggagctcttg cagcgaggcg aagtttttca gcggcttgag yccgtcggcc atgggcattt    5040
tggagagggt ctgttgcaag agttccagac ggtcccagag ctcggtgatg tgctctaggg    5100
catctcgatc cagcagacct cctcgtttcg cgggttgggg cgactgcggg agtagggcac    5160
caggcgatgg gcgtccagcg aggccagggt ccggtccttc cagggtcgca gggtccgcgt    5220
cagcgtggtc tccgtcacgg tgaaggggtg cgcgccgggc tgggcgcttg cgagggtgcg    5280
cttcaggctc atccggctgg tcgagaaccg ctcccggtcg gcgccctgcg cgtcggccag    5340
gtagcaattg agcatgagtt cgtagttgag cgcctcggcc gcgtggccct tggcgcggag    5400
cttacctttg gaagtgtgtc cgcagacggg acagaggagg gacttgaggg cgtagagctt    5460
gggggcgagg aagacggact cgggggcgta ggcgtccgcg ccgcagctgg cgcagacggt    5520
ctcgcactcc acgagccagg tgaggtcggg ccggttgggg tcaaaaacga ggtttcctcc    5580
gtgctttttg atgcgtttct tacctctggt ctccatgagc tcgtgtcccc gctgggtgac    5640
aaagaggctg tccgtgtccc cgtagaccga ctttatgggc cggtcctcga gcggggtgcc    5700
gcggtcctcg tcgtagagga accccgccca ctccgagacg aaggcccggg tccaggccag    5760
cacgaaggag gccacgtggg aggggtagcg gtcgttgtcc accagcgggt ccaccttctc    5820
cagggtatgc aagcacatgt ccccctcgtc cacatccagg aaggtgattg gcttgtaagt    5880
gtaggccacg tgaccggggg tcccggccgg gggggtataa aagggggcgg gcccctgctc    5940
gtcctcactg tcttccggat cgctgtccag gagcgccagc tgttggggta ggtattccct    6000
ctcgaaggct ggcataacct cggcactcag gttgtcagtt tctagaaacg aggaggattt    6060
gatattgacg gtgccgttgg agacgccttt catgagcccc tcgtccatct ggtcagaaaa    6120
gacgatcttt ttgttgtcga gcttggtggc gaaggagccg tagagggcgt tggagaggag    6180
cttggcgatg gagcgcatgg tctggttctt ttccttgtcg gcgcgctcct tggcggcgat    6240
gttgagctgc acgtactcgc gcgccacgca cttccattcg gggaagacgg tggtgagctc    6300
gtcgggcacg attctgaccc gccagccgcg gttgtgcagg gtgatgaggt ccacgctggt    6360
ggccacctcg ccgcgcaggg gctcgttggt ccagcagagg cgcccgccct tgcgcgagca    6420
gaaggggggc agcgggtcca gcatgagctc gtcggggggg tcggcgtcca cggtgaagat    6480
gccgggcaga agctcggggt cgaagtagct gatgcaggtg tccagatcgt ccagcgccgc    6540
ttgccagtcg cgcacggcca gcgcgcgctc gtaggggctg aggggcgtgc cccagggcat    6600
ggggtgcgtg agcgcggagg cgtacatgcc gcagatgtcg tagacgtaga ggggctcctc    6660
gaggacgccg atgtaggtgg ggtagcagcg ccccccgcgg atgctggcgc gcacgtagtc    6720
gtacagctcg tgcgagggcg cgaggagccc cgtgccgagg ttggagcgtt gcggcttttc    6780
ggcgcggtag acgatctggc ggaagatggc gtgggagttg gaggagatgg tgggcctctg    6840
gaagatgttg aagtgggcgt ggggcaggcc gaccgagtcc ctgatgaagt gggcgtagga    6900
gtcctgcagc ttggcgacga gctcggcggt gacgaggacg tccagggcgc agtagtcgag    6960
ggtctcttgg atgatgtcgt acttgagctg gcccttctgc ttccacagct cgcggttgag    7020
aaggaactct tcgcggtcct tccagtactc ttcgaggggg aacccgtcct gatcggcacg    7080
gtaagagccc accatgtaga actggttgac ggccttgtag gcgcagcagc ccttctccac    7140
ggggagggcg taagcttgtg cggccttgcg cagggaggtg tgggtgaggg cgaaggtgtc    7200
gcgcaccatg accttgagga actggtgctt gaagtcgagg tcgtcgcagc cgccctgctc    7260
ccagagctgg aagtccgtgc gcttcttgta ggcggggttg ggcaaagcga aagtaacatc    7320
gttgaagagg atcttgcccg cgcggggcat gaagttgcga gtgatgcgga aaggctgggg    7380
cacctcggcc cggttgttga tgacctgggc ggcgaggacg atctcgtcga agccgttgat    7440
gttgtgcccg acgatgtaga gttccacgaa tcgcgggcgg cccttaacgt ggggcagctt    7500
cttgagctcg tcgtaggtga gctcggcggg gtcgctgagc ccgtgctgct cgagggccca    7560
gtcggcgacg tgggggttgg cgctgaggaa ggaagtccag agatccacgg ccagggcggt    7620
ctgcaagcgg tcccggtact gacggaactg ctggcccacg gccatttttt cgggggtgac    7680
gcagtagaag gtgcgggggt cgccgtgcca gcggtcccac ttgagctgga gggcgaggtc    7740
gtgggcgagc tcgacgagcg gcgggtcccc ggagagtttc atgaccagca tgaaggggac    7800
gagctgcttg ccgaaggacc ccatccaggt gtaggtttcc acatcgtagg tgaggaagag    7860
cctttcggtg cgaggatgcg agccgatggg gaagaactgg atctcctgcc accagttgga    7920
ggaatggctg ttgatgtgat ggaagtagaa atgccgacgg cgcgccgagc actcgtgctt    7980
gtgtttatac aagcgtccgc agtgctcgca acgctgcacg ggatgcacgt gctgcacgag    8040
ctgtacctgg gttcctttga cgaggaattt cagtgggcag tggagcgctg gcggctgcat    8100
ctggtgctgt actacgtcct ggccatcggc gtggccatcg tctgcctcga tggtggtcat    8160
gctgacgagc ccgcgcggga ggcaggtcca gacttcggct cggacgggtc ggagagcgag    8220
gacgagggcg cgcaggccgg agctgtccag ggtcctgaga cgctgcggag tcaggtcagt    8280
gggcagcggc ggcgcgcggt tgacttgcag gagcttttcc agggcgcgcg ggaggtccag    8340
atggtacttg atctccacgg cgccgttggt ggcgacgtcc acggcttgca gggtcccgtg    8400
cccctggggc gccaccaccg tgccccgttt cttcttgggc gctgcttcca tgccggtcag    8460
aagcggcggc gaggacgcgc gccgggcggc aggggcggct cgggacccgg aggcaggggc    8520
ggcaggggca cgtcggcgcc gcgcgcgggc aggttctggt actgcgcccg gagaagactg    8580
gcgtgagcga cgacgcgacg gttgacgtcc tggatctgac gcctctgggt gaaggccacg    8640
ggacccgtga gtttgaacct gaaagagagt tcgacagaat caatctcggt atcgttgacg    8700
gcggcctgcc gcaggatctc ttgcacgtcg cccgagttgt cctggtaggc gatctcggtc    8760
atgaactgct cgatctcctc ctcctgaagg tctccgcggc cggcgcgctc gacggtggcc    8820
gcgaggtcgt tggagatgcg gcccatgagc tgcgagaagg cgttcatgcc ggcctcgttc    8880
cagacgcggc tgtagaccac ggctccgtcg gggtcgcgcg cgcgcatgac cacctgggcg    8940
aggttgagct cgacgtggcg cgtgaagacc gcgtagttgc agaggcgctg gtagaggtag    9000
ttgagcgtgg tggcgatgtg ctcggtgacg aagaagtaca tgatccagcg gcggagcggc    9060
atctcgctga cgtcgcccag ggcttccaag cgctccatgg cctcgtagaa gtccacggcg    9120
aagttgaaaa actgggagtt gcgcgccgag acggtcaact cctcctccag aagacggatg    9180
agctcagcga tggtggcgcg cacctcgcgc tcgaaggccc cggggggctc ctcttcttcc    9240
atctcttcct cctccactaa catctcttct acttcctcct caggaggcgg cggcggggga    9300
ggggccctgc gtcgccggcg gcgcacgggc agacggtcga tgaagcgctc gatggtctcc    9360
ccgcgccggc gacgcatggt ctcggtgacg gcgcgcccgt cctcgcgggg ccgcagcgtg    9420
aagacgccgc cgcgcatctc caggtggccg ccgggggggt ctccgttggg cagggagagg    9480
gcgctgacga tgcatcttat caattggccc gtagggactc cgcgcaagga cctgagcgtc    9540
tcgagatcca cgggatccga aaaccgctga acgaaggctt cgagccagtc gcagtcgcaa    9600
ggtaggctga gcccggtttc ttgttcttcg gggatttcgg gaggcgggcg ggcgatgctg    9660
ctggtgatga agttgaagta ggcggtcctg agacggcgga tggtggcgag gagcaccagg    9720
tccttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc gtggtcctga    9780
cacctggcga ggtccttgta gtagtcctgc atgagccgct ccacgggcac ctcctcctcg    9840
cccgcgcggc cgtgcatgcg cgtgagcccg aacccgcgct ggggctggac gagcgccagg    9900
tcggcgacga cgcgctcggc gaggatggcc tgctgtatct gggtgagggt ggtctggaag    9960
tcgtcgaagt cgacgaagcg gtggtaggct ccggtgttga tggtatagga gcagttggcc   10020
atgacggacc agttgacggt ctggtggccg ggtcgcacga gctcgtggta cttgaggcgc   10080
gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggtgc gcacgaggta ctggtatccg   10140
acgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc gggggcgccg   10200
ggcgcgaggt cctcgagcat gaggcggtgg tagccgtaga tgtacctgga catccaggtg   10260
atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca gatgttgcgc   10320
agcggcagga agtagttcat ggtggccgcg gtctggcccg tgaggcgcgc gcagtcgtgg   10380
atgctctaga catacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag   10440
gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag   10500
ccgcagctaa cgtggtactg gcactcccgt ctcgacccaa gcctgctaac gaaacctcca   10560
ggatacggag gcgggtcgtt ttttggcctt ggtcgctggt catgaaaaac tagtaagcgc  10620
ggaaagcgac cgcccgcgat ggctcgctgc cgtagtctgg agaaagaatc gccagggttg  10680
cgttgcggtg tgccccggtt cgagcctcag cgctcggcgc cggccggatt ccgcggctaa  10740
cgtgggcgtg gctgccccgt cgtttccaag accccttagc cagccgactt ctccagttac  10800
ggagcgagcc cctctttttc ttgtgttttt gccagatgca tcccgtactg cggcagatgc  10860
gcccccaccc tccacctcaa ccgcccctac cgccgcagca gcagcaacag ccggcgcttc  10920
tgcccccgcc ccagcagcag ccagccacta ccgcggcggc cgccgtgagc ggagccggcg  10980
ttcagtatga cctggccttg gaagagggcg aggggctggc gcggctgggg gcgtcgtcgc  11040
cggagcggca cccgcgcgtg cagatgaaaa gggacgctcg cgaggcctac gtgcccaagc  11100
agaacctgtt cagagacagg agcggcgagg agcccgagga gatgcgcgcc tcccgcttcc  11160
acgcggggcg ggagctgcgg cgcggcctgg accgaaagcg ggtgctgagg gacgaggatt  11220
tcgaggcgga cgagctgacg gggatcagcc ccgcgcgcgc gcacgtggcc gcggccaacc  11280
tggtcacggc gtacgagcag accgtgaagg aggagagcaa cttccaaaaa tccttcaaca  11340
accacgtgcg cacgctgatc gcgcgcgagg aggtgaccct gggcctgatg cacctgtggg  11400
acctgctgga ggccatcgtg cagaacccca cgagcaagcc gctgacggcg cagctgtttc  11460
tggtggtgca gcacagtcgg gacaacgaga cgttcaggga ggcgctgctg aatatcaccg  11520
agcccgaggg ccgctggctc ctggacctgg tgaacattct gcagagcatc gtggtgcagg  11580
agcgcgggct gccgctgtcc gagaagctgg cggctatcaa cttctcggtg ctgagcctgg  11640
gcaagtacta cgctaggaag atctacaaga ccccgtacgt gcccatagac aaggaggtga  11700
agatcgacgg gttttacatg cgcatgaccc tgaaagtgct gaccctgagc gacgatctgg  11760
gggtgtaccg caacgacagg atgcaccgcg cggtgagcgc cagccgccgg cgcgagctga  11820
gcgaccagga gctgatgcac agcctgcagc gggccctgac cggggccggg accgaggggg  11880
agagctactt tgacatgggc gcggacctgc gctggcagcc cagccgccgg gccttggaag  11940
ctgccggcgg ttccccctac gtggaggagg tggacgatga ggaggaggag ggcgagtacc  12000
tggaagactg atggcgcgac cgtatttttg ctagatgcag caacagccac cgcctcctga  12060
tcccgcgatg cgggcggcgc tgcagagcca gccgtccggc attaactcct cggacgattg  12120
gacccaggcc atgcaacgca tcatggcgct gacgacccgc aatcccgaag cctttagaca  12180
gcagcctcag gccaaccggc tctcggccat cctggaggcc gtggtgccct cgcgctcgaa  12240
ccccacgcac gagaaggtgc tggccatcgt gaacgcgctg gtggagaaca aggccatccg  12300
cggcgacgag gccgggctgg tgtacaacgc gctgctggag cgcgtggccc gctacaacag  12360
caccaacgtg cagacgaacc tggaccgcat ggtgaccgac gtgcgcgagg cggtgtcgca  12420
gcgcgagcgg ttccaccgcg agtcgaacct gggctccatg gtggcgctga acgccttcct  12480
gagcacgcag cccgccaacg tgccccgggg ccaggaggac tacaccaact tcatcagcgc  12540
gctgcggctg atggtggccg aggtgcccca gagcgaggtg taccagtcgg ggccggacta  12600
cttcttccag accagtcgcc agggcttgca gaccgtgaac ctgagccagg ctttcaagaa  12660
cttgcaggga ctgtggggcg tgcaggcccc ggtcggggac cgcgcgacgg tgtcgagcct  12720
gctgacgccg aactcgcgcc tgctgctgct gctggtggcg cccttcacgg acagcggcag  12780
cgtgagccgc gactcgtacc tgggctacct gcttaacctg taccgcgagg ccatcgggca  12840
ggcgcacgtg gacgagcaga cctaccagga gatcacccac gtgagccgcg cgctgggcca  12900
ggaggacccg ggcaacctgg aggccaccct gaacttcctg ctgaccaacc ggtcgcagaa  12960
gatcccgccc cagtacgcgc tgagcaccga ggaggagcgc atcctgcgct acgtgcagca  13020
gagcgtgggg ctgttcctga tgcaggaggg ggccacgccc agcgccgcgc tcgacatgac  13080
cgcgcgcaac atggagccca gcatgtacgc tcgcaaccgc ccgttcatca ataagctgat  13140
ggactacttg catcgggcgg ccgccatgaa ctcggactac tttaccaacg ccatcttgaa  13200
cccgcactgg ctcccgccgc ccgggttcta cacgggcgag tacgacatgc ccgaccccaa  13260
cgacgggttc ctgtgggacg acgtggacag cagcgtgttc tcgccgcgcc ccgccaccac  13320
cgtgtggaag aaagagggcg gggaccggcg gccgtcctcg gcgctgtccg gtcgcgcggg  13380
tgctgccgcg gcggtgcctg aggccgccag ccccttcccg agcctgccct tttcgctgaa  13440
cagcgtgcgc agcagcgagc tgggtcggct gacgcggccg cgcctgctgg gcgaggagga  13500
gtacctgaac gactccttgt tgaggcccga gcgcgagaag aacttcccca ataacgggat  13560
agagagcctg gtggacaaga tgagccgctg gaagacgtac gcgcacgagc acagggacga  13620
gccccgagct agcagcagcg caggcacccg tagacgccag cgacacgaca ggcagcgggg  13680
tctggtgtgg gacgatgagg attccgccga cgacagcagc gtgttggact tgggtgggag  13740
tggtggtggt aacccgttcg ctcacttgcg cccccgtatc gggcgcctga tgtaagaatc  13800
tgaaaaaata aaaaacggta ctcaccaagg ccatggcgac cagcgtgcgt tcttctctgt  13860
tgtttgtagt agt atg atg agg cgc gtg tac ccg gag ggt cct cct ccc     13909
               Met Met Arg Arg Val Tyr Pro Glu Gly Pro Pro Pro
               1               5                   10
tcg tac gag agc gtg atg cag cag gcg gtg gcg gcg gcg atg cag ccc    13957
Ser Tyr Glu Ser Val Met Gln Gln Ala Val Ala Ala Ala Met Gln Pro
        15                  20                  25
ccg ctg gag gcg cct tac gtg ccc ccg cgg tac ctg gcg cct acg gag    14005
Pro Leu Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu
    30                  35                  40
ggg cgg aac agc att cgt tac tcg gag ctg gca ccc ttg tac gat acc    14053
Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr
45                  50                  55                  60
acc cgg ttg tac ctg gtg gac aac aag tcg gcg gac atc gcc tcg ctg    14101
Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu
                65                  70                  75
aac tac cag aac gac cac agc aac ttc ctg acc acc gtg gtg cag aac    14149
Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn
            80                  85                  90
aac gat ttc acc ccc acg gag gcc agc acc cag acc atc aac ttt gac    14197
Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp
        95                  100                 105
gag cgc tcg cgg tgg ggc ggc cag ctg aaa acc atc atg cac acc aac    14245
Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn
    110                 115                 120
atg ccc aac gtg aac gag ttc atg tac agc aac aag ttc aag gcg cgg    14293
Met Pro Asn Val Asn Glu Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg
125                 130                 135                 140
gtg atg gtc tcg cgc aag acc ccc aat ggg gtc gcg gtg gat gag aat    14341
Val Met Val Ser Arg Lys Thr Pro Asn Gly Val Ala Val Asp Glu Asn
                145                 150                 155
tat gat ggt agt cag gac gag ctg act tac gag tgg gtg gag ttt gag    14389
Tyr Asp Gly Ser Gln Asp Glu Leu Thr Tyr Glu Trp Val Glu Phe Glu
            160                 165                 170
ctg ccc gag ggc aac ttc tcg gtg acc atg acc atc gat ctg atg aac    14437
Leu Pro Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp Leu Met Asn
        175                 180                 185
aac gcc atc atc gac aac tac ttg gcg gtg ggg cgt cag aac ggg gtg    14485
Asn Ala Ile Ile Asp Asn Tyr Leu Ala Val Gly Arg Gln Asn Gly Val
    190                 195                 200
ctg gag agc gac atc ggc gtg aag ttc gac acg cgc aac ttc cgg ctg    14533
Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu
205                 210                 215                 220
ggc tgg gac ccc gtg acc gag ctg gtg atg ccg ggc gtg tac acc aac    1458l
Gly Trp Asp Pro Val Thr Glu Leu Val Met Pro Gly Val Tyr Thr Asn
                225                 230                 235
gag gcc ttc cac ccc gac atc gtc ctg ctg ccc ggc tgc ggc gtg gac    14629
Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp
            240                 245                 250
ttc acc gag agc cgc ctc agc aac ctg ctg ggc atc cgc aag cgg cag    14677
Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln
        255                 260                 265
ccc ttc cag gag ggc ttc cag atc ctg tac gag gac ctg gag ggg ggc    14725
Pro Phe Gln Glu Gly Phe Gln Ile Leu Tyr Glu Asp Leu Glu Gly Gly
    270                 275                 280
aac atc ccc gcg ctc ttg gat gtc gaa gcc tat gag aaa agc aag gag    14773
Asn Ile Pro Ala Leu Leu Asp Val Glu Ala Tyr Glu Lys Ser Lys Glu
285                 290                 295                 300
gag gcc gcc gca gcg gcg acc gca gcc gtg gcc acc gcc tct acc gag    1482l
Glu Ala Ala Ala Ala Ala Thr Ala Ala Val Ala Thr Ala Ser Thr Glu
                305                 310                 315
gtg cgg ggc gat aat ttt gct agc gcc gcg gca gtg gcc gag gcg gct    14869
Val Arg Gly Asp Asn Phe Ala Ser Ala Ala Ala Val Ala Glu Ala Ala
            320                 325                 330
gaa acc gaa agt aag ata gtc atc cag ccg gtg gag aag gac agc aag    14917
Glu Thr Glu Ser Lys Ile ValIle Gln Pro Val Glu Lys Asp Ser Lys
        335                 340                 345
gac agg agc tac aac gtg ctc gcg gac aag aaa aac acc gcc tac cgc    14965
Asp Arg Ser Tyr Asn Val Leu Ala Asp Lys Lys Asn Thr Ala Tyr Arg
    350                 355                 360
agc tgg tac ctg gcc tac aac tac ggc gac ccc gag aag ggc gtg cgc    15013
Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg
365                 370                 375                 380
tcc tgg acg ctg ctc acc acc tcg gac gtc acc tgc ggc gtg gag caa    15061
Ser Trp Thr Leu Leu Thr Thr Ser Asp Val Thr Cys Gly Val Glu Gln
                385                 390                 395
gtc tac tgg tcg ctg ccc gac atg atg caa gac ccg gtc acc ttc cgc    15109
Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg
            400                 405                 410
tcc acg cgt caa gtt agc aac tac ccg gtg gtg ggc gcc gag ctc ctg    15157
Ser Thr Arg Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Leu
        415                 420                 425
ccc gtc tac tcc aag agc ttc ttc aac gag cag gcc gtc tac tcg cag    15205
Pro Val Tyr Ser Lys Ser Phe Phe Asn Glu Gln Ala Val Tyr Ser Gln
    430                 435                 440
cag ctg cgc gcc ttc acc tcg ctc acg cac gtc ttc aac cgc ttc ccc    15253
Gln Leu Arg Ala Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro
445                 450                 455                 460
gag aac cag atc ctc gtc cgc ccg ccc gcg ccc acc att acc acc gtc    15301
Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val
                465                 470                 475
agt gaa aac gtt cct gct ctc aca gat cac ggg acc ctg ccg ctg cgc    15349
Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg
            480                 485                 490
agc agt atc cgg gga gtc cag cgc gtg acc gtc act gac gcc aga cgc    15397
Ser Ser Ile Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg
        495                 500                 505
cgc acc tgc ccc tac gtc tac aag gcc ctg ggc gta gtc gcg ccg cgc    15445
Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Val Val Ala Pro Arg
    510                 515                 520
gtc ctc tcg agc cgc acc ttc taa aaaatgtcca ttctcatctc gcccagtaat   15499
Val Leu Ser Ser Arg Thr Phe
525                 530
aacaccggtt ggggcctgcg cgcgcccagc aagatgtacg gaggcgctcg ccaacgctcc  15559
acgcaacacc ccgtgcgcgt gcgcgggcac ttccgcgctc cctggggcgc cctcaagggc  15619
cgcgtgcgct cgcgcaccac cgtcgacgac gtgatcgacc aggtggtggc cgacgcgcgc  15679
aactacacgc ccgccgccgc gcccgcctcc accgtggacg ccgtcatcga cagcgtggtg  15739
gccgatgcgc gccggtacgc ccgcgccaag agccggcggc ggcgcatcgc ccggcggcac  15799
cggagcaccc ccgccatgcg cgcggcgcga gccttgctgc gcagggccag gcgcacggga  15859
cgcagggcca tgctcagggc ggccagacgc gcggcctccg gcagcagcag cgccggcagg  15919
acccgcagac gcgcggccac ggcggcggcg gcggccatcg ccagcatgtc ccgcccgcgg  15979
cgcggcaacg tgtactgggt gcgcgacgcc gccaccggtg tgcgcgtgcc cgtgcgcacc  16039
cgcccccctc gcacttgaag atgctgactt cgcgatgttg atgtgtccca gcggcgagga  16099
ggatgtccaa gcgcaaatac aaggaagaga tgctccaggt catcgcgcct gagatctacg  16159
gccccgcggt gaaggaggaa agaaagcccc gcaaactgaa gcgggtcaaa aaggacaaaa  16219
aggaggagga agatgtggac ggactggtgg agtttgtgcg cgagttcgcc ccccggcggc  16279
gcgtgcagtg gcgcgggcgg aaagtgaaac cggtgctgcg gcccggcacc acggtggtct  16339
tcacgcccgg cgagcgttcc ggctccgcct ccaagcgctc ctacgacgag gtgtacgggg  16399
acgaggacat cctcgagcag gcggtcgagc gtctgggcga gtttgcttac ggcaagcgca  16459
gccgccccgc gcccttgaaa gaggaggcgg tgtccatccc gctggaccac ggcaacccca  16519
cgccgagcct gaagccggtg accctgcagc aggtgctgcc gagcgcggcg ccgcgccggg  16579
gcttcaagcg cgagggcggc gaggatctgt acccgaccat gcagctgatg gtgcccaagc  16639
gccagaagct ggaggacgtg ctggagcaca tgaaggtgga ccccgaggtg cagcccgagg  16699
tcaaggtgcg gcccatcaag caggtggccc cgggcctggg cgtgcagacc gtggacatca  16759
agatccccac ggagcccatg gaaacgcaga ccgagcccgt gaagcccagc accagcacca  16819
tggaggtgca gacggatccc tggatgccgg cgccggcttc caccactcgc cgaagacgca  16879
agtacggcgc ggccagcctg ctgatgccca actacgcgct gcatccttcc atcatcccca  16939
cgccgggcta ccgcggcacg cgcttctacc gcggctacac cagcagccgc cgcaagacca  16999
ccacccgccg ccgccgtcgt cgcacccgcc gcagcagcac cgcgacttcc gccgccgccc  17059
tggtgcggag agtgtaccgc agcgggcgcg agcctctgac cctgccgcgc gcgcgctacc  17119
acccgagcat cgccatttaa ctctgccgtc gcctcctact tgcagatatg gccctcacat  17179
gccgcctccg cgtccccatt acgggctacc gaggaagaaa gccgcgccgt agaaggctga  17239
cggggaacgg gctgcgtcgc catcaccacc ggcggcggcg cgccatcagc aagcggttgg  17299
ggggaggctt cctgcccgcg ctgatcccca tcatcgccgc ggcgatcggg gcgatccccg  17359
gcatagcttc cgtggcggtg caggcctctc agcgccactg agacacagct tggaaaattt  17419
gtaataaaaa aatggactga cgctcctggt cctgtgatgt gtgtttttag atggaagaca  17479
tcaatttttc gtccctggca ccgcgacacg gcacgcggcc gtttatgggc acctggagcg  17539
acatcggcaa cagccaactg aacgggggcg ccttcaattg gagcagtctc tggagcgggc  17599
ttaagaattt cgggtccacg ctcaaaacct atggcaacaa ggcgtggaac agcagcacag  17659
ggcaggcgct gagggaaaag ctgaaagagc agaacttcca gcagaaggtg gtcgatggcc  17719
tggcctcggg catcaacggg gtggtggacc tggccaacca ggccgtgcag aaacagatca  17779
acagccgcct ggacgcggtc ccgcccgcgg ggtccgtgga gatgccccag gtggaggagg  17839
agctgcctcc cctggacaag cgcggcgaca agcgaccgcg tcccgacgcg gaggagacgc  17899
tgctgacgca cacggacgag ccgcccccgt acgaggaggc ggtgaaactg ggtctgccca  17959
ccacgcggcc cgtggcgcct ctggccaccg gggtgctgaa acccagcagc agcagccagc  18019
ccgcgaccct ggacttgcct ccgcctgctt cccgcccctc cacagtggct aagcccctgc  18079
cgccggtggc cgtcgcgtcg cgcgcccccc gaggccgccc ccaggcgaac tggcagagca  18139
ctctgaacag catcgtgggt ctgggagtgc agagtgtgaa gcgccgccgc tgctattaaa  18199
agacactgta gcgcttaact tgcttgtctg tgtgtatatg tatgtccgcc gaccagaagg  18259
aggaagaggc gcgtcgccga gttgcaag atg gcc acc cca tcg atg ctg ccc     18311
                               Met Ala Thr Pro Ser Met Leu Pro
                                           535
cag tgg gcg tac atg cac atc gcc gga cag gac gct tcg gag tac ctg    18359
Gln Trp Ala Tyr Met His Ile Ala Gly Gln Asp Ala Ser Glu Tyr Leu
540                 545                 550                 555
agt ccg ggt ctg gtg cag ttc gcc cgc gcc aca gac acc tac ttc agt    18407
Ser Pro Gly Leu Val Gln Phe Ala Arg Ala Thr Asp Thr Tyr Phe Ser
                560                 565                 570
ctg ggg aac aag ttt agg aac ccc acg gtg gcg ccc acg cac gat gtg    18455
Leu Gly Asn Lys Phe Arg Asn Pro Thr Val Ala Pro Thr His Asp Val
            575                 580                 585
acc acc gac cgc agc cag cgg ctg acg ctg cgc ttc gtg ccc gtg gac    18503
Thr Thr Asp Arg Ser Gln Arg Leu Thr Leu Arg Phe Val Pro Val Asp
        590                 595                 600
cgc gag gac aac acc tac tcg tac aaa gtg cgc tac acg ctg gcc gtg    18551
Arg Glu Asp Asn Thr Tyr Ser Tyr Lys Val Arg Tyr Thr Leu Ala Val
    605                 610                 615
ggc gac aac cgc gtg ctg gac atg gcc agc acc tac ttt gac atc cgc    18599
Gly Asp Asn Arg Val Leu Asp Met Ala Ser Thr Tyr Phe Asp Ile Arg
620                 625                 630                 635
ggc gtg ctg gat cgg ggg ccc agc ttc aaa ccc tac tcc ggc acc gcc    18647
Gly Val Leu Asp Arg Gly Pro Ser Phe Lys Pro Tyr Ser Gly Thr Ala
                640                 645                 650
tac aac agc ctg gct ccc aag gga gcg ccc aac act tgc cag tgg aca    18695
Tyr Asn Ser Leu Ala Pro Lys Gly Ala Pro Asn Thr Cys Gln Trp Thr
            655                 660                 665
tat aaa gct ggt gat act gat aca gaa aaa acc tat aca tat gga aat    18743
Tyr Lys Ala Gly Asp Thr Asp Thr Glu Lys Thr Tyr Thr Tyr Gly Asn
        670                 675                 680
gca cct gtg caa ggc att agc att aca aag gat ggt att caa ctt gga    18791
Ala Pro Val Gln Gly Ile Ser 1le Thr Lys Asp Gly Ile Gln Leu Gly
    685                 690                 695
act gac agc gat ggt cag gca atc tat gca gac gaa act tat caa cca    18839
Thr Asp Ser Asp Gly Gln AlaIle Tyr Ala Asp Glu Thr Tyr Gln Pro
700                 705                 710                 715
gag cct caa gtg ggt gat gct gaa tgg cat gac atc act ggt act gat    18887
Glu Pro Gln Val Gly Asp Ala Glu Trp His Asp Ile Thr Gly Thr Asp
                720                 725                 730
gaa aaa tat gga ggc aga gct ctt aag cct gac acc aaa atg aag cct    18935
Glu Lys Tyr Gly Gly Arg Ala Leu Lys Pro Asp Thr Lys Met Lys Pro
            735                 740                 745
tgc tat ggt tct ttt gcc aag cct acc aat aaa gaa gga ggc cag gca    18983
Cys Tyr Gly Ser Phe Ala Lys Pro Thr Asn Lys Glu Gly Gly Gln Ala
        750                 755                 760
aat gtg aaa acc gaa aca ggc ggt acc aaa gaa tat gac att gac atg    19031
Asn Val Lys Thr Glu Thr Gly Gly Thr Lys Glu Tyr Asp Ile Asp Met
    765                 770                 775
gca ttc ttc gat aat cga agt gca gct gcc gcc ggc cta gcc cca gaa    19079
Ala Phe Phe Asp Asn Arg Ser Ala Ala Ala Ala Gly Leu Ala Pro Glu
780                 785                 790                 795
att gtt ttg tat act gag aat gtg gat ctg gaa act cca gat acc cat    19127
Ile Val Leu Tyr Thr Glu Asn Val Asp Leu Glu Thr Pro Asp Thr His
                800                 805                 810
att gta tac aag gca ggt aca gat gac agt agc tct tct atc aat ttg    19175
Ile Val Tyr Lys Ala Gly Thr Asp Asp Ser Ser Ser Ser Ile Asn Leu
            815                 820                 825
ggt cag cag tcc atg ccc aac aga ccc aac tac att ggc ttc aga gac    19223
Gly Gln Gln Ser Met Pro Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp
        830                 835                 840
aac ttt atc ggt ctg atg tac tac aac agc act ggc aat atg ggt gta    19271
Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val
    845                 850                 855
ctg gct gga cag gcc tcc cag ctg aat gct gtg gtg gac ttg cag gac    19319
Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu Gln Asp
860                 865                 870                 875
aga aac acc gaa ctg tcc tac cag ctc ttg ctt gac tct ctg ggt gac    19367
Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp Ser Leu Gly Asp
                880                 885                 890
aga acc agg tat ttc agt atg tgg aat cag gcg gtg gac agt tat gac    19415
Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser Tyr Asp
            895                 900                 905
ccc gat gtg cgc att att gaa aat cac ggt gtg gag gat gaa ctt cct    19463
Pro Asp Val Arg Ile Ile Glu Asn His Gly Val Glu Asp Glu Leu Pro
        910                 915                 920
aac tat tgc ttc ccc ctg gat gct gtg ggt aga act gat act tac cag    19511
Asn Tyr Cys Phe Pro Leu Asp Ala Val Gly Arg Thr Asp Thr Tyr Gln
    925                 930                 935
gga att aag gcc aat ggt gat aat caa acc acc tgg acc aaa gat gat    19559
Gly Ile Lys Ala Asn Gly Asp Asn Gln Thr Thr Trp Thr Lys Asp Asp
940                 945                 950                 955
act gtt aat gat gct aat gaa ttg ggc aag ggc aat cct ttc gcc atg    19607
Thr Val Asn Asp Ala Asn Glu Leu Gly Lys Gly Asn Pro Phe Ala Met
                960                 965                 970
gag atc aac atc cag gcc aac ctg tgg cgg aac ttc ctc tac gcg aac    19655
Glu Ile Asn Ile Gln Ala Asn Leu Trp Arg Asn Phe Leu Tyr Ala Asn
            975                 980                 985
gtg gcg ctg tac ctg ccc gac tcc tac aag tac acg ccg gcc aac atc    19703
Val Ala Leu Tyr Leu Pro Asp Ser Tyr Lys Tyr Thr Pro  Ala Asn Ile
        990                 995                 1000
acg ctg  ccc acc aac acc aac  acc tac gat tac atg  aac ggc cgc    19748
Thr Leu  Pro Thr Asn Thr Asn  Thr Tyr Asp Tyr Met  Asn Gly Arg
    1005                 1010                 1015
gtg gtg  gcg ccc tcg ctg gtg  gac gcc tac atc aac  atc ggg gcg    19793
Val Val  Ala Pro Ser Leu Val  Asp Ala Tyr Ile Asn  Ile Gly Ala
    1020                 1025                 1030
cgc tgg  tcg ctg gac ccc atg  gac aac gtc aac ccc  ttc aac cac    19838
Arg Trp  Ser Leu Asp Pro Met  Asp Asn Val Asn Pro  Phe Asn His
    1035                 1040                 1045
cac cgc  aac gcg ggc ctg cga  tac cgc tcc atg ctc  ctg ggc aac    19883
His Arg  Asn Ala Gly Leu Arg  Tyr Arg Ser Met Leu  Leu Gly Asn
    1050                 1055                 1060
ggg cgc  tac gtg ccc ttc cac  atc cag gtg ccc caa  aag ttt ttc    19928
Gly Arg  Tyr Val Pro Phe His  Ile Gln Val Pro Gln  Lys Phe Phe
    1065                 1070                 1075
gcc atc  aag agc ctc ctg ctc  ctg ccc ggg tcc tac  acc tac gag    19973
Ala Ile  Lys Ser Leu Leu Leu  Leu Pro Gly Ser Tyr  Thr Tyr Glu
    1080                 1085                 1090
tgg aac  ttc cgc aag gac gtc  aac atg atc ctg cag  agc tcc ctc    20018
Trp Asn  Phe Arg Lys Asp Val  Asn Met Ile Leu Gln  Ser Ser Leu
    1095                 1100                 1105
ggc aac  gac ctg cgc acg gac  ggg gcc tcc atc gcc  ttc acc agc    20063
Gly Asn  Asp Leu Arg Thr Asp  Gly Ala Ser Ile Ala  Phe Thr Ser
    1110                 1115                 1120
atc aac  ctc tac gcc acc ttc  ttc ccc atg gcg cac  aac acc gcc    20108
Ile Asn  Leu Tyr Ala Thr Phe  Phe Pro Met Ala His  Asn Thr Ala
    1125                 1130                 1135
tcc acg  ctc gag gcc atg ctg  cgc aac gac acc aac  gac cag tcc    20153
Ser Thr  Leu Glu Ala Met Leu  Arg Asn Asp Thr Asn  Asp Gln Ser
    1140                 1145                 1150
ttc aac  gac tac ctc tcg gcg  gcc aac atg ctc tac  ccc atc ccg    20198
Phe Asn  Asp Tyr Leu Ser Ala  Ala Asn Met Leu Tyr  Pro Ile Pro
    1155                 1160                 1165
gcc aac  gcc acc aac gtg ccc  atc tcc atc ccc tcg  cgc aac tgg    20243
Ala Asn  Ala Thr Asn Val Pro  Ile Ser Ile Pro Ser  Arg Asn Trp
    1170                 1175                 1180
gcc gcc  ttc cgc ggc tgg tcc  ttc acg cgc ctc aag  acc cgc gag    20288
Ala Ala  Phe Arg Gly Trp Ser  Phe Thr Arg Leu Lys  Thr Arg Glu
    1185                 1190                 1195
acg ccc  tcg ctc ggc tcc ggg  ttc gac ccc tac ttc  gtc tac tcg    20333
Thr Pro  Ser Leu Gly Ser Gly  Phe Asp Pro Tyr Phe  Val Tyr Ser
    1200                 1205                 1210
ggc tcc  atc ccc tac ctc gac  ggc acc ttc tac ctc  aac cac acc    20378
Gly Ser  Ile Pro Tyr Leu Asp  Gly Thr Phe Tyr Leu  Asn His Thr
    1215                 1220                 1225
ttc aag  aag gtc tcc atc acc  ttc gac tcc tcc gtc  agc tgg ccc    20423
Phe Lys  Lys Val Ser Ile Thr  Phe Asp Ser Ser Val  Ser Trp Pro
    1230                 1235                 1240
ggc aac  gac cgc ctc ctg acg  ccc aac gag ttc gaa  atc aag cgc    20468
Gly Asn  Asp Arg Leu Leu Thr  Pro Asn Glu Phe Glu  Ile Lys Arg
    1245                 1250                 1255
acc gtc  gac gga gag ggg tac  aac gtg gcc cag tgc  aac atg acc    20513
Thr Val  Asp Gly Glu Gly Tyr  Asn Val Ala Gln Cys  Asn Met Thr
    1260                 1265                 1270
aag gac  tgg ttc ctg gtc cag  atg ctg gcc cac tac  aac atc ggc    20558
Lys Asp  Trp Phe Leu Val Gln  Met Leu Ala His Tyr  Asn Ile Gly
    1275                 1280                 1285
tac cag  ggc ttc tac gtg ccc  gag ggc tac aag gac  cgc atg tac    20603
Tyr Gln  Gly Phe Tyr Val Pro  Glu Gly Tyr Lys Asp  Arg Met Tyr
    1290                 1295                 1300
tcc ttc  ttc cgc aac ttc cag  ccc atg agc cgc cag  gtc gtg gac    20648
Ser Phe  Phe Arg Asn Phe Gln  Pro Met Ser Arg Gln  Val Val Asp
    1305                 1310                 1315
gag gtc  aac tac aag gac tac  cag gcc gtc acc ctg  gcc tac cag    20693
Glu Val  Asn Tyr Lys Asp Tyr  Gln Ala Val Thr Leu  Ala Tyr Gln
    1320                 1325                 1330
cac aac  aac tcg ggc ttc gtc  ggc tac ctc gcg ccc  acc atg cgc    20738
His Asn  Asn Ser Gly Phe Val  Gly Tyr Leu Ala Pro  Thr Met Arg
    1335                 1340                 1345
cag ggc  cag ccc tac ccc gcc  aac tac ccc tac ccg  ctc atc ggc    20783
Gln Gly  Gln Pro Tyr Pro Ala  Asn Tyr Pro Tyr Pro  Leu Ile Gly
    1350                 1355                 1360
aag agc  gcc gtc gcc agc gtc  acc cag aaa aag ttc  ctc tgc gac    20828
Lys Ser  Ala Val Ala Ser Val  Thr Gln Lys Lys Phe  Leu Cys Asp
    1365                 1370                 1375
cgg gtc  atg tgg cgc atc ccc  ttc tcc agc aac ttc  atg tcc atg    20873
Arg Val  Met Trp ArgIle Pro  Phe Ser Ser Asn Phe  Met Ser Met
    1380                 1385                 1390
ggc gcg  ctc acc gac ctc ggc  cag aac atg ctc tac  gcc aac tcc    20918
Gly Ala  Leu Thr Asp Leu Gly  Gln Asn Met Leu Tyr  Ala Asn Ser
    1395                 1400                 1405
gcc cac  gcg cta gac atg aat  ttc gaa gtc gac ccc  atg gat gag    20963
Ala His  Ala Leu Asp Met Asn  Phe Glu Val Asp Pro  Met Asp Glu
    1410                 1415                 1420
tcc acc  ctt ctc tat gtt gtc  ttc gaa gtc ttc gac  gtc gtc cga     21008
Ser Thr  Leu Leu Tyr Val Val  Phe Glu Val Phe Asp  Val Val Arg
    1425                 1430                 1435
gtg cac  cag ccc cac cgc ggc  gtc atc gag gcc gtc  tac ctg cgc     21053
Val His  Gln Pro His Arg Gly  Val Ile Glu Ala Val  Tyr Leu Arg
    1440                 1445                 1450
acg ccc  ttc tcg gcc ggc aac  gcc acc acc taa gcctcttgct           21096
Thr Pro  Phe Ser Ala Gly Asn  Ala Thr Thr
    1455                 1460
tcttgcaaga tgacggcctg cgcgggctcc ggcgagcagg agctcagggc catcctccgc  21156
gacctgggct gcgggccctg cttcctgggc accttcgaca agcgcttccc gggattcatg  21216
gccccgcaca agctggcctg cgccatcgtc aacacggccg gccgcgagac cgggggcgag  21276
cactggctgg ccttcgcctg gaacccgcgc tcccacacct gctacctctt cgaccccttc  21336
gggttctcgg acgagcgcct caagcagatc taccagttcg agtacgaggg cctgctgcgt  21396
cgcagcgccc tggccaccga ggaccgctgc gtcaccctgg aaaagtccac ccagaccgtg  21456
cagggtccgc gctcggccgc ctgcgggctc ttctgctgca tgttcctgca cgccttcgtg  21516
cactggcccg accgccccat ggacaagaac cccaccatga acttgctgac gggggtgccc  21576
aacggcatgc tccagtcgcc ccaggtggaa cccaccctgc gccgcaacca ggaggcgctc  21636
taccgcttcc tcaacgccca ctccgcctac tttcgctccc accgcgcgcg catcgagaag  21696
gccaccgcct tcgaccgcat gaatcaagac atgtaatccg gtgtgtgtat gtgaatgctt  21756
tattcatcat aataaacagc acatgtttat gccaccttct ctgaggctct gactttattt  21816
agaaatcgaa ggggttctgc cggctctcgg catggcccgc gggcagggat acgttgcgga  21876
actggtactt gggcagccac ttgaactcgg ggatcagcag cttcggcacg gggaggtcgg  21936
ggaacgagtc gctccacagc ttgcgcgtga gttgcagggc gcccagcagg tcgggcgcgg  21996
agatcttgaa atcgcagttg ggacccgcgt tctgcgcgcg agagttacgg tacacggggt  22056
tgcagcactg gaacaccatc agggccgggt gcttcacgct cgccagcacc gtcgcgtcgg  22116
tgatgccctc cacgtccaga tcctcggcgt tggccatccc gaagggggtc atcttgcagg  22176
tctgccgccc catgctgggc acgcagccgg gcttgtggtt gcaatcgcag tgcaggggga  22236
tcagcatcat ctgggcctgc tcggagctca tgcccgggta catggccttc atgaaagcct  22296
ccagctggcg gaaggcctgc tgcgccttgc cgccctcggt gaagaagacc ccgcaggact  22356
tgctagagaa ctggttggtg gcgcagccag cgtcgtgcac gcagcagcgc gcgtcgttgt  22416
tggccagctg caccacgctg cgcccccagc ggttctgggt gatcttggcc cggtcggggt  22476
tctccttcag cgcgcgctgc ccgttctcgc tcgccacatc catctcgatc gtgtgctcct  22536
tctggatcat cacggtcccg tgcaggcacc gcagcttgcc ctcggcctcg gtgcacccgt  22596
gcagccacag cgcgcagccg gtgctctccc agttcttgtg ggcgatctgg gagtgcgagt  22656
gcacgaagcc ctgcaggaag cggcccatca tcgtggtcag ggtcttgttg ctggtgaagg  22716
tcagcggaat gccgcggtgc tcctcgttca catacaggtg gcagatacgg cggtacacct  22776
cgccctgctc gggcatcagc tggaaggcgg acttcaggtc gctctccacg cggtaccggt  22836
ccatcagcag cgtcatcact tccatgccct tctcccaggc cgaaacgatc ggcaggctca  22896
gggggttctt caccgttgtc atcttagtcg ccgccgccga agtcaggggg tcgttctcgt  22956
ccagggtctc aaacactcgc ttgccgtcct tctcggtgat gcgcacgggg ggaaagctga  23016
agcccacggc cgccagctcc tcctcggcct gcctttcgtc ctcgctgtcc tggctgatgt  23076
cttgcaaagg cacatgcttg gtcttgcggg gtttcttttt gggcggcaga ggcggcggcg  23136
gagacgtgct gggcgagcgc gagttctcgc tcaccacgac tatttcttct ccttggccgt  23196
cgtccgagac cacgcggcgg taggcatgcc tcttctgggg cagaggcgga ggcgacgggc  23256
tctcgcggtt cggcgggcgg ctggcagagc cccttccgcg ttcgggggtg cgctcctggc  23316
ggcgctgctc tgactgactt cctccgcggc cggccattgt gttctcctag ggagcaagca  23376
tggagactca gccatcgtcg ccaacatcgc catctgcccc cgccgccgcc gacgagaacc  23436
agcagcagca gaatgaaagc ttaaccgccc cgccgcccag ccccacctcc gacgccgcag  23496
ccccagacat gcaagagatg gaggaatcca tcgagattga cctgggctac gtgacgcccg  23556
cggagcacga ggaggagctg gcagcgcgct tttcagcccc ggaagagaac caccaagagc  23616
agccagagca ggaagcagag agcgagcaga accaggctgg gctcgagcat ggcgactacc  23676
tgagcggggc agaggacgtg ctcatcaagc atctggcccg ccaatgcatc atcgtcaagg  23736
acgcgctgct cgaccgcgcc gaggtgcccc tcagcgtggc ggagctcagc cgcgcctacg  23796
agcgcaacct cttctcgccg cgcgtgcccc ccaagcgcca gcccaacggc acctgcgagc  23856
ccaacccgcg cctcaacttc tacccggtct tcgcggtgcc cgaggccctg gccacctacc  23916
acctcttttt caagaaccaa aggatccccg tctcctgccg cgccaaccgc acccgcgccg  23976
acgccctgct caacctgggc cccggcgccc gcctacctga tatcgcctcc ttggaagagg  24036
ttcccaagat cttcgagggt ctgggcagcg acgagactcg ggccgcgaac gctctgcaag  24096
gaagcggaga ggagcatgag caccacagcg ccctggtgga gttggaaggc gacaacgcgc  24156
gcctggcggt cctcaagcgc acggtcgagc tgacccactt cgcctacccg gcgctcaacc  24216
tgccccccaa ggtcatgagc gccgtcatgg accaggtgct catcaagcgc gcctcgcccc  24276
tctcggagga ggagatgcag gaccccgaga gctcggacga gggcaagccc gtggtcagcg  24336
acgagcagct ggcgcgctgg ctgggagcga gtagcacccc ccagagcctg gaagagcggc  24396
gcaagctcat gatggccgtg gtcctggtga ccgtggagct ggagtgtctg cgccgcttct  24456
tcgccgacgc ggagaccctg cgcaaggtcg aggagaacct gcactacctc ttcagacacg  24516
ggttcgtgcg ccaggcctgc aagatctcca acgtggagct gaccaacctg gtctcctaca  24576
tgggcatcct gcacgagaac cgcctggggc agaacgtgct gcacaccacc ctgcgcgggg  24636
aggcccgccg cgactacatc cgcgactgcg tctacctgta cctctgccac acctggcaga  24696
cgggcatggg cgtgtggcag cagtgcctgg aggagcagaa cctgaaagag ctctgcaagc  24756
tcctgcagaa gaacctcaag gccctgtgga ccgggttcga cgagcgcacc accgccgcgg  24816
acctggccga cctcatcttc cccgagcgcc tgcggctgac gctgcgcaac gggctgcccg  24876
actttatgag ccaaagcatg ttgcaaaact ttcgctcttt catcctcgaa cgctccggga  24936
tcctgcccgc cacctgctcc gcgctgccct cggacttcgt gccgctgacc ttccgcgagt  24996
gccccccgcc gctctggagc cactgctacc tgctgcgcct ggccaactac ctggcctacc  25056
actcggacgt gatcgaggac gtcagcggcg agggcctgct cgagtgccac tgccgctgca  25116
acctctgcac gccgcaccgc tccctggcct gcaaccccca gctgctgagc gagacccaga  25176
tcatcggcac cttcgagttg caaggccccg gcgagggcaa ggggggtctg aaactcaccc  25236
cggggctgtg gacctcggcc tacttgcgca agttcgtgcc cgaggactac catcccttcg  25296
agatcaggtt ctacgaggac caatcccagc cgcccaaggc cgagctgtcg gcctgcgtca  25356
tcacccaggg ggccatcctg gcccaattgc aagccatcca gaaatcccgc caagaatttc  25416
tgctgaaaaa gggccacggg gtctacttgg acccccagac cggagaggag ctcaacccca  25476
gcttccccca ggatgccccg aggaagcagc aagaagctga aagtggagct gccgccgccg  25536
ccggaggatt tggaggaaga ctgggagagc agtcaggcag aggaggagga gatggaagac  25596
tgggacagca ctcaggcaga ggaggacagc ctgcaagaca gtctggagga ggaagacgag  25656
gtggaggagg cagaggaaga agcagccgcc gccagaccgt cgtcctcggc ggaggaggag  25716
aaagcaagca gcacggatac catctccgct ccgggtcggg gtcgcggcgg ccgggcccac  25776
agtagatggg acgagaccgg gcgcttcccg aaccccacca cccagaccgg taagaaggag  25836
cggcagggat acaagtcctg gcgggggcac aaaaacgcca tcgtctcctg cttgcaagcc  25896
tgcgggggca acatctcctt cacccggcgc tacctgctct tccaccgcgg ggtgaacttc  25956
ccccgcaaca tcttgcatta ctaccgtcac ctccacagcc cctactactg tttccaagaa  26016
gaggcagaaa cccagcagca gcagcagcag cagaaaacca gcggcagcag ctagaaaatc  26076
cacagcggcg gcaggtggac tgaggatcgc ggcgaacgag ccggcgcaga cccgggagct  26136
gaggaaccgg atctttccca ccctctatgc catcttccag cagagtcggg ggcaagagca  26196
ggaactgaaa gtcaagaacc gttctctgcg ctcgctcacc cgcagttgtc tgtatcacaa  26256
gagcgaagac caacttcagc gcactctcga ggacgccgag gctctcttca acaagtactg  26316
cgcgctcact cttaaagagt agcccgcgcc cgcccacaca cggaaaaagg cgggaattac  26376
gtcaccacct gcgcccttcg cccgaccatc atcatgagca aagagattcc cacgccttac  26436
atgtggagct accagcccca gatgggcctg gccgccggcg ccgcccagga ctactccacc  26496
cgcatgaact ggctcagtgc cgggcccgcg atgatctcac gggtgaatga catccgcgcc  26556
caccgaaacc agatactcct agaacagtca gcgatcaccg ccacgccccg ccatcacctt  26616
aatccgcgta attggcccgc cgccctggtg taccaggaaa ttccccagcc cacgaccgta  26676
ctacttccgc gagacgccca ggccgaagtc cagctgacta actcaggtgt ccagctggcc  26736
ggcggcgccg ccctgtgtcg tcaccgcccc gctcagggta taaagcggct ggtgatccga  26796
ggcagaggca cacagctcaa cgacgaggtg gtgagctctt cgctgggtct gcgacctgac  26856
ggagtcttcc aactcgccgg atcggggaga tcttccttca cgcctcgtca ggccgtcctg  26916
actttggaga gttcgtcctc gcagccccgc tcgggtggca tcggcactct ccagttcgtg  26976
gaggagttca ctccctcggt ctacttcaac cccttctccg gctcccccgg ccactacccg  27036
gacgagttca tcccgaactt cgacgccatc agcgagtcgg tggacggcta cgattgaatg  27096
tcccatggtg gcgcggctga cctagctcgg cttcgacacc tggaccactg ccgccgcttc  27156
cgctgcttcg ctcgggatct cgccgagttt gcctactttg agctgcccga ggagcaccct  27216
cagggcccgg cccacggagt gcggatcgtc gtcgaagggg gtctcgactc ccacctgctt  27276
cggatcttca gccagcgtcc gatcctggcc gagcgcgagc aaggacagac ccttctgacc  27336
ctgtactgca tctgcaacca ccccggcctg catgaaagtc tttgttgtct gctgtgtact  27396
gagtataata aaagctgaga tcagcgacta ctccggactt ccgtgtgttc ctgctatcaa  27456
ccagtccctg ttcttcaccg ggaacgagac cgagctccag ctccagtgta agccccacaa  27516
gaagtacctc acctggctgt tccagggctc tccgatcgcc gttgtcaacc actgcgacaa  27576
cgacggagtc ctgctgagcg gccctgccaa ccttactttt tccacccgca gaagcaagct  27636
ccagctcttc caacccttcc tccccgggac ctatcagtgc gtctcgggac cctgccatca  27696
caccttccac ctgatcccga ataccacagc gtcgctcccc gctactaaca accaaactac  27756
ccaccaacgc caccgtcgcg acctttcctc tgggtctaat accactaccg gaggtgagct  27816
ccgaggtcga ccaacctctg ggatttacta cggcccctgg gaggtggtag ggttaatagc  27876
gctaggccta gttgcgggtg ggcttttggc tctctgctac ctatacctcc cttgctgttc  27936
gtacttagtg gtgctgtgtt gctggtttaa gaaatgggga agatcaccct agtgagctgc  27996
ggtgtgctgg tggcggtggt gctttcgatt gtgggactgg gcggcgcggc tgtagtgaag  28056
gagaaggccg atccctgctt gcatttcaat cccgacaaat gccagctgag ttttcagccc  28116
gatggcaatc ggtgcgcggt gctgatcaag tgcggatggg aatgcgagaa cgtgagaatc  28176
gagtacaata acaagactcg gaacaatact ctcgcgtccg tgtggcagcc cggggacccc  28236
gagtggtaca ccgtctctgt ccccggtgct gacggctccc cgcgcaccgt gaataatact  28296
ttcatttttg cgcacatgtg cgacacggtc atgtggatga gcaagcagta cgatatgtgg  28356
ccccccacga aggagaacat cgtggtcttc tccatcgctt acagcgtgtg cacggcgcta  28416
atcaccgcta tcgtgtgcct gagcattcac atgctcatcg ctattcgccc cagaaataat  28476
gccgaaaaag aaaaacagcc ataacacgtt ttttcacaca cctttttcag accatggcct  28536
ctgttaaatt tttgctttta tttgccagtc tcattgccgt cattcatgga atgagtaatg  28596
agaaaattac tatttacact ggcactaatc acacattgaa aggtccagaa aaagccacag  28656
aagtttcatg gtattgttat tttaatgaat cagatgtatc tactgaactc tgtggaaaca  28716
ataacaaaaa aaatgagagc attactctca tcaagtttca atgtggatct gacttaaccc  28776
taattaacat cactagagac tatgtaggta tgtattatgg aactacagca ggcatttcgg  28836
acatggaatt ttatcaagtt tctgtgtctg aacccaccac gcctagaatg accacaacca  28896
caaaaactac acctgttacc actatacagc tcactaccaa tggctttctt gccatgcttc  28956
aagtggctga aaatagcacc agcattcaac ccaccccacc cagtgaggaa attcccagat  29016
ccatgattgg cattattgtt gctgtagtgg tgtgcatgtt gatcatcgcc ttgtgcatgg  29076
tgtactatgc cttctgctac agaaagcaca gactgaacga caagctggaa cacttactaa  29136
gtgttgaatt ttaatttttt agaaccatga agatcctagg ccttttagtt ttttctatca  29196
ttacctctgc tctatgcaat tctgacaatg aggacgttac tgtcgttgtc ggatcaaatt  29256
atacactaaa aggtccagca aaaggtatgc tttcgtggta ttgttggttc ggaactgacg  29316
agcaacagac agaactttgc aatgctcaaa aaggcaaaac ctcaaattct aaaatctcta  29376
attatcaatg caatggcact gacttagtat tgctcaatgt cacgaaagca tatgctggca  29436
gttacacctg ccctggagat gatgccgaca atatgatttt ttacaaagtg gaagtggttg  29496
atcccactac tccaccgccc accaccacaa ctactcatac cacacacaca gaacaaacac  29556
cagaggcagc agaagcagag ttggccttcc aggttcacgg agattccttt gctgtcaata  29616
cccctacacc cgatcagcgg tgtccggggc tgctcgtcag cggcattgtc ggtgtgcttt  29676
cgggattagc agtcataatc atctgcatgt tcatttttgc ttgctgctat agaaggcttt  29736
accgacaaaa atcagaccca ctgctgaacc tctatgttta attttttcca gagccatgaa  29796
ggcagttagc gctctagttt tttgttcttt gattggcatt gtttttagtg ctgggttttt  29856
gaaaaatctt accatttatg aaggtgagaa tgccactcta gtgggcatca gtggtcaaaa  29916
tgtcagctgg ctaaaatacc atctagatgg gtggaaagac atttgcgatt ggaatgtcac  29976
tgtgtataca tgtaatggag ttaacctcac cattactaat gccacccaag atcagaatgg  30036
taggtttaag ggccagagtt tcactagaaa taatgggtat gaatcccata acatgtttat  30096
ctatgacgtc actgtcatca gaaatgagac tgccaccacc acacagatgc ccactacaca  30156
cagttctacc actactacca tgcaaaccac acagacaacc actacatcaa ctcagcatat  30216
gaccaccact acagcagcaa agccaagtag tgcagcgcct cagccccagg ctttggcttt  30276
gaaagctgca caacctagta caactactag gaccaatgag cagactactg aatttttgtc  30336
cactgtcgag agccacacca cagctacctc cagtgccttc tctagcaccg ccaatctctc  30396
ctcgctttcc tctacaccaa tcagtcccgc tactactccc accccagctc ttctccccac  30456
tcccctgaag caaactgagg acagcggcat gcaatggcag atcaccctgc tcattgtgat  30516
cgggttggtc atcctggccg tgttgctcta ctacatcttc tgccgccgca ttcccaacgc  30576
gcaccgcaaa ccggcctaca agcccatcgt tatcgggcag ccggagccgc ttcaggtgga  30636
agggggtcta aggaatcttc tcttctcttt tacagtatgg tgattgaact atgattccta  30696
gacaattctt gatcactatt cttatctgcc tcctccaagt ctgtgccacc ctcgctctgg  30756
tggccaacgc cagtccagac tgtattgggc ccttcgcctc ctacgtgctc tttgccttca  30816
tcacctgcat ctgctgctgt agcatagtct gcctgcttat caccttcttc cagttcattg  30876
actggatctt tgtgcgcatc gcctacctgc gccaccaccc ccagtaccgc gaccagcgag  30936
tggcgcggct gctcaggctc ctctgataag catgcgggct ctgctacttc tcgcgcttct  30996
gctgttagtg ctcccccgcc ccgtcgaccc ccggtccccc actcagtccc ccgaagaggt  31056
ccgcaaatgc aaattccaag aaccctggaa attcctcaaa tgctaccgcc aaaaatcaga  31116
catgcttccc agctggatca tgatcattgg gatcgtgaac attctggcct gcaccctcat  31176
ctcctttgtg atttacccct gctttgactt tggttggaac tcgccagagg cgctctatct  31236
cccgcctgaa cctgacacac caccacagca acctcaggca cacgcactac caccaccaca  31296
gcctaggcca caatacatgc ccatattaga ctatgaggcc gagccacagc gacccatgct  31356
ccccgctatt agttacttca atctaaccgg cggagatgac tgacccactg gccaacaaca  31416
acgtcaacga ccttctcctg gacatggacg gccgcgcctc ggagcagcga ctcgcccaac  31476
ttcgcattcg ccagcagcag gagagagccg tcaaggagct gcaggacggc atagccatcc  31536
accagtgcaa gaaaggcatc ttctgcctgg tgaaacaggc caagatctcc tacgaggtca  31596
ccccgaccga ccatcgcctc tcctacgagc tcctgcagca gcgccagaag ttcacctgcc  31656
tggtcggagt caaccccatc gtcatcaccc agcagtcggg cgataccaag gggtgcatcc  31716
actgctcctg cgactccccc gactgcgtcc acactctgat caagaccctc tgcggcctcc  31776
gcgacctcct ccccatgaac taatcacccc cttatccagt gaaataaata tcatattgat  31836
gatgatttaa ataaaaaata atcatttgat ttgaaataaa gatacaatca tattgatgat  31896
ttgagtttta aaaaataaag aatcacttac ttgaaatctg ataccaggtc tctgtccatg  31956
ttttctgcca acaccacctc actcccctct tcccagctct ggtactgcag accccggcgg  32016
gctgcaaact tcctccacac gctgaagggg atgtcaaatt cctcctgtcc ctcaatcttc  32076
attttatctt ctatcag atg tcc  aaa aag cgc gtc cgg  gtg gat gat gac   32126
                   Met Ser  Lys Lys Arg Val Arg  Val Asp Asp Asp
                       1465                 1470
ttc  gac ccc gtc tac ccc  tac gat gca gac aac  gca ccg acc gtg     32171
Phe  Asp Pro Val Tyr Pro  Tyr Asp Ala Asp Asn  Ala Pro Thr Val
1475                 1480                 1485
ccc  ttc atc aac ccc ccc  ttc gtc tct tca gat  gga ttc caa gag     32216
Pro  Phe Ile Asn Pro Pro  Phe Val Ser Ser Asp  Gly Phe Gln Glu
1490                 1495                 1500
aag  ccc ctg ggg gtg ctg  tcc ctg cga ctg gct  gac ccc gtc acc     32261
Lys  Pro Leu Gly Val Leu  Ser Leu Arg Leu Ala  Asp Pro Val Thr
1505                 1510                 1515
acc  aag aac ggg gaa atc  acc ctc aag ctg gga  gag ggg gtg gac     32306
Thr  Lys Asn Gly Glu Ile  Thr Leu Lys Leu Gly  Glu Gly Val Asp
1520                 1525                 1530
ctc  gac tcc tcg gga aaa  ctc atc tcc aac acg  gcc acc aag gcc    32351
Leu  Asp Ser Ser Gly Lys  Leu Ile Ser Asn Thr  Ala Thr Lys Ala
1535                 1540                 1545
gcc  gcc cct ctc agt ttt  tcc aac aac acc att  tcc ctt aac atg    32396
Ala  Ala Pro Leu Ser Phe  Ser Asn Asn Thr Ile  Ser Leu Asn Met
1550                 1555                 1560
gat  acc cct ctt tat acc  aaa gat gga aaa tta  tcc tta caa gtt    32441
Asp  Thr Pro Leu Tyr Thr  Lys Asp Gly Lys Leu  Ser Leu Gln Val
1565                 1570                 1575
tct  cca ccg tta aac ata  tta aaa tca acc att  ctg aac aca tta    32486
Ser  Pro Pro Leu Asn Ile  Leu Lys Ser Thr Ile  Leu Asn Thr Leu
1580                 1585                 1590
gct  gta gct tat gga tca  ggt tta gga ctg agt  ggt ggc act gct    32531
Ala  Val Ala Tyr Gly Ser  Gly Leu Gly Leu Ser  Gly Gly Thr Ala
1595                 1600                 1605
ctt  gca gta cag ttg gcc  tct cca ctc act ttt  gat gaa aaa gga    32576
Leu  Ala Val Gln Leu Ala  Ser Pro Leu Thr Phe  Asp Glu Lys Gly
1610                 1615                 1620
aat  att aaa att aac cta  gcc agt ggt cca tta  aca gtt gat gca    32621
Asn  Ile Lys Ile Asn Leu  Ala Ser Gly Pro Leu  Thr Val Asp Ala
1625                 1630                 1635
agt  cga ctt agt atc aac  tgc aaa aga ggg gtc  act gtc act acc    32666
Ser  Arg Leu Ser Ile Asn  Cys Lys Arg Gly Val  Thr Val Thr Thr
1640                 1645                 1650
tca  gga gat gca att gaa  agc aac ata agc tgg  cct aaa ggt ata    32711
Ser  Gly Asp Ala Ile Glu  Ser Asn Ile Ser Trp  Pro Lys GlyIle
1655                 1660                 1665
aga  ttt gaa ggt aat ggc  ata gct gca aac att  ggc aga gga ttg    32756
Arg  Phe Glu Gly Asn Gly  Ile Ala Ala Asn Ile  Gly Arg Gly Leu
1670                 1675                 1680
gaa  ttt gga acc act agt  aca gag act gat gtc  aca gat gca tac    32801
Glu  Phe Gly Thr Thr Ser  Thr Glu Thr Asp Val  Thr Asp Ala Tyr
1685                 1690                 1695
cca  att caa gtt aaa ttg  ggt act ggc ctt acc  ttt gac agt aca    32846
Pro  Ile Gln Val Lys Leu  Gly Thr Gly Leu Thr  Phe Asp Ser Thr
1700                 1705                 1710
ggc  gcc att gtt gct tgg  aac aaa gag gat gat  aaa ctt aca tta    32891
Gly  Ala Ile Val Ala Trp  Asn Lys Glu Asp Asp  Lys Leu Thr Leu
1715                 1720                 1725
tgg  acc aca gcc gac ccc  tcg cca aat tgc aaa  ata tac tct gaa    32936
Trp  Thr Thr Ala Asp Pro  Ser Pro Asn Cys Lys  Ile Tyr Ser Glu
1730                 1735                 1740
aaa  gat gcc aaa ctc aca  ctt tgc ttg aca aag  tgt gga agt caa    32981
Lys  Asp Ala Lys Leu Thr  Leu Cys Leu Thr Lys  Cys Gly Ser Gln
1745                 1750                 1755
att  ctg ggt act gtg act  gta ttg gca gtg aat  aat gga agt ctc     33026
Ile  Leu Gly Thr Val Thr  Val Leu Ala Val Asn  Asn Gly Ser Leu
1760                 1765                 1770
aac  cca atc aca aac aca  gta agc act gca ctc  gtc tcc ctc aag     33071
Asn  Pro Ile Thr Asn Thr  Val Ser Thr Ala Leu  Val Ser Leu Lys
1775                 1780                 1785
ttt  gat gca agt gga gtt  ttg cta agc agc tcc  aca tta gac aaa     33116
Phe  Asp Ala Ser Gly Val  Leu Leu Ser Ser Ser  Thr Leu Asp Lys
1790                 1795                 1800
gaa  tat tgg aac ttc aga  aag gga gat gtt aca  cct gct gag ccc     33161
Glu  Tyr Trp Asn Phe Arg  Lys Gly Asp Val Thr  Pro Ala Glu Pro
1805                 1810                 1815
tat  act aat gct ata ggt  ttt atg cct aac ata  aag gcc tat cct     33206
Tyr  Thr Asn Ala Ile Gly  Phe Met Pro Asn Ile  Lys Ala Tyr Pro
1820                 1825                 1830
aaa  aac aca tct gca gct  tca aaa agc cat att  gtc agt caa gtt     33251
Lys  Asn Thr Ser Ala Ala  Ser Lys Ser His Ile  Val Ser Gln Val
1835                 1840                 1845
tat  ctc aat ggg gat gag  gcc aaa cca ctg atg  ctg att att act     33296
Tyr  Leu Asn Gly Asp Glu  Ala Lys Pro Leu Met  Leu Ile Ile Thr
1850                 1855                 1860
ttt  aat gaa act gag gat  gca act tgc acc tac  agt atc act ttt     33341
Phe  Asn Glu Thr Glu Asp  Ala Thr Cys Thr Tyr  Ser Ile Thr Phe
1865                 1870                 1875
caa  tgg aaa tgg gat agt  act aag tac aca ggt  gaa aca ctt gct     33386
Gln  Trp Lys Trp Asp Ser  Thr Lys Tyr Thr Gly  Glu Thr Leu Ala
1880                 1885                 1890
acc  agc tcc ttc acc ttc  tcc tac atc gcc caa  gaa tga acactgtatc  33435
Thr  Ser Ser Phe Thr Phe  Ser Tyr Ile Ala Gln  Glu
1895                 1900                 1905
ccaccctgca tgccaaccct tcccacccca ctctgtctat ggaaaaaact ctgaagcaca  33495
aaataaaata aagttcaagt gttttattga ttcaacagtt ttacaggatt cgagcagtta  33555
tttttcctcc accctcccag gacatggaat acaccaccct ctccccccgc acagccttga  33615
acatctgaat gccattggtg atggacatgc ttttggtctc cacgttccac acagtttcag  33675
agcgagccag tctcgggtcg gtcagggaga tgaaaccctc cgggcactcc cgcatctgca  33735
cctcacagct caacagctga ggattgtcct cggtggtcgg gatcacggtt atctggaaga  33795
agcagaagag cggcggtggg aatcatagtc cgcgaacggg atcggccggt ggtgtcgcat  33855
caggccccgc agcagtcgct gccgccgccg ctccgtcaag ctgctgctca gggggtccgg  33915
gtccagggac tccctcagca tgatgcccac ggccctcagc atcagtcgtc tggtgcggcg  33975
ggcgcagcag cgcatgcgga tctcgctcag gtcgctgcag tacgtgcaac acaggaccac  34035
caggttgttc aacagtccat agttcaacac gctccagccg aaactcatcg cgggaaggat  34095
gctacccacg tggccgtcgt accagatcct caggtaaatc aagtggcgct ccctccagaa  34155
cacgctgccc acgtacatga tctccttggg catgtggcgg ttcaccacct cccggtacca  34215
catcaccctc tggttgaaca tgcagccccg gatgatcctg cggaaccaca gggccagcac  34275
cgccccgccc gccatgcagc gaagagaccc cgggtcccgg caatggcaat ggaggaccca  34335
ccgctcgtac ccgtggatca tctgggagct gaacaagtct atgttggcac agcacaggca  34395
tatgctcatg catctcttca gcactctcag ctcctcgggg gtcaaaacca tatcccaggg  34455
cacggggaac tcttgcagga cagcgaaccc cgcagaacag ggcaatcctc gcacataact  34515
tacattgtgc atggacaggg tatcgcaatc aggcagcacc gggtgatcct ccaccagaga  34575
agcgcgggtc tcggtctcct cacagcgtgg taagggggcc ggccgatacg ggtgatggcg  34635
ggacgcggct gatcgtgttc gcgaccgtgt catgatgcag ttgctttcgg acattttcgt  34695
acttgctgta gcagaacctg gtccgggcgc tgcacaccga tcgccggcgg cggtcccggc  34755
gcttggaacg ctcggtgttg aaattgtaaa acagccactc tctcagaccg tgcagcagat  34815
ctagggcctc aggagtgatg aagatcccat catgcctgat agctctgatc acatcgacca  34875
ccgtggaatg ggccagaccc agccagatga tgcaattttg ttgggtttcg gtgacggcgg  34935
gggagggaag aacaggaaga accatgatta acttttaatc caaacggtct cggagcactt  34995
caaaatgaag gtcgcggaga tggcacctct cgcccccgct gtgttggtgg aaaataacag  35055
ccaggtcaaa ggtgatacgg ttctcgagat gttccacggt ggcttccagc aaagcctcca  35115
cgcgcacatc cagaaacaag acaatagcga aagcgggagg gttctctaat tcctcaatca  35175
tcatgttaca ctcctgcacc atccccagat aattttcatt tttccagcct tgaatgattc  35235
gaactagttc ctgaggtaaa tccaagccag ccatgataaa gagctcgcgc agagcgccct  35295
ccaccggcat tcttaagcac accctcataa ttccaagata ttctgctcct ggttcacctg  35355
cagcagattg acaagcggaa tatcaaaatc tctgccgcga tccctaagct cctccctcag  35415
caataactgt aagtactctt tcatatcctc tccgaaattt ttagccatag gaccaccagg  35475
aataagatta gggcaagcca cagtacagat aaaccgaagt cctccccagt gagcattgcc  35535
aaatgcaaga ctgctataag catgctggct agacccggtg atatcttcca gataactgga  35595
cagaaaatca cccaggcaat ttttaagaaa atcaacaaaa gaaaaatcct ccaggtgcac 35655
gtttagagcc tcgggaacaa cgatgaagta aatgcaagcg gtgcgttcca gcatggttag 35715
ttagctgatc tgtaaaaaac aaaaaataaa acattaaacc atgctagcct ggcgaacagg 35775
tgggtaaatc gttctctcca gcaccaggca ggccacgggg tctccggcgc gaccctcgta 35835
aaaattgtcg ctatgattga aaaccatcac agagagacgt tcccggtggc cggcgtgaat 35895
gattcgacaa gatgaataca cccccggaac attggcgtcc gcgagtgaaa aaaagcgccc 35955
gaggaagcaa taaggcacta caatgctcag tctcaagtcc agcaaagcga tgccatgcgg 36015
atgaagcaca aaatcctcag gtgcgtacaa aatgtaatta ctcccctcct gcacaggcag 36075
cgaagccccc gatccctcca gatacacata caaagcctca gcgtccatag cttaccgagc 36135
agcagcacac aacaggcgca agagtcagag aaaggctgag ctctaacctg tccacccgct 36195
ctctgctcaa tatatagccc agatctacac tgacgtaaag gccaaagtct aaaaataccc 36255
gccaaataat cacacacgcc cagcacacgc ccagaaaccg gtgacacact caaaaaaata 36315
cgcgcacttc ctcaaacgcc caaactgccg tcatttccgg gttcccacgc tacgtcatcg 36375
gaattcgact ttcaaattcc gtcgaccgtt aaaaacgtca cccgccccgc ccctaacggt 36435
cgcccgtctc tcggccaatc accttcctcc ctccccaaat tcaaacagct catttgcata 36495
ttaacgcgca ccaaaagttt gaggtatatt attgatgatg                       36535
<210>10
<211>531
<212>PRT
<213>黑猩猩腺病毒血清型Pan7
<400>10
Met Met Arg Arg Val Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser
1               5                   10                  15
Val Met Gln Gln Ala Val Ala Ala Ala Met Gln Pro Pro Leu Glu Ala
            20                  25                  30
Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg Asn Ser
        35                  40                  45
Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Leu Tyr
    50                  55                  60
Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Gln Asn
65                  70                  75                  80
Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Phe Thr
                85                  90                  95
Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg
            100                 105                 110
Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro Asn Val
        115                 120                 125
Asn Glu Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg Val Met Val Ser
    130                 135                 140
Arg Lys Thr Pro Asn Gly Val Ala Val Asp Glu Asn Tyr Asp Gly Ser
145                 150                 155                 160
Gln Asp Glu Leu Thr Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly
                165                 170                 175
Asn Phe Ser Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Ile
            180                 185                 190
Asp Asn Tyr Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp
        195                 200                 205
Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro
    210                 215                 220
Val Thr Glu Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His
225                 230                 235                 240
Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Glu Ser
                245                 250                 255
Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu
            260                 265                 270
Gly Phe Gln Ile Leu Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala
        275                 280                 285
Leu Leu Asp Val Glu Ala Tyr Glu Lys Ser Lys Glu Glu Ala Ala Ala
    290                 295                 300
Ala Ala Thr Ala Ala Val Ala Thr Ala Ser Thr Glu Val Arg Gly Asp
305                 310                 315                 320
Asn Phe Ala Ser Ala Ala Ala Val Ala Glu Ala Ala Glu Thr Glu Ser
                325                 330                 335
Lys Ile Val Ile Gln Pro Val Glu Lys Asp Ser Lys Asp Arg Ser Tyr
            340                 345                 350
Asn Val Leu Ala Asp Lys Lys Asn Thr Ala Tyr Arg Ser Trp Tyr Leu
        355                 360                 365
Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu
    370                 375                 380
Leu Thr Thr Ser Asp Val Thr Cys Gly Val Glu Gln Val Tyr Trp Ser
385                 390                 395                 400
Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln
                405                 410                 415
Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Leu Pro Val Tyr Ser
            420                 425                 430
Lys Ser Phe Phe Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Ala
        435                 440                 445
Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile
    450                 455                 460
Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val
465                 470                 475                 480
Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg
                485                 490                 495
Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro
            500                 505                 510
Tyr Val Tyr Lys Ala Leu Gly Val Val Ala Pro Arg Val Leu Ser Ser
        515                 520                 525
Arg Thr Phe
    530
<210>11
<211>932
<212>PRT
<213>黑猩猩腺病毒血清型Pan7
<400>11
Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala
1               5                   10                  15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
            20                  25                  30
Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro
        35                  40                  45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
    50                  55                  60
Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr
65                  70                  75                  80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
                85                  90                  95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
            100                 105                 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
        115                 120                 125
Ala Pro Asn Thr Cys Gln Trp Thr Tyr Lys Ala Gly Asp Thr Asp Thr
    130                 135                 140
Glu Lys Thr Tyr Thr Tyr Gly Asn Ala Pro Val Gln Gly Ile Ser Ile
145                 150                 155                 160
Thr Lys Asp Gly Ile Gln Leu Gly Thr Asp Ser Asp Gly Gln Ala Ile
                165                 170                 175
Tyr Ala Asp Glu Thr Tyr Gln Pro Glu Pro Gln Val Gly Asp Ala Glu
            180                 185                 190
Trp His Asp Ile Thr Gly Thr Asp Glu Lys Tyr Gly Gly Arg Ala Leu
        195                 200                 205
Lys Pro Asp Thr Lys Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys Pro
    210                 215                 220
Thr Asn Lys Glu Gly Gly Gln Ala Asn Val Lys Thr Glu Thr Gly Gly
225                 230                 235                 240
Thr Lys Glu Tyr Asp Ile Asp Met Ala Phe Phe Asp Asn Arg Ser Ala
                245                 250                 255
Ala Ala Ala Gly Leu Ala Pro Glu Ile Val Leu Tyr Thr Glu Asn Val
            260                 265                 270
Asp Leu Glu Thr Pro Asp Thr His Ile Val Tyr Lys Ala Gly Thr Asp
        275                 280                 285
Asp Ser Ser Ser Ser Ile Asn Leu Gly Gln Gln Ser Met Pro Asn Arg
    290                 295                 300
Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr
305                 310                 315                 320
Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu
                325                 330                 335
Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln
            340                 345                 350
Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp
        355                 360                 365
Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn
    370                 375                 380
His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asp Ala
385                 390                 395                 400
Val Gly Arg Thr Asp Thr Tyr Gln Gly Ile Lys Ala Asn Gly Asp Asn
                405                 410                 415
Gln Thr Thr Trp Thr Lys Asp Asp Thr Val Asn Asp Ala Asn Glu Leu
            420                 425                 430
Gly Lys Gly Asn Pro Phe Ala Met Glu Ile Asn Ile Gln Ala Asn Leu
        435                 440                 445
Trp Arg Asn Phe Leu Tyr Ala Asn Val Ala Leu Tyr Leu Pro Asp Ser
    450                 455                 460
Tyr Lys Tyr Thr Pro Ala Asn Ile Thr Leu Pro Thr Asn Thr Asn Thr
465                 470                 475                 480
Tyr Asp Tyr Met Asn Gly Arg Val Val Ala Pro Ser Leu Val Asp Ala
                485                 490                 495
Tyr Ile Asn Ile Gly Ala Arg Trp Ser Leu Asp Pro Met Asp Asn Val
            500                 505                 510
Asn Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met
        515                 520                 525
Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln
    530                 535                 540
Lys Phe Phe Ala Ile Lys Ser Leu Leu Leu Leu Pro Gly Ser Tyr Thr
545                 550                 555                 560
Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met Ile Leu Gln Ser Ser
                565                 570                 575
Leu Gly Asn Asp Leu Arg Thr Asp Gly Ala Ser Ile Ala Phe Thr Ser
            580                 585                 590
Ile Asn Leu Tyr Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala Ser
        595                 600                 605
Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn
    610                 615                 620
Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala
625                 630                 635                 640
Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg
                645                 650                 655
Gly Trp Ser Phe Thr Arg Leu Lys Thr Arg Glu Thr Pro Ser Leu Gly
            660                 665                 670
Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly Ser Ile Pro Tyr Leu
        675                 680                 685
Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser Ile Thr
    690                 695                 700
Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro
705                 710                 715                 720
Asn Glu Phe Glu Ile Lys Arg Thr Val Asp Gly Glu Gly Tyr Asn Val
                725                 730                 735
Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu Val Gln Met Leu Ala
            740                 745                 750
His Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Val Pro Glu Gly Tyr Lys
        755                 760                 765
Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln
    770                 775                 780
Val Val Asp Glu Val Asn Tyr Lys Asp Tyr Gln Ala Val Thr Leu Ala
785                 790                 795                 800
Tyr Gln His Asn Asn Ser Gly Phe Val Gly Tyr Leu Ala Pro Thr Met
                805                 810                 815
Arg Gln Gly Gln Pro Tyr Pro Ala Asn Tyr Pro Tyr Pro Leu Ile Gly
            820                 825                 830
Lys Ser Ala Val Ala Ser Val Thr Gln Lys Lys Phe Leu Cys Asp Arg
        835                 840                 845
Val Met Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ala
    850                 855                 860
Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala Asn Ser Ala His Ala
865                 870                 875                 880
Leu Asp Met Asn Phe Glu Val Asp Pro Met Asp Glu Ser Thr Leu Leu
                885                 890                 895
Tyr Val Val Phe Glu Val Phe Asp Val Val Arg Val His Gln Pro His
            900                 905                 910
Arg Gly Val Ile Glu Ala Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly
        915                 920                 925
Asn Ala Thr Thr
    930
<210>12
<211>443
<212>PRT
<213>黑猩猩腺病毒血清型Pan7
<400>12
Met Ser Lys Lys Arg Val Arg Val Asp Asp Asp Phe Asp Pro Val Tyr
1               5                   10                  15
Pro Tyr Asp Ala Asp Asn Ala Pro Thr Val Pro Phe Ile Asn Pro Pro
            20                  25                  30
Phe Val Ser Ser Asp Gly Phe Gln Glu Lys Pro Leu Gly Val Leu Ser
        35                  40                  45
Leu Arg Leu Ala Asp Pro Val Thr Thr Lys Asn Gly Glu Ile Thr Leu
    50                  55                  60
Lys Leu Gly Glu Gly Val Asp Leu Asp Ser Ser Gly Lys Leu Ile Ser
65                  70                  75                  80
Asn Thr Ala Thr Lys Ala Ala Ala Pro Leu Ser Phe Ser Asn Asn Thr
                85                  90                  95
Ile Ser Leu Asn Met Asp Thr Pro Leu Tyr Thr Lys Asp Gly Lys Leu
            100                 105                 110
Ser Leu Gln Val Ser Pro Pro Leu Asn Ile Leu Lys Ser Thr Ile Leu
        115                 120                 125
Asn Thr Leu Ala Val Ala Tyr Gly Ser Gly Leu Gly Leu Ser Gly Gly
    130                 135                 140
Thr Ala Leu Ala Val Gln Leu Ala Ser Pro Leu Thr Phe Asp Glu Lys
145                 150                 155                 160
Gly Asn Ile Lys Ile Asn Leu Ala Ser Gly Pro Leu Thr Val Asp Ala
                165                 170                 175
Ser Arg Leu Ser Ile Asn Cys Lys Arg Gly Val Thr Val Thr Thr Ser
            180                 185                 190
Gly Asp Ala Ile Glu Ser Asn Ile Ser Trp Pro Lys Gly Ile Arg Phe
        195                 200                 205
Glu Gly Asn Gly Ile Ala Ala Asn Ile Gly Arg Gly Leu Glu Phe Gly
    210                 215                 220
Thr Thr Ser Thr Glu Thr Asp Val Thr Asp Ala Tyr Pro Ile Gln Val
225                 230                 235                 240
Lys Leu Gly Thr Gly Leu Thr Phe Asp Ser Thr Gly Ala Ile Val Ala
                245                 250                 255
Trp Asn Lys Glu Asp Asp Lys Leu Thr Leu Trp Thr Thr Ala Asp Pro
            260                 265                 270
Ser Pro Asn Cys Lys Ile Tyr Ser Glu Lys Asp Ala Lys Leu Thr Leu
        275                 280                 285
Cys Leu Thr Lys Cys Gly Ser Gln Ile Leu Gly Thr Val Thr Val Leu
    290                 295                 300
Ala Val Asn Asn Gly Ser Leu Asn Pro Ile Thr Asn Thr Val Ser Thr
305                 310                 315                 320
Ala Leu Val Ser Leu Lys Phe Asp Ala Ser Gly Val Leu Leu Ser Ser
                325                 330                 335
Ser Thr Leu Asp Lys Glu Tyr Trp Asn Phe Arg Lys Gly Asp Val Thr
            340                 345                 350
Pro Ala Glu Pro Tyr Thr Asn Ala Ile Gly Phe Met Pro Asn Ile Lys
        355                 360                 365
Ala Tyr Pro Lys Asn Thr Ser Ala Ala Ser Lys Ser His Ile Val Ser
    370                 375                 380
Gln Val Tyr Leu Asn Gly Asp Glu Ala Lys Pro Leu Met Leu Ile Ile
385                 390                 395                 400
Thr Phe Asn Glu Thr Glu Asp Ala Thr Cys Thr Tyr Ser Ile Thr Phe
                405                 410                 415
Gln Trp Lys Trp Asp Ser Thr Lys Tyr Thr Gly Glu Thr Leu Ala Thr
            420                 425                 430
Ser Ser Phe Thr Phe Ser Tyr Ile Ala Gln Glu
        435                 440
<210>13
<211>338
<212>PRT
<213>猿猴血清型Cl
<400>13
Ala Pro Lys Gly Ala Pro Asn Thr Ser Gln Trp Leu Asp Lys Gly Val
1               5                   10                  15
Thr Thr Thr Asp Asn Asn Thr Glu Asn Gly Asp Glu Glu Asp Glu Val
            20                  25                  30
Ala Glu Glu Gly Glu Glu Glu Lys Gln Ala Thr Tyr Thr Phe Gly Asn
        35                  40                  45
Ala Pro Val Lys Ala Glu Ala Glu Ile Thr Lys Glu Gly Leu Pro Ile
    50                  55                  60
Gly Leu Glu Val Pro Ser Glu Gly Asp Pro Lys Pro Ile Tyr Ala Asp
65                  70                  75                  80
Lys Leu Tyr Gln Pro Glu Pro Gln Val Gly Glu Glu Ser Trp Thr Asp
                85                  90                  95
Thr Asp Gly Thr Asp Glu Lys Tyr Gly Gly Arg Ala Leu Lys Pro Glu
            100                 105                 110
Thr Lys Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys Pro Thr Asn Val
        115                 120                 125
Lys Gly Gly Gln Ala Lys Val Lys Lys Val Glu Glu Gly Lys Val Glu
    130                 135                 140
Tyr Asp Ile Asp Met Asn Phe Phe Asp Leu Arg Ser Gln Lys Thr Gly
145                 150                 155                 160
Leu Lys Pro Lys Ile Val Met Tyr Ala Glu Asn Val Asp Leu Glu Thr
                165                 170                 175
Pro Asp Thr His Val Val Tyr Lys Pro Gly Ala Ser Asp Ala Ser Ser
            180                 185                 190
His Ala Asn Leu Gly Gln Gln Ser Met Pro Asn Arg Pro Asn Tyr Ile
        195                 200                 205
Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly
    210                 215                 220
Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val
225                 230                 235                 240
Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp
                245                 250                 255
Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala Val
            260                 265                 270
Asp Ser Tyr Asp Pro Asp Val Arg Val Ile Glu Asn His Gly Val Glu
        275                 280                 285
Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asp Gly Val Gly Pro Arg
    290                 295                 300
Thr Asp Ser Tyr Lys Gly Ile Glu Thr Asn Gly Asp Glu Asn Thr Thr
305                 310                 315                 320
Trp Lys Asp Leu Asp Pro Asn Gly Ile Ser Glu Leu Ala Lys Gly Asn
                325                 330                 335
Pro Phe
<210>14
<211>315
<212>PRT
<213>黑猩猩腺病毒Pan-9
<400>14
Ala Pro Lys Gly Ala Pro Asn Thr Cys Gln Trp Thr Tyr Lys Ala Asp
1               5                   10                  15
Gly Glu Thr Ala Thr Glu Lys Thr Tyr Thr Tyr Gly Asn Ala Pro Val
            20                  25                  30
Gln Gly Ile Asn Ile Thr Lys Asp Gly Ile Gln Leu Gly Thr Asp Thr
        35                  40                  45
Asp Asp Gln Pro Ile Tyr Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln
    50                  55                  60
Val Gly Asp Ala Glu Trp His Asp Ile Thr Gly Thr Asp Glu Lys Tyr
65                  70                  75                  80
Gly Gly Arg Ala Leu Lys Pro Asp Thr Lys Met Lys Pro Cys Tyr Gly
                85                  90                  95
Ser Phe Ala Lys Pro Thr Asn Lys Glu Gly Gly Gln Ala Asn Val Lys
            100                 105                 110
Thr Gly Thr Gly Thr Thr Lys Glu Tyr Asp Ile Asp Met Ala Phe Phe
        115                 120                 125
Asp Asn Arg Ser Ala Ala Ala Ala Gly Leu Ala Pro Glu Ile Val Leu
    130                 135                 140
Tyr Thr Glu Asn Val Asp Leu Glu Thr Pro Asp Thr His Ile Val Tyr
145                 150                 155                 160
Lys Ala Gly Thr Asp Asp Ser Ser Ser Ser Ile Asn Leu Gly Gln Gln
                165                 170                 175
Ala Met Pro Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile
            180                 185                 190
Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly
        195                 200                 205
Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr
    210                 215                 220
Glu Leu Ser Tyr Gln Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg
225                 230                 235                 240
Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val
                245                 250                 255
Arg Ile Ile Glu Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys
            260                 265                 270
Phe Pro Leu Asp Ala Val Gly Arg Thr Asp Thr Tyr Gln Gly Ile Lys
        275                 280                 285
Ala Asn Gly Thr Asp Gln Thr Thr Trp Thr Lys Asp Asp Ser Val Asn
    290                 295                 300
Asp Ala Asn Glu Ile Gly Lys Gly Asn Pro Phe
305                 310                 315
<210>15
<211>315
<212>PRT
<213>黑猩猩腺病毒Pan-5
<400>15
Ala Pro Lys Gly Ala Pro Asn Thr Cys Gln Trp Thr Tyr Lys Ala Asp
1               5                   10                  15
Gly Asp Thr Gly Thr Glu Lys Thr Tyr Thr Tyr Gly Asn Ala Pro Val
            20                  25                  30
Gln Gly Ile Ser Ile Thr Lys Asp Gly Ile Gln Leu Gly Thr Asp Thr
        35                  40                  45
Asp Asp Gln Pro Ile Tyr Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln
    50                  55                  60
Val Gly Asp Ala Glu Trp His Asp Ile Thr Gly Thr Asp Glu Lys Tyr
65                  70                  75                  80
Gly Gly Arg Ala Leu Lys Pro Asp Thr Lys Met Lys Pro Cys Tyr Gly
                85                  90                  95
Ser Phe Ala Lys Pro Thr Asn Lys Glu Gly Gly Gln Ala Asn Val Lys
            100                 105                 110
Thr Glu Thr Gly Gly Thr Lys Glu Tyr Asp Ile Asp Met Ala Phe Phe
        115                 120                 125
Asp Asn Arg Ser Ala Ala Ala Ala Gly Leu Ala Pro Glu Ile Val Leu
   130                 135                 140
Tyr Thr Glu Asn Val Asp Leu Glu Thr Pro Asp Thr His Ile Val Tyr
145                 150                 155                 160
Lys Ala Gly Thr Asp Asp Ser Ser Ser Ser Ile Asn Leu Gly Gln Gln
                165                 170                 175
Ser Met Pro Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile
           180                 185                 190
Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly
        195                 200                 205
Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr
    210                 215                 220
Glu Leu Ser Tyr Gln Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg
225                 230                 235                 240
Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val
                245                 250                 255
Arg Ile Ile Glu Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys
            260                 265                 270
Phe Pro Leu Asp Ala Val Gly Arg Thr Asp Thr Tyr Gln Gly Ile Lys
        275                 280                 285
Ala Asn Gly Ala Asp Gln Thr Thr Trp Thr Lys Asp Asp Thr Val Asn
    290                 295                 300
Asp Ala Asn Glu Leu Gly Lys Gly Asn Pro Phe
305                 310                 315
<210>16
<211>324
<212>PRT
<213>黑猩猩腺病毒Pan-6
<400>16
Ala Pro Lys Gly Ala Pro Asn Ser Ser Gln Trp Glu Gln Ala Lys Thr
1               5                   10                  15
Gly Asn Gly Gly Thr Met Glu Thr His Thr Tyr Gly Val Ala Pro Met
            20                  25                  30
Gly Gly Glu Asn Ile Thr Lys Asp Gly Leu Gln Ile Gly Thr Asp Val
        35                  40                  45
Thr Ala Asn Gln Asn Lys Pro Ile Tyr Ala Asp Lys Thr Phe Gln Pro
    50                  55                  60
Glu Pro Gln Val Gly Glu Glu Asn Trp Gln Glu Thr Glu Asn Phe Tyr
65                  70                  75                  80
Gly Gly Arg Ala Leu Lys Lys Asp Thr Lys Met Lys Pro Cys Tyr Gly
                85                  90                  95
Ser Tyr Ala Arg Pro Thr Asn Glu Lys Gly Gly Gln Ala Lys Leu Lys
            100                 105                 110
Val Gly Asp Asp Gly Val Pro Thr Lys Glu Phe Asp Ile Asp Leu Ala
        115                 120                 125
Phe Phe Asp Thr Pro Gly Gly Thr Val Asn Gly Gln Asp Glu Tyr Lys
    130                 135                 140
Ala Asp Ile Val Met Tyr Thr Glu Asn Thr Tyr Leu Glu Thr Pro Asp
145                 150                 155                 160
Thr His Val Val Tyr Lys Pro Gly Lys Asp Asp Ala Ser Ser Glu Ile
                165                 170                 175
Asn Leu Val Gln Gln Ser Met Pro Asn Arg Pro Asn Tyr Ile Gly Phe
            180                 185                 190
Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met
        195                 200                 205
Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu
    210                 215                 220
Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp Ser Leu
225                 230                 235                 240
Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser
                245                 250                 255
Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Val Glu Asp Glu
            260                 265                 270
Leu Pro Asn Tyr Cys Phe Pro Leu Asp Gly Ser Gly Thr Asn Ala Ala
        275                 280                 285
Tyr Gln Gly Val Lys Val Lys Asp Gly Gln Asp Gly Asp Val Glu Ser
    290                 295                 300
Glu Trp Glu Asn Asp Asp Thr Val Ala Ala Arg Asn Gln Leu Cys Lys
305                 310                 315                 320
Gly Asn Ile Phe
<210>17
<211>314
<212>PRT
<213>黑猩猩腺病毒Pan-7
<400>17
Ala Pro Lys Gly Ala Pro Asn Thr Cys Gln Trp Thr Tyr Lys Ala Gly
1               5                   10                  15
Asp Thr Asp Thr Glu Lys Thr Tyr Thr Tyr Gly Asn Ala Pro Val Gln
            20                  25                  30
Gly Ile Ser Ile Thr Lys Asp Gly Ile Gln Leu Gly Thr Asp Ser Asp
        35                  40                  45
Gly Gln Ala Ile Tyr Ala Asp Glu Thr Tyr Gln Pro Glu Pro Gln Val
    50                  55                  60
Gly Asp Ala Glu Trp His Asp Ile Thr Gly Thr Asp Glu Lys Tyr Gly
65                  70                  75                  80
Gly Arg Ala Leu Lys Pro Asp Thr Lys Met Lys Pro Cys Tyr Gly Ser
                85                  90                  95
Phe Ala Lys Pro Thr Asn Lys Glu Gly Gly Gln Ala Asn Val Lys Thr
            100                 105                 110
Glu Thr Gly Gly Thr Lys Glu Tyr Asp Ile Asp Met Ala Phe Phe Asp
        115                 120                 125
Asn Arg Ser Ala Ala Ala Ala Gly Leu Ala Pro Glu Ile Val Leu Tyr
    130                 135                 140
Thr Glu Asn Val Asp Leu Glu Thr Pro Asp Thr His Ile Val Tyr Lys
145                 150                 155                 160
Ala Gly Thr Asp Asp Ser Ser Ser Ser Ile Asn Leu Gly Gln Gln Ser
                165                 170                 175
Met Pro Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly
            180                 185                 190
Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln
        195                 200                 205
Ala Ser Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu
    210                 215                 220
Leu Ser Tyr Gln Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr
225                 230                 235                 240
Phe Ser Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg
                245                 250                 255
Ile Ile Glu Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe
            260                 265                 270
Pro Leu Asp Ala Val Gly Arg Thr Asp Thr Tyr Gln Gly Ile Lys Ala
        275                 280                 285
Asn Gly Asp Asn Gln Thr Thr Trp Thr Lys Asp Asp Thr Val Asn Asp
    290                 295                 300
Ala Asn Glu Leu Gly Lys Gly Asn Pro Phe
305                 310
<210>18
<211>179
<212>PRT
<213>黑猩猩腺病毒Pan9
<400>18
Thr Leu Trp Thr Thr Pro Asp Pro Ser Pro Asn Cys Gln Ile Leu Ala
1           5                   10                  15
Glu Asn Asp Ala Lys Leu Thr Leu Cys Leu Thr Lys Cys Gly Ser Gln
        20                  25                  30
Ile Leu Ala Thr Val Ser Val Leu Val Val Gly Ser Gly Asn Leu Asn
    35                  40                  45
Pro Ile Thr Gly Thr Val Ser Ser Ala Gln Val Phe Leu Arg Phe Asp
50                  55                  60
Ala Asn Gly Val Leu Leu Thr Glu His Ser Thr Leu Lys Lys Tyr Trp
65                  70                  75                  80
Gly Tyr Arg Gln Gly Asp Ser Ile Asp Gly Thr Pro Tyr Thr Asn Ala
                85                  90                  95
Val Gly Phe Met Pro Asn Leu Lys Ala Tyr Pro Lys Ser Gln Ser Ser
            100                 105                 110
Thr Thr Lys Asn Asn Ile Val Gly Gln Val Tyr Met Asn Gly Asp Val
        115                 120                 125
Ser Lys Pro Met Leu Leu Thr Ile Thr Leu Asn Gly Thr Asp Asp Ser
    130                 135                 140
Asn Ser Thr Tyr Ser Met Ser Phe Ser Tyr Thr Trp Thr Asn Gly Ser
145                 150                 155                 160
Tyr Val Gly Ala Thr Phe Gly Ala Asn Ser Tyr Thr Phe Ser Tyr Ile
                165                 170                 175
Ala Gln Glu
<210>19
<211>185
<212>PRT
<213>黑猩猩腺病毒Pan6
<400>19
Thr Leu Trp Thr Thr Pro Asp Pro Ser Pro Asn Cys Gln Leu Leu Ser
1               5                   10                  15
Asp Arg Asp Ala Lys Phe Thr Leu Cys Leu Thr Lys Cys Gly Ser Gln
            20                 25                 30
Ile Leu Gly Thr Val Ala Val Ala Ala Val Thr Val Gly Ser Ala Leu
        35                 40                 45
Asn Pro Ile Asn Asp Thr Val Lys Ser Ala Ile Val Phe Leu Arg Phe
    50                  55                  60
Asp Ser Asp Gly Val Leu Met Ser Asn Ser Ser Met Val Gly Asp Tyr
65                  70                  75                  80
Trp Asn Phe Arg Glu Gly Gln Thr Thr Gln Ser Val Ala Tyr Thr Asn
                85                  90                  95
Ala Val Gly Phe Met Pro Asn Ile Gly Ala Tyr Pro Lys Thr Gln Ser
            100                 105                 110
Lys Thr Pro Lys Asn Ser Ile Val Ser Gln Val Tyr Leu Thr Gly Glu
        115                 120                 125
Thr Thr Met Pro Met Thr Leu Thr Ile Thr Phe Asn Gly Thr Asp Glu
    130                 135                 140
Lys Asp Thr Thr Pro Val Ser Thr Tyr Ser Met Thr Phe Thr Trp Gln
145                 150                 155                 160
Trp Thr Gly Asp Tyr Lys Asp Lys Asn Ile Thr Phe Ala Thr Asn Ser
                155                 170                 175
Phe Ser Phe Ser Tyr Ile Ala Gln Glu
            180                 185
<210>20
<211>179
<212>PRT
<213>黑猩猩腺病毒Pan7
<400>20
Thr Leu Trp Thr Thr Ala Asp Pro Ser Pro Asn Cys Lys Ile Tyr Ser
1               5                   10                  15
Glu Lys Asp Ala Lys Leu Thr Leu Cys Leu Thr Lys Cys Gly Ser Gln
            20                  25                  30
Ile Leu Gly Thr Val Thr Val Leu Ala Val Asn Asn Gly Ser Leu Asn
        35                  40                  45
Pro Ile Thr Asn Thr Val Ser Thr Ala Leu Val Ser Leu Lys Phe Asp
    50                  55                  60
Ala Ser Gly Val Leu Leu Ser Ser Ser Thr Leu Asp Lys Glu Tyr Trp
65                  70                  75                  80
Asn Phe Arg Lys Gly Asp Val Thr Pro Ala Glu Pro Tyr Thr Asn Ala
                85                  90                  95
Ile Gly Phe Met Pro Asn Ile Lys Ala Tyr Pro Lys Asn Thr Ser Ala
            100                 105                 110
Ala Ser Lys Ser His Ile Val Ser Gln Val Tyr Leu Asn Gly Asp Glu
        115                 120                 125
Ala Lys Pro Leu Met Leu Ile Ile Thr Phe Asn Glu Thr Glu Asp Ala
    130                 135                 140
Thr Cys Thr Tyr Ser Ile Thr Phe Gln Trp Lys Trp Asp Ser Thr Lys
145                 150                 155                 160
Tyr Thr Gly Glu Thr Leu Ala Thr Ser Ser Phe Thr Phe Ser Tyr Ile
                165                 170                 175
Ala Gln Glu
<210>21
<211>179
<212>PRT
<213>黑猩猩腺病毒Pan5
<400>21
Thr Leu Trp Thr Thr Ala Asp Pro Ser Pro Asn Cys His Ile Tyr Ser
1               5                   10                  15
Glu Lys Asp Ala Lys Leu Thr Leu Cys Leu Thr Lys Cys Gly Ser Gln
            20                  25                  30
Ile Leu Gly Thr Val Ser Leu Ile Ala Val Asp Thr Gly Ser Leu Asn
        35                  40                  45
Pro Ile Thr Gly Thr Val Thr Thr Ala Leu Val Ser Leu Lys Phe Asp
    50                  55                  60
Ala Asn Gly Val Leu Gln Ser Ser Ser Thr Leu Asp Ser Asp Tyr Trp
65                  70                  75                  80
Asn Phe Arg Gln Gly Asp Val Thr Pro Ala Glu Ala Tyr Thr Asn Ala
                85                  90                  95
Ile Gly Phe Met Pro Asn Leu Lys Ala Tyr Pro Lys Asn Thr Ser Gly
            100                 105                 110
Ala Ala Lys Ser His Ile Val Gly Lys Val Tyr Leu His Gly Asp Thr
        115                 120                 125
Gly Lys Pro Leu Asp Leu Ile Ile Thr Phe Asn Glu Thr Ser Asp Glu
    130                 135                 140
Ser Cys Thr Tyr Cys Ile Asn Phe Gln Trp Gln Trp Gly Ala Asp Gln
145                 150                 155                 160
Tyr Lys Asn Glu Thr Leu Ala Val Ser Ser Phe Thr Phe Ser Tyr Ile
                165                 170                 175
Ala Lys Glu
<210>22
<211>183
<212>PRT
<213>人腺病毒Ad 2
<400>22
Thr Leu Trp Thr Thr Pro Asp Pro Ser Pro Asn Cys Arg Ile His Ser
1               5                   10                  15
Asp Asn Asp Cys Lys Phe Thr Leu Val Leu Thr Lys Cys Gly Ser Gln
            20                  25                  30
Val Leu Ala Thr Val Ala Ala Leu Ala Val Ser Gly Asp Leu Ser Ser
        35                  40                  45
Met Thr Gly Thr Val Ala Ser Val Ser Ile Phe Leu Arg Phe Asp Gln
    50                  55                  60
Asn Gly Val Leu Met Glu Asn Ser Ser Leu Lys Lys His Tyr Trp Asn
65                  70                  75                  80
Phe Arg Asn Gly Asn Ser Thr Asn Ala Asn Pro Tyr Thr Asn Ala Val
                85                  90                  95
Gly Phe Met Pro Asn Leu Leu Ala Tyr Pro Lys Thr Gln Ser Gln Thr
            100                 105                 110
Ala Lys Asn Asn Ile Val Ser Gln Val Tyr Leu His Gly Asp Lys Thr
        115                 120                 125
Lys Pro Met Ile Leu Thr Ile Thr Leu Asn Gly Thr Ser Glu Ser Thr
    130                 135                 140
Glu Thr Ser Glu Val Ser Thr Tyr Ser Met Ser Phe Thr Trp Ser Trp
145                 150                 155                 160
Glu Ser Gly Lys Tyr Thr Thr Glu Thr Phe Ala Thr Asn Ser Tyr Thr
                165                 170                 175
Phe Ser Tyr Ile Ala Gln Glu
            180
<210>23
<211>182
<212>PRT
<213>人腺病毒Ad 5
<400>23
Thr Leu Trp Thr Thr Pro Ala Pro Ser Pro Asn Cys Arg Leu Asn Ala
1               5                   10                  15
Glu Lys Asp Ala Lys Leu Thr Leu Val Leu Thr Lys Cys Gly Ser Gln
            20                  25                  30
Ile Leu Ala Thr Val Ser Val Leu Ala Val Lys Gly Ser Leu Ala Pro
        35                  40                  45
Ile Ser Gly Thr Val Gln Ser Ala His Leu Ile Ile Arg Phe Asp Glu
    50                  55                  60
Asn Gly Val Leu Ile Asn Asn Ser Phe Leu Asp Pro Glu Tyr Trp Asn
65                  70                  75                  80
Phe Arg Asn Gly Asp Leu Thr Glu Gly Thr Ala Tyr Thr Asn Ala Val
                85                  90                  95
Gly Phe Met Pro Asn Leu Ser Ala Tyr Pro Lys Ser His Gly Lys Thr
            100                 105                 110
Ala Lys Ser Asn Ile Val Ser Gln Val Tyr Leu Asn Gly Asp Lys Thr
        115                 120                 125
Lys Pro Val Thr Leu Thr Ile Thr Leu Asn Gly Thr Gln Glu Thr Gly
    130                 135                 140
Asp Thr Thr Pro Ser Ala Tyr Ser Met Ser Phe Ser Trp Asp Trp Ser
145                 150                 155                 160
Gly His Asn Tyr Ile Asn Glu Ile Phe Ala Thr Ser Ser Tyr Thr Glu
                165                 170                 175
Ser Tyr Ile Ala Gln Glu
            180
<210>24
<211>34264
<212>DNA
<213>猿猴腺病毒SV-1
<220>
<221>CDS
<222>(12454)..(13965)
<223>L2五邻体
<220>
<221>CDS
<222>(16841)..(19636)
<223>L3六邻体
<220>
<221>CDS
<222>(28059)..(29150)
<223>L5纤维#2
<220>
<221>CDS
<222>(29183)..(30865)
<223>L5纤维#1
<400>24
tccttattct ggaaacgtgc caatatgata atgagcgggg aggagcgagg cggggccggg    60
gtgacgtgcg gtgacgtggg gtgacgcggg gtggcgcgag ggcggggcgg gagtggggag   120
gcgcttagtt tttacgtatg cggaaggagg ttttataccg gaagttgggt aatttgggcg   180
tatacttgta agttttgtgt aatttggcgc gaaaaccggg taatgaggaa gttgaggtta   240
atatgtactt tttatgactg ggcggaattt ctgctgatca gcagtgaact ttgggcgctg   300
acggggaggt ttcgctacgt ggcagtacca cgagaaggct caaaggtccc atttattgta   360
ctcctcagcg ttttcgctgg gtatttaaac gctgtcagat catcaagagg ccactcttga   420
gtgccggcga gtagagtttt ctcctccgcg ctgccgcgat gaggctggtt cccgagatgt   480
acggtgtttt ctgcagcgag acggcccgga actcagatga gctgcttaat acagatctgc   540
tggatgttcc caactcgcct gtggcttcgc ctccgtcgct tcatgatctt ttcgatgtgg   600
aagtggatcc accgcaagat cccaacgagg acgcggtaaa cagtatgttc cctgaatgtc   660
tgtttgaggc ggctgaggag ggttctcaca gcagtgaaga gagcagacgg ggagaggaac   720
tggacttgaa atgctacgag gaatgtctgc cttctagcga ttctgaaacg gaacagacag   780
ggggagacgg ctgtgagtcg gcaatgaaaa atgaacttgt attagactgt ccagaacatc     840
ctggtcatgg ctgccgtgcc tgtgcttttc atagaaatgc cagcggaaat cctgagactc     900
tatgtgctct gtgttatctg cgccttacca gcgattttgt atacagtaag taaagtgttt     960
tcattggcgt acggtagggg attcgttgaa gtgctttgtg acttattatg tgtcattatt    1020
tctaggtgac gtgtccgacg tggaagggga aggagataga tcaggggctg ctaattctcc    1080
ttgcactttg ggggctgtgg ttccagttgg catttttaaa ccgagtggtg gaggagaacg    1140
agccggagga gaccgagaat ctgagagccg gcctggaccc tccagtggaa gactaggtgc    1200
tgaggatgat cctgaagagg ggactagtgg gggtgctagg aaaaagcaaa aaactgagcc    1260
tgaacctaga aactttttga atgagttgac tgtaagccta atgaatcggc agcgtcctga    1320
gacggtgttt tggactgagt tggaggatga gttcaagaag ggggaattaa acctcttgta    1380
caagtatggg tttgagcagt tgaaaactca ctggttggag ccgtgggagg atatggaaat    1440
ggctctagac acctttgcta aagtggctct gcggccggat aaagtttaca ctattcgccg    1500
cactgttaat ataaaaaaga gtgtttatgt tatcggccat ggagctctgg tgcaggtgca    1560
gaccccagac cgggtggctt tcaattgcgg catgcagagt ttgggccccg gggtgatagg    1620
tttgaatgga gttacatttc aaaatgtcag gtttactggt gatgatttta atggctctgt    1680
gtttgtgact agcacccagc taaccctcca cggtgtttac ttttttaact ttaacaatac    1740
atgtgtggag tcatggggta gggtgtctct gaggggctgc agttttcatg gttgctggaa    1800
ggcggtggtg ggaagaatta aaagtgtcat gtctgtgaag aaatgcatat ttgaacgctg    1860
tgtgatagct ctagcagtag aggggtacgg acggatcagg aataacgccg catctgagaa    1920
tggatgtttt cttttgctga aaggtacggc cagcgttaag cataatatga tttgcggcag    1980
cggcctgtgc ccctcgcagc tcttaacttg cgcagatgga aactgtcaca ccttgcgcac    2040
cgtgcacata gtgtcccact cgcgccgcac ctggccaaca tttgagcaca atatgctcat    2100
gcgttgcgcc gttcacctag gtgctagacg cggcgtgttt atgccttatc aatgtaactt    2160
tagtcatact aagattttgc tggaaactga ttccttccct cgagtatgtt tcaatggggt    2220
gtttgacatg tcaatggaac tttttaaagt gataagatat gatgaaacca agtctcgttg    2280
tcgctcatgt gaatgcggag ctaatcattt gaggttgtat cctgtaaccc tgaacgttac    2340
cgaggagctg aggacggacc accacatgct gtcttgcctg cgtaccgact atgaatccag    2400
cgatgaggag tgaggtgagg ggcggagcca caaagggtat aaaggggcat gaggggtggg    2460
cgcggtgttt caaaatgagc gggacgacgg acggcaatgc gtttgagggg ggagtgttca    2520
gcccatatct gacatctcgt cttccttcct gggcaggagt tcgtcagaat gtagtgggct    2580
ccaccgtgga cggacggccg gtcgcccctg caaattccgc caccctcacc tatgccaccg    2640
tgggatcatc gttggacact gccgcggcag ctgccgcttc tgctgccgct tctactgctc    2700
gcggcatggc ggctgatttt ggactatata accaactggc cactgcagct gtggcgtctc    2760
ggtctctggt tcaagaagat gccctgaatg tgatcttgac tcgcctggag atcatgtcac    2820
gtcgcctgga cgaactggct gcgcagatat cccaagctaa ccccgatacc gcttcagaat    2880
cttaaaataa agacaaacaa atttgttgaa aagtaaaatg gctttatttg ttttttttgg    2940
ctcggtaggc tcgggtccac ctgtctcggt cgttaaggac tttgtgtatg ttttccaaaa    3000
cacggtacag atgggcttgg atgttcaagt acatgggcat gaggccatct ttggggtgga    3060
gataggacca ctgaagagcg tcatgttccg gggtggtatt gtaaatcacc cagtcgtagc    3120
agggtttttg agcgtggaac tggaatatgt ccttcaggag caggctaatg gccaagggta    3180
gacccttagt gtaggtgttt acaaagcggt tgagctggga gggatgcatg cggggggaga    3240
tgatatgcat cttggcttgg attttgaggt tagctatgtt accacccagg tctctgcggg    3300
ggttcatgtt atgaaggacc accagcacgg tatagccagt gcatttgggg aacttgtcat    3360
gcagtttgga ggggaaggcg tggaagaatt tagatacccc cttgtgcccc cctaggtttt    3420
ccatgcactc atccataata atggcaatgg gacccctggc ggccgcttta gcaaacacgt    3480
tttgggggtt ggaaacatca tagttttgct ctagagtgag ctcatcatag gccatcttta    3540
caaagcgggg taggagggtg cccgactggg ggatgatagt tccatctggg cctggagcgt    3600
agttgccctc acagatctgc atctcccagg ccttaatttc cgaggggggg atcatgtcca    3660
cctggggggc gataaaaaac acggtttctg gcggggggtt aatgagctgg gtggaaagca    3720
agttacgcaa cagctgggat ttgccgcaac cggtgggacc gtagatgacc ccgatgacgg    3780
gttgcagctg gtagttcaga gaggaacagc tgccgtcggg gcgcaggagg ggagctacct    3840
cattcatcat gcttctgaca tgtttatttt cactcactaa gttttgcaag agcctctccc    3900
cacccaggga taagagttct tccaggctgt tgaagtgttt cagcggtttc aggccgtcgg    3960
ccatgggcat cttttcaagc gactgacgaa gcaagtacag tcggtcccag agctcggtga    4020
cgtgctctat ggaatctcga tccagcagac ttcttggttt cgggggttgg gccgactttc    4080
gctgtagggc accagccggt gggcgtccag ggccgcgagg gttctgtcct tccagggtct    4140
cagcgttcgg gtgagggtgg tctcggtgac ggtgaaggga tgagccccgg gctgggcgct    4200
tgcgagggtg cgcttcaggc tcatcctgct ggtgctgaag cgggcgtcgt ctccctgtga    4260
gtcggccaga tagcaacgaa gcatgaggtc gtagctgagg gactcggccg cgtgtccctt    4320
ggcgcgcagc tttcccttgg aaacgtgctg acatttggtg cagtgcagac acttgagggc    4380
gtagagtttt ggggccagga agaccgactc gggcgagtag gcgtcggctc cgcactgagc    4440
gcagacggtc tcgcactcca ccagccacgt gagctcgggt ttagcgggat caaaaaccaa    4500
gttgcctcca ttttttttga tgcgtttctt accttgcgtc tccatgagtc tgtgtcccgc    4560
ttccgtgaca aaaaggctgt cggtatcccc gtagaccgac ttgagggggc gatcttccaa    4620
aggtgttccg aggtcttccg cgtacaggaa ctgggaccac tccgagacaa aggctcgggt    4680
ccaggctaac acgaaggagg cgatctgcga ggggtatctg tcgttttcaa tgagggggtc    4740
caccttttcc agggtgtgca gacacaggtc gtcctcctcc gcgtccacga aggtgattgg    4800
cttgtaagtg taggtcacgt gacccgcacc cccccaaggg gtataaaagg gggcgtgccc    4860
actctccccg tcactttctt ccgcatcgct gtggaccaga gccagctgtt cgggtgagta    4920
ggccctctca aaagccggca tgatttcggc gctcaagttg tcagtttcta caaacgaggt    4980
ggatttgata ttcacgtgcc ccgcggcgat gcttttgatg gtggaggggt ccatctgatc    5040
agaaaacacg atctttttat tgtcaagttt ggtggcgaaa gacccgtaga gggcgttgga    5100
aagcaacttg gcgatggagc gcagggtctg atttttctcc cgatcggccc tctccttggc    5160
ggcgatgttg agttgcacgt actcgcgggc cacgcaccgc cactcgggga acacggcggt    5220
gcgctcgtcg ggcaggatgc gcacgcgcca gccgcggttg tgcagggtga tgaggtccac    5280
gctggtggcc acctccccgc ggaggggctc gttggtccaa cacaatcgcc ccccttttct    5340
ggagcagaac ggaggcaggg gatctagcaa gttggcgggc ggggggtcgg cgtcgatggt    5400
aaatatgccg ggtagcagaa ttttattaaa ataatcgatt tcggtgtccg tgtcttgcaa    5460
cgcgtcttcc cacttcttca ccgccagggc cctttcgtag ggattcaggg gcggtcccca    5520
gggcatgggg tgggtcaggg ccgaggcgta catgccgcag atgtcgtaca cgtacagggg    5580
ctccctcaac accccgatgt aagtggggta acagcgcccc ccgcggatgc tggctcgcac    5640
gtagtcgtac atctcgtgag agggagccat gagcccgtct cccaagtggg tcttgtgggg    5700
tttttcggcc cggtagagga tctgcctgaa gatggcgtgg gagttggaag agatagtggg    5760
gcgttggaag acgttaaagt tggctccggg cagtcccacg gagtcttgga tgaactgggc    5820
gtaggattcc cggagcttgt ccaccagggc tgcggttacc agcacgtcga gagcgcagta    5880
gtccaacgtc tcgcggacca ggttgtaggc cgtctcttgt tttttctccc acagttcgcg    5940
attgaggagg tattcctcgc ggtctttcca gtactcttcg gcgggaaatc ctttttcgtc    6000
cgctcggtaa gaacctaaca tgtaaaattc gttcacggct ttgtatggac aacagccttt    6060
ttctaccggc agggcgtacg cttgagcggc ctttctgaga gaggtgtggg tgagggcgaa    6120
ggtgtcccgc accatcactt tcaggtactg atgtttgaag tccgtgtcgt cgcaggcgcc    6180
ctgttcccac agcgtgaagt cggtgcgctt tttctgcctg ggattgggga gggcgaatgt    6240
gacgtcgtta aagaggattt tcccggcgcg gggcatgaag ttgcgagaga tcctgaaggg    6300
tccgggcacg tccgagcggt tgttgatgac ttgcgccgcc aggacgatct cgtcgaagcc    6360
gttgatgttg tggcccacga tgtaaagttc gataaagcgc ggctgtccct tgagggccgg    6420
cgcttttttc aactcctcgt aggtgagaca gtccggcgag gagagaccca gctccgcccg    6480
ggcccagtcg gagagctgag ggttagccgc gaggaaagag ctccacaggt caagggctag    6540
cagagtttgc aagcggtcgc ggaactcgcg aaactttttc cccacggcca ttttctccgg    6600
cgtcaccacg tagaaagtgc aggggcggtc gttccagacg tcccatcgga gctctagggc    6660
cagctcgcag gcttgacgaa cgagggtctc ctcgcccgag acgtgcatga ccagcatgaa    6720
gggtaccaac tgtttcccga acgagcccat ccatgtgtag gtttctacgt cgtaggtgac    6780
aaagagccgc tgggtgcgcg cgtgggagcc gatcgggaag aagctgatct cctgccacca    6840
gttggaggaa tgggtgttga tgtggtgaaa gtagaagtcc cgccggcgca cagagcattc    6900
gtgctgatgt ttgtaaaagc gaccgcagta gtcgcagcgc tgcacgctct gtatctcctg    6960
aatgagatgc gcttttcgcc cgcgcaccag aaaccggagg gggaagttga gacgggggct    7020
tggtggggcg gcatcccctt cgccttggcg gtgggagtct gcgtctgcgc cctccttctc    7080
tgggtggacg acggtgggga cgacgacgcc ccgggtgccg caagtccaga tctccgccac    7140
ggaggggcgc aggcgttgca ggaggggacg cagctgcccg ctgtccaggg agtcgagggc    7200
ggccgcgctg aggtcggcgg gaagcgtttg caagttcact ttcagaagac cggtaagagc    7260
gtgagccagg tgcacatggt acttgatttc caggggggtg ttggaagagg cgtccacggc    7320
gtagaggagg ccgtgtccgc gcggggccac caccgtgccc cgaggaggtt ttatctcact    7380
cgtcgagggc gagcgccggg gggtagaggc ggctctgcgc cggggggcag cggaggcagt    7440
ggcacgtttt cgtgaggatt cggcagcggt tgatgacgag cccggagact gctggcgtgg    7500
gcgacgacgc ggcggttgag gtcctggatg tgccgtctct gcgtgaagac caccggcccc    7560
cgggtcctga acctgaaaga gagttccaca gaatcaatgt ctgcatcgtt aacggcggcc    7620
tgcctgagga tctcctgtac gtcgcccgag ttgtcttgat aggcgatctc ggccatgaac    7680
tgctccactt cttcctcgcg gaggtcgccg tggcccgctc gctccacggt ggcggccagg    7740
tcgttggaga tgcgacgcat gagttgagag aaggcgttga ggccgttctc gttccacacg    7800
cggctgtaca ccacgtttcc gaaggagtcg cgcgctcgca tgaccacctg ggccacgttg    7860
agttccacgt ggcgggcgaa gacggcgtag tttctgaggc gctggaagag gtagttgagc    7920
gtggtggcga tgtgctcgca gacgaagaag tacatgatcc agcgccgcag ggtcatctcg    7980
ttgatgtctc cgatggcttc gagacgctcc atggcctcgt agaagtcgac ggcgaagttg    8040
aaaaattggg agttgcgggc ggccaccgtg agttcttctt gcaggaggcg gatgagatcg    8100
gcgaccgtgt cgcgcacctc ctgctcgaaa gcgccccgag gcgcctctgc ttcttcctcc    8160
ggctcctcct cttccagggg cacgggttcc tccggcagct ctgcgacggg gacggggcgg    8220
cgacgtcgtc gtctgaccgg caggcggtcc acgaagcgct cgatcatttc gccgcgccgg    8280
cgacgcatgg tctcggtgac ggcgcgtccg ttttcgcgag gtcgcagttc gaagacgccg    8340
ccgcgcagag cgcccccgtg cagggagggt aagtggttag ggccgtcggg cagggacacg    8400
gcgctgacga tgcattttat caattgctgc gtaggcactc cgtgcaggga tctgagaacg    8460
tcgaggtcga cgggatccga gaacttctct aggaaagcgt ctatccaatc gcagtcgcaa    8520
ggtaagctga ggacggtggg ccgctggggg gcgtccgcgg gcagttggga ggtgatgctg    8580
ctgatgatgt aattaaagta ggcggtcttc aggcggcgga tggtggcgag gaggaccacg    8640
tctttgggcc cggcctgttg aatgcgcagg cgctcggcca tgccccaggc ctcgctctga    8700
cagcgacgca ggtctttgta gtagtcttgc atcagtctct ccaccggaac ctctgcttct    8760
cccctgtctg ccatgcgagt cgagccgaac ccccgcaggg gctgcagcaa cgctaggtcg    8820
gccacgaccc tctcggccag cacggcctgt tggatctgcg tgagggtggt ctggaagtcg    8880
tccaggtcca cgaagcggtg ataggccccc gtgttgatgg tgtaggtgca gttggccatg    8940
acggaccagt tgacgacttg catgccgggt tgggtgatct ccgtgtactt gaggcgcgag    9000
taggcgcggg actcgaacac gtagtcgttg catgtgcgta ccagatactg gtagccaacc    9060
aggaagtggg gaggcggttc tcggtacagg ggccagccga ctgtggcggg ggcgccgggg    9120
gacaggtcgt ccagcatgag gcgatggtag tggtagatgt agcgggagag ccaggtgatg    9180
ccggccgagg tggtcgcggc cctggtgaat tcgcggacgc ggttccagat gttgcgcagg    9240
gggcgaaagc gctccatggt gggcacgctc tgccccgtga ggcgggcgca atcttgtacg    9300
ctctagatgg aaaaaagaca gggcggtcat cgactccctt ccgtagctcg gggggtaaag   9360
tcgcaagggt gcggcggcgg ggaaccccgg ttcgagaccg gccggatccg ccgctcccga   9420
tgcgcctggc cccgcatcca cgacgtccgc gtcgagaccc agccgcgacg ctccgcccca   9480
atacggaggg gagtcttttg gtgttttttc gtagatgcat ccggtgctgc ggcagatgcg   9540
acctcagacg cccaccacca ccgccgcggc ggcagtaaac ctgagcggag gcggtgacag   9600
ggaggaggag gagctggctt tagacctgga agagggagag gggctggccc ggctgggagc   9660
gccgtcccca gagagacacc ctagggttca gctcgtgagg gacgccaggc aggcttttgt   9720
gccgaagcag aacctgttta gggaccgcag cggtcaggag gcggaggaga tgcgcgattg   9780
caggtttcgg gcgggtagag agctgagggc gggcttcgat cgggagcggc tcctgagggc   9840
ggaggatttc gagcccgacg agcgttctgg ggtgagcccg gcccgcgctc acgtctcggc   9900
ggccaacctg gtgagcgcgt acgagcagac ggtgaacgag gagcgcaact tccaaaagag   9960
ctttaacaat cacgtgagga ccctgatcgc gagggaggag gtgaccatcg ggctgatgca  10020
tctgtgggac ttcgtggagg cctacgtgca gaacccggcc agcaaacctc tgacggccca  10080
gctgttcctg atcgtgcagc acagccgcga caacgagacg ttccgcgacg ccatgttgaa  10140
catcgcggag cccgagggtc gctggctctt ggatctgatt aacatcctgc agagcatcgt  10200
ggtgcaggag aggggcctca gcttagcgga caaggtggcg gccattaact attcgatgca  10260
gagcctgggg aagttctacg ctcgcaagat ctacaagagc ccttacgtgc ccatagacaa  10320
ggaggtgaag atagacagct tttacatgcg catggcgctg aaggtgctga cgctgagcga  10380
cgacctcggc gtgtaccgta acgacaagat ccacaaggcg gtgagcgcca gccgccggcg  10440
ggagctgagc gacagggagc tgatgcacag cctgcagagg gcgctggcgg gcgccgggga  10500
cgaggagcgc gaggcttact tcgacatggg agccgatctg cagtggcgtc ccagcgcgcg  10560
cgccttggag gcggcgggct accccgacga ggaggatcgg gacgatttgg aggaggcagg  10620
cgagtacgag gacgaagcct gaccgggcag gtgttgtttt agatgcagcg gccggcggac  10680
ggggccaccg cggatcccgc acttttggca tccatgcaga gtcaaccttc gggcgtgacc  10740
gcctccgatg actgggcggc ggccatggac cgcattatgg cgctgactac ccgcaacccc  10800
gaggctttta gacagcaacc ccaggccaac cgtttttcgg ccatcttgga agcggtggtg  10860
ccctcccgca ccaaccccac acacgagaaa gtcctgacta tcgtgaacgc cctggtagac  10920
agcaaggcca tccgccgcga cgaggcgggc ttgatttaca acgctctgct ggaacgggtg  10980
gcgcgctaca acagcactaa cgttcagacc aatctggatc gcctcaccac cgacgtgaag  11040
gaggcgctgg ctcagaagga gcggtttctg agggacagca atctgggctc tctggtggca  11100
ctcaacgcct tcctgagcac gcagccggcc aacgtgcccc gcgggcagga ggactacgtg  11160
agcttcatca gcgctctgag gctgctggtg tccgaggtgc cccagagcga ggtgtatcag  11220
tctgggccgg attacttctt ccagacgtcc cgacagggct tgcaaacggt gaacctgact  11280
caggccttta aaaacttgca aggcatgtgg ggcgttaagg ccccggtggg cgatcgagcc  11340
accatctcca gtctgctgac ccccaacact cgcctgctgc tgctcttgat cgcgccgttc  11400
accaacagta gcactatcag ccgtgactcg tacctgggtc atctcatcac tttgtaccgc  11460
gaggccatcg gtcaggctca gatcgacgag cacacatatc aggagatcac taacgtgagc  11520
cgggccctgg gtcaggaaga taccggcagc ctggaagcca cgttgaactt tttgctaacc  11580
aaccggaggc aaaaaatacc ctcccagttt acgttaagcg ccgaggagga gaggattctg  11640
cgatacgtgc agcagtccgt gagtctgtac ttgatgcggg agggcgccac cgcttccacg  11700
gctttagaca tgacggctcg gaacatggaa ccgtcctttt actccgccca ccggccgttc  11760
attaaccgtc tgatggacta cttccatcgc gcggccgcca tgaacgggga gtacttcacc  11820
aatgccatcc tgaatccgca ttggatgccc ccgtccggct tctacaccgg cgagtttgac  11880
ctgcccgaag ccgacgacgg ctttctttgg gacgacgtgt ccgacagcat tttcacgccg  11940
ggcaatcgcc gattccagaa gaaggagggc ggagacgagc tccccctctc cagcgtggag  12000
gcggcctcta ggggagagag tccctttccc agtctgtctt ccgccagcag tggtcgggta  12060
acgcgcccgc ggttgccggg ggagagcgac tacctgaacg accccttgct gcggccggct  12120
aggaagaaaa atttccccaa caacggggtg gaaagcttgg tggataaaat gaatcgttgg  12180
aagacctacg cccaggagca gcgggagtgg gaggacagtc agccgcgacc gctggttccg  12240
ccgcactggc gtcgtcagag agaagacccg gacgactccg cagacgatag tagcgtgttg  12300
gacctgggag ggagcggagc caaccccttt gctcacttgc aacccaaggg gcgttccagt  12360
cgcctctact aataaaaaag acgcggaaac ttaccagagc catggccaca gcgtgtgtcc  12420
tttcttcctc tctttcttcc tcggcgcggc aga atg aga aga gcg gtg aga gtc   12474
                                     Met Arg Arg Ala Val Arg Val
                                     1               5
acg ccg gcg gcg tat gag ggt ccg ccc cct tct tac gaa agc gtg atg    12522
Thr Pro Ala Ala Tyr Glu Gly Pro Pro Pro Ser Tyr Glu Ser Val Met
        10                  15                  20
gga tca gcg aac gtg ccg gcc acg ctg gag gcg cct tac gtt cct ccc    12570
Gly Ser Ala Asn Val Pro Ala Thr Leu Glu Ala Pro Tyr Val Pro Pro
    25                  30                  35
aga tac ctg gga cct acg gag ggc aga aac agc atc cgt tac tcc gag    12618
Arg Tyr Leu Gly Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu
40                  45                  50                  55
ctg gca ccc ctg tac gat acc acc aag gtg tac ctg gtg gac aac aag    12666
Leu Ala Pro Leu Tyr Asp Thr Thr Lys Val Tyr Leu Val Asp Asn Lys
                60                  65                  70
tcg gcg gac atc gcc tcc ctg aat tat caa aac gat cac agc aat ttt    12714
Ser Ala Asp Ile Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe
            75                  80                  85
ctg act acc gtg gtg cag aac aat gac ttc acc ccg acg gag gcg ggc    12762
Leu Thr Thr Val Val Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Gly
        90                  95                  100
acg cag acc att aac ttt gac gag cgt tcc cgc tgg ggc ggt cag ctg    12810
Thr Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu
    105                 110                 115
aaa acc atc ctg cac acc aac atg ccc aac atc aac gag ttc atg tcc    12858
Lys Thr Ile Leu His Thr Asn Met Pro Asn Ile Asn Glu Phe Met Ser
120                 125                 130                 135
acc aac aag ttc agg gcc agg ctg atg gtt aaa aag gct gaa aac cag    12906
Thr Asn Lys Phe Arg Ala Arg Leu Met Val Lys Lys Ala Glu Asn Gln
                140                 145                 150
cct ccc gag tac gaa tgg ttt gag ttc acc att ccc gag ggc aac tat    12954
Pro Pro Glu Tyr Glu Trp Phe Glu Phe Thr Ile Pro Glu Gly Asn Tyr
            155                 160                 165
tcc gag acc atg act atc gat ctg atg aac aat gcg atc gtg gac aat    13002
Ser Glu Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Val Asp Asn
        170                 175                 180
tac ctg caa gtg ggg agg cag aac ggg gta ttg gaa agc gat atc ggc    13050
Tyr Leu Gln Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly
    185                 190                 195
gta aaa ttt gat acc aga aac ttc cga ctg ggg tgg gat ccc gtg acc    13098
Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Thr
200                 205                 210                 215
aag ctg gtg atg cca ggc gtg tac acc aac gag gct ttt cac ccc gac    13146
Lys Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp
                220                 225                 230
atc gtg ctg ctg ccg ggg tgc ggt gtg gac ttc act cag agc cgt ttg    13194
Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Gln Ser Arg Leu
            235                 240                 245
agt aac ctg tta ggg atc aga aag cgc cgc ccc ttc caa gag ggc ttt    13242
Ser Asn Leu Leu Gly Ile Arg Lys Arg Arg Pro Phe Gln Glu Gly Phe
        250                 2552                 60
cag atc atg tat gag gac ctg gaa gga ggt aac att cca ggt ttg cta    13290
Gln Ile Met Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Gly Leu Leu
    265                 270                 275
gac gtg ccg gcg tat gaa gag agt gtt aaa cag gcg gag gcg cag gga    13338
Asp Val Pro Ala Tyr Glu Glu Ser Val Lys Gln Ala Glu Ala Gln Gly
280                 285                 290                 295
cga gag att cga ggc gac acc ttt gcc acg gaa cct cac gaa ctg gta    13386
Arg Glu Ile Arg Gly Asp Thr Phe Ala Thr Glu Pro His Glu Leu Val
                300                 305                 310
ata aaa cct ctg gaa caa gac agt aaa aaa cgg agt tac aac att ata    13434
Ile Lys Pro Leu Glu Gln Asp Ser Lys Lys Arg Ser Tyr Asn Ile Ile
            315                 320                 325
tcc ggc act atg aat acc ttg tac cgg agc tgg ttt ctg gct tac aac    13482
Ser Gly Thr Met Asn Thr Leu Tyr Arg Ser Trp Phe Leu Ala Tyr Asn
        330                 335                 340
tac ggg gat ccc gaa aag gga gtg aga tca tgg acc ata ctc acc acc    13530
Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp ThrIle Leu Thr Thr
    345                 350                 355
acg gac gtg acc tgc ggc tcg cag caa gtg tac tgg tcc ctg ccg gat    13578
Thr Asp Val Thr Cys Gly Ser Gln Gln Val Tyr Trp Ser Leu Pro Asp
360                 365                 370                 375
atg atg caa gac ccg gtc acc ttc cgc ccc tcc acc caa gtc agc aac    13626
Met Met Gln Asp Pro Val Thr Phe Arg Pro Ser Thr Gln Val Ser Asn
                380                 385                 390
ttc ccg gtg gtg ggc acc gag ctg ctg ccc gtc cat gcc aag agc ttc    13674
Phe Pro Val Val Gly Thr Glu Leu Leu Pro Val His Ala Lys Ser Phe
            395                 400                 405
tac aac gaa cag gcc gtc tac tcg caa ctc att cgc cag tcc acc gcg    13722
Tyr Asn Glu Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Ser Thr Ala
        410                 415                 420
ctt acc cac gtg ttc aat cgc ttt ccc gag aac cag att ctg gtg cgc    13770
Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn GlnIle Leu Val Arg
    425                 430                 435
cct ccc gct cct acc att acc acc gtc agt gaa aac gtt ccc gcc ctc    13818
Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu
440                 445                 450                 455
aca gat cac gga acc ctg ccg ctg cgc agc agt atc agt gga gtt cag    13866
Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Ser Gly Val Gln
                460                 465                 470
cgc gtg acc atc acc gac gcc aga cgt cga acc tgt ccc tac gtt tac    13914
Arg Val Thr Ile Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr
            475                 480                 485
aaa gct ctt ggc gta gtg gct cct aaa gtg ctc tct agt cgc acc ttc    13962
Lys Ala Leu Gly Val Val Ala Pro Lys Val Leu Ser Ser Arg Thr Phe
        490                 495                 500
taa acatgtccat cctcatctct cccgataaca acaccggctg gggactgggc         14015
tccggcaaga tgtacggcgg agccaaaagg cgctccagtc agcacccagt tcgagttcgg  14075
ggccacttcc gtgctccctg gggagcttac aagcgaggac tctcgggccg aacggcggta  14135
gacgatacca tagatgccgt gattgccgac gcccgccggt acaaccccgg accggtcgct  14195
agcgccgcct ccaccgtgga ttccgtgatc gacagcgtgg tagctggcgc tcgggcctat  14255
gctcgccgca agaggcggct gcatcggaga cgtcgcccca ccgccgccat gctggcagcc  14315
agggccgtgc tgaggcgggc ccggagggta ggcagaaggg ctatgcgccg cgctgccgcc  14375
aacgccgccg ccgggagggc ccgccgacag gctgcccgcc aggctgctgc cgccatcgct  14435
agcatggcca gacccaggag agggaacgtg tactgggtgc gcgattctgt gacgggagtc  14495
cgagtgccgg tgcgcagccg acctccccga agttagaaga tccaagctgc gaagacggcg  14555
gtactgagtc tccctgttgt tatcagccca acatgagcaa gcgcaagttt aaagaagaac  14615
tgctgcagac gctggtgcct gagatctatg gccctccgga cgtgaagcct gacattaagc  14675
cccgcgatat caagcgtgtt aaaaagcggg aaaagaaaga ggaactcgcg gtggtagacg  14735
atggcggagt ggaatttatt aggagtttcg ccccgcgacg cagggttcaa tggaaagggc  14795
ggcgggtaca acgcgttttg aggccgggca ccgcggtagt ttttaccccg ggagagcggt  14855
cggccgttag gggtttcaaa aggcagtacg acgaggtgta cggcgacgag gacatattgg  14915
aacaggcggc tcaacagatc ggagaatttg cctacggaaa gcgttcgcgt cgcgaagacc  14975
tggccatcgc tttagacagc ggcaacccca cgcccagcct caaacctgtg acgctgcagc  15035
aggtgctccc cgtgagcgcc agcacggaca gcaagagggg aataaaaaga gaaatggaag  15095
atctgcagcc caccatccag ctcatggtcc ctaaacggca gaggctggaa gaggtcctgg  15155
agaaaatgaa agtggaccca agcatagagc cggacgtcaa agtcaggccg atcaaagaag  15215
tggcccctgg tctcggggtg cagacggtgg atatccagat ccccgtcacg tcagcttcga  15275
ccgccgtgga agccatggaa acgcaaacgg aaacccctgc cgcgatcggt accagggaag  15335
tggcgttgca aaccgacccc tggtacgaat acgccgcccc tcggcgtcag aggcgacccg  15395
ctcgttacgg ccccgccaac gccatcatgc cagaatatgc gctgcatccg tctatcctgc  15455
ccacccccgg ctaccgggga gtgacgtatc gcccgtcagg aacccgccgc cgaacccgtc  15515
gccgccgccg ctcccgtcgt gctctggccc ccgtgtcggt gcgccgcgta acacgccggg  15575
gaaagacagt taccattccc aacccgcgct accaccctag catcctttaa tgactctgcc  15635
gttttgcaga tggctctgac ttgccgcgtg cgccttcccg ttccgcacta tcgaggaaga  15695
tctcgtcgta ggagaggcat ggcgggtagt ggtcgccggc gggctttgcg caggcgcatg  15755
aaaggcggaa ttttacccgc tctgataccc ataatcgccg ccgccatcgg tgccataccc  15815
ggcgtcgctt cagtggcctt gcaagcagct cgtaataaat aaacgaaggc ttttgcactt  15875
atgtcctggt cctgactatt ttatgcagaa agagcatgga agacatcaat tttacgtcgc  15935
tggctccgcg gcacggctcg cggccgctca tgggcacctg gaacgacatc ggcaccagtc  15995
agctcaacgg gggcgctttc aattggggga gcctttggag cggcattaaa aactttggct  16055
ccacgattaa atcctacggc agcaaagcct ggaacagtag tgctggtcag atgctccgag  16115
ataaactgaa ggacaccaac ttccaagaaa aagtggtcaa tggggtggtg accggcatcc  16175
acggcgcggt agatctcgcc aaccaagcgg tgcagaaaga gattgacagg cgtttggaaa  16235
gctcgcgggt gccgccgcag agaggggatg aggtggaggt cgaggaagta gaagtagagg  16295
aaaagctgcc cccgctggag aaagttcccg gtgcgcctcc gagaccgcag aagcgaccca  16355
ggccagaact agaagaaact ctggtgacgg agagcaagga gcctccctcg tacgagcaag  16415
ccttgaaaga gggcgcctct ccaccctacc caatgacaaa accgatcgcg cctatggctc  16475
ggccggtgta cgggaaggac tacaagcctg tcacgctaga gctccccccg ccgccaccgc  16535
cgccccccac gcgcccgacc gttccccccc ccctgccggc tccgtcggcg ggacccgtgt  16595
ccgcacccgt cgccgtgcct ctgccagccg cccgcccagt ggccgtggcc actgccagaa  16655
accccagagg ccagagagga gccaactggc aaagcacgct gaacagcatc gtgggcctgg  16715
gagtgaaaag cctgaaacgc cgccgttgct attattaaaa gtgtagctaa aaaatttccc  16775
gttgtatacg cctcctatgt taccgccaga gacgcgtgac tgtcgccgcg agcgccgctt  16835
tcaag atg gcc acc cca tcg atg atg ccg cag tgg tct tac atg cac atc  16885
      Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile
          505                 510                 515
gcc ggg cag gac gcc tcg gag tac ctg agc ccc ggt ctc gtg cag ttc    16933
Ala Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe
    520                 525                 530
gcc cgc gcc acc gac acc tac ttc agc ttg gga aac aag ttt aga aac    16981
Ala Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn
535                 540                 545                 550
ccc acc gtg gcc ccc acc cac gat gta acc acg gac cgc tcg caa agg    17029
Pro Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg
                555                 560                 565
ctg acc ctg cgt ttt gtg ccc gta gac cgg gag gac acc gcg tac tct    17077
Leu Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser
            570                 575                 580
tac aaa gtg cgc tac acg ctg gcc gta ggg gac aac cga gtg ctg gac    17125
Tyr Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp
        585                 590                 595
atg gcc agc acc tac ttt gac atc cgg gga gtg ctg gat cgc ggt ccc    17173
Met Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro
    600                 605                 610
agt ttt aag ccc tac tcg ggt acc gcg tac aat tcc ctg gct ccc aag    17221
Ser Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys
615                 620                 625                 630
ggc gct ccc aac cct gca gaa tgg acg aat tca gac agc aaa gtt aaa    17269
Gly Ala Pro Asn Pro Ala Glu Trp Thr Asn Ser Asp Ser Lys Val Lys
                635                 640                 645
gtg agg gca cag gcg cct ttt gtt agc tcg tat ggt gct aca gcg att    17317
Val Arg Ala Gln Ala Pro Phe Val Ser Ser Tyr Gly Ala Thr Ala Ile
            650                 655                 660
aca aaa gag ggt att cag gtg gga gta acc tta aca gac tcc gga tca    17365
Thr Lys Glu Gly Ile Gln Val Gly Val Thr Leu Thr Asp Ser Gly Ser
        665                 670                 675
aca cca cag tat gca gat aaa acg tat cag cct gag ccg caa att gga    17413
Thr Pro Gln Tyr Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln Ile Gly
    680                 685                 690
gaa cta cag tgg aac agc gat gtt gga acc gat gac aaa ata gca gga    17461
Glu Leu Gln Trp Asn Ser Asp Val Gly Thr Asp Asp Lys Ile Ala Gly
695                 700                 705                 710
aga gtg cta aag aaa aca acg ccc atg ttc cct tgt tac ggc tca tat    17509
Arg Val Leu Lys Lys Thr Thr Pro Met Phe Pro Cys Tyr Gly Ser Tyr
                715                 720                 725
gcc agg ccc act aat gaa aaa gga gga cag gca aca ccg tcc gct agt    17557
Ala Arg Pro Thr Asn Glu Lys Gly Gly Gln Ala Thr Pro Ser Ala Ser
            730                 735                 740
caa gac gtg caa aat ccc gaa tta caa ttt ttt gcc tct act aat gtc    17605
Gln Asp Val Gln Asn Pro Glu Leu Gln Phe Phe Ala Ser Thr Asn Val
        745                 750                 755
gcc aat aca cca aaa gca gtt cta tat gcg gag gac gtg tca att gaa    17653
Ala Asn Thr Pro Lys Ala Val Leu Tyr Ala Glu Asp Val Ser Ile Glu
    760                 765                 770
gcg cca gac act cac ttg gtg ttc aaa cca aca gtc act gaa ggc att    17701
Ala Pro Asp Thr His Leu Val Phe Lys Pro Thr Val Thr Glu Gly Ile
775                 780                 785                 790
aca agt tca gag gct cta ctg acc caa caa gct gct ccc aac cgt cca    17749
Thr Ser Ser Glu Ala Leu Leu Thr Gln Gln Ala Ala Pro Asn Arg Pro
                795                 800                 805
aac tac ata gcc ttt aga gat aat ttt att ggt ctc atg tac tac aat    17797
Asn Tyr Ile Ala Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn
            810                 815                 820
agc aca ggt aac atg gga gta ctg gca ggc cag gct tct cag cta aat    17845
Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn
        825                 830                 835
gca gtt gtt gac ctg caa gac aga aat act gag ctg tcc tac caa ctc    17893
Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu
    840                 845                 850
atg ttg gac gcc ctc gga gac cgc agt cgg tac ttt tct atg tgg aac    17941
Met Leu Asp Ala Leu Gly Asp Arg Ser Arg Tyr Phe Ser Met Trp Asn
855                 860                 865                 870
caa gct gtg gat agt tac gat cct gat gta aga atc ata gaa aac cat    17989
Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His
                875                 880                 885
ggc gta gaa gat gaa ttg cct aat tat tgc ttt cct ttg gga ggc atg    18037
Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Gly Gly Met
            890                 895                 900
gca gta acc gac acc tac tcg cct ata aag gtt aat gga gga ggc aat    18085
Ala Val Thr Asp Thr Tyr Ser Pro Ile Lys Val Asn Gly Gly Gly Asn
        905                 910                 915
gga tgg gaa gcc aat aac ggc gtt ttc acc gaa aga gga gtg gaa ata    18133
Gly Trp Glu Ala Asn Asn Gly Val Phe Thr Glu Arg Gly Val Glu Ile
    920                 925                 930
ggt tca ggg aac atg ttt gcc atg gag att aac ctg caa gcc aac cta    18181
Gly Ser Gly Asn Met Phe Ala Met GluIle Asn Leu Gln Ala Asn Leu
935                 940                 945                 950
tgg cgt agc ttt ctg tac tcc aat att ggg ctg tac ctg cca gac tct    18229
Trp Arg Ser Phe Leu Tyr Ser Asn Ile Gly Leu Tyr Leu Pro Asp Ser
                955                 960                 965
ctc aaa atc act cct gac aac atc aca ctc cca gag aac aaa aac acc    18277
Leu Lys Ile Thr Pro Asp Asn Ile Thr Leu Pro Glu Asn Lys Asn Thr
            970                 975                 980
tat cag tat atg aac ggt cgc gtg acg cca ccc ggg ctg gtt gac acc    18325
Tyr Gln Tyr Met Asn Gly Arg Val Thr Pro Pro Gly Leu Val Asp Thr
        985                 990                 995
tac gtt  aac gtg ggc gcg cgc  tgg tcc ccc gat gtc  atg gac agt     18370
Tyr Val  Asn Val Gly Ala Arg  Trp Ser Pro Asp Val  Met Asp Ser
    1000                 1005                 1010
att aac  cct ttt aat cac cac  cgc aac gcc gga ctc  cgc tac cgt    18415
Ile Asn  Pro Phe Asn His His  Arg Asn Ala Gly Leu  Arg Tyr Arg
    1015                 1020                 1025
tcc atg  ctc ctg gga aac gga  cgc tac gtg ccc ttc  cac atc cag    18460
Ser Met  Leu Leu Gly Asn Gly  Arg Tyr Val Pro Phe  His Ile Gln
    1030                 1035                 1040
gtg ccc  cag aaa ttc ttt gca  att aaa aac ctg ctg  ctg ctc ccc    18505
Val Pro  Gln Lys Phe Phe Ala  Ile Lys Asn Leu Leu  Leu Leu Pro
    1045                 1050                 1055
ggt tcc  tac acc tac gag tgg  aac ttc cgc aag gac  gtg aac atg    18550
Gly Ser  Tyr Thr Tyr Glu Trp  Asn Phe Arg Lys Asp  Val Asn Met
    1060                 1065                 1070
atc ttg  cag agc tcg ctg ggc  aat gac ctg cga gtg  gac ggg gcc    18595
Ile Leu  Gln Ser Ser Leu Gly  Asn Asp Leu Arg Val  Asp Gly Ala
    1075                 1080                 1085
agc atc  cgc ttc gac agc atc  aac ctg tac gcc aac  ttt ttc ccc    18640
Ser Ile  Arg Phe Asp Ser Ile  Asn Leu Tyr Ala Asn  Phe Phe Pro
    1090                 1095                 1100
atg gcc  cac aac acg gcc tcc  acc ctg gaa gcc atg  ctg cgc aac    18685
Met Ala  His Asn Thr Ala Ser  Thr Leu Glu Ala Met  Leu Arg Asn
    1105                 1110                 1115
gac acc  aac gac caa tct ttc  aac gac tac ctg tgc  gcg gcc aac    18730
Asp Thr  Asn Asp Gln Ser Phe  Asn Asp Tyr Leu Cys  Ala Ala Asn
    1120                 1125                 1130
atg ctg  tac ccc atc ccc gcc  aac gcc acc agc gtg  ccc atc tcc    18775
Met Leu  Tyr Pro Ile Pro Ala  Asn Ala Thr Ser Val  Pro Ile Ser
    1135                 1140                 1145
att ccc  tct cgc aac tgg gca  gcc ttc agg ggc tgg  agt ttc acc    18820
Ile Pro  Ser Arg Asn Trp Ala  Ala Phe Arg Gly Trp  Ser Phe Thr
    1150                 1155                 1160
cgc ctc  aaa acc aag gag acc  ccc tcg ctg ggc tcc  ggg ttc gac    18865
Arg Leu  Lys Thr Lys Glu Thr  Pro Ser Leu Gly Ser  Gly Phe Asp
    1165                 1170                 1175
ccc tac  ttc gtc tac tcc ggc  tcc atc ccc tac ctg  gac ggc acc    18910
Pro Tyr  Phe Val Tyr Ser Gly  Ser Ile Pro Tyr Leu  Asp Gly Thr
    1180                 1185                 1190
ttc tac  ctc aac cat act ttc  aaa aag gtg tca atc  atg ttc gac    18955
Phe Tyr  Leu Asn His Thr Phe  Lys Lys Val Ser Ile  Met Phe Asp
    1195                 1200                 1205
tcc tcc  gtc agc tgg ccc ggc  aac gac cgt ctg ctg  acg ccc aac    19000
Ser Ser  Val Ser Trp Pro Gly  Asn Asp Arg Leu Leu  Thr Pro Asn
    1210                 1215                 1220
gag ttc  gaa atc aag cgt tcg  gtg gac ggt gaa ggg  tac aac gtg    19045
Glu Phe  Glu Ile Lys Arg Ser  Val Asp Gly Glu Gly  Tyr Asn Val
    1225                 1230                 1235
gct cag  agc aac atg acc aag  gac tgg ttc ctg att  cag atg ctc    19090
Ala Gln  Ser Asn Met Thr Lys  Asp Trp Phe Leu Ile  Gln Met Leu
    1240                 1245                 1250
agc cac  tac aac atc ggc tac  cag ggc ttc tac gtg  ccc gaa aat    19135
Ser His  Tyr Asn Ile Gly Tyr  Gln Gly Phe Tyr Val  Pro Glu Asn
    1255                 1260                 1265
tac aag  gac cgc atg tac tct  ttc ttc aga aac ttc  caa ccc atg    19180
Tyr Lys  Asp Arg Met Tyr Ser  Phe Phe Arg Asn Phe  Gln Pro Met
    1270                 1275                 1280
agc cgc  caa att gta gat tca  acg gct tac act aat  tat cag gat    19225
Ser Arg  Gln Ile Val Asp Ser  Thr Ala Tyr Thr Asn  Tyr Gln Asp
    1285                 1290                 1295
gtg aaa  ctg cca tac cag cat  aac aac tca ggg ttc  gtg ggc tac    19270
Val Lys  Leu Pro Tyr Gln His  Asn Asn Ser Gly Phe  Val Gly Tyr
    1300                 1305                 1310
atg gga  ccc acc atg cga gag  ggg cag gcc tac ccg  gcc aac tat    19315
Met Gly  Pro Thr Met Arg Glu  Gly Gln Ala Tyr Pro  Ala Asn Tyr
    1315                 1320                 1325
ccc tat  ccc ctg att ggg gcc  acc gcc gtg ccc agc  ctc acg cag    19360
Pro Tyr  Pro Leu Ile Gly Ala  Thr Ala Val Pro Ser  Leu Thr Gln
    1330                 1335                 1340
aaa aag  ttc ctc tgc gac cgg  gtg atg tgg agg atc  ccc ttc tct    19405
Lys Lys  Phe Leu Cys Asp Arg  Val Met Trp Arg Ile  Pro Phe Ser
    1345                 1350                 1355
agc aac  ttc atg tct atg ggc  tcc ctc acc gac ctg  ggg cag aac    19450
Ser Asn  Phe Met Ser Met Gly  Ser Leu Thr Asp Leu  Gly Gln Asn
    1360                 1365                 1370
atg ctg  tac gcc aac tcc gct  cac gcc ttg gat atg  acc ttt gag    19495
Met Leu  Tyr Ala Asn Ser Ala  His Ala Leu Asp Met  Thr Phe Glu
    1375                 1380                 1385
gtg gat  ccc atg gat gag ccc  acg ctt ctc tat gtt  ctg ttt gaa    19540
Val Asp  Pro Met Asp Glu Pro  Thr Leu Leu Tyr Val  Leu Phe Glu
    1390                 1395                 1400
gtc ttc  gac gtg gtg cgc atc  cac cag ccg cac cgc  ggc gtc atc    19585
Val Phe  Asp Val Val Arg Ile  His Gln Pro His Arg  Gly Val Ile
    1405                 1410                 1415
gag gcc  gtc tac ctg cgc aca  cct ttc tct gcc ggt  aac gcc acc    19630
Glu Ala  Val Tyr Leu Arg Thr  Pro Phe Ser Ala Gly  Asn Ala Thr
    1420                 1425                 1430
acc taa agaagccgat gggctccagc gaacaggagc tgcaggccat tgttcgcgac    19686
Thr
ctgggctgcg ggccctactt tttgggcacc ttcgacaagc gttttcccgg cttcatgtcc  19746
ccccacaagc cggcctgtgc catcgttaac acggccggac gggagaccgg gggggtccac  19806
tggctcgcct tcgcctggaa cccgcgtaac cgcacctgct acctgttcga cccttttggt  19866
ttctccgacg aaaggctgaa gcagatctac cagttcgagt acgaggggct cctcaagcgc  19926
agcgctctgg cctccacgcc cgaccactgc gtcaccctgg aaaagtccac ccaaacggtc  19986
caggggcccc tctcggccgc ctgcgggctc ttctgttgca tgtttttgca cgccttcgtg  20046
cactggcctc acacccccat ggatcacaac cccaccatgg atctgctcac cggagtgccc  20106
aacagcatgc ttcacagccc ccaggtcgcc cccaccctgc gccgtaacca ggaacacctg  20166
tatcgctttc tggggaaaca ctctgcctat tttcgccgcc accggcagcg catcgaacgg  20226
gccacggcct tcgaaagcat gagccaaaga gtgtaatcaa taaaaaacat ttttatttga  20286
catgatacgc gcttctggcg ttttattaaa aatcgaaggg ttcgagggag gggtcctcgt  20346
gcccgctggg gagggacacg ttgcgatact ggaaacgggc gctccaacga aactcgggga  20406
tcaccagccg cggcaggggc acgtcttcta ggttctgctt ccaaaactgc cgcaccagct  20466
gcagggctcc catgacgtcg ggcgccgata tcttgaagtc gcagttaggg ccggagctcc  20526
cgcggctgtt gcggaacacg gggttggcac actggaacac cagcacgccg gggttgtgga  20586
tactggccag ggccgtcggg tcggtcacct ccgacgcatc cagatcctcg gcgttgctca  20646
gggcaaacgg ggtcagcttg cacatctgcc gcccaatctg gggtactagg tcgcgcttgt  20706
tgaggcagtc gcagcgcaga gggatcagga tgcgtcgctg cccgcgttgc atgatagggt  20766
aactcgccgc caggaactcc tccatttgac ggaaggccat ctgggctttg ccgccctcgg  20826
tgtagaatag cccgcaggac ttgctagaga atacgttatg accgcagttg acgtcctccg  20886
cgcagcagcg ggcgtcttcg ttcttcagct gaaccacgtt gcggccccaa cggttctgga  20946
ccaccttggc tctagtgggg tgctccttca gcgcccgctg tccgttctcg ctggttacat  21006
ccatttccaa cacgtgctcc ttgcagacca tctccactcc gtggaagcaa aacaggacgc  21066
cctcctgctg ggtactgcga tgctcccata cggcgcatcc ggtgggctcc cagctcttgt  21126
gttttacccc cgcgtaggct tccatgtaag ccataaggaa tctgcccatc agctcggtga  21186
aggtcttctg gttggtgaag gttagcggca ggccgcggtg ctcctcgttc aaccaagttt  21246
gacagatctt gcggtacacc gctccctggt cgggcagaaa cttaaaagcc gctctgctgt  21306
cgttgtctac gtggaacttc tccattaaca tcatcatggt ttccataccc ttctcccacg  21366
ctgtcaccag tggtttgctg tcggggttct tcaccaacac ggcggtagag gggccctcgc  21426
cggccccgac gtccttcatg gtcattcttt gaaactccac ggagccgtcc gcgcgacgta  21486
ctctgcgcac cggagggtag ctgaagccca cctccaccac ggtgccttcg ccctcgctgt  21546
cggagacaat ctccggggat ggcggcggcg cgggtgtcgc cttgcgagcc ttcttcttgg  21606
gagggagctg aggcgcctcc tgctcgcgct cggggctcat ctcccgcaag tagggggtaa  21666
tggagctgcc tgcttggttc tgacggttgg ccattgtatc ctaggcagaa agacatggag  21726
cttatgcgcg aggaaacttt aaccgccccg tcccccgtca gcgacgaaga tgtcatcgtc  21786
gaacaggacc cgggctacgt tacgccgccc gaggatctgg aggggcctga ccggcgcgac  21846
gctagtgagc ggcaggaaaa tgagaaagag gaggcctgct acctcctgga aggcgacgtt  21906
ttgctaaagc atttcgccag gcagagcacc atagttaagg aggccttgca agaccgctcc  21966
gaggtgccct tggacgtcgc cgcgctctcc caggcctacg aggcgaacct tttctcgcct  22026
cgagtgcctc cgaagagaca gcccaacggc acctgcgagc ccaacccgcg actcaacttc  22086
taccccgtgt tcgccgtacc agaggcgctg gccacctatc acattttttt caaaaaccaa  22146
cgcatccccc tatcgtgccg ggccaaccgc accgcggccg ataggaatct caggcttaaa  22206
aacggagcca acatacctga tatcacgtcg ctggaggaag tgcccaagat tttcgagggt  22266
ctgggtcgag atgagaagcg ggcggcgaac gctctgcaga aagaacagaa agagagtcag  22326
aacgtgctgg tggagctgga gggggacaac gcgcgtctgg ccgtcctcaa acgctgcata  22386
gaagtctccc acttcgccta ccccgccctc aacttgccac ccaaagttat gaaatcggtc  22446
atggatcagc tgctcatcaa gagagctgag cccctggatc ccgaccaccc cgaggcggaa  22506
aactcagagg acggaaagcc cgtcgtcagc gacgaggagc tcgagcggtg gctggaaacc  22566
agggaccccc aacagttgca agagaggcgc aagatgatga tggcggccgt gctggtcacc  22626
gtggagctgg aatgcctgca acggtttttc agcgacgtgg agacgctacg caaaatcggg  22686
gaatccctgc actacacctt ccgccagggc tacgtccgcc aggcctgcaa gatctccaac  22746
gtggagctca gcaacctggt ctcctacatg ggcatcctcc acgagaaccg gctggggcag  22806
agcgtgctgc actgcacctt gcaaggcgag gcgcggcggg actacgtgcg agactgcatc  22866
tacctcttcc tcaccctcac ctggcagacc gccatgggcg tctggcagca gtgcttggaa  22926
gagagaaacc tcaaagagct agacaaactc ctctgccgcc agcggcgcgc cctgtggtcc  22986
ggtttcagcg agcgcacggt cgccagcgct ctggcggaca tcatcttccc ggagcgcctg  23046
atgaaaacct tgcaaaacgg cctgccggat ttcatcagtc aaagcatttt gcaaaacttc  23106
cgctcttttg tcctggaacg ctccgggatc ttgcccgcca tgagctgcgc gctaccttct  23166
gactttgtcc ccctctccta ccgcgagtgc cctcccccac tgtggagcca ctgctacctc  23226
ttccaactgg ccaactttct ggcctaccac tccgacctca tggaagacgt aagcggagag  23286
ggtttactgg agtgccactg ccgctgcaac ctgtgcaccc cccacagatc gctggcctgc  23346
aacaccgagc tactcagcga aacccaggtc ataggtacct tcgagatcca ggggccccag  23406
cagcaagagg gtgcttccgg cttgaagctc actccggcgc tgtggacctc ggcttactta  23466
cgcaaatttg tagccgagga ctaccacgcc cacaaaattc agttttacga agaccaatct  23526
cgaccaccga aagcccccct cacggcctgc gtcatcaccc agagcaagat cctggcccaa  23586
ttgcaatcca tcaaccaagc gcgccgcgat ttccttttga aaaagggtcg gggggtgtac  23646
ctggaccccc agaccggcga ggaactcaac ccgtccacac tctccgtcga agcagccccc  23706
ccgagacatg ccgcccaagg gaaccgccaa gcagctgatc gctcggcaga gagcgaagaa  23766
gcaagagctg ctccagcagc aggtggagga cgaggaagag atgtgggaca gccaggcaga  23826
ggaggtgtca gaggacgagg aggagatgga aagctgggac agcctagacg aggaggagga  23886
cgagctttca gaggaagagg cgaccgaaga aaaaccacct gcatccagcg cgccttctct  23946
gagccgacag ccgaagcccc ggcccccgac gcccccggcc ggctcactca aagccagccg  24006
taggtgggac gccaccgaat ctccagcggc agcggcaacg gcagcgggta aggccaaacg  24066
cgagcggcgg gggtattgct cctggcgggc ccacaaaagc agtattgtga actgcttgca  24126
acactgcggg ggaaacatct cctttgcccg acgctacctc ctcttccatc acggtgtggc  24186
cttccctcgc aacgttctct attattaccg tcatctctac agcccctacg aaacgctcgg  24246
agaaaaaagc taaggcctcc tccgccgcga ggaaaaactc cgccgccgct gccgccgcca  24306
aggatccacc ggccaccgaa gagctgagaa agcgcatctt tcccactctg tatgctatct  24366
ttcagcaaag ccgcgggcag caccctcagc gcgaactgaa aataaaaaac cgctccttcc  24426
gctcgctcac ccgcagctgt ctgtaccaca agagagaaga ccagctgcag cgcaccctgg  24486
acgacgccga agcactgttc agcaaatact gctcagcgtc tcttaaagac taaaagaccc  24546
gcgctttttc cccctcggcc gccaaaaccc acgtcatcgc cagcatgagc aaggagattc  24606
ccacccccta catgtggagc tatcagcccc agatgggcct ggccgcgggg gccgcccagg  24666
actactccag caagatgaac tggctcagcg ccggccccca catgatctca cgagttaacg  24726
gcatccgagc ccaccgaaac cagattctct tagaacaggc ggcaatcacc gccacacccc  24786
ggcgccaact caacccgcct agttggcccg ccgcccaggt gtatcaggaa aatccccgcc  24846
cgaccacagt cctcctgcca cgcgacgcgg aggccgaagt cctcatgact aactctgggg  24906
tacaattagc gggcgggtcc aggtacgcca ggtacagagg tcgggccgct ccttactctc  24966
ccgggagtat aaagagggtg atcattcgag gccgaggtat ccagctcaac gacgagacgg  25026
tgagctcctc aaccggtctc agacctgacg gagtcttcca gctcggagga gcgggccgct  25086
cttccttcac cactcgccag gcctacctga ccctgcagag ctcttcctcg cagccgcgct  25146
ccgggggaat cggcactctc cagttcgtgg aagagttcgt tccctccgtc tacttcaacc  25206
ccttctccgg ctcgcctgga cgctacccgg acgccttcat tcccaacttt gacgcagtga  25266
gtgaatccgt ggacggctac gactgatgac agatggtgcg gccgtgagag ctcggctgcg  25326
acatctgcat cactgccgtc agcctcgctg ctacgctcgg gaggcgatcg tcttcagcta  25386
ctttgagctg ccggacgagc accctcaggg tccggctcac gggttgaaac tcgagatcga  25446
gaacgcgctc gagtctcgcc tcatcgacac cttcaccgcc cgacctctcc tggtagaaat  25506
ccaacggggg atcactacca tcaccctgtt ctgcatctgc cccacgcccg gattacatga  25566
agatctgtgt tgtcatcttt gcgctcagtt taataaaaac tgaacttttt gccgcacctt  25626
caacgccatc tgtgatttct acaacaaaaa gttcttctgg caaaggtaca caaactgtat  25686
tttattctaa ttctacctca tctatcgtgc tgaactgcgc ctgcactaac gaacttatcc  25746
agtggattgc aaacggtagt gtgtgcaagt acttttgggg gaacgatata gttagtagaa  25806
ataacagcct ttgcgagcac tgcaactcct ccacactaat cctttatccc ccatttgtta  25866
ctggatggta tatgtgcgtt ggctccggtt taaatcctag ttgctttcat aagtggtttc  25926
tacaaaaaga gacccttccc aacaattctg tttctttttt cgccctatcc tactgctgtt  25986
ctccctctgg ttactctttc aaacctctaa ttggtatttt agctttgata ctcataatct  26046
ttattaactt tataataatt aacaacttac agtaaacatg cttgttctac tgctcgccac  26106
atctttcgct ctctctcacg ccagaacaag tattgttggc gcaggttaca atgcaactct  26166
tcaatctgct tacatgccag attccgacca gataccccat attacgtggt acttacaaac  26226
ctccaaacct aattcttcat tttatgaagg aaacaaactc tgcgatgact ccgacaacag  26286
aacgcacaca tttccccacc cttcactaca attcgaatgc gtaaacaaaa gcttgaagct  26346
ttacaactta aagccttcag attctggctt gtaccatgct gtagttgaaa aaagtaattt  26406
agaagtccac agtgattaca ttgaattgac ggttgtggac ctgccacctc caaaatgtga  26466
ggtttcctcc tcttaccttg aagttcaagg cgtggatgcc tactgcctca tacacattaa  26526
ctgcagcaac tctaaatatc cagctagaat ttactataat ggacaggaaa gtaatctttt  26586
ttattattta acaacaagcg ctggtaacgg taaacagtta cctgactatt ttactgctgt  26646
tgttgaattt tccacctaca gagaaacgta tgccaagcgg ccttacaatt tctcataccc  26706
gtttaacgac ctttgcaatg aaatacaagc gctcgaaact ggaactgatt ttactccaat  26766
tttcattgct gccattgttg taagcttaat taccattatt gtcagcctag cattttactg  26826
cttttacaag cccaaaaacc ctaagtttga aaaacttaaa ctaaaacctg tcattcaaca  26886
agtgtgattt tgttttccag catggtagct gcatttctac ttctcctctg tctacccatc  26946
attttcgtct cttcaacttt cgccgcagtt tcccacctgg aaccagagtg cctaccgcct  27006
tttgacgtgt atctgattct cacctttgtt tgttgtatat ccatttgcag tatagcctgc  27066
ttttttataa caatctttca agccgccgac tatttttacg tgcgaattgc ttactttaga  27126
caccatcctg aatacagaaa tcaaaacgtt gcctccttac tttgtttggc atgattaagt  27186
tattgctgat acttaattat ttacccctaa tcaactgtaa ttgtccattc accaaaccct  27246
ggtcattcta cacctgttat gataaaatcc ccgacactcc tgttgcttgg ctttacgcag  27306
ccaccgccgc tttggtattt atatctactt gccttggagt aaaattgtat tttattttac  27366
acactgggtg gctacatccc agagaagatt tacctagata tcctcttgta aacgcttttc  27426
aattacagcc tctgcctcct cctgatcttc ttcctcgagc tccctctatt gtgagctact  27486
ttcaactcac cggtggagat gactgactct caggacatta atattagtgt ggaaagaata  27546
gctgctcagc gtcagcgaga aacgcgagtg ttggaatacc tggaactaca gcaacttaaa  27606
gagtcccact ggtgtgagaa aggagtgctg tgccatgtta agcaggcagc cctttcctac  27666
gatgtcagcg ttcagggaca tgaactgtct tacactttgc ctttgcagaa acaaaccttc  27726
tgcaccatga tgggctctac ctccatcaca atcacccaac aagccgggcc tgtagagggg  27786
gctatcctct gtcactgtca cgcacctgat tgcatgtcca aactaatcaa aactctctgt  27846
gctttaggtg atatttttaa ggtgtaaatc aataataaac ttaccttaaa tttgacaaca  27906
aatttctggt gacatcattc agcagcacca ctttaccctc ttcccagctc tcgtatggga  27966
tgcgatagtg ggtggcaaac ttcctccaaa ccctaaaaga aatattggta tccacttcct  28026
tgtcctcacc cacaattttc atcttttcat ag atg  aaa aga acc aga gtt  gat  28079
                                    Met  Lys Arg Thr Arg Val  Asp
                                    1435                 1440
gaa gac ttc aac  ccc gtc tac ccc tat  gac acc aca acc act  cct     28124
Glu Asp Phe Asn  Pro Val Tyr Pro Tyr  Asp Thr Thr Thr Thr  Pro
            1445                 1450                 1455
gca gtt ccc ttt  ata tca ccc ccc ttt  gta aac agc gat ggt  ctt    28169
Ala Val Pro Phe  Ile Ser Pro Pro Phe  Val Asn Ser Asp Gly  Leu
            1460                 1465                 1470
cag gaa aac ccc  cca ggt gtt tta agt  ctg cga ata gct aaa  ccc    28214
Gln Glu Asn Pro  Pro Gly Val Leu Ser  Leu Arg Ile Ala Lys  Pro
            1475                 1480                 1485
cta tat ttc gac  atg gag aga aaa cta  gcc ctt tca ctt gga  aga    28259
Leu Tyr Phe Asp  Met Glu Arg Lys Leu  Ala Leu Ser Leu Gly  Arg
            1490                 1495                 1500
ggg ttg aca att  acc gcc gcc gga caa  tta gaa agt acg cag  agc    28304
Gly Leu Thr Ile  Thr Ala Ala Gly Gln  Leu Glu Ser Thr Gln  Ser
            1505                 1510                 1515
gta caa acc aac  cca ccg ttg ata att  acc aac aac aac aca  ctg    28349
Val Gln Thr Asn  Pro Pro Leu Ile Ile  Thr Asn Asn Asn Thr  Leu
            1520                 1525                 1530
acc cta cgt cat  tct ccc ccc tta aac  cta act gac aat agc  tta    28394
Thr Leu Arg His  Ser Pro Pro Leu Asn  Leu Thr Asp Asn Ser  Leu
            1535                 1540                 1545
gtg cta ggc tac  tcg agt cct ctc cgc  gtc aca gac aac aaa  ctt    28439
Val Leu Gly Tyr  Ser Ser Pro Leu Arg  Val Thr Asp Asn Lys  Leu
            1550                 1555                 1560
aca ttt aac ttc  aca tca cca ctc cgt  tat gaa aat gaa aac  ctt    28484
Thr Phe Asn Phe  Thr Ser Pro Leu Arg  Tyr Glu Asn Glu Asn  Leu
            1565                 1570                 1575
act ttt aac tat  aca gag cct ctt aaa  ctt ata aat aac agc  ctt    28529
Thr Phe Asn Tyr  Thr Glu Pro Leu Lys  Leu Ile Asn Asn Ser  Leu
            1580                 1585                 1590
gcc att gac atc  aat tcc tca aaa ggc  ctt agt agc gtc gga  ggc    28574
Ala Ile Asp Ile  Asn Ser Ser Lys Gly  Leu Ser Ser Val Gly  Gly
            1595                 1600                 1605
tca cta gct gta  aac ctg agt tca gac  tta aag ttt gac agc  aac    28619
Ser Leu Ala Val  Asn Leu Ser Ser Asp  Leu Lys Phe Asp Ser  Asn
            1610                 1615                 1620
gga tcc ata gct  ttt ggc ata caa acc  ctg tgg acc gct ccg  acc    28664
Gly Ser Ile Ala  Phe Gly Ile Gln Thr  Leu Trp Thr Ala Pro  Thr
            1625                 1630                 1635
tcg act ggc aac  tgc acc gtc tac agc  gag ggc gat tcc cta  ctt    28709
Ser Thr Gly Asn  Cys Thr Val Tyr Ser  Glu Gly Asp Ser Leu  Leu
            1640                 1645                 1650
agt ctc tgt tta  acc aaa tgc gga gct  cac gtc tta gga agt  gta    28754
Ser Leu Cys Leu  Thr Lys Cys Gly Ala  His Val Leu Gly Ser  Val
            1655                 1660                 1665
agt tta acc ggt  tta aca gga acc ata  acc caa atg act gat  att    28799
Ser Leu Thr Gly  Leu Thr Gly Thr Ile  Thr Gln Met Thr Asp  Ile
            1670                 1675                 1680
tct gtc acc att  caa ttt aca ttt gac  aac aat ggt aag cta  cta    28844
Ser Val Thr Ile  Gln Phe Thr Phe Asp  Asn Asn Gly Lys Leu  Leu
            1685                 1690                 1695
agc tct cca ctt  ata aac aac gcc ttt  agt att cga cag aat  gac    28889
Ser Ser Pro Leu  Ile Asn Asn Ala Phe  Ser Ile Arg Gln Asn  Asp
            1700                 1705                 1710
agt acg gcc tca  aac cct acc tac aac  gcc ctg gcg ttt atg  cct    28934
Ser Thr Ala Ser  Asn Pro Thr Tyr Asn  Ala Leu Ala Phe Met  Pro
            1715                 1720                 1725
aac agt acc ata  tat gca aga ggg gga  ggt ggt gaa cca cga  aac    28979
Asn Ser Thr Ile  Tyr Ala Arg Gly Gly  Gly Gly Glu Pro Arg  Asn
            1730                 1735                 1740
aac tac tac gtc  caa acg tat ctt agg  gga aat gtt caa aaa  cca    29024
Asn Tyr Tyr Val  Gln Thr Tyr Leu Arg  Gly Asn Val Gln Lys  Pro
            1745                 1750                 1755
atc att ctt act  gta acc tac aac tca  gtc gcc aca gga tat  tcc    29069
Ile Ile Leu Thr  Val Thr Tyr Asn Ser  Val Ala Thr Gly Tyr  Ser
            1760                 1765                 1770
tta tct ttt aag  tgg act gct ctt gca  cgt gaa aag ttt gca  acc    29114
Leu Ser Phe Lys  Trp Thr Ala Leu Ala  Arg Glu Lys Phe Ala  Thr
            1775                 1780                 1785
cca aca acc tcg  ttt tgc tac att aca  gaa caa taa aaccgtgtac      29160
Pro Thr Thr Ser  Phe Cys TyrIle Thr  Glu Gln
            1790                 1795
cccaccgttt cgtttttttc ag atg aaa cgg  gcg aga gtt gat gaa  gac    29209
                         Met Lys Arg  Ala Arg Val Asp Glu  Asp
                                 1800                 1805
ttc aac cca gtg  tac cct tat gac ccc  cca cat gct cct gtt  atg    29254
Phe Asn Pro Val  Tyr Pro Tyr Asp Pro  Pro His Ala Pro Val  Met
            1810                 1815                 1820
ccc ttc att act  cca cct ttt acc tcc  tcg gat ggg ttg cag  gaa    29299
Pro Phe Ile Thr  Pro Pro Phe Thr Ser  Ser Asp Gly Leu Gln  Glu
            1825                 1830                 1835
aaa cca ctt gga  gtg tta agt tta aac  tac aga gat ccc att  act    29344
Lys Pro Leu Gly  Val Leu Ser Leu Asn  Tyr Arg Asp Pro Ile  Thr
            1840                 1845                 1850
acg caa aat gag  tct ctt aca att aaa  cta gga aac ggc ctc  act    29389
Thr Gln Asn Glu  Ser Leu Thr Ile Lys  Leu Gly Asn Gly Leu  Thr
            1855                 1860                 1865
cta gac aac cag  gga caa cta aca tca  acc gct ggc gaa gta  gaa    29434
Leu Asp Asn Gln  Gly Gln Leu Thr Ser  Thr Ala Gly Glu Val  Glu
            1870                 1875                 1880
cct cca ctc act  aac gct aac aac aaa  ctt gca ctg gtc tat  agc    29479
Pro Pro Leu Thr  Asn Ala Asn Asn Lys  Leu Ala Leu Val Tyr  Ser
            1885                 1890                 1895
gat cct tta gca  gta aag cgc aac agc  cta acc tta tcg cac  acc    29524
Asp Pro Leu Ala  Val Lys Arg Asn Ser  Leu Thr Leu Ser His  Thr
            1900                 1905                 1910
gct ccc ctt gtt  att gct gat aac tct  tta gca ttg caa gtt  tca    29569
Ala Pro Leu Val  Ile Ala Asp Asn Ser  Leu Ala Leu Gln Val  Ser
            1915                 1920                 1925
gag cct att ttt  ata aat gac aag gac  aaa cta gcc ctg caa  aca    29614
Glu Pro Ile Phe  Ile Asn Asp Lys Asp  Lys Leu Ala Leu Gln  Thr
            1930                 1935                 1940
gcc gcg ccc ctt  gta act aac gct ggc  acc ctt cgc tta caa  agc    29659
Ala Ala Pro Leu  Val Thr Asn Ala Gly  Thr Leu Arg Leu Gln  Ser
            1945                 1950                 1955
gcc gcc cct tta  ggc att gca gac caa  acc cta aaa ctc ctg  ttt    29704
Ala Ala Pro Leu  Gly Ile Ala Asp Gln  Thr Leu Lys Leu Leu  Phe
            1960                 1965                 1970
acc aac cct ttg  tac ttg cag aat aac  ttt ctc acg tta gcc  att    29749
Thr Asn Pro Leu  Tyr Leu Gln Asn Asn  Phe Leu Thr Leu Ala  Ile
            1975                 1980                 1985
gaa cga ccc ctt  gcc att acc aat act  gga aag ctg gct cta  cag    29794
Glu Arg Pro Leu  Ala Ile Thr Asn Thr  Gly Lys Leu Ala Leu  Gln
            1990                 1995                 2000
ctc tcc cca ccg  cta caa aca gca gac  aca ggc ttg act ttg  caa    29839
Leu Ser Pro Pro  Leu Gln Thr Ala Asp  Thr Gly Leu Thr Leu  Gln
            2005                 2010                 2015
acc aac gtg cca  tta act gta agc aac  ggg acc cta ggc tta  gcc    29884
Thr Asn Val Pro  Leu Thr Val Ser Asn  Gly Thr Leu Gly Leu  Ala
            2020                 2025                 2030
ata aag cgc cca  ctt att att cag gac  aac aac ttg ttt ttg  gac    29929
Ile Lys Arg Pro  Leu Ile Ile Gln Asp  Asn Asn Leu Phe Leu  Asp
            2035                 2040                 2045
ttc aga gct ccc  ctg cgt ctt ttc aac  agc gac cca gta cta  ggg    29974
Phe Arg Ala Pro  Leu Arg Leu Phe Asn  Ser Asp Pro Val Leu  Gly
            2050                 2055                 2060
ctt aac ttt tac  acc cct ctt gcg gta  cgc gat gag gcg ctc  act    30019
Leu Asn Phe Tyr  Thr Pro Leu Ala Val  Arg Asp Glu Ala Leu  Thr
            2065                 2070                 2075
gtt aac aca ggc  cgc ggc ctc aca gtg  agt tac gat ggt tta  att    30064
Val Asn Thr Gly  Arg Gly Leu Thr Val  Ser Tyr Asp Gly Leu  Ile
            2080                 2085                 2090
tta aat ctt ggt  aag gat ctt cgc ttt  gac aac aac acc gtt  tct    30109
Leu Asn Leu Gly  Lys Asp Leu Arg Phe  Asp Asn Asn Thr Val  Ser
            2095                 2100                 2105
gtc gct ctt agt  gct gct ttg cct tta  caa tac act gat cag  ctt    30154
Val Ala Leu Ser  Ala Ala Leu Pro Leu  Gln Tyr Thr Asp Gln  Leu
            21102                 115                 2120
cgc ctt aac gtg  ggc gct ggg ctg cgt  tac aat cca gtg agt  aag    30199
Arg Leu Asn Val  Gly Ala Gly Leu Arg  Tyr Asn Pro Val Ser  Lys
            2125                 2130                 2135
aaa ttg gac gtg  aac ccc aat caa aac  aag ggt tta acc tgg  gaa    30244
Lys Leu Asp Val  Asn Pro Asn Gln Asn  Lys Gly Leu Thr Trp  Glu
            2140                 2145                 2150
aat gac tac ctc  att gta aag cta gga  aat gga tta ggt ttt  gat    30289
Asn Asp Tyr Leu  Ile Val Lys Leu Gly  Asn Gly Leu Gly Phe  Asp
            2155                 2160                 2165
ggc gat gga aac  ata gct gtt tct cct  caa gtt aca tcg cct  gac    30334
Gly Asp Gly Asn  Ile Ala Val Ser Pro  Gln Val Thr Ser Pro  Asp
            2170                 2175                 2180
acc tta tgg acc  act gcc gac cca tcc  ccc aat tgt tcc atc  tac    30379
Thr Leu Trp Thr  Thr Ala Asp Pro Ser  Pro Asn Cys Ser Ile  Tyr
            2185                 2190                 2195
act gat tta gat  gcc aaa atg tgg ctc  tcg ttg gta aaa caa  ggg    30424
Thr Asp Leu Asp  Ala Lys Met Trp Leu  Ser Leu Val Lys Gln  Gly
            2200                 2205                 2210
ggt gtg gtt cac  ggt tct gtt gct tta  aaa gca ttg aaa gga  acc    30469
Gly Val Val His  Gly Ser Val Ala Leu  Lys Ala Leu Lys Gly  Thr
            2215                 2220                 2225
cta ttg agt cct  acg gaa agc gcc att  gtt att ata cta cat  ttt    30514
Leu Leu Ser Pro  Thr Glu Ser Ala Ile  Val Ile Ile Leu His  Phe
            2230                 2235                 2240
gac aat tat gga  gtg cga att ctc aat  tat ccc act ttg ggc  act    30559
Asp Asn Tyr Gly  Val Arg Ile Leu Asn  Tyr Pro Thr Leu Gly  Thr
            2245                 2250                 2255
caa ggc acg ttg  gga aat aat gca act  tgg ggt tat agg cag  gga    30604
Gln Gly Thr Leu  Gly Asn Asn Ala Thr  Trp Gly Tyr Arg Gln  Gly
            2260                 2265                 2270
gaa tct gca gac  act aat gta ctc aat  gca cta gca ttt atg  ccc    30649
Glu Ser Ala Asp  Thr Asn Val Leu Asn  Ala Leu Ala Phe Met  Pro
            2275                 2280                 2285
agt tca aaa agg  tac cca aga ggg cgt  gga agc gaa gtt cag  aat    30694
Ser Ser Lys Arg  Tyr Pro Arg Gly Arg  Gly Ser Glu Val Gln  Asn
            2290                 2295                 2300
caa act gtg ggc  tac act tgt ata cag  ggt gac ttt tct atg  ccc     30739
Gln Thr Val Gly  Tyr Thr Cys Ile Gln  Gly Asp Phe Ser Met  Pro
            2305                 2310                 2315
gta ccg tac caa  ata cag tac aac tat  gga cca act ggc tac  tcc     30784
Val Pro Tyr Gln  Ile Gln Tyr Asn Tyr  Gly Pro Thr Gly Tyr  Ser
            2320                 2325                 2330
ttt aaa ttt att  tgg aga act gtt tca  aga caa cca ttt gac  atc     30829
Phe Lys Phe Ile  Trp Arg Thr Val Ser  Arg Gln Pro Phe Asp  Ile
            2335                 2340                 2345
cca tgc tgt ttt  ttc tct tac att acg  gaa gaa taa aacaactttt       30875
Pro Cys Cys Phe  Phe Ser Tyr Ile Thr  Glu Glu
            2350                 2355
tctttttatt ttctttttat tttacacgca cagtaaggct tcctccaccc ttccatctca  30935
cagcatacac cagcctctcc cccttcatgg cagtaaactg ttgtgagtca gtccggtatt  30995
tgggagttaa gatccaaaca gtctctttgg tgatgaaaca tggatccgtg atggacacaa  31055
atccctggga caggttctcc aacgtttcgg taaaaaactg catgccgccc tacaaaacaa  31115
acaggttcag gctctccacg ggttatctcc ccgatcaaac tcagacagag taaaggtgcg  31175
atgatgttcc actaaaccac gcaggtggcg ctgtctgaac ctctcggtgc gactcctgtg  31235
aggctggtaa gaagttagat tgtccagcag cctcacagca tggatcatca gtctacgagt  31295
gcgtctggcg cagcagcgca tctgaatctc actgagattc cggcaagaat cgcacaccat  31355
cacaatcagg ttgttcatga tcccatagct gaacacgctc cagccaaagc tcattcgctc  31415
caacagcgcc accgcgtgtc cgtccaacct tactttaaca taaatcaggt gtctgccgcg  31475
tacaaacatg ctacccgcat acagaacctc ccggggcaaa cccctgttca ccacctgcct  31535
gtaccaggga aacctcacat ttatcaggga gccatagata gccattttaa accaattagc  31595
taacaccgcc ccaccagctc tacactgaag agaaccggga gagttacaat gacagtgaat  31655
aatccatctc tcataacccc taatggtctg atggaaatcc agatctaacg tggcacagca  31715
gatacacact ttcatataca ttttcatcac atgtttttcc caggccgtta aaatacaatc  31775
ccaatacacg ggccactcct gcagtacaat aaagctaata caagatggta tactcctcac  31835
ctcactaaca ttgtgcatgt tcatattttc acattctaag taccgagagt tctcctctac  31895
aacagcactg ccgcggtcct cacaaggtgg tagctggtga cgattgtaag gagccagtct  31955
gcagcgatac cgtctgtcgc gttgcatcgt agaccaggga ccgacgcact tcctcgtact  32015
tgtagtagca gaaccacgtc cgctgccagc acgtctccaa gtaacgccgg tccctgcgtc  32075
gctcacgctc cctcctcaac gcaaagtgca accactcttg taatccacac agatccctct  32135
cggcctccgg ggcgatgcac acctcaaacc tacagatgtc tcggtacagt tccaaacacg  32195
tagtgagggc gagttccaac caagacagac agcctgatct atcccgacac actggaggtg  32255
gaggaagaca cggaagaggc atgttattcc aagcgattca ccaacgggtc gaaatgaaga  32315
tcccgaagat gacaacggtc gcctccggag ccctgatgga atttaacagc cagatcaaac  32375
attatgcgat tttccaggct atcaatcgcg gcctccaaaa gagcctggac ccgcacttcc  32435
acaaacacca gcaaagcaaa agcgttatta tcaaactctt cgatcatcaa gctgcaggac  32495
tgtacaatgc ccaagtaatt ttcatttctc cactcgcgaa tgatgtcgcg gcaaatagtc  32555
tgaaggttca tgccgtgcat attaaaaagc tccgaaaggg cgccctctat agccatgcgt  32615
agacacacca tcatgactgc aagatatcgg gctcctgaga cacctgcagc agatttaaca  32675
gacccaggtc aggttgctct ccgcgatcgc gaatctccat ccgcaaagtc atttgcaaat  32735
aattaaatag atctgcgccg actaaatctg ttaactccgc gctaggaact aaatcaggtg  32795
tggctacgca gcacaaaagt tccagggatg gcgccaaact cactagaacc gctcccgagt  32855
agcaaaactg atgaatggga gtaacacagt gtaaaatgtt cagccaaaaa tcactaagct  32915
gctcctttaa aaagtccagt acttctatat tcagttcgtg caagtactga agcaactgtg  32975
cgggaatatg cacagcaaaa aaaatagggc ggctcagata catgttgacc taaaataaaa  33035
agaatcatta aactaaagaa gcctggcgaa cggtgggata tatgacacgc tccagcagca  33095
ggcaagcaac cggctgtccc cgggaaccgc ggtaaaattc atccgaatga ttaaaaagaa  33155
caacagagac ttcccaccat gtactcggtt ggatctcctg agcacagagc aatacccccc  33215
tcacattcat atccgctaca gaaaaaaaac gtcccagata cccagcggga atatccaacg  33275
acagctgcaa agacagcaaa acaatccctc tgggagcaat cacaaaatcc tccggtgaaa  33335
aaagcacata catattagaa taaccctgtt gctggggcaa aaaggcccgt cgtcccagca  33395
aatgcacata aatatgttca tcagccattg ccccgtctta ccgcgtaaac agccacgaaa  33455
aaatcgagct aaaatccacc caacagccta tagctatata tacactccac ccaatgacgc  33515
taataccgca ccacccacga ccaaagttca cccacaccca caaaacccgc gaaaatccag  33575
cgccgtcagc acttccgcaa tttcagtctc acaacgtcac ttccgcgcgc cttttcactt  33635
tcccacacac gcccttcgcc cgcccgccct cgcgccaccc cgcgtcaccc cacgtcaccg  33695
cacgtcaccc cggccccgcc tcgctcctcc ccgctcatta tcatattggc acgtttccag  33755
aataaggtat attattgatg cagcaaaaca atccctctgg gagcaatcac aaaatcctcc  33815
ggtgaaaaaa gcacatacat attagaataa ccctgttgct ggggcaaaaa ggcccgtcgt  33875
cccagcaaat gcacataaat atgttcatca gccattgccc cgtcttaccg cgtaaacagc  33935
cacgaaaaaa tcgagctaaa atccacccaa cagcctatag ctatatatac actccaccca  33995
atgacgctaa taccgcacca cccacgacca aagttcaccc acacccacaa aacccgcgaa  34055
aatccagcgc cgtcagcact tccgcaattt cagtctcaca acgtcacttc cgcgcgcctt  34115
ttcactttcc cacacacgcc cttcgcccgc ccgccctcgc gccaccccgc gtcaccccac  34175
gtcaccgcac gtcaccccgg ccccgcctcg ctcctccccg ctcattatca tattggcacg  34235
tttccagaat aaggtatatt attgatgca                                    34264
<210>25
<211>503
<212>PRT
<213>猿猴腺病毒SV-1
<400>25
Met Arg Arg Ala Val Arg Val Thr Pro Ala Ala Tyr Glu Gly Pro Pro
1               5                   10                  15
Pro Ser Tyr Glu Ser Val Met Gly Ser Ala Asn Val Pro Ala Thr Leu
            20                  25                  30
Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Gly Arg
        35                  40                  45
Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Lys
    50                  55                  60
Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr
65                  70                  75                  80
Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp
                85                  90                  95
Phe Thr Pro Thr Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Glu Arg
            100                 105                 110
Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Leu His Thr Asn Met Pro
        115                 120                 125
Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Arg Ala Arg Leu Met
    130                 135                 140
Val Lys Lys Ala Glu Asn Gln Pro Pro Glu Tyr Glu Trp Phe Glu Phe
145                 150                 155                 160
Thr Ile Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile Asp Leu Met
                165                 170                 175
Asn Asn Ala Ile Val Asp Asn Tyr Leu Gln Val Gly Arg Gln Asn Gly
            180                 185                 190
Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg
        195                 200                 205
Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr Thr
    210                 215                 220
Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val
225                 230                 235                 240
Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg
                245                 250                 255
Arg Pro Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu Glu Gly
            260                 265                 270
Gly Asn Ile Pro Gly Leu Leu Asp Val Pro Ala Tyr Glu Glu Ser Val
         275                 280                 285
Lys Gln Ala Glu Ala Gln Gly Arg Glu Ile Arg Gly Asp Thr Phe Ala
    290                 295                 300
Thr Glu Pro His Glu Leu Val Ile Lys Pro Leu Glu Gln Asp Ser Lys
305                 310                 315                 320
Lys Arg Ser Tyr Asn Ile Ile Ser Gly Thr Met Asn Thr Leu Tyr Arg
                325                 330                 335
Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg
            340                 345                 350
Ser Trp Thr Ile Leu Thr Thr Thr Asp Val Thr Cys Gly Ser Gln Gln
        355                 360                 365
Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg
    370                 375                 380
Pro Ser Thr Gln Val Ser Ash Phe Pro Val Val Gly Thr Glu Leu Leu
385                 390                 395                 400
Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln
                405                 410                 415
Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val Phe Asn Arg Phe Pro
            420                 425                 430
Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val
        435                 440                 445
Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg
    450                 455                 460
Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile Thr Asp Ala Arg Arg
465                 470                 475                 480
Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Val Val Ala Pro Lys
                485                 490                 495
Val Leu Ser Ser Arg Thr Phe
            500
<210>26
<211>931
<212>PRT
<213>猿猴腺病毒SV-1
<400>26
Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ala
1               5                   10                  15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
            20                  25                  30
Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro
        35                  40                  45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
    50                  55                  60
Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr
65                  70                  75                  80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
                85                  90                  95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
            100                 105                 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
        115                 120                 125
Ala Pro Asn Pro Ala Glu Trp Thr Asn Ser Asp Ser Lys Val Lys Val
    130                 135                 140
Arg Ala Gln Ala Pro Phe Val Ser Ser Tyr Gly Ala Thr Ala Ile Thr
145                 150                 155                 160
Lys Glu Gly Ile Gln Val Gly Val Thr Leu Thr Asp Ser Gly Ser Thr
                165                 170                 175
Pro Gln Tyr Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln Ile Gly Glu
            180                 185                 190
Leu Gln Trp Asn Ser Asp Val Gly Thr Asp Asp Lys Ile Ala Gly Arg
        195                 200                 205
Val Leu Lys Lys Thr Thr Pro Met Phe Pro Cys Tyr Gly Ser Tyr Ala
    210                 215                 220
Arg Pro Thr Asn Glu Lys Gly Gly Gln Ala Thr Pro Ser Ala Ser Gln
225                 230                 235                 240
Asp Val Gln Asn Pro Glu Leu Gln Phe Phe Ala Ser Thr Asn Val Ala
                245                 250                 255
Asn Thr Pro Lys Ala Val Leu Tyr Ala Glu Asp Val Ser Ile Glu Ala
            260                 265                 270
Pro Asp Thr His Leu Val Phe Lys Pro Thr Val Thr Glu Gly Ile Thr
        275                 280                 285
Ser Ser Glu Ala Leu Leu Thr Gln Gln Ala Ala Pro Asn Arg Pro Asn
    290                 295                 300
Tyr Ile Ala Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser
305                 310                 315                 320
Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala
                325                 330                 335
Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Met
            340                 345                 350
Leu Asp Ala Leu Gly Asp Arg Ser Arg Tyr Phe Ser Met Trp Asn Gln
        355                 360                 365
Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly
    370                 375                 380
Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Gly Gly Met Ala
385                 390                 395                 400
Val Thr Asp Thr Tyr Ser Pro Ile Lys Val Asn Gly Gly Gly Asn Gly
                405                 410                 415
Trp Glu Ala Asn Asn Gly Val Phe Thr Glu Arg Gly Val Glu Ile Gly
            420                 425                 430
Ser Gly Asn Met Phe Ala Met Glu Ile Asn Leu Gln Ala Asn Leu Trp
        435                 440                 445
Arg Ser Phe Leu Tyr Ser Asn Ile Gly Leu Tyr Leu Pro Asp Ser Leu
    450                 455                 460
Lys Ile Thr Pro Asp Asn Ile Thr Leu Pro Glu Asn Lys Asn Thr Tyr
465                 470                 475                 480
Gln Tyr Met Asn Gly Arg Val Thr Pro Pro Gly Leu Val Asp Thr Tyr
                485                 490                 495
Val Asn Val Gly Ala Arg Trp Ser Pro Asp Val Met Asp Ser Ile Asn
            500                 505                 510
Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met Leu
        515                 520                 525
Leu Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln Lys
    530                 535                 540
Phe Phe Ala Ile Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr Tyr
545                 550                 555                 560
Glu Trp Asn Phe Arg Lys Asp Val Asn Met Ile Leu Gln Ser Ser Leu
                565                 570                 575
Gly Asn Asp Leu Arg Val Asp Gly Ala Ser Ile Arg Phe Asp Ser Ile
            580                 585                 590
Asn Leu Tyr Ala Asn Phe Phe Pro Met Ala His Asn Thr Ala Ser Thr
        595                 600                 605
Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn Asp
    610                 615                 620
Tyr Leu Cys Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala Thr
625                 630                 635                 640
Ser Val Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg Gly
                645                 650                 655
Trp Ser Phe Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu Gly Ser
            660                 665                 670
Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly Ser Ile Pro Tyr Leu Asp
        675                 680                 685
Gly Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser Ile Met Phe
    690                 695                 700
Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro Asn
705                 710                 715                 720
Glu Phe Glu Ile Lys Arg Ser Val Asp Gly Glu Gly Tyr Asn Val Ala
                725                 730                 735
Gln Ser Asn Met Thr Lys Asp Trp Phe Leu Ile Gln Met Leu Ser His
            740                 745                 750
Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Val Pro Glu Asn Tyr Lys Asp
        755                 760                 765
Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln Ile
    770                 775                 780
Val Asp Ser Thr Ala Tyr Thr Asn Tyr Gln Asp Val Lys Leu Pro Tyr
785                 790                 795                 800
Gln His Asn Asn Ser Gly Phe Val Gly Tyr Met Gly Pro Thr Met Arg
                805                 810                 815
Glu Gly Gln Ala Tyr Pro Ala Asn Tyr Pro Tyr Pro Leu Ile Gly Ala
            820                 825                 830
Thr Ala Val Pro Ser Leu Thr Gln Lys Lys Phe Leu Cys Asp Arg Val
        835                 840                 845
Met Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ser Leu
    850                 855                 860
Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala Asn Ser Ala His Ala Leu
865                 870                 875                 880
Asp Met Thr Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu Leu Tyr
                885                 890                 895
Val Leu Phe Glu Val Phe Asp Val Val Arg Ile His Gln Pro His Arg
            900                 905                 910
Gly Val Ile Glu Ala Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly Asn
        915                 920                 925
Ala Thr Thr
    930
<210>27
<211>363
<212>PRT
<213>猿猴腺病毒SV-1
<400>27
Met Lys Arg Thr Arg Val Asp Glu Asp Phe Asn Pro Val Tyr Pro Tyr
1               5                   10                  15
Asp Thr Thr Thr Thr Pro Ala Val Pro Phe Ile Ser Pro Pro Phe Val
            20                  25                  30
Asn Ser Asp Gly Leu Gln Glu Asn Pro Pro Gly Val Leu Ser Leu Arg
        35                  40                  45
Ile Ala Lys Pro Leu Tyr Phe Asp Met Glu Arg Lys Leu Ala Leu Ser
    50                  55                  60
Leu Gly Arg Gly Leu Thr Ile Thr Ala Ala Gly Gln Leu Glu Ser Thr
65                  70                  75                  80
Gln Ser Val Gln Thr Asn Pro Pro Leu Ile Ile Thr Asn Ash Asn Thr
                85                  90                  95
Leu Thr Leu Arg His Ser Pro Pro Leu Asn Leu Thr Asp Asn Ser Leu
            100                 105                 110
Val Leu Gly Tyr Ser Ser Pro Leu Arg Val Thr Asp Asn Lys Leu Thr
        115                 120                 125
Phe Asn Phe Thr Ser Pro Leu Arg Tyr Glu Asn Glu Asn Leu Thr Phe
    130                 135                 140
Asn Tyr Thr Glu Pro Leu Lys Leu Ile Asn Asn Ser Leu Ala Ile Asp
145                 150                 155                 160
Ile Asn Ser Ser Lys Gly Leu Ser Ser Val Gly Gly Ser Leu Ala Val
                165                 170                 175
Asn Leu Ser Ser Asp Leu Lys Phe Asp Ser Asn Gly Ser Ile Ala Phe
            180                 185                 190
Gly Ile Gln Thr Leu Trp Thr Ala Pro Thr Ser Thr Gly Asn Cys Thr
        195                 200                 205
Val Tyr Ser Glu Gly Asp Ser Leu Leu Ser Leu Cys Leu Thr Lys Cys
    210                 215                 220
Gly Ala His Val Leu Gly Ser Val Ser Leu Thr Gly Leu Thr Gly Thr
225                 230                 235                 240
Ile Thr Gln Met Thr Asp Ile Ser Val Thr Ile Gln Phe Thr Phe Asp
                245                 250                 255
Asn Asn Gly Lys Leu Leu Ser Ser Pro Leu Ile Asn Asn Ala Phe Ser
            260                 265                 270
Ile Arg Gln Asn Asp Ser Thr Ala Ser Asn Pro Thr Tyr Asn Ala Leu
        275                 280                 285
Ala Phe Met Pro Asn Ser Thr Ile Tyr Ala Arg Gly Gly Gly Gly Glu
    290                 295                 300
Pro Arg Asn Asn Tyr Tyr Val Gln Thr Tyr Leu Arg Gly Asn Val Gln
305                 310                 315                 320
Lys Pro Ile Ile Leu Thr Val Thr Tyr Asn Ser Val Ala Thr Gly Tyr
                325                 330                 335
Ser Leu Ser Phe Lys Trp Thr Ala Leu Ala Arg Glu Lys Phe Ala Thr
            340                 345                 350
Pro Thr Thr Ser Phe Cys Tyr Ile Thr Glu Gln
        355                 360
<210>28
<211>560
<212>PRT
<213>猿猴腺病毒SV-1
<400>28
Met Lys Arg Ala Arg Val Asp Glu Asp Phe Asn Pro Val Tyr Pro Tyr
1               5                   10                  15
Asp Pro Pro His Ala Pro Val Met Pro Phe Ile Thr Pro Pro Phe Thr
            20                  25                  30
Ser Ser Asp Gly Leu Gln Glu Lys Pro Leu Gly Val Leu Ser Leu Asn
        35                  40                  45
Tyr Arg Asp Pro Ile Thr Thr Gln Asn Glu Ser Leu Thr Ile Lys Leu
    50                  55                  60
Gly Asn Gly Leu Thr Leu Asp Asn Gln Gly Gln Leu Thr Ser Thr Ala
65                  70                  75                  80
Gly Glu Val Glu Pro Pro Leu Thr Asn Ala Asn Asn Lys Leu Ala Leu
                85                  90                  95
Val Tyr Ser Asp Pro Leu Ala Val Lys Arg Asn Ser Leu Thr Leu Ser
            100                 105                 110
His Thr Ala Pro Leu Val Ile Ala Asp Asn Ser Leu Ala Leu Gln Val
        115                 120                 125
Ser Glu Pro Ile Phe Ile Asn Asp Lys Asp Lys Leu Ala Leu Gln Thr
    130                 135                 140
Ala Ala Pro Leu Val Thr Asn Ala Gly Thr Leu Arg Leu Gln Ser Ala
145                 150                 155                 160
Ala Pro Leu Gly Ile Ala Asp Gln Thr Leu Lys Leu Leu Phe Thr Asn
                165                 170                 175
Pro Leu Tyr Leu Gln Asn Asn Phe Leu Thr Leu Ala Ile Glu Arg Pro
            180                 185                 190
Leu Ala Ile Thr Asn Thr Gly Lys Leu Ala Leu Gln Leu Ser Pro Pro
        195                 200                 205
Leu Gln Thr Ala Asp Thr Gly Leu Thr Leu Gln Thr Asn Val Pro Leu
     210                 215                 220
Thr Val Ser Asn Gly Thr Leu Gly Leu Ala Ile Lys Arg Pro Leu Ile
225                 230                 235                 240
Ile Gln Asp Asn Asn Leu Phe Leu Asp Phe Arg Ala Pro Leu Arg Leu
                245                 250                 255
Phe Asn Ser Asp Pro Val Leu Gly Leu Asn Phe Tyr Thr Pro Leu Ala
            260                 265                 270
Val Arg Asp Glu Ala Leu Thr Val Asn Thr Gly Arg Gly Leu Thr Val
        275                 280                 285
Ser Tyr Asp Gly Leu Ile Leu Asn Leu Gly Lys Asp Leu Arg Phe Asp
    290                 295                 300
Asn Asn Thr Val Ser Val Ala Leu Ser Ala Ala Leu Pro Leu Gln Tyr
305                 310                 315                 320
Thr Asp Gln Leu Arg Leu Asn Val Gly Ala Gly Leu Arg Tyr Asn Pro
                325                 330                 335
Val Ser Lys Lys Leu Asp Val Asn Pro Asn Gln Asn Lys Gly Leu Thr
            340                 345                 350
Trp Glu Asn Asp Tyr Leu Ile Val Lys Leu Gly Asn Gly Leu Gly Phe
        355                 360                 365
Asp Gly Asp Gly Asn Ile Ala Val Ser Pro Gln Val Thr Ser Pro Asp
    370                 375                 380
Thr Leu Trp Thr Thr Ala Asp Pro Ser Pro Asn Cys Ser Ile Tyr Thr
385                 390                 395                 400
Asp Leu Asp Ala Lys Met Trp Leu Ser Leu Val Lys Gln Gly Gly Val
                405                 410                 415
Val His Gly Ser Val Ala Leu Lys Ala Leu Lys Gly Thr Leu Leu Ser
            420                 425                 430
Pro Thr Glu Ser Ala Ile Val Ile Ile Leu His Phe Asp Asn Tyr Gly
        435                 440                 445
Val Arg Ile Leu Asn Tyr Pro Thr Leu Gly Thr Gln Gly Thr Leu Gly
    450                 455                 460
Asn Asn Ala Thr Trp Gly Tyr Arg Gln Gly Glu Ser Ala Asp Thr Asn
465                 470                 475                 480
Val Leu Asn Ala Leu Ala Phe Met Pro Ser Ser Lys Arg Tyr Pro Arg
                485                 490                 495
Gly Arg Gly Ser Glu Val Gln Asn Gln Thr Val Gly Tyr Thr Cys Ile
            500                 505                 510
Gln Gly Asp Phe Ser Met Pro Val Pro Tyr Gln Ile Gln Tyr Asn Tyr
        515                 520                 525
Gly Pro Thr Gly Tyr Ser Phe Lys Phe Ile Trp Arg Thr Val Ser Arg
    530                 535                 540
Gln Pro Phe Asp Ile Pro Cys Cys Phe Phe Ser Tyr Ile Thr Glu Glu
545                 550                 555                 560
<210>29
<211>31044
<212>DNA
<213>猿猴腺病毒SV-25
<220>
<221>CDS
<222>(12284)..(13801)
<223>五邻体
<220>
<221>CDS
<222>(16681)..(19446)
<223>六邻体
<220>
<221>CDS
<222>(25380)..(26423)
<223>纤维#2
<220>
<221>CDS
<222>(26457)..(28136)
<223>纤维#1
<400>29
catcatcaat aatatacctt attctggaaa cgtgccaata tgataatgag cggggaggag     60
cgaggcgggg ccggggtgac gtgcggtgac gcggggtggc gcgagggcgg ggcgaagggc    120
gcgggtgtgt gtgtgggagg cgcttagttt ttacgtatgc ggaaggaggt tttataccgg    180
aagatgggta atttgggcgt atacttgtaa gttttgtgta atttggcgcg aaaactgggt    240
aatgaggaag ttgaggttaa tatgtacttt ttatgactgg gcggaatttc tgctgatcag    300
cagtgaactt tgggcgctga cggggaggtt tcgctacgtg acagtaccac gagaaggctc    360
aaaggtccca tttattgtac tcttcagcgt tttcgctggg tatttaaacg ctgtcagatc    420
atcaagaggc cactcttgag tgctggcgag aagagttttc tcctccgtgc tgccacgatg     480
aggctggtcc ccgagatgta cggtgttttt agcgacgaga cggtgcgtaa ctcagatgac     540
ctgctgaatt cagacgcgct ggaaatttcc aattcgcctg tgctttcgcc gccgtcactt     600
cacgacctgt ttgtgttttg gctcaacgct tagcaacgtg ttatataggg tcaagaagga     660
gcaggagacg cagtttgcta ggctgttggc cgatactcct ggagtttttg tggctctgga     720
tctaggccat cactctcttt tccaagagaa aattatcaaa aacttaactt ttacgtctcc     780
tggtcgcacg gttgcttccg ctgcctttat tacctatatt ttggatcaat ggagcaacag     840
cgacagccac ctgtcgtggg agtacatgct ggattacatg tcgatggcgc tgtggagggc     900
catgctgcgg aggagggttt gcatttactt gcgggcgcag cctccgcggc tggaccgagt     960
ggaggaggag gacgagccgg gggagaccga gaacctgagg gccgggctgg accctccaac    1020
ggaggactag gtgctgagga tgatcccgaa gaggggacta gtggggctag gaagaagcaa    1080
aagactgagt ctgaacctcg aaactttttg aatgagttga ctgtgagttt gatgaatcgt    1140
cagcgtccgg agacaatttt ctggtctgaa ttggaggagg aattcaggag gggggaactg    1200
aacctgctat acaagtatgg gtttgaacag ttaaaaactc actggttgga gccgtgggag    1260
gattttgaaa ccgccttgga cacttttgct aaagtggctc tgcggccgga taaggtttac    1320
actatccgcc gcactgttaa cataaagaag agtgtttatg ttataggcca tggagctctg    1380
gtgcaggtgc aaaccgtcga ccgggtggcc tttagttgcg gtatgcaaaa tctgggcccc    1440
ggggtgatag gcttaaatgg tgtaacattt cacaatgtaa ggtttactgg tgaaagtttt    1500
aacggctctg tgtttgcaaa taacacacag ctgacgctcc acggcgttta cttttttaac    1560
tttaataaca catgtgtgga gtcgtggggc agggtgtctt tgaggggctg ctgttttcac    1620
ggctgctgga aggcggtggt gggaagactt aaaagtgtaa catctgtaaa aaaatgcgtg    1680
tttgagcggt gtgtgttggc tttaactgtg gagggctgtg gacgcattag gaataatgcg    1740
gcgtctgaga atggatgttt tcttttgcta aaaggcacgg ctagtattaa gcataacatg    1800
atatgcggca gcggtctgta cccttcacag ctgttaactt gcgcggatgg aaactgtcag    1860
accttgcgca ccgtgcacat agcgtcccac cagcgccgcg cctggccaac attcgagcac    1920
aatatgctta tgcgttgtgc cgtccacttg ggccctaggc gaggcgtgtt tgtgccttac    1980
cagtgtaact ttagccatac caagatttta ctagaacctg ataccttctc tcgagtgtgt    2040
ttcaatgggg tgtttgacat gtcaatggaa ctgtttaaag tgataagata tgatgaatcc    2100
aagtctcgtt gtcgcccatg tgaatgcgga gctaatcatc tgaggttgta tcctgtaacc    2160
ctaaacgtta ccgaggagct gaggacggat caccacatgt tgtcctgcct gcgcaccgac    2220
tatgaatcca gcgacgagga gtgaggtgag gggcggagcc acaaagggta taaaggggcg    2280
tgaggggtgg gtgtgatgat tcaaaatgag cgggacgacg gacggcaacg cgtttgaggg    2340
tggagtgttc agcccttatc tgacatctcg tcttccttcc tgggcaggag tgcgtcagaa    2400
tgtagtgggc tccaccgtgg acggacgacc ggtcgcccct gcaaattccg ccaccctcac    2460
ctatgccacc gtgggatcat cgttggacac tgccgcggca gctgccgctt ctgctgccgc    2520
ttctactgct cgcggcatgg cggctgattt tggactgtat aaccaactgg ccactgcagc    2580
tgtggcgtct cggtctctgg ttcaagaaga tgccctgaat gtgatcctga ctcgcctgga    2640
gatcatgtca cgtcgcttgg acgaactggc tgcgcagata tcccaagcta accccgatac    2700
cacttcagaa tcctaaaata aagacaaaca aatatgttga aaagtaaaat ggctttattt    2760
gttttttttg gctcggtagg ctcgggtcca cctgtctcgg tcgttaagaa ctttgtgtat    2820
gttttccaaa acacggtaca gatgggcttg gatgttcaag tacatgggca tgaggccatc    2880
tttggggtga agataggacc attgaagagc gtcatgctcc ggggtggtgt tgtaaattac    2940
ccagtcgtag cagggtttct gggcgtggaa ctggaagatg tcctttagga gtaggctgat    3000
ggccaagggc aggcccttag tgtaggtgtt tacaaagcgg ttaagctggg agggatgcat    3060
gcggggggag atgatatgca tcttggcttg gatcttgagg ttagctatgt taccacccag    3120
gtctctgcgg gggttcatgt tatgaaggac caccagcacg gtgtagccgg tgcatttggg    3180
gaacttgtca tgcagtttgg aggggaaggc gtggaagaat ttagagaccc ccttgtggcc    3240
ccctaggttt tccatgcact catccataat gatggcaatg ggacccctgg cggccgcttt    3300
ggcaaacacg ttttgggggt tggaaacatc atagttttgc tctagagtga gctcatcata    3360
ggccatctta acaaagcggg gtaggagggt gcccgactgg gggatgatag ttccatctgg    3420
gcctggggcg tagttaccct cacagatctg catctcccag gccttaattt ccgagggggg    3480
tatcatgtcc acctgggggg caataaagaa cacggtttct ggcgggggat tgatgagctg    3540
ggtggaaagc aagttacgca gcagttgaga tttgccacag ccggtggggc cgtagatgac    3600
cccgatgacg ggttgcagct ggtagttgag agaggaacag ctgccgtcgg ggcgcaggag    3660
gggggctacc tcattcatca tgcttctaac atgtttattt tcactcacta agttttgcaa    3720
gagcctctcc ccacccaggg ataagagttc ttccaggctg ttgaagtgtt tcagcggttt    3780
taggccgtcg gccatgggca tcttttcgag cgactgacga agcaagtaca gtcggtccca    3840
gagctcggtg acgtgctcta tggaatctcg atccagcaga cttcttggtt gcgggggttg    3900
ggtcgacttt cgctgtaggg caccagccgg tgggcgtcca gggccgcgag ggttctgtcc    3960
ttccagggtc tcagcgtccg ggtgagggtg gtctcggtga cggtgaaggg atgagccccg    4020
ggctgggcgc ttgcgagggt gcgcttcagg ctcatcctgc tggtgctgaa gcggacgtcg    4080
tctccctgtg agtcggccag atagcaacga agcatgaggt cgtagctgag ggactcggcc    4140
gcgtgtccct tggcgcgcag ctttcccttg gaaacgtgct gacatttggt gcagtgcaga    4200
cattggaggg cgtagagttt gggggccagg aagaccgact cgggcgagta ggcgtcggct    4260
ccgcactgag cgcagacggt ctcgcactcc actagccacg tgagctcggg tttagcggga    4320
tcaaaaacca agttgcctcc attttttttg atgcgtttct taccttgcgt ttccatgagt    4380
ttgtggcccg cttccgtgac aaaaaggctg tcggtgtctc cgtagacaga cttgaggggg    4440
cgatcttcca aaggtgttcc gaggtcttcc gcgtacagga actgggacca ctccgagacg    4500
aaggctctgg tccaggctaa cacgaaggag gcaatctgcg aggggtatct gtcgttttca    4560
atgagggggt ccaccttttc cagggtgtgc agacacaggt cgtcctcctc cgcgtccacg    4620
aaggtgattg gcttgtaagt gtaggtcacg tgatctgcac cccccaaagg ggtataaaag    4680
ggggcgtgcc caccctctcc gtcactttct tccgcatcgc tgtggaccag agccagctgt    4740
tcgggtgagt aggccctctc aaaagccggc atgatctcgg cgctcaagtt gtcagtttct    4800
acaaacgagg tggatttgat attcacgtgc cccgcggcga tgcttttgat ggtggagggg    4860
tccatctgat cagaaaacac gatctttttg ttgtcaagtt tggtggcgaa agacccgtag    4920
agggcgttgg aaagcaactt ggcgatggag cgcagggtct gatttttctc ccgatcggcc    4980
ctctccttgg cggcgatgtt gagttgcacg tactcccggg ccgcgcaccg ccactcgggg    5040
aacacggcgg tgcgctcgtc gggcaggatg cgcacgcgcc agccgcgatt gtgcagggtg    5100
atgaggtcca cgctggtagc cacctccccg cggaggggct cgttggtcca acacaatcgc    5160
cccccttttc tggagcagaa cggaggcagg ggatctagca agttggcggg cggggggtcg    5220
gcgtcgatgg tgaagatacc gggtagcagg atcttattaa aataatcgat ttcggtgtcc    5280
gtgtcttgca acgcgtcttc ccacttcttc accgccaggg ccctttcgta gggattcagg    5340
ggcggtcccc agggcatggg gtgggtcagg gccgaggcgt acatgccgca gatgtcatac    5400
acgtacaggg gttccctcaa caccccgatg taagtggggt aacagcgccc cccgcggatg    5460
ctggctcgca cgtagtcgta catctcgcgc gagggagcca tgaggccgtc tcccaagtgg    5520
gtcttgtggg gtttttcggc ccggtagagg atctgtctga agatggcgtg ggagttggaa    5580
gagatggtgg ggcgttggaa gacgttaaag ttggccccgg gtagtcccac ggagtcttgg    5640
atgaactggg cgtaggattc ccggagtttg tccaccaggg cggcggtcac cagcacgtcg    5700
agagcgcagt agtccaacgt ctcgcggacc aggttgtagg ccgtctcttg ttttttctcc    5760
cacagttcgc ggttgaggag gtattcctcg cggtctttcc agtactcttc ggcgggaaat    5820
cctttttcgt ccgctcggta agaacctaac atgtaaaatt cgttcaccgc tttgtatgga    5880
caacagcctt tttctaccgg cagggcgtac gcttgagcgg cctttctgag agaggtgtgg    5940
gtgagggcga aggtgtcccg caccatcact ttcaggtact gatgtttgaa gtccgtgtcg    6000
tcgcaggcgc cctgttccca cagcgtgaag tcggtgcgct ttttctgcct gggattgggg    6060
agggcgaagg tgacatcgtt aaagagtatt ttcccggcgc ggggcatgaa gttgcgagag    6120
atcctgaagg gcccgggcac gtccgagcgg ttgttgatga cctgcgccgc caggacgatc    6180
tcgtcgaagc cgttgatgtt gtgacccacg atgtaaagtt cgatgaagcg cggctgtccc    6240
ttgagggccg gcgctttttt caactcctcg taggtgagac agtccggcga ggagagaccc    6300
agctcagccc gggcccagtc ggagagttga ggattagccg caaggaagga gctccataga    6360
tccaaggcca ggagagtttg caagcggtcg cggaactcgc ggaacttttt ccccacggcc    6420
attttctccg gtgtcactac gtaaaaggtg ttggggcggt tgttccacac gtcccatcgg    6480
agctctaggg ccagctcgca ggcttggcga acgagggtct cctcgccaga gacgtgcatg    6540
accagcataa agggtaccaa ctgtttcccg aacgagccca tccatgtgta ggtttctacg    6600
tcgtaggtga caaagagccg ctgggtgcgc gcgtgggagc cgatcggaaa gaagctgatc    6660
tcctgccacc agctggagga atgggtgtta atgtggtgga agtagaagtc ccgccggcgc    6720
acagagcatt cgtgctgatg tttgtaaaag cgaccgcagt agtcgcagcg ctgcacgctc    6780
tgtatctcct gaacgagatg cgcttttcgc ccgcgcacca gaaaccggag ggggaagttg    6840
agacgggggg ctggtggggc gacatcccct tcgccttggc ggtgggagtc tgcgtctgcg    6900
tcctccttct ctgggtggac gacggtgggg acgacgacgc cccgggtgcc gcaagtccag    6960
atctccgcca cggaggggtg caggcgctgc aggaggggac gcagctgccc gctgtccagg    7020
gagtcgaggg aagtcgcgct gaggtcggcg ggaagcgttt gcaagttcac tttcagaaga    7080
ccggtaagag cgtgagccag gtgcagatgg tacttgattt ccaggggggt gttggatgaa    7140
gcgtccacgg cgtagaggag tccgtgtccg cgcggggcca ccaccgtgcc ccgaggaggt    7200
tttatctcac tcgtcgaggg cgagcgccgg ggggtagagg cggctctgcg ccggggggca    7260
gcggaggcag aggcacgttt tcgtgaggat tcggcagcgg ttgatgacga gcccggagac    7320
tgctggcgtg ggcgacgacg cggcggttga ggtcctggat gtgccgtctc tgcgtgaaga    7380
ccaccggccc ccgggtcctg aacctaaaga gagttccaca gaatcaatgt ctgcatcgtt    7440
aacggcggcc tgcctgagga tctcctgcac gtcgcccgag ttgtcctgat aggcgatctc    7500
ggccatgaac tgttccactt cttcctcgcg gaggtcaccg tggcccgctc gctccacggt    7560
ggcggccagg tcgttggaga tgcggcgcat gagttgagag aaggcgttga ggccgttctc    7620
gttccacacg cggctgtaca ccacgtttcc gaaggagtcg cgcgctcgca tgaccacctg    7680
ggccacgttg agttccacgt ggcgggcgaa gacggcgtag tttctgaggc gctggaagag    7740
gtagttgagc gtggtggcga tgtgctcgca gacgaagaag tacataatcc agcgccgcag    7800
ggtcatctcg ttgatgtctc cgatggcttc gagacgctcc atggcctcgt agaagtcgac    7860
ggcgaagttg aaaaattggg agttgcgggc ggccaccgtg agttcttctt gcaggaggcg    7920
gatgagatcg gcgaccgtgt cgcgcacctc ctgttcgaaa gcgccccgag gcgcctctgc    7980
ttcttcctcc ggctcctcct cttccagggg ctcgggttcc tccggcagct ctgcgacggg    8040
gacggggcgg cgacgtcgtc gtctgaccgg caggcggtcc acgaagcgct cgatcatttc    8100
gccgcgccgg cgacgcatgg tctcggtgac ggcgcgtccg ttttcgcgag gtcgcagttc    8160
gaagacgccg ccgcgcagag cgcccccgtg cagggagggt aagtggttag ggccgtcggg    8220
cagggacacg gcgctgacga tgcattttat caattgctgc gtaggcactc cgtgcaggga    8280
tctgagaacg tcgaggtcga cgggatccga gaacttctct aggaaagcgt ctatccaatc    8340
gcaatcgcaa ggtaagctga gaacggtggg tcgctggggg gcgttcgcgg gcagttggga    8400
ggtgatgctg ctgatgatgt aattaaagta ggcggtcttc aggcggcgga tggtggcgag    8460
gaggaccacg tctttgggcc cggcctgttg aatgcgcagg cgctcggcca tgccccaggc    8520
ctcgctctga cagcgacgca ggtctttgta gaagtcttgc atcagtctct ccaccggaac    8580
ctctgcttct cccctgtctg ccatgcgagt cgagccgaac ccccgcaggg gctgcagcaa    8640
cgctaggtcg gccacgaccc tttcggccag cacggcctgt tgaatctgcg tgagggtggc    8700
ctggaagtcg tccaggtcca cgaagcggtg ataggccccc gtgttgatgg tgtaggtgca    8760
gttggccatg acggaccagt tgacgacttg catgccgggt tgggtgatct ccgtgtactt    8820
gaggcgcgag taggccctgg actcgaacac gtagtcgttg catgtgcgca ccagatactg    8880
gtagccgacc aggaagtgag gaggcggctc tcggtacagg ggccagccaa cggtggcggg    8940
ggcgccgggg gacaggtcgt ccagcatgag gcggtggtag tggtagatgt agcgggagag   9000
ccaggtgatg ccggccgagg tggttgcggc cctggtgaat tcgcggacgc ggttccagat   9060
gttgcgcagg ggaccaaagc gctccatggt gggcacgctc tgccccgtga ggcgggcgca   9120
atcttgtacg ctctagatgg aaaaaagaca gggcggtcat cgactccttt ccgtagcttg   9180
gggggtaaag tcgcaagggt gcggcggcgg ggaaccccgg ttcgagaccg gccggatccg   9240
ccgctcccga tgcgcctggc cccgcatcca cgacgtccgc gccgagaccc agccgcgacg   9300
ctccgcccca atacggaggg gagtcttttg gtgttttttc gtagatgcat ccggtgctgc   9360
ggcagatgcg accccagacg cccactacca ccgccgtggc ggcagtaaac ctgagcggag   9420
gcggtgacag ggaggaggaa gagctggctt tagacctgga agagggagag gggctggccc   9480
ggctgggagc gccatcccca gagagacacc ctagggttca gctcgtgagg gacgccaggc   9540
aggcttttgt gccgaagcag aacctgttta gggaccgcag cggtcaggag gcggaggaga   9600
tgcgcgattg caggtttcgg gcgggcagag agctcagggc gggcttcgat cgggagcggc   9660
tcctgagggc ggaggatttc gagcccgacg agcgttctgg ggtgagcccg gcccgcgctc   9720
acgtatcggc ggccaacctg gtgagcgcgt acgagcagac ggtgaacgag gagcgcaact   9780
tccaaaagag ctttaacaat cacgtgagga ccctgatcgc gagggaggag gtgaccatcg   9840
ggctgatgca tctgtgggac ttcgtggagg cctacgtgca gaacccggct agcaaacccc   9900
tgacggccca gctgttcctg atcgtgcagc acagccgcga caacgagacg ttccgcgacg   9960
ccatgttgaa catcgcggag cccgagggtc gctggctctt ggatctgatt aacatcctgc  10020
agagcatcgt ggtgcaggag aggggcctga gtttagcgga caaggtggcg gccattaact  10080
attcgatgca gagcctgggg aagttctacg ctcgcaagat ctacaagagc ccttacgtgc  10140
ccatagacaa ggaggtgaag atagacagct tttacatgcg catggcgctg aaggtgctga  10200
cgctgagcga cgacctcggc gtgtaccgta acgacaagat ccacaaggcg gtgagcgcca  10260
gccgccggcg ggagctgagc gacagggagc tgatgcacag cctgcagagg gcgctggcgg  10320
gcgccgggga cgaggagcgc gaggcttact tcgacatggg agccgatctg cagtggcgtc  10380
ccagcgcgcg cgccttggag gcggcgggtt atcccgacga ggaggatcgg gacgatttgg  10440
aggaggcagg cgagtacgag gacgaagcct gaccgggcag gtgttgtttt agatgcagcg  10500
gccggcggac gggaccaccg cggatcccgc acttttggca tccatgcaga gtcaaccttc  10560
gggcgtgacc gcctccgatg actgggcggc ggccatggac cgcatcatgg cgctgaccac  10620
ccgcaacccc gaggctttta ggcagcaacc ccaggccaac cgtttttcgg ccatcttgga  10680
agcggtggtg ccgtcgcgca ccaacccgac gcacgagaaa gtcctgacta tcgtgaacgc  10740
cctggtagac agcaaggcca tccgccgtga cgaggcgggc ttgatttaca acgctctttt  10800
ggaacgcgtg gcgcgctaca acagcactaa cgtgcagacc aatctggacc gcctcaccac  10860
cgacgtgaag gaggcgctgg cgcagaagga gcggtttctg agggacagta atctgggctc  10920
tctggtggca ctgaacgcct tcctgagctc acagccggcc aacgtgcccc gcgggcagga  10980
ggattacgtg agcttcatca gcgctctgag actgctggtg tccgaggtgc cccagagcga  11040
ggtgtaccag tctgggccgg attacttttt ccagacgtcc cgacagggct tgcaaacggt  11100
gaacctgact caggccttta aaaacttgca aggcatgtgg ggggtcaagg ccccggtggg  11160
cgatcgcgcc actatctcca gtctgctgac ccccaacact cgcctgctgc tgctcttgat  11220
cgcaccgttt accaacagta gcactatcag ccgtgactcg tacctgggtc atctcatcac  11280
tctgtaccgc gaggccatcg gccaggctca gatcgacgag catacgtatc aggagattac  11340
taacgtgagc cgtgccctgg gtcaggaaga taccggcagc ctggaagcca cgttgaactt  11400
tttgctaacc aaccggaggc aaaaaatacc ctcccagttc acgttaagcg ccgaggagga  11460
gaggattctg cgatacgtgc agcagtccgt gagcctgtac ttgatgcgcg agggcgccac  11520
cgcttccacg gctttagaca tgacggctcg gaacatggaa ccgtcctttt actccgccca  11580
ccggccgttc attaaccgtc tgatggacta cttccatcgc gcggccgcca tgaacgggga  11640
gtacttcacc aatgccatcc tgaatccgca ttggatgccc ccgtccggct tctacaccgg  11700
ggagtttgac ctgcccgaag ccgacgacgg ctttctgtgg gacgacgtgt ccgatagcat  11760
tttcacgccg gctaatcgcc gattccagaa gaaggagggc ggagacgagc tccccctctc  11820
cagcgtggaa gcggcctcaa ggggagagag tccctttcca agtctgtctt ccgccagtag  11880
cggtcgggta acgcgtccac ggttgccggg ggagagcgac tacctgaacg accccttgct  11940
gcgaccggct agaaagaaaa attttcccaa taacggggtg gaaagcttgg tggataaaat  12000
gaatcgttgg aagacgtacg cccaggagca gcgggagtgg gaggacagtc agccgcggcc  12060
gctggtaccg ccgcattggc gtcgccagag agaagacccg gacgactccg cagacgatag  12120
tagcgtgttg gacctgggag ggagcggagc caaccccttt gctcacttgc aacccaaggg  12180
gcgctcgagt cgcctgtatt aataaaaaag acgcggaaac ttaccagagc catggccaca  12240
gcgtgtgtgc tttcttcctc tctttcttcc tcggcgcggc aga atg aga aga gcg    12295
                                                Met Arg Arg Ala
                                                1
gtg aga gtc acg ccg gcg gcg tat gag ggc ccg ccc cct tct tac gaa    12343
Val Arg Val Thr Pro Ala Ala Tyr Glu Gly Pro Pro Pro Ser Tyr Glu
5                   10                  15                  20
agc gtg atg gga tca gcg aac gtg ccg gcc acg ctg gag gcg cct tac    12391
Ser Val Met Gly Ser Ala Asn Val Pro Ala Thr Leu Glu Ala Pro Tyr
                25                  30                  35
gtt cct ccc aga tac ctg gga cct acg gag ggc aga aac agc atc cgt    12439
Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Gly Arg Asn Ser Ile Arg
            40                  45                  50
tac tcc gag ctg gcg ccc ctg tac gat acc acc aag gtg tac ctg gtg    12487
Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Lys Val Tyr Leu Val
        55                  60                  65
gac aac aag tcg gcg gac atc gcc tcc ctg aat tac caa aac gat cac    12535
Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Gln Asn Asp His
    70                  75                  80
agt aac ttt ctg act acc gtg gtg cag aac aat gac ttc acc ccg acg    12583
Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Phe Thr Pro Thr
85                  90                  95                  100
gag gcg ggc acg cag acc att aac ttt gac gag cgt tcc cgc tgg ggc    12631
Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg Trp Gly
                105                 110                 115
ggt cag ctg aaa acc atc ctg cac acc aac atg ccc aac atc aac gag    12679
Gly Gln Leu Lys Thr Ile Leu His Thr Asn Met Pro Asn Ile Asn Glu
            120                 125                 130
ttc atg tcc acc aac aag ttc agg gct aag ctg atg gta gaa aaa agt    12727
Phe Met Ser Thr Asn Lys Phe Arg Ala Lys Leu Met Val Glu Lys Ser
        135                 140                 145
aat gcg gaa act cgg cag ccc cga tac gag tgg ttc gag ttt acc att    12775
Asn Ala Glu Thr Arg Gln Pro Arg Tyr Glu Trp Phe Glu Phe ThrIle
    150                 155                 160
cca gag ggc aac tat tcc gaa act atg act atc gat ctc atg aat aac    12823
Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile Asp Leu Met Asn Asn
165                 170                 175                 180
gcg atc gtg gac aat tac ctg caa gtg ggg aga cag aac ggg gtg ctg    12871
Ala Ile Val Asp Asn Tyr Leu Gln Val Gly Arg Gln Asn Gly Val Leu
                185                 190                 195
gaa agc gat atc ggc gtg aaa ttc gat acc aga aac ttc cga ctg ggg    12919
Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly
            200                 205                 210
tgg gat ccc gtg acc aag ctg gtg atg cca ggc gtg tac acc aac gag    12967
Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr Thr Asn Glu
        215                 220                 225
gct ttt cac ccg gac atc gtg ctg ctg ccg ggg tgc ggt gtg gac ttc    13015
Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe
    230                 235                 240
act cag agc cgt ttg agt aac ctg tta gga att aga aag cgc cgc ccc    13063
Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Arg Pro
245                 250                 255                 260
ttc caa gag ggc ttt caa atc atg tat gag gac ctg gag gga ggt aat    13111
Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu Glu Gly Gly Asn
                265                 270                 275
ata ccc gcc tta ctg gac gtg tcg aag tac gaa gct agc ata caa cgc    13159
Ile Pro Ala Leu Leu Asp Val Ser Lys Tyr Glu Ala Ser Ile Gln Arg
            280                 285                 290
gcc aaa gcg gag ggt aga gag att cgg gga gac acc ttt gcg gta gct    13207
Ala Lys Ala Glu Gly Arg Glu Ile Arg Gly Asp Thr Phe Ala Val Ala
        295                 300                 305
ccc cag gac ctg gaa ata gtg cct tta act aaa gac agc aaa gac aga    13255
Pro Gln Asp Leu Glu Ile Val Pro Leu Thr Lys Asp Ser Lys Asp Arg
    310                 315                 320
agc tac aat att ata aac aac acg acg gac acc ctg tat cgg agc tgg    13303
Ser Tyr Asn Ile Ile Asn Asn Thr Thr Asp Thr Leu Tyr Arg Ser Trp
325                 330                 335                 340
ttt ctg gct tac aac tac gga gac ccc gag aaa gga gtg aga tca tgg    13351
Phe Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp
                345                 350                 355
acc ata ctc acc acc acg gac gtg acc tgt ggc tcg cag caa gtg tac    13399
Thr Ile Leu Thr Thr Thr Asp Val Thr Cys Gly Ser Gln Gln Val Tyr
            360                 365                 370
tgg tcc ctg ccg gat atg atg caa gac ccg gtc acc ttc cgc ccc tcc    13447
Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg Pro Ser
        375                 380                 385
acc caa gtc agc aac ttc ccg gtg gtg ggc acc gag ctg ctg ccc gtc    13495
Thr Gln Val Ser Asn Phe Pro Val Val Gly Thr Glu Leu Leu Pro Val
    390                 395                 400
cat gcc aag agc ttc tac aac gag cag gcc gtc tac tcg caa ctt att    13543
His Ala Lys Ser Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln Leu Ile
405                 410                 415                 420
cgc cag tcc acc gcg ctt acc cac gtg ttc aat cgc ttt ccc gag aac    13591
Arg Gln Ser Thr Ala Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn
                425                 430                 435
cag att ctg gtg cgc cct ccc gct cct acc att acc acc gtc agt gaa    13639
Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu
            440                 445                 450
aac gtt ccc gcc ctc aca gat cac gga acc ctg ccg ctg cgc agc agt    13687
Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser
        455                 460                 465
atc agt gga gtt cag cgc gtg acc atc acc gac gcc aga cgt cga acc    13735
Ile Ser Gly Val Gln Arg Val Thr Ile Thr Asp Ala Arg Arg Arg Thr
    470                 475                 480
tgc ccc tac gtt tac aaa gcg ctt ggc gtg gtg gct cct aaa gtt ctt    13783
Cys Pro Tyr Val Tyr Lys Ala Leu Gly Val Val Ala Pro Lys Val Leu
485                 490                 495                 500
tct agt cgc acc ttc taa aaacatgtcc atcctcatct ctcccgataa           13831
Ser Ser Arg Thr Phe
                505
caacaccggc tggggactgg gctccggcaa gatgtacggc ggagccaaaa ggcgctccag  13891
tcagcaccca gttcgagttc ggggccactt ccgcgctcct tggggagctt acaagcgagg  13951
actctcgggt cgaacggctg tagacgatac catagatgcc gtgattgccg acgcccgccg  14011
gtacaacccc ggaccggtcg ctagcgccgc ctccaccgtg gattccgtga tcgacagcgt  14071
ggtagccggc gctcgggcct atgctcgccg caagaggcgg ctgcatcgga gacgtcgccc  14131
caccgccgcc atgctggcag ccagggccgt gctgaggcgg gcccggaggg caggcagaag  14191
ggctatgcgc cgcgctgccg ccaacgccgc cgccgggagg gcccgccgac aggctgcccg  14251
ccaggctgcc gctgccatcg ctagcatggc cagacccagg agagggaacg tgtactgggt  14311
gcgtgattct gtgacgggag tccgagtgcc ggtgcgcagc cgacctcccc gaagttagaa  14371
gatccaagct gcgaagacgg cggtactgag tctccctgtt gttatcagcc caacatgagc  14431
aagcgcaagt ttaaagaaga actgctgcag acgctggtgc ctgagatcta tggccctccg  14491
gacgtgaagc cagacattaa gccccgcgat atcaagcgtg ttaaaaagcg ggaaaagaaa  14551
gaggaactcg cggtggtaga cgatggcgga gtggaattta ttaggagttt cgccccgcga  14611
cgcagggttc aatggaaagg gcggcgggta caacgcgttt tgaggccggg caccgcggta  14671
gtttttaccc cgggagagcg gtcggccgtt aggggtttca aaaggcagta cgacgaggtg  14731
tacggcgacg aggacatatt ggaacaggcg gctcaacaga tcggagaatt tgcctacgga  14791
aagcgttcgc gtcgcgaaga cctggccatc gccttagaca gcggcaaccc cacgcccagc  14851
ctcaaacccg tgacgctgca gcaggtgctt cccgtgagcg ccagcacgga cagcaagagg  14911
gggattaaga gagaaatgga agatctgcat cccaccatcc aactcatggt ccctaaacgg  14971
cagaggctgg aagaggtcct ggagaagatg aaagtggacc ccagcataga gccggatgta  15031
aaagtcagac ctattaagga agtggccccc ggtcttgggg tgcaaacggt ggacattcaa  15091
atccccgtca ccaccgcttc aaccgccgtg gaagctatgg aaacgcaaac ggagacccct  15151
gccgcgatcg gtaccaggga agtggcgttg caaacggagc cttggtacga atacgcagcc  15211
cctcggcgtc agaggcgttc cgctcgttac ggccccgcca acgccatcat gccagaatat  15271
gcgctgcatc cgtctattct gcccactccc ggataccggg gtgtgacgta tcgcccgtct  15331
ggaacccgcc gccgaacccg tcgccgccgc cgctcccgtc gcgctctggc ccccgtgtcg  15391
gtgcggcgtg tgacccgccg gggaaagaca gtcgtcattc ccaacccgcg ttaccaccct  15451
agcatccttt aataactctg ccgttttgca gatggctctg acttgccgcg tgcgccttcc  15511
cgttccgcac tatcgaggaa gatctcgtcg taggagaggc atgacgggca gtggtcgccg  15571
gcgggctttg cgcaggcgca tgaaaggcgg aattttaccc gccctgatac ccataattgc  15631
cgccgccatc ggtgccatac ccggcgttgc ttcagtggcg ttgcaagcag ctcgtaataa  15691
ataaacaaag gcttttgcac ttatgacctg gtcctgacta ttttatgcag aaagagcatg  15751
gaagacatca attttacgtc gctggctccg cggcacggct cgcggccgct catgggcacc  15811
tggaacgaca tcggcaccag tcagctcaac gggggcgctt tcaattgggg gagcctttgg  15871
agcggcatta aaaactttgg ctccacgatt aaatcctacg gcagcaaagc ctggaacagt  15931
agtgctggtc agatgctccg agataaactg aaggacacca acttccaaga aaaagtggtc  15991
aatggggtgg tgaccggcat ccacggcgcg gtagatctcg ccaaccaagc ggtgcagaaa  16051
gagattgaca ggcgtttgga aagctcgcgg gtgccgccgc agagagggga tgaggtggag  16111
gtcgaggaag tagaagtaga ggaaaagctg cccccgctgg agaaagttcc cggtgcgcct  16171
ccgagaccgc agaagcggcc caggccagaa ctagaagaga ctctggtgac ggagagcaag  16231
gagcctccct cgtacgagca agccttgaaa gagggcgcct ctccaccctc ctacccgatg  16291
actaagccga tcgcacccat ggctcgaccg gtgtacggca aggattacaa gcccgtcacg  16351
ctagagctgc ccccaccgcc ccccacgcgc ccgaccgtcc cccccctgcc gactccgtcg  16411
gcggccgcgg cgggacccgt gtccgcacca tccgctgtgc ctctgccagc cgcccgtcca  16471
gtggccgtgg ccactgccag aaaccccaga ggccagagag gagccaactg gcaaagcacg  16531
ctgaacagca tcgtgggcct gggagtgaaa agcctgaaac gccgccgttg ctattattaa  16591
aaaagtgtag ctaaaaagtc tcccgttgta tacgcctcct atgttaccgc cagagacgag  16651
tgactgtcgc cgcgagcgcc gctttcaag atg gcc acc cca tcg atg atg ccg    16704
                                Met Ala Thr Pro Ser Met Met Pro
                                                510
cag tgg tct tac atg cac atc gcc ggc cag gac gcc tcg gag tac ctg    16752
Gln Trp Ser Tyr Met His Ile Ala Gly Gln Asp Ala Ser Glu Tyr Leu
    515                 520                 525
agt ccc ggc ctc gtg cag ttt gcc cgc gcc acc gac acc tac ttc agc    16800
Ser Pro Gly Leu Val Gln Phe Ala Arg Ala Thr Asp Thr Tyr Phe Ser
530                 535                 540                 545
ttg gga aac aag ttt aga aac ccc acc gtg gcc ccc acc cac gat gtg    16848
Leu Gly Asn Lys Phe Arg Asn Pro Thr Val Ala Pro Thr His Asp Val
                550                 555                 560
acc acg gac cgc tcg cag agg ctg acc ctg cgc ttt gtg ccc gta gac    16896
Thr Thr Asp Arg Ser Gln Arg Leu Thr Leu Arg Phe Val Pro Val Asp
            565                 570                 575
cgg gag gac acc gcg tac tct tac aaa gtg cgc tac acg ttg gcc gta    16944
Arg Glu Asp Thr Ala Tyr Ser Tyr Lys Val Arg Tyr Thr Leu Ala Val
        580                 585                 590
ggg gac aac cga gtg ctg gac atg gcc agc acc tac ttt gac atc cgg    16992
Gly Asp Asn Arg Val Leu Asp Met Ala Ser Thr Tyr Phe Asp Ile Arg
    595                 600                 605
ggg gtg ctg gat cgg ggt ccc agc ttc aag ccc tat tcc ggc acc gct    17040
Gly Val Leu Asp Arg Gly Pro Ser Phe Lys Pro Tyr Ser Gly Thr Ala
610                 615                 620                 625
tac aac tcc ctg gcc ccc aag gga gct ccc aac ccc tcg gaa tgg acg    17088
Tyr Asn Ser Leu Ala Pro Lys Gly Ala Pro Asn Pro Ser Glu Trp Thr
                630                 635                 640
gac act tcc gac aac aaa ctt aaa gca tat gct cag gct ccc tac cag    17136
Asp Thr Ser Asp Asn Lys Leu Lys Ala Tyr Ala Gln Ala Pro Tyr Gln
            645                 650                 655
agt caa gga ctt aca aag gat ggt att cag gtt ggg cta gtt gtg aca    17184
Ser Gln Gly Leu Thr Lys Asp Gly Ile Gln Val Gly Leu Val Val Thr
        660                 665                 670
gag tca gga caa aca ccc caa tat gca aac aaa gtg tac caa ccc gag    17232
Glu Ser Gly Gln Thr Pro Gln Tyr Ala Asn Lys Val Tyr Gln Pro Glu
    675                 680                 685
cca caa att ggg gaa aac caa tgg aat tta gaa caa gaa gat aaa gcg    17280
Pro Gln Ile Gly Glu Asn Gln Trp Asn Leu Glu Gln Glu Asp Lys Ala
690                 695                 700                 705
gcg gga aga gtc cta aag aaa gat acc cct atg ttt ccc tgc tat ggg    17328
Ala Gly Arg Val Leu Lys Lys Asp Thr Pro Met Phe Pro Cys Tyr Gly
                710                 715                 720
tca tat gcc agg ccc aca aac gaa caa gga ggg cag gca aaa aac caa    17376
Ser Tyr Ala Arg Pro Thr Asn Glu Gln Gly Gly Gln Ala Lys Asn Gln
            725                 730                 735
gaa gta gat tta cag ttt ttt gcc act ccg ggc gac acc cag aac acg    17424
Glu Val Asp Leu Gln Phe Phe Ala Thr Pro Gly Asp Thr Gln Asn Thr
        740                 745                 750
gct aaa gtg gta ctt tat gct gaa aat gtc aac ctg gaa act cca gat    17472
Ala Lys Val Val Leu Tyr Ala Glu Asn Val Asn Leu Glu Thr Pro Asp
    755                 760                 765
act cac tta gtg ttt aaa ccc gat gac gac agc acc agt tca aaa ctt    17520
Thr His Leu Val Phe Lys Pro Asp Asp Asp Ser Thr Ser Ser Lys Leu
770                 775                 780                 785
ctt ctt ggg cag cag gct gca cct aac aga ccc aac tac ata ggt ttt    17568
Leu Leu Gly Gln Gln Ala Ala Pro Asn Arg Pro Asn Tyr Ile Gly Phe
                790                 795                 800
aga gat aat ttt att ggt tta atg tac tac aat agc act gga aac atg    17616
Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met
            805                 810                 815
ggc gtg ctg gcc gga cag gct tct caa ttg aat gcc gta gtc gac ttg    17664
Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu
        820                 825                 830
cag gac aga aac acc gag ttg tcc tac cag ctg atg ctg gac gca ctg    17712
Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Met Leu Asp Ala Leu
    835                 840                 845
ggg gat cgc agc cga tat ttt tca atg tgg aat cag gca gta gac agc    17760
Gly Asp Arg Ser Arg Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser
850                 855                 860                 865
tat gac cca gac gtt aga att ata gaa aac cac gga gtg gaa gac gaa    17808
Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Val Glu Asp Glu
                870                 875                 880
ctg cca aac tat tgt ttt cct ctg gga gga atg gtg gtg act gac aat    17856
Leu Pro Asn Tyr Cys Phe Pro Leu Gly Gly Met Val Val Thr Asp Asn
            885                 890                 895
tac aac tct gtg acg cct caa aat gga ggc agt gga aat aca tgg cag    17904
Tyr Asn Ser Val Thr Pro Gln Asn Gly Gly Ser Gly Asn Thr Trp Gln
        900                 905                 910
gca gac aat act aca ttt agt caa aga gga gcg cag att ggc tcc gga    17952
Ala Asp Asn Thr Thr Phe Ser Gln Arg Gly Ala Gln Ile Gly Ser Gly
    915                 920                 925
aac atg ttt gcc ctg gaa att aac cta cag gcc aac ctc tgg cgc ggc    18000
Asn Met Phe Ala Leu Glu Ile Asn Leu Gln Ala Asn Leu Trp Arg Gly
930                 935                 940                 945
ttc ttg tat tcc aat att ggg ttg tat ctt cca gac tct ctg aaa atc    18048
Phe Leu Tyr Ser Asn Ile Gly Leu Tyr Leu Pro Asp Ser Leu Lys Ile
                950                 955                 960
acc ccc gac aac atc acg ctg cca gaa aac aaa aac act tat cag tac    18096
Thr Pro Asp Asn Ile Thr Leu Pro Glu Asn Lys Asn Thr Tyr Gln Tyr
            965                 970                 975
atg aac ggt cgc gta acg cca ccc ggg ctc ata gac acc tat gta aac    18144
Met Asn Gly Arg Val Thr Pro Pro Gly Leu Ile Asp Thr Tyr Val Asn
        980                 985                 990
gtg ggc gcg cgc tgg tcc ccc  gat gtc atg gac agc  att aac ccc ttc  18192
Val Gly Ala Arg Trp Ser Pro  Asp Val Met Asp Ser  Ile Asn Pro Phe
    995                 1000                 1005
aac  cac cac cgt aac gcg  ggc ttg cgc tac cgc  tcc atg ctc ttg     18237
Asn  His His Arg Asn Ala  Gly Leu Arg Tyr Arg  Ser Met Leu Leu
1010                 1015                 1020
ggc  aac ggc cgt tat gtg  cct ttt cac att cag  gtg ccc caa aaa     18282
Gly  Asn Gly Arg Tyr Val  Pro Phe His Ile Gln  Val Pro Gln Lys
1025                 1030                 1035
ttc  ttt gcc att aaa aac  ctg ctg ctt ctc ccc  ggt tcc tat acc     18327
Phe  Phe Ala Ile Lys Asn  Leu Leu Leu Leu Pro  Gly Ser Tyr Thr
1040                 1045                 1050
tat  gag tgg aac ttc cgc  aag gat gtc aac atg  atc ctg cag agc     18372
Tyr  Glu Trp Asn Phe Arg  Lys Asp Val Asn Met  Ile Leu Gln Ser
1055                 1060                 1065
tcg  ctg ggt aat gac ctg  cga gtg gac ggg gcc  agc ata cgc ttt     18417
Ser  Leu Gly Asn Asp Leu  Arg Val Asp Gly Ala  Ser Ile Arg Phe
1070                 1075                 1080
gac  agc att aac ctg tat  gcc aac ttt ttt ccc  atg gcc cac aac     18462
Asp  Ser Ile Asn Leu Tyr  Ala Asn Phe Phe Pro  Met Ala His Asn
1085                 1090                 1095
acg  gcc tct acc ctg gaa  gcc atg ctg cgc aac  gac acc aat gac     18507
Thr  Ala Ser Thr Leu Glu  Ala Met Leu Arg Asn  Asp Thr Asn Asp
1100                 1105                 1110
cag  tcc ttc aac gac tac  ctg tgc gcg gct aac  atg ctg tac ccc     18552
Gln  Ser Phe Asn Asp Tyr  Leu Cys Ala Ala Asn  Met Leu Tyr Pro
1115                 1120                 1125
atc  ccc gcc aac gcc acc  agc gtg ccc att tct  att cct tct cgg     18597
Ile  Pro Ala Asn Ala Thr  Ser Val Pro Ile Ser  Ile Pro Ser Arg
1130                 1135                 1140
aac  tgg gct gcc ttc agg  ggc tgg agt ttt act  cgc ctc aaa acc     18642
Asn  Trp Ala Ala Phe Arg  Gly Trp Ser Phe Thr  Arg Leu Lys Thr
1145                 1150                 1155
aag  gag act ccc tcg ctg  ggc tcc ggt ttt gac  ccc tac ttt gtt     18687
Lys  Glu Thr Pro Ser Leu  Gly Ser Gly Phe Asp  Pro Tyr Phe Val
1160                 1165                 1170
tac  tcc ggc tcc att ccc  tac cta gat ggc acc  ttt tac ctc aac     18732
Tyr  Ser Gly Ser Ile Pro  Tyr Leu Asp Gly Thr  Phe Tyr Leu Asn
1175                 1180                 1185
cac  act ttc aaa aag gtg  tct att atg ttt gac  tcc tcg gtt agc     18777
His  Thr Phe Lys Lys Val  Ser Ile Met Phe Asp  Ser Ser Val Ser
1190                 11951                 200
tgg  ccc ggc aac gac cgc  ctg cta acg ccc aac  gag ttc gaa att    18822
Trp  Pro Gly Asn Asp Arg  Leu Leu Thr Pro Asn  Glu Phe Glu Ile
1205                 1210                 1215
aag  cgt tcc gtg gac ggt  gaa ggg tac aac gtg  gcc cag agc aac    18867
Lys  Arg Ser Val Asp Gly  Glu Gly Tyr Asn Val  Ala Gln Ser Asn
1220                 1225                 1230
atg  acc aag gac tgg ttt  cta att caa atg ctc  agt cac tat aat    18912
Met  Thr Lys Asp Trp Phe  Leu Ile Gln Met Leu  Ser His Tyr Asn
1235                 1240                 1245
ata  ggt tac cag ggc ttc  tat gtg ccc gag aac  tac aag gac cgc    18957
Ile  Gly Tyr Gln Gly Phe  Tyr Val Pro Glu Asn  Tyr Lys Asp Arg
1250                 1255                 1260
atg  tac tcc ttc ttc cgc  aac ttc caa cca atg  agc cgg cag gtg    19002
Met  Tyr Ser Phe Phe Arg  Asn Phe Gln Pro Met  Ser Arg Gln Val
1265                 1270                 1275
gta  gat acc gtg act tat  aca gac tac aaa gat  gtc aag ctc ccc    19047
Val  Asp Thr Val Thr Tyr  Thr Asp Tyr Lys Asp  Val Lys Leu Pro
1280                 1285                 1290
tac  caa cac aac aac tca  ggg ttc gtg ggc tac  atg gga ccc acc    19092
Tyr  Gln His Asn Asn Ser  Gly Phe Val Gly Tyr  Met Gly Pro Thr
1295                 1300                 1305
atg  cga gag gga cag gcc  tac ccg gcc aac tat  ccc tac ccc ctg    19137
Met  Arg Glu Gly Gln Ala  Tyr Pro Ala Asn Tyr  Pro Tyr Pro Leu
1310v1315                 1320
atc  gga gag act gcc gta  ccc agc ctc acg cag  aaa aag ttc ctc    19182
Ile  Gly Glu Thr Ala Val  Pro Ser Leu Thr Gln  Lys Lys Phe Leu
1325                 1330                 1335
tgc  gac cgg gtg atg tgg  agg ata ccc ttc tct  agc aac ttt atg    19227
Cys  Asp Arg Val Met Trp  ArgIle Pro Phe Ser  Ser Asn Phe Met
1340                 1345                 1350
tcg  atg ggc tcc ctc acc  gac ctg ggg cag aac  atg ctg tac gcc    19272
Ser  Met Gly Ser Leu Thr  Asp Leu Gly Gln Asn  Met Leu Tyr Ala
1355                 1360                 1365
aac  tcc gct cac gcc ttg  gac atg act ttt gag  gtg gat ccc atg    19317
Asn  Ser Ala His Ala Leu  Asp Met Thr Phe Glu  Val Asp Pro Met
1370                 1375                 1380
gat  gag ccc acg ctt ctc  tat gtt ctg ttt gaa  gtc ttc gac gtg    19362
Asp  Glu Pro Thr Leu Leu  Tyr Val Leu Phe Glu  Val Phe Asp Val
1385                 1390                 1395
gtg  cgc atc cac cag ccg  cac cgc ggc gtc atc  gag gcc gtc tac    19407
Val  Arg Ile His Gln Pro  His Arg Gly Val Ile  Glu Ala Val Tyr
1400                 1405                 1410
ctg  cgc aca cct ttc tct  gcc ggt aac gcc acc  acc taa agaagctgat  19456
Leu  Arg Thr Pro Phe Ser  Ala Gly Asn Ala Thr  Thr
1415                 1420                 1425
gggttccagc gaacaggagt tgcaggccat tgttcgcgac ctgggctgcg ggccctgctt  19516
tttgggcacc ttcgacaagc gttttcccgg attcatgtcc ccccacaagc cggcctgcgc  19576
catcgttaac acggccggac gggagacagg gggggtgcac tggctcgcct tcgcctggaa  19636
cccgcgcaac cgcacctgct acctgttcga cccttttggt ttctccgacg aaaggctgaa  19696
gcagatctac caattcgagt acgaggggct cctcaagcgc agcgctctgg cctccacgcc  19756
cgaccactgc gtcaccctgg aaaagtccac ccagacggtc caggggcccc tctcggccgc  19816
ctgcgggctt ttctgttgca tgtttttgca cgccttcgtg cactggcctc acacccccat  19876
ggagcgcaac cccaccatgg atctgctcac cggagtgccc aacagcatgc ttcacagtcc  19936
ccaggtcgcc cccaccctgc gtcgcaatca ggaccacctg tatcgctttc tggggaaaca  19996
ctctgcctat ttccgccgcc accggcagcg catcgaacag gccacggcct tcgaaagcat  20056
gagccaaaga gtgtaatcaa taaaaaccgt ttttatttga catgatacgc gcttctggcg  20116
tttttattaa aaatcgaagg gttcgaggga ggggtcctcg tgcccgctgg ggagggacac  20176
gttgcggtac tggaatcggg cgctccaacg aaactcgggg atcaccagcc gcggcagggc  20236
cacgtcttcc atgttctgct tccaaaactg tcgcaccagc tgcagggctc ccatcacgtc  20296
gggcgctgag atcttgaagt cgcagttagg gccggagccc ccgcggctgt tgcggaacac  20356
ggggttggca cactggaaca ccaacacgct ggggttgtgg atactagcca gggccgtcgg  20416
gtcggtcacc tccgatgcat ccagatcctc ggcattgctc agggcgaacg gggtcagctt  20476
gcacatctgc cgcccgatct ggggtaccag gtcgcgcttg ttgaggcagt cgcagcgcag  20536
agggatgagg atgcgacgct gcccgcgttg catgatgggg taactcgccg ccaggaactc  20596
ctctatctga cggaaggcca tctgggcctt gacgccctcg gtgaaaaata gcccacagga  20656
cttgctggaa aacacgttat tgccacagtt gatgtcttcc gcgcagcagc gcgcatcttc  20716
gttcttcagc tgaaccacgt tgcgacccca gcggttctga accaccttgg ctttcgtggg  20776
atgctccttc agcgcccgct gtccgttctc gctggtcaca tccatttcca ccacgtgctc  20836
cttgcagacc atctccactc cgtggaaaca gaacagaatg ccctcctgtt gggtattgcg  20896
atgctcccac acggcgcacc cggtggactc ccagctcttg tgtttcaccc ccgcgtaggc  20956
ttccatgtaa gccattagaa atctgcccat cagctcagtg aaggtcttct ggttggtgaa  21016
ggttagcggc aggccgcggt gttcctcgtt caaccaagtt tgacagatct tgcggtacac  21076
ggctccctgg tcgggcagaa acttaaaagt cgttctgctc tcgttgtcca cgtggaactt  21136
ctccatcaac atcgtcatga cttccatgcc cttctcccag gcagtcacca gcggcgcgct  21196
ctcggggttc ttcaccaaca cggcggtgga ggggccctcg ccggccccga cgtccttcat  21256
ggacattttt tgaaactcca cggtgccgtc cgcgcggcgt actctgcgca tcggagggta  21316
gctgaagccc acctccatga cggtgctttc gccctcgctg tcggagacga tctccgggga  21376
gggcggcgga acgggggcag acttgcgagc cttcttcttg ggagggagcg gaggcacctc  21436
ctgctcgcgc tcgggactca tctcccgcaa gtagggggtg atggagcttc ctggttggtt  21496
ctgacggttg gccattgtat cctaggcaga aagacatgga gcttatgcgc gaggaaactt  21556
taaccgcccc gtcccccgtc agcgacgaag aggtcatcgt cgaacaggac ccgggctacg  21616
ttacgccgcc cgaggatctg gaggggccct tagacgaccg gcgcgacgct agtgagcggc  21676
aggaaaatga gaaagaggag gaggagggct gctacctcct ggaaggcgac gttttgctaa  21736
agcatttcgc caggcagagc accatactca aggaggcctt gcaagaccgc tccgaggtgc  21796
ccttggacgt cgccgcgctc tcccaggcct acgaggcgaa ccttttctcg ccccgagtgc  21856
ctccgaagag acagcccaac ggcacctgcg agcccaaccc gcgactcaac ttctaccccg  21916
tgttcgccgt gcccgaggcg ctggccacct accacatctt tttcaaaaac cagcgcattc  21976
ccctttcctg ccgggccaac cgcaccgcgg ccgataggaa gctaacactc agaaacggag  22036
tcagcatacc tgatatcacg tcactggagg aagtgcctaa gatcttcgag ggtctgggtc  22096
gagatgagaa gcgggcggcg aacgctctgc agaaagaaca gaaagagagt cagaacgtgc  22156
tggtggagct ggagggggac aacgcgcgtc tgaccgtcct caaacgttgc atagaagttt  22216
cccacttcgc ctacccggcc ctcaacctgc cgcccaaagt tatgaaatcg gtcatggacc  22276
agctactcat caagagagct gagcccctga atcccgacca ccctgaggcg gaaaactcag  22336
aggacggaaa gcccgtcgtc agcgacgagg agctcgagcg gtggctggaa accagggacc  22396
cccagcagtt gcaagagagg cgcaagatga tgatggcggc cgtgctggtc acggtggagc  22456
tagaatgcct gcaacggttt ttcagcgacg tggagacgct acgcaaaatc ggggagtccc  22516
tgcactacac cttccgccag ggctacgttc gccaggcctg caaaatctcc aacgtagagc  22576
tcagcaacct ggtttcctac atgggcatcc tccacgagaa ccggctgggg cagagcgtgc  22636
tgcactgcac cttgcaaggc gaggcgcgaa gggactacgt ccgagactgc gtctacctct  22696
tcctcaccct cacctggcag accgccatgg gcgtgtggca gcagtgcttg gaagagagaa  22756
acctcaaaga gctggacaaa ctcctctgcc gccagcggcg ggccctctgg accggcttca  22816
gcgagcgcac ggtcgcctgc gccctggcag acatcatttt cccagaacgc ctgatgaaaa  22876
ccttgcagaa cggcctgccg gatttcatca gtcagagcat cttgcaaaac ttccgctcct  22936
tcgtcctgga gcgctccggg atcttgcccg ccatgagctg cgcgctgcct tctgactttg  22996
tccccctttc ctaccgcgag tgccctcccc cactgtggag ccactgctac ctcttccaac  23056
tggccaactt tctggcctac cactccgacc tcatggaaga cgtgagcgga gaggggctgc  23116
tcgagtgcca ctgccgctgc aacctctgca ccccccacag atcgctggcc tgcaacaccg  23176
agctgctcag cgaaacccag gtcataggta ccttcgagat ccaggggccc cagcagcaag  23236
agggtgcttc cggcttgaag ctcactccgg cgctgtggac ctcggcttac ttacgcaaat  23296
ttgtagccga ggactaccac gcccacaaaa ttcagtttta cgaagaccaa tctcgaccac  23356
cgaaagcccc cctcacggcc tgcgtcatca cccagagcaa aatcctggcc caattgcaat  23416
ccatcaacca agcgcgccga gatttccttt tgaaaaaggg tcggggggtg tacctggacc  23476
cccagaccgg cgaggaactc aacccgtcca cactttccgt cgaagcagcc cccccgagac  23536
atgccaccca agggaaccgc caagcagctg atcgctcggc agagagcgaa gaagcaagag  23596
ctgctccagc agcaggtgga ggacgaggaa gagctgtggg acagccaggc agaggaggtg  23656
tcagaggacg aggaggagat ggaaagctgg gacagcctag acgaggagga cgagctttca  23716
gaggaagagg cgaccgaaga aaaaccacct gcatccagcg cgccttctct gagccgacag  23776
ccgaagcccc ggcccccgac gcccccggcc ggctcactca aagccagccg taggtgggac  23836
gccaccggat ctccagcggc agcggcaacg gcagcgggta aggccaaacg cgagcggcgg  23896
gggtattgct cctggcggac ccacaaaagc agtatcgtga actgcttgca acactgcggg  23956
ggaaacatct cctttgcccg acgctacctc ctcttccatc acggtgtggc cttccctcgc  24016
aacgttctct attattaccg tcatctctac agcccctacg aaacgctcgg agaaaaaagc  24076
taaggcctcc tctgccgcga ggaaaaactc cgccgccgct gccgccaagg atccgccggc  24136
caccgaggag ctgagaaagc gcatctttcc cactctgtat gctatctttc agcaaagccg  24196
cgggcagcac cctcagcgcg aactgaaaat aaaaaaccgc tccttccgct cactcacccg  24256
cagctgtctg taccacaaga gagaagacca gctgcagcgc accctggacg acgccgaagc  24316
actgttcagc aaatactgct cagcgtctct taaagactaa aagacccgcg ctttttcccc  24376
ctcgggcgcc aaaacccacg tcatcgccag catgagcaag gagattccca ccccttacat  24436
gtggagctat cagccccaga tgggcctggc cgcgggggcc gcccaggact actccagcaa  24496
aatgaactgg ctcagcgccg gcccccacat gatctcacga gttaacggca tccgagccca  24556
ccgaaaccag atcctcttag aacaggcggc aatcaccgcc acaccccggc gccaactcaa  24616
cccgcccagt tggcccgccg cccaggtgta tcaggaaact ccccgcccga ccacagtcct  24676
cctgccacgc gacgcggagg ccgaagtcct catgactaac tctggggtac aattagcggg  24736
cgggtccagg tacgccaggt acagaggtcg ggccgctcct tactctcccg ggagtataaa  24796
gagggtgatc attcgaggcc gaggtatcca gctcaacgac gaggcggtga gctcctcaac  24856
cggtctcaga cctgacggag tcttccagct cggaggagcg ggccgctctt ccttcaccac  24916
tcgccaggcc tacctgaccc tgcagagctc ttcctcgcag ccgcgctccg ggggaatcgg  24976
cactctccag ttcgtggaag agttcgtccc ctccgtctac ttcaacccgt tttccggctc  25036
acctggacgc tacccggacg ccttcattcc caactttgac gcagtgagtg aatccgtgga  25096
cggctacgac tgatgacaga tggtgcggcc gtgagagctc ggctgcgaca tctgcatcac  25156
tgccgccagc ctcgctgcta cgctcgggag gcgatcgtgt tcagctactt tgagctgccg  25216
gacgagcacc ctcagggacc ggctcacggg ttgaaactcg agattgagaa cgcgcttgag  25276
tctcacctca tcgacgcctt caccgcccgg cctctcctgg tagaaaccga acgcgggatc  25336
actaccatca ccctgttctg catctgcccc acgcccggat tac atg aag atc tgt    25391
                                                Met Lys Ile Cys
                                                            1430
gtt gtc atc ttt gcg  ctc agt tta ata aaa  act gaa ctt ttt gcc      25436
Val Val Ile Phe Ala  Leu Ser Leu Ile Lys  Thr Glu Leu Phe Ala
                1435                 1440                 1445
gta cct tca acg cca  cgc gtt gtt tct cct  tgt gaa aaa acc cca      25481
Val Pro Ser Thr Pro  Arg Val Val Ser Pro  Cys Glu Lys Thr Pro
                1450                 1455                 1460
gga gtc ctt aac tta  cac ata gca aaa ccc  ttg tat ttt acc ata      25526
Gly Val Leu Asn Leu  His Ile Ala Lys Pro  Leu Tyr Phe Thr Ile
                1465                 1470                 1475
gaa aaa caa cta gcc  ctt tca att gga aaa  ggg tta aca att tct      25571
Glu Lys Gln Leu Ala  Leu Ser Ile Gly Lys  Gly Leu Thr Ile Ser
                1480                 1485                 1490
gct aca gga cag ttg  gaa agc aca gca agc  gta cag gac agc gct      25616
Ala Thr Gly Gln Leu  Glu Ser Thr Ala Ser  Val Gln Asp Ser Ala
                1495                 1500                 1505
aca cca ccc cta cgt  ggt att tcc cct tta  aag ctg aca gac aac      25661
Thr Pro Pro Leu Arg  Gly Ile Ser Pro Leu  Lys Leu Thr Asp Asn
                1510                 1515                 1520
ggt tta aca tta agc  tat tca gat ccc ctg  cgt gtg gta ggt gac    25706
Gly Leu Thr Leu Ser  Tyr Ser Asp Pro Leu  Arg Val Val Gly Asp
                1525                 1530                 1535
caa ctt acg ttt aat  ttt act tct cca cta  cgt tac gaa aat ggc    25751
Gln Leu Thr Phe Asn  Phe Thr Ser Pro Leu  Arg Tyr Glu Asn Gly
                1540                 1545                 1550
agt ctt aca ttc aac  tac act tct ccc atg  aca cta ata aac aac    25796
Ser Leu Thr Phe Asn  Tyr Thr Ser Pro Met  Thr Leu Ile Asn Asn
                1555                 1560                 1565
agt ctt gct att aac  gtc aat acc tcc aaa  ggc ctc agt agt gac    25841
Ser Leu Ala Ile Asn  Val Asn Thr Ser Lys  Gly Leu Ser Ser Asp
                1570                 1575                 1580
aac ggc aca ctc gct  gta aat gtt act cca  gat ttt aga ttt aac    25886
Asn Gly Thr Leu Ala  Val Asn Val Thr Pro  Asp Phe Arg Phe Asn
                1585                 1590                 1595
agc tct ggt gcc tta  act ttt ggc ata caa  agt cta tgg act ttt    25931
Ser Ser Gly Ala Leu  Thr Phe Gly Ile Gln  Ser Leu Trp Thr Phe
                1600                 1605                 1610
cca acc aaa act cct  aac tgt acc gtg ttt  acc gaa agt gac tcc    25976
Pro Thr Lys Thr Pro  Asn Cys Thr Val Phe  Thr Glu Ser Asp Ser
                1615                 1620                 1625
ctg ctg agt ctt tgc  ttg act aaa tgc gga  gct cac gta ctt gga    26021
Leu Leu Ser Leu Cys  Leu Thr Lys Cys Gly  Ala His Val Leu Gly
                1630                 1635                 1640
agc gtg agt tta agc  gga gtg gca gga acc  atg cta aaa atg acc    26066
Ser Val Ser Leu Ser  Gly Val Ala Gly Thr  Met Leu Lys Met Thr
                1645                 1650                 1655
cac act tct gtt acc  gtt cag ttt tcg ttt  gat gac agt ggt aaa    26111
His Thr Ser Val Thr  Val Gln Phe Ser Phe  Asp Asp Ser Gly Lys
                1660                 1665                 1670
cta ata ttc tct cca  ctt gcg aac aac act  tgg ggt gtt cga caa    26156
Leu Ile Phe Ser Pro  Leu Ala Asn Asn Thr  Trp Gly Val Arg Gln
                1675                 1680                 1685
agc gag agt ccg ttg  ccc aac cca tcc ttc  aac gct ctc acg ttt    26201
Ser Glu Ser Pro Leu  Pro Asn Pro Ser Phe  Asn Ala Leu Thr Phe
                1690                 1695                 1700
atg cca aac ag tacc  att tat tct aga gga  gca agt aac gaa cct    26246
Met Pro Asn Ser Thr  Ile Tyr Ser Arg Gly  Ala Ser Asn Glu Pro
                1705                 1710                 1715
caa aac aat tat tat  gtc cag acg tat ctt  aga ggc aac gtg cga    26291
Gln Asn Asn Tyr Tyr  Val Gln Thr Tyr Leu  Arg Gly Asn Val Arg
                1720                 1725                 1730
aag cca att cta cta  act gtt acc tac aac  tca gtt aat tca gga     26336
Lys Pro Ile Leu Leu  Thr Val Thr Tyr Asn  Ser Val Asn Ser Gly
                1735                 1740                 1745
tat tcc tta act ttt  aaa tgg gat gct gtc  gcc aat gaa aaa ttt     26381
Tyr Ser Leu Thr Phe  Lys Trp Asp Ala Val  Ala Asn Glu Lys Phe
                1750                 1755                 1760
gcc act cct aca tct  tcg ttt tgc tat gtt  gca gag caa taa         26423
Ala Thr Pro Thr Ser  Ser Phe Cys Tyr Val  Ala Glu Gln
                1765                 1770
aaccctgtta ccccaccgtc tcgttttttt cag atg aaa  cga gcg aga gtt     26474
                                     Met Lys  Arg Ala Arg Val
                                         1775
gat  gaa gac ttc aac cca  gtg tac cct tat gac  ccc cca tac gct    26519
Asp  Glu Asp Phe Asn Pro  Val Tyr Pro Tyr Asp  Pro Pro Tyr Ala
1780                 1785                 1790
ccc  gtc atg ccc ttc att  act ccg cct ttt acc  tcc tcg gat ggg    26564
Pro  Val Met Pro Phe Ile  Thr Pro Pro Phe Thr  Ser Ser Asp Gly
1795                 1800                 1805
ttg  cag gaa aaa cca ctt  gga gtg tta agt tta  aac tac agg gat    26609
Leu  Gln Glu Lys Pro Leu  Gly Val Leu Ser Leu  Asn Tyr Arg Asp
1810                 1815                 1820
ccc  att act aca caa aat  ggg tct ctc acg tta  aaa cta gga aac    26654
Pro  Ile Thr Thr Gln Asn  Gly Ser Leu Thr Leu  Lys Leu Gly Asn
1825                 1830                 1835
ggc  ctc act cta aac aac  cag gga cag tta aca  tca act gct ggc    26699
Gly  Leu Thr Leu Asn Asn  Gln Gly Gln Leu Thr  Ser Thr Ala Gly
1840                 1845                 1850
gaa  gtg gag cct ccg ctc  act aat gct aac aac  aaa ctt gca cta    26744
Glu  Val Glu Pro Pro Leu  Thr Asn Ala Asn Asn  Lys Leu Ala Leu
1855                 1860                 1865
gcc  tat agc gaa cca tta  gca gta aaa agc aac  cgc cta act cta    26789
Ala  Tyr Ser Glu Pro Leu  Ala Val Lys Ser Asn  Arg Leu Thr Leu
1870                 1875                 1880
tca  cac acc gct ccc ctt  gtc atc gct aat aat  tct tta gcg ttg    26834
Ser  His Thr Ala Pro Leu  Val Ile Ala Asn Asn  Ser Leu Ala Leu
1885                 1890                 1895
caa  gtt tca gag cct att  ttt gta aat gac gat  gac aag cta gcc    26879
Gln  Val Ser Glu Pro Ile  Phe Val Asn Asp Asp  Asp Lys Leu Ala
1900                 1905                 1910
ctg  cag aca gcc gcc ccc  ctt gta acc aac gct  ggc acc ctt cgc    26924
Leu  Gln Thr Ala Ala Pro  Leu Val Thr Asn Ala  Gly Thr Leu Arg
1915                 1920                 1925
tta  cag agc gct gcc cct  tta gga ttg gtt gaa  aat act ctt aaa    26969
Leu  Gln Ser Ala Ala Pro  Leu Gly Leu Val Glu  Asn Thr Leu Lys
1930                 1935                 1940
ctg  ctg ttt tct aaa ccc  ttg tat ttg caa aat  gat ttt ctt gca    27014
Leu  Leu Phe Ser Lys Pro  Leu Tyr Leu Gln Asn  Asp Phe Leu Ala
1945                 1950                 1955
tta  gcc att gaa cgc ccc  ctg gct gta gca gcc  gca ggt act ctg    27059
Leu  Ala Ile Glu Arg Pro  Leu Ala Val Ala Ala  Ala Gly Thr Leu
1960                 1965                 1970
acc  cta caa ctt act cct  cca tta aag act aac  gat gac ggg cta    27104
Thr  Leu Gln Leu Thr Pro  Pro Leu Lys Thr Asn  Asp Asp Gly Leu
1975                 1980                 1985
aca  cta tcc aca gtc gag  cca tta act gta aaa  aac gga aac cta    27149
Thr  Leu Ser Thr Val Glu  Pro Leu Thr Val Lys  Asn Gly Asn Leu
1990                 1995                 2000
ggc  ttg caa ata tcg cgc  cct tta gtt gtt caa  aac aac ggc ctt    27194
Gly  Leu Gln Ile Ser Arg  Pro Leu Val Val Gln  Asn Asn Gly Leu
2005                 2010                 2015
tcg  ctt gct att acc ccc  ccg ctg cgt ttg ttt  aac agc gac ccc    27239
Ser  Leu Ala Ile Thr Pro  Pro Leu Arg Leu Phe  Asn Ser Asp Pro
2020                 2025                 2030
gtt  ctt ggt ttg ggc ttc  act ttt ccc cta gct  gtc aca aac aac    27284
Val  Leu Gly Leu Gly Phe  Thr Phe Pro Leu Ala  Val Thr Asn Asn
2035                 2040                 2045
ctc  ctc tcc tta aac atg  gga gac gga gtt aaa  ctt acc tat aat    27329
Leu  Leu Ser Leu Asn Met  Gly Asp Gly Val Lys  Leu Thr Tyr Asn
2050                 2055                 2060
aaa  cta aca gcc aat ttg  ggt agg gat tta caa  ttt gaa aac ggt    27374
Lys  Leu Thr Ala Asn Leu  Gly Arg Asp Leu Gln  Phe Glu Asn Gly
2065                 2070                 2075
gcg  att gcc gta acg ctt  act gcc gaa tta cct  ttg caa tac act    27419
Ala  Ile Ala Val Thr Leu  Thr Ala Glu Leu Pro  Leu Gln Tyr Thr
2080                 2085                 2090
aac  aaa ctt caa ctg aat  att gga gct ggc ctt  cgt tac aat gga    27464
Asn  Lys Leu Gln Leu Asn  Ile Gly Ala Gly Leu  Arg Tyr Asn Gly
2095                 2100                 2105
gcc  agc aga aaa cta gat  gta aac att aac caa  aat aaa ggc tta    27509
Ala  Ser Arg Lys Leu Asp  Val Asn Ile Asn Gln  Asn Lys Gly Leu
2110                 2115                 2120
act  tgg gac aac gat gca  gtt att ccc aaa cta  gga tcg ggc tta    27554
Thr  Trp Asp Asn Asp Ala  Val Ile Pro Lys Leu  Gly Ser Gly Leu
2125                 2130                 2135
caa  ttt gac cct aat ggc  aac atc gct gtt atc  cct gaa acc gtg    27599
Gln  Phe Asp Pro Asn Gly  Asn Ile Ala Val Ile  Pro Glu Thr Val
2140                 2145                 2150
aag  ccg caa acg tta tgg  acg act gca gat ccc  tcg cct aac tgc     27644
Lys  Pro Gln Thr Leu Trp  Thr Thr Ala Asp Pro  Ser Pro Asn Cys
2155                 2160                 2165
tca  gtg tac cag gac ttg  gat gcc agg ctg tgg  ctc gct ctt gtt     27689
Ser  Val Tyr Gln Asp Leu  Asp Ala Arg Leu Trp  Leu Ala Leu Val
2170                 2175                 2180
aaa  agt ggc gac atg gtg  cat gga agc att gcc  cta aaa gcc cta     27734
Lys  Ser Gly Asp Met Val  His Gly Ser Ile Ala  Leu Lys Ala Leu
2185                 2190                 2195
aaa  ggg acg ttg cta aat  cct aca gcc agc tac  att tcc att gtg     27779
Lys  Gly Thr Leu Leu Asn  Pro Thr Ala Ser Tyr  Ile Ser Ile Val
2200                 2205                 2210
ata  tat ttt tac agc aac  gga gtc agg cgt acc  aac tat cca acg     27824
Ile  Tyr Phe Tyr Ser Asn  Gly Val Arg Arg Thr  Asn Tyr Pro Thr
2215                 2220                 2225
ttt  gac aac gaa ggc acc  tta gct aac agc gcc  act tgg gga tac     27869
Phe  Asp Asn Glu Gly Thr  Leu Ala Asn Ser Ala  Thr Trp Gly Tyr
2230                 2235                 2240
cga  cag ggg caa tct gct  aac act aat gtg acc  aat gcc act gaa     27914
Arg  Gln Gly Gln Ser Ala  Asn Thr Asn Val Thr  Asn Ala Thr Glu
2245                 2250                 2255
ttt  atg ccc agc tca agc  agg tac ccc gtg aat  aaa gga gac aac     27959
Phe  Met Pro Ser Ser Ser  Arg Tyr Pro Val Asn  Lys Gly Asp Asn
2260                 2265                 2270
att  caa aat caa tct ttt  tca tac acc tgt att  aaa gga gat ttt     28004
Ile  Gln Asn Gln Ser Phe  Ser Tyr Thr Cys Ile  Lys Gly Asp Phe
2275                 2280                 2285
gct  atg cct gtc ccg ttc  cgt gta aca tat aat  cac gcc ctg gaa     28049
Ala  Met Pro Val Pro Phe  Arg Val Thr Tyr Asn  His Ala Leu Glu
2290                 2295                 2300
ggg  tat tcc ctt aag ttc  acc tgg cgc gtt gta  gcc aat cag gcc     28094
Gly  Tyr Ser Leu Lys Phe  Thr Trp Arg Val Val  Ala Asn Gln Ala
2305                 2310                 2315
ttt  gat att cct tgc tgt  tca ttt tca tac atc  aca gaa taa         28136
Phe  Asp Ile Pro Cys Cys  Ser Phe Ser Tyr Ile  Thr Glu
2320                 2325                 2330
aaaaccactt tttcatttta atttcttttt attttacacg aacagtgaga cttcctccac  28196
ccttccattt gacagcatac accagcctct cccccttcat agcagtaaac tgttgtgaat  28256
cagtccggta tttgggagtt aaaatccaaa cagtctcttt ggtgatgaaa cgtcgatcag  28316
taatggacac aaatccctgg gacaggtttt ccaacgtttc ggtgaaaaac tgcacaccgc  28376
cctacaaaac aaacaggttc aggctctcca cgggttatct ccccgatcaa actcagacag  28436
ggtaaaggtg cggtggtgtt ccactaaacc acgcaggtgg cgctgtctga acctctcggt  28496
gcgactcctg tgaggctggt aagaagttag attgtccagt agcctcacag catgtatcat  28556
cagtctacga gtgcgtctgg cgcagcagcg catctgaatc tcactgagat tccggcaaga  28616
atcgcacacc atcacaatca ggttgttcat gatcccatag ctgaacacgc tccagccaaa  28676
gctcattcgc tccaacagcg ccaccgcgtg tccgtccaac cttactttaa cataaatcag  28736
gtgtctgccg cgtacaaaca tgctacccac atacagaact tcccggggca ggcccctgtt  28796
caccacctgt ctgtaccagg gaaacctcac atttatcagg gagccataga tggccatttt  28856
aaaccaatta gctaataccg ccccaccagc tctacactga agagaaccgg gagagttaca  28916
atgacagtga ataatccatc tctcataacc cctgatggtc tgatgaaaat ctagatctaa  28976
cgtggcacaa caaatacaca ctttcatata cattttcata acatgttttt cccaggccgt  29036
taaaatacaa tcccaataca cgggccactc ctgcagtaca ataaagctaa tacaagatgg  29096
tatactcctc acctcactga cactgtgcat gttcatattt tcacattcta agtaccgaga  29156
gttctcctct acagcagcac tgctgcggtc ctcacaaggt ggtagctggt gatgattgta  29216
gggggccagt ctgcagcgat accgtctgtc gcgttgcatc gtagaccagg aaccgacgca  29276
cctcctcgta cttgtggtag cagaaccacg tccgctgcca gcacgtctcc acgtaacgcc  29336
ggtccctgcg tcgctcacgc tccctcctca atgcaaagtg caaccactct tgtaatccac  29396
acagatccct ctcggcctcc ggggtgatgc acacctcaaa cctacagatg tctcggtaca  29456
gttccaaaca cgtagtgagg gcgagttcca accaagacag acagcctgat ctatcccgac  29516
acactggagg tggaggaaga cacggaagag gcatgttatt ccaagcgatt caccaacggg  29576
tcgaaatgaa gatcccgaag atgacaacgg tcgcctccgg agccctgatg gaatttaaca  29636
gccagatcaa acgttatgcg attctccaag ctatcgatcg ccgcttccaa aagagcctgg  29696
acccgcactt ccacaaacac cagcaaagca aaagcactat tatcaaactc ttcaatcatc  29756
aagctgcagg actgtacaat gcctaagtaa ttttcgtttc tccactcgcg aatgatgtcg  29816
cggcagatag tctgaaggtt catcccgtgc agggtaaaaa gctccgaaag ggcgccctct  29876
acagccatgc gtagacacac catcatgact gcaagatatc gggctcctga gacacctgca  29936
gcagatttaa cagatcaagg tcaggttgct ctccgcgatc acgaatctcc atccgcaagg  29996
tcatttgcaa aaaattaaat aaatctatgc cgactagatc tgtcaactcc gcattaggaa  30056
ccaaatcagg tgtggctacg cagcacaaaa gttccaggga tggtgccaaa ctcactagaa  30116
ccgctcccga gtaacaaaac tgatgaatgg gagtaacaca gtgtaaaatg tgcaaccaaa  30176
aatcactaag gtgctccttt aaaaagtcca gtacttctat attcagtccg tgcaagtact  30236
gaagcaactg tgcgggaata tgcacaacaa aaaaaatagg gcggctcaga tacatgttga  30296
cctaaaataa aaagaatcat taaactaaag aagcttggcg aacggtggga taaatgacac  30356
gctccagcag cagacaggca accggctgtc cccgggaacc gcggtaaaat tcatccgaat  30416
gattaaaaag aacaacagaa acttcccacc atgtactcgg ttggatctcc tgagcacaca  30476
gcaatacccc cctcacattc atgtccgcca cagaaaaaaa acgtcccaga tacccagcgg  30536
ggatatccaa cgacagctgc aaagacagca aaacaatccc tctgggagcg atcacaaaat  30596
cctccggtga aaaaagcaca tacatattag aataaccctg ttgctggggc aaaaaggccc  30656
ggcgtcccag caaatgcaca taaatatgtt catcagccat tgccccgtct taccgcgtaa  30716
tcagccacga aaaaatcgag ctaaaattca cccaacagcc tatagctata tatacactcc  30776
gcccaatgac gctaataccg caccacccac gaccaaagtt cacccacacc cacaaaaccc  30836
gcgaaaatcc agcgccgtca gcacttccgc aatttcagtc tcacaacgtc acttccgcgc  30896
gccttttcac attcccacac acacccgcgc ccttcgcccc gccctcgcgc caccccgcgt  30956
caccgcacgt caccccggcc ccgcctcgct cctccccgct cattatcata ttggcacgtt  31016
tccagaataa ggtatattat tgatgatg                                     31044
<210>30
<211>505
<212>PRT
<213>猿猴腺病毒SV-25
<400>30
Met Arg Arg Ala Val Arg Val Thr Pro Ala Ala Tyr Glu Gly Pro Pro
1               5                   10                  15
Pro Ser Tyr Glu Ser Val Met Gly Ser Ala Asn Val Pro Ala Thr Leu
            20                  25                  30
Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Gly Arg
        35                  40                  45
Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Lys
    50                  55                  60
Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr
65                  70                  75                  80
Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp
                85                  90                  95
Phe Thr Pro Thr Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Glu Arg
            100                 105                 110
Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Leu His Thr Asn Met Pro
        115                 120                 125
Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Arg Ala Lys Leu Met
    130                 135                 140
Val Glu Lys Ser Asn Ala Glu Thr Arg Gln Pro Arg Tyr Glu Trp Phe
145                 150                 155                 160
Glu Phe Thr Ile Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile Asp
                165                 170                 175
Leu Met Asn Asn Ala Ile Val Asp Asn Tyr Leu Gln Val Gly Arg Gln
            180                 185                 190
Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn
        195                 200                 205
Phe Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val
    210                 215                 220
Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys
225                 230                 235                 240
Gly Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg
                245                 250                 255
Lys Arg Arg Pro Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu
            260                 265                 270
Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Ser Lys Tyr Glu Ala
        275                 280                 285
Ser Ile Gln Arg Ala Lys Ala Glu Gly Arg Glu Ile Arg Gly Asp Thr
    290                 295                 300
Phe Ala Val Ala Pro Gln Asp Leu Glu Ile Val Pro Leu Thr Lys Asp
305                 310                 315                 320
Ser Lys Asp Arg Ser Tyr Asn Ile Ile Asn Asn Thr Thr Asp Thr Leu
                325                 330                 335
Tyr Arg Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly
            340                 345                 350
Val Arg Ser Trp Thr Ile Leu Thr Thr Thr Asp Val Thr Cys Gly Ser
        355                 360                 365
Gln Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr
    370                 375                 380
Phe Arg Pro Ser Thr Gln Val Ser Asn Phe Pro Val Val Gly Thr Glu
385                 390                 395                 400
Leu Leu Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln Ala Val Tyr
                405                 410                 415
Ser Gln Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val Phe Asn Arg
            420                 425                 430
Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr
        435                 440                 445
Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro
    450                 455                 460
Leu Arg Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile Thr Asp Ala
465                 470                 475                 480
Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Val Val Ala
                485                 490                 495
Pro Lys Val Leu Ser Ser Arg Thr Phe
            500                 505
<210>31
<211>921
<212>PRT
<213>猿猴腺病毒SV-25
<400>31
Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ala
1               5                   10                  15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
            20                  25                  30
Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro
        35                  40                  45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
    50                  55                  60
Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr
65                  70                  75                  80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
                85                  90                  95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
            100                 105                 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
        115                 120                 125
Ala Pro Asn Pro Ser Glu Trp Thr Asp Thr Ser Asp Asn Lys Leu Lys
    130                 135                 140
Ala Tyr Ala Gln Ala Pro Tyr Gln Ser Gln Gly Leu Thr Lys Asp Gly
145                 150                 155                 160
Ile Gln Val Gly Leu Val Val Thr Glu Ser Gly Gln Thr Pro Gln Tyr
                165                 170                 175
Ala Asn Lys Val Tyr Gln Pro Glu Pro Gln Ile Gly Glu Asn Gln Trp
            180                 185                 190
Asn Leu Glu Gln Glu Asp Lys Ala Ala Gly Arg Val Leu Lys Lys Asp
        195                 200                 205
Thr Pro Met Phe Pro Cys Tyr Gly Ser Tyr Ala Arg Pro Thr Asn Glu
    210                 215                 220
Gln Gly Gly Gln Ala Lys Asn Gln Glu Val Asp Leu Gln Phe Phe Ala
225                 230                 235                 240
Thr Pro Gly Asp Thr Gln Asn Thr Ala Lys Val Val Leu Tyr Ala Glu
                245                 250                 255
Asn Val Asn Leu Glu Thr Pro Asp Thr His Leu Val Phe Lys Pro Asp
            260                 265                 270
Asp Asp Ser Thr Ser Ser Lys Leu Leu Leu Gly Gln Gln Ala Ala Pro
        275                 280                 285
Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met
    290                 295                 300
Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser
305                 310                 315                 320
Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser
                325                 330                 335
Tyr Gln Leu Met Leu Asp Ala Leu Gly Asp Arg Ser Arg Tyr Phe Ser
            340                 345                 350
Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile
        355                 360                 365
Glu Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu
    370                 375                 380
Gly Gly Met Val Val Thr Asp Asn Tyr Asn Ser Val Thr Pro Gln Asn
385                 390                 395                 400
Gly Gly Ser Gly Asn Thr Trp Gln Ala Asp Asn Thr Thr Phe Ser Gln
                405                 410                 415
Arg Gly Ala Gln Ile Gly Ser Gly Asn Met Phe Ala Leu Glu Ile Asn
            420                 425                 430
Leu Gln Ala Asn Leu Trp Arg Gly Phe Leu Tyr Ser Asn Ile Gly Leu
        435                 440                 445
Tyr Leu Pro Asp Ser Leu Lys Ile Thr Pro Asp Asn Ile Thr Leu Pro
    450                 455                 460
Glu Asn Lys Asn Thr Tyr Gln Tyr Met Asn Gly Arg Val Thr Pro Pro
465                 470                 475                 480
Gly Leu Ile Asp Thr Tyr Val Asn Val Gly Ala Arg Trp Ser Pro Asp
                485                 490                 495
Val Met Asp Ser Ile Asn Pro Phe Asn His His Arg Asn Ala Gly Leu
            500                 505                 510
Arg Tyr Arg Ser Met Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His
        515                 520                 525
Ile Gln Val Pro Gln Lys Phe Phe Ala Ile Lys Asn Leu Leu Leu Leu
    530                 535                 540
Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met
545                 550                 555                 560
Ile Leu Gln Ser Ser Leu Gly Asn Asp Leu Arg Val Asp Gly Ala Ser
                565                 570                 575
Ile Arg Phe Asp Ser Ile Asn Leu Tyr Ala Asn Phe Phe Pro Met Ala
            580                 585                 590
His Asn Thr Ala Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn
        595                 600                 605
Asp Gln Ser Phe Asn Asp Tyr Leu Cys Ala Ala Asn Met Leu Tyr Pro
    610                 615                 620
Ile Pro Ala Asn Ala Thr Ser Val Pro Ile Ser Ile Pro Ser Arg Asn
625                 630                 635                 640
Trp Ala Ala Phe Arg Gly Trp Ser Phe Thr Arg Leu Lys rhr Lys Glu
                645                 650                 655
Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly
            660                 665                 670
Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys
        675                 680                 685
Lys Val Ser Ile Met Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp
    690                 695                 700
Arg Leu Leu Thr Pro Asn Glu Phe Glu Ile Lys Arg Ser Val Asp Gly
705                 710                 715                 720
Glu Gly Tyr Asn Val Ala Gln Ser Asn Met Thr Lys Asp Trp Phe Leu
                725                 730                 735
Ile Gln Met Leu Ser His Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Val
            740                 745                 750
Pro Glu Asn Tyr Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln
        755                 760                 765
Pro Met Ser Arg Gln Val Val Asp Thr Val Thr Tyr Thr Asp Tyr Lys
    770                 775                 780
Asp Val Lys Leu Pro Tyr Gln His Asn Asn Ser Gly Phe Val Gly Tyr
785                 790                 795                 800
Met Gly Pro Thr Met Arg Glu Gly Gln Ala Tyr Pro Ala Asn Tyr Pro
                805                 810                 815
Tyr Pro Leu Ile Gly Glu Thr Ala Val Pro Ser Leu Thr Gln Lys Lys
            820                 825                 830
Phe Leu Cys Asp Arg Val Met Trp Arg Ile Pro Phe Ser Ser Asn Phe
        835                 840                 845
Met Ser Met Gly Ser Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala
    850                 855                 860
Asn Ser Ala His Ala Leu Asp Met Thr Phe Glu Val Asp Pro Met Asp
865                 870                 875                 880
Glu Pro Thr Leu Leu Tyr Val Leu Phe Glu Val Phe Asp Val Val Arg
                885                 890                 895
Ile His Gln Pro His Arg Gly Val Ile Glu Ala Val Tyr Leu Arg Thr
            900                 905                 910
Pro Phe Ser Ala Gly Ash Ala Thr Thr
        915                 920
<210>32
<211>347
<212>PRT
<213>猿猴腺病毒SV-25
<400>32
Met Lys Ile Cys Val Val Ile Phe Ala Leu Ser Leu Ile Lys Thr Glu
1               5                   10                  15
Leu Phe Ala Val Pro Ser Thr Pro Arg Val Val Ser Pro Cys Glu Lys
            20                  25                  30
Thr Pro Gly Val Leu Asn Leu His Ile Ala Lys Pro Leu Tyr Phe Thr
        35                  40                  45
Ile Glu Lys Gln Leu Ala Leu Ser Ile Gly Lys Gly Leu Thr Ile Ser
    50                  55                  60
Ala Thr Gly Gln Leu Glu Ser Thr Ala Ser Val Gln Asp Ser Ala Thr
65                  70                  75                  80
Pro Pro Leu Arg Gly Ile Ser Pro Leu Lys Leu Thr Asp Asn Gly Leu
                85                  90                  95
Thr Leu Ser Tyr Ser Asp Pro Leu Arg Val Val Gly Asp Gln Leu Thr
            100                 105                 110
Phe Asn Phe Thr Ser Pro Leu Arg Tyr Glu Asn Gly Ser Leu Thr Phe
        115                 120                 125
Asn Tyr Thr Ser Pro Met Thr Leu Ile Asn Asn Ser Leu Ala Ile Asn
    130                 135                 140
Val Asn Thr Ser Lys Gly Leu Ser Ser Asp Asn Gly Thr Leu Ala Val
145                 150                 155                 160
Asn Val Thr Pro Asp Phe Arg Phe Asn Ser Ser Gly Ala Leu Thr Phe
                165                 170                 175
Gly Ile Gln Ser Leu Trp Thr Phe Pro Thr Lys Thr Pro Asn Cys Thr
            180                 185                 190
Val Phe Thr Glu Ser Asp Ser Leu Leu Ser Leu Cys Leu Thr Lys Cys
        195                 200                 205
Gly Ala His Val Leu Gly Ser Val Ser Leu Ser Gly Val Ala Gly Thr
    210                 215                 220
Met Leu Lys Met Thr His Thr Ser Val Thr Val Gln Phe Ser Phe Asp
225                 230                 235                 240
Asp Ser Gly Lys Leu Ile Phe Ser Pro Leu Ala Asn Asn Thr Trp Gly
                245                 250                 255
Val Arg Gln Ser Glu Ser Pro Leu Pro Asn Pro Ser Phe Asn Ala Leu
            260                 265                 270
Thr Phe Met Pro Asn Ser Thr Ile Tyr Ser Arg Gly Ala Ser Asn Glu
        275                 280                 285
Pro Gln Asn Asn Tyr Tyr Val Gln Thr Tyr Leu Arg Gly Asn Val Arg
    290                 295                 300
Lys Pro Ile Leu Leu Thr Val Thr Tyr Asn Ser Val Asn Ser Gly Tyr
305                 310                 315                 320
Ser Leu Thr Phe Lys Trp Asp Ala Val Ala Asn Glu Lys Phe Ala Thr
                325                 330                 335
Pro Thr Ser Ser Phe Cys Tyr Val Ala Glu Gln
            340                 345
<210>33
<211>559
<212>PRT
<213>猿猴腺病毒SV-25
<400>33
Met Lys Arg Ala Arg Val Asp Glu Asp Phe Asn Pro Val Tyr Pro Tyr
1               5                   10                  15
Asp Pro Pro Tyr Ala Pro Val Met Pro Phe Ile Thr Pro Pro Phe Thr
             20                  25                  30
Ser Ser Asp Gly Leu Gln Glu Lys Pro Leu Gly Val Leu Ser Leu Asn
        35                  40                  45
Tyr Arg Asp Pro Ile Thr Thr Gln Asn Gly Ser Leu Thr Leu Lys Leu
    50                  55                  60
Gly Asn Gly Leu Thr Leu Asn Asn Gln Gly Gln Leu Thr Ser Thr Ala
65                  70                  75                  80
Gly Glu Val Glu Pro Pro Leu Thr Asn Ala Asn Asn Lys Leu Ala Leu
                85                  90                  95
Ala Tyr Ser Glu Pro Leu Ala Val Lys Ser Asn Arg Leu Thr Leu Ser
            100                 105                 110
His Thr Ala Pro Leu Val Ile Ala Asn Asn Ser Leu Ala Leu Gln Val
        115                 120                 125
Ser Glu Pro Ile Phe Val Asn Asp Asp Asp Lys Leu Ala Leu Gln Thr
    130                 135                 140
Ala Ala Pro Leu Val Thr Asn Ala Gly Thr Leu Arg Leu Gln Ser Ala
145                 150                 155                 160
Ala Pro Leu Gly Leu Val Glu Asn Thr Leu Lys Leu Leu Phe Ser Lys
                165                 170                 175
Pro Leu Tyr Leu Gln Asn Asp Phe Leu Ala Leu Ala Ile Glu Arg Pro
            180                 185                 190
Leu Ala Val Ala Ala Ala Gly Thr Leu Thr Leu Gln Leu Thr Pro Pro
        195                 200                 205
Leu Lys Thr Asn Asp Asp Gly Leu Thr Leu Ser Thr Val Glu Pro Leu
    210                 215                 220
Thr Val Lys Asn Gly Asn Leu Gly Leu Gln Ile Ser Arg Pro Leu Val
225                 230                 235                 240
Val Gln Asn Asn Gly Leu Ser Leu Ala Ile Thr Pro Pro Leu Arg Leu
                245                 250                 255
Phe Asn Ser Asp Pro Val Leu Gly Leu Gly Phe Thr Phe Pro Leu Ala
            260                 265                 270
Val Thr Asn Asn Leu Leu Ser Leu Asn Met Gly Asp Gly Val Lys Leu
        275                 280                 285
Thr Tyr Asn Lys Leu Thr Ala Asn Leu Gly Arg Asp Leu Gln Phe Glu
    290                 295                 300
Asn Gly Ala Ile Ala Val Thr Leu Thr Ala Glu Leu Pro Leu Gln Tyr
305                 310                 315                 320
Thr Asn Lys Leu Gln Leu Asn Ile Gly Ala Gly Leu Arg Tyr Asn Gly
                325                 330                 335
Ala Ser Arg Lys Leu Asp Val Asn Ile Asn Gln Asn Lys Gly Leu Thr
            340                 345                 350
Trp Asp Asn Asp Ala Val Ile Pro Lys Leu Gly Ser Gly Leu Gln Phe
        355                 360                 365
Asp Pro Asn Gly Asn Ile Ala Val Ile Pro Glu Thr Val Lys Pro Gln
    370                 375                 380
Thr Leu Trp Thr Thr Ala Asp Pro Ser Pro Asn Cys Ser Val Tyr Gln
385                 390                 395                 400
Asp Leu Asp Ala Arg Leu Trp Leu Ala Leu Val Lys Ser Gly Asp Met
                405                 410                 415
Val His Gly Ser Ile Ala Leu Lys Ala Leu Lys Gly Thr Leu Leu Asn
             420                 425                 430
Pro Thr Ala Ser Tyr Ile Ser Ile Val Ile Tyr Phe Tyr Ser Asn Gly
        435                 440                 445
Val Arg Arg Thr Asn Tyr Pro Thr Phe Asp Asn Glu Gly Thr Leu Ala
    450                 455                 460
Asn Ser Ala Thr Trp Gly Tyr Arg Gln Gly Gln Ser Ala Asn Thr Asn
465                 470                 475                 480
Val Thr Asn Ala Thr Glu Phe Met Pro Ser Ser Ser Arg Tyr Pro Val
                485                 490                 495
Asn Lys Gly Asp Asn Ile Gln Asn Gln Ser Phe Ser Tyr Thr Cys Ile
            500                 505                 510
Lys Gly Asp Phe Ala Met Pro Val Pro Phe Arg Val Thr Tyr Asn His
        515                 520                 525
Ala Leu Glu Gly Tyr Ser Leu Lys Phe Thr Trp Arg Val Val Ala Asn
    530                 535                 540
Gln Ala Phe Asp Ile Pro Cys Cys Ser Phe Ser Tyr Ile Thr Glu
545                 550                 555
<210>34
<211>34115
<212>DNA
<213>猿猴腺病毒SV-39
<220>
<221>CDS
<222>(13448)..(14959)
<223>L2五邻体
<220>
<221>CDS
<222>(17785)..(20538)
<223>L3六邻体
<220>
<221>CDS
<222>(29515)..(31116)
<223>L5纤维#1
<400>34
catcatcaat ataacaccgc aagatggcga ccgagttaac atgcaaatga ggtgggcgga     60
gttacgcgac ctttgtcttg ggaacgcgga agtgggcgcg gcgggtttcg gggaggagcg    120
cggggcgggg cgggcgtgtc gcgcggcggt gacgcgccgg ggacccggaa attgagtagt    180
ttttattcat tttgcaagtt tttctgtaca ttttggcgcg aaaactgaaa cgaggaagtg    240
aaaagtgaaa aatgccgagg tagtcaccgg gtggagatct gacctttgcc gtgtggagtt    300
tacccgctga cgtgtgggtt tcggtctcta ttttttcact gtggttttcc gggtacggtc     360
aaaggtcccc attttatgac tccacgtcag ctgatcgcta gggtatttaa tgcgcctcag     420
accgtcaaga ggccactctt gagtgccggc gagaagagtt ttctcctccg cgttccgcca     480
actgtgaaaa aatgaggaac ttcttgctat ctccggggct gccagcgacc gtagccgccg     540
agctgttgga ggacattgtt accggagctc tgggagacga tcctcaggtg atttctcact     600
tttgtgaaga ttttagtctt catgatctct atgatattga tccgggtgtt gaggggcaag     660
aggatgaatg gctggagtct gtggatgggt tttttccgga cgctatgctg ctagaggctg     720
atttgccacc acctcacaac tctcacactg agcccgagtc agctgctatt cctgaattgt     780
catcaggtga acttgacttg gcttgttacg agactatgcc tccggagtcg gatgaggagg     840
acagcgggat cagcgatccc acggctttta tggtctctaa ggcgattgct atactaaaag     900
aagatgatga tggcgatgat ggatttcgac tggacgctcc ggcggtgccg gggagagact     960
gtaagtcctg tgaataccac cgggatcgta ccggagaccc gtctatgttg tgttctctgt    1020
gttatctccg tcttaacgct gcttttgtct acagtaagtg ttttgtgctt ttttaccctg    1080
tggctttgtt gagtttattt ttttctgtgt ctcatagggt gttgtttatt ataggtcctg    1140
tttcagatgt ggaggaacct gatagtacta ctggaaatga ggaggaaaag ccctccccgc    1200
cgaaactaac tcagcgctgc agacctaata ttttgagacc ctcggcccag cgtgtgtcat    1260
cccggaaacg tgctgctgtt aattgcatag aagatttatt ggaagagccc actgaacctt    1320
tggacttgtc cttaaagcga ccccgcccgc agtagggcgc ggtgccagtt ttttctctct    1380
agcttccggg tgactcagtg caataaaaat tttcttggca acaggtgtat gtgtttactt    1440
tacgggcggg aagggattag gggagtataa agctggaggg gaaaaatctg aggctgtcag    1500
atcgagtgag aagttccatg gacttgtacg agagcctaga gaatctaagt tctttgcgac    1560
gtttgctgga ggaggcctcc gacagaacct cttacatttg gaggtttctg ttcggttccc    1620
ctctgagtcg ctttttgcac cgggtgaagc gagagcacct gacggaattt gatgggcttt    1680
tagagcagct gcctggactg tttgattctt tgaatctcgg ccaccggacg ctgctagagg    1740
agaggctttt tccacaattg gacttttcct ctccaggccg tctgtgttca gcgcttgctt    1800
ttgctgtaca tctgttggac agatggaacg agcagacgca gctcagcccg ggttacactc    1860
tggacttcct gacgctatgc ctatggaagt tcggaatcag gagggggagg aagctgtacg    1920
ggcgcttggt ggagaggcat ccgtctctgc gccagcagcg tctgcaagct caagtgctgc    1980
tgaggcggga ggatctggaa gccatttcgg aggaggagag cggcatggaa gagaagaatc    2040
cgagagcggg gctggaccct ccggcggagg agtagggggg ataccggacc cttttcctga    2100
gttggctttg ggggcggtgg ggggcgcttc tgtggtacgt gaggatgaag aggggcgcca    2160
acgcggtcag aagagggagc attttgagtc ctcgactttc ttggctgatg taaccgtggc    2220
cctgatggcg aaaaacaggc tggaggtggt gtggtacccg gaagtatggg aggactttga    2280
gaagggggac ttgcacctgc tggaaaaata taactttgag caggtgaaaa catactggat    2340
gaacccggat gaggactggg aggtggtttt gaaccgatac ggcaaggtag ctctgcgtcc    2400
cgactgtcgc taccaggttc gcgacaaggt ggtcctgcga cgcaacgtgt acctgttggg    2460
caacggcgcc accgtggaga tggtggaccc cagaaggggt ggttttgtgg ccaatatgca    2520
agaaatgtgc cctggggtgg tgggcttgtc tggggtgact tttcatagtg tgaggtttag    2580
cggtagcaat tttgggggtg tggttattac cgcgaacact cctgtggtcc tgcataattg    2640
ctactttttt ggcttcagca acacctgtgt ggaaatgagg gtgggaggca aagtgcgcgg    2700
gtgttccttt tacgcttgct ggaagggggt ggtgagccag ggtaaggcta aagtgtctgt    2760
tcacaagtgt atgttggaga gatgcacctt gggcatttcc agtgagggct tcctccacgc    2820
cagcgacaac gtggcttctg acaacggctg cgcctttctt atcaagggag ggggtcgcat    2880
ctgtcacaac atgatatgcg gccctgggga tgtcccccca aagccttacc agatggttac    2940
ctgcacagat ggcaaggtgc gcatgctcaa gcctgtgcac attgtgggcc accggcgcca    3000
ccgctggcca gagtttgaac acaatgtgat gacccgctgt agcttgtacc tgggaggcag    3060
gcgaggagtt ttcttgccca gacagtgtaa cctggcccac tgcaacgtga tcatggaaca    3120
atccgccgct acccaggttt gctttggagg aatatttgat ataagcatgg tggtgtataa    3180
gatcctgcgc tacgacgact gtcgggctcg tactcgaacc tgcgactgcg gagcctctca    3240
cctgtgtaac ctgactgtga tggggatggt gactgaggag gtgcgactgg accactgtca    3300
gcactcttgc ctgcgggagg agttttcttc ctcggacgag gaggactagg taggtggttg    3360
gggcgtggcc agcgagaggg tgggctataa aggggaggtg tcggctgacg ctgtcttctg    3420
tttttcaggt accatgagcg gatcaagcag ccagaccgcg ctgagcttcg acggggccgt    3480
gtacagcccc tttctgacgg ggcgcttgcc tgcctgggcc ggagtgcgtc agaatgttac    3540
cggttcgacc gtggacggac gtcccgtgga tccatctaac gctgcttcta tgcgctacgc    3600
tactatcagc acatctactc tggacagcgc cgctgccgcc gcagccgcca cctcagccgc    3660
tctctccgcc gccaagatca tggctattaa cccaagcctt tacagccctg tatccgtgga    3720
cacctcagcc ctggagcttt accggcgaga tctagctcaa gtggtggacc aactcgcagc    3780
cgtgagccaa cagttgcagc tggtgtcgac ccgagtggag caactttccc gccctcccca    3840
gtaaccgcaa aaattcaata aacagaattt aataaacagc acttgagaaa agtttaaact    3900
tgtggttgac tttattcctg gatagctggg gggagggaac ggcgggaacg gtaagacctg    3960
gtccatcgtt cccggtcgtt gagaacacgg tggatttttt ccaagacccg atagaggtgg    4020
gtctgaacgt tgagatacat gggcatgagc ccgtctcggg ggtggaggta ggcccactgc    4080
agggcctcgt tttcaggggt ggtgttgtaa atgatccagt cgtaggcccc ccgctgggcg    4140
tggtgctgga agatgtcctt cagcagcaag ctgatggcaa cgggaagacc cttggtgtag    4200
gtgttgacaa agcggttgag ttgggagggg tgcatgcggg gactgatgag gtgcattttg    4260
gcctggatct tgaggttggc tatgttgccg cccagatcgc gcctgggatt catgttatgc    4320
aagaccacca gcaccgagta accggtgcag cgggggaatt tgtcgtgcag cttggaaggg    4380
aaagcgtgga agaatttgga gacccctcgg tgcccgccta ggttttccat gcactcatcc    4440
atgatgatgg cgatgggccc ccgggaggca gcctgggcaa aaacgttgcg ggggtccgtg    4500
acatcgtagt tgtggtcctg ggtgagttca tcataggaca ttttgacaaa gcgcgggcag    4560
agggtcccag actggggaat gatggttcca tccggtccgg gggcgtagtt gccctcgcag    4620
atttgcattt cccaggcttt gatttcagag ggagggatca tgtcaacctg gggggcgatg    4680
aaaaaaatgg tctctggggc gggggtgatg agctgggtgg aaagcaggtt gcgcaagagc    4740
tgtgacttgc cgcagccggt gggcccgtag atgacagcta tgacgggttg cagggtgtag    4800
tttagagagc tacaactgcc atcatccttc aaaagcgggg ccacactgtt taaaagttct    4860
ctaacatgta agttttcccg cactaagtcc tgcaggagac gtgaccctcc tagggagaga    4920
agttcaggaa gcgaagcaaa gtttttaagt ggcttgaggc catcggccaa gggcaagttc    4980
ctgagagttt gactgagcag ttccagccgg tcccagagct cggttacgtg ctctacggca    5040
tctcgatcca gcagacctcc tcgtttcggg ggttggggcg gctctggctg tagggaatga    5100
ggcggtgggc gtccagctgg gccatggtgc ggtccctcca tgggcgcagg gttctcttca    5160
gggtggtctc ggtcacggtg aatgggtggg ccccgggctg ggcgctggcc agggtgcgct    5220
tgaggctgag gcggctggtg gcgaaccgtt gcttttcgtc tccctgcaag tcagccaaat    5280
agcaacggac catgagctca tagtccaggc tctctgcggc atgtcctttg gcgcgaagct    5340
tgcctttgga aacgtgcccg cagtttgagc agagcaagca ttttagcgcg tagagttttg    5400
gcgccaagaa cacggattcc ggggaataag catccccacc gcagttggag caaacggttt    5460
cgcattccac cagccaggtc agctgaggat cttttgggtc aaaaaccaag cgcccgccgt    5520
tttttttgat gcgcttccta cctcgggtct ccatgaggcg gtgcccgcgt tcggtgacga    5580
agaggctgtc ggtgtctccg tagacggagg tcagggcgcg ctcctccagg ggggtcccgc    5640
ggtcctcggc gtagagaaac tcgcaccact ctgacataaa cgcccgggtc caggctagga    5700
cgaatgaggc gatgtgggaa gggtaccggt cgttatcgat gagggggtcg gttttttcca    5760
aggtgtgcag gcacatgtcc ccctcgtccg cttccaaaaa tgtgattggc ttgtaggtgt    5820
aagtcacgtg atcctgtcct tccgcggggg tataaaaggg ggcgtttccc ccctcctcgt    5880
cactctcttc cggttcgctg tcgccaaagg ccagctgttg gggtacgtaa acgcgggtga    5940
aggcgggcat gacctgtgcg ctgaggttgt cagtttctat atacgaggaa gatttgatgg    6000
cgagcgcccc cgtggagatg cccttgaggt gctcggggcc catttggtca gaaaacacaa    6060
tctgtcggtt atcaagcttg gtggcaaaag acccgtagag ggcgttggag agcaacttgg    6120
cgatggagcg ctgggtttgg tttttttccc ggtcggcttt ttccttggcc gcgatgttga    6180
gctggacgta ctccctggcc acgcacttcc agccgggaaa aacggccgtg cgctcgtccg    6240
gcaccagcct cacgctccat ccgcggttgt gcagggtgat gacgtcgatg ctggtggcca    6300
cctctccgcg caggggctcg ttggtccagc agaggcgacc gcccttgcga gagcagaagg    6360
ggggcagggg gtcaagcagg cgctcgtccg gggggtcggc gtcgatggta aagatggcgg    6420
gcagcaggtg tttgtcaaag taatcgatct gatgcccggg gcaacgcagg gcggtttccc    6480
agtcccgcac cgccaaggcg cgctcgtatg gactgagggg ggcgccccag ggcatgggat    6540
gcgtcagggc cgaggcgtac atgccgcaga tgtcatagac gtaaaggggc tcctccagga    6600
cgccgaggta ggtggggtag cagcgccccc cgcggatgct ggcccgtacg tagtcgtaga    6660
gctcgtgcga gggggccaga aggtggcggc tgaggtgagc gcgctggggc ttttcatctc    6720
ggaagaggat ctgcctgaag atggcgtggg agttggagga gatggtgggc cgctgaaaaa    6780
tgttgaagcg ggcgtcgggc agacccacgg cctcgccgat aaagtgggcg taggactctt    6840
gcagcttttc caccagggag gcggtgacca gcacgtccag agcgcagtag tccagggttt    6900
cccgcacgat gtcataatgc tcttcctttt tttccttcca gaggtctcgg ttgaagagat    6960
actcttcgcg gtctttccag tactcttgga gaggaaaccc gttttcgtct ccacggtaag    7020
agcccaacat gtaaaactgg ttgacggcct gatagggaca gcatcccttc tccacgggca    7080
gcgagtaggc cagggcggcc ttgcgcaggg aggtgtgagt cagggcaaag gtgtcgcgga    7140
ccataacttt tacaaactgg tacttaaagt cccggtcgtc gcacatgcct cgctcccagt    7200
ctgagtagtc tgtgcgcttt ttgtgcttgg ggttaggcag ggagtaggtg acgtcgttaa    7260
agaggatttt gccacatctg ggcataaagt tgcgagagat tctgaagggg ccgggcacct    7320
ccgagcggtt gttgatgact tgggcagcca ggagaatttc gtcgaagccg ttgatgttgt    7380
gccccacgac gtagaactct atgaaacgcg gagcgccgcg cagcaggggg cacttttcaa    7440
gttgctggaa agtaagttcc cgcggctcga cgccgtgttc cgtgcggctc cagtcctcca    7500
ccgggtttcg ctccacaaaa tcctgccaga tgtggtcgac tagcaagagc tgcagtcggt    7560
cgcgaaattc gcggaatttt ctgccgatgg cttgcttctg ggggttcaag caaaaaaagg    7620
tgtctgcgtg gtcgcgccag gcgtcccagc cgagctcgcg agccagattc agggccagca    7680
gcaccagagc cggctcaccg gtgattttca tgacgaggag aaagggcacc agctgttttc    7740
cgaacgcgcc catccaggtg taggtctcca cgtcgtaggt gagaaacaga cgttcggtcc    7800
gcgggtgcga tcccaggggg aaaaacttga tgggctgcca ccattgggag ctctgggcgt    7860
ggatgtgatg gaagtaaaag tcccggcggc gcgtggaaca ttcgtgctgg tttttgtaaa    7920
agcggccgca gtggtcgcag cgcgagacgg agtgaaggct gtgaatcagg tgaatcttgc    7980
gtcgctgagg gggccccaga gccaaaaagc ggagcgggaa cgaccgcgcg gccacttcgg    8040
cgtccgcagg caagatggat gagggttcca ccgttccccg cccgcggacc gaccagactt    8100
ccgccagctg cggcttcagt tcttgcacca gctctcgcag cgtttcgtcg ctgggcgaat    8160
cgtgaatacg gaagttgtcg ggtagaggcg ggaggcggtg gacttccagg aggtgtgtga    8220
gggccggcag gagatgcagg tggtacttga tttcccacgg atgacggtcg cgggcgtcca    8280
aggcgaagag atgaccgtgg ggccgcggcg ccaccagcgt tccgcggggg gtctttatcg    8340
gcggcgggga cgggctcccg gcggcagcgg cggctcggga cccgcgggca agtcgggcag    8400
cggcacgtcg gcgtggagct cgggcagggg ctggtgctgc gcgcggagct gactggcaaa    8460
ggctatcacc cggcgattga cgtcctggat ccggcggcgc tgcgtgaaga ccaccggacc    8520
cgtggtcttg aacctgaaag agagttcgac agaatcaatc tcggcatcgt taaccgcggc    8580
ctggcgcagg atttcggcca cgtccccgga gttgtcttga tacgcgattt ctgccatgaa    8640
ctggtcgatt tcctcttcct gcaagtctcc gtgaccggcg cgttcgacgg tggccgcgag    8700
atcgttggag atgcggccca tgagctggga aaaggcattg atgccgacct cgttccacac    8760
tcggctgtac accacctctc cgtgaacgtc gcgggcgcgc atcaccacct gggcgagatt    8820
gagttccacg tggcgggcga aaaccggata gtttcggagg cgctgataca gatagttgag    8880
ggtggtggcg gcgtgctcgg ccacaaaaaa atacatgatc cagcggcgga gggtcagctc    8940
gttgatgtcg cccagcgcct ccaggcgttc catggcctcg taaaagtcca cggcaaagtt    9000
gaaaaattgg ctgttcctgg ccgagaccgt gagctcttct tccaagagcc gaatgagatc    9060
cgccacggtg gccctgactt cgcgttcgaa agccccgggt gcctcctcca cctcttcctc    9120
ctcgacttct tcgaccgctt cgggcacctc ctcttcctcg accaccacct caggcggggc    9180
tcggcggcgc cggcggcgga cgggcaggcg gtcgacgaaa cgctcgatca tttcccccct    9240
ccgtcgacgc atggtctcgg tgacggcgcg accctgttcg cgaggacgca gggtgaaggc    9300
gccgccgccg agcggaggta acagggagat cggggggcgg tcgtggggga gactgacggc    9360
gctaactatg catctgatca atgtttgcgt agtgacctcg ggtcggagcg agctcagcgc    9420
ttgaaaatcc acgggatcgg aaaaccgttc caggaacgcg tctagccaat cacagtcgca    9480
aggtaagctg aggaccgtct cgggggcttg tctgttctgt cttcccgcgg tggtgctgct    9540
gatgaggtag ttgaagtagg cgctcttgag gcggcggatg gtggacagga gaaccacgtc    9600
tttgcgccca gcttgctgta tccgcaggcg gtcggccatg ccccacactt ctccttgaca    9660
gcggcggagg tccttgtagt attcttgcat cagcctttcc acgggcacct cgtcttcttc    9720
ttccgctcgg ccggacgaga gccgcgtcag gccgtacccg cgctgcccct gtggttggag    9780
cagggccagg tcggccacga cgcgctcggc cagcacggcc tgctggatgc gggtgagggt    9840
gtcctgaaag tcgtcgagat ccacaaagcg gtggtacgcg ccagtgttga tggtgtaggt    9900
gcagttgctc atgacggacc agtttacggt ctgggtgcca tggcccacgg tttccaggta    9960
gcggagacgc gagtaggccc gcgtctcgaa gatgtagtcg ttgcaggtcc gcagcaggta   10020
ctggtagccc accagcagat gcggcggcgg ctggcggtag aggggccacc gctgggtggc   10080
gggggcgttg ggggcgagat cttccaacat gaggcggtga tagccgtaga tgtagcgcga   10140
catccaagtg atgccgctgg ccgtggtgct ggcgcgggcg tagtcgcgaa cgcggttcca   10200
gatgtttcgc agcggctgga agtactcgat ggtggggcga ctctgccccg tgaggcgggc   10260
gcagtcggcg atgctctacg gggaaaaaga agggccagtg aacaaccgcc ttccgtagcc   10320
ggaggagaac gcaagggggt caaagaccac cgaggctcgg gttcgaaacc cgggtggcgg   10380
cccgaatacg gagggcggtt ttttgctttt ttctcagatg catcccgtgc tgcggcagat   10440
gcgtccgaac gcggggtccc agtccccggc ggtgcctgcg gccgtgacgg cggcttctac   10500
ggccacgtcg cgctccaccc cgcctaccac ggcccaggcg gcggtggctc tgcgcggcgc   10560
aggggaaccc gaagcagagg cggtgttgga cgtggaggag ggccaggggt tggctcggct  10620
gggggccctg agtcccgagc ggcacccgcg cgtggctctg aagcgcgacg cggcggaggc  10680
gtacgtgccg cggagcaatc tgtttcgcga ccgcagcggc gaggaggccg aggagatgcg  10740
agacttgcgt tttcgggcgg ggagggagtt gcgtcacggg ctggaccggc agagggttct  10800
gagagaggag gactttgagg cggacgagcg cacgggggtg agtcccgcgc gggctcacgt  10860
ggcggccgcc aacctggtga gcgcgtacga gcagacggtc aaggaggaga tgaacttcca  10920
gaagagcttc aatcatcacg tgcgcacgct gattgcgcgc gaagaggtgg ccatcggcct  10980
catgcatctg tgggattttg tggaggcgta cgttcagaac cccagcagca agccgctgac  11040
ggctcagctg ttcctcatcg tgcaacatag tcgagacaac gaaacgttca gggaggccat  11100
gctgaacatt gcagagcctg aggggcgctg gctcttggat ctcattaaca tcttgcagag  11160
tatcgtagtg caggagcgct cgctgagcct ggccgacaag gtggctgcca tcaactacag  11220
catgctgtcg ctgggcaaat tttacgcccg caagatctac aagtctccgt tcgtccccat  11280
agacaaggag gtgaagatag acagctttta catgcgcatg gcgctcaagg tgctgactct  11340
aagcgacgac ctgggggtgt accgcaacga ccgcatacac aaggcggtga gcgccagccg  11400
ccggcgcgag ctgagcgacc gcgagctttt gcacagcctg catcgggcgt tgactggtgc  11460
cggcagcgcc gaggcggccg agtactttga cgccggagcg gacttgcgct ggcagccatc  11520
ccgacgcgcg ctggaggcgg ctggcgtcgg ggagtacggg gtcgaggacg acgatgaagc  11580
ggacgacgag ttgggcattg acttgtagcc gtttttcgtt agatatgtcg gcgaacgagc  11640
cgtctgcggc cgccatggtg acggcggcgg gcgcgcccca ggacccggcc acgcgcgcgg  11700
cgctgcagag tcagccttcc ggagtgacgc ccgcggacga ctggtccgag gccatgcgtc  11760
gcatcctggc gctgacggcg cgcaaccccg aggcttttcg gcagcagccg caggcaaacc  11820
ggtttgcggc cattttggaa gcggtggtgc cctccagacc caaccccacc cacgaaaagg  11880
tgctggccat cgtcaacgcc ctggcggaga ccaaggccat ccgcccagac gaggccgggc  11940
aggtttacaa cgcgctgcta gaaagggtgg gacgctacaa cagctccaac gtgcagacca  12000
atctggaccg cttggtgacg gacgtgaagg aggccgtagc ccagcgagag cggtttttca  12060
aggaagccaa tctgggctcg ctggtggccc tcaacgcctt cctgagcacg ctgccggcga  12120
acgtgccccg cggtcaggag gactacgtga actttctgag cgccctccgc ctgatggtgg  12180
ccgaggtgcc gcagagcgag gtgtaccagt ctggccccaa ctactacttc cagacctccc  12240
ggcagggcct gcagacggta aacctgacgc aggcctttca gaacctgcag ggcctttggg  12300
gggtgcgcgc tccgctgggc gaccgcagca cggtgtccag cctgctgacc cccaatgccc  12360
ggctgctctt gcttctcatt gctccgttca ccgacagcgg ttccatcagc cgcgactctt  12420
acctgggaca cctgctcacc ctgtaccggg aggccatcgg gcaggcgcgg gtggacgagc  12480
agacgtacca ggaaatcacc agcgtgagcc gcgcgctggg gcaggaggac acgggcagct  12540
tggaggcgac tctgaacttc ctgctgacca accggcggca gcgcctacct ccccagtacg  12600
cgctgaacgc ggaggaggag cgcatcctgc gtttcgtgca gcagagcacc gcgctgtact  12660
tgatgcggga aggcgcctct cccagcgctt cgctggacat gacggcggcc aacatggagc  12720
catcgttcta cgccgccaac cgtcccttcg tcaaccggct aatggactat ttgcatcggg  12780
cggcggccct gaacccggaa tactttacta acgtcatcct gaacgaccgt tggctgccac  12840
ctcccggctt ctacacgggg gagttcgacc tcccggaggc caacgacggt ttcatgtggg  12900
acgacgtgga cagcgtgttc ctgcccggca agaaggaggc gggtgactct cagagccacc  12960
gcgcgagcct cgcagacctg ggggcgaccg ggcccgcgtc tccgctgcct cgcctgccga  13020
gcgccagcag cgccagcgtg gggcgggtga gccgtccgcg cctcagcggt gaggaggact  13080
ggtggaacga tccgctgctc cgtccggccc gcaacaaaaa cttccccaac aacgggatag  13140
aggatttggt agacaaaatg aaccgttgga agacgtatgc ccaggagcat cgggagtggc  13200
aggcgaggca acccatgggc cctgttctgc cgccctctcg gcgcccgcgc agggacgaag  13260
acgccgacga ttcagccgat gacagcagcg tgttggatct gggcgggagc gggaacccct  13320
ttgcccacct gcaacctcgc ggcgtgggtc ggcggtggcg ctaggaaaaa aaattattaa  13380
aagcacttac cagagccatg gtaagaagag caacaaaggt gtgtcctgct ttcttcccgg  13440
tagcaaa atg cgt cgg gcg gtg gca gtt ccc tcc gcg gca atg gcg tta    13489
        Met Arg Arg Ala Val Ala Val Pro Ser Ala Ala Met Ala Leu
        1               5                   10
ggc ccg ccc cct tct tac gaa agc gtg atg gca gcg gcc acc ctg caa    13537
Gly Pro Pro Pro Ser Tyr Glu Ser Val Met Ala Ala Ala Thr Leu Gln
15                  20                  25                  30
gcg ccg ttg gag aat cct tac gtg ccg ccg cga tac ctg gag cct acg    13585
Ala Pro Leu Glu Asn Pro Tyr Val Pro Pro Arg Tyr Leu Glu Pro Thr
                35                  40                  45
ggc ggg aga aac agc att cgt tac tcg gag ctg acg ccc ctg tac gac    13633
Gly Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Thr Pro Leu Tyr Asp
            50                  55                  60
acc acc cgc ctg tac ctg gtg gac aac aag tca gca gat atc gcc acc    13681
Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Thr
        65                  70                  75
ttg aac tac cag aac gac cac agc aac ttt ctc acg tcc gtg gtg cag    13729
Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Ser Val Val Gln
    80                  85                  90
aac agc gac tac acg ccc gcc gaa gcg agc acg cag acc att aac ttg    13777
Asn Ser Asp Tyr Thr Pro Ala Glu Ala Ser Thr Gln Thr Ile Asn Leu
95                  100                 105                 110
gac gac cgc tcg cgc tgg ggc ggg gac ttg aaa acc att ctg cac act    13825
Asp Asp Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr Ile Leu His Thr
                115                 120                 125
aac atg ccc aac gtg aac gag ttc atg ttt acc aac tcg ttc agg gct    13873
Asn Met Pro Asn Val Asn Glu Phe Met Phe Thr Asn Ser Phe Arg Ala
            130                 135                 140
aaa ctt atg gtg gcg cac gag gcc gac aag gac ccg gtt tat gag tgg    13921
Lys Leu Met yal Ala His Glu Ala Asp Lys Asp Pro Val Tyr Glu Trp
        145                 150                 155
gtg cag ctg acg ctg ccg gag ggg aac ttt tca gag att atg acc ata    13969
Val Gln Leu Thr Leu Pro Glu Gly Asn Phe Ser Glu Ile Met Thr Ile
    160                 165                 170
gac ctg atg aac aac gcc att atc gac cac tac ctg gcg gta gcc aga    14017
Asp Leu Met Asn Asn Ala Ile Ile Asp His Tyr Leu Ala Val Ala Arg
175                 180                 185                 190
cag cag ggg gtg aaa gaa agc gag atc ggc gtc aag ttt gac acg cgc    14065
Gln Gln Gly Val Lys Glu Ser Glu Ile Gly Val Lys Phe Asp Thr Arg
                195                 200                 205
aac ttt cgt ctg ggc tgg gac ccg gag acg ggg ctt gtg atg ccg ggg    14113
Asn Phe Arg Leu Gly Trp Asp Pro Glu Thr Gly Leu Val Met Pro Gly
            210                 215                 220
gtg tac acg aac gaa gct ttc cat ccc gac gtg gtc ctc ttg ccg ggc    14161
Val Tyr Thr Asn Glu Ala Phe His Pro Asp Val Val Leu Leu Pro Gly
        225                 230                 235
tgc ggg gtg gac ttt acc tac agc cgg tta aac aac ctg cta ggc ata    14209
Cys Gly Val Asp Phe Thr Tyr Ser Arg Leu Asn Asn Leu Leu Gly Ile
    240                 245                 250
cgc aag aga atg ccc ttt cag gaa ggg ttt cag atc ctg tac gag gac    14257
Arg Lys Arg Met Pro Phe Gln Glu Gly Phe Gln Ile Leu Tyr Glu Asp
255                 260                 265                 270
ctg gag ggc ggt aac atc ccg gcc ctg ctg gac gtg ccg gcg tac gag    14305
Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Pro Ala Tyr Glu
                275                 280                 285
gag agc atc gcc aac gca agg gag gcg gcg atc agg ggc gat aat ttc    14353
Glu Ser Ile Ala Asn Ala Arg Glu Ala Ala Ile Arg Gly Asp Asn Phe
            290                 295                 300
gcg gcg cag ccc cag gcg gct cca acc ata aaa ccc gtt ttg gaa gac    14401
Ala Ala Gln Pro Gln Ala Ala Pro Thr Ile Lys Pro Val Leu Glu Asp
        305                 310                 315
tcc aaa ggg cgg agc tac aac gta ata gcc aac acc aac aac acg gct    14449
Ser Lys Gly Arg Ser Tyr Asn Val Ile Ala Asn Thr Asn Asn Thr Ala
    320                 325                 330
tac agg agc tgg tat ctg gct tat aac tac ggc gac ccg gag aag ggg    14497
Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly
335                 340                 345                 350
gtt agg gcc tgg acc ctg ctc acc act ccg gac gtg acg tgc ggt tca    14545
Val Arg Ala Trp Thr Leu Leu Thr Thr Pro Asp Val Thr Cys Gly Ser
                355                 360                 365
gag cag gtc tac tgg tcg ctg cct gac atg tac gtg gac cct gtg acg    14593
Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Tyr Val Asp Pro Val Thr
            370                 375                 380
ttt cgc tcc acg cag caa gtt agc aac tac cca gtg gtg gga gcg gag    14641
Phe Arg Ser Thr Gln Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu
        385                 390                 395
ctt atg ccg att cac agc aag agc ttt tac aac gag cag gcc gtc tac    14689
Leu Met Pro Ile His Ser Lys Ser Phe Tyr Asn Glu Gln Ala Val Tyr
    400                 405                 410
tca cag ctc att cgt cag acc acc gcc cta acg cac gtt ttc aac cgc    14737
Ser Gln Leu Ile Arg Gln Thr Thr Ala Leu Thr His Val Phe Asn Arg
415                 420                 425                 430
ttc ccc gag aac caa atc cta gtg cga cct cca gcg ccc acc atc acc    14785
Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr
                435                 440                 445
acc gtc agc gag aac gtg ccc gct cta acc gat cac ggg acg ctg cct    14833
Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro
            450                 455                 460
ttg cag aac agc atc cgc gga gtt cag cga gtt acc atc acg gac gcc    14881
Leu Gln Asn Ser Ile Arg Gly Val Gln Arg Val Thr Ile Thr Asp Ala
        465                 470                 475
cgt cgt cgg acc tgt ccc tac gtc tac aaa gcc ttg gga atc gtg gcc    14929
Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala
    480                 485                 490
ccg cgc gtc ctg tcg agt cgc act ttc tag atgtccatcc tcatctctcc      14979
Pro Arg Val Leu Ser Ser Arg Thr Phe
495                 500
cagcaacaat accggttggg gtctgggcgt gaccaaaatg tacggaggcg ccaaacgacg  15039
gtccccacaa catcccgtgc gagtgcgcgg gcactttaga gccccatggg ggtcgcacac  15099
gcgcgggcgc accggccgaa ccaccgtcga cgacgtgatc gatagcgtgg tggccgacgc  15159
ccgcaactac cagcccgctc gatccacggt ggacgaagtc atcgacggcg tggtggccga  15219
cgccagggcc tacgcccgca gaaagtctcg tctgcgccgc cgccgttcgc taaagcgccc  15279
cacggccgcc atgaaagccg ctcgctctct gctgcgtcgc gcacgtatcg tgggtcgccg  15339
cgccgccaga cgcgcagccg ccaacgccgc cgccggccga gtgcgccgcc gggccgccca  15399
gcaggccgcc gccgccatct ccagtctatc cgccccccga cgcgggaatg tgtactgggt  15459
cagggactcg gccaccggcg tgcgagttcc cgtgagaacc cgtcctcctc gtccctgaat  15519
aaaaagttct aagcccaatc ggtgttccgt tgtgtgttca gctcgtcatg accaaacgca  15579
agtttaaaga ggagctgctg caagcgctgg tccccgaaat ctatgcgccg gcgccggacg  15639
tgaaaccgcg tcgcgtgaaa cgcgtgaaga agcaggaaaa gctagagaca aaagaggagg  15699
cggtggcgtt gggagacggg gaggtggagt ttgtgcgctc gttcgcgccg cgtcggcgag  15759
tgaattggaa ggggcgcaag gtgcaacggg tgctgcgtcc cggcacggtg gtgtctttca  15819
ccccgggtga aaaatccgcc tggaagggca taaagcgcgt gtacgatgag gtgtacgggg  15879
acgaagacat tctggagcag gcgctggata gaagcgggga gtttgcttac ggcaagaggg  15939
cgaggacggg cgagatcgcc atcccgctgg acacttccaa ccccaccccc agtctgaaac  15999
ccgtgacgct gcaacaggtg ttgccggtga gcgccccctc gcgacgcggc ataaaacgcg  16059
agggcggcga gctgcagccc accatgcagc tcctggttcc caagaggcag aaactagagg  16119
acgtactgga catgataaaa atggagcccg acgtgcagcc cgatattaaa atccgtccca  16179
tcaaagaagt ggcgccggga atgggcgtgc agaccgtgga catccagatt cccatgacca  16239
gcgccgcaca ggcggtagag gccatgcaga ccgacgtggg gatgatgacg gacctgcccg  16299
cagctgctgc cgccgtggcc agcgccgcga cgcaaacgga agccggcatg cagaccgacc  16359
cgtggacgga ggcgcccgtg cagccggcca gaagacgcgt cagacggacg tacggccccg  16419
tttctggcat aatgccggag tacgcgctgc atccttccat catccccacc cccggctacc  16479
gggggcgcac ctaccgtccg cgacgcagca ccactcgccg ccgtcgccgc acggcacgag  16539
tcgccaccgc cagagtgaga cgcgtaacga cacgtcgcgg ccgccgcttg accctgcccg  16599
tggtgcgcta ccatcccagc attctttaaa aaaccgctcc tacgttgcag atgggcaagc  16659
ttacttgtcg actccgtatg gccgtgcccg gctaccgagg aagatcccgc cgacgacgga  16719
ctttgggagg cagcggtttg cgccgccgtc gggcggttca ccggcgcctc aagggaggca  16779
ttctgccggc cctgatcccc ataatcgccg cagccatcgg ggccattccc ggaatcgcca  16839
gcgtagcggt gcaggctagc cagcgccact gattttacta accctgtcgg tcgcgccgtc  16899
tctttcggca gactcaacgc ccagcatgga agacatcaat ttctcctctc tggccccgcg  16959
gcacggcacg cggccgtata tggggacgtg gagcgagatc ggcacgaacc agatgaacgg  17019
gggcgctttc aattggagcg gtgtgtggag cggcttgaaa aatttcggtt ccactctgaa  17079
aacttacggc aaccgggtgt ggaactccag cacggggcag atgctgaggg acaagctaaa  17139
ggacacgcag tttcagcaaa aggtggtgga cggcatcgct tcgggcctca acggcgccgt  17199
cgacctggcc aaccaggcca ttcaaaagga aattaacagc cgcctggagc cgcggccgca  17259
ggtggaggag aacctgcccc ctctggaggc gctgcccccc aagggagaga agcgcccgcg  17319
gcccgacatg gaggagacgc tagttactaa gagcgaggag ccgccatcat acgaggaggc  17379
ggtgggtagc tcgcagctgc cgtccctcac gctgaagccc accacctatc ccatgaccaa  17439
gcccatcgcc tccatggcgc gccccgtggg agtcgacccg cccatcgacg cggtggccac  17499
tttggacctg ccgcgccccg aacccggcaa ccgcgtgcct cccgtcccca tcgctccgcc  17559
ggtttctcgc cccgccatcc gccccgtcgc cgtggccact ccccgctatc cgagccgcaa  17619
cgccaactgg cagaccaccc tcaacagtat tgtcggactg ggggtgaagt ctctgaagcg  17679
ccgtcgctgt ttttaaagca caatttatta aacgagtagc cctgtcttaa tccatcgttg  17739
tatgtgtgcc tatatcacgc gttcagagcc tgaccgtccg tcaag atg gcc act ccg  17796
                                                  Met Ala Thr Pro
                                                      505
tcg atg atg ccg cag tgg tcg tac atg cac atc gcc ggg cag gac gcc    17844
Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ala Gly Gln Asp Ala
        510                 515                 520
tcg gag tac ctg agc ccg ggt ctg gtg cag ttt gcc cgt gcg acg gaa    17892
Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala Arg Ala Thr Glu
    525                 530                 535
acc tac ttc tca ctg ggc aac aag ttc agg aac ccc acc gtg gcg ccc    17940
Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro Thr Val Ala Pro
540                 545                 550                 555
acc cac gac gtc acc acc gat cgg tcc cag cga ctg aca atc cgc ttc    17988
Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu Thr Ile Arg Phe
                560                 565                 570
gtc ccc gtg gac aag gaa gac acc gct tac tcc tac aaa acc cgc ttc    18036
Val Pro Val Asp Lys Glu Asp Thr Ala Tyr Ser Tyr Lys Thr Arg Phe
            575                 580                 585
acg ctg gcc gtg ggc gac aac cgg gtg cta gac atg gcc agt acc tac    18084
Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met Ala Ser Thr Tyr
        590                 595                 600
ttt gac atc cgc ggc gtg atc gac cgc gga cct agc ttc aag cct tac    18132
Phe Asp Ile Arg Gly Val Ile Asp Arg Gly Pro Ser Phe Lys Pro Tyr
    605                 610                 615
tcc ggc acg gct tac aac tca ctg gct ccc aaa ggg gcg ccc aac aac    18180
Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly Ala Pro Asn Asn
620                 625                 630                 635
agc caa tgg aac gcc aca gat aac ggg aac aag cca gtg tgt ttt gct    18228
Ser Gln Trp Asn Ala Thr Asp Asn Gly Asn Lys Pro Val Cys Phe Ala
                640                 645                 650
cag gca gct ttt ata ggt caa agc att aca aaa gac gga gtg caa ata    18276
Gln Ala Ala Phe Ile Gly Gln Ser Ile Thr Lys Asp Gly Val Gln Ile
            655                 660                 665
cag aac tca gaa aat caa cag gct gct gcc gac aaa act tac caa cca    18324
Gln Asn Ser Glu Asn Gln Gln Ala Ala Ala Asp Lys Thr Tyr Gln Pro
        670                 675                 680
gag cct caa att gga gtt tcc acc tgg gat acc aac gtt acc agt aac    18372
Glu Pro Gln Ile Gly Val Ser Thr Trp Asp Thr Asn Val Thr Ser Asn
    685                 690                 695
gct gcc gga cga gtg tta aaa gcc acc act ccc atg ctg cca tgt tac    18420
Ala Ala Gly Arg Val Leu Lys Ala Thr Thr Pro Met Leu Pro Cys Tyr
700                 705                 710                 715
ggt tca tat gcc aat ccc act aat cca aac ggg ggt cag gca aaa aca    18468
Gly Ser Tyr Ala Asn Pro Thr Asn Pro Asn Gly Gly Gln Ala Lys Thr
                720                 725                 730
gaa gga gac att tcg cta aac ttt ttc aca aca act gcg gca gca gac    18516
Glu Gly Asp Ile Ser Leu Asn Phe Phe Thr Thr Thr Ala Ala Ala Asp
            735                 740                 745
aat aat ccc aaa gtg gtt ctt tac agc gaa gat gta aac ctt caa gcc    18564
Asn Asn Pro Lys Val Val Leu Tyr Ser Glu Asp Val Asn Leu Gln Ala
        750                 755                 760
ccc gat act cac tta gta tat aag cca acg gtg gga gaa aac gtt atc    18612
Pro Asp Thr His Leu Val Tyr Lys Pro Thr Val Gly Glu Asn Val Ile
    765                 770                 775
gcc gca gaa gcc ctg cta acg cag cag gcg tgt ccc aac aga gca aac    18660
Ala Ala Glu Ala Leu Leu Thr Gln Gln Ala Cys Pro Asn Arg Ala Asn
780                 785                 790                 795
tac ata ggt ttc cga gat aac ttt atc ggt tta atg tat tat aac agc    18708
Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser
                800                 805                 810
aca ggg aac atg gga gtt ctg gca ggt cag gcc tcg cag tta aac gca    18756
Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala
            815                 820                 825
gtt gta gac ctg caa gat cga aac acg gaa ctg tcc tat cag cta atg    18804
Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Met
        830                 835                 840
cta gat gct ctg ggt gac aga act cga tat ttc tca atg tgg aat cag    18852
Leu Asp Ala Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln
    845                 850                 855
gcc gtg gac agc tac gat cca gac gtt agg att atc gag aac cat ggg    18900
Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly
860                 865                 870                 875
gtg gaa gac gag ctg ccc aat tac tgt ttt cca ctc cca ggc atg ggt    18948
Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Pro Gly Met Gly
                880                 885                 890
att ttt aac tcc tac aag ggg gta aaa cca caa aat ggc ggt aat ggt    18996
Ile Phe Asn Ser Tyr Lys Gly Val Lys Pro Gln Asn Gly Gly Asn Gly
            895                 900                 905
aac tgg gaa gca aac ggg gac cta tca aat gcc aat gag atc gct tta    19044
Asn Trp Glu Ala Asn Gly Asp Leu Ser Asn Ala Asn Glu Ile Ala Leu
        910                 915                 920
gga aac att ttt gcc atg gaa att aac ctc cac gca aac ctg tgg cgc    19092
Gly Asn Ile Phe Ala Met GluIle Asn Leu His Ala Asn Leu Trp Arg
    925                 930                 935
agc ttc ttg tac agc aat gtg gcg ctg tac ctg cca gac agc tat aaa    19140
Ser Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp Ser Tyr Lys
940                 945                 950                 955
ttc act ccc gct aac atc act ctg ccc gcc aac caa aac acc tac gag    19188
Phe Thr Pro Ala Asn Ile Thr Leu Pro Ala Asn Gln Asn Thr Tyr Glu
                960                 965                 970
tat atc aac ggg cgc gtc act tct cca acc ctg gtg gac acc ttt gtt    19236
Tyr Ile Asn Gly Arg Val Thr Ser Pro Thr Leu Val Asp Thr Phe Val
            975                 980                 985
aac att gga gcc cga tgg tcg ccg gat ccc atg gac aac  gtc aac ccc   19284
Asn Ile Gly Ala Arg Trp Ser Pro Asp Pro Met Asp Asn  Val Asn Pro
        990                 995                 1000
ttt aac  cat cac cgg aac gcg  ggc ctc cgt tac cgc  tcc atg ctg     19329
Phe Asn  His His Arg Asn Ala  Gly Leu Arg Tyr Arg  Ser Met Leu
    1005                 1010                 1015
ctg gga  aat gga cgc gtg gtg  cct ttc cac ata caa  gtg ccg caa     19374
Leu Gly  Asn Gly Arg Val Val  Pro Phe His Ile Gln  Val Pro Gln
    1020                 1025                 1030
aaa ttt  ttc gcg att aag aac  ctc ctg ctt ttg ccc  ggc tcc tac     19419
Lys Phe  Phe Ala Ile Lys Asn  Leu Leu Leu Leu Pro  Gly Ser Tyr
    1035                 1040                 1045
act tac  gag tgg agc ttc aga  aaa gac gtg aac atg  att ctg cag    19464
Thr Tyr  Glu Trp Ser Phe Arg  Lys Asp Val Asn Met  Ile Leu Gln
    1050                 1055                 1060
agc acc  ctg ggc aat gat ctt  cga gtg gac ggg gcc  agc gtc cgc    19509
Ser Thr  Leu Gly Asn Asp Leu  Arg Val Asp Gly Ala  Ser Val Arg
    1065                 1070                 1075
att gac  agc gtc aac ttg tac  gcc aac ttt ttc ccc  atg gcg cac    19554
Ile Asp  Ser Val Asn Leu Tyr  Ala Asn Phe Phe Pro  Met Ala His
    1080                 1085                 1090
aac acc  gct tct acc ttg gaa  gcc atg ctg cga aac  gac acc aac    19599
Asn Thr  Ala Ser Thr Leu Glu  Ala Met Leu Arg Asn  Asp Thr Asn
    1095                 1100                 1105
gac cag  tcg ttt aac gac tac  ctc agc gcg gcc aac  atg ctt tat    19644
Asp Gln  Ser Phe Asn Asp Tyr  Leu Ser Ala Ala Asn  Met Leu Tyr
    1110                 1115                 1120
ccc att  ccg gcc aac gcc acc  aac gtt ccc att tcc  att ccc tcc    19689
Pro Ile  Pro Ala Asn Ala Thr  Asn Val Pro Ile Ser  Ile Pro Ser
    1125                 1130                 1135
cgc aac  tgg gcg gcc ttc cgg  gga tgg agc ttc acc  cgc ctt aaa    19734
Arg Asn  Trp Ala Ala Phe Arg  Gly Trp Ser Phe Thr  Arg Leu Lys
    1140                 1145                 1150
gcc aag  gaa acg cct tcc ttg  ggc tcc ggc ttt gac  ccc tac ttt    19779
Ala Lys  Glu Thr Pro Ser Leu  Gly Ser Gly Phe Asp  Pro Tyr Phe
    1155                 1160                 1165
gtg tac  tca ggc acc att cct  tac ctg gac ggc agc  ttt tac ctc    19824
Val Tyr  Ser Gly Thr Ile Pro  Tyr Leu Asp Gly Ser  Phe Tyr Leu
    1170                 1175                 1180
aac cac  act ttc aaa cgt ctg  tcc atc atg ttc gat  tct tcc gta    19869
Asn His  Thr Phe Lys Arg Leu  Ser Ile Met Phe Asp  Ser Ser Val
    1185                 1190                 1195
agt tgg  ccg ggc aac gac cgc  ctc ctg acg ccg aac  gag ttc gaa    19914
Ser Trp  Pro Gly Asn Asp Arg  Leu Leu Thr Pro Asn  Glu Phe Glu
    1200                 1205                 1210
att aag  cgc att gtg gac ggg  gaa ggc tac aac gtg  gct caa agt    19959
Ile Lys  Arg Ile Val Asp Gly  Glu Gly Tyr Asn Val  Ala Gln Ser
    1215                 1220                 1225
aac atg  acc aaa gac tgg ttt  tta att caa atg ctc  agc cac tac    20004
Asn Met  Thr Lys Asp Trp Phe  Leu Ile Gln Met Leu  Ser His Tyr
    1230                 1235                 1240
aac atc  ggc tac caa ggc ttc  tat gtt ccc gag ggc  tac aag gat    20049
Asn Ile  Gly Tyr Gln Gly Phe  Tyr Val Pro Glu Gly  Tyr Lys Asp
    1245                 1250                 1255
cgg atg  tat tct ttc ttc cga  aac ttt cag ccc atg  agc cgc cag    20094
Arg Met  Tyr Ser Phe Phe Arg  Asn Phe Gln Pro Met  Ser Arg Gln
    1260                 1265                 1270
gtg ccg  gat ccc acc gct gcc  ggc tat caa gcc gtt  ccc ctg ccc     20139
Val Pro  Asp Pro Thr Ala Ala  Gly Tyr Gln Ala Val  Pro Leu Pro
    1275                 1280                 1285
aga caa  cac aac aac tcg ggc  ttt gtg ggg tac atg  ggc ccg acc     20184
Arg Gln  His Asn Asn Ser Gly  Phe Val Gly Tyr Met  Gly Pro Thr
    1290                 1295                 1300
atg cgc  gaa gga cag cca tac  ccg gcc aac tac ccc  tat ccc ctg     20229
Met Arg  Glu Gly Gln Pro Tyr  Pro Ala Asn Tyr Pro  Tyr Pro Leu
    1305                 1310                 1315
atc ggc  gct acc gcc gtc ccc  gcc att acc cag aaa  aag ttt ttg     20274
Ile Gly  Ala Thr Ala Val Pro  Ala Ile Thr Gln Lys  Lys Phe Leu
    1320                 1325                 1330
tgc gac  cgc gtc atg tgg cgc  ata cct ttt tcc agc  aac ttt atg     20319
Cys Asp  Arg Val Met Trp Arg  Ile Pro Phe Ser Ser  Asn Phe Met
    1335                 1340                 1345
tca atg  ggg gcc ctg acc gac  ctc gga cag aac atg  ctt tac gct     20364
Ser Met  Gly Ala Leu Thr Asp  Leu Gly Gln Asn Met  Leu Tyr Ala
    1350                 1355                 1360
aac tcc  gcc cat gcc ctg gat  atg act ttt gag gtg  gac ccc atg     20409
Asn Ser  Ala His Ala Leu Asp  Met Thr Phe Glu Val  Asp Pro Met
    1365                 1370                 1375
aac gag  ccc acg ttg ctg tac  atg ctt ttt gag gtg  ttc gac gtg     20454
Asn Glu  Pro Thr Leu Leu Tyr  Met Leu Phe Glu Val  Phe Asp Val
    1380                 1385                 1390
gtc aga  gtg cac cag ccg cac  cgc ggt att atc gag  gcc gtg tac     20499
Val Arg  Val His Gln Pro His  Arg Gly Ile Ile Glu  Ala Val Tyr
    1395                 1400                 1405
ctg cgc  acc ccc ttc tct gcg  ggc aat gcc acc aca  taa gccgctgaac  20548
Leu Arg  Thr Pro Phe Ser Ala  Gly Asn Ala Thr Thr
    1410                 1415                 1420
tagctggttt ttaccccaga tcccatgggc tccacggaag acgaactgcg ggccattgtg  20608
cgagacctgg gctgcggacc ctacttcctg ggcacctttg acaagcggtt tcccgggttc  20668
gtgtctcctc gcaaactcgc gtgcgcgatc gtgaataccg ccggccgaga gaccggagga  20728
gagcattggc tagctctggg ctggaacccc cgctcgtcca cgtttttcct gttcgacccc  20788
tttggctttt cagaccaacg cttgaagcag atctatgcat ttgaatatga gggtctactc  20848
aagcgaagcg cgctggcctc ctccgccgat cactgtctaa ccctggtaaa gagcactcag  20908
acggttcagg gccctcacag cgccgcctgt ggcctttttt gttgcatgtt tttgcacgcc  20968
tttgtgaact ggccggacac ccccatggaa aacaacccca ccatggacct cctgactggc  21028
gttcccaact ccatgctcca aagccccagc gtgcagacca ccctcctcca aaaccagaaa  21088
aatctgtacg cctttctgca caagcactct ccctactttc gccgccatcg ggaacaaata  21148
gaaaatgcaa ccgcgtttaa caaaactctg taacgtttaa taaatgaact ttttattgaa  21208
ctggaaaacg ggtttgtgat ttttaaaaat caaaggggtt gagctggaca tccatgtggg  21268
aggccggaag ggtggtgttc ttgtactggt acttgggcag ccacttaaac tctggaatca  21328
caaacttggg cagcggtatt tctgggaagt tgtcgtgcca cagctggcgg gtcagctgaa  21388
gtgcctgcag aacatcgggg gcggagatct tgaagtcgca gtttatctgg ttcacggcac  21448
gcgcgttgcg gtacatggga ttggcacact gaaacaccag caggctggga ttcttgatgc  21508
tagccagggc cacggcgtcg gtcacgtcac cggtgtcttc tatgttggac agcgaaaaag  21568
gcgtgacttt gcaaagctgg cgtcccgcgc gaggcacgca atctcccagg tagttgcact  21628
cacagcggat gggcagaaga agatgcttgt ggccgcgggt catgtaggga taggccgctg  21688
ccataaaagc ttcgatctgc ctgaaagcct gcttggcctt gtgcccttcg gtataaaaaa  21748
caccgcagga cttgttggaa aaggtattac tggcgcaagc ggcatcgtga aagcaagcgc  21808
gtgcgtcttc gtttcgtaac tgcaccacgc tgcggcccca ccggttctga atcaccttgg  21868
ccctgccggg gttttccttg agagcgcgct ggccggcttc gctgcccaca tccatttcca  21928
cgacatgctc cttgttaatc atggccagac cgtggaggca gcgcagctcc tcgtcatcgt  21988
cggtgcagtg atgctcccac acgacgcagc cagtgggctc ccacttgggc ttggaggcct  22048
cggcaatgcc agaatacagg agaacgtagt ggtgcagaaa acgtcccatc atggtgccaa  22108
aggttttctg gctgctgaag gtcatcgggc agtacctcca gtcctcgtta agccaagtgt  22168
tgcagatctt cctgaagacc gtgtactgat cgggcataaa gtggaactca ttgcgctcgg  22228
tcttgtcgat cttatacttt tccatcagac tatgcataat ctccatgccc ttttcccagg  22288
cgcaaacaat cttggtgcta cacgggttag gtatggccaa agtggttggc ctctgaggcg  22348
gcgcttgttc ttcctcttga gccctctccc gactgacggg ggttgaaaga gggtgcccct  22408
tggggaacgg cttgaacacg gtctggcccg aggcgtcccg aagaatctgc atcgggggat  22468
tgctggccgt catggcgatg atctgacccc ggggctcctc cacttcgtcc tcctcgggac  22528
tttcctcgtg cttttcgggg gacggtacgg gagtaggggg aagagcgcgg cgcgccttct  22588
tcttgggcgg cagttccgga gcctgctctt gacgactggc cattgtcttc tcctaggcaa  22648
gaaaaacaag atggaagact ctttctcctc ctcctcgtca acgtcagaaa gcgagtcttc  22708
caccttaagc gccgagaact cccagcgcat agaatccgat gtgggctacg agactccccc  22768
cgcgaacttt tcgccgcccc ccataaacac taacgggtgg acggactacc tggccctagg  22828
agacgtactg ctgaagcaca tcaggcggca gagcgttatc gtgcaagatg ctctcaccga  22888
gcgactcgcg gttccgctgg aagtggcgga acttagcgcc gcctacgagc gaaccctctt  22948
ctccccaaag actcccccca agaggcaggc taacggcacc tgcgagccta accctcgact  23008
caacttctac cctgcctttg ccgtgccaga ggtactggct acgtaccaca tttttttcca  23068
aaaccacaaa atccctctct cgtgccgcgc caaccgcacc aaagccgatc gcgtgctgcg  23128
actggaggaa ggggctcgca tacctgagat tgcgtgtctg gaggaagtcc caaaaatctt  23188
tgaaggtctg ggccgcgacg aaaagcgagc agcaaacgct ctggaagaga acgcagagag  23248
tcacaacagc gccttggtag aactcgaggg cgacaacgcc agactggccg tcctcaaacg  23308
gtccatagaa gtcacgcact tcgcctaccc cgccgttaac ctccctccaa aagttatgac  23368
agcggtcatg gactcgctgc tcataaagcg cgctcagccc ttagacccag agcacgaaaa  23428
caacagtgac gaaggaaaac cggtggtttc tgatgaggag ttgagcaagt ggctgtcctc  23488
caacgacccc gccacgttgg aggaacgaag aaaaaccatg atggccgtgg tgctagttac  23548
cgtgcaatta gaatgtctgc agaggttctt ttcccaccca gagaccctga gaaaagtgga  23608
ggaaacgctg cactacacat ttaggcacgg ctacgtgaag caagcctgca agatttccaa  23668
cgtagaactt agcaacctca tctcctacct ggggatcttg cacgaaaacc gcctcggaca  23728
aaacgtgctg cacagcacac tgaaaggaga agcccgccga gactatgtgc gagactgcgt  23788
gttcctagcg ctagtgtaca cctggcagag cggaatggga gtctggcagc agtgcctgga  23848
ggacgaaaac ctcaaagagc ttgaaaagct gctggtgcgc tccagaaggg cactgtggac  23908
cagttttgac gagcgcaccg ccgcgcgaga cctagctgat attatttttc ctcccaagct  23968
ggtgcagact ctccgggaag gactgccaga ttttatgagt caaagcatct tgcaaaactt  24028
ccgctctttc atcttggaac gctcgggaat cttgcccgcc actagctgcg ccctacccac  24088
agattttgtg cctctccact accgcgaatg cccaccgccg ctgtggccgt acacttactt  24148
gcttaaactg gccaactttc taatgttcca ctctgacctg gcagaagacg ttagcggcga  24208
ggggctgcta gaatgccact gccgctgcaa cctgtgcacc ccccaccgct ctctagtatg  24268
caacactccc ctgctcaatg agacccagat catcggtacc tttgaaatcc agggaccctc  24328
cgacgcggaa aacggcaagc aggggtctgg gctaaaactc acagccggac tgtggacctc  24388
cgcctacttg cgcaaatttg taccagaaga ctatcacgcc caccaaatta aattttacga  24448
aaaccaatca aaaccaccca aaagcgagtt aacggcttgc gtcattacgc agagcagcat  24508
agttgggcag ttgcaagcca ttaacaaagc gcggcaagag tttctcctaa aaaaaggaaa  24568
aggggtctac ttggaccccc agaccggcga ggaactcaac ggaccctcct cagtcgcagg  24628
ttgtgtgccc catgccgccc aaaaagaaca cctcgcagtg gaacatgcca gagacggagg  24688
aagaggagtg gagcagtgtg agcaacagcg aaacggagga agagccgtgg cccgaggggt  24748
gcaacgggga agaggacacg gagggacggc gaagtcttcg ccgaagaact ctcgccgctg  24808
cccccgaagt cccagccggc cgcctcggcc caagatcccg cacacacccg tagatgggat  24868
agcaagacca aaaagccggg taagagaaac gctcgccccc gccagggcta ccgctcgtgg  24928
agaaagcaca aaaactgcat cttatcgtgc ttgctccagt gcggcggaga cgtttcgttc  24988
acccgtagat acttgctttt taacaaaggg gtggccgtcc cccgtaacgt cctccactac  25048
taccgtcact cttacagctc cgaagcggac ggctaagaaa acgcagcagt tgccggcggg  25108
aggactgcgt ctcagcgccc gagaaccccc agccaccagg gagctccgaa accgcatatt  25168
tcccaccctc tacgctatct ttcagcaaag ccgggggcag cagcaagaac tgaaaataaa  25228
aaaccgcacg ctgaggtcgc ttacccgaag ctgcctctat cacaagagcg aagagcagct  25288
gcagcgaacc ctggaggacg cagaagcgct gttccagaag tactgcgcga ccaccctaaa  25348
taactaaaaa agcccgcgcg cgggacttca aaccgtctga cgtcaccagc cgcgcgccaa  25408
aatgagcaaa gagattccca cgccttacat gtggagttac cagccgcaga tgggattagc  25468
cgccggcgcc gcccaggatt actccacgaa aatgaactgg ctcagcgccg ggccccacat  25528
gatttcccgc gtaaacgaca ttcgcgccca ccgcaatcag ctattgttag aacaggctgc  25588
tctgaccgcc acgccccgta ataacctgaa ccctcccagc tggccagctg ccctggtgta  25648
ccaggaaacg cctccaccca ccagcgtact tttgccccgt gacgcccagg cggaagtcca  25708
gatgactaac gcgggcgcgc aattagcggg cggatcccgg tttcggtaca gagttcacgg  25768
cgccgcaccc tatagcccag gtataaagag gctgatcatt cgaggcagag gtgtccagct  25828
caacgacgag acagtgagct cttcgcttgg tctacgacca gacggagtgt tccagctcgc  25888
gggctcgggc cgctcttcgt tcacgcctcg ccaggcatac ctgactctgc agagctctgc  25948
ctctcagcct cgctcgggag gaatcggacc ccttcagttt gtggaggagt ttgtgccctc  26008
ggtctacttt cagcctttct ccggatcgcc cggccagtac ccggacgagt tcatccccaa  26068
cttcgacgcg gtgagtgact ctgtggacgg ttatgactga tgtcgagccc gcttcagtgc  26128
tagtggaaca agcgcggctc aatcacctgg ttcgttgccg ccgccgctgc tgcgtggctc  26188
gcgacttgag cttagctctc aagtttgtaa aaaacccgtc cgaaaccggg agcgctgtgc  26248
acgggttgga gctagtgggt cctgagaagg ccaccatcca cgttctcaga aactttgtgg  26308
aaaaacccat tttggttaaa cgagatcagg ggccttttgt aatcagctta ctctgcacct  26368
gtaaccatgt tgaccttcac gactatttta tggatcattt gtgcgctgaa ttcaataagt  26428
aaagcgaatt cttaccaaga ttatgatgtc catgactgtt cctcgccact atacgatgtt  26488
gtgccagtaa actctcttgt cgacatctat ctgaactgtt ccttttggtc cgcacagctt  26548
acttggtact acggtgacac cgtcctttct ggctcactgg gcagctcaca cggaataaca  26608
cttcacctct tttcgccgtt tcgatacgga aactacagct gtcgtgccgg tacctgcctc  26668
cacgttttca atcttcagcc ctgtccaccg accaaacttg tatttgtcga ctctaagcac  26728
ttacagctca actgcagcat tctaggcccc agtatcttgt ggacatacaa taaaatcagg  26788
ttggtggaat ttgtctacta cccacccagc gcccgcggtt ttggggaaat tcctttccag  26848
atctactaca actatcttgc cacacattat gcaagtcaac agcaactaaa cttgcaagca  26908
cccttcacgc caggagagta ctcctgtcac gtaggctcct gcacagaaac ttttattctc  26968
ttcaacagat cttctgccat tgaacgcttc actactaact actttagaaa ccaagttgtg  27028
cttttcactg acgaaacccc taacgtcacc ctggactgtg catgtttttc tcatgacacc  27088
gtaacttgga ctcttaacaa tactctctgg ctcgcgttcg ataaccaaag cttgattgtt  27148
aaaaattttg atttaacctt tactaaaccc tctcctcgcg aaatagttat ctttgctcct  27208
tttaatccaa aaactacctt agcctgtcag gttttgttta agccttgcca aacaaacttt  27268
aagtttgttt atttgcctcc gcaatctgtc aaactcatag aaaaatacaa caaagcgccc  27328
gtcttggctc ctaaaacctt ctaccactgg ctaacctaca cggggctgtt tgcactaatt  27388
gtttttttcc taattaacat ttttatatgt ttcttgcctt cctccttctt ttcgcgaaca  27448
ccgttgccgc agaaagacct ctccttatta ctgtagcgct tgctatacaa aaccaagagt  27508
ggtcaaccgt gctctcaatc tattttcaat ttttcatttt gtccttaata ctttctctta  27568
ttgtcgttaa caatgatctg gagcattggt ctcgcctttt tttggctgct tagtgcaaaa  27628
gccactattt ttcacaggta tgtggaagaa ggaactagca ccctctttac gatacctgaa  27688
acaattaagg cggctgatga agtttcttgg tacaaaggct cgctctcaga cggcaaccac  27748
tcattctcag gacagaccct ttgcatccaa gaaacttatt ttaaatcaga actacaatac  27808
agctgcataa aaaacttttt ccatctctac aacatctcaa aaccctatga gggtatttac  27868
aatgccaagg tttcagacaa ctccagcaca cggaactttt actttaatct gacagttatt  27928
aaagcaattt ccattcctat ctgtgagttt agctcccagt ttctttctga aacctactgt  27988
ttaattacta taaactgcac taaaaatcgc cttcacacca ccataatcta caatcacaca  28048
caatcacctt gggttttaaa cctaaaattt tctccacaca tgccttcgca atttctcacg  28108
caagttaccg tctctaacat aagcaagcag tttggctttt actatccttt ccacgaactg  28168
tgcgaaataa ttgaagccga atatgaacca gactacttta cttacattgc cattggtgta  28228
atcgttgttt gcctttgctt tgttattggg gggtgtgttt atttgtacat tcagagaaaa  28288
atattgctct cgctgtgctc ctgcggttac aaagcagaag aaagaattaa aatctctaca  28348
ctttattaat gttttccaga aatggcaaaa ctaacgctcc tacttttgct tctcacgccg  28408
gtgacgcttt ttaccatcac tttttctgcc gccgccacac tcgaacctca atgtttgcca  28468
ccggttgaag tctactttgt ctacgtgttg ctgtgctgcg ttagcgtttg cagtataaca  28528
tgttttacct ttgtttttct tcagtgcatt gactacttct gggtcagact ctactaccgc  28588
agacacgcgc ctcagtatca aaatcaacaa attgccagac tactcggtct gccatgattg  28648
tcttgtattt taccctgatt ttttttcacc ttacttgcgc ttgtgatttt cacttcactc  28708
aattttggaa aacgcaatgc ttcgacccgc gcctctccaa cgactggatg atggctcttg  28768
caattgccac gcttggggcg tttggacttt ttagtggttt tgctttgcat tacaaattta  28828
agactccatg gacacatggc tttctttcag attttccagt tacacctact ccgccgcctc  28888
ccccggccat cgacgtgcct caggttccct caccttctcc atctgtctgc agctactttc  28948
atctgtaatg gccgacctag aatttgacgg agtgcaatct gagcaaaggg ctatacactt  29008
ccaacgccag tcggaccgcg aacgcaaaaa cagagagctg caaaccatac aaaacaccca  29068
ccaatgtaaa cgcgggatat tttgtattgt aaaacaagct aagctccact acgagcttct  29128
atctggcaac gaccacgagc tccaatacgt ggtcgatcag cagcgtcaaa cctgtgtatt  29188
cttaattgga gtttccccca ttaaagttac tcaaaccaag ggtgaaacca agggaaccat  29248
aaggtgctca tgtcacctgt cagaatgcct ttacactcta gttaaaaccc tatgtggctt  29308
acatgattct atccccttta attaaataaa cttactttaa atctgcaatc acttcttcgt  29368
ccttgttttt gtcgccatcc agcagcacca ccttcccctc ttcccaactt tcatagcata  29428
ttttccgaaa agaggcgtac tttcgccaca ccttaaaggg aacgtttact tcgctttcaa  29488
gctctcccac gattttcatt gcagat atg aaa cgc gcc aaa  gtg gaa gaa gga  29541
                             Met Lys Arg Ala Lys  Val Glu Glu Gly
                                             1425
ttt  aac ccc gtt tat ccc  tat gga tat tct act  ccg act gac gtg    29586
Phe  Asn Pro Val Tyr Pro  Tyr Gly Tyr Ser Thr  Pro Thr Asp Val
1430                 1435                 1440
gct  cct ccc ttt gta gcc  tct gac ggt ctt caa  gaa aac cca cct    29631
Ala  Pro Pro Phe Val Ala  Ser Asp Gly Leu Gln  Glu Asn Pro Pro
1445                 1450                 1455
ggg  gtc ttg tcc cta aaa  ata tcc aaa cct tta  act ttt aat gcc    29676
Gly  Val Leu Ser Leu Lys  Ile Ser Lys Pro Leu  Thr Phe Asn Ala
1460                 1465                 1470
tcc  aag gct cta agc ctg  gct att ggt cca gga  tta aaa att caa    29721
Ser  Lys Ala Leu Ser Leu  Ala Ile Gly Pro Gly  Leu Lys Ile Gln
1475                 1480                 1485
gat  ggt aaa cta gtg ggg  gag gga caa gca att  ctt gca aac ctg    29766
Asp  Gly Lys Leu Val Gly  Glu Gly Gln Ala Ile  Leu Ala Asn Leu
1490                 1495                 1500
ccg  ctt caa atc acc aac  aac aca att tca cta  cgt ttt ggg aac    29811
Pro  Leu Gln Ile Thr Asn  Asn Thr Ile Ser Leu  Arg Phe Gly Asn
1505                 1510                 1515
aca  ctt gcc ttg aat gac  aat aat gaa ctc caa  acc aca cta aaa    29856
Thr  Leu Ala Leu Asn Asp  Asn Asn Glu Leu Gln  Thr Thr Leu Lys
1520                 1525                 1530
tct  tca tcg ccc ctt aaa  atc aca gac cag act  ctg tcc ctt aac    29901
Ser  Ser Ser Pro Leu Lys  Ile Thr Asp Gln Thr  Leu Ser Leu Asn
1535                 1540                 1545
ata  ggg gac agc ctt gca  att aaa gat gac aaa  cta gaa agc gct    29946
Ile  Gly Asp Ser Leu Ala  Ile Lys Asp Asp Lys  Leu Glu Ser Ala
1550                 1555                 1560
ctt  caa gcg acc ctc cca  ctc tcc att agc aac  aac acc atc agc    29991
Leu  Gln Ala Thr Leu Pro  Leu Ser Ile Ser Asn  Asn Thr Ile Ser
1565                 1570                 1575
ctc  aac gtg ggc acc gga  ctc acc ata aat gga  aac gtt tta caa    30036
Leu  Asn Val Gly Thr Gly  Leu Thr Ile Asn Gly  Asn Val Leu Gln
1580                 1585                 1590
gct  gtt ccc tta aat gct  cta agt ccc cta act  att tcc aac aat    30081
Ala  Val Pro Leu Asn Ala  Leu Ser Pro Leu Thr  Ile Ser Asn Asn
1595                 1600                 1605
aac  atc agc ctg cgc tat  ggc agt tcc ctg acg  gtg ctt aac aat    30126
Asn  Ile Ser Leu Arg Tyr  Gly Ser Ser Leu Thr  Val Leu Asn Asn
1610                 1615                 1620
gaa  ctg caa agc aac ctc  aca gtt cac tcc cct  tta aaa ctc aac    30171
Glu  Leu Gln Ser Asn Leu  Thr Val His Ser Pro  Leu Lys Leu Asn
1625                 1630                 1635
tcc  aac aac tca att tct  ctc aac act cta tct  ccg ttt aga atc    30216
Ser  Asn Asn Ser Ile Ser  Leu Asn Thr Leu Ser  Pro Phe Arg Ile
1640                 1645                 1650
gag  aat ggt ttc ctc acg  ctc tat ttg gga aca  aaa tct ggc ttg    30261
Glu  Asn Gly Phe Leu Thr  Leu Tyr Leu Gly Thr  Lys Ser Gly Leu
1655                 1660                 1665
cta  gtt caa aac agt ggc  tta aaa gtt caa gcg  ggc tac ggc ctg    30306
Leu  Val Gln Asn Ser Gly  Leu Lys Val Gln Ala  Gly Tyr Gly Leu
1670                 1675                 1680
caa  gta aca gac acc aat  gct ctc aca tta aga  tat ctc gct cca    30351
Gln  Val Thr Asp Thr Asn  Ala Leu Thr Leu Arg  Tyr Leu Ala Pro
1685                 1690                 1695
ctg  acc att cca gac tcg  ggc tca gaa caa ggc  att ctt aaa gta    30396
Leu  Thr Ile Pro Asp Ser  Gly Ser Glu Gln Gly  Ile Leu Lys Val
1700                 1705                 1710
aac  act gga cag ggc cta  agt gtg aac caa gct  gga gcg ctt gaa    30441
Asn  Thr Gly Gln Gly Leu  Ser Val Asn Gln Ala  Gly Ala Leu Glu
1715                 1720                 1725
aca  tcc cta gga ggt gga  tta aaa tat gct gat  aac aaa ata acc    30486
Thr  Ser Leu Gly Gly Gly  Leu Lys Tyr Ala Asp  Asn Lys Ile Thr
1730                 1735                 1740
ttt  gat aca gga aac gga  ctg aca tta tct gaa  aat aaa ctt gca    30531
Phe  Asp Thr Gly Asn Gly  Leu Thr Leu Ser Glu  Asn Lys Leu Ala
1745                 1750                 1755
gta  gct gca ggt agt ggt  cta act ttt aga gat  ggt gcc ttg gta    30576
Val  Ala Ala Gly Ser Gly  Leu Thr Phe Arg Asp  Gly Ala Leu Val
1760                 1765                 1770
gcc  acg gga acc gca ttt  acg caa aca ctg tgg  act acg gct gat    30621
Ala  Thr Gly Thr Ala Phe  Thr Gln Thr Leu Trp  Thr Thr Ala Asp
1775                 1780                 1785
ccg  tct ccc aac tgc aca  att ata cag gac cgc  gac aca aaa ttt    30666
Pro  Ser Pro Asn Cys Thr  Ile Ile Gln Asp Arg  Asp Thr Lys Phe
1790                 1795                 1800
act  ttg gcg ctt acc att  agt ggg agc caa gtg  ctg ggg acg gtt    30711
Thr  Leu Ala Leu Thr Ile  Ser Gly Ser Gln Val  Leu Gly Thr Val
1805                 1810                 1815
tcc  att att gga gta aaa  ggc ccc ctt tca agt  agc ata ccg tca    30756
Ser  Ile Ile Gly Val Lys  Gly Pro Leu Ser Ser  Ser Ile Pro Ser
1820                 1825                 1830
gct  acc gtt aca gta caa  ctt aac ttt gat tcc  aac gga gcc cta    30801
Ala  Thr Val Thr Val Gln  Leu Asn Phe Asp Ser  Asn Gly Ala Leu
1835                 1840                 1845
ttg  agc tcc tct tca ctt  aaa ggt tac tgg ggg  tat cgc caa ggt     30846
Leu  Ser Ser Ser Ser Leu  Lys Gly Tyr Trp Gly  Tyr Arg Gln Gly
1850                 1855                 1860
ccc  tca att gac cct tac  ccc ata att aat gcc  tta aac ttt atg     30891
Pro  Ser Ile Asp Pro Tyr  Pro Ile Ile Asn Ala  Leu Asn Phe Met
1865                 1870                 1875
cca  aac tca ctg gct tat  ccc ccg gga caa gaa  atc caa gca aaa     30936
Pro  Asn Ser Leu Ala Tyr  Pro Pro Gly Gln Glu  Ile Gln Ala Lys
1880                 1885                 1890
tgt  aac atg tac gtt tct  act ttt tta cga gga  aat cca caa aga     30981
Cys  Asn Met Tyr Val Ser  Thr Phe Leu Arg Gly  Asn Pro Gln Arg
1895                 1900                 1905
cca  ata gtt tta aac atc  act ttt aat aat caa  acc agc ggg ttt     31026
Pro  Ile Val Leu Asn Ile  Thr Phe Asn Asn Gln  Thr Ser Gly Phe
1910                 1915                 1920
tcc  att aga ttt aca tgg  aca aat tta acc aca  gga gaa gca ttt     31071
Ser  Ile Arg Phe Thr Trp  Thr Asn Leu Thr Thr  Gly Glu Ala Phe
1925                 1930                 1935
gca  atg ccc cca tgc act  ttt tcc tac att gct  gaa caa caa taa     31116
Ala  Met Pro Pro Cys Thr  Phe Ser Tyr Ile Ala  Glu Gln Gln
1940                 1945                 1950
actatgtaac cctcaccgtt aacccgcctc cgcccttcca ttttatttta taaaccaccc  31176
gatccacctt ttcagcagta aacaattgca tgtcagtagg ggcagtaaaa cttttgggag  31236
ttaaaatcca cacaggttct tcacaagcta agcgaaaatc agttacactt ataaaaccat  31296
cgctaacatc ggacaaagac aagcatgagt ccaaagcttc cggttctgga tcagattttt  31356
gttcattaac agcgggagaa acagcttctg gaggattttc catctccatc tccttcatca  31416
gttccaccat gtccaccgtg gtcatctggg acgagaacga cagttgtcat acacctcata  31476
agtcaccggt cgatgacgaa cgtacagatc tcgaagaatg tcctgtcgcc gcctttcggc  31536
agcactgggc cgaaggcgaa agcgcccatg tttaacaatg gccagcaccg cccgcttcat  31596
caggcgccta gttcttttag cgcaacagcg catgcgcagc tcgctaagac tggcgcaaga  31656
aacacagcac agaaccacca gattgttcat gatcccataa gcgtgctgac accagcccat  31716
actaacaaat tgtttcacta ttctagcatg aatgtcatat ctgatgttca agtaaattaa  31776
atggcgcccc cttatgtaaa cacttcccac gtacaacacc tcctttggca tctgataatt  31836
aaccacctcc cgataccaaa tacatctctg attaatagtc gccccgtaca ctacccgatt  31896
aaaccaagtt gccaacataa tcccccctgc catacactgc aaagaacctg gacggctaca  31956
atgacagtgc aaagtccaca cctcgttgcc atggataact gaggaacgcc ttaagtcaat  32016
agtggcacaa ctaatacaaa catgtaaata gtgtttcaac aagtgccact cgtatgaggt  32076
gagtatcatg tcccagggaa cgggccactc cataaacact gcaaaaccaa cacatcctac  32136
catcccccgc acggcactca catcgtgcat ggtgttcata tcacagtccg gaagctgagg  32196
acaaggaaaa gtctcgggag cattttcata gggcggtagt gggtactcct tgtaggggtt  32256
cagtcggcac cggtatctcc tcaccttctg ggccataaca cacaagttga gatctgattt  32316
caaggtactt tctgaatgaa aaccaagtgc tttcccaaca atgtatccga tgtcttcggt  32376
ccccgcgtcg gtagcgctcc ttgcagtaca cacggaacaa ccactcacgc aggcccagaa  32436
gacagttttc cgcggacggt gacaagttaa tccccctcag tctcagagcc aatatagttt  32496
cttccacagt agcataggcc aaacccaacc aggaaacaca agctggcacg tcccgttcaa  32556
cgggaggaca aggaagcaga ggcagaggca taggcaaagc aacagaattt ttattccaac  32616
tggtcacgta gcacttcaaa caccaggtca cgtaaatggc agcgatcttg ggtttcctga  32676
tggaacataa cagcaagatc aaacatgaga cgattctcaa ggtgattaac cacagctgga  32736
attaaatcct ccacgcgcac atttagaaac accagcaata caaaagcccg gttttctccg  32796
ggatctatca tagcagcaca gtcatcaatt agtcccaagt aattttcccg tttccaatct  32856
gttataattt gcagaataat gccctgtaaa tccaagccgg ccatggcgaa aagctcagat  32916
aatgcacttt ccacgtgcat tcgtaaacac accctcatct tgtcaatcca aaaagtcttc  32976
ttcttgagaa acctgtagta aattaagaat cgccaggtta ggctcgatgc ctacatcccg  33036
gagcttcatt ctcagcatgc actgcaaatg atccagcaga tcagaacagc aattagcagc  33096
cagctcatcc ccggtttcca gttccggagt tcccacggca attatcactc gaaacgtggg  33156
acaaatcgaa ataacatgag ctcccacgtg agcaaaagcc gtagggccag tgcaataatc  33216
acagaaccag cggaaaaaag attgcagctc atgtttcaaa aagctctgca gatcaaaatt  33276
cagctcatgc aaataacaca gtaaagtttg cggtatagta accgaaaacc acacgggtcg  33336
acgttcaaac atctcggctt acctaaaaaa gaagcacatt tttaaaccac agtcgcttcc  33396
tgaacaggag gaaatatggt gcggcgtaaa accagacgcg ccaccggatc tccggcagag  33456
ccctgataat acagccagct gtggttaaac agcaaaacct ttaattcggc aacggttgag  33516
gtctccacat aatcagcgcc cacaaaaatc ccatctcgaa cttgctcgcg tagggagcta  33576
aaatggccag tatagcccca tggcacccga acgctaatct gcaagtatat gagagccacc  33636
ccattcggcg ggatcacaaa atcagtcgga gaaaacaacg tatacacccc ggactgcaaa  33696
agctgttcag gcaaacgccc ctgcggtccc tctcggtaca ccagcaaagc ctcgggtaaa 33756
gcagccatgc caagcgctta ccgtgccaag agcgactcag acgaaaaagt gtactgaggc 33816
gctcagagca gcggctatat actctacctg tgacgtcaag aaccgaaagt caaaagttca 33876
cccggcgcgc ccgaaaaaac ccgcgaaaat ccacccaaaa agcccgcgaa aaacacttcc 33936
gtataaaatt tccgggttac cggcgcgtca ccgccgcgcg acacgcccgc cccgccccgc 33996
gctcctcccc gaaacccgcc gcgcccactt ccgcgttccc aagacaaagg tcgcgtaact 34056
ccgcccacct catttgcatg ttaactcggt cgccatcttg cggtgttata ttgatgatg  34115
<210>35
<211>503
<212>PRT
<213>猿猴腺病毒SV-39
<400>35
Met Arg Arg Ala Val Ala Val Pro Ser Ala Ala Met Ala Leu Gly Pro
1               5                   10                  15
Pro Pro Ser Tyr Glu Ser Val Met Ala Ala Ala Thr Leu Gln Ala Pro
            20                  25                  30
Leu Glu Asn Pro Tyr Val Pro Pro Arg Tyr Leu Glu Pro Thr Gly Gly
        35                  40                  45
Arg Asn Ser Ile Arg Tyr Ser Glu Leu Thr Pro Leu Tyr Asp Thr Thr
    50                  55                  60
Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Thr Leu Asn
65                  70                  75                  80
Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Ser Val Val Gln Asn Ser
                85                  90                  95
Asp Tyr Thr Pro Ala Glu Ala Ser Thr Gln Thr Ile Asn Leu Asp Asp
            100                 105                 110
Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr Ile Leu His Thr Asn Met
        115                 120                 125
Pro Asn Val Asn Glu Phe Met Phe Thr Asn Ser Phe Arg Ala Lys Leu
    130                 135                 140
Met Val Ala His Glu Ala Asp Lys Asp Pro Val Tyr Glu Trp Val Gln
145                 150                 155                 160
Leu Thr Leu Pro Glu Gly Asn Phe Ser Glu Ile Met Thr Ile Asp Leu
                165                 170                 175
Met Asn Asn Ala Ile Ile Asp His Tyr Leu Ala Val Ala Arg Gln Gln
            180                 185                 190
Gly Val Lys Glu Ser Glu Ile Gly Val Lys Phe Asp Thr Arg Asn Phe
        195                 200                 205
Arg Leu Gly Trp Asp Pro Glu Thr G1y Leu Val Met Pro Gly Val Tyr
    210                 215                 220
Thr Asn Glu Ala Phe His Pro Asp Val Val Leu Leu Pro Gly Cys Gly
225                 230                 235                 240
Val Asp Phe Thr Tyr Ser Arg Leu Asn Asn Leu Leu Gly Ile Arg Lys
                245                 250                 255
Arg Met Pro Phe Gln Glu Gly Phe Gln Ile Leu Tyr Glu Asp Leu Glu
            260                 265                 270
Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Pro Ala Tyr Glu Glu Ser
        275                 280                 285
Ile Ala Asn Ala Arg Glu Ala Ala Ile Arg Gly Asp Asn Phe Ala Ala
    290                 295                 300
Gln Pro Gln Ala Ala Pro Thr Ile Lys Pro Val Leu Glu Asp Ser Lys
305                 310                 315                 320
Gly Arg Ser Tyr Asn Val Ile Ala Asn Thr Asn Asn Thr Ala Tyr Arg
                325                 330                 335
Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg
            340                 345                 350
Ala Trp Thr Leu Leu Thr Thr Pro Asp Val Thr Cys Gly Ser Glu Gln
        355                 360                 365
Val Tyr Trp Ser Leu Pro Asp Met Tyr Val Asp Pro Val Thr Phe Arg
    370                 375                 380
Ser Thr Gln Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Met
385                 390                 395                 400
Pro Ile His Ser Lys Ser Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln
                405                 410                 415
Leu Ile Arg Gln Thr Thr Ala Leu Thr His Val Phe Asn Arg Phe Pro
            420                 425                 430
Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val
        435                 440                 445
Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Gln
    450                 455                 460
Asn Ser Ile Arg Gly Val Gln Arg Val Thr Ile Thr Asp Ala Arg Arg
465                 470                 475                 480
Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg
                485                 490                 495
Val Leu Ser Ser Arg Thr Phe
            500
<210>36
<211>917
<212>PRT
<213>猿猴腺病毒SV-39
<400>36
Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ala
1               5                   10                  15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
            20                  25                  30
Arg Ala Thr Glu Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro
        35                  40                  45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
    50                  55                  60
Thr Ile Arg Phe Val Pro Val Asp Lys Glu Asp Thr Ala Tyr Ser Tyr
65                  70                  75                  80
Lys Thr Arg Phe Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
               85                  90                  95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Ile Asp Arg Gly Pro Ser
            100                 105                 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
        115                 120                 125
Ala Pro Asn Asn Ser Gln Trp Asn Ala Thr Asp Asn Gly Asn Lys Pro
    130                 135                 140
Val Cys Phe Ala Gln Ala Ala Phe Ile Gly Gln Ser Ile Thr Lys Asp
145                 150                 155                 160
Gly Val Gln Ile Gln Asn Ser Glu Asn Gln Gln Ala Ala Ala Asp Lys
                165                 170                 175
Thr Tyr Gln Pro Glu Pro Gln Ile Gly Val Ser Thr Trp Asp Thr Asn
            180                 185                 190
Val Thr Ser Asn Ala Ala Gly Arg Val Leu Lys Ala Thr Thr Pro Met
        195                 200                 205
Leu Pro Cys Tyr Gly Ser Tyr Ala Asn Pro Thr Asn Pro Asn Gly Gly
    210                 215                 220
Gln Ala Lys Thr Glu Gly Asp Ile Ser Leu Asn Phe Phe Thr Thr Thr
225                 230                 235                 240
Ala Ala Ala Asp Asn Asn Pro Lys Val Val Leu Tyr Ser Glu Asp Val
                245                 250                 255
Asn Leu Gln Ala Pro Asp Thr His Leu Val Tyr Lys Pro Thr Val Gly
            260                 265                 270
Glu Asn Val Ile Ala Ala Glu Ala Leu Leu Thr Gln Gln Ala Cys Pro
        275                 280                 285
Asn Arg Ala Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met
    290                 295                 300
Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser
305                 310                 315                 320
Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser
                325                 330                 335
Tyr Gln Leu Met Leu Asp Ala Leu Gly Asp Arg Thr Arg Tyr Phe Ser
            340                 345                 350
Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile
        355                 360                 365
Glu Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu
    370                 375                 380
Pro Gly Met Gly Ile Phe Asn Ser Tyr Lys Gly Val Lys Pro Gln Asn
385                 390                 395                 400
Gly Gly Asn Gly Asn Trp Glu Ala Asn Gly Asp Leu Ser Asn Ala Asn
                405                 410                 415
Glu Ile Ala Leu Gly Asn Ile Phe Ala Met Glu Ile Asn Leu His Ala
            420                 425                 430
Asn Leu Trp Arg Ser Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro
        435                 440                 445
Asp Ser Tyr Lys Phe Thr Pro Ala Asn Ile Thr Leu Pro Ala Asn Gln
    450                 455                 460
Asn Thr Tyr Glu Tyr Ile Asn Gly Arg Val Thr Ser Pro Thr Leu Val
465                 470                 475                 480
Asp Thr Phe Val Asn Ile Gly Ala Arg Trp Ser Pro Asp Pro Met Asp
                485                 490                 495
Asn Val Asn Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg
            500                 505                 510
Ser Met Leu Leu Gly Asn Gly Arg Val Val Pro Phe His Ile Gln Val
        515                 520                 525
Pro Gln Lys Phe Phe Ala Ile Lys Asn Leu Leu Leu Leu Pro Gly Ser
    530                 535                 540
Tyr Thr Tyr Glu Trp Ser Phe Arg Lys Asp Val Asn Met Ile Leu Gln
545                 550                 555                 560
Ser Thr Leu Gly Asn Asp Leu Arg Val Asp Gly Ala Ser Val Arg Ile
                565                 570                 575
Asp Ser Val Asn Leu Tyr Ala Asn Phe Phe Pro Met Ala His Asn Thr
            580                 585                 590
Ala Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser
        595                 600                 605
Phe Asn Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala
    610                 615                 620
Asn Ala Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala
625                 630                 635                 640
Phe Arg Gly Trp Ser Phe Thr Arg Leu Lys Ala Lys Glu Thr Pro Ser
                645                 650                 655
Leu Gly Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly Thr Ile Pro
            660                 665                 670
Tyr Leu Asp Gly Ser Phe Tyr Leu Asn His Thr Phe Lys Arg Leu Ser
        675                 680                 685
Ile Met Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu
    690                 695                 700
Thr Pro Asn Glu Phe Glu Ile Lys Arg Tle Val Asp Gly Glu Gly Tyr
705                 710                 715                 720
Asn Val Ala Gln Ser Asn Met Thr Lys Asp Trp Phe Leu Ile Gln Met
                725                 730                 735
Leu Ser His Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Val Pro Glu Gly
            740                 745                 750
Tyr Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser
        755                 760                 765
Arg Gln Val Pro Asp Pro Thr Ala Ala Gly Tyr Gln Ala Val Pro Leu
    770                 775                 780
Pro Arg Gln His Asn Asn Ser Gly Phe Val Gly Tyr Met Gly Pro Thr
785                 790                 795                 800
Met Arg Glu Gly Gln Pro Tyr Pro Ala Asn Tyr Pro Tyr Pro Leu Ile
                805                 810                 815
Gly Ala Thr Ala Val Pro Ala Ile Thr Gln Lys Lys Phe Leu Cys Asp
            820                 825                 830
Arg Val Met Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly
        835                 840                 845
Ala Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala Asn Ser Ala His
    850                 855                 860
Ala Leu Asp Met Thr Phe Glu Val Asp Pro Met Asn Glu Pro Thr Leu
865                 870                 875                 880
Leu Tyr Met Leu Phe Glu Val Phe Asp Val Val Arg Val His Gln Pro
                885                 890                 895
His Arg Gly Ile Ile Glu Ala Val Tyr Leu Arg Thr Pro Phe Ser Ala
            900                 905                 910
Gly Asn Ala Thr Thr
        915
<210>37
<211>533
<212>PRT
<213>猿猴腺病毒SV-39
<400>37
Met Lys Arg Ala Lys Val Glu Glu Gly Phe Asn Pro Val Tyr Pro Tyr
1               5                   10                  15
Gly Tyr Ser Thr Pro Thr Asp Val Ala Pro Pro Phe Val Ala Ser Asp
             20                  25                  30
Gly Leu Gln Glu Asn Pro Pro Gly Val Leu Ser Leu LysIle Ser Lys
        35                  40                  45
Pro Leu Thr Phe Asn Ala Ser Lys Ala Leu Ser Leu Ala Ile Gly Pro
    50                  55                  60
Gly Leu Lys Ile Gln Asp Gly Lys Leu Val Gly Glu Gly Gln Ala Ile
65                  70                  75                  80
Leu Ala Asn Leu Pro Leu Gln Ile Thr Asn Asn Thr Ile Ser Leu Arg
                85                  90                  95
Phe Gly Asn Thr Leu Ala Leu Asn Asp Asn Asn Glu Leu Gln Thr Thr
            100                 105                 110
Leu Lys Ser Ser Ser Pro Leu Lys Ile Thr Asp Gln Thr Leu Ser Leu
        115                 120                 125
Asn Ile Gly Asp Ser Leu Ala Ile Lys Asp Asp Lys Leu Glu Ser Ala
    130                 135                 140
Leu Gln Ala Thr Leu Pro Leu Ser Ile Ser Asn Asn Thr Ile Ser Leu
145                 150                 155                 160
Asn Val Gly Thr Gly Leu Thr Ile Asn Gly Asn Val Leu Gln Ala Val
                165                 170                 175
Pro Leu Asn Ala Leu Ser Pro Leu Thr Ile Ser Asn Asn Asn Ile Ser
            180                 185                 190
Leu Arg Tyr Gly Ser Ser Leu Thr Val Leu Asn Asn Glu Leu Gln Ser
        195                 200                 205
Asn Leu Thr Val His Ser Pro Leu Lys Leu Asn Ser Asn Asn Ser Ile
    210                 215                 220
Ser Leu Asn Thr Leu Ser Pro Phe Arg Ile Glu Asn Gly Phe Leu Thr
225                 230                 235                 240
Leu Tyr Leu Gly Thr Lys Ser Gly Leu Leu Val Gln Asn Ser Gly Leu
                245                 250                 255
Lys Val Gln Ala Gly Tyr Gly Leu Gln Val Thr Asp Thr Asn Ala Leu
            260                 265                 270
Thr Leu Arg Tyr Leu Ala Pro Leu Thr Ile Pro Asp Ser Gly Ser Glu
        275                 280                 285
Gln Gly Ile Leu Lys Val Asn Thr Gly Gln Gly Leu Ser Val Asn Gln
    290                 295                 300
Ala Gly Ala Leu Glu Thr Ser Leu Gly Gly Gly Leu Lys Tyr Ala Asp
305                 310                 315                 320
Asn Lys Ile Thr Phe Asp Thr Gly Asn Gly Leu Thr Leu Ser Glu Asn
                325                 330                 335
Lys Leu Ala Val Ala Ala Gly Ser Gly Leu Thr Phe Arg Asp Gly Ala
            340                 345                 350
Leu Val Ala Thr Gly Thr Ala Phe Thr Gln Thr Leu Trp Thr Thr Ala
        355                 360                 365
Asp Pro Ser Pro Asn Cys Thr Ile Ile Gln Asp Arg Asp Thr Lys Phe
    370                 375                 380
Thr Leu Ala Leu Thr Ile Ser Gly Ser Gln Val Leu Gly Thr Val Ser
385                 390                 395                 400
Ile Ile Gly Val Lys Gly Pro Leu Ser Ser Ser Ile Pro Ser Ala Thr
                405                 410                 415
Val Thr Val Gln Leu Asn Phe Asp Ser Asn Gly Ala Leu Leu Ser Ser
            420                 425                 430
Ser Ser Leu Lys Gly Tyr Trp Gly Tyr Arg Gln Gly Pro Ser Ile Asp
        435                 440                 445
Pro Tyr Pro Ile Ile Asn Ala Leu Asn Phe Met Pro Asn Ser Leu Ala
    450                 455                 460
Tyr Pro Pro Gly Gln Glu Ile Gln Ala Lys Cys Asn Met Tyr Val Ser
465                 470                 475                 480
Thr Phe Leu Arg Gly Asn Pro Gln Arg Pro Ile Val Leu Asn Ile Thr
                485                 490                 495
Phe Asn Asn Gln Thr Ser Gly Phe Ser Ile Arg Phe Thr Trp Thr Asn
            500                 505                 510
Leu Thr Thr Gly Glu Ala Phe Ala Met Pro Pro Cys Thr Phe Ser Tyr
        515                 520                 525
Ile Ala Glu Gln Gln
    530
<210>38
<211>50
<212>DNA
<213>人工序列
<220>
<223>寡聚体SV25T
<400>38
aatttaaata cgtagcgcac tagtcgcgct aagcgcggat atcatttaaa    50
<210>39
<211>49
<212>DNA
<213>人工序列
<220>
<223>寡聚体SV25B
<400>39
tatttaaatg atatccgcgc ttaagcgcga ctagtgcgct acgtattta     49

Claims (15)

1.一种腺病毒载体,它包含腺病毒衣壳,
所述衣壳包含猿猴腺病毒Pan7蛋白,所述猿猴腺病毒Pan7蛋白具有SEQ IDNO:11的氨基酸序列,所述衣壳还包含一个或多个选自纤维蛋白和五邻体蛋白的蛋白,所述载体还包含在所述衣壳中的5’腺病毒倒置末端重复序列;异源基因,该基因与指导所述基因在宿主细胞中表达的序列操作性相连;和3’腺病毒倒置末端重复序列。
2.根据权利要求1所述的腺病毒载体,其中所述腺病毒衣壳包含SEQ ID NO:12所示的Pan 7纤维蛋白,以及SEQ ID NO:10所示的Pan 7五邻体蛋白。
3.根据权利要求1或2所述的腺病毒载体,其中腺病毒载体还包含其他腺病毒序列。
4.根据权利要求1或2所述的腺病毒载体,其中所述载体缺少部分或全部E1基因。
5.根据权利要求1所述的腺病毒载体,其中该异源基因编码免疫原。
6.根据权利要求1所述的腺病毒载体,其中该异源基因编码治疗性分子。
7.根据权利要求1或2所述的腺病毒载体,其中所述衣壳包含异源纤维蛋白和异源五邻体蛋白。
8.根据权利要求7所述的腺病毒载体,其中所述衣壳包含选自SEQ ID NO:19所示的Pan6序列和SEQ ID NO:21所示的Pan5序列的蛋白。
9.权利要求1或2的腺病毒载体在制备药物中的用途。
10.一种组合物,它包含权利要求5或6所述的腺病毒载体,以及药学上可接受的载体。
11.一种宿主细胞,它包含权利要求1或2所述的腺病毒载体。
12.根据权利要求11所述的宿主细胞,其中所述宿主细胞被所述腺病毒载体稳定地转化。
13.根据权利要求11或12所述的宿主细胞,其中所述宿主细胞从所述腺病毒载体表达一种或多种腺病毒基因产物,所述腺病毒基因产物选自E1a、E1b、E2a和E4 ORF6。
14.根据权利要求11所述的宿主细胞,其中所述宿主细胞被一核酸分子稳定地转化,所述核酸分子包含猿猴腺病毒倒置末端重复序列。
15.一种产生所选基因产物的方法,该方法包括用权利要求1-9任一所述的腺病毒载体感染哺乳动物细胞,在合适的条件下培育所述细胞,然后从所述细胞培养物回收表达的基因产物。
CN02823023XA 2001-11-21 2002-11-20 猿猴腺病毒的核酸和氨基酸序列,含有它们的载体以及用法 Expired - Fee Related CN1578678B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US33195101P 2001-11-21 2001-11-21
US60/331,951 2001-11-21
US36679802P 2002-03-22 2002-03-22
US60/366,798 2002-03-22
PCT/US2002/033645 WO2003046124A2 (en) 2001-11-21 2002-11-20 Simian adenovirus nucleic acid and amino acid sequences, vectors containing same, and methods of use

Publications (2)

Publication Number Publication Date
CN1578678A CN1578678A (zh) 2005-02-09
CN1578678B true CN1578678B (zh) 2010-05-26

Family

ID=26987985

Family Applications (1)

Application Number Title Priority Date Filing Date
CN02823023XA Expired - Fee Related CN1578678B (zh) 2001-11-21 2002-11-20 猿猴腺病毒的核酸和氨基酸序列,含有它们的载体以及用法

Country Status (19)

Country Link
US (5) US7247472B2 (zh)
EP (4) EP1453543B1 (zh)
JP (9) JP2005511035A (zh)
KR (1) KR100987360B1 (zh)
CN (1) CN1578678B (zh)
AU (1) AU2002365366B2 (zh)
BR (1) BR0214350A (zh)
CA (3) CA2990322A1 (zh)
CO (1) CO5590973A2 (zh)
HU (3) HU230364B1 (zh)
IL (5) IL161584A0 (zh)
MX (2) MXPA04004876A (zh)
NO (3) NO332692B1 (zh)
NZ (3) NZ550416A (zh)
PH (1) PH12016500338A1 (zh)
PL (1) PL209133B1 (zh)
SG (2) SG2013034475A (zh)
WO (1) WO2003046124A2 (zh)
ZA (1) ZA200403117B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103930551A (zh) * 2011-05-25 2014-07-16 Isis创新有限公司 猴腺病毒和杂合腺病毒载体

Families Citing this family (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040136963A1 (en) * 2001-06-22 2004-07-15 The Trustees Of The University Of Pennsylvania Simian adenovirus vectors and methods of use
EP1409748B1 (en) 2001-06-22 2011-10-26 The Trustees of The University of Pennsylvania Recombinant Adenoviruses comprising simian adenovirus proteins and uses thereof.
CA2990322A1 (en) * 2001-11-21 2003-06-05 The Trustees Of The University Of Pennsylvania Simian adenovirus nucleic acid and amino acid sequences, vectors containing same, and methods of use
AU2003285932A1 (en) 2002-10-23 2004-05-13 Glaxosmithkline Biologicals S.A. Methods for vaccinating against malaria
US7291498B2 (en) 2003-06-20 2007-11-06 The Trustees Of The University Of Pennsylvania Methods of generating chimeric adenoviruses and uses for such chimeric adenoviruses
WO2005001103A2 (en) * 2003-06-20 2005-01-06 The Trustees Of The University Of Pennsylvania Methods of generating chimeric adenoviruses and uses for such chimeric adenoviruses
EP1711518B1 (en) * 2004-01-23 2009-11-18 Istituto di Richerche di Biologia Molecolare P. Angeletti S.p.A. Chimpanzee adenovirus vaccine carriers
EP1742668B1 (en) * 2004-04-28 2011-02-09 The Trustees of The University of Pennsylvania Sequential delivery of immunogenic molecules via adenovirus and adeno-associated virus-mediated administrations
ES2442225T3 (es) * 2004-04-28 2014-02-10 The Trustees Of The University Of Pennsylvania Régimen de inmunización con cebado de adenovirus suprimido en E4 y potenciación de adenovirus suprimido en E1
CA2567741A1 (en) * 2004-05-25 2006-03-30 Chimeracore, Inc. Self-assembling nanoparticle drug delivery system
GB0417494D0 (en) 2004-08-05 2004-09-08 Glaxosmithkline Biolog Sa Vaccine
CN101090974B (zh) 2004-11-16 2011-05-11 克鲁塞尔荷兰公司 包含重组病毒载体的多价疫苗
EP1863520B1 (en) * 2005-03-08 2014-12-31 Aptose Biosciences Inc. Use of interleukin 17e for the treatment of cancer
GB0513421D0 (en) 2005-06-30 2005-08-03 Glaxosmithkline Biolog Sa Vaccines
US8067011B2 (en) * 2006-04-07 2011-11-29 Chimeros, Inc. Compositions and methods for treating B-cell malignancies
WO2008010864A2 (en) * 2006-04-28 2008-01-24 The Trustees Of The University Of Pennsylvania Modified adenovirus hexon protein and uses thereof
WO2008027394A2 (en) 2006-08-28 2008-03-06 The Wistar Institute Of Anatomy And Biology Constructs for enhancing immune responses
EP2998316B1 (en) 2007-03-02 2019-06-12 GlaxoSmithKline Biologicals S.A. Novel method and compositions
US20090226525A1 (en) * 2007-04-09 2009-09-10 Chimeros Inc. Self-assembling nanoparticle drug delivery system
PT2220241T (pt) * 2007-11-28 2016-12-26 Univ Pennsylvania Adenovírus compreendendo uma proteína hexão da cápside do adenovírus e símio sadv-39 e suas utilizações
LT2220242T (lt) * 2007-11-28 2017-04-10 The Trustees Of The University Of Pennsylvania Simian pošeimio b adenovirusai sadv-28,27,-29,-32,-33 ir -35 ir jų panaudojimas
JP5758124B2 (ja) * 2007-11-28 2015-08-05 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア サルサブファミリーCアデノウイルスSAdV−40、−31および−34ならびにそれらの用途
AU2014203073B2 (en) * 2007-11-28 2016-07-07 The Trustees Of The University Of Pennsylvania Simian E adenovirus SAdV-30
WO2009136977A2 (en) 2008-03-04 2009-11-12 The Trustees Of The University Of Pennsylvania Simian adenoviruses sadv-36,-42.1, -42.2, and -44 and uses thereof
US9217155B2 (en) 2008-05-28 2015-12-22 University Of Massachusetts Isolation of novel AAV'S and uses thereof
US8940290B2 (en) * 2008-10-31 2015-01-27 The Trustees Of The University Of Pennsylvania Simian adenoviruses SAdV-43, -45, -46, -47, -48, -49, and -50 and uses thereof
HRP20181377T1 (hr) * 2009-02-02 2018-10-19 Glaxosmithkline Biologicals Sa Nukleinskokiselinski i aminokiselinski sljedovi majmunskog adenovirusa, vektori koji ih sadrže, te njihova upotreba
WO2010085984A1 (en) * 2009-02-02 2010-08-05 Okairos Ag Simian adenovirus nucleic acid- and amino acid-sequences, vectors containing same, and uses thereof
SG172935A1 (en) * 2009-02-02 2011-08-29 Okairos Ag Simian adenovirus nucleic acid- and amino acid-sequences, vectors containing same, and uses thereof
CN102575284A (zh) 2009-03-17 2012-07-11 MDx健康公司 改进的基因表达检测
WO2010120874A2 (en) 2009-04-14 2010-10-21 Chimeros, Inc. Chimeric therapeutics, compositions, and methods for using same
US8734809B2 (en) 2009-05-28 2014-05-27 University Of Massachusetts AAV's and uses thereof
EP2435559A1 (en) 2009-05-29 2012-04-04 The Trustees Of The University Of Pennsylvania Simian adenovirus 41 and uses thereof
WO2011057254A2 (en) * 2009-11-09 2011-05-12 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Simian adenoviral vector-based vaccines
KR20120139672A (ko) 2009-11-09 2012-12-27 젠벡, 인코포레이티드 원숭이 아데노바이러스 벡터의 증식 방법
CN102844329B (zh) * 2010-04-14 2016-01-20 财团法人牧岩生命工学研究所 分离自猿腺病毒血清型19的六邻体、其高变区和使用其的嵌合型腺病毒
ES2698203T3 (es) 2010-04-23 2019-02-01 Univ Massachusetts Vectores de AAV que se dirigen al SNC y métodos de uso de los mismos
CA2833912C (en) 2010-04-23 2021-09-21 University Of Massachusetts Aav-based treatment of cholesterol-related disorders
CA3050894C (en) 2010-04-23 2022-10-18 University Of Massachusetts Multicistronic expression constructs
DK3333265T3 (da) * 2010-05-14 2020-04-27 Univ Oregon Health & Science Rekombinante hcmv- og rhcmv-vektorer der koder for et heterologt antigen isoleret fra hepatitis b-virus og anvendelser deraf
WO2012021730A2 (en) 2010-08-11 2012-02-16 Genvec, Inc. Respiratory syncytial virus (rsv) vaccine
CN103118702A (zh) 2010-09-20 2013-05-22 克鲁塞尔荷兰公司 活动性结核病的治疗性接种
AU2011332025B2 (en) 2010-11-23 2015-06-25 The Trustees Of The University Of Pennsylvania Subfamily E simian adenoviruses A1321, A1325, A1295, A1309 and A1322 and uses thereof
CA2823066A1 (en) 2010-12-27 2012-07-05 Alexion Pharma International Sarl Compositions comprising natriuretic peptides and methods of use thereof
WO2012089231A1 (en) * 2010-12-30 2012-07-05 Okairòs Ag Paramyxovirus vaccines
US9267112B2 (en) 2011-05-10 2016-02-23 The Regents Of The University Of California Adenovirus isolated from Titi Monkeys
US10221218B2 (en) 2011-05-10 2019-03-05 The Regents Of The University Of California Adenovirus isolated from titi monkeys
TWI575070B (zh) 2011-07-12 2017-03-21 傳斯堅公司 Hbv聚合酶突變體
JP2014527072A (ja) 2011-09-09 2014-10-09 バイオメド リアルティー, エル.ピー. ウイルスタンパク質の集合を制御するための方法および組成物
WO2013036791A2 (en) * 2011-09-09 2013-03-14 Beth Israel Deaconess Medical Center, Inc. Modified adenoviral vectors and methods of treatment using same
TW201321016A (zh) 2011-09-29 2013-06-01 Transgene Sa 免疫療法組成物及用於治療c型肝炎病毒感染之療程(二)
TW201318637A (zh) 2011-09-29 2013-05-16 Transgene Sa 免疫療法組成物及用於治療c型肝炎病毒感染之療程(一)
CA2850627C (en) * 2011-10-05 2024-05-21 Genvec, Inc. Affenadenovirus (gorilla) or adenoviral vectors and methods of use
CA2852874A1 (en) 2011-10-19 2013-04-25 Alexion Pharma Holding Compositions comprising alkaline phosphatase and/or natriuretic peptide and methods of use thereof
WO2013063019A1 (en) 2011-10-28 2013-05-02 The Wistar Institute Of Anatomy And Biology Methods and compositions for enhancing the therapeutic effect of anti-tumor t cells
WO2013082268A1 (en) 2011-11-30 2013-06-06 The Wistar Institute Of Anatomy And Biology Methods and compositions for regulation of cell aging, carcinogenesis, and reprogramming
CN105473723A (zh) 2012-05-18 2016-04-06 宾夕法尼亚大学托管会 亚家族e猿腺病毒a1302、a1320、a1331和a1337及其用途
US9861693B2 (en) 2012-09-07 2018-01-09 Emory University HIV immune stimulating compositions comprising recombinantly expressed pili on bacteria and methods related thereto
WO2014047261A1 (en) * 2012-09-19 2014-03-27 Beth Israel Deaconess Medical Center, Inc. Viruses associated with immunodeficiency and enteropathy and methods using same
DK2920313T3 (da) * 2012-11-16 2019-09-02 Beth Israel Deaconess Medical Ct Inc Rekombinante adenovira og anvendelse deraf
CN105189755A (zh) * 2013-01-15 2015-12-23 加利福尼亚大学董事会 腺病毒及其用途
US9624510B2 (en) 2013-03-01 2017-04-18 The Wistar Institute Adenoviral vectors comprising partial deletions of E3
WO2014153204A1 (en) 2013-03-14 2014-09-25 Salk Institute For Biological Studies Oncolytic adenovirus compositions
US9402888B2 (en) 2013-03-14 2016-08-02 The Wistar Institute Of Anatomy And Biology Methods and compositions for treating cancer
KR102196884B1 (ko) * 2013-11-01 2020-12-30 화이자 인코포레이티드 전립선-연관 항원의 발현을 위한 벡터
EP3151866B1 (en) 2014-06-09 2023-03-08 Voyager Therapeutics, Inc. Chimeric capsids
EP3198009B1 (en) 2014-09-24 2021-09-08 Salk Institute for Biological Studies Oncolytic tumor viruses and methods of use
EP3200815B1 (en) 2014-10-02 2021-03-03 The Wistar Institute Of Anatomy And Biology Methods and compositions for treating cancer
CA2963293A1 (en) 2014-10-06 2016-04-14 The Trustees Of The University Of Pennsylvania Compositions and methods for isolation of circulating tumor cells (ctc)
AU2015335923B2 (en) 2014-10-21 2021-04-29 University Of Massachusetts Recombinant AAV variants and uses thereof
SG11201703148TA (en) 2014-11-05 2017-05-30 Voyager Therapeutics Inc Aadc polynucleotides for the treatment of parkinson's disease
CN107207556B (zh) 2014-11-14 2020-12-08 沃雅戈治疗公司 调节性多核苷酸
CN114717264A (zh) 2014-11-14 2022-07-08 沃雅戈治疗公司 治疗肌萎缩性侧索硬化(als)的组合物和方法
WO2016094783A1 (en) 2014-12-12 2016-06-16 Voyager Therapeutics, Inc. Compositions and methods for the production of scaav
ES3011733T3 (en) 2015-02-13 2025-04-08 Transgene Immunotherapeutic vaccine and antibody combination therapy
WO2016131945A1 (en) 2015-02-20 2016-08-25 Transgene Sa Combination product with autophagy modulator
WO2016198621A1 (en) * 2015-06-12 2016-12-15 Glaxosmithkline Biologicals Sa Adenovirus polynucleotides and polypeptides
EP3384035A4 (en) 2015-12-02 2019-08-07 Voyager Therapeutics, Inc. ASSAYS FOR THE DETECTION OF AAV-NEUTRALIZING ANTIBODIES
EP3416668A4 (en) 2016-02-18 2020-02-19 The Wistar Institute Of Anatomy And Biology METHODS AND COMPOSITIONS FOR THE TREATMENT OF MELANOMA
CN108699566B (zh) 2016-02-23 2023-06-30 萨克生物研究学院 对病毒动力学影响最小的治疗性腺病毒中的外源基因表达
JP7054527B2 (ja) 2016-02-23 2022-04-14 ソーク インスティテュート フォー バイオロジカル スタディーズ アデノウイルスの複製動態を測定するための高スループットアッセイ
EP3448874A4 (en) 2016-04-29 2020-04-22 Voyager Therapeutics, Inc. COMPOSITIONS FOR TREATING A DISEASE
EP3448987A4 (en) 2016-04-29 2020-05-27 Voyager Therapeutics, Inc. COMPOSITIONS FOR TREATING A DISEASE
CA3023022A1 (en) 2016-05-04 2017-11-09 Transgene Sa Combination therapy with cpg tlr9 ligand
IL297576B2 (en) 2016-05-18 2024-02-01 Voyager Therapeutics Inc Compositions and methods of treating huntington's disease
KR102652994B1 (ko) 2016-05-18 2024-04-01 보이저 테라퓨틱스, 인크. 조절성 폴리뉴클레오티드
SG11201900808SA (en) * 2016-08-01 2019-02-27 Wistar Inst Compositions and methods of replication deficient adenoviral vectors for vaccine applications
AU2017313917B2 (en) 2016-08-18 2023-12-21 The Regents Of The University Of California CRISPR-Cas genome engineering via a modular AAV delivery system
EP3506817A4 (en) 2016-08-30 2020-07-22 The Regents of The University of California Methods for biomedical targeting and delivery and devices and systems for practicing the same
EP3522920A2 (en) 2016-10-10 2019-08-14 Transgene SA Immunotherapeutic product and mdsc modulator combination therapy
KR20190075964A (ko) 2016-10-13 2019-07-01 유니버시티 오브 매사추세츠 Aav 캡시드 설계
CA3045892A1 (en) 2016-12-12 2018-06-21 Salk Institute For Biological Studies Tumor-targeting synthetic adenoviruses and uses thereof
CN111108198A (zh) 2017-05-05 2020-05-05 沃雅戈治疗公司 治疗亨廷顿病的组合物和方法
EP3618839A4 (en) 2017-05-05 2021-06-09 Voyager Therapeutics, Inc. Compositions and methods of treating amyotrophic lateral sclerosis (als)
JOP20190269A1 (ar) 2017-06-15 2019-11-20 Voyager Therapeutics Inc بولي نوكليوتيدات aadc لعلاج مرض باركنسون
AU2018302016A1 (en) 2017-07-17 2020-02-06 The Regents Of The University Of California Trajectory array guide system
EP3662060A2 (en) 2017-08-03 2020-06-10 Voyager Therapeutics, Inc. Compositions and methods for delivery of aav
WO2019067840A1 (en) 2017-09-29 2019-04-04 Voyager Therapeutics, Inc. RESTRICTING CENTRAL AND PERIPHERAL NEUROLOGICAL PHENOTYPE FROM FRIEDREICH ATAXIA BY INTRAVENOUS ADMINISTRATION
CA3077426A1 (en) 2017-10-16 2019-04-25 Voyager Therapeutics, Inc. Treatment of amyotrophic lateral sclerosis (als)
EP4454654A3 (en) 2017-10-16 2025-02-19 Voyager Therapeutics, Inc. Treatment of amyotrophic lateral sclerosis (als)
US11773142B2 (en) 2017-12-11 2023-10-03 Beth Israel Deaconess Medical Center, Inc. Recombinant adenoviruses and uses thereof
WO2019199859A1 (en) 2018-04-09 2019-10-17 Salk Institute For Biological Studies Oncolytic adenovirus compositions with enhanced replication properties
CA3099306A1 (en) 2018-05-15 2019-11-21 Voyager Therapeutics, Inc. Compositions and methods for the treatment of parkinson's disease
EP3807404A1 (en) 2018-06-13 2021-04-21 Voyager Therapeutics, Inc. Engineered 5' untranslated regions (5' utr) for aav production
KR20210052443A (ko) 2018-07-17 2021-05-10 뉴로마이언 주식회사 Igf-1 이형체를 발현하는 dna 컨스트럭트를 이용한 신경병증의 치료
MX2021000810A (es) 2018-07-24 2021-04-28 Voyager Therapeutics Inc Sistemas y metodos para producir formulaciones de terapia genetica.
US12281321B2 (en) 2018-09-28 2025-04-22 Voyager Therapeutics, Inc. Frataxin expression constructs having engineered promoters and methods of use thereof
TW202035689A (zh) 2018-10-04 2020-10-01 美商航海家醫療公司 測量病毒載體粒子的效價及強度之方法
EP3861107A1 (en) 2018-10-05 2021-08-11 Voyager Therapeutics, Inc. Engineered nucleic acid constructs encoding aav production proteins
EP3867389A1 (en) 2018-10-15 2021-08-25 Voyager Therapeutics, Inc. Expression vectors for large-scale production of raav in the baculovirus/sf9 system
KR20210130158A (ko) 2019-01-31 2021-10-29 오레곤 헬스 앤드 사이언스 유니버시티 Aav 캡시드의 전사 의존적 유도 진화를 사용하는 방법
US20220211835A1 (en) * 2019-04-17 2022-07-07 The Wistar Institute Replication Deficient Adenoviral Vectors for HIV Vaccine Applications
TW202217002A (zh) 2020-07-13 2022-05-01 法商傳斯堅公司 免疫抑制之治療
MX2023008826A (es) 2021-02-01 2023-09-15 Regenxbio Inc Terapia génica para lipofuscinosis neuronal ceroidea.
CN112831524B (zh) * 2021-02-20 2023-06-13 苏州相奕生物技术有限公司 人工改造的重组腺病毒载体、由其包装的病毒及其应用
CA3213066A1 (en) 2021-03-29 2022-10-06 Soo-Ok Kim Recombinant chimeric adenoviral vector substituted by knob gene of chimpanzee adenovirus serotype 6, and application thereof
WO2022218997A1 (en) 2021-04-12 2022-10-20 Centre National De La Recherche Scientifique (Cnrs) Novel universal vaccine presenting system
KR102874372B1 (ko) * 2022-03-03 2025-10-23 (주)진매트릭스 사스-코로나바이러스-2 감염증 예방용 재조합 발현 벡터 및 그 응용
WO2023213764A1 (en) 2022-05-02 2023-11-09 Transgene Fusion polypeptide comprising an anti-pd-l1 sdab and a member of the tnfsf

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8607679D0 (en) 1986-03-27 1986-04-30 Winter G P Recombinant dna product
IL162181A (en) 1988-12-28 2006-04-10 Pdl Biopharma Inc A method of producing humanized immunoglubulin, and polynucleotides encoding the same
US5240846A (en) 1989-08-22 1993-08-31 The Regents Of The University Of Michigan Gene therapy vector for cystic fibrosis
US6174666B1 (en) 1992-03-27 2001-01-16 The United States Of America As Represented By The Department Of Health And Human Services Method of eliminating inhibitory/instability regions from mRNA
CA2200869A1 (en) 1994-10-19 1996-05-02 Bruce C. Trapnell Gene therapy involving concurrent and repeated administration of adenoviruses and immunosuppressive agents
US5856152A (en) 1994-10-28 1999-01-05 The Trustees Of The University Of Pennsylvania Hybrid adenovirus-AAV vector and methods of use therefor
CA2203809C (en) 1994-10-28 2008-06-03 James M. Wilson Recombinant adenovirus and methods of use thereof
US6127525A (en) * 1995-02-21 2000-10-03 Cornell Research Foundation, Inc. Chimeric adenoviral coat protein and methods of using same
US5770442A (en) * 1995-02-21 1998-06-23 Cornell Research Foundation, Inc. Chimeric adenoviral fiber protein and methods of using same
AU6261696A (en) * 1995-06-05 1996-12-24 Trustees Of The University Of Pennsylvania, The A replication-defective adenovirus human type 5 recombinant as a vaccine carrier
US5698202A (en) * 1995-06-05 1997-12-16 The Wistar Institute Of Anatomy & Biology Replication-defective adenovirus human type 5 recombinant as a rabies vaccine carrier
JP2001500015A (ja) 1996-09-06 2001-01-09 トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア T7ポリメラーゼを利用する組換えアデノ随伴ウイルスの誘導可能な製造方法
WO1998010087A1 (en) 1996-09-06 1998-03-12 Trustees Of The University Of Pennsylvania Chimpanzee adenovirus vectors
US5922315A (en) 1997-01-24 1999-07-13 Genetic Therapy, Inc. Adenoviruses having altered hexon proteins
US5891994A (en) 1997-07-11 1999-04-06 Thymon L.L.C. Methods and compositions for impairing multiplication of HIV-1
WO1999014354A1 (en) 1997-09-19 1999-03-25 The Trustees Of The University Of The Pennsylvania Methods and vector constructs useful for production of recombinant aav
JP2001517454A (ja) 1997-09-19 2001-10-09 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア 組換えアデノ随伴ウイルスの産生に有用な方法および細胞株
GB9720585D0 (en) 1997-09-26 1997-11-26 Smithkline Beecham Biolog Vaccine
ATE286138T1 (de) 1998-03-20 2005-01-15 Univ Pennsylvania Zusammensetzungen und verfahren zur helfer-freien herstellung von rekombinante adeno-assoziierten viren
US20030017138A1 (en) * 1998-07-08 2003-01-23 Menzo Havenga Chimeric adenoviruses
US6210663B1 (en) * 1998-08-20 2001-04-03 The Wistar Institute Of Anatomy And Biology Methods of augmenting mucosal immunity through systemic priming and mucosal boosting
US6258595B1 (en) 1999-03-18 2001-07-10 The Trustees Of The University Of Pennsylvania Compositions and methods for helper-free production of recombinant adeno-associated viruses
JP2003530307A (ja) 1999-07-06 2003-10-14 メルク・アンド・カンパニー・インコーポレーテッド gag遺伝子保有アデノウイルスHIVワクチン
CA2398611A1 (en) 2000-01-31 2001-08-02 Smithkline Beecham Biologicals S.A. Vaccine for the prophylactic or therapeutic immunization against hiv
AU2001234981A1 (en) 2000-02-09 2001-08-20 Genvec, Inc. Adenoviral capsid containing chimeric protein ix
US20040136963A1 (en) 2001-06-22 2004-07-15 The Trustees Of The University Of Pennsylvania Simian adenovirus vectors and methods of use
WO2003000283A1 (en) * 2001-06-22 2003-01-03 The Wistar Institute Of Anatomy And Biology Methods of inducing a cytotoxic immune response and recombinant simian adenovirus compositions useful therein
EP1409748B1 (en) * 2001-06-22 2011-10-26 The Trustees of The University of Pennsylvania Recombinant Adenoviruses comprising simian adenovirus proteins and uses thereof.
CA2990322A1 (en) * 2001-11-21 2003-06-05 The Trustees Of The University Of Pennsylvania Simian adenovirus nucleic acid and amino acid sequences, vectors containing same, and methods of use
AU2003285932A1 (en) 2002-10-23 2004-05-13 Glaxosmithkline Biologicals S.A. Methods for vaccinating against malaria
US7291498B2 (en) 2003-06-20 2007-11-06 The Trustees Of The University Of Pennsylvania Methods of generating chimeric adenoviruses and uses for such chimeric adenoviruses
WO2005001103A2 (en) 2003-06-20 2005-01-06 The Trustees Of The University Of Pennsylvania Methods of generating chimeric adenoviruses and uses for such chimeric adenoviruses
EP1742668B1 (en) * 2004-04-28 2011-02-09 The Trustees of The University of Pennsylvania Sequential delivery of immunogenic molecules via adenovirus and adeno-associated virus-mediated administrations
US20070218536A1 (en) * 2004-04-28 2007-09-20 Guangping Gao Polyvalent Viral Vectors and a System for Production Thereof
ES2442225T3 (es) * 2004-04-28 2014-02-10 The Trustees Of The University Of Pennsylvania Régimen de inmunización con cebado de adenovirus suprimido en E4 y potenciación de adenovirus suprimido en E1
AU2006245920A1 (en) 2005-05-12 2006-11-16 Glaxo Group Limited Vaccine composition
WO2008010864A2 (en) * 2006-04-28 2008-01-24 The Trustees Of The University Of Pennsylvania Modified adenovirus hexon protein and uses thereof
WO2008009652A2 (en) 2006-07-18 2008-01-24 Glaxosmithkline Biologicals S.A. Vaccines for malaria
EP2998316B1 (en) 2007-03-02 2019-06-12 GlaxoSmithKline Biologicals S.A. Novel method and compositions
US9603035B2 (en) 2011-10-13 2017-03-21 Telefonaktiebolaget L M Ericsson Method and node related to channel estimation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
US-6083716-A 2000.07.04
US-6127525-A 2000.10.03

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103930551A (zh) * 2011-05-25 2014-07-16 Isis创新有限公司 猴腺病毒和杂合腺病毒载体

Also Published As

Publication number Publication date
US7247472B2 (en) 2007-07-24
NO20120337L (no) 2004-05-26
HU230488B1 (hu) 2016-08-29
NO20042191L (no) 2004-05-26
KR100987360B1 (ko) 2010-10-12
EP1453543B1 (en) 2017-08-30
EP1453543A2 (en) 2004-09-08
HU230364B1 (hu) 2016-03-29
SG165153A1 (en) 2010-10-28
US8105574B2 (en) 2012-01-31
SG2013034475A (en) 2016-10-28
NZ532383A (en) 2007-03-30
US20140065105A1 (en) 2014-03-06
IL161584A0 (en) 2004-09-27
CN1578678A (zh) 2005-02-09
HUP0500987A2 (en) 2006-01-30
JP2015057052A (ja) 2015-03-26
EP3108899A1 (en) 2016-12-28
JP2013252144A (ja) 2013-12-19
JP2005511035A (ja) 2005-04-28
IL223344A (en) 2015-04-30
IL223344A0 (en) 2013-02-03
US20170119873A9 (en) 2017-05-04
PH12016500338A1 (en) 2018-03-26
US20050069866A1 (en) 2005-03-31
EP2286841A1 (en) 2011-02-23
EP2301582B1 (en) 2017-07-12
MXPA04004876A (es) 2004-07-30
US20150352203A1 (en) 2015-12-10
IL231502A0 (en) 2014-04-30
NO334512B1 (no) 2014-03-24
NZ550416A (en) 2008-06-30
ZA200403117B (en) 2005-03-30
US8603459B2 (en) 2013-12-10
IL230292A (en) 2016-08-31
AU2002365366B2 (en) 2007-05-10
WO2003046124A2 (en) 2003-06-05
PL373602A1 (en) 2005-09-05
HUP0500987A3 (en) 2008-05-28
CO5590973A2 (es) 2005-12-30
HU230365B1 (hu) 2016-03-29
CA2852277A1 (en) 2003-06-05
HUP1400619A2 (en) 2006-01-30
JP2017070292A (ja) 2017-04-13
MX351516B (es) 2017-10-17
NO20130590L (no) 2004-05-26
IL161584A (en) 2015-05-31
JP5715749B2 (ja) 2015-05-13
NO332692B1 (no) 2012-12-10
US20120093778A1 (en) 2012-04-19
NO335438B1 (no) 2014-12-15
CA2466431A1 (en) 2003-06-05
IL231502A (en) 2017-04-30
AU2002365366A1 (en) 2003-06-10
US9133483B2 (en) 2015-09-15
WO2003046124A3 (en) 2003-11-20
JP2017035110A (ja) 2017-02-16
US20080090281A1 (en) 2008-04-17
KR20040054796A (ko) 2004-06-25
NZ564586A (en) 2009-09-25
CA2990322A1 (en) 2003-06-05
JP2015057051A (ja) 2015-03-26
JP2009136296A (ja) 2009-06-25
CA2466431C (en) 2014-08-05
EP1453543A4 (en) 2006-12-06
JP2011055835A (ja) 2011-03-24
CA2852277C (en) 2018-02-20
JP2017035111A (ja) 2017-02-16
EP2301582A1 (en) 2011-03-30
PL209133B1 (pl) 2011-07-29
BR0214350A (pt) 2005-05-10

Similar Documents

Publication Publication Date Title
CN1578678B (zh) 猿猴腺病毒的核酸和氨基酸序列,含有它们的载体以及用法
US20040136963A1 (en) Simian adenovirus vectors and methods of use
CN1833027B (zh) 产生嵌合腺病毒的方法及这种嵌合腺病毒的用途
AU2017305176B2 (en) Compositions and methods of replication deficient adenoviral vectors for vaccine applications
ES2627288T3 (es) Portadores de vacuna de adenovirus de chimpancé
AU2011332025B2 (en) Subfamily E simian adenoviruses A1321, A1325, A1295, A1309 and A1322 and uses thereof
AU2019271972B2 (en) Adenovirus polynucleotides and polypeptides
KR102205908B1 (ko) 아데노바이러스 벡터
AU2008331906B2 (en) Simian E adenovirus SAdV-39
AU2018295421B2 (en) Non human great apes adenovirus nucleic acid- and amino acid-sequences, vectors containing same, and uses thereof
CA2528511A1 (en) Methods of generating chimeric adenoviruses and uses for such chimeric adenoviruses
TW202523847A (zh) 經修飾之腺病毒
CN108135991A (zh) 新型腺病毒
JP7698678B2 (ja) エプスタインバールウイルス抗原構築物
CN112805387A (zh) 用于制备病毒载体的组合物和方法
CN101213204A (zh) 丙型肝炎病毒核酸疫苗
KR20200066349A (ko) 복제 가능 아데노바이러스 벡터
CN113897388B (zh) 一种新型黑猩猩腺病毒载体及其构建方法和应用
NL2023464B1 (en) Oncolytic Non-human adenoviruses and uses thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: THE TRUSTEES OF THE UNIVERSITY OF PENNSYLVANIA

Free format text: FORMER NAME: THE TRUSTEES OF THE PENNSYLVANIA STATE UNIVERSITY

CP01 Change in the name or title of a patent holder

Address after: American Pennsylvania

Patentee after: The Trustees of the University of Pennsylvania

Address before: American Pennsylvania

Patentee before: The Trustees of The University of Pennsylvania

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100526

Termination date: 20181120