[go: up one dir, main page]

WO2000008164A2 - Thermostabiler in vitro-komplex mit polymeraseaktivität - Google Patents

Thermostabiler in vitro-komplex mit polymeraseaktivität Download PDF

Info

Publication number
WO2000008164A2
WO2000008164A2 PCT/DE1999/002480 DE9902480W WO0008164A2 WO 2000008164 A2 WO2000008164 A2 WO 2000008164A2 DE 9902480 W DE9902480 W DE 9902480W WO 0008164 A2 WO0008164 A2 WO 0008164A2
Authority
WO
WIPO (PCT)
Prior art keywords
protein
thermostable
fro
gavlimpfw
elongation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/DE1999/002480
Other languages
English (en)
French (fr)
Other versions
WO2000008164A3 (de
Inventor
Christian Kilger
Ingo Kober
Hartmut Voss
Gerd Moeckel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sygnis Pharma AG
Original Assignee
Lion Bioscience AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE19840771A external-priority patent/DE19840771A1/de
Application filed by Lion Bioscience AG filed Critical Lion Bioscience AG
Priority to EP99942776A priority Critical patent/EP1100923A2/de
Priority to JP2000563788A priority patent/JP2002522042A/ja
Priority to AU56171/99A priority patent/AU5617199A/en
Priority to DE19981494T priority patent/DE19981494D2/de
Priority to CA002338185A priority patent/CA2338185A1/en
Publication of WO2000008164A2 publication Critical patent/WO2000008164A2/de
Publication of WO2000008164A3 publication Critical patent/WO2000008164A3/de
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Definitions

  • the invention relates to a thermostable in vitro complex for template-dependent elongation of nucleic acids, a thermostable in vitro complex and DNA sequences and vectors coding therefor.
  • the invention further relates to the use of the complexes according to the invention in methods for template-dependent elongation of nucleic acids, such as PCR reactions, reverse transcription, DNA labeling or DNA sequencing, in which template-dependent DNA strand synthesis takes place in vitro.
  • the invention also relates to kits or reagent kits for carrying out the method according to the invention.
  • DNA polymerases belong to a group of enzymes that use single-stranded DNA as a template for the synthesis of a complementary DNA strand. These enzymes play an important role in nucleic acid metabolism, including the processes of DNA replication, repair and recombination. DNA polymerases have been identified in all cellular organisms, from bacterial to human cells, in many viruses and in bacteriophages (Kornberg, A. & Baker, TA (1991) DNA Replication WH Freeman, New York, NY).
  • the archaebacteria and the eubacteria are combined to form the group of prokaryotes, the organisms without a real cell nucleus, and the eukaryotes, the organisms with a real cell nucleus, are compared.
  • Common to many polymerases from a wide variety of organisms are often similarities in the amino acid sequence and similarities in structure (Wang, J., Sattar, AKMA; Wang, CC, Karam, JD, Königsberg, WH & Steitz, TA (1997) Crystal Structure of pol ⁇ familily replication DNA polymerase from bacteriophage RB69.Cell 89, 1087-1099).
  • Organisms like humans have a large number of DNA-dependent polymerases, but not all of them are responsible for DNA replication, but some also carry out DNA repair.
  • replicative DNA polymerases mostly consist of protein complexes with multiple units that replicate the chromosomes of cellular organisms and viruses.
  • a general property of these replicating polymerases is generally high processivity, that is, their ability to polymerize thousands of nucleotides without dissociating from the DNA template (Kornberg, A. & Baker, TA (1991) DNA Replication. WH Freeman, New York, NY).
  • the replication apparatus includes a variety of components. These include, inter alia, a) proteins having polymerase activity, b) proteins which are involved in the formation of a clamp structure, the clamp structure having the task, inter alia, of binding polymerase activity to its template, stabilizing the binding and thus the dissociation constant to be changed accordingly, c) proteins which load the clip onto the template, d) proteins which stabilize the template and optionally e) proteins which carry the polymerase to the template.
  • the proteins mentioned under b) form structures that are either open or closed, for example ring-shaped or semi-ring-shaped structures. Such structures can be formed by one or more species of proteins. It is possible that one of said protein species has polymerase activity.
  • the proteins responsible for the formation of these structures, if they have no polymerase activity, are hereinafter referred to as “glide clip proteins” or “clip proteins”. 5
  • the glide clip is often linked to an elongation protein via one or more other proteins, in other words coupled to the elongation protein.
  • a coupling protein is hereinafter referred to as a coupling protein or coupling subunit, where the coupling can optionally take place via a plurality of coupling proteins.
  • Elongation protein is to be understood herein to mean a protein or complex which has polymerase activity and which has at least one or more of the following properties: use of RNA as a template for the synthesis of DNA and / or RNA, use of DNA as a template for the synthesis of DNA and / or RNA, synthesis of RNA, synthesis of DNA, synthesis of nucleic acids from DNA and RNA, exonuclease activity in 5'-3 'direction and exonuclease activity in 3'-5' direction, strand displacement activity, thermostability and processivity or non-processivity.
  • PCNA eukaryotic proliferating cell nuclear antigen
  • such a protein complex consists of a large number of subunits, which is called Escherichia coli ⁇ complex in the Eubacterium and replication factor C (RF-C) in humans (Kelman, Z. &O'Donnell, M. (1994) DNA replication - enzymology and mechanisms. Curr. Opin. Gent. Dev. 4, 185-195).
  • the protein complex recognizes the 3 'end of the primer of the "primer-template duplex" and positions the glide clip around the DNA in the presence of ATP.
  • the phage expresses its own catalytic polymerase, the T7 polymerase, which is the gene product of the gene 5, which binds to a protein from the host Escherichia coli, the thioredoxin, and which enables highly processing DNA replication as a replicase (Proc. Natl. Acad. Sci. USA 1992 Oct 15; 89 (20): 9774-9778 Genetic analysis of the interaction between bacteriophage T7 DNA polymerase and Escherichia coli thioredoxin, Himawan JS, Richardson CC). Brackets are also formed here, but this bracket does not have the same structure as e.g. in the case of eukaryotic PCNA.
  • DNA polymerases are characterized, among other things, by two properties, their elongation rate, that is, the number of nucleotides that they can incorporate into a growing DNA strand per second, and their dissociation constant. If, after each incorporation step, the polymerase disassociates one of the nucleotides into the growing chain again (i.e. one elongation step occurs per binding event), then the processivity has the value 1 and the polymerase is not processive. This synthesis is called distributive.
  • the replication mode is called processive and can reach a value of several thousand (see also: Methods in Enzymology Volume 262, DNA Replication, Edited by JL Campbell, Academic press 1995, pp. 270-280)
  • thermostable enzymes previously used in these reactions have only a small amount
  • temperature-sensitive T7 polymerase associated with thioredoxin has a processivity of several thousand nucleotides .
  • thermostable DNA polymerase from Thermus thermophilus or Thermus aquaticus only have a processivity of about 50 nucleotides (Biochim Biophys Acta 1995 Nov 7; 1264 (2): 243-248 Inactivation of the 5'-3 'exonuclease of Thermus aquaticus DNA polymerase, Merkens LS, Bryan SK, Moses RE).
  • PCR Chain reaction
  • primers also called template
  • nucleotides nucleotides
  • a DNA polymerase of a corresponding buffer and suitable reaction conditions. This is usually based on a double-stranded DNA sequence from which a specific target area is to be amplified.
  • two primers are used, which are complementary to flanking regions of the target sequence on a partial strand of the DNA double strand.
  • the DNA double strands are first denatured, in particular thermally melted. After hybridization of the primers, an elongation takes place using the polymerase.
  • the PCR preferably uses a thermostable polymerase that survives the cyclic, thermal melting of the DNA strands. So Taq DNA polymerase is often used (US Patent 4,965,188). The processivity of the Taq DNA polymerase, however, is, as stated above, relatively low in comparison to the T7 polymerase.
  • DNA polymerases are also used in DNA sequence determination (Sanger et al., Proc. Natl. Acad. Sei., USA 74: 5463-5467 (1997)).
  • a T7 DNA polymerase is often used in Sanger sequencing (Tabor, S. and Richardson, CC. Proc. Natl. Acad. Sei., USA 86: 4076-4080 (1989)).
  • the cycle sequencing method was later developed (Murray, V. (1989) Nucleic Acids Res. 17, 8889), which does not require a single-stranded template and allows the initiation of the sequence reaction with relatively small amounts of template.
  • the polymerases used here can be, for example, the above-mentioned tag polymerase (US Patent 5,075, 216) or the polymerase from Thermotoga neapolitana (WO 96/10640) or other thermostable polymerases.
  • Newer methods combine the exponential amplification and the sequencing of a DNA fragment in one step, so that it is possible to sequence genomic DNA directly.
  • DEXAS method Nucleic Acids Res 1997 May 15; 25 (10): 2032-2034 Direct DNA sequence determination from total genomic DNA.Kilger C, Pääbo S, Biol. Chem. 1997 Feb; 378 (2 ): 99-105 Direct exponential amplification and sequencing (DEXAS) of genomic DNA.Kilger C, Pääbo S and DE 19653439.9 and DE
  • DNA polymerases are also used in the reverse transcription of RNA into DNA.
  • RNA serves as a template and the polymerase synthesizes a complementary DNA strand.
  • thermostable DNA polymerase from the organism Thermus thermusphilus (Tth) (U.S. Patent 5,322,770).
  • the polymerase may also have proof-reading activity
  • thermostable in v / yro complex comprising a thermostable gliding clip protein and a thermostable elongation protein having polymerase activity.
  • the complex according to the invention can serve for the template-dependent elongation of nucleic acid (s).
  • This complex can be used in in wfro reactions, such as in PCR reactions, and is highly processive. It is also advantageous that the complex has a low error rate in nucleotide incorporation, that is, it has an increased accuracy in base incorporation. This complex can thus be used advantageously in elongation, amplification, reverse transcription, DNA labeling and the sequencing of nucleic acids.
  • the possible uses outlined above each represent particularly preferred embodiments of the invention.
  • the sliding chamber protein is linked to the elongation protein.
  • thermostable in ' fra complex the glide clip protein and the elongation protein are linked via a coupling protein.
  • the coupling between slide clamp protein and elongation protein having polymerase activity can be carried out by covalent but also by non-covalent binding.
  • the gliding clip protein and / or the elongation protein come from archaebacteria.
  • the complex according to the invention is a prokaryotic in w ' fro complex.
  • the prokaryotic complex according to the invention can be an archaebacterial in v / fro complex.
  • the prokaryotic complex according to the invention can be an eubacterial in vitro complex.
  • the complex according to the invention is a eukaryotic in v / fro complex.
  • a prokaryotic in v / fro complex is one in which the gliding clip protein is of prokaryotic origin regardless of the origin of the elongation protein.
  • a eubacterial complex is one in which the glide clip protein is of eubacterial origin, regardless of the origin of the elongation protein.
  • an archaebacterial complex is one in which the glide clip protein is of archaebacterial origin, regardless of the origin of the elongation protein.
  • a eukaryotic complex is still one in which the glide clip protein is of eukaryotic origin, regardless of the origin of the elongation protein.
  • the present invention also relates to those thermostable in wYro complexes in which the proteins which form the complexes originate in part from archaebacteria, eukaryotes and from eubacteria.
  • any permutations of the in ⁇ ro complexes with regard to the protein components and their respective origins are the subject of the present invention. Origin in the above sense is intended to denote the source to which the gene, the gene information or the protein can be attributed.
  • the actual manner of obtaining the gliding clip protein or the elongation protein is independent of this, which can be done, for example, by chemical synthesis, genetic engineering processes or isolation from natural sources.
  • thermostable prokaryotic in w ⁇ ro complex for elongation in particular for template-dependent elongation of nucleic acids, which comprises a thermostable gliding clip protein (FIG. 20) which completely or partially encloses the complementary nucleic acid strands, and a thermostable, polymerase activity (FIG 21 and 22) comprising protein, said protein or protein complex being coupled or associated with the gliding clip protein.
  • polymerase activity-having elongation protein also includes polymerase activity-having protein complexes or subunits of such complexes which carry the polymerase activity.
  • thermostable means that the in vitro complex with high processivity incorporates nucleotides into growing nucleic acid strands, both at low and at high temperatures, which occur in PCR or another reaction, such as e.g. DNA sequencing.
  • the PCR consists e.g. usually from the steps of denaturing (70 ° C to 98 ° C), annealing (40 ° C to 78 ° C) and DNA strand synthesis (60 ° C to 76 ° C). This complex must therefore at least between approx. 60 ° C and approx.
  • Denaturation phenomena of the complex or individual components occur which prevent or inhibit the elongation reaction.
  • the gliding clip protein fulfills the function of binding the elongation protein to the DNA.
  • the glide clip protein itself completely or partially encloses the single-stranded or double-stranded nucleic acid or by association with the protein having polymerase activity or with the protein complex having polymerase activity or a subunit thereof, and thereby forms a bracket around the nucleic acid.
  • the processivity is significantly increased by this bracketing, at least one and a half times (Example 5 and Fig. 23).
  • the in v / yro complex according to the invention has at least one and a half times the processivity in comparison to an elongation protein alone, or in comparison to a protein complex having polymerase activity, or a subunit thereof, without a glide clip (example 5 and FIG. 23).
  • homologs or functional analogs of the "proliferating cell nuclear antigen" protein complex, encoded in the human genome, or homologs of the likewise circular " ⁇ -clamp" protein complex from E. coli, which originate from thermostable organisms and are thermostable, can serve as the sliding chamber , or if they are not thermally stable are made thermostable, or come from non-thermostable organisms and are thermostable or are subsequently made thermostable by changing the amino acid sequence (Eijsink VG, van der Zee JR, van den Burg B, Vriend G, Venema G, FEBS Lett 1991 Apr 22 ; 282 (1): 13-16, Improving the thermostability of the neutral protease of Bacillus stearothermophilus by replacing a buried asparagine by leucine, Bertus Van den Burg, Gert Vriend, Oene R.
  • homologous sequences are to be understood as sequences which are distinguished by the fact that they have sequence similarity to one or more other sequences, to an extent to which a coincidental similarity cannot be assumed. The degree of sequence similarity is expressed in percent and is called homology. The term "sequence identity" is sometimes also used.
  • a homolog is a nucleic acid or amino acid sequence which is a homologous sequence to a reference sequence.
  • the slide clamp can be constructed from several components.
  • the glide clip identified in the human genome consists of three PCNA protein components (SEQ ID NO: 11) (homotrimers), the glide clip identified in the E. co // genome consists of two components (SEQ ID NO: 35) (homodimers).
  • a slide clamp is to be understood here in particular to mean any protein which has the functional property of increasing the polymerase processivity (example 5 and FIG. 23) and / or serves to lower the error rate.
  • the glide clip can have an annular three-dimensional structure or, by coupling to another protein, form an annular three-dimensional structure, by means of which it is able to completely or partially enclose single and double-stranded nucleic acids.
  • a slide clamp in the sense of the present invention is to be understood in particular as a protein of this type
  • SEQ ID NO 11 over a length of at least 100 amino acids with a sequence alignment has an at least 20%, preferably at least 25% and more preferably at least 30% sequence identity or the 2nd to the bacterial ß-clamp sequence from E . coli (eubacteria)
  • Archaeoglobus fulgidus (Archaebacteria) (SEQ ID NO 12) has at least 20%, preferably 25% and more preferably 30% sequence identity over a length of at least 100 amino acids with a sequence alignment.
  • the slide clip according to the invention can have one or more of the aforementioned features.
  • Invention are also to be understood as including proteins that contain one or both of the following consensus sequences (Region 1 and Region 2) no more than four positions from region 1 (SEQ ID No .: 39) or no more than four positions from region 2 (SEQ ID No .: 40) (Fig. 4):
  • amino acids are named according to the standard IUPAC - single letter nomenclature and listed according to the Prosite Pattern description standard.
  • the following amino acid groups are often combined: G, A, V, L, I, MP, F or W (amino acids with non-polar side chains) S, T, N, Q, Y, or C (amino acid with uncharged polar side chains) K , R, H, D or E (amino acid with charged and polar side chains)
  • X in the sequences or sequence listing means any amino acid or insertion or deletion
  • a hidden Markov model was also generated from the multiple alignment of human PCNA homologs shown in FIG.
  • a slide clamp is to be understood in particular to mean any protein which, with the hidden Markov model thus generated (hereinafter referred to as “HMM”), has a “score” of more than 20, preferably 25, most preferably 30 (Fig. 12), where a "score” is the output value of an HMM analysis.
  • the hidden Markov models and the corresponding scores were calculated with the hmmfs program (version 1.8.4, July 1997) from the HMMER package (HMMER Protein and DNA Hidden Markov Models (Version 1.8) by Sean Eddy, Dept. of Genetics, Washington University School of Medicine, St. Louis, USA;).
  • Markov models with a hidden profile are statistical models of the consensus of the primary structure of a sequence family.
  • the profiles use position-specific scores (" scores ") for amino acids (or nucleotides) and position-specific scores to open or expand an insertion or deletion.
  • scores position-specific scores
  • Methods for creating profiles based on multiple alignments have been described by Taylor (1986), Gribskov et al. (1987), Barton (1990) and Heinikoff (1996).
  • HMM provide a completely probabilistic description of profiles, ie Bayes' teaching defines how the entire probability (evaluation) parameter should be set (see Krogh et al. 1994, Eddy 1996 and Eddy 1998).
  • the central idea is that an HMM is a finite model that describes a probability distribution over an unlimited number of possible sequences.
  • the HMM is composed of a number of states that correspond to the pillars of a multiple alignment, as is usually shown. Each state emits symbols (residues) according to the (state-specific) symbol emission probabilities, and the states are interconnected by state transition probabilities. Starting from an initial state, a sequence of states is generated by moving from one state to another according to the state transition probabilities until a final state is reached.
  • Each state then emits symbols according to the emission probability distribution of that state, creating an observable sequence of symbols.
  • the attribute "hidden” is derived from the fact that the underlying state sequence cannot be observed; what is seen is the symbol sequence.
  • An estimate of the transition and emission probabilities (the training of the model) is carried out achieved dynamic programming algorithms implemented in the HMMER package.
  • the HMMER package provides a numerical quantity (the score or output value) that is proportional to this probability, i.e. H. the information content of the sequence, expressed in bits, measured according to the HMM.
  • a slide clamp is to be understood in particular as any protein that has a score of more than 25, preferably 30 and most preferably 35 with the HMM thus generated (FIG. 13).
  • the slide clip can be constructed from several components which are firmly bonded to one another by a characteristic bond, so that a stable ring-shaped molecular complex is formed which cannot readily dissociate from the nucleic acid. This enables a firm, but not covalent, bond to the nucleic acid, which, however, does not hinder the free movement on it.
  • the processivity-enhancing glide clip proteins also have characteristic local molecular properties in the region of the interaction region with DNA, which facilitate the free movement and which can be supported by water molecules stored in this region.
  • a preferred embodiment of the present invention is furthermore in particular a thermostable prokaryotic in w ⁇ ro complex, the gliding clip protein being one of the following: AF 0335 from Archaeoglobus fulgidus (SEQ ID NO .: 12) (FIG. 24), MJ0247 from Methanococcus jannaschii (SEQ ID NO .: 13), PHLA008 from Pyrococcus horikoschii (SEQ ID NO .: 14), MTH1312 from Methanobacterium Thermoautotrophicus (SEQ ID NO .: 15), and AE000761_7 from Aquifex aeolicus (SEQ ID NO .: 36).
  • thermostable in w / o complexes are the subject of this application, the gliding clip protein comprising an amino acid sequence which is selected from the group SEQ ID No. 11, 12, 13, 14, 15 and 36.
  • the complex according to the invention comprises a slide clamp loader.
  • a slide clamp loader is understood here to mean a protein, protein complex or subunit of a protein which comprises a homologue of the "Replication Factor C" protein complex identified in humans.
  • this protein complex consists of five subunits, which are encoded by 5 separate genes in humans.
  • the 4 small subunits, each encoded by a gene form a protein complex in humans.
  • the large subunit protein in humans is encoded by a gene (referred to herein as a sliding clip loader 2).
  • the sequences of the four small subunits are shown as SEQ ID NO .: 1, 32, 33, 34, the sequence of the large subunit is shown as SEQ ID NO .: 6.
  • homologs or functional analogs, individually or in any combination, of each of the sequences SEQ ID NO .: 1, 32, 33, 34 mentioned above can be used as slide clamp loader 1.
  • the homologues can be of prokaryotic, such as eubacterial or archaebacterial, or eukaryotic origin.
  • homologs or functional analogs individually or in any combination, of the sequence SEQ ID NO .: 6 mentioned above can be used as slide clamp loader 2.
  • the homologues can be of prokaryotic, such as eubacterial or archaebacterial, or eukaryotic origin.
  • a slide clamp loader 1 in the sense of the present invention can also be understood to be such a protein which has at least 100 amino acids in a sequence alignment with the human (eukaryotes) amino acid sequence (SEQ ID NO: 1, 32, 33, 34) with a sequence alignment %, preferably at least 25% and more preferably at least 30% sequence identity.
  • a slide clamp loader 2 in the sense of the present invention can also be understood to be such a protein which has at least 20%, preferably at least 20% sequence identity to the human (eukaryotes) amino acid sequence (SEQ ID NO: 6) over a length of at least 150 amino acids with a sequence alignment Has 25% and more preferably at least 30%.
  • Sliding clip loader homologs in the sense of the above definition are, for example, the genes from archaebacteria listed in FIG. 1.
  • the sequences SEQ ID NO correspond to these genes for slide clamp loader 1: 2, 3, 4, and 5 and for the sliding clamp loader 2 the sequences SEQ ID NO: 7, 8, 9, and 10.
  • a slide clamp loader 1 in the sense of the present invention can also be understood to be a protein which comprises a sequence according to the following consensus sequence and does not deviate from this sequence at more than four positions (see also FIG. 6 for alignment):
  • a slide clamp loader 2 in the sense of the present invention can also be understood to be a protein which comprises a sequence according to the following consensus sequence and does not deviate from this sequence at more than four positions (see also FIG. 7 for alignment):
  • An HMM was also generated from the multiple alignment of sequences of slide clamp loader 1 comprising the human sequence and some sequences from archaebacteria homologous to it, shown in FIG. 14.
  • a slide clamp loader 1 in the sense of the present invention is therefore also to be understood as a protein which, with the HMM thus produced, has a score of more than 25, preferably more than 30 and most preferably more than 35 (see also FIG. 14 for alignment).
  • a slide clamp loader 2 in the sense of the present invention is therefore also to be understood as a protein which, with the HMM thus generated, has a score of more than 15, preferably more than 20 and most preferably more than 25 (see also FIG. 15 for alignment).
  • the in w ' fro complex according to the invention comprises a protein homologous to the Eubaktehum Escherichia coli ⁇ complex or parts thereof as a slide clamp loader 1 or slide clamp loader 2.
  • a sliding clip loader in the sense of the present invention can accordingly be a sliding clip loader 1 alone, a sliding clip loader 2 alone, or a combination of one or more sliding clip loaders 1 or sliding clip loader 2, each as defined above.
  • thermostable in / ro complex for elongation of nucleic acids additionally comprises a compound which releases energy during cleavage, such as ATP, GTP, CTP, TTP, dATP, dGTP, dCTP or dTTP.
  • a compound which releases energy during cleavage such as ATP, GTP, CTP, TTP, dATP, dGTP, dCTP or dTTP.
  • a slide clamp loader appears to assemble the components of the slide clamp around the uninterrupted strand of DNA or to remove them again when the reaction is complete.
  • the sliding clamp can have an annular three-dimensional structure or, by coupling to another protein, form an annular three-dimensional structure, by means of which it is able to completely or partially enclose single- or double-stranded nucleic acids.
  • the sliding clamp loader can bring advantages if the template nucleic acid molecule is present in a closed ring.
  • thermostable in w ' fro complexes are the subject of this application, the sliding clip loader 1 comprising an amino acid sequence which is selected from the group SEQ ID No. 2, 3, 4 and 5.
  • thermostable in / ro complexes are the subject of this application, the sliding clip ladder 2 comprising an amino acid sequence which is selected from the group SEQ ID No. 7, 8, 9 and 10.
  • the coupling protein has the function of linking an elongation protein with one or more glide clip proteins or a glide clip protein complex.
  • Coupling protein in the sense of the present invention is therefore to be understood in particular as any protein which has the function described above. Coupling proteins of archaebacterial origin are preferred.
  • Coupling proteins in the sense of the present invention are, for example, homologs or functional analogs, individually or in any combination, of each of the sequences listed in FIG. 1, the homologs to the human sequence of the small subunit of polymerase ⁇ , referred to herein as the coupling subunit (sequence name: DPD2JHUMAN , shown in the sequence listing as SEQ ID NO: 16).
  • a coupling protein can be a protein which comprises a sequence which is selected from the group which comprises the sequences SEQ ID NO: 17, 18, 19, 20 and 21.
  • a coupling protein in the sense of the present invention is to be understood in particular to be a protein that has a length of at least 150 to the human (eukaryotes) amino acid sequence (SEQ ID NO: 16)
  • Amino acids in a sequence alignment an at least 18%, preferably has at least 22% and more preferably at least 26% sequence identity.
  • Coupling protein in the sense of the present invention is to be understood in particular as a protein which has at least 20%, preferably at least 20% sequence identity to the amino acid sequence (SEQ ID NO: 19) of Pyrococcus horikoshii with a sequence alignment of at least 150 amino acids 25% sequence identity and most preferably a sequence identity greater than 30%.
  • Coupling protein for the purposes of the present invention is also to be understood as any protein which comprises the following consensus sequence and does not deviate from this sequence at more than four positions.
  • the generation of the consensus sequence is shown in FIG. 5, which is shown as SEQ ID No. 43 is disclosed herein.
  • a coupling subunit in the sense of the present invention is therefore to be understood as any protein which has a score of more than 10, preferably more than 15, most preferably more than 20 with the HMM thus generated.
  • thermostable in v / fro complexes are the subject of this application, the coupling protein comprising an amino acid sequence which is selected from the group SEQ ID No. 17, 18, 19, 20 and 21.
  • an elongation protein can be used which has the features defined at the outset.
  • forms of elimination proteins can be used, as described below and at least in part are already known in the prior art.
  • Elongation proteins require the presence of a coupling protein to have any polymerase activity at all. It is also known that some elongation proteins can bind directly to glide clip proteins, whereas other elongation proteins require the presence of a coupling protein for binding to the glide clip proteins. Elongation proteins can furthermore combine the two properties mentioned above, that is to say both via a coupling protein and also directly, that is to say without a coupling protein, bind to a stick clamp protein.
  • Preferred elongation proteins for the in w ' / ro complex according to the invention can be selected from the group comprising the organisms carboxydothermus hydrogenoformans, Thermus aquaticus, Thermus caldophilus, Thermus chliarophilus, Thermus filiformis, Thermus flavus, Thermus oshimai, Thermus ruber, Thermus scotoductus, Thermus silvanus, Thermus species Z05, Thermus species sp.
  • Thermus thermusphilus Therotoga maritima, Therotoga neapolitana, Thermosipho af canus, Anaerocellum thermophilum, Bacillus caldotenax, or Bacillus stearothermophilus.
  • Suitable elongation proteins are, for example, the elongation proteins from archaebacteria homologous or functionally analogous to human elongation protein (SEQ ID NO: 22) (SEQ ID NO: 23, 24, 25, 26).
  • the invention relates to such thermostable in w-ro complexes, the elongation protein comprising an amino acid sequence which is selected from the group SEQ ID No. 23, 24, 25, 26, 27, 28, 29, 30 and 31.
  • An elongation protein in the sense of the present invention is to be understood in particular as a protein that has at least 20%, preferably 25%, sequence identity to the human (eukaryotes) amino acid sequence (SEQ ID NO: 22) over a length of at least 200 amino acids with a sequence alignment. sequence identity, most preferably 30% sequence identity.
  • An elongation protein in the sense of the present invention is also to be understood in particular as a protein which contains the following consensus sequence (SEQ ID No. 44) and does not deviate from this sequence at more than four positions. 8 shows the alignment on which the consensus sequence is based.
  • An HMM was also generated from the multiple alignment of homologs to the human elongation protein (SEQ ID NO: 22) shown in FIG. 17.
  • An elongation protein in the sense of the present invention is therefore also to be understood as a protein which, with the HMM thus generated, has a score of more than 20, preferably more than 25, most preferably more than 30.
  • An elongation protein in the sense of the present invention is thus also to be understood as a protein which, in relation to the archaebacterial amino acid sequence (SEQ ID NO: 27), has a sequence identity of at least 25%, preferably at least 30%, over a length of at least 400 amino acids with a sequence alignment Sequence identity, most preferably has at least 35% sequence identity.
  • the proteins with the SEQ ID NO: 27, 28, 29, 30 or 31 originating from archaebacteria are suitable.
  • Elongation protein in the sense of the present invention is therefore to be understood in particular as any protein which contains the following consensus sequence, referred to herein as SEQ ID No .: 45, and does not deviate from this sequence at more than four positions. (FIG. 9 shows the alignment on which the consensus sequence is based.)
  • HMM was also generated from the multiple alignment of homologs to the archaebacterial elongation protein (SEQ ID NO: 27) shown in FIG. 18.
  • Elongation protein in the sense of the present invention is thus to be understood in particular as any protein that has a score of more than 35, preferably more than 40 and even more preferably more than 45 with the HMM produced in this way (FIG. 18).
  • the elongation protein can also be of eubacterial origin.
  • An elongation protein in the sense of the present invention is therefore also to be understood as a protein that has a length of at least 300 to form the eubacterial amino acid sequence (SEQ ID NO: 37)
  • Amino acids in a sequence alignment have at least 25% preferably has at least 30% and more preferably at least 35% sequence identity.
  • Elongation protein in the sense of the present invention is therefore to be understood in particular as any protein which contains the following consensus sequence and does not deviate from this sequence at more than eight positions (FIG. 10):
  • Elongation protein in the sense of the present invention is therefore to be understood as any protein which has a score of more than 20, preferably more than 25, most preferably more than 30 with the HMM thus generated.
  • thermostable in w ' / ro complexes are the subject of this application, the elongation protein comprising an amino acid sequence which is selected from the group SEQ ID No. 38 includes.
  • DNA polymerases have been used as elongation proteins without coupling protein and without slide clamp for standard PCR reactions, for example DNA polymerase I from Pyrococcus furiosus (US No. 5,545,552) or Pyrococcus species (EP-A-0 547 359). These enzymes are characterized by the property of being thermostable and often one To have 3'-5 'exonuclease activity (' proof-reading 'activity).
  • a heterodimer with polymerase activity in Pyrococcus furiosus has only recently been discovered (Uemori, T., Sato, Y., Kato, I., Doi, H., and Ishino, Y. (1997).
  • a novel DNA polymerase in the hyperthermophilic archaeon , Pyrococcus furiosus gene cloning, expression, and characterization. Genes to Cells 2, 499-512.
  • thermostable in w ' fro complex illustrates an example of an embodiment of the thermostable in w ' fro complex according to the invention, in which case the glide clip binds to the elongation protein via a coupling protein.
  • the reaction mixture according to the invention in v / fro or the reaction mixture according to the invention containing it can furthermore comprise a nucleic acid, the nucleic acid being, for example, the nucleic acid to be elongated, sequenced, amplified or reversely transcribed and / or a primer, the latter Primer is preferably hybridized to a nucleic acid.
  • Primers are usually oligonucleotides which are complementary to a target sequence in order to be able to bind to them, whereby in opposite orientation, with their 3 'ends directed towards one another, includes the nucleic acid section to be elongated, sequenced, amplified or reversely transcribed . They serve as the starting point for the enzyme activity and generally provide a free 3'-OH end for the polymerase to incorporate a nucleotide.
  • the complex according to the invention optionally in a reaction mixture, is preferably in a suitable buffer.
  • Suitable buffers are those which are used for PCR, sequencing, nucleic acid tag and others in w 'rro-nucleic acid elongation reactions by polymerase. Suitable buffers are described, for example, in Methods in Molecular Biology, Vol. 15 Humana Press Totowa, New Jersey, 1993, ed. Bruce A. White.
  • thermostable invention in vi 'TRO for the elongation complex, amplification, reverse transcription and / or sequencing may additionally be present to the inventive complex is a nucleotide or a mixture of nucleotides, or used or to be encompassed.
  • Deoxynucleotides can be selected from, but are not limited to, dGTP, dATP, dTTP and dCTP.
  • derivatives of deoxynucleotides can also be used which are defined as deoxynucleotides which are able to be incorporated into growing nucleic acid molecules by a thermostable polymerase.
  • Such derivatives include the thionucleotides, 7-deaza-2 '-dGTP, 7-deaza-2' - dATP, digoxigenin-dUTP (Boehringer Mannheim) -dATP and deoxyinosine triphosphate, which is also a replacement deoxynucleotide for dATP, dGTP, dTTP or dCTP can be used, but are not limited to these. Labeled deoxynucleotides can also be used.
  • the use of pyrenes and pyrene derivatives is also possible. All known markings and / or markings suitable for the purpose according to the invention can be present or used.
  • Dideoxynucleotides can be selected from, but are not limited to, ddGTP, ddATP, ddTTP and ddCTP. Alternatively, you can
  • Dideoxynucleotides are defined that are capable of being incorporated by polymerase into growing nucleic acid molecules that are synthesized in the reaction.
  • Such derivatives can be radioactive dideoxynucleotides (ddATP, ddGTP, ddTTP and ddCTP) or dideoxynucleotides (ddATP, ddGTP, ddTTP and ddCTP) which are labeled with, for example, FITC, Cy5, Cy5.5, Cy7, Texas red or other dyes, but are not limited to these.
  • Labeled deoxynucleotides can also be used together with unlabeled dideoxynucleotides in the course of sequencing using the thermostable in ⁇ ro complex according to the invention.
  • Ribonucleotides can be selected from, but are not limited to, GTP, ATP, TTP and CTP.
  • derivatives of ribonucleotides defined as those ribonucleotides capable of being incorporated by polymerase into growing nucleic acid molecules that are synthesized in the reaction can also be used in accordance with the invention.
  • Such derivatives can be radioactive ribonucleotides (ATP, GTP, TTP and CTP) or ribonucleotides (ATP, GTP, TTP and CTP) which are labeled with e.g. FITC, Cy5, Cy5.5, Cy7 and Texas red or others are marked, include, but are not limited to, these.
  • the present invention furthermore relates to a reaction mixture which comprises the in w ' ro complex according to the invention. It can be provided that the reaction mixture further comprises one or more elongation proteins which have at least one or more of the above activities. Such an additional elongation protein is advantageously a thermostable polymerase. Such a reaction approach allows increased processivity compared to the use of the known thermostable polymerases.
  • the complexes preferably completely or partially consisting of recombinant proteins, can be provided with the following steps: provision of the nucleic acid fragment which codes for the desired protein, ligation into an expression vector, transformation into a host, expression and purification of the protein ( Fig. 25).
  • provision of the nucleic acid fragment which codes for the desired protein ligation into an expression vector
  • transformation into a host transformation into a host
  • purification of the protein Fig. 25.
  • genes in particular from the archaebacteria, intein (Proc. Natl. Acad. Sci.
  • genes and / or proteins suitable for the complex according to the invention can be identified, for example, by homology searches in databases which include genomes from prokaryotes.
  • Programs that are suitable for this include, but are not limited to, the BLAST, BLASTP, and FASTA programs.
  • BLAST Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs ", Nucleic Acids Res. 25: 3389-3402. WR Pearson & D. Lipman PNAS (1988) 85: 2444-2448).
  • Identification can also be done by using DNA probes to screen for prokaryotes or eukaryotes in genomic banks, for example, for the corresponding genes.
  • the experimental procedures required for this can be found in Maniatis et al. (Molecular Cloning (2 " d edition, 3 Volume set): A laboratory Manual, Cold Spring Harbor Laboratory Press, NY (1989)) or in Ausubel et al (Current Protocols in Molecular Biology, John Wiley and Sons (1988)).
  • the provision of the purified nucleic acid of the genes, the proteins which build up the complexes according to the invention can e.g. by isolating them from a genomic library of the relevant organism or by synthetic DNA production, in each case if desired combined with amplification by means of PCR, with the aid of primers which are specific for the desired gene segment.
  • Usual methods are described in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y. (1989)).
  • genes of the proteins of the ⁇ ra complexes according to the invention can be cloned using a variety of methods and thus made available by means of an expression vector for protein expression in a host organism. Common processes are in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, NY (1989)).
  • the genes of the complexes can first be cloned into a high-copy vector, for example pUC18, pBst or pBR322, and only then into a prokaryotic expression vector, for example pTrc99, pQE30, pQE31 or pQE32, or directly into one prokaryotic or viral expression vector can be cloned.
  • vectors are to be understood as nucleic acids which are capable of to transport another nucleic acid molecule in or between different organisms or genetic backgrounds. They usually have the ability to autonomously replicate and / or express (expression vectors) the operatively linked nucleic acid molecule. "Operatively linked” herein means that the transported nucleic acid molecule is linked to the vector such that it is under the transcriptional and translational control of expression control sequences of the vector and can be expressed in a host cell.
  • Bacterial and viral expression systems their preferred use and a selection of vector systems are described, for example, in Gene Expression Technology, (Meth. Enzymol., Vol 185, Goeddel, Ed., Academic Press, NY (1990)).
  • Suitable vectors for the present invention should enable different expression levels of the proteins by having some or all of the following properties: (1) promoters, or transcription initiation sites, either immediately next to the start of the protein or as a fusion protein, (2) operators, can be used to switch gene expression on or off, (3) ribosomal binding sites for improved translation, and (4) termination sites for transcription or translation, which lead to improved stability of the transcript.
  • Expression vectors that are compatible with eukaryotic cells, preferably with vertebrate cells, can also be used.
  • Some known vectors are pSVL and pKSV-10 (Pharmacia), pBPV-1 / pML2d (International Biotechnologies, Inc.), pAcHLT-ABC (Pharmingen) and pTDTI (ATCC 31255). It is also possible to use a retroviral expression vector.
  • the vectors according to the invention contain at least one gene for the glide clip protein or at least one gene for the coupling protein or at least one gene for a glide clip loader 1 and / or 2 or at least one gene for an elongation protein.
  • the vectors simultaneously contain several of the various genes mentioned above, for example the genes for an elongation protein and a glide clip protein.
  • the vector also contains suitable restriction sites and, if appropriate, polylinkers for the insertion of further DNA sequences. It is particularly preferred if the spatial arrangement of the already contained DNA sequence and additional insertion site leads to the formation of a fusion protein after expression.
  • the vector according to the invention contains promoter and / or operator areas, it being particularly preferred if such promoter and / or operator areas are inducible or repressible. Control of expression in host cells is thereby considerably simplified and can be designed particularly efficiently.
  • Such promoter / operator areas can also occur multiple times in an expression vector, so that, if necessary, independent expression of several DNA sequences is made possible using only one expression vector.
  • Another object of the present invention is a host cell containing one or more vector (s) according to the invention, the expression of proteins in this host cell under suitable conditions can be done.
  • suitable conditions include, for example, the presence of a repressor, inductor, or a derepressor.
  • the transformants are cultivated under the appropriate growth conditions of the host strain.
  • Most E. co // strains are e.g. cultivated in LB medium at 30 ° C to 42 ° C until the logarithmic or stationary growth phase.
  • the proteins can be purified from a transformed culture, which can be done either from a cell pellet, after centrifugation, or from the culture fluid. If the proteins are purified from the cell pellet, the cells are resuspended in a suitable buffer and broken up by means of ultrasound treatment, enzymatic treatment or freezing and thawing. If the purification from the culture suspension takes place, either without or with a fusion protein, the supernatant is separated from the cells by means of known methods, such as centrifugation.
  • the separation and purification of the proteins of the complexes according to the invention either from the supernatant of the culture solution or from the cell extract can be carried out by known separation or purification processes.
  • These methods are, for example, those that relate to the solubilities, such as salt precipitation and solvent precipitation, methods that take advantage of the different molecular weights, such as dialysis, ultrafiltration, gel filtration, and SDS-polyacrylamide gel electrophoresis, methods that use the different charges, such as Ion exchange chromatography, methods that take advantage of the different hydrophobicity, such as reverse-phase HPLC (High Performance Liquid Chromatography), methods that take advantage of certain affinities, such as affinity chromatography (examples 6, 7, 24 and 25), and methods that take advantage of differences in the isoelectric point, such as isoelectric focusing.
  • solubilities such as salt precipitation and solvent precipitation
  • methods that take advantage of the different molecular weights such as dialysis, ultrafiltration, gel filtration, and SDS
  • cell extracts can be made either from the organism which carries the gene of the accessory complex which fulfills the task according to the invention, or from the recombinant host organism, for example E. coli. With these extractions one could avoid other cleaning steps.
  • thermostable in v / o complexes according to the invention can be used to elongate nucleic acids, e.g. B. for polymerase chain reaction, (example 3, 4, and Fig. 21; Fig. 22) DNA sequencing, for labeling nucleic acids and other reactions that involve the in vitro synthesis of nucleic acids.
  • Another object of the present invention is therefore a method for template-dependent elongation of nucleic acids, the nucleic acid being denatured, if necessary, provided with at least one primer under hybridization conditions, the primer being sufficiently complementary to a flanking region of a desired nucleic acid sequence of the template strand and with the aid of a polymerase in the presence of nucleotides, a primer elongation takes place, where as Polymerase a thermostable in w ' f / o complex is used.
  • Methods for the template-dependent elongation of nucleic acids in which the elongation takes place starting from a primer which has been hybridized to the template nucleic acid and provides a free 3'-OH end for the elongation, are known to the person skilled in the art.
  • a PCR polymerase chain reaction is carried out for the amplification.
  • thermostable in vitro complex according to the invention in reverse transcription, with either the complex according to the invention itself having reverse transcriptase activity, or else a suitable enzyme having a reverse transcriptase activity being added, regardless of whether the thermostable in ⁇ ra complex itself has reverse transcriptase activity.
  • thermostable in w ' fro complex for the reverse transcription of RNA into DNA preferred according to the invention, a thermostable in w ' fro complex according to the invention is likewise used, the elongation protein of which itself has a reverse transcriptase activity.
  • This reverse transcriptase activity can be the only polymerase activity of the elongation protein, but can also be present in addition to an existing 5'-3 'DNA polymerase activity.
  • a preferred embodiment of the in w ' fro complex according to the invention comprises the elongation protein from the organism Carboxydothermus hydrogenoformans, as disclosed in EP-A 0 834 569.
  • Sequencing Another preferred use of the 'TRO in vi complex of the invention is the sequencing of nucleic acids according to the method of Sanger. Starting from at least one primer which is sufficiently complementary to a part of the nucleic acid to be sequenced, a template-dependent elongation is carried out. In the case of the sequencing of RNA, it is necessary to carry out a reverse transcription. In the context of this preferred embodiment, the respective derivatives described above are also considered suitable as deoxynucleotides or dideoxynucleotides. In particular, it is preferred for the methods according to the invention for elongating nucleic acids that the nucleic acids formed are labeled.
  • Another object of the present invention a method for labeling nucleic acids, for example by insertion of individual fractures in phosphodiester bonds of the nucleic acid chain, and replacement of one nucleotide at the break points by a labeled nucleotide using a polymerase, wherein the polymerase, an inventive thermostable in w 'fro- Complex is used.
  • a preferred method is the method generally referred to as nick translation, which enables simple labeling of nucleic acids. All of the labeled ribonucleotides or deoxyribonucleotides or derivatives thereof already described above are suitable for this as long as the polymerase accepts them as a substrate. Labeling in the above sense is also a label which is carried out as part of a PCR reaction, in which case labeled nucleotides or derivatives thereof are incorporated into the nucleic acid sequence.
  • the present invention also relates to a kit for elongation and / or amplification and / or reverse transcription and / or sequencing of nucleic acids, it being possible for this kit to comprise one or more containers.
  • the kit itself comprises a) a thermostable in w ' fro complex according to the invention or b) a thermostable in w ' fro complex and optionally an elongation protein having polymerase activity, and optionally one or more of the components selected from the group , which includes primers, buffer substances, nucleotides, ATP, other cofactors and pyrophosphatase.
  • thermostable in w ' fro complex in said kit is present in the form of its individual constituents, that is to say as a thermostable gliding clip protein and thermostable elongation protein, separately or combined in one container, and only forms as such at a later point in time .
  • the present invention relates to a kit for elongation, amplification, reverse transcription, labeling or sequencing of nucleic acids, which additionally contains deoxynucleotides or their derivatives.
  • ribonucleotides or derivatives thereof can also be included in the kit according to the invention, namely if an elongation protein is used which accepts ribonucleotides as a substrate.
  • a preferred embodiment of the kit according to the invention is a kit for sequencing nucleic acids, which in addition to deoxynucleotides or their derivatives, dideoxynucleotides or their derivatives are included for chain termination.
  • the present invention particularly relates to a kit for reverse transcription of nucleic acids, either the complex according to the invention itself having reverse transcriptase activity, or additionally a suitable enzyme which has reverse transcriptase activity, with deoxynucleotides or their derivatives being present Reaction mixture can be included.
  • the kit contains primers and / or deoxynucleotides and / or dideoxynucleotides and / or ribonucleotides and / or their respective derivatives in labeled form.
  • Suitable markings have already been described above in exemplary form. Suitable marking agents are included in a preferred embodiment of the kit according to the invention.
  • the kit also referred to herein as the reagent kit
  • the reagent kit contains the components a) or b) and labeled nucleotides, buffer substances, ATP or other cofactors and / or pyrophosphatase may also be present.
  • a kit is preferred which comprises a suitable buffer, as described above. It is also preferred that the kit according to the invention additionally comprises a pyrophosphatase, ATP and / or other cofactors.
  • the present invention furthermore relates to the use of a thermostable gliding clip protein in in vitro methods for elongation, amplification, labeling or sequencing or reverse transcription of nucleic acids.
  • thermostable in w ' fro complex according to the invention can be used for the purposes of sequencing, amplification, reverse transcription and the like with both short and long nucleic acid fragments, with a reduced overall frequency of errors
  • thermostable in w ' fro complex is used for the purposes of sequencing, amplification and reverse transcription of long nucleic acid fragments.
  • thermostable in w ' fro complex is used for the purposes of sequencing, amplification and reverse transcription of those nucleic acid fragments which form the secondary structure.
  • sequence names are often used, under which the protein or nucleic acid sequences are in the gene bank and the EMBL database. It shows:
  • Fig. 2 is a table similar to that of Fig. 1, but limited to
  • Gliding clip protein and elongation protein from E. coli and A. aeolicus Gliding clip protein and elongation protein from E. coli and A. aeolicus
  • thermostable in w ' fro complex shows a schematic representation of the thermostable in w ' fro complex according to the invention
  • Elongation protein 1; 9 shows an alignment of a conserved region of the
  • HMM hidden Markov models
  • 27 shows the results of a Y2H experiment
  • 28 shows the PCR amplification result of the human collagen gene using the thermostable in w ' fro complex according to the invention
  • FIG. 1 lists, in tabular form, protein sequence names of the thermostable in w ' fro complex according to the invention, and values from pairwise alignments and multiple alignments between archaebacteria and between archaebacteria and the corresponding human genes.
  • the annotation " 1" means the percent identity (%) to the corresponding human gene, calculated from the pairwise alignment (see figures) with BLASTP 2.0.4 [Feb-24-1998] and the annotation " 2" percent identity to the corresponding gene from Archaeoglobus fulgidus, calculated from the pairwise alignment (see figures) with BLASTP 2.0.4 [Feb-24-1998] and the annotation " 3" percentage identity to the corresponding human gene, calculated from the pairwise alignment with FASTA 3.1t02 [March, 1998] ⁇ .
  • the methods are described in more detail in: Altschul, Stephen F., Thomas L. Madden, AIejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J.
  • Die 1 shows the sequence names from the databases and also their SEQ ID number in the case of the glide clip loader 1, the glide clip loader 2, the glide clip, the coupling protein and the elongation protein 1, and also their SEQ ID number, the values in the brackets representing percent identity per number of amino acids The values relate to percent sequence identity to the Archaeoglobus fulgidus sequence in the case of elongation protein 2.
  • the sequence names from the databases and also their "SEQ ID No.” are also shown here.
  • FIG. 3 shows a sketch of a possible form of the thermostable in w ' fro complex according to the invention, the sliding chamber binding to the elongation protein via a coupling protein.
  • Fig. 4 shows a sketch of a possible form of the thermostable in w ' fro complex according to the invention, the sliding chamber binding to the elongation protein via a coupling protein.
  • PCNA human from SEQ ID NO: 11
  • Methanococcus janashii from SEQ ID NO: 13
  • Pyrococcus horikoschii from SEQ ID NO: 14
  • Methanococcus thermoautothrophicus from SEQ ID NO: 15
  • FIG. 5 shows an alignment of a conserved region of the coupling protein and the consensus sequences derived therefrom.
  • the following genes are shown: PfuORF2, DPD2JHUMAN, AF1790 and MJ0702.
  • the SEQ ID numbers can be found in FIG. 1.
  • FIG. 6 shows an alignment of a conserved region of the coupling subunit and the consensus sequences derived therefrom.
  • the following genes are shown: AC11_HUMAN, AF2060, MTH0241, PHBN012 and MJ1422.
  • the SEQ ID numbers can be found in FIG. 1.
  • FIG. 7 shows an alignment of a conserved region of the sliding clamp loader 2 and the consensus sequences derived therefrom.
  • the following genes are shown: AC15_HUMAN, MJ0884, AF1195, MTH0240 and MTH0240.
  • the SEQ ID numbers can be found in FIG. 1.
  • FIG. 8 shows an alignment of a conserved region of the elongation protein 1, and the consensus sequences derived therefrom. The following genes are shown: DPODJHUMAN, MJ0885, MTH1208, PHBT047 and DPOL_ARCFU. The SEQ ID numbers can be found in FIG. 1.
  • FIG. 9 shows an alignment of a conserved region of the elongation protein 2, and the consensus sequences derived therefrom.
  • the following genes are shown: AF1722, MJ1630, PfuORF3, MTH1536 and PHBN021.
  • the SEQ ID numbers can be found in FIG. 1.
  • DP3A_ECOLI DNA Pol III, alpha subunit, Escherichia coli, BB0579: DNA Pol III, alpha subunit, Borrelia burgdorferi, DP3A_HELPY: DNA Pol III, alpha subunit, Helicobacter pylori AA50: Aquifex aeolicus, section 50 and DP3A_ALT DNA Pol III, alpha subunit, Salmonella typhimuhum).
  • AAPOL3B AAPOL3B, DP3B_ECOLI, S.TYPHIM, DP3B_PROMI, DP3B_PSEPU and DP3B_STRC0
  • AAP0L3B Aquifex aeolicus Section 93: DP3B_ECOLI: DNA Pol III, beta chain, Escherichia coli S.TYPHIM, DNA Salmonella P3, DNAMM3 PYBM3, DNA Polmonella P3: DNA Polmonella P3 : DNA Polmonella P3 : DNA Pol III, beta chain, Proteus mirabilis
  • DP3B_PSEPU DNA Pol III, beta chain, Pseudomonas putida DP3B_STRCO: DNA Pol III, beta chain, Streptomyces coelicolo ⁇ .
  • Figure 12 shows a multiple alignment of the glide clip protein sequences to generate the HMM.
  • AAPOL3B Aqufex Aeolicus section 93: DP3B_ECOLI: DNA Pol III, beta chain, Escherichia coli S.TYPHIM: DNA Pol III, beta chain, Salmonella typhimurium: P3B_PROMI DNA Pol III, beta chain, Proteus mirabilis
  • DP3B_PSEPU DNA Pol III, beta chain, Pseudomonas putida DP3B_STRCO: DNA Pol III, beta chain, Streptomyces coelicolor).
  • FIG. 14 shows a multiple alignment of the sliding clip loader 1 protein sequences for generating the HMM.
  • FIG. 16 shows a multiple alignment of the protein sequences of the coupling proteins to generate the HMM.
  • DP3A_ECOLI DNA Pol III, alpha subunit, Escherichia coli, BB0579: DNA Pol III, alpha subunit, Borrelia burgdorferi, DP3AJHELPY: DNA Pol III, alpha subunit, Helicobacter pylori AA50: Aquifex aeolicus, section 50 and DP3A_ALT DNA Pol III, alpha subunit, Salmonella typhimurium).
  • Fig. 20 (Example 2)
  • Recombinant Archaeoglobus fulgidus-PCNA (AF 0335) is a trimer under native conditions.
  • 20A shows proteins with His tag (histidine tag) in fractions 15 (lane 1), 17 (lane 2), 19 (lane 3), 21 (lane 4), 23 (lane 5), 25 ( Lane 6) of the chromatography carried out without urea.
  • 20B shows His-tagged proteins in fractions 10 (lane 1), 11 (lane 2), 12 (lane 3), 13 (lane 4), 14 (lane 5), 15 (lane 6), 16 ( Lane 7), 17 (lane 8) of the denaturing chromatography carried out in the presence of urea.
  • Sample 23 shows a comparison of the activity of an elongation protein with and without glide clip protein.
  • Sample 1 represents an enzyme-free approach.
  • Samples 2-12 also each contained 3 ⁇ l of a 1: 1000 dilution of a fraction of recombinant archeoglobe / u / gr / divs DNA polymerase (starting concentration 7.5 ⁇ g / ⁇ l).
  • Samples 3-7 and 8-12 also 0.5; 1 ; 2; 4 and 8 ul of a fraction of recombinant slide clamp protein from Archaeoglobus fulgidus PCNA.
  • Lane 24 shows the result of the purification of a slide clamp protein:
  • Lane 1 shows a molecular weight standard ((BIO RAD Cat No. 161-0317).
  • 500 ⁇ l bacteria were sedimented directly before induction, according to the manufacturer's instructions for running NuPage gels (NOVEX; Fig. 25) treated and applied.
  • Lane 3 shows the same amount of bacteria 16 hours after the elution.
  • Lanes 4 and 5 each show 8 ⁇ l of the two eluates of the Ni-Nta agarose column after dialysis. By cleaning over Ni-NTA Agarose (Qiagen) are obtained as high-purity fractions of the sliding clip protein of the organism Archaeoglobus fulgidus (see lanes 4 and 5).
  • FIG. 25 shows the expression and purification of the Archaeoglobus fulgidus DNA polymerase (see also Example 7):
  • Lane 1 shows a molecular weight standard ((BIO RAD Cat No. 161-0317).
  • 500 ⁇ l bacteria were sedimented directly before induction, treated and applied according to the instructions for running NuPage gels.
  • Lane 3 shows the same amount of bacteria after 16 hours
  • lanes 4 and 5 each show 8 ⁇ l of the two eluates of the Ni-Nta agarose column after dialysis
  • Lane 6 shows 8 ml of a dialyzed coarse extract
  • Lanes 4 and 5 show highly pure fractions of the Archaeoglobus fulgidus DNA polymerase, which are purified by purification over Ni -NTA- agarose are obtained.
  • FIG. 26 shows the results of the use of an in w ' fro complex according to the invention in the PCR.
  • Lane one shows a PCR reaction without using a glide clip
  • lane 2 shows the result of a PCR reaction using a glide clip protein.
  • Figure 27 shows the results of a "yeast two hybrid" experiment, referred to herein as a Y2H experiment, where row A is populated with cells carrying the empty pGAD424 vector (Clontech, Palo Alto, USA) so that the Transcription activation domain is expressed, the row B is populated with cells that carry the pGAD424 vector, of which the Sacharomyces cerevesiae gene CDC48 is expressed as a fusion protein with the transcription activation domain, the row C is populated with cells which carry the pGAD424 vector, of which the sliding clip gene from Archaeoglobus fulgidus is expressed as a fusion protein with the transcription activation domain, the row D is not is populated with cells and row E is populated with cells which carry the pGAD424 vector, from which the elongation protein gene from Archaeoglobus fulgidus is expressed as a fusion protein with the transcription activation domain.
  • Column 1 is populated with cells that carry the empty pGBT9 vector (Clontech, Palo Alto, USA) so that the DNA binding domain is expressed
  • column 2 is populated with cells that carry the pGBT9 vector, of which the Saccharomyces cerevisiae -Gen UFD3 is expressed as a fusion protein with the DNA binding domain
  • column 3 is populated with cells that carry the pGBT9 vector, from which the gliding clip protein from Archaeoglobus fulgidus is expressed as a fusion protein with the DNA binding domain
  • column 4 is populated with cells that carry the pGBT9 vector, from which the coupling protein from Archaeoglobus fulgidus is expressed as a fusion protein with the DNA binding domain
  • column 5 is populated with cells that carry the pGBT9 vector, from which the elongation protein from Archaeoglobus fulgidus as a fusion protein the DNA binding domain is expressed.
  • FIG. 28 shows the PCR amplification result of the human collagen gene in each case using the thermostable in w ' fro complex according to the invention and without it.
  • the expected amplificate has a size of approximately 1 Kb in both cases.
  • Lane 1 shows a molecular weight marker
  • lane 2 shows the result of the amplification using an elongation protein according to the invention without Slide clamp
  • track 3 shows the result of the amplification using the thermostable in w ' fro complex according to the invention.
  • the DNA is purified from the archaeoglobus fulgidus organism (DSM No. 4304) using known methods. The organisms were grown by the DSM (German Collection for Microorganisms).
  • DSM German Collection for Microorganisms.
  • primers are developed for each gene, which span the complete open reading frame including the stop codon.
  • the primer sequences also contain the start codon only for cloning in pTRC99.
  • the corresponding primers for cloning in pQE30 contain the nucleotides immediately following the start codon as the first gene-specific sequences.
  • restriction ends are added to the primers, which facilitate directed cloning into the expression vector.
  • PCR reactions are carried out with the appropriate annealing temperatures (approximately 35 cycles) and the resulting products are purified. After cleaning, the products are treated with restriction enzymes and purified on an agarose gel in order to be ready for ligation.
  • the expression vector is linearized, purified and diluted by means of restriction enzymes in such a way that it is used for ligation with the amplificates of the genes of the in vitro Complex from the above PCR is ready. The ligation is set up and, after incubation, an aliquot is transformed into one of the E.
  • IPTG is added for induction (125 mg / l). These cultures now grow another 4-21 hours.
  • the cultures are centrifuged and, starting from the vector pQE30, recombinant proteins expressed according to protocol 8 and 11 are extracted and purified from "The QIAexpressionist" (third edition, QIAGEN).
  • the pellets are taken up in a buffer (buffer A: 50 mM Tris -HCI pH 7.9, 50 mM dextrose, 1 mM EDTA. After centrifugation, the cells are taken up again, but buffer A now additionally contains lysozyme (4 mg / ml).
  • buffer B 10 mM Tris-HCl (pH 7.9), 50 mM KCI, 1 mM EDTA, 1 mM PMSF, 0.5% Tween 20, 0.5% Nonidet P40
  • B 10 mM Tris-HCl (pH 7.9), 50 mM KCI, 1 mM EDTA, 1 mM PMSF, 0.5% Tween 20, 0.5% Nonidet P40
  • the supernatant is removed by centrifugation and the overexpressed proteins are precipitated using (NH) 2 S0 4. After centrifugation, the pellets are collected and the proteins are resuspended with buffer A.
  • the resuspended proteins are washed against storage buffer (50 mM Tris HCI (pH 7.9), 50 mM KCI, 0.1 mM EDTA, 1 mM DTT, 0.5 mM PMSF, 50% glycerol) dialyzed and then stored at + 4 ° C to -70 ° C.
  • storage buffer 50 mM Tris HCI (pH 7.9), 50 mM KCI, 0.1 mM EDTA, 1 mM DTT, 0.5 mM PMSF, 50% glycerol
  • DNA polymerization activity is measured by incorporating (methyl- 3 H) TTP in trichloric acid-insoluble material or by incorporating digoxigenin-dUTP in unlabeled double-stranded DNA regions with free internal 3 ' ends (Ishino, Y., Iwasaki, H., Fukui, H., Mineno, J., Kato, I., & Schinigawa, H. (1992) Biochimie 74, 131-136). To determine the processivity, the above protein mixtures are used in primer elongation experiments.
  • An M13 single-strand template is introduced into 10 mM Tris-HCl (pH 9.4) and heated (92 ° C.) and cooled (room temperature) together with a universal primer (New England Biolabs) (5′-FITC labeled).
  • Dilution series of the template-primer mixture generated in this way are prepared in a reaction consisting of nucleotides (about 200 ⁇ M to 1 mM), reaction buffer (final concentration: 50 mM KCI, 10 mM Tris-HCl (pH 8.3), 1.5-5 mM MgCI 2 , ATP (0 mM - 200 mM) and protein-stabilizing agents are combined and incubated for 10 minutes at 37 ° C, 52 °, 62 °, 68 °, 74 °, and 78 °.
  • protein mixtures above also serve to measure fidelity and exonuclease activity, whereby the methods described in Kohler et al. (Proc. Natl. Acad. Sci. USA 88: 7958-7962 (1991) or Chase et al. (J. Biol. Chem., 249: 4545-4552 (1972).
  • the protein mixtures in PCR was used (Fig. 26; Methods in Molecular Biology Vol. 15 Humana Press Totowa, New Jersey, 1993, edited by Bruce A. White).
  • FIG. 20A shows His-tagged proteins in fractions 15 (lane 1), 17 (lane 2), 19 (lane 3), 21 (lane 4), 23 (lane 5), 25 (lane 6) or without Urea carried out Chromatography.
  • Example 3 Isolation, provision and use of an elongation protein (Pyrococcus horikoshii DNA polymerase (PH1947)) for the formation of the fro complex according to the invention.
  • an elongation protein Pyrococcus horikoshii DNA polymerase (PH1947)
  • the elongation protein from Pyrococcus horikoshii (Pyrococcus horikoshii DNA polymerase (PH 1947)) was used in PCR reactions and leads to efficient amplification of a specific DNA product.
  • each reaction contained 5 ng template DNA (421 bp Rsa I fragment cloned with adapters in PCR 2.1; (Kaiser C, v.
  • the samples went through 40 cycles of 30 s at 95 ° C; 30 s at 55 ° C and 120 s at 68 ° C. 5 ⁇ l of the batches were then removed and separated on a 1% agarose gel in 1 ⁇ TAE buffer (40 mM Tris acetate; 20 mM sodium acetate; 10 mM EDTA; pH 7.2) at 10 V / cm.
  • the Archaeoglobe fw / g / ' dus DNA polymerase AF 0497 can generate PCR products as efficiently as Taq polymerase.
  • 1 unit Taq polymerase and 1 ⁇ l Archaeoglobus fu / g / dus DNA polymerase AF 0497 crude extract (see 25) were used individually in standard PCR reactions to compare the activity.
  • Each reaction contained 20 ng M13 MP18 ssDNA in addition to the enzyme; 0.2 mM each of dATP, dTTP, dCTP and dGTP; 1.5 ⁇ M DNA each Primer of the following nucleotide sequence:
  • GGATTGACCGTAATGGGATAGGTTACGTT SEQ ID NO .: 47
  • AGCGGATAACAATTTCACACAGGAAACAG SEQ ID NO .: 48
  • the samples went through a different number of cycles consisting of 30 s at 95 ° C; 30 s at 59 ° C and 60 s at 68 ° C.
  • the final components of a 50 ⁇ l volume included the following components of an in w ' fro complex according to the invention: 10 mM Tris / HCl pH 7.5; 50 mM KCI; 2 mM MgCl 2 ; 10 ⁇ g BSA (can also be omitted); 0.5 mM digoxigenin-dUTP (DIG-dUTP, Boehringer Mannheim); 40 nM; 0.5 ⁇ g poly dA / 40 nM OligodT (20mer) hybrid. Sample 1 without elongation protein.
  • Samples 2-12 also contained 3 ⁇ l of a 1: 1000 dilution of a fraction of recombinant Archaeoglobus ftv / g / dus DNA polymerase (elongation protein). Samples 3-7 and 8-12 also 0.5; 1 ; 2; 4 and 8 ⁇ l of a fraction of recombinant slide clamp protein from Archaeoglobus fulgidus.
  • the samples were incubated at 68 ° C. for 30 minutes and then nucleic acids by precipitation with 3 parts by volume of ethanol / 3 M sodium acetate pH 5.2 (30/1). Like. The precipitate was resuspended in 20 ⁇ l 100 mM Tris-HCl (pH 7.9) and 10 ⁇ l each in individual cavities of a 96-well silent screen plate with Nylon 66 Biodyne B 0.45 ⁇ m pore (Nalge Nunc) dripped on and the nucleic acids fixed for 10 minutes at 70 ° C on the membrane. Incorporated digoxigenin-dUTP (Boehringer Mannheim) was detected using the DIG Luminiscent Detection Kit for Nucleic Acids (Boehringer Mannheim).
  • PCNA clearly stimulates the integration of DIG-dUTP by the DNA polymerase (cf. lanes 3-7 with lane 2).
  • the PCNA fraction used has no endogenous polymerase activity (lanes 8-12).
  • Example 6 Amplification; Cloning, Expression and Purification of a
  • Archipelaginus protein from Archaeoglobus fulgidus is Archipelaginus protein from Archaeoglobus fulgidus:
  • Example 7 Provision of an elongation protein Expression and purification of the archaeoglobus fu / g / dus DNA polymerase: pQE 30 plasmid DNA (QIAGEN) with the gene inserted in the correct reading frame for the elongation protein, the Archaeoglobus fulgidus DNA polymerase AF 0497, was followed Instructions from "The QIAexpressionist (third edition; QIAGEN)" transformed into competent E.coli M15 [prep 4]. Transfer to 1 L culture medium and induced protein expression also took place according to the schemes given there. After an induction time of 16 hours, the bacteria were sedimented for 10 minutes at 5000 g.
  • QIAGEN plasmid DNA
  • the QIAexpressionist (third edition; QIAGEN; protocol 8, protocol 11) was used to obtain highly pure fractions. Only the bound proteins were eluted with 2 x 2 ml elution buffer and not as described there with 4 x 0.5 ml elution buffer. To obtain crude extracts from recombinant proteins, the bacterial sediments were alternatively washed with 100 ml of buffer A (50 mM Tris-HCl pH 7.9; 50 mM glucose; 1 mM EDTA) and, after renewed centrifugation, resuspended in 50 ml of buffer A with 4 mg / ml of lysozyme .
  • buffer A 50 mM Tris-HCl pH 7.9; 50 mM glucose; 1 mM EDTA
  • lysis buffer (10 mM Tris-HCl pH 7.9; 50 mM KCI; 1 mM EDTA; 0.5% Tween 20; 0.5% IGPAL) and E. coli proteins were added Incubated for 60 minutes at 75 ° C in a water bath. After subsequent centrifugation for 15 minutes at 27,000 g, the supernatant was precipitated by slowly adding 40 mg of crystalline ammonium sulfate per ml of extract with permanent stirring. Precipitated proteins were sedimented at 27000 g for 10 minutes and the sediment was resuspended in 20 ml of buffer A.
  • Example 8 Use of an In Vitro Complex According to the Invention in PCR
  • each reaction contained a PCR-amplified and unpurified PCNA gene fragment (PCR reaction for specific amplification of the PCNA fragment: 0.5 ⁇ l Archeoglobus fulgidus polymerase; 0.2 mM each dATP, dTTP, dCTP and dGTP; 1.5 ⁇ M each of the specific primers (5 ' -ACG CGC GGA TCC ATA GAC GTC ATA ATG ACC GG- 3 '(SEQ ID No .: 49); 5 ' -TAC GGG GTA CCC GAG CCA AAA TTG GGT AAA G-3 '(SEQ ID No.:50); 50 mM KCI; 2 mM MgCI 2 ; 10 mM Tris- HCI (pH 7.5) and 50
  • a positive control was also amplified by PCR, cloned into the vectors pGBT9 (see also vertical columns in FIG. 27) and pGAD424 (see also horizontal rows in FIG. 27) and by gap repair in the yeast strain PJ69-4a (for pGAD424 ) and PJ69-4alpha (for pGBT9) as hybrid proteins. Diploid cells containing both vectors were generated by pairing according to the grid shown in Fig. 27. The expression of three independent reporters (HIS3, ADE2 and MEL1) was measured. The growth on medium without histidine and adenine is shown in FIG. 27. In this experiment, the cells that carry both vectors and in which the cells also grow Expression products of these two vectors bind to each other. As a result of the binding of the expression products, transcription of the reporter genes is initiated, so that the histidine and adenine auxotrophy are abolished and these cells are able to grow in said medium.
  • Fig. 27 shows a binding between the proteins of the positive control, the elongation protein and the glide clip protein, the glide clip protein and the glide clip protein and the coupling protein and the glide clip protein.
  • thermostable in w ' fro complex according to the invention can be used very well in the amplification of genomic DNA fragments. This results in efficient amplification even when using small amounts of a template or an elongation protein.
  • Example 10 a section of the human collagen gene was amplified, once using the thermostable in w ' fro complex according to the invention and once using an elongation protein alone.
  • nucleotide mix 25 mM starting solution containing each nucleotide A, C, G and T
  • 0.2 ⁇ l of each primer 100 pmol / ⁇ l starting solution “collagen forward” 5′-TAA AGG GTC ACC GTG GCT TC-3 '(SEQ ID NO .: 53), 100 pmol / ⁇ l starting solution "collagen reverse”5'- CGA ACC ACA TTG GCA TCA TC-3' SEQ ID NO .: 54), 0.8 ⁇ l DNA (200 ng / ul human genomic DNA from Boehringer Mannheim), 5 ul 10 x PCR buffer (pH 7.5) (100mM Tris-HCl pH7.5, 500mM KCI, 15mM MgCI 2 ), 1 ⁇ l elongatin protein (AF1722, 7.5 ⁇ g / ⁇ l protein concentration) and 8 ⁇ l slide clamp protein (AF 0335, protein concentration 0.3

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

Der erfindungsgemäße thermostabile in vitro-Komplex zur Template-abhängigen Elongation von Nukleinsäuren umfaßt ein thermostabiles Gleitklammerprotein und ein thermostabiles Elongationsprotein.

Description

Thermostabiler in vitro Komplex mit Polymeraseaktivität
Beschreibung
Die Erfindung betrifft einen thermostabilen in wϊro-Komplex zur Templateabhängigen Elongation von Nukleinsäuren, einen thermostabilen in vitro Komplex sowie dafür kodierende DNA-Sequenzen und Vektoren. Die Erfindung betrifft weiterhin die Verwendung der erfindungsgemäßen Komplexe in Verfahren zur Template-abhängigen Elongation von Nukleinsäuren, wie PCR Reaktionen reversen Transkription, DNA-Markierung oder DNA- Sequenzierung, bei denen in vitro Template-abhängige DNA Strangsynthese erfolgt. Schließlich betrifft die Erfindung noch Kits bzw. Reagenzien kits zur Durchführung der erfindungsgemäßen Verfahren.
DNA-Polymerasen gehören zu einer Gruppe von Enzymen, die einzelsträngige DNA als Template für die Synthese eines komplementären DNA Stranges verwenden. Diese Enzyme spielen eine bedeutende Rolle im Nukleinsäurestoffwechsel, einschließlich der Prozesse DNA-Replikation, Reparatur und Rekombination. DNA-Polymerasen wurden in allen zellulären Organismen identifiziert, von bakteriellen bis zu menschlichen Zellen, in vielen Viren sowie in Bakteriophagen (Kornberg, A. & Baker, T. A. (1991 ) DNA Replikation WH Freeman, New York, NY). Man faßt in der Regel die Archaebakterien und die Eubakterien zusammen zu der Gruppe der Prokaryonten, der Organismen ohne echten Zellkern, und stellt ihnen die Eukaryonten, die Organismen mit echtem Zellkern, gegenüber. Gemeinsam sind vielen Polymerasen aus den verschiedensten Organismen oftmals Ähnlichkeiten in der Aminosäuresequenz sowie Ähnlichkeiten in der Struktur (Wang, J., Sattar, A.K.M.A.; Wang, C.C., Karam, J.D., Königsberg, W.H. & Steitz, T.A. (1997) Crystal Structure of pol α familily replication DNA polymerase from bacteriophage RB69.Cell 89, 1087-1099). Organismen wie der Mensch besitzen eine Vielzahl von DNA-abhängigen Polymerasen, von denen jedoch nicht alle für die DNA-Replikation zuständig sind, sondern einige auch DNA-Reparatur durchführen. Replikative DNA-Polymerasen bestehen in vivo meist aus Proteinkomplexen mit mehreren Einheiten, welche die Chromosomen der zellulären Organismen und Viren replizieren. Eine generelle Eigenschaft dieser replizierenden Polymerasen ist im allgemeinen eine hohe Prozessivität, das heißt, deren Fähigkeit, Tausende von Nukleotiden zu polymerisieren ohne vom DNA Template abzudissoziieren (Kornberg, A. & Baker, T. A. (1991) DNA Replikation. WH Freeman, New York, NY).
Im Stand der Technik sind hochprozessive Replikationsmechanismen bekannt, wobei es sich dabei zum einen um zelluläre Mechanismen und zum anderen um die bei den Bakteriophagen T4 und T7 auftretetenden Repliaktionsmechanismen handelt.
Der Repliaktionsapparat umfaßt eine Vielzahl von Komponenten. Dazu gehören, unter anderem, a) Polymeraseaktivität aufweisende Proteine, b) Proteine, die an der Ausbildung einer Klammerstruktur beteiligt sind, wobei der Klammerstruktur unter anderem die Aufgabe zukommt, eine Polymeraseaktivität an ihr Template zu binden, die Bindung zu stabilisieren und somit die Dissoziationskonstante entsprechend zu ändern, c) Proteine, welche die Klammer auf das template laden, d) Proteine, welche das Template stabilisieren und gegebenenfalls e) Proteine, welche die Polymerase an das Template führen .
Die unter b) genannten Proteine bilden Strukturen aus, die entweder offen oder geschlossen sind, beispielsweise ringförmige oder halbringförmige Strukturen. Derlei Strukturen können durch eine oder mehrere Spezies von Proteinen ausgebildet werden. Dabei ist es möglich, daß eine der besagten Proteinspezies eine Polymeraseaktivität aufweist. Die für die Ausbildung dieser Strukturen verantwortlichen Proteine werden, sofern sie keine Polymeraseaktivität aufweisen, hierin im folgenden als „Gleitklammerproteine" oder „Klammerproteine" bezeichnet. 5
Beispielhaft sei für einen prozessiven Replikationsapparat, der nicht geschlossen ringförmig ist, auf denjenigen des Bakteriophagen T4 oder T7 hingewiesen.
10 Beispielhaft sei für einen prozessiven Replikationsapparat, der geschlossen ringförmig ist, auf denjenigen des Bakteriums E. coli hingewiesen (Stukenberg, P.T., Studwell-Vaughan, P.S.& O'Donell, M. (1991 ) Mechanism of the ß-clamp of DNA polymerase III holoenzyme. J. Biol. Chem. 266, 11328-11334; Kuriyan, J. & O'Donnel, M. (1993) Sliding clamps of DNA polymerases. J.Mol.Biol.234,
15 915-925).
Es ist bekannt, daß der Replikationsapparat in Archaebakterien dem eukaryontischen Replikationsapparat ähnlich ist, obwohl die Genomorganisation in Eukaryonten und Archaebakterien gänzlich verschieden 20 ist und die zelluläre Struktur der Eubakterien dem der Archaea ähnelt. (Edgell, D.R. and Doolittle, W.F. (1997). Archaea and the origin(s) of DNA replication proteins. Cell 89, 995-998.).
Die Gleitklammer ist häufig über ein oder mehrere weitere Proteine an ein 25 Elongationsprotein gebunden, mit anderen Worten an das Elongationsprotein gekoppelt. Ein derartiges koppelndes Protein wird hierin im folgenden als Kopplungsprotein oder koppelnde Untereinheit bezeichnet, wobei gegebenfalls die Kopplung über eine Mehrzahl von Kopplungsproteinen erfolgen kann.
30 Unter Elongationsprotein soll hierin im übrigen ein Polymeraseaktivität- aufweisendes Protein oder Komplex verstanden werden, das oder der mindestens eine oder mehrere der folgenden Eigenschaften aufweißt: Verwendung von RNA als Template zur Synthese von DNA und/oder RNA, Verwendung von DNA als Template zur Synthese von DNA und/oder RNA, Synthese von RNA, Synthese von DNA, Synthese von Nukleinsäuren aus DNA und RNA, Exonukleaseaktivität in 5'-3'- Richtung und Exonukleaseaktivität in 3'-5'-Richtung, Strangverdrängungsaktivität (strand-displacement activity) Thermostabilität und Prozessivität oder Nicht-Prozessivität.
Die dreidimensionale Struktur von verschiedenen Gleitklammerproteinen wurde bereits bestimmt:
- die des eukaryontischen proliferating cell nuclear antigen (PCNA) (Krishna, T.S.R., Kong, X.-P., Gary, S., Burgers, P. M. & Kuriyan, J. (1994) Crystal structure of the eukaryotic DNA polymerase processivity factor PCNA. Cell 79, 1233-1243; Gulbis, J. M., Kelman, Z., Hurwitz, J., O'Donnel, M. & Kuriyan, J. (1996) Structure of the C-terminal region of p21WAF1/CIP1 complexed with human PCNA. Cell 87, 297-306),
- die der ß-Untereinheit der Polymerase III des Eubakteriums Escherichia coli (Kong, X.-P., Onrust, R., O'Donnell, M. & Kuriyan; J. (1992) Three dimensional structure of the ß-subunit of Escherichia coli DNA polymerase III holoenzyme; a sliding DNA clamp. Cell 69, 425-437)
- und die des Gen45-Proteins des Bakteriophagens T4 Proteins (Kelman, Zvi, Hurwitz, J. O'Donnel, Mike (1998) Structure, 6, 121-125).
Die Gesamtstruktur dieser Gleitklammern ist sehr ähnlich; die Bilder der ringförmig ausgebildeten Proteingesamtstruktur von PCNA, der ß-Untereinheit und gp45-Ringe sind übereinandergelegt deckungsgleich (Kelman, Z. & O'Donnell, M. (1995) Structural and functional similarities of prokaryotic and eukaryotic sliding clamps. Nucleic Acids Res. 23, 3613-3620). Jeder Ring hat vergleichbare Dimensionen und eine zentrale Öffnung, die groß genug ist, um Duplex-DNA, also einen DNA-Doppelstrang, bestehend aus den zwei komplementären DNA-Strängen, zu umschließen. Die Gleitklammer kann sich in vivo nicht selbst um die DNA herum positionieren, sondern muß um die DNA fixiert werden. In Prokaryonten und Eukaryonten besteht ein derartiger Proteinkomplex aus einer Vielzahl von Untereinheiten, der beim Eubakterium Escherichia coli γ-Komplex und beim Menschen Replikationsfaktor C (RF-C) genannt wird (Kelman, Z. & O'Donnell, M. (1994) DNA replication - enzymology and mechanisms. Curr. Opin. Gent. Dev. 4, 185-195). Der Proteinkomplex erkennt das 3'-Ende des Primers des „Primer-Template-Duplexes" und positioniert die Gleitklammer in Anwesenheit von ATP um die DNA.
Im Falle des Bacteriophagen T7 wird das gleiche Ziel, eine prozessive DNA- Synthese, mittels eines strukturell anderen Proteinkomplexes erreicht. Der Phage exprimiert eine eigene katalytische Polymerase, die T7-Polymerase, die das Genprodukt des gene 5, welche mit einem Protein aus dem Wirt Escherichia coli, dem Thioredoxin, eine Bindung eingeht und als Replikase eine hochprozessive DNA-Replikation ermöglicht (Proc. Natl. Acad. Sei. U S A 1992 Oct 15; 89(20):9774-9778 Genetic analysis of the interaction between bacteriophage T7 DNA polymerase and Escherichia coli thioredoxin, Himawan JS, Richardson CC). Auch hierbei kommt es zur Klammerbildung, jedoch weist diese Klammer nicht die gleiche Struktur auf, wie z.B. im Falle des eukaryontischen PCNA.
Oft ist es nötig, wie zum Beispiel im Falle der humanen Polymerase δ, daß Kopplungsproteine eine Verbindung zwischen dem katalytisch aktiven Teil der Polymerase und dem Prozessivitätsfaktor (Gleitklammer) zu schaffen. Beim Menschen ist dies die kleine Untereinheit der δ-Polymerase (Zhang, S.-J., Zeng, X.-R., Zhang, P., Toomey, N.L, Chuang, R.Y., Chang, L-S., and Lee, M.Y.W.T. (1994). A conserved region in the amino terminus of DNA polymerase δ is involved in proliferating cell nuclear antigen binding. J. Biol. Chem. 270, 7988-7992). Im Falle der T7 Polymerase jedoch bindet der Prozessivitätsfaktor die katalytische Einheit der Polymerase direkt.
DNA-Polymerasen werden unter anderem durch zwei Eigenschaften charakterisiert, ihre Elongationsrate, das heißt die Anzahl der Nukleotide, die sie pro Sekunde in einen wachsenden DNA-Strang inkorporieren können, und ihre Dissoziationskonstante. Wenn die Polymerase nach jedem Inkorporationsschritt eines der Nukleotide in die wachsende Kette wieder vom Strang abdissoziiert (d.h. ein Elongationsschritt erfolgt pro Bindungsereignis), dann hat die Prozessivität den Wert 1 und die Polymerase ist nicht prozessiv. Diese Synthese wird distributiv genannt. Wenn die Polymerase für wiederholte Nukleinsäureinkorporationen mit dem Strang verbunden bleibt, dann wird der Replikationsmodus als prozessiv bezeichnet und kann einen Wert von mehreren Tausend erreichen (siehe hierzu auch: Methods in Enzymology Volume 262, DNA Replication, Edited by J. L. Campbell, Academic press 1995, pp. 270-280)
Für die meisten in vitro Anwendungen, wie PCR oder Sequenzierungsprozesse, ist Prozessivität eine wünschenswerte Eigenschaft, die allerdings die bislang in diesen Reaktionen eingesetzten thermostabilen Enzyme nur in geringem Maße besitzen, wohingegen die temperaturempfindlichen, mit Thioredoxin assoziierte T7 Polymerase eine Prozessivität von einigen tausend Nukleotiden aufweist. Im Vergleich - die thermostabile DNA-Polymerase aus Thermus thermophilus oder Thermus aquaticus haben nur eine Prozessivität von etwa 50 Nukleotiden (Biochim Biophys Acta 1995 Nov 7;1264(2):243-248 Inactivation of the 5'-3' exonuclease of Thermus aquaticus DNA polymerase. Merkens LS, Bryan SK, Moses RE).
Die U.S. Patente 4,683,195, 4,800,195 und 4,683,202 beschreiben die Anwendung solcher thermostabiler DNA-Polymerasen in der Polymerase-
Kettenreaktion (PCR). In der PCR wird unter Verwendung von Primem, Template (auch Matrize genannt), Nukleotiden, einer DNA-Polymerase eines entsprechenden Puffers und geeigneten Reaktionsbedingungen DNA neu synthetisiert. Hierbei wird üblicherweise von einer doppelsträngigen DNA- Sequenz ausgegangen, von der ein bestimmter Zielbereich amplifiziert werden soll. Hierbei werden zwei Primer eingesetzt, welche zu flankierenden Bereichen der Zielsequenz auf jeweils einem Teilstrang des DNA-Doppelstranges komplementär sind. Zur Anhybridisierung der Primer werden allerdings die DNA-Doppelstränge zuerst denaturiert, insbesondere thermisch aufgeschmolzen. Nach Anhybridisierung der Primer erfolgt eine Elongation mittels der Polymerase. Daraufhin wird nochmals denaturiert und damit die neu gebildeten DNA-Stränge von den Template-Strängen getrennt, woraufhin für einen weiteren Elongationszyklus neben den ursprünglichen Template- Strängen auch die im ersten Schritt gebildeten Nukleinsäure-Stränge als Template zur Verfügung stehen, diese jeweils erneut mit Primern hybridisiert werden und eine erneute Elongation stattfindet. Diese Vorgehensweise wird zyklisch durchgeführt unter jeweils thermischer Denaturierung als Zwischenschritte. Bei der PCR kommt es bevorzugt zur Verwendung einer thermostabilen Polymerase, welche das zyklische, thermische Aufschmelzen der DNA Stränge übersteht. So wird häufig Taq DNA-Polymerase verwendet (U.S. Patent 4,965,188). Die Prozessivität der Taq DNA-Polymerase ist jedoch, wie oben ausgeführt, relativ gering im Vergleich zur T7-Polymerase.
DNA-Polymerasen finden auch bei der DNA-Sequenzbestimmung Anwendung (Sanger et al., Proc. Natl. Acad. Sei., USA 74:5463-5467 (1997)). Häufig wird bei der Sequenzierung nach Sanger eine T7-DNA-Polymerase verwendet (Tabor, S. und Richardson, CC. Proc. Natl. Acad. Sei., USA 86:4076-4080 (1989)). Später wurde das Cycle-Sequencing-Verfahren entwickelt (Murray, V. (1989) Nucleic Acids Res. 17, 8889), welches kein einzelsträngiges Template erfordert und die Initiierung der Sequenzreaktion mit verhältnismäßig geringen Mengen an Template erlaubt. Die hierbei zur Verwendung kommenden Polymerasen können z.B. die oben erwähnte Tag-Polymerase sein (U.S. Patent 5,075, 216) oder die Polymerase von Thermotoga neapolitana (WO 96/10640) oder andere thermostabile Polymerasen. Neuere Verfahren koppeln die exponentielle Amplifikation und die Sequenzierung eines DNA-Fragmentes in einem Schritt, so daß es möglich ist, genomische DNA direkt zu 5 sequenzieren. Eines der Verfahren, das sogenannte DEXAS-Verfahren (Nucleic Acids Res 1997 May 15;25(10):2032-2034 Direct DNA sequence determination from total genomic DNA. Kilger C, Pääbo S, Biol. Chem. 1997 Feb; 378(2):99-105 Direct exponential amplification and sequencing (DEXAS) of genomic DNA. Kilger C, Pääbo S und DE 19653439.9 sowie DE
10 19653494.1 ), verwendet eine Polymerasen mit verminderter Diskriminierungsfähigkeit gegenüber Dideoxynukleotiden (ddNTPs) im Vergleich zu Deoxynukleotiden (dNTPs) sowie einen Reaktionspuffer, zwei Primer, die bevorzugt nicht äquimolar vorliegen, und die oben genannten Nukleotide, um dann in mehreren Zyklen eine komplette, sequenzspezifische
15 DNA-Leiter eines Fragmentes zu erhalten, welches von den Primern flankiert ist. Eine Weiterentwicklung dieses Verfahrens besteht in der Verwendung eines Polymerasegemisches, wobei eine der beiden Polymerasen zwischen ddNTPs und dNTPs diskriminiert, während die zweite eine verminderte Diskriminierungsfähigkeit aufweist (Nucleic Acids Res. 1997 May 15;
20 25(10):2032-2034 Direct DNA sequence determination from total genomic DNA. Kilger C, Pääbo S).
DNA-Polymerasen finden auch Anwendung bei der reversen Transkription von RNA in DNA. Hierbei dient RNA als Template und die Polymerase synthetisiert 25 einen komplementären DNA-Strang. Zur Anwendung kommt hier z.B. die thermostabile DNA-Polymerase aus dem Organismus Thermus thermusphilus (Tth) (U.S. Patent 5,322,770).
Es kann auch vorkommen, daß die Polymerase eine 'proof-reading' Aktivität
30 besitzt, also eine 3'-5' Exonukleaseaktivität aufweist. Diese Eigenschaft ist insbesondere dann wünschenswert, wenn das zu synthetisierende Produkt mit einer niedrigen Fehlerrate bei der Nukleotidinkorporation hergestellt werden soll. Ein Beispiel stellen Polymerasen aus dem Organismus Pyrococcus wosei dar.
Die oben genannten Enzyme, die üblicherweise in PCR-Reaktionen eingesetzt werden, gehören in vivo größtenteils nicht zu den eigentlichen Replikationsenzymen, sondern es sind zumeist Enzyme, von denen man annimmt, daß sie bei der DNA-Reparatur beteiligt sind, weshalb deren Prozessivität relativ gering ist.
Somit war es eine Aufgabe der vorliegenden Erfindung, mehrere der vorgenannten Eigenschaften von Polymerasen, insbesondere hohe Prozessivität und Thermostabilität, für die Verwendung in in vitro Reaktionen zu vereinen.
Diese Aufgabe wurde erfindungsgemäß gelöst durch die Bereitstellung eines thermostabilen in v/Yro-Komplexes, umfassend ein thermostabiles Gleitklammerprotein und ein thermostabiles Polymeraseaktivität-aufweisendes Elongationsprotein. Der erfindungsgemäße Komplex kann dabei zur Template- abhängigen Elongation von Nukleinsäure(n) dienen.
Dieser Komplex kann in in wfro-Reaktionen, wie z.B. in PCR-Reaktionen, eingesetzt werden und weist dabei eine hohe Prozessivität auf. Von Vorteil ist zudem, daß der Komplex eine geringe Fehlerquote bei der Nukleotidinkorporation aufweist, also eine erhöhte Genauigkeit beim Baseneinbau hat. Dieser Komplex kann somit bei der Elongation, der Amplifikation, der Reversen Transkription, DNA-Markierung und der Sequenzierung von Nukleinsäuren in vorteilhafter Weise eingesetzt werden. Die vorstehend aufgezeigten Verwendungsmöglichkeiten stellen jeweils für sich besonders bevorzugte Ausführungsformen der Erfindung dar. lm Falle der Verwendung des erfindungsgemäßen Komplexes zur Amplifikation von Nukleinsäurensäuren wurde überraschend festgestellt, daß das dabei hergestellte Amplifikationsprodukt eine besonders niedrige Basenfehlinkorporationsrate aufweist.
Bei der Verwendung eines solchen Komplexes, beispielsweise in Standard- PCR-Reaktionen, wird eine einfache Handhabung und eine hohe Prozessivität gewährleistet, wie dies beispielsweise aus Fig. 26 ersichtlich ist.
In einer Ausführungsform ist vorgesehen, daß bei dem erfindungsgemäßen in ϊro-Komplex das Gleitkammerprotein mit dem Elongationsprotein verbunden ist.
In einer bevorzugten Ausführungsform des erfindungsgemäßen thermostabilen in 'fra-Komplexes sind das Gleitklammerprotein und das Elongationsprotein über ein Kopplungsprotein verbunden.
Die Kopplung zwischen Gleitklammerprotein und Polymeraseaktivität aufweisendem Elongationsprotein kann durch kovalente, aber auch durch nicht-kovalente Bindung erfolgen. In einer bevorzugten alternativen Ausführungsform ist vorgesehen, daß eine direkte Kopplung zwischen Gleitklammerprotein und Elongationsprotein erfolgt.
Dabei kann vorgesehen sein, daß das Gleitklammerprotein und/oder das Elongationsprotein aus Archaebakterien stammen.
In einer bevorzugten Ausführungsform des erfindungsgemäßen Komplexes handelt es sich um einen prokaryontischen in w'fro-Komplex. In einer bevorzugten Ausführungsform kann es sich bei dem erfindungsgemäßen prokaryontischen Komplex um einen archaebakteriellen in v/fro-Komplex handeln.
In einer bevorzugten alternativen Ausführungsform kann es sich bei dem erindungsgemäßen prokaryontischen Komplex um einen eubakteriellen in vitro- Komplex handeln.
In einer alternativen Ausführungsform des erfindungsgemäßen Komplexes handelt es sich um einen eukaryontischen in v/fro-Komplex.
In diesem Zusammenhang ist ein prokaryontischer in v/fro-Komplex ein solcher, bei dem das Gleitklammerprotein prokaryontischen Ursprungs ist unabhängig vom Ursprung des Elongationsproteins. Entsprechend ist ein eubakterieller Komplex ein solcher, bei dem das Gleitklammerprotein eubakteriellen Ursprungs ist, unabhängig vom Ursprung des Elongationsproteins. Entsprechend ist ein archaebakterieller Komplex ein solcher, bei dem das Gleitklammerprotein archaebakteriellen Ursprungs ist, unabhängig vom Ursprung des Elongationsproteins. Entsprechend ist weiterhin ein eukaryontischer Komplex ein solcher, bei dem das Gleitklammerprotein eukaryontischen Ursprungs ist, unabhängig vom Ursprung des Elongationsproteins.
Gegenstand der vorliegenden Erfindung sind ebenfalls solche thermostabilen in wYro-Komplexe, bei denen die die Komplexe aufbauenden Proteine zum Teil aus Archaebakterien, Eukaryonten und aus Eubakterien stammen. Insoweit sind jegliche Permutationen der in ϊro-Komplexe hinsichtlich der Proteinkomponenten und ihres jeweiligen Ursprunges Gegenstand der vorliegenden Erffindung. Ursprung im vorstehenden Sinne soll dabei jene Quelle bezeichnen, auf die das Gen, die Geninformation oder das Protein zurückzuführen ist.
Davon unabhängig ist die tatsächliche Art und Weise der Gewinnung des Gleitklammerproteins bzw. des Elongationsproteins, die beispielsweise durch chemische Synthese, gentechnologische Verfahren oder Isolierung aus den natürlichen Quellen erfolgen kann.
Insbesondere ist Gegenstand der Erfindung ein thermostabiler prokaryontischer in wϊro-Komplex zur Elongation, insbesondere zur Template- abängigen Elongation von Nukleinsäuren, der ein thermostabiles Gleitklammerprotein (Fig. 20), welches die komplementären Nukleinsäurestränge ganz oder teilweise umschließt, und ein thermostabiles, Polymeraseaktivität (Fig. 21 und Fig. 22) aufweisendes Protein umfaßt, wobei dieses Protein oder dieser Proteinkomplex mit dem Gleitklammerprotein gekoppelt oder assoziiert ist.
Im Rahmen der vorliegenden Erfindung umfaßt der Begriff Polymeraseaktivität- aufweisendes Elongationsprotein auch Polymeraseaktivität-aufweisende Proteinkomplexe oder Untereinheiten solcher Komplexe, welche die Polymeraseaktivität tragen.
Thermostabil im Sinne der vorliegenden Erfindung bedeutet, daß der in vitro- Komplex mit hoher Prozessivität Nukleotide in wachsende Nukleinsäurestränge inkorporiert, sowohl bei niedrigen als auch bei hohen Temperaturen, die in der PCR oder einer anderen Reaktion auftreten, wie z.B. der DNA-Sequenzierung.
Die PCR besteht z.B. in der Regel aus den Schritten der Denaturierung (70°C bis 98°C), dem Annealing (40°C bis 78°C) und der DNA-Strangsynthese (60°C bis 76°C). Somit muß dieser Komplex mindestens zwischen ca. 60°C und ca.
70°C, bevorzugt insbesondere zwischen 60°C und 76°C und besonders bevorzugterweise funktionsfähig sein zwischen 40°C und 98°C. Es dürfen während der gesamten Reaktion keine irreversiblen
Denaturierungserscheinungen des Komplexes oder einzelner Komponenten auftreten, welche die Elongationsreaktion unterbinden oder inhibieren.
Die Gleitklammer
Die folgenden Ausführungen sollen dazu dienen, die Funktion und die möglichen Erscheinungsformen der Gleitkammer bzw. des Gleitklammerproteins zu veranschaulichen.
Das Gleitklammerprotein erfüllt die Funktion, das Elongationsprotein an die DNA zu binden. Wie eingangs bereits ausgeführt, umschließt das Gleitklammerprotein selbst die einzelsträngige oder doppelsträngige Nukleinsäure ganz oder teilweise oder durch Assoziation an das Polymeraseaktivität aufweisende Protein beziehungsweise an den Polymeraseaktivität-aufweisenden Proteinkomplex oder eine Untereinheit davon und bildet dadurch eine Klammer um die Nukleinsäure aus. In jedem Fall wird durch diese Klammerbildung die Prozessivität signifikant gesteigert, mindestens um das Eineinhalbfache (Beispiel 5 und Fig. 23).
Das heißt, der erfindungsgemäße in v/Yro-Komplex besitzt eine mindestens eineinhalbfache Prozessivität im Vergleich zu einem Elongationsprotein alleine, beziehungsweise im Vergleich zu einem Polymeraseaktivität-aufweisenden Proteinkomplex, bzw. einer Untereinheit davon, ohne Gleitklammer (Beispiel 5 und Fig. 23).
Als Gleitkammer können erfindungsgemäß beispielsweise Homologe oder Funktionsanaloge des "Proliferating Cell Nuclear Antigen"-Protein komplexes, kodiert im menschlichen Genom, oder Homologe des ebenfalls ringförmigen "ß-clamp"-Proteinkomplex aus E. coli dienen, welche aus thermostabilen Organismen stammen und thermostabil sind, oder sofern sie nicht-thermostabil sind, thermostabil gemacht werden, oder aus nicht thermostabilen Organismen stammen und thermostabil sind bzw. nachträglich durch Veränderung der Aminosäuresequenz thermostabil gemacht werden (Eijsink VG, van der Zee JR, van den Burg B, Vriend G, Venema G, FEBS Lett 1991 Apr 22;282(1 ):13- 16, Improving the thermostability of the neutral protease of Bacillus stearothermophilus by replacing a buried asparagine by leucine, Bertus Van den Burg, Gert Vriend, Oene R. Veltman, Gerard Venema, and Vincent G. H. Eijsink Engineering an enzyme to resist boiling PNAS 1998 95: 2056-2060). Unter homologen Sequenzen soll hierin im folgenden Sequenzen verstanden werden, die sich dadurch auszeichnen, daß sie zu einer oder mehreren anderen Sequenzen eine Sequenzähnlichkeit aufweisen und zwar in einem Maße, bei dem nicht von einer zufälligen Ähnlichkeit ausgegangen werden kann. Der Grad der Sequenzähnlichkeit wird in Prozent ausgedrückt und Homologie genannt. Bisweilen wird auch der Begriff „Sequenzidentität" verwendet. Ein Homolog ist eine Nukleinsäure oder Aminosäuresequenz, welche zu einer Bezugssequenz eine homologe Sequenz ist.
Die Gleitklammer kann aus mehreren Komponenten aufgebaut sein. Die im menschlichen Genom identifizierte Gleitklammer besteht aus drei PCNA- Protein Komponenten (SEQ ID NO: 11 ) (Homotrimeres), die im E. co//-Genom identifizierte Gleitklammer besteht aus zwei Komponenten (SEQ ID NO: 35) (Homodimeres ).
Als Gleitklammer im Sinne der vorliegenden Erfindung ist hierbei insbesondere jedes Protein zu verstehen, das die funktioneile Eigenschaft der Polymeraseprozessivitätssteigerung (Beispiel 5 und Fig. 23) besitzt und/oder der Senkung der Fehlerrate dient. Dazu kann die Gleitklammer eine ringförmige dreidimensionale Struktur aufweisen oder durch Kopplung an ein anderes Protein eine ringförmige dreidimensionale Struktur bilden, durch die sie in der Lage ist, ein- und doppelsträngige Nukleinsäuren ganz oder teilweise zu umschließen. Als Gleitklammer im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das
1. zu der menschlichen PCNA-Aminosäuresequenz (Eukaryonten)
(SEQ ID NO 11 ) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 %ige Sequenzidentität aufweist oder das 2. zu der bakteriellen ß-clamp-Sequenz aus E. coli (Eubakterien)
(SEQ ID NO 35) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 %ige Sequenzidentität aufweist oder das 3. zu der Aminosäuresequenz des PCNA-Homologen aus
Archaeoglobus fulgidus (Archaebakterien) (SEQ ID NO 12) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt 25 %ige und noch bevorzugter 30 %ige Sequenzidentität aufweist.
Sämtliche Sequenzalignments, wie sie hierin offenbart werden, wurden mit dem BLAST Algorithmus nach Altschul, S.F., Gish, W. Miller, W., Myers.E.W., and Lipman, D ., J. Mol. Biol. 215, 403-410 (1990) erstellt.
Die erfindungsgemäße Gleitklammer kann eines oder mehrere der vorgenannten Merkmale aufweisen.
Als Gleitklammer bzw. Gleitklammerproteine im Sinne der vorliegenden
Erfindung sind außerdem Proteine zu verstehen, die eine oder beide der folgenden Konsensussequenzen (Region 1 und Region 2) beinhalten und an nicht mehr als vier Positionen von der Region 1 (SEQ ID No.: 39) oder nicht mehr als vier Positionen von der Region 2 (SEQ ID No.: 40) abweichen (Fig. 4):
Region 1 (SEQ ID No.: 39):
[GAVLIMPFW]-D-X-X-X-[GAVLIMPFW]-X-X-[GAVLIMPFW]-X-[GAVLIMPFW]- X-[GAVLI M PFW]-X-X-X-X-F-X-X-Y-X-X-D und / oder Region 2: (SEQ ID No.: 40):
[GAVLIMPFW]-X(3)-L-A-P-[KRHDE]-[GAVLIMPFW]-E
Die Aminosäuren werden hierbei gemäß der Standard IUPAC - Einbuchstaben Nomenklatur benannt und gemäß dem Prosite Pattern- Beschreibungsstandard aufgeführt. Dabei sind die folgenden Aminosäuregruppen häufig zusammengefaß: G,A,V,L,I,M.P,F oder W (Aminosäuren mit nicht polaren Seitenketten) S,T,N,Q,Y, oder C (Aminosäure mit ungeladenen polaren Seitenketten) K,R,H,D oder E (Aminosäure mit geladenen und polaren Seitenketten) Außerdem bedeutet X in den Sequenzen bzw. Sequenzprotokollen jede beliebige Aminosäure oder Insertion oder Deletion
Aus dem in Fig. 12 dargestellten multiplen Alignment von menschlichen PCNA- Homologen wurde zudem ein Hidden-Markov-Modell generiert. Als Gleitklammer im Sinne der vorliegenden Erfindung ist somit insbesondere auch jedes Protein zu verstehen, das mit dem so erzeugten Hidden-Markov-Modell (hierin im folgenden mit „HMM" bezeichnet) einen „Score" von mehr als 20, bevorzugt 25 am bevorzugtesten 30 aufweist (Fig. 12), wobei ein „Score" der Ausgabewert einer HMM-Analyse ist. Die Hidden-Markov-Modelle und die entsprechenden Scores wurden mit dem hmmfs Programm (Version 1.8.4, July 1997) aus dem HMMER-Paket berechnet (HMMER Protein and DNA Hidden Markov Models (Version 1.8) von Sean Eddy, Dept. of Genetics, Washington University School of Medicine, St. Louis, USA;).
Markov-Modelle mit verstecktem Profil (engl.: profile hidden Markov modeis - profile HMMs), kurz auch „Hidden Markov Models" genannt, hierin als HMM abgekürzt, sind statistische Modelle des Konsensus der Primärstruktur einer Sequenzfamilie. Die Profile verwenden positionsspezifische Punktzahlen („scores") für Aminosäuren (oder Nukleotide) und positionsspezifische Punktzahlen zum Eröffnen oder Erweitern einer Insertion oder Deletion. Methoden zum Erstellen von Profilen, ausgehend von multiplen Alignments, wurden von Taylor (1986), Gribskov et al. (1987), Barton (1990) und Heinikoff (1996) eingeführt.
HMM stellen eine vollkommen probabilistische Beschreibung von Profilen bereit, d. h. die Lehre von Bayes legt fest, wie die gesamten Wahrscheinlichkeits- (Auswertungs-) Parameter gesetzt werden sollten (vergl. Krogh et al. 1994, Eddy 1996 und Eddy 1998). Die zentrale Idee ist die, daß ein HMM ein finites Modell ist, das eine Wahrscheinlichkeitsverteilung über eine unbegrenzte Anzahl möglicher Sequenzen beschreibt. Das HMM setzt sich aus einer Anzahl von Zuständen zusammen, die den Säulen eines multiplen Alignments, wie dies üblicherweise dargestellt wird, entsprechen. Jeder Zustand emittiert Symbole (Reste) entsprechend den (zustandsspezifischen) Symbol-Emissions- Wahrscheinlichkeiten, und die Zustände sind durch Zustand-Übergangs- Wahrscheinlichkeiten untereinander verbunden. Ausgehend von einem Anfangszustand wird eine Abfolge von Zuständen generiert, indem von einem Zustand zum anderen entsprechend den Zustands-Übergangs- Wahrscheinlichkeiten übergegangen wird, bis ein Endzustand erreicht ist. Jeder Zustand emittiert dann Symbole entsprechend den Emissions- Wahrscheinlichkeits-Verteilung dieses Zustands, was eine beobachtbare Sequenz von Symbolen erzeugt. Das Attribut „hidden" (versteckt) leitet sich ab von der Tatsache, daß die zugrunde liegende Zustandssequenz nicht beobachtet werden kann; was gesehen wird, ist die Symbolsequenz. Eine Abschätzung der Übergangs- und Emissions-Wahrscheinlichkeiten (das Trainieren des Modells) wird durch dynamische Programmierungsalgorithmen erreicht, die in dem HMMER- Paket implementiert sind.
Wenn ein existierendes HMM und eine Sequenz gegeben sind, kann man die Wahrscheinlichkeit berechnen, daß das HMM die fragliche Sequenz erzeugen könnte. Das HMMER-Paket liefert eine numerische Größe (die Punktzahl bzw. Ausgabewert), die proportional zu dieser Wahrscheinlichkeit ist, d. h. den Informationsgehalt der Sequenz, angegeben in Bits, gemessen gemäß dem HMM.
In Zusammenhang mit HMM sei auf folgende Literaturstellen verwiesen:
Barton, G.J. (1990):
Protein multiple alignment and flexible pattern matching. Methods Ezymol. 183: 403-427.
Eddy, S.R. (1996): Hidden markov modeis. Curr. Opin. Strct. Biol. 6: 361-365.
Eddy, S.R. (1998):
Profile hidden markov modeis.
Bioinformatics. 14: 755-763.
Gribskov, M. McLachlan, A.D. und Eisenberg D. (1987):
Profile analysis: Detection of distantly related proteins. Proc. Natl. Acad. Sei. USA. 84: 4355-5358.
Heinikoff, S. (1996):
Scores for sequence searches and alignment. Curr. Opin. Strct. Biol. 6: 353-360.
Krogh, A., Brown, M., Mian, I.S., Sjolander, K. und Haussler, D. (1994):
Hidden markov modeis in computational biology: Applications to protein modelling.
J. Mol. Biol. 235: 1501-1531.
Taylor, W.R. (1986):
Identification of protein sequence homology by consensus template alignment.
J. Mol. Biol. 188: 233-258.
Aus dem in Fig. 13 dargestelten multiplen Alignment von E. coli ß-clamp- Homologen wurde ein HMM generiert. Als Gleitklammer im Sinne der vorliegenden Erfindung ist somit insbesondere auch jedes Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 25, bevorzugt 30 und am bevorzugtesten 35 aufweist (Fig. 13).
Die Gleitklammer kann aus mehreren Komponenten aufgebaut sein, die durch eine charakteristische Bindung fest aneinander gebunden sind, so daß ein stabiler ringförmiger Molekülkomplex gebildet wird, der nicht ohne weiteres von der Nukleinsäure dissoziieren kann. Dadurch wird eine feste, aber nicht kovalente Bindung an die Nukleinsäure ermöglicht, die die freie Verschiebbarkeit auf derselben aber nicht behindert. Die prozessivitätssteigernden Gleitklammerproteine haben zudem charakteristische lokale Moleküleigenschaften im Bereich der Wechselwirkungsregion zur DNA, die die freie Verschiebbarkeit erleichtern und die durch in diese Region eingelagerte Wassermoleküle unterstützt werden kann.
Eine bevorzugte Ausführungsform der vorliegenden Erfindung ist weiterhin insbesondere ein thermostabiler prokaryontischer in wϊro-Komplex, wobei das Gleitklammerprotein eines der folgenden ist: AF 0335 aus Archaeoglobus fulgidus (SEQ ID NO.: 12) (Fig.24), MJ0247 aus Methanococcus jannaschii (SEQ ID NO.: 13), PHLA008 aus Pyrococcus horikoschii (SEQ ID NO.: 14), MTH1312 aus Methanobacterium Thermoautotrophicus (SEQ ID NO.: 15), sowie AE000761_7 aus Aquifex aeolicus (SEQ ID NO.: 36).
Insbesondere sind solche thermostabilen in w/o-Komplexe Gegenstand dieser Anmeldung, wobei das Gleitklammerprotein eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 11 , 12, 13, 14, 15 und 36 umfaßt.
Der Gleitklammerlader
Desweiteren ist als bevorzugte Ausführungsform zu verstehen, wenn der erfindungsgemäße Komplex einen Gleitklammerlader umfaßt. Als Gleitklammerlader wird hierin ein Protein, Proteinkomplex oder Untereinheit eines Proteins verstanden, welches ein Homolog des im Menschen identifizierten "Replication Factor C"-Proteinkomplexes umfaßt.
Dieser Proteinkomplex besteht im Menschen aus fünf Untereinheiten wobei sie durch 5 separate Gene im Menschen kodiert sind. Die 4 von jeweils einem Gen kodierten kleinen Untereinheiten (hierin als Gleitklammerlader 1 bezeichnet) bilden beim Menschen einen Proteinkomplex. Das Protein der großen Untereinheit wird beim Menschen durch ein Gen kodiert (hierin als Gleitklammerlader 2 bezeichnet). Die Sequenzen der vier kleinen Untereinheiten sind als SEQ ID NO.: 1 , 32, 33, 34 dargestellt, die Sequenz der großen Untereinheit ist als SEQ ID NO.: 6 dargestellt. Als Gleitklammerlader 1 können erfindungsgemäß Homologe oder Funktionsanaloge, einzeln oder in beliebiger Kombination, einer jeden der vorstehen genannten Sequenzen SEQ ID NO.: 1 , 32, 33, 34 verwendet werden. Dabei können die Homologen prokaryontischen, wie eubakteriellen oder archaebakteriellen, oder eukaryontischen Ursprungs sein.
Als Gleitklammerlader 2 können erfindungsgemäß Homologe oder Funktionsanaloge, einzeln oder in beliebiger Kombination, der vorstehend genannten Sequenz SEQ ID NO.: 6 verwendet werden. Dabei können die Homologen prokaryontischen, wie eubakteriellen oder archaebakteriellen, oder eukaryontischen Ursprungs sein.
Als Gleitklammerlader 1 im Sinne der vorliegenden Erfindung kann auch ein solches Protein verstanden werden, das zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 1 , 32, 33, 34 ) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 %ige Sequenzidentität aufweist.
Als Gleitklammerlader 2 im Sinne der vorliegenden Erfindung kann auch ein solches Protein verstanden werden, das zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 6) auf einer Länge von mindestens 150 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 %ige aufweist.
Gleitklammerlader-Homologe im Sinne der obigen Definition sind beispielsweise die in Fig. 1 aufgeführten Gene aus Archaebakterien. Diesen Genen entsprechen für den Gleitklammerlader 1 die Sequenzen SEQ ID NO: 2, 3, 4, und 5 und für den Gleitklammerlader 2 die Sequenzen SEQ ID NO: 7, 8, 9, und 10.
Als Gleitklammerlader 1 im Sinne der vorliegenden Erfindung kann auch ein Protein verstanden werden, das eine Sequenz gemäß der folgenden Konsensussequenz umfaßt und an nicht mehr als vier Positionen von dieser Sequenz abweicht (Alinierung siehe auch Fig. 6):
SEQ ID No. 41 : C-N-Y-X-S-[KRHDE]-I-I-X-[GAVLIMPFW]-[GAVLIMPFW]-Q-S-R-C-X-X-F-R-F- X-P-[GAVLIMPFW]
Als Gleitklammerlader 2 im Sinne der vorliegenden Erfindung kann auch ein Protein verstanden werden, das eine Sequenz gemäß der folgenden Konsensussequenz umfaßt und an nicht mehr als vier Positionen von dieser Sequenz abweicht (Alinierung siehe auch Fig. 7):
SEQ ID No.42:
K-X-X-L-L-X-G-P-P-G-X-G-K-T-[STNQYC]-X-[GAVLI M PFWj-X-X- [GAVLIMPFW]
Aus dem in Fig. 14 dargestellten multiplen Alignment von Sequenzen des Gleitklammerladers 1 umfassend die menschliche Sequenz sowie einige dazu homologe Sequenzen aus Archaebakterien, wurde zudem ein HMM generiert. Als Gleitklammerlader 1 im Sinne der vorliegenden Erfindung ist demzufolge auch ein Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 25, bevorzugt mehr als 30 und am bevorzugtesten mehr als 35 aufweist (Alinierung siehe auch Fig. 14).
Aus dem in Fig. 15 dargestellten multiplen Alignment von Sequenzen des Gleitklammerladers 2 umfassend die menschliche Sequenz sowie einigen dazu homologen Sequenzen aus Archaebakterien wurde zudem ein HMM generiert. Als Gleitklammerlader 2 im Sinne der vorliegenden Erfindung ist demzufolge auch ein Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 15, bevorzugt mehr als 20 und am bevorzugtesten mehr als 25 aufweist (Alinierung siehe auch Fig. 15).
Es kann auch vorgesehen sein, daß der erfindungsgemäße in w'fro-Komplex ein dem Eubaktehum Escherichia coli γ-Komplex oder Teilen davon homologes Protein als Gleitklammerlader 1 oder Gleitklammerlader 2 umfaßt.
Ein Gleitklammerlader im Sinne der vorliegenden Erfindung kann demgemäß ein Gleitklammerlader 1 alleine, ein Gleitklammerlader 2 alleine, oder eine Kombination einer oder mehrerer Gleitklammerlader 1 bzw. Gleitklammerlader 2, jeweils wie vorstehend definiert, sein.
Außerdem ist in einer Ausführungsform des erfindungsgemäßen thermostabilen in w/ro-Komplex zur Elongation von Nukleinsäuren vorgesehen, daß dieser zusätzlich eine Verbindung umfaßt, welche bei der Spaltung Energie freisetzt, wie beispielsweise ATP, GTP, CTP, TTP, dATP, dGTP, dCTP oder dTTP.
Ohne im folgenden darauf festgelegt sein zu wollen, scheint ein Gleitklammerlader die Komponenten der Gleitklammer um den ununterbrochenen DNA-Strang herum zusammenzufügen, bzw. diese wieder zu entfernen, wenn die Reaktion beendet ist. Dabei kann die Gleitklammer eine ringförmige dreidimensionale Struktur aufweisen oder durch Kopplung an ein anderes Protein eine ringförmige dreidimensionale Struktur bilden, durch die sie in der Lage ist, ein- oder doppelsträngige Nukleinsäuren ganz oder teilwseise zu umschließen. Der Gleitklammerlader kann dann Vorteile mit sich bringen, wenn das Template-Nukleinsäuremolekül ringförmig geschlossen vorliegt. Insbesondere sind solche thermostabile in w'fro-Komplexe Gegenstand dieser Anmeldung, wobei der Gleitklammerlader 1 eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 2, 3, 4 und 5 umfaßt.
Insbesondere sind solche thermostabile in /ro-Komplexe Gegenstand dieser Anmeldung, wobei der Gleitklammerladder 2 eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 7, 8, 9 und 10 umfaßt.
Das Kopplungsprotein
Das Kopplungsprotein hat die Funktion, ein Elongationsprotein mit einem oder mehreren Gleitklammerproteinen oder einem Gleitklammerproteinkomplex zu verbinden. Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist somit insbesondere jedes Protein zu verstehen, welches die oben beschriebene Funktion aufweist. Bevorzugt sind solche Kopplungsproteine, die archaebakteriellen Ursprungs sind.
Kopplungsproteine im Sinne der vorliegenden Erfindung sind beispielsweise Homologe oder Funktionsanaloge, einzeln oder in beliebiger Kombination, einer jeden der in Fig. 1 aufgeführten Sequenzen, die Homologe zu der humanen Sequenz der kleinen Untereinheit der Polymerase δ, hierin als koppelnde Untereinheit bezeichnet (Sequenzname: DPD2JHUMAN, dargestellt im Sequenzprotokoll als SEQ ID NO:16), sind. Im Sinne der vorliegenden Erfindung kann ein Kopplungsprotein ein Protein sein, das eine Sequenz umfaßt, die aus der Gruppe ausgewählt ist, die die Sequenzen SEQ ID NO: 17, 18, 19, 20 und 21 umfaßt.
Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 16 ) auf einer Länge von mindestens 150
Aminosäuren bei einem Sequenzalignment eine mindestens 18 %ige, bevorzugt mindestens 22 %ige und noch bevorzugter mindestens 26 %ige Sequenzidentität aufweist.
Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das zu der Aminosäuresequenz (SEQ ID NO: 19 ) von Pyrococcus horikoshii auf einer Länge von mindestens 150 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist, bevorzugt eine mindestens 25 %ige Sequenzidentität und am bevorzugtesten eine Sequenzidentität von mehr als 30 % .
Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist auch jedes Protein zu verstehen, das die folgende Konsensussequenz umfaßt und an nicht mehr als vier Positionen von dieser Sequenz abweicht. Die Generierung der Konsensussequenz wird in Fig. 5 gezeigt, die als SEQ ID No. 43 hierin offenbart wird.
SEQ ID No. 43:
[FL]-[GAVLIMPFW]-X-X-[GAVLIMPFW]-X-G-X(13)-[GAVLIMPFW]-X-[YR]-
[GAVLIMPFW]-X-[GAVLIMPFW]-A-G-[DN]-[GAVLIMPFW]-[GAVLIMPFW]-[DS]
Aus dem in Fig. 16 dargestellten multiplen Alignment von Homologen zur menschlichen koppelnden Untereinheit oder Kopplungsprotein wurde zudem ein HMM generiert. Als koppelnde Untereinheit im Sinne der vorliegenden Erfindung ist somit jedes Protein zu verstehen, das mit dem so erzeugten HMM einen Score mehr als 10, bevorzugt mehr als 15, am bevorzugtesten mehr als 20 aufweist.
Insbesondere sind solche thermostabilen in v/fro-Komplexe Gegenstand dieser Anmeldung, wobei das Kopplungsprotein eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 17, 18, 19, 20 und 21 umfaßt. Elongationsprotein
Im Rahmen der vorliegenden Erfindung kann ein Elongationsprotein verwendet werden, das die eingangs definierten Merkmale aufweist. Darüber hinaus können Formen von Elonagtionsproteinen verwendet werden, wie sie im folgenden beschrieben werden und im Stand der Technik zumindest zum Teil bereits bekannt sind.
Es ist bekannt, daß einige Elongationsproteine die Anwesenheit eines Kopplungsproteins benötigen, um überhaupt Polymeraseaktivität aufzuweisen. Weiterhin ist bekannt, daß einige Elongationsproteine direkt an Gleitklammerproteine binden können, wohingegen andere Elongationsproteine die Anwesenheit eines Kopplungsproteins für die Bindung an die Gleitklammerproteine benötigen. Weiterhin können Elongationsproteine die beiden vorstehend genannten Eigenschaft in sich vereinen, das heißt sowohl über ein Kopplungsprotein als auch direkt, das heißt ohne ein Kopplungsprotein, an ein Gleiklammerprotein binden.
Bevorzugte Elongationsproteine für den erfindungsgemäßen in w'/ro-Komplex können ausgewählt sein aus der Gruppe, die die Organismen Carboxydothermus hydrogenoformans, Thermus aquaticus, Thermus caldophilus, Thermus chliarophilus, Thermus filiformis, Thermus flavus, Thermus oshimai, Thermus ruber, Thermus scotoductus, Thermus silvanus, Thermus species Z05, Thermus species sp. 17, Thermus thermusphilus, Therotoga maritima, Therotoga neapolitana, Thermosipho af canus, Anaerocellum thermophilum, Bacillus caldotenax, oder Bacillus stearothermophilus umfaßt, eingebracht wird.
Als Elongationsproteine sind beispielsweise auch die in Fig. 1 aufgeführten zum menschlichen Elongationsprotein (SEQ ID NO: 22) homologen oder funktionsanalogen Elonagationsproteine aus Archaebakterien geeignet (SEQ ID NO: 23, 24, 25, 26). Insbesondere sind solche thermostabile in w-ro-Komplexe Gegenstand der Erfindung, wobei das Elongationsprotein eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 23, 24, 25, 26, 27, 28, 29, 30 und 31 umfaßt.
Als Elongationsprotein im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 22) auf einer Länge von mindestens 200 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität, bevorzugt 25 %ige Sequenzidentität, am bevorzugtesten 30 %ige Sequenzidentität aufweist.
Als Elongationsprotein im Sinne der vorliegenden Erfindung ist auch insbesondere ein Protein zu verstehen, das die folgende Konsensussequenz (SEQ ID No. 44) beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz abweicht. Die Fig. 8 zeigt das Alignment, das der Konsensussequenz zugrunde liegt.
SEQ ID No.44:
D-[GAVLIMPFW]-[GAVLIMPFW]-X-X-Y-N-X-X-X-F-D-X-P-Y-[GAVLIMPFW]-X- X-R-A
Aus dem in Fig. 17 dargestellten multiplen Alignment von Homologen zum menschlichen Elongationsprotein (SEQ ID NO: 22) wurde zudem ein HMM generiert. Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit auch ein Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 20, bevorzugt mehr als 25, am bevorzugtesten mehr als 30 aufweist. Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit auch ein solches Protein zu verstehen, das zu der archaebakteriellen Aminosäuresequenz (SEQ ID NO: 27) auf einer Länge von mindestens 400 Aminosäuren bei einem Sequenzalignment eine mindestens 25 %ige Sequenzidentität, bevorzugt mindestens 30 %ige Sequenzidentität, am bevorzugtesten mindestens 35 %ige Sequenzidentität aufweist. Beispielsweise sind geeignet die aus Archaebakterien stammenden Proteine mit der SEQ ID NO: 27, 28, 29, 30 oder 31.
Als Elongationsprotein im Sinne der vorliegenden Erfindung ist daher insbesondere auch jedes Protein zu verstehen, das die folgende Konsensussequenz, hierin als SEQ ID No.: 45 bezeichnet, beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz abweicht. (Die Fig. 9 zeigt das Alignment, das der Konsensussequenz zu Grunde liegt.)
SEQ ID No. 45:
A-[GAVLIMPFW]-R-T-A-[GAVLIMPFW]-A-[GAVLIMPFW]-[GAVLIMPFW]-T-E-
G-[GAVLIMPFW]-V-X-A-P-[GAVLIMPFW]-E-G-I-A-X-V-[KRHDE]-I
Aus dem in Fig. 18 dargestellten multiplen Alignment von Homologen zum archaebakteriellen Elongationsprotein (SEQ ID NO: 27) wurde zudem ein HMM generiert. Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit insbesondere jedes Protein zu verstehen, daß mit dem so erzeugten HMM einen Score mehr als 35, bevorzugt mehr als 40 und noch bevorzugter mehr als 45 aufweist (Fig. 18).
Das Elongationsprotein kann auch eubakteriellen Ursprungs sein.
Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit ebenfalls ein solches Protein zu verstehen, das zu der eubakteriellen Aminosäuresequenz (SEQ ID NO: 37) auf einer Länge von mindestens 300
Aminosäuren bei einem Sequenzalignment eine mindestens 25 %ige, bevorzugt mindestens 30 %ige und noch bevorzugter mindestens 35 %ige Sequenzidentität aufweist.
Als Elongationsprotein im Sinne der vorliegenden Erfindung ist daher auch insbesondere jedes Protein zu verstehen, das die folgende Konsensussequenz beinhaltet und an nicht mehr als acht Positionen von dieser Sequenz abweicht (Fig. 10):
SEQ ID No. 46: [GAVLIMPFW]-P-V-G-[GAVLIMPFW]-G-R-G-S-X-[GAVLIMPFW]-G-S- [GAVLIMPFW]-V-A-X-A-[GAVLIMPFW]-X-I-T-D-[GAVLIMPFW]-D-P- [GAVLIMPFW]-X-X-X-[GAVLIMPFW]-L-F-E-R-F-L-N-P-E-R-[GAVLIMPFW]-S- M-P-D
Aus dem in Fig. 19 dargestellten multiplen Alignment von Homologen zum eubakteriellen Elongationsprotein (SEQ ID NO: 37) wurde zudem ein HMM generiert. Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit jedes Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 20, bevorzugt mehr als 25, am bevorzugtesten mehr als 30 aufweist.
Insbesondere sind solche thermostabile in w'/ro-Komplexe Gegenstand dieser Anmeldung, wobei das Elongationsprotein eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 38 umfaßt.
Verwendungen des erfindungsgemäßen in fro-Komplexes:
Bisher wurden DNA-Polymerasen als Elongationsproteine ohne Kopplungsprotein und ohne Gleitklammer für Standard-PCR-Reaktionen eingesetzt, so z.B. DNA-Polymerase I aus Pyrococcus furiosus (US No. 5,545,552) oder Pyrococcus species (EP-A-0 547 359). Diese Enzyme zeichnen sich durch die Eigenschaft aus, thermostabil zu sein und häufig eine 3'-5'-Exonuklease-Aktivität (,proof-reading' Aktivität) zu besitzen. Erst vor kurzem wurde ein Heterodimer mit Polymeraseaktivität in Pyrococcus furiosus entdeckt (Uemori, T., Sato, Y., Kato, I., Doi, H., and Ishino, Y. (1997). A novel DNA polymerase in the hyperthermophilic archaeon, Pyrococcus furiosus: gene cloning, expression, and characterization. Genes to Cells 2, 499-512. )
Es ist auch möglich, durch Deletionen oder Mutationen oder durch das Anfügen von Aminosäuren die Eigenschaften dieser Proteine zu optimieren. Diese veränderten Proteine sind ebenfalls Gegenstand der vorliegenden Erfindung, solange sie den erfindungsgemäßen in vitro Komplex zur Elongation von Nukleinsäuren bilden und die oben näher spezifizierten Funktionen erfüllen.
Fig. 3 veranschaulicht beispielhaft eine Ausführungsform des erfindungsgemäßen thermostabilen in w'fro-Komplexes, wobei hier die Gleitklammer über ein Kopplungsprotein an das Elongationsprotein bindet.
Der erfindungsgemäße in v/fro-Komplex bzw. der diesen enthaltende erfindungsgemäße Reaktionsansatz, kann desweiteren eine Nukleinsäure umfassen, wobei die Nukleinsäure die beispielsweise zu elongierende, zu sequenzierende, zu amplifizierende oder die revers zu transkribierende Nukleinsäure ist und/oder ein Primer, wobei dieser Primer bevorzugterweise an eine Nukleinsäure hybridisiert ist.
Primer sind in der Regel Oligonukleotide, welche komplementär zu einer Zielsequenz sind, um an diese binden zu können, wobei sie in gegensätzlicher Orientierung, ihre 3'-Enden zueinander gerichtet, den zu elongierenden, zu sequenzierenden, zu amplifizierenden oder revers zu transkribierenden Nukleinsäureabschnitt einschließt. Sie dienen als Startpunkt der Enzymaktivität und stellen in der Regel ein freies 3'-OH Ende für die Polymerase zur Inkorporation eines Nukleotides zur Verfügung. Während der Verwendung des erfindungsgemäßen thermostabilen in vitro- Komplexes zur Amplifikation, Elongation, Reversen Transkription und/oder Sequenzierung liegt der erfindungsgemäße Komplex, gegebenenfalls in einem Reaktionsansatz, bevorzugterweise in einem geeigneten Puffer vor. Geeignete Puffer sind solche, die für PCR, Sequenzierung, Nukleinsäuremarkierung und andere in w'rro-Nukleinsäure-Elongationsreaktionen mittels Polymerase Anwendung finden. Geeignete Puffer werden beispielweise beschrieben in Methods in Molecular Biology, Vol. 15 Humana Press Totowa, New Jersey, 1993, Hrsg. Bruce A. White.
Bei der Verwendung des erfindungsgemäßen thermostabilen in vi'tro- Komplexes zur Elongation, Amplifikation, Reversen Transkription und/oder Sequenzierung kann zusätzlich zu dem erfindungsgemäßen Komplex ein Nukleotid oder ein Gemisch aus Nukleotiden vorliegen bzw. verwendet werden bzw. umfaßt sein. Deoxynukleotide können aus dGTP, dATP, dTTP und dCTP ausgewählt werden, sind jedoch nicht auf diese beschränkt. Zusätzlich können auch Derivate von Deoxynukleotiden verwendet werden, die als solche Deoxynukleotide definiert sind, die in der Lage sind, durch eine thermostabile Polymerase in wachsende Nukleinsäure-Moleküle inkorporiert zu werden. Solche Derivate umfassen die Thionukleotide, 7-deaza-2' -dGTP, 7-deaza-2' - dATP, Digoxigenin-dUTP (Boehringer Mannheim)-dATP sowie Deoxyinosine- Triphosphat, das auch als Ersatz-Deoxynukleotid für dATP, dGTP, dTTP oder dCTP verwendet werden kann, sind aber nicht auf diese beschränkt. Ebenso können markierte Deoxynukleotide verwendet werden. Auch die Verwendung von Pyrenen und Pyrenderivaten ist möglich. Alle bekannten und/oder zu dem erfindungsgemäßen Zweck geeigneten Markierungen können dabei vorliegen bzw. verwendet werden.
Dideoxynukleotide können aus ddGTP, ddATP, ddTTP und ddCTP ausgewählt werden, sind jedoch nicht auf diese beschränkt. Alternativ können auch
Derivate von Dideoxynukleotiden verwendet werden, die als solche Dideoxynukleotide definiert sind, die in der Lage sind, durch eine Polymerase in wachsende Nukleinsäure-Moleküle inkorporiert zu werden, die in der Reaktion synthetisiert werden. Solche Derivate können radioaktive Dideoxynukleotide (ddATP, ddGTP, ddTTP und ddCTP) sein oder Dideoxynukleotide (ddATP, ddGTP, ddTTP und ddCTP) sein, die mit z.B. FITC, Cy5, Cy5.5, Cy7, Texas- Rot oder anderen Farbstoffen markiert sind, sind aber nicht auf diese beschränkt. Im Rahmen einer Sequenzierung unter Verwendung des erfindungsgemäßen thermostabilen in ϊro-Komplexes können auch markierte Deoxynukleotide zusammen mit unmarkierten Dideoxynukleotiden eingesetzt werden.
Ribonukleotide können aus GTP, ATP, TTP und CTP ausgewählt werden, sind jedoch nicht auf diese beschränkt. Zusätzlich können gemäß der Erfindung auch Derivate von Ribonukleotiden verwendet werden, die als solche Ribonukleotide definiert sind, die in der Lage sind, durch eine Polymerase in wachsende Nukleinsäure-Moleküle inkorporiert zu werden, die in der Reaktion synthetisiert werden. Solche Derivate können radioaktive Ribonukleotide (ATP, GTP, TTP und CTP) oder Ribonukleotide (ATP, GTP, TTP und CTP), welche mit z.B. FITC, Cy5, Cy5.5, Cy7 und Texas-Rot oder anderen markiert sind, umfassen, sind aber nicht auf diese beschränkt.
Während der Verwendung des Proteinkomplexes zur Amplifikation, Elongation und Sequenzierung kann es sich als vorteilhaft erweisen, wenn bei der Reaktion oder im Reaktionsansatz eine Pyrophosphatase anwesend ist.
Reaktionsansatz umfassend den erfindungsgemäßen thermostabilen in fro-Komplex:
Weiterhin ist Gegenstand der vorliegenden Erfindung ein Reaktionsansatz, der den erfindungsgemäßen in w' ro-Komplex umfaßt. Dabei kann vorgesehen sein, daß der Reaktionsansatz weiterhin ein oder mehrer Elongationsproteine umfaßt, die mindestens eine oder mehrere der vorstehenden Eigenschaften Aktivitäten aufweisen. Ein derartiges zusätliches Elongationsprotein ist dabei vorteilhafterweise eine thermostabile Polymerase. Ein derartiger Reaktionsansatz erlaubt eine verglichen mit der Verwendung der bekannten thermostabilen Polymerasen erhöhte Prozessivität.
Identifizierung der Gene, Klonierung der Gene, Expression dieser und Reinigung der Proteine der erfindungsgemäßen in ro-Komplexe:
In der Regel können die Komplexe, bevorzugt vollständig oder teilweise bestehend aus rekombinanten Proteinen, mit den folgenden Schritten bereitgestellt werden: Bereitstellung des Nukleinsäurefragmentes, welches für das gewünschte Protein kodiert, Ligation in einen Expressionsvektor, Transformation in einen Wirt, Expression und Aufreinigung des Proteins (Fig. 25). In Übereinstimmung mit der vorliegenden Erfindung kann es vorkommen, daß Gene, insbesondere aus den Archaebakterien, Inteine (Proc. Natl. Acad. Sei. U S A 1992 Jun 15;89(12):5577-5581 , Intervening sequences in an Archaea DNA polymerase gene, Perler FB, Comb DG, Jack WE, Moran LS, Qiang B, Kucera RB, Benner J, Slatko BE, Nwankwo DO, Hempstead SK, et al) enthalten können, welche zunächst entfernt werden können.
Die Identifizierung weiterer für den erfindungsgemäßen Komplex geeigneter Gene und/oder Proteine kann z.B. erfolgen durch Homologiesuchen in Datenbanken, welche Genome aus Prokaryonten umfassen. Programme, die dafür geeignet sind, umfassen beispielsweise das Programm BLAST, BLASTP und FASTA, sind aber nicht darauf beschränkt. (Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389- 3402. W.R. Pearson & D . Lipman PNAS (1988) 85:2444-2448).
Die Identifizierung kann auch dadurch geschehen, daß DNA-Sonden verwendet werden, um in z.B. gesamtgenomischen Banken aus Prokaryonten oder Eukaryonten nach den entsprechenden Genen zu screenen. Die hierfür nötigen experimentellen Verfahren finden sich in Maniatis et al. (Molecular Cloning (2"d edition, 3 Volume set): A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y.(1989)) oder in Ausubel et al (Current Protocols in Molecular Biology, John Wiley and Sons (1988)).
Die Bereitstellung der gereinigten Nukleinsäure der Gene, die die erfindungsgemäßen Komplexe aufbauenden Proteine kann z.B. über deren Isolierung aus einer genomischen Bank des relevanten Organismus geschehen oder durch synthetische DNA-Herstellung, jeweils gewünschtenfalls kombiniert mit einer Amplifikation mittels PCR, unter Zuhilfenahme von Primern, welche für den gewünschten Genabschnitt spezifisch sind. Übliche Verfahren sind in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y. (1989)) beschrieben.
Die Gene der Proteine der erfindungsgemäßen in ϊra-Komplexe können unter Anwendung einer Vielzahl von Methoden kloniert werden und somit mittels eines Expressionsvektors zur Proteinexpression in einem Wirtsorganismus zur Verfügung gestellt werden. Gängige Verfahren sind in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y.(1989)) beschrieben. Die Gene der Komplexe können hierbei z.B. zunächst in einen ,high-copy' Vektor, z.B. pUC18, pBst oder pBR322 kloniert werden und dann erst in einen prokaryontischen Expressionsvektor, z.B. pTrc99, pQE30, pQE31 oder pQE32, umkloniert werden, oder aber direkt in einen prokaryontischen oder viralen Expressionsvektor kloniert werden. Unter Vektoren sind hierbei Nukleinsäuren zu verstehen, die in der Lage sind, ein anderes Nukleinsäuremolekül in oder zwischen verschiedenen Organismen, bzw. genetischen Hintergründen zu transportieren. Sie haben in der Regel die Fähigkeit zur autonomen Replikation und/oder zur Expression (Expressionsvektoren) des operativ verbundenen Nukleinsäuremoleküls. "Operativ verbunden" bedeutet hierin, daß das transportierte Nukleinsäuremolekül so mit dem Vektor verbunden ist, daß es unter der Transkriptions- und Translationskontrolle von Expressionskontrollsequenzen des Vektors steht und in einer Wirtszelle exprimiert werden kann. Bakterielle und virale Expressionssysteme, deren bevorzugte Verwendung, sowie eine Auswahl an Vektorsystemen ist z.B. in ,Gene Expression Technology, (Meth. Enzymol., Vol 185, Goeddel, Ed., Academic Press, N.Y. (1990)) beschrieben. Geeignete Vektoren für die vorliegende Erfindung sollten eine unterschiedlich starke Expression der Proteine dadurch ermöglichen, daß sie einige oder alle der folgenden Eigenschaften besitzen: (1 ) Promotoren, oder Transkriptionsinitiationsstellen, entweder unmittelbar neben dem Start des Proteins oder als Fusionsprotein, (2) Operatoren, verwendet werden können, um die Genexpression an oder aus zu schalten, (3) ribosomale Bindungsstellen für eine verbesserte Translation, und (4) Terminationsstellen für die Transkription oder Translation, die zu verbesserter Stabilität des Transkriptes führen.
Expressionsvektoren, die mit eukaryontischen Zellen, bevorzugterweise mit Vertebratenzellen kompatibel sind, können auch Verwendung finden. Einige bekannte Vektoren sind pSVL und pKSV-10 (Pharmacia), pBPV-1/pML2d (International Biotechnologies, Inc.), pAcHLT-ABC (Pharmingen) und pTDTI (ATCC 31255). Die Verwendung eines retroviralen Expressionsvektors ist auch möglich.
Weitere Gegenstände der vorliegenden Erfindung sind daher DNA-Sequenzen, welche für die erfindungsgemäßen thermostabilen in wYro-Komplexe codieren, sowie entsprechende Vektoren, vorzugsweise Expressionsvektoren. Die erfindungsgemäßen Vektoren enthalten mindestens ein Gen für das Gleitklammerprotein oder mindestents ein Gen für das Kopplungsprotein oder mindestens ein Gen für einen Gleitklammerlader 1 und/oder 2 oder mindestens ein Gen für ein Elongationsprotein. In einer Ausführungsform enthalten die Vektoren gleichzeitig mehrere der verschiedenen vorstehend genannten Gene, beispielsweise die Gene für ein Elongationsprotein und ein Gleitklammerprotein.
Es ist dabei im Rahmen der Erfindung bevorzugt, wenn der Vektor neben den darin bereits enthaltenen DNA-Sequenzen noch geeignete Restriktionsschnittstellen und ggf. Polylinker zur Insertion weiterer DNA- Sequenzen enthält. Besonders bevorzugt ist es, wenn die räumliche Anordnung von bereits enthaltener DNA-Sequenz und zusätzlicher Insertionsstelle nach Expression zur Ausbildung eines Fusionsproteins führt.
Ebenfalls bevorzugt ist es, wenn der erfindungsgemäße Vektor Promotor- und/oder Operatorbereiche enthält, wobei es besonders bevorzugt ist, wenn derartige Promotor- und/oder Operatorbereiche induzierbar oder reprimierbar sind. Dadurch wird eine Steuerung der Expression in Wirtszellen erheblich vereinfacht und kann besonders effizient gestaltet werden.
Derartige Promotor/Operatorbereiche können in einem Expressionsvektor auch mehrfach vorkommen, so daß ggf. eine unabhängige Expression mehrerer DNA-Sequenzen unter Verwendung nur eines Expressionsvektors ermöglicht wird.
Ein weiterer Gegenstand der vorliegenden Erfindung ist eine Wirtszelle, enthaltend einen oder mehrere erfindungsgemäße(n) Vektor(en), wobei in dieser Wirtszelle unter geeigneten Bedingungen die Expression zu Proteinen erfolgen kann. Geeignete Bedingungen schließen beispielsweise Anwesenheit eines Repressors, Induktors oder eines Derepressors ein.
Für die Transformation, Phageninfektion und Zellkultur existieren Standardprotokolle in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y.). Aus der Vielzahl der vorhandenen E. co//-Stämme, die zur Transformation geeignet sind, sind bevorzugt JM101 (ATCC No. 33876), XL1 (Stratagene), RRI (ATCC No. 31343)M15[prep4] (QIAGEN) und BL21 (Pharmacia). Proteinexpression kann z.B. auch geschehen unter Zuhilfenahme des E. coli Stammes INVαF' (Invitrogen).
Die Transformanten werden unter den geeigneten Wachstumsbedingungen des Wirtsstammes kultiviert. So werden die meisten E. co//-Stämme z.B. in LB- Medium bei 30°C bis 42°C bis zur logarithmischen oder stationären Wachstumsphase kultiviert. Die Proteine können aus einer transformierten Kultur gereinigt werden, wobei dies entweder aus einem Zellpellet, nach Zentrifugation, oder aber aus der Kulturlflüssigkeit geschehen kann. Sofern die Proteine aus dem Zellpellet gereinigt werden, werden die Zellen in einem geeigneten Puffer resuspendiert und mittels Ultraschallbehandlung, enzymatischer Behandlung oder Einfrieren und Auftauen aufgebrochen. Sofern die Reinigung aus der Kultursuspension geschieht, sei es ohne oder mit einem Fusionsprotein, wird der Überstand von den Zellen mittels bekannter Verfahren, wie Zentrifugation abgetrennt.
Die Trennung und Reinigung der Proteine der erfindungsgemäßen Komplexe entweder aus dem Überstand der Kulturlösung oder aus dem Zellextrakt kann durch bekannte Separations- oder Reinigungverfahren geschehen. Diese Methoden sind z.B. solche, die die Löslichkeiten betreffen, wie Salzfällungen und Lösungsmittelfällungen, Methoden, die sich die unterschiedlichen Molekulargewichte zunutze machen, wie Dialyse, Ultrafiltration, Gelfiltration, und SDS-Polyacrylamidgelelektrophorese, Methoden die sich die unterschiedlichen Ladungen zunutze machen, wie lonenaustauschchromatographie, Methoden die sich die unterschiedliche Hydrophobie zunutze machen, wie reverse-phase HPLC (High Performance Liquid Chromatography), Methoden, die sich bestimmte Affinitäten zunutze machen, wie Affinitätschromatographie (Beispiel 6, 7 Fig. 24 und Fig. 25), und Methoden, die sich Unterschiede im isoelektrischen Punkt zunutze machen, wie isoelektrische Fokussierung. Es ist auch vorstellbar, daß Zellextrakte, entweder aus dem Organismus, welcher das Gen des akzessorischen Komplexes trägt, gemacht werden können, welcher die erfindungsgemäße Aufgabe erfüllt, oder aus dem rekombinanten Wirtsorganismus, z.B. E. coli. Mit diesen Extraktionen könnte man andere Reinigungsschritte vermeiden.
Die oben beschriebenen Verfahren können in einer Vielzahl von Kombinationen eingesetzt werden, um die Proteine des in w'r/o-Komplexes bereitzustellen.
Elongation von Nukleinsäuren
Der erfindungsgemäße thermostabile in v/ o-Komplexe kann zur Elongation von Nukleinsäuren verwendet werden, z. B. zur Polymerase-Ketten-Reaktion, (Beispiel 3, 4, sowie Fig. 21 ; Fig. 22) DNA-Sequenzierung, zur Markierung von Nukleinsäuren und anderen Reaktionen, die die in vitro Synthese von Nukleinsäuren beinhalten.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein Verfahren zur Template-abhängigen Elongation von Nukleinsäuren, wobei die Nukleinsäure nötigenfalls denaturiert, mit mindestens einem Primer unter Hybridisierungsbedingungen versehen wird, wobei der Primer hinreichend komplementär zu einem flankierenden Bereich einer gewünschten Nukleinsäuresequenz des Template-Strangs ist und mit Hilfe einer Polymerase in Anwesenheit von Nukleotiden eine Primer-Elongation erfolgt, wobei als Polymerase ein erfindungsgemäßer thermostabiler in w'f/o-Komplex eingesetzt wird.
Verfahren zur Template-abhängigen Elongation von Nukleinsäuren, bei denen die Elongation ausgehend von einem Primer erfolgt, der an die Template- Nukleinsäure anhybridisiert wurde und ein freies 3'-OH-Ende für die Elongation zur Verfügung stellt, sind dem Fachmann bekannt. Zur Amplifikation wird insbesondere eine PCR-Polymerasekettenreaktion durchgeführt.
Reverse Transkription
Es ist auch die Anwendung des erfindungsgemäßen thermostabilen in-vitro- Komplexes in der reversen Transkription möglich, wobei entweder der erfindungsgemäße Komplex selbst Reverse-Transkriptase-Aktivität besitzt, oder aber zusätzlich ein geeignetes Enzym hinzugefügt wird, das eine Reverse-Transkriptase-Aktivität aufweist, unabhängig davon ob der thermostabile in ϊra-Komplex selbst eine Reverse-Transkriptase-Aktivität hat.
Zur erfindungsgemäß bevorzugten reversen Transkription von RNA in DNA wird ebenfalls ein erfindungsgemäßer thermostabiler in w'fro-Komplex eingesetzt, wobei dessen Elongationsprotein selbst eine Reverse Transkriptase-Aktivität aufweist. Diese Reverse Transkriptase-Aktivität kann die einzige Polymeraseaktivität des Elongationsproteins sein, kann aber auch zusätzlich zu einer vorhandenen 5'-3'-DNA-Polymeraseaktivität vorliegen. Eine erfindungsgemäß bevorzugte Ausführungsform des in w'fro-Komplex umfaßt das Elongationsprotein aus dem Organismus Carboxydothermus hydrogenoformans, wie offenbart in EP-A 0 834 569.
Sequenzierung Eine weitere bevorzugte Verwendung des erfindungsgemäßen in vi'tro- Komplexes ist die Sequenzierung von Nukleinsäuren gemäß der Methode von Sanger. Ausgehend von mindestens einem Primer, der zu einem Teil der zu sequenzierenden Nukleinsäure hinreichend komplementär ist, wird eine Template-abhängige Elongation vorgenommen. Im Falle der Sequenzierung von RNA ist es nötig, eine reverse Transkription durchzuführen. Als Deoxynukleotide oder Dideoxynukleotide werden im Rahmen dieser bevorzugten Ausführungsform auch die oben beschriebenen jeweiligen Derivate als geeignet angesehen. Insbesondere ist es für die erfindungsgemäßen Verfahren zur Elongation von Nukleinsäuren bevorzugt, daß die gebildeten Nukleinsäuren markiert werden. Hierzu ist es möglich, markierte Primer und/oder markierte Deoxynukleotide und/oder markierte Dideoxynukleotide und/oder markierte Ribonukleotide oder jeweils entsprechende Derivate, wie sie oben bereits beispielsweise beschrieben sind, einzusetzen.
Markierung von Nukleinsäuren
Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Verfahren zur Markierung von Nukleinsäuren, z.B. durch Einfügung einzelner Brüche in Phosphodiesterbindungen der Nukleinsäurekette und Ersatz eines Nukleotids an den Bruchstellen durch ein markiertes Nukleotid mit Hilfe einer Polymerase, wobei als Polymerase ein erfindungsgemäßer thermostabiler in w'fro-Komplex eingesetzt wird.
Ein bevorzugtes Verfahren stellt das allgemein als Nick-Translation bezeichnete Verfahren dar, das eine einfache Markierung von Nukleinsäuren ermöglicht. Alle oben bereits beschriebenen markierten Ribonukleotide oder Deoxyribonukleotide oder Derivate davon sind hierfür geeignet, solange die Polymerase sie als Substrat akzeptiert. Markierung im vorstehenden Sinne ist auch eine Markierung, die im Rahmen einer PCR-Reaktion erfolgt, wobei in diesem Fall markierte Nukleotide oder Derivate davon in die Nukleinsäuresequenz eingebaut werden.
Gegenstand der vorliegenden Erfindung ist ebenfalls ein Kit zur Elongation und/oder Amplifikation und/oder Reversen Transkription und/oder Sequenzierung von Nukleinsäuren, wobei dieser Kit ein oder mehrere Behälter umfassen kann.
Der Kit selbst umfaßt a) einen erfindungsgemäßen thermostabilen in w'fro-Komplex oder b) einen thermostabilen in w'fro-Komplex und ggf. separat davon ein Polymeraseaktivität aufweisendes Elongationsprotein sowie ggf. eine oder mehrere der Komponenten, die ausgewählt sind aus der Gruppe, die Primer, Puffersubstanzen, Nukleotide, ATP, andere Kofaktoren und Pyrophosphatase umfaßt.
Dabei ist es möglich, daß der erfindungsgemäße thermostabile in w'fro- Komplex in besagtem Kit in Form seiner Einzelbestandteile, das heißt als thermostabiles Gleitklammerprotein sowie thermostabiles Elongationsprotein vorliegt, getrennt oder vereint in einem Behältnis, und sich als solches erst zu einem späteren Zeitpunkt ausbildet.
Insbesondere ist Gegenstand der vorliegenden Erfindung ein Kit zur Elongation, Amplifikation, Reversen Transkription, Markierung bzw. Sequenzierung von Nukleinsäuren, wobei zusätzlich Deoxynukleotide bzw. deren Derivate enthaltend sind.
Gegebenenfalls können in dem erfindungsgemäßen Kit auch Ribonukleotide oder Derivate davon umfaßt sein, nämlich dann, wenn ein Elongationsprotein eingesetzt wird, das Ribonukleotide als Substrat akzeptiert. Eine bevorzugte Ausführungsform des erfindungsgemäßen Kits ist ein Kit zur Sequenzierung von Nukleinsäuren, wobei zusätzlich zu Deoxynukleotiden bzw. deren Derivaten, Dideoxynukleotide bzw. deren Derivate zur Kettentermination umfaßt sind.
Desweiteren ist insbesondere Gegenstand der vorliegenden Erfindung ein Kit zur reversen Transkrition von Nukleinsäuren, wobei entweder der erfindungsgemäße Komplex selbst reverse Transkriptase-Aktivität besitzt, oder aber zusätzlich ein geeignetes Enzym anwesend ist, das reverse Transkriptase-Aktivität besitzt, wobei Deoxynukleotide bzw. deren Derivaten im Reaktionsgemisch enthalten sein können.
In einer weiteren besonders bevorzugten Ausführungsform enthält der Kit Primer und/oder Deoxynukleotide und/oder Dideoxynukleotide und/oder Ribonukleotide und/oder deren jeweilige Derivate in markierter Form.
Insbesondere für die Sequenzierung von Nukleinsäuren ist es nötig, eine Markierung einzufügen. Geeignete Markierungen sind weiter oben bereits in beispielhafter Form beschrieben. Geeignete Markierungsmittel sind in einer bevorzugten Ausführungsform des erfindungsgemäßen Kits umfaßt.
Im Rahmen der vorliegenden Erfindung ist es weiterhin möglich, daß der Kit (hierin auch als Reagenzienkit bezeichnet) zur Markierung von Nukleinsäuren eingesetzt wird. In diesem Fall enthält der Reagenzienkit die Bestandteile a) oder b) und markierte Nukleotide, wobei Puffersubstanzen, ATP oder andere Kofaktoren und/oder Pyrophosphatase ebenfalls anwesend sein können. Insbesondere ist ein Kit bevorzugt, der einen geeigneten Puffer umfaßt, wie oben beschrieben. Bevorzugt ist ebenfalls, daß der erfindungsgemäße Kit zusätzlich eine Pyrophosphatase, ATP und/oder andere Kofaktoren umfaßt.
Gegenstand der vorliegenden Erfindung ist desweiteren die Verwendung eines thermostabilen Gleitklammerproteins in in vitro Verfahren zur Elongation, Amplifikation, Markierung bzw. Sequenzierung oder reversen Transkription von Nukleinsäuren.
Der erfindungsgemäße thermostabile in w'fro-Komplex kann zu Zwecken der Sequenzierung, Amplifikation, reversen Transkription und dergleichen sowohl mit kurzen als auch mit langen Nukleinsäurefragmenten verwendet werden, wobei insgesamt eine verringerte Fehlerhäufigkeit
(Nukleotidfehlinkorporation) gegenüber der Verwendung thermostabiler Elongationsproteine alleine erreicht wird.
In einer bevorzugten Alternative wird der thermostabile in w'fro-Komplex zu Zwecken der Sequenzierung, Amplifikation und reversen Transkription von langen Nukleinsäurefragmenten verwendet.
In einer weiteren bevorzugten Alternative wird der thermostabile in w'fro- Komplex zu Zwecken der Sequenzierung, Amplifikation und reversen Transkription von solchen Nukleinsäurefragmenten verwendet, die Sekundärstruktur ausbilden.
Die folgenden Beispiele sollen in Verbindung mit den Figuren die Erfindung näher erläutern und Vorteile veranschaulichen:
Figuren: lm folgendenden werden häufig Sequenznamen verwendet, unter denen die Protein- oder Nukleinsäuresequenzen in der Genbank und der EMBL Datenbank stehen. Dabei zeigt:
Fig. 1 tabellarisch Proteinsequenznamen des erfindungsgemäßen in w'fro-Komplexes, sowie Werte aus paarweisen Alignments und multiplen Alignments zwischen Archaebakterien und zwischen Archaebakterien und den entsprechenden humanen Genen;
Fig. 2 eine Tabelle ähnlich der von Fig. 1 , jedoch beschränkt auf
Gleitklammerprotein und Elongationsprotein von E. coli und A. aeolicus;
Fig. 3 eine schematische Dartstellung des erfindungsgemäßen thermostabilen in w'fro-Komplexes;
Fig. 4 Alignments zweier konservierter Regionen des
Gleitklammerproteins;
Fig. 5 ein Alignment einer konservierten Region des Kopplungsproteins;
Fig. 6 ein Alignment einer konservierten Region des
Gleitklammerladers;
Fig. 7 ein Alignment einer konservierten Region des
Gleitklammerladers 2;
Fig. 8 ein Alignment einer konservierten Region des
Elongationsproteins 1 ; Fig. 9 ein Alignment einer konservierten Region des
Elongationsproteins 2;
Fig. 10 ein Alignment einer konservierten Region des Elongationsproteins aus Eubakterien;
Fig. 11 ein Alignment einer konservierten Region der Gleitklammer aus
Eubakterien;
Fig. 12 bis 19 multiple Alignments verschiedener Proteinsequenzen zur
Generierung von Hidden Markov Modellen (HMM);
Fig. 20 eine chromatographische Analyse einer rekombinanten
Gleitkammer (Archaeoglobus fulgidus PCNA (AF 0335));
Fig. 21 und 22 das Ergebnis einer PCR unter Verwendung eines Elongationsproteins, wie es Bestandteil eines erfindungsgemäßen thermostabilen in w'fro-Komplexes ist;
Fig. 23 den Vergleich der Aktivität eines Elongationsproteins mit und ohne Gleitklammerprotein;
Fig. 24 das Resultat der Reinigung eines Gleitklammerproteins;
Fig. 25 die Expression und Reinigung der Archaeoglobus fulgidus-
DNA-Polymerase;
Fig. 26 die Ergebnisse der Verwendung eines erfindungsgemäßen in w'fro-Komplexes in der PCR;
Fig. 27 die Ergebnisse eines Y2H Experimentes; Fig. 28 das PCR-Amplifikationsergebnis des humanen Kollagen-Gens unter Verwendung des erfindungsgemäßen thermostabilen in w'fro-Komplex
Fig. 29 eine tabellarische Übersicht derjenigen Gene, wie sie den in
Fig. 1 angegebenen Proteinsequenznummern entsprechen und aus den jeweiligen Datenbanken erhalten werden können; und
Fig. 30 eine tabellarische Darstellung der Hintergrundinformation zu den verschiedenen Datenbanken in englischer Sprache, aus denen die hierin angegebenen Nukleinsäuresequenz- und Aminosäuresequenzdaten erhalten werden können.
Detaillierte Beschreibung der Figuren
Fig. 1 :
Figur 1 listet tabellarisch Proteinsequenznamen des erfindungsgemäßen thermostabilen in w'fro-Komplexes auf sowie Werte aus paarweisen Alignments und multiplen Alignments zwischen Archaebakterien und zwischen Archaebakterien und den entsprechenden humanen Genen. Hierbei bedeutet die Annotation „1" die Prozentidentität (%) zu dem entsprechneden humanen Gen, berechnet aus dem paarweisen Alignment (siehe Figuren) mit BLASTP 2.0.4 [Feb-24-1998] und die Annotation „2" Prozentidentität zu dem entsprechneden Gen von Archaeoglobus fulgidus, berechnet aus dem paarweisen Alignment (siehe Figuren) mit BLASTP 2.0.4 [Feb-24-1998] und die Annotation „3" Prozenzidentität zu dem entsprechneden humanen Gen, berechnet aus dem paarweisen Alignment mit FASTA 3.1t02 [March, 1998]§. Die Verfahren werden näher beschrieben in: Altschul, Stephen F., Thomas L. Madden, AIejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402 und W.R. Pearson & DJ. Lipman Proc. Natl. Acad. Sei. (1988) 85:2444-2448. Die Fig. 1 zeigt im Falle des Gleitklammerladers 1 , des Gleitklammerlader 2, des Gleitklammer, des Kopplungsprotein und des Elongationsprotein 1 die Sequenznamen aus den Datenbanken und ebenso deren SEQ ID Nummer, wobei die Werte in den Klammern jeweils Prozent Identät je Anzahl Aminosäuren darstellen. Im Falle des Elongationsprotein 2 beziehen sich die Werte auf Prozent Sequenzidentität zu der Archaeoglobus fulgidus- Sequenz. Auch hier sind die Sequenznamen aus den Datenbanken und ebenso deren "SEQ ID No." gezeigt.
Fig. 2:
Fig. 2 zeigt Proteinsequenzen, paarweise Alignments und multiple Alignments aus Eubakterien des Replikationsapparates. Wobei die Annotation 1 %ldentität zu dem entsprechneden Gen aus E. coli bedeutet, berechnet aus dem paarweisen Alignment (siehe Anhang) mit BLASTP 2.0.4 [Feb-24-1998]#. Das Verfahren wird in: Altschul, Stephen F., Thomas L. Madden, AIejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402, näher beschrieben.
Fig. 3:
Fig. 3 zeigt eine Skizze einer möglichen Form des erfindungsgemäßen thermostabilen in w'fro-Komplexes, wobei die Gleitkammer über ein Kopplungsprotein an das Elongationsprotein bindet. Fig. 4:
Fig. 4 zeigt Alignments zweier konservierter Regionen des Gleitklammerproteins, sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: PCNA human (aus SEQ ID NO: 11 ) und die entsprechenden Sequenzen aus Archaeoglobus fulgidus (aus SEQ ID NO: 12), aus Methanococcus janashii (aus SEQ ID NO: 13), aus Pyrococcus horikoschii (aus SEQ ID NO: 14) und aus Methanococcus thermoautothrophicus (aus SEQ ID NO: 15).
Fig. 5:
Fig. 5 zeigt ein Alignment einer konservierten Region des Kopplungsproteins sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: PfuORF2, DPD2JHUMAN, AF1790 und MJ0702. Die SEQ ID Nummern können Fig. 1 entnommen werden.
Fig. 6:
Fig. 6 zeigt ein Alignment einer konservierten Region der koppelnden Untereinheit sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: AC11_HUMAN, AF2060 , MTH0241 , PHBN012 und MJ1422. Die SEQ ID Nummern können Fig. 1 entnommen werden.
Fig. 7:
Fig. 7 zeigt ein Alignment einer konservierten Region des Gleitklammerlader 2 sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: AC15_HUMAN, MJ0884 , AF1195, MTH0240 und MTH0240. Die SEQ ID Nummern können Fig. 1 entnommen werden. Fig. 8:
Fig. 8 zeigt ein Alignment einer konservierten Region des Elongationsproteins 1 , sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: DPODJHUMAN, MJ0885 , MTH1208, PHBT047und DPOL_ARCFU. Die SEQ ID Nummern können Fig. 1 entnommen werden.
Fig. 9:
Fig. 9 zeigt ein Alignment einer konservierten Region des Elongationsproteins 2, sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: AF1722, MJ1630 , PfuORF3, MTH1536 und PHBN021. Die SEQ ID Nummern können Fig. 1 entnommen werden.
Fig. 10:
Fig. 10 zeigt ein Alignment einer konservierten Region des Elongationsproteins aus Eubakterien sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: DP3A_ECOLI: DNA Pol III, alpha subunit, Escherichia coli, BB0579: DNA Pol III, alpha subunit, Borrelia burgdorferi, DP3A_HELPY: DNA Pol III, alpha subunit, Helicobacter pylori AA50: Aquifex aeolicus, section 50 und DP3A_SALTY: DNA Pol III, alpha subunit, Salmonella typhimuhum).
Fig. 11 :
Fig. 11 zeigt ein Alignment einer konservierten Region der Gleitklammer aus Eubakterien sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: AAPOL3B, DP3B_ECOLI, S.TYPHIM, DP3B_PROMI, DP3B_PSEPU und DP3B_STRC0 (AAP0L3B: Aquifex aeolicus Sektion 93: DP3B_ECOLI : DNA Pol III, beta chain, Escherichia coli S.TYPHIM: DNA Pol III, beta chain, Salmonella typhimurium P3B_PROMI : DNA Pol III, beta chain, Proteus mirabilis DP3B_PSEPU: DNA Pol III, beta chain, Pseudomonas putida DP3B_STRCO: DNA Pol III, beta chain, Streptomyces coelicoloή.
Fig. 12:
Fig. 12 zeigt ein multiples Alignment der Gleitklammerprotein-Sequenzen zur Generierung des HMM.
Fig. 13:
Fig. 13 zeigt ein multiples Alignment der eubakteriellen Gleitklammerprotein- Sequenzen zur Generierung des HMM (AAPOL3B: Aqufex Aeolicus Sektion 93: DP3B_ECOLI : DNA Pol III, beta chain, Escherichia coli S.TYPHIM: DNA Pol III, beta chain, Salmonella typhimurium P3B_PROMI : DNA Pol III, beta chain, Proteus mirabilis DP3B_PSEPU: DNA Pol III, beta chain, Pseudomonas putida DP3B_STRCO: DNA Pol III, beta chain, Streptomyces coelicolor).
Fig. 14:
Fig. 14 zeigt ein multiples Alignment der Gleitklammerlader 1- Proteinsequenzen zur Generierung des HMM. Fig. 15:
Fig. 15 zeigt ein multiples Alignment der Gleitklammerlader 2- Proteinsequenzen zur Generierung des HMM.
Fig. 16:
Fig. 16 zeigt ein multiples Alignment der Proteinsequenzen der Kopplungsproteine zur Generierung des HMM.
Fig. 17:
Fig. 17 zeigt ein multiples Alignment der Sequenzen der Elongationsproteine
1 zur Generierung des Hidden Markov Models.
Fig. 18:
Fig. 18 zeigt ein multiples Alignment der Sequenzen der Elongationsproteine
2 zur Generierung des Hidden Markov Models.
Fig. 19:
Fig. 19 zeigt ein multiples Alignment der Sequenzen der eubakteriellen Elongationsproteine zur Generierung des HMM. Folgende Gene sind gezeigt: DP3A_ECOLI: DNA Pol III, alpha subunit, Escherichia coli, BB0579: DNA Pol III, alpha subunit, Borrelia burgdorferi, DP3AJHELPY: DNA Pol III, alpha subunit, Helicobacter pylori AA50: Aquifex aeolicus, section 50 und DP3A_SALTY: DNA Pol III, alpha subunit, Salmonella typhimurium). Fig. 20: (Beispiel 2)
Fig. 20 zeigt eine chromatographische Analyse von rekombinatem Archaeoglobus fulgidus PCNA (AF 0335):
Rekombinantes Archaeoglobus fulgidus-PCNA (AF 0335) liegt unter nativen Bedingungen als Trimer vor. Fig. 20 A zeigt Proteine mit His-Tag (Histidin- Tag) in den Fraktionen 15 (Spur 1 ), 17 (Spur 2), 19 (Spur 3), 21 (Spur 4), 23 (Spur 5), 25 (Spur 6) der ohne Harnstoff durchgeführten Chromatographie. Fig. 20B zeigt Proteine mit His-Tag in den Fraktionen 10 (Spur 1), 11 (Spur 2), 12 (Spur 3), 13 (Spur 4),14 (Spur 5),15 (Spur 6), 16 (Spur 7),17 (Spur 8), der in Anwesenheit von Harnstoff durchgeführten denaturierenden Chromatographie.
Fig. 21 : (Beispiel 3)
Fig. 21 zeigt das Ergebnis einer PCR unter Verwendung eines Elongationsproteins, wie es Bestandteil eines erfindungsgemäßen thermostabilen in w'fro-Komplexes ist:
Jeweils 1 μl (Spur 4), 2,5 μl (Spur 5) und 5 μl (Spur 6) Pyrococcus horikoshii DNA-Polymerase (PH1947; Grobextrakt s. Fig. 25) wurden zum Aktivitätsvergleich mit 1 Einheit Taq Polymerase (Spur 2) und 1 μl Archaeoglobus fulgidus DNA-Polymerase (AF 0497)-Grobextrakt (s. Fig.25) (Spur 3) individuell in Standard PCR Reaktionen eingesetzt.; Spur 1 zeigt einen DNA-Größenmarker (New England Biolabs; Mischung aus 1 kb DNA ladder und 100 bp DNA ladder).
Fig. 22: (Beispiel 4)
Fig. 22 zeigt das Ergebnis einer PCR unter Verwendung eines Elongationsproteins, wie es Bestandteil eines erfindungsgemäßen thermostabilen in w'fro-Komplexes ist:
Proben der PCR mit Archaeoglobus fulgidus DNA-Polymerase AF 0497 wurde nach unterschiedlichen Zyklenzahlen (Z) entnommen und auf einem 1 % Agarosegel in 1 x TAE Puffer (40 mM Tris-Acetat; 20 mM Natriumacetat; 10 mM EDTA ; pH 7,2) mit 10V/cm aufgetrennt. Spur 2: 16Z; Spur 3:21 Z; Spur 4: 26Z; Spur 5: 28Z; Spur 6. 30Z; Spur 7: 32Z; Spur 8: 34Z; Spur 9: 36Z; Spur 10: 38Z; Spur 11 : 40Z; Spur 1 zeigt einen DNA Größenmarker (New England Biolabs; Mischung aus 1 kb DNA ladder und 100 bp DNA ladder). Der obere Abschnitt zeigt Reaktionsprodukte der Taq Polymerase; der untere Abschnitt zeigt Reaktionsprodukte der Archaeoglobus fulgidus DNA-Polymerase AF 0497.
Fig. 23: (Beispiel 5)
Fig. 23 zeigt einen Vergleich der Aktivität eines Elongationsproteins mit und ohne Gleitklammerprotein. Probe 1 repräsentiert einen enzymfreien Ansatz. Proben 2-12 enthielten außerdem je 3μl einer 1 :1000 Verdünnung einer Fraktion von rekombinanter Archaeoglobus /u/gr/divs-DNA-Polymerase (Ausgangskonzentration 7,5 μg/μl). Proben 3-7 sowie 8-12 außerdem 0,5; 1 ; 2; 4 und 8 μl einer Fraktion von rekombinantem Gleitklammerprotein aus Archaeoglobus fulgidus PCNA. Intensitätsauswertung mit AIDA: Intensität Hintergrund Spur 1 : 46,4; Spur 2= 258,5; Spur 3= 164,4; Spur 4= 122,8; Spur 5= 162,1 ; Spur 6= 297,4; Spur 7=359,5
Fig. 24: (Beispiel 6)
Fig. 24 zeigt das Ergebnis der Reinigung eines Gleitklammerproteins: Spur 1 zeigt einen Molekulargewichtsstandard ((BIO RAD Cat Nr 161-0317). Für Spur 2 wurden 500 μl Bakterien direkt vor der Induktion sedimentiert, gemäß der Anweisung des Herstellers zum Lauf von NuPage Gelen (NOVEX; Fig. 25) behandelt und aufgetragen. Spur 3 zeigt die gleiche Menge Bakterien 16 Stunden nach der Elution. Spuren 4 und 5 zeigen je 8μl der beiden Eluate der Ni-Nta Agarosesäule nach der Dialyse. Durch Reinigung über Ni-NTA- Agarose (Qiagen) werden hochreine Fraktionen des Gleitklammerproteins des Organismus Archaeoglobus fulgidus erhalten (siehe Spuren 4 und 5).
Fig. 25: (Beispiel 7) Fig. 25 zeigt die Expression und Reinigung der Archaeoglobus fulgidus DNA- Polymerase (siehe auch Beispiel 7):
Spur 1 zeigt einen Molekulargewichtsstandard ((BIO RAD Cat Nr 161-0317). Für Spur 2 wurden 500μl Bakterien direkt vor der Induktion sedimentiert, gemäß der Anweisung zum Lauf von NuPage Gelen behandelt und aufgetragen. Spur 3 zeigt die gleiche Menge Bakterien 16 Stunden nach der Elution. Spuren 4 und 5 zeigen je 8μl der beiden Eluate der Ni-Nta Agarosesäule nach der Dialyse. Spur 6 zeigt 8 ml eines dialysierten Grobextraktes. Spuren 4 und 5 zeigen hochreine Fraktionen der Archaeoglobus fulgidus DNA-Polymerase, die durch Reinigung über Ni-NTA- Agarose werden erhalten.
Fig. 26: (Beispiel 8)
In Fig. 26 sind die Ergebnisse der Verwendung eines erfindungsgemäßen in w'fro-Komplexes in der PCR gezeigt. Spur eins zeigt eine PCR Reaktion ohne Verwendung einer Gleitklammer, wohingegen in der Spur 2 das Ergebnis einer PCR Reaktion unter Verwendung eines Gleitklammerproteins gezeigt ist.
Fig. 27: (Beispiel 9)
Fig. 27 zeigt die Ergebnisse eines „Yeast-Two-Hybrid"-Experiments, hierin als Y2H- Experiment bezeichnet, wobei die Reihe A mit Zellen bestückt ist, die den leeren pGAD424 Vektor (Clontech, Palo Alto, USA) tragen, sodaß die Transkriptions-Aktivierungsdomäne exprimiert wird, die Reihe B mit Zellen bestückt ist, die den pGAD424 Vektor tragen, von dem das Sacharomyces cerevesiae-Gen CDC48 als Fusionsprotein mit der Transkriptions-Aktivierungsdomäne exprimiert wird, die Reihe C mit Zellen bestückt ist, die den pGAD424 Vektor tragen, von dem das Gleitklammergen aus Archaeoglobus fulgidus als Fusionsprotein mit der Transkriptions- Aktivierungsdomäne exprimiert wird, die Reihe D nicht mit Zellen bestückt ist und die Reihe E mit Zellen bestückt ist, die den pGAD424 Vektor tragen, von dem das Elongationsproteingen aus Archaeoglobus fulgidus als Fusionsprotein mit der Transkriptions-Aktivierungsdomäne exprimiert wird.
Die Spalte 1 ist mit Zellen bestückt, die den leeren pGBT9 Vektor (Clontech, Palo Alto, USA) tragen, sodaß die DNA-Bindedomäne exprimiert wird, die Spalte 2 ist bestückt mit Zellen, die den pGBT9 Vektor tragen, von dem das Saccharomyces cerevisiae-Gen UFD3 als Fusionsprotein mit der DNA- Bindedomäne exprimiert wird, die Spalte 3 ist bestückt mit Zellen, die den pGBT9-Vektor tragen, von dem das Gleitklammerprotein aus Archaeoglobus fulgidus als Fusionsprotein mit der DNA-Bindedomäne exprimiert wird, die Spalte 4 ist bestückt mit Zellen, die den pGBT9 Vektor tragen, von dem das Kopplungsprotein aus Archaeoglobus fulgidus als Fusionsprotein mit der DNA-Bindedomäne exprimiert wird und die Spalte 5 ist bestückt mit Zellen, die den pGBT9 Vektor tragen, von dem das Elongationsprotein aus Archaeoglobus fulgidus als Fusionsprotein mit der DNA-Bindedomäne exprimiert wird.
Fig. 28: (Beispiel 10) In Fig. 28 ist das PCR-Amplifikationsergebnis des humanen Kollagen-Gens jeweils unter Verwendung des erfindungsgemäßen thermostabilen in w'fro- Komplexes und ohne diesen dargestellt. Das erwartete Amplifikat hat in beiden Fällen eine Größe von etwa 1 Kb. Spur 1 zeigt einen Molekulargewichtsmarker, Spur 2 zeigt das Ergebnis der Amplifikation unter Verwendung eines erfindungsgemäßen Elongationsproteins ohne Gleitklammer und Spur 3 zeigt das Ergebnis der Amplifikation unter Verwendung des erfindungsgemäßen thermostabilen in w'fro-Komplexes.
Beispiele:
Die Erfindung wird durch die folgenden Beispiele näher beschrieben, ist aber nicht auf diese beschränkt.
Beispiel 1 :
Die DNA wird mittels der bekannten Verfahren aus dem Organismus Archaeoglobus fulgidus (DSM No. 4304) gereinigt. Die Aufzucht der Organismen erfolgte hierbei durch die DSM (Deutsche Sammlung für Mikroorganismen). Um die entsprechenden Gene (Gleitklammerlader 1/2, Gleitklammer, Elongationsproteine 1/2, koppelnde Untereinheit) in die Expressionsvektoren pTrc99 und pQE30 zu klonieren, werden für jedes Gen Primer entwickelt, die den vollständigen offenen Leserahmen samt Stopcodon umspannen. Nur für die Klonierung in pTRC99 ist in den Primer- Sequenzen ebenfalls das Startcodon enthalten. Die entsprechenden Primer zur Klonierung in pQE30 enthalten die dem Startcodon unmittelbar folgenden Nukleotide als erste genspezifische Sequenzen. Hierbei werden den Primern jeweils Restriktionsenden hinzugefügt, die die gerichtete Klonierung in den Expressionsvektor erleichtern. Unter Verwendung von etwa 200 ng gesamtgenomischer DNA werden mit den entsprechenden Annealing- Temperaturen PCR-Reaktionen gefahren (etwa 35 Zyklen) und die daraus resultierenden Produkte gereinigt. Nach der Reinigung werden die Produkte mit Restriktionsenzymen behandelt und über ein Agarosegel gereinigt, um zur Ligation bereit zu stehen. Der Expressionsvektor wird mittels Restriktionsenzymen so linearisiert, gereinigt und verdünnt, daß er zur Ligation mit den Amplifikaten der Gene des erfindungsgemäßen in vitro- Komplexes aus der obigen PCR bereit ist. Die Ligation wird angesetzt und nach Inkubation ein Aliquote in einen der E. coli Stämme INValphaF' (Invitrogen) odert XL1 blue oder M15 [prep4] transformiert. Von jedem Gen werden mindestens 3 positive Kolonien gepickt, Plasmid-DNA präpariert und die Inserts auf Vollständigkeit und Richtigkeit mittels DNA-Sequenzierung überprüft. Korrekte Klone werden ausgesucht und erneut zur Vereinzelung auf Agarplatten (Ampicillin; Ampicillin und Kanamycin) ausgebracht. Kolonien werden gepickt und Übernachtkulturen angesetzt. Ein Aliquot (500 μl) der Übernachtkultur wird in eine ein bis fünf Liter Kultur von LB (Ampicillin: 80 mg/l bzw zusätzlich 25μg/ml Kanamycin für M15 [prep4]Stämme) gegeben. Die Kulturen wachsen bis zu einer OD66o von 0.8 bei 37°C. Nun wird zur Induktion IPTG zugegeben (125 mg/l). Diese Kulturen wachsen nun weitere 4-21 Stunden. Die Kulturen werden zentrifugiert und ausgehend von dem Vektor pQE30 exprimierte rekombinante Proteine gemäß protocol 8 und 11 aus „The QIAexpressionist" (Dritte Auflage, QIAGEN) extrahiert und gereinigt. In alternativen Reinigungsprotokollen werden die Pellets in einem Puffer aufgenommen (Puffer A: 50 mM Tris-HCI pH 7.9, 50 mM Dextrose, 1 mM EDTA). Nach Zentrifugation werden die Zellen erneut aufgenommen, jedoch enthält Puffer A nun zusätzlich Lysozym (4 mg/ml). Nach Inkubation (15 min.) wird ein gleiches Volumen Puffer B zugegeben (B: 10 mM Tris-HCI (pH 7.9), 50 mM KCI, 1 mM EDTA, 1 mM PMSF, 0.5 % Tween 20, 0.5 % Nonidet P40) und die Lyse zur Inkubation bei 75°C für eine Stunde gegeben. Nach Zentrifugation wird der Überstand entnommen und die überexprimierten Proteine werden mittels (NH )2S04 ausgefällt. Die Pellets werden nach Zentrifugation gesammelt und die Proteine mit Puffer A resuspendiert. Die resuspendierten Proteine werden gegen Aufbewahrungspuffer (50 mM Tris-HCI (pH 7.9), 50 mM KCI, 0.1 mM EDTA, 1 mM DTT, 0.5 mM PMSF, 50 % Glycerol) dialysiert und anschließend bei +4°C bis -70°C gelagert. Um die Aktivität der Proteine zu testen, werden Reaktionen wie folgt zusammengesetzt. Aliquots der Proteine werden in unterschiedlichen Konfigurationen und Molaritäten vereint, Gleitklammerlader 1/2 mit Gleitklammer, koppelnder Untereinheit und Elongationsprotein 1 , oder Gleitklammerlader 1/2 mit Gleitklammer, mit und ohne koppelnder Untereinheit und Elongationsprotein 2, oder Gleitklammer, und Elongationsprotein 1 oder 2 und schließlich nur Elongationsprotein 1 oder 2; als Puffer dient der obige Aufbewahrungspuffer. DNA- Polymerisationsaktivität wird mittels Inkorporation von (methyl-3H) TTP in Trichlorsäure-unlösliches Material oder mittels Inkorporation von Digoxigenin- dUTP in unmarkierte DNA-Doppelstrangbereiche mit freien internen 3'- Enden gemessen (Ishino, Y., Iwasaki, H., Fukui, H., Mineno, J., Kato, I., & Schinigawa, H. (1992) Biochimie 74, 131-136). Um die Prozessivität zu bestimmen, werden die obigen Proteingemische in Primer- Elongationsexperimenten verwendet. Ein M13-Einzelstrangtemplate wird in 10 mM Tris-HCI (pH 9.4) eingebracht und gemeinsam mit einem Universal- primer (New England Biolabs) (5'-FITC markiert) erhitzt (92°C) und abgekühlt (Raumtemperatur). Verdünnungsserien des so generierten Template-Primer- Gemisches werden in einer Reaktion bestehend aus Nukleotiden (etwa 200 μM bis 1 mM), Reaktionspuffer (Endkonzentration: 50 mM KCI, 10 mM Tris- HCI (pH 8.3), 1.5-5 mM MgCI2, ATP (0 mM - 200 mM) und proteinstabilisierenden Agenzien zusammengeführt und für 10 Minuten bei 37°C, 52°, 62°, 68°, 74°, und 78° inkubiert. Ein Aliquot wird zur Analyse auf einen Sequenzautomaten geladen (z.B. Alf, Pharmacie Biotech). Alternativ kann eine qualitative Analyse der Steigerung der Prozessivität auch nach Maga G., Jόnssom Z.O., Stucki M., Spadari S. und Hübscher U.( J. Mol. Biol. 1999; 285: 259-267, Dual Mode of Interaction of DNA-Polymerase ε with Proliferating Cell Nuclear Antigen in Primer Binding and DNA Synthesis) über den Nachweis einer Stimulation des Einbaus von Nukleotiden in Doppelstrangbereiche mit freien internen 3 '-Enden unter geeigneten Reaktionsbedingungen erfolgen (s. Fig. 23) Die obigen Proteingemische dienen auch dazu Fidelity und Exonukleaseaktivität zu messen, wobei die in Kohler et al. (Proc. Natl. Acad. Sei. USA 88:7958-7962 (1991 ) oder Chase et al. (J. Biol. Chem., 249:4545-4552 (1972) beschriebenen Verfahren zur Anwendung kommen. Ebenso werden die Proteingemische in der PCR eingesetzt (Fig. 26; Methods in Molecular Biology Vol. 15 Humana Press Totowa, New Jersey, 1993, edited by Bruce A. White).
Beispiel 2: Trimerisierung von PCNA
In folgenden Experimenten wird gezeigt, daß rekombinantes Archaeoglobus fulgidus PCNA-Protein (AF 0335) unter nativen Bedingungen als Trimer vorliegt und somit eine für die Klammerbildung geignete Struktur einnehmen kann.
Für das in Fig. 20 A abgebildete Experiment wurden 350 μl Ni-NTA Agarose Eluat von PCNA (s. Fig. 24) und 150 μl einer rohen DNA-Polymerase Fraktion (s. Fig. 25) mit Lagerpuffer ohne Glyzerin (s. Fig. 25) auf 1 ml aufgefüllt und nach Vorschrift des Herstellers auf einer Superdex 200 HR (Pharmacia) FPLC Säule im gleichen Puffer die Proteine nach Molekulargewicht aufgetrennt. Es wurden während des gesamten Laufes Fraktionen zu je 1 ml gesammelt. Für das in Fig. 20 B. dargestellte Experiment wurden gleiche Mengen der gleichen Proteinfraktionen in Storagepuffer ohne Glyzerin mit 8 M Harnstoff auf 1 ml aufgefüllt, 10 Minuten bei 95°C denaturiert und anschließend die Proteine im gleichen Puffer wie für Fig. 20 A dargestellt nach Molekulargewicht aufgetrennt. Je 8 μl einzelner Fraktionen wurden anschließend auf einem NuPage Bis-Tris Gel aufgetrennt (NOVEX; s. Fig. 25) und nach Angaben des Herstellers mittels eines Blot-Modules (NOVEX) auf Nitrocellulosemembran geblottet. Der Nachweis von Proteinen mit His-Tag erfolgte nach Angaben der Hersteller mittels des RGS His Antibody (QIAGEN) und des DIG Luminiscent Detection Kit for Nucleic Acids (Boehringer Mannheim). Fig. 20 A zeigt Proteine mit His-Tag in den Fraktionen 15 (Spur 1), 17 (Spur 2), 19 (Spur 3), 21 (Spur 4), 23 (Spur 5), 25 (Spur 6) der ohne Harnstoff durchgeführten Chromatographie. Fig. 20B zeigt Proteine mit His-Tag in den Fraktionen 10 (Spur 1), 11 (Spur 2), 12 (Spur 3),13 (Spur 4),14 (Spur 5),15 (Spur 6), 16 (Spur 7), 17 (Spur 8) der in Anwesenheit Harnstoff durchgeführten denaturierenden Chromatographie. Archaeoglobus fulgidus DNA- Polymerase (AF0497) hat ein errechnetes Molekulargewicht von Mr = 90 kDa; Archaeoglobus fulgidus-PC A (AF0335) hat ein errechnetes Molekulargewicht von Mr = 27 kDa. Wenn Archaeoglobus fulgidus-PC A (AF 335), wie das homologe Protein aus Eukaryonten, als Homotrimer vorliegt, hat der native Faktor daher ein theoretisches Molekulargewicht von Mr = 81 KDa. Die in Fig. 20A gezeigten Ergebnisse bestätigen diese Annahme, nach der natives PCNA ein ähnliches Molekulargewicht aufweist, wie die DNA- Polymerase, für das rekombinante Protein: Beide Proteine eluieren unter nativen Bedingungen in den gleichen Fraktionen von der Gelfiltrationssäule (Fig 20 A, Spuren 1-3). Das Maximum der PCNA Menge eluiert dabei etwas später als das Maximum der DNA-Polymerasemenge und korelliert mit der etwas geringeren Größe des postulierten Trimers (81 kDa gegenüber 90 KDa). Die in Fig. 20 B gezeigten Daten belegen, daß diese Beobachtung auf einer Oligomerisierung des PCNA beruht, da unter denaturierenden Bedingungen, die Protein/Protein Interaktionen nicht zulassen, PCNA deutlich später von der Säule eluiert als die DNA-Polymerase (Fig. 20 B , Spuren 1-7), was dem geringeren Molekulargewicht des Monomers entspricht.
Beispiel 3: Isolierung, Bereitsstellung und Verwendung eines Elongationsproteins (Pyrococcus horikoshii DNA-Polymerase (PH1947)) zur Ausbildung des erfindungsgemäßen in fro-Komplexes.
Das Elongationsprotein aus Pyrococcus horikoshii (Pyrococcus horikoshii- DNA-Polymerase (PH 1947)) wurde in PCR-Reaktionen verwendet und führt zu effizenter Amplifikation eines spezifischen DNA Produktes. 1 (Spur 4), 2,5 (Spur 5)und 5 μl (Spur 6) Pyrococcus horikoshii DNA- Polymerase (PH1947; Rohextrakt s. Fig. 25) wurden zum Aktivitätsvergleich mit 1 Einheit Taq Polymerase (Spur 2) und 1 μl Archaeoglobus fulgidus-DNA- Polymerase (Af 497) Rohextrakt (s. Fig.25) (Spur 3) individuell in Standard PCR-Reaktionen eingesetzt.; Spur 1 zeigt einen DNA-Größenmarker (New England Biolabs; Mischung aus 1 kb DNA Molekulargewichtsgrößenmarker und 100 bp DNA-Molekulargewichtsgrößenmarker). Jede Reaktion enthielt neben dem Enzym 5 ng template DNA (421 bp Rsa I-Fragment mit Adaptoren in PCR 2.1 kloniert; (Kaiser C, v. Stein O., Laux G., Hoffmann M., Electrophoresis 1999; 20: 261-268, Functional Genomics in Cancer Research: Identification of Target Genes of the Epstein-Barr Virus Nuclear Antigen 2 by Subtractive cDNA Cloning and High-throughput Differential Screening using High-density Agarose Gels); je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1 ,5 μM der spezifischen Adaptor-Primer (Kaiser et al., (1999)); 50 mM KCI; 2 mM MgCI2; 10 mM Tris HCI (pH 8,3 für Taq-Reaktionen; pH 7,5 für Archaeoglobus fulgidus und Pyrococcus
Figure imgf000063_0001
Reaktionen) bei einem Gesamtvolumen von 50 μl pro Reaktion. Die Proben durchliefen 40 Zyklen bestehend aus 30 s bei 95°C; 30 s bei 55°C und 120 s bei 68°C. Anschließend wurden 5 μl der Ansätze entnommen und auf einem 1 % Agarosegel in 1 x TAE Puffer (40 mM Tris-Acetat; 20 mM Natriumacetat; 10 mM EDTA ; pH 7,2) mit 10V/cm aufgetrennt.
Beispiel 4: Verwendung eines Elongationsproteins
Die Archaeoglobus fw/g/'dus-DNA-Polymerase AF 0497 kann PCR-Produkte ebenso effizient wie Taq-Polymerase generieren.1 Einheit Taq-Polymerase und 1 μl Archaeoglobus fu/g/dus-DNA-Polymerase AF 0497 Rohextrakt (s. Fig. 25) wurden zum Aktivitätsvergleich individuell in Standard-PCR- Reaktionen eingesetzt. Jede Reaktion enthielt neben dem Enzym 20 ng M13 MP18 ssDNA; je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1 ,5 μM DNA Primer folgender Nukleotidsequenz:
GGATTGACCGTAATGGGATAGGTTACGTT (SEQ ID NO.: 47) bzw AGCGGATAACAATTTCACACAGGAAACAG (SEQ ID NO.: 48) in 50 mM KCI; 2 mM MgCI2; 10 mM Tris HCI (pH 8,3 für Taq Reaktionen; pH 7,5 für Archaeoglobus fulgidus Polymerase-Reaktionen) bei einem Gesamtvolumen von 50μl pro Reaktion. Die Proben durchliefen eine unterschiedliche Anzahl von Zyklen bestehend aus 30 s bei 95°C; 30 s bei 59°C und 60 s bei 68°C. Nach unterschiedlichen Zyklenzahlen (Z) wurden 5 μl der Ansätze entnommen und auf einem 1 % Agarosegel in 1 x TAE Puffer (40 mM Tris- Acetat; 20 mM Natriumacetat; 10 mM EDTA ; pH 7,2) mit 10V/cm aufgetrennt (Siehe Fig. 22).
Beispiel 5: Bereitssteliung und Verwendung eines erfindungsgemäßen thermostabilen in v/'fro-Komplexes:
In einem Endvolumen von 50 μl waren unter anderem folgende Komponenten eines erfindungsgemäßen in w'fro-Komplexes enthalten: 10 mM Tris/HCI pH 7,5; 50 mM KCI; 2 mM MgCI2; 10 μg BSA (kann auch weggelassen werden); 0,5 mM Digoxigenin-dUTP (DIG-dUTP, Boehringer Mannheim); 40 nM ; 0,5μg Poly dA/40 nM OligodT (20mer) Hybrid. Probe 1 ohne Elongationsprotein. Proben 2-12 enthielten außerdem je 3μl einer 1 :1000 Verdünnung einer Fraktion von rekombinanter Archaeoglobus ftv/g/dus-DNA-Polymerase (Elongationsprotein). Proben 3-7 sowie 8-12 außerdem 0,5; 1 ; 2; 4 und 8 μl einer Fraktion von rekombinantem Gleitklammerprotein aus Archaeoglobus fulgidus.
Die Proben wurden 30 Minuten bei 68°C inkubiert und Nukleinsäuren anschließend durch Präzipitation mit 3 Volumenteilen Ethanol / 3 M Natriumacetat pH 5,2 (30/1 ). Gefällt. Das Präzipitat wurde in 20 μl 100 mM Tris-HCI (pH 7,9) resuspendiert und je 10μl in einzelne Kavitäten einer 96- Well Silent Screen plate with Nylon 66 Biodyne B 0,45μm pore (Nalge Nunc) aufgetropft und die Nukleinsäuren 10 Minuten bei 70°C auf der Membran fixiert. Die Detection von inkorporiertem Digoxigenin-dUTP (Boehringer Mannheim) erfolgte mittels des DIG Luminiscent Detection Kit for Nucleic Acids (Boehringer Mannheim). Zum Nachweis der Chemilumineszenz wurde auf die Membran abschließend für 30 s ein Röntgenfilm aufgelegt. PCNA stimuliert die Einbindung von DIG-dUTP durch die DNA-Polymerase deutlich (vgl. Spuren 3-7 mit Spur 2). Die verwendete PCNA- Fraktion weist keine endogene Polymeraseaktivität auf (Spuren 8-12).
Beispiel 6: Amplifikation; Klonierung, Expression und Reinigung eines
Gleitkiammerproteins aus Archaeoglobus fulgidus:
Nach Amplifikation des erfindungsgemäßen Gleitklammerprotein Gens aus Archaeglobus fulgidus wurde das Gen in die Expressionsvektoren pTrc99 und pQE30 kloniert. Die Expression, Reinigung und gelelektrophoretische Auftrennung von Archaeoglobus fulgidus-Gleitklammerprotein (PCNA (AF 0335)) erfolgte, wie für das Elonagationsprotein (die DNA-Polymerase AF 0497) in Fig. 25 dargestellt.
Beispiel 7: Bereitstellung eines Elongationsproteins Expression und Reinigung der Archaeoglobus fu/g/dus-DNA-Polymerase: pQE 30 Plasmid-DNA (QIAGEN) mit in korrektem Leseraster inseriertem Gen für das Elongationsprotein, die Archaeoglobus fulgidus DNA- Polymerase AF 0497, wurde nach Anleitung aus "The QIAexpressionist (dritte Auflage; QIAGEN)" in kompetente E.coli M15 [prep 4] transformiert. Übertragung auf 1 L Kulturmedium und induzierte Proteinexpression erfolgte ebenfalls nach den dort vorgegebenen Schemata. Nach 16 Stunden Induktionszeit wurden die Bakterien 10 Minuten bei 5000 g sedimentiert. Zum Erhalt hochreiner Fraktionen wurde gemäß The QIAexpressionist (dritte Auflage; QIAGEN; protocol 8, protocol 11 ) verfahren. Lediglich die Elution der gebundenen Proteine erfolgte mit 2 x 2 ml Elutionspuffer und nicht wie dort beschrieben mit 4 x 0,5 ml Elutionspuffer. Zum Erhalt von Rohextrakten rekombinanter Proteine wurden die Bakteriensedimente alternativ mit 100 ml Puffer A (50 mM Tris-HCI pH 7,9; 50 mM Glukose;1 mM EDTA) gewaschen und nach erneuter Zentrifugation in 50 ml Puffer A mit 4mg/ml Lysozym resuspendiert. Nach 15 Minuten bei Raumtemperatur erfolgte die Zugabe von 50 ml Lysepuffer (10 mM Tris-HCI pH 7.9; 50 mM KCI; 1 mM EDTA; 0,5% Tween 20; 0,5% IGPAL) und E. coli-Proteine wurden durch 60-minütige Inkubation bei 75°C im Wasserbad denaturiert. Nach anschließender Zentrifugation für 15 Minuten bei 27000 g wurde der Überstand durch langsame unter permanentem Rühren erfolgte Zugabe von 40 mg kristallinem Ammoniumsulfat pro ml Extrakt präzipitiert. Präzipitierte Proteine wurden 10 Minuten bei 27000 g sedimentiert und das Sediment in 20 ml Puffer A resuspendiert. Sowohl diese Rohextrakte als auch die Elutionsfraktionen aus der Ni NTA-Agarose wurden je 2-mal 8 Stunden gegen mindestens je 50 Volumenteile Lagerpuffer (Puffer (10 mM Tris-HCI pH 7.9; 50 mM KCI; 1 mM EDTA; 50% Glyzerin; 1 m>M Dithiothreitol; 0,5 mM Phenylmethylsulfonylfluorid) dialysiert und bei -20°C aufbewahrt. Zur Analyse der Proteinzusammensetzung der erhaltenen Fraktionen wurden Teile davon nach Anweisungen des Herstellers auf NuPAge™ 10% Bis-Tris Gelen (NOVEX) elektrophoretisch aufgetrennt und die enthaltenen Proteine mit Coomassie brilliant blue angefärbt. Spur 1 zeigt einen Molekulargewichtsstandard ((BIO RAD Cat Nr 161-0317). Für Spur 2 wurden 500μl Bakterien direkt vor der Induktion sedimentiert, gemäß der Anweisung zum Lauf von NuPage Gelen behandelt und aufgetragen. Spur 3 zeigt die gleiche Menge Bakterien 16 Stunden nach der Elution. Spuren 4 und 5 zeigen je 8μl der beiden Eluate der Ni-Nta-Agarosesäule nach der Dialyse. Spur 6 zeigt 8 ml eines dialysierten Grobextraktes. Durch Reinigung über Ni- NTA-Agarose werden hochreine Fraktionen der Archaeoglobus fulgidus DNA-Polymerase erhalten (Spuren 4 und 5). Aber bereits im Grobextrakt stellt dieses Enzym das dominierende Polypeptid dar. i
- 65 -
Beispiel 8: Verwendung eines erfindungsgemäßen in vitro Komplexes in der PCR
Der Einsatz von Archeoglobus fulgidus PCNA (AF 0335) in PCR Reaktionen mit Archeoglobus fulgidus DNA-Polymerase (AF 0497) führt zu einer effizienteren Amplifikation eines spezifischen DNA-Produkts im Vergleich zu einer PCR-Reaktion ohne PCNA. Die Auswertung der amplifizierten DNA- Mengen laut AIDA (Advanced Image Data Analyzer, Software Version AIDA 2.1 , Firma Raytest) zeigt einen Hintergrund von 94, eine Wert von 104,9 für Spur 1 und einen Wert von 228,4 für Spur 2. Zieht man von den Werten aus den Spuren 1 und 2, den Hindergrund ab, folgt daraus eine 12,3-fache prozessive Stimulation durch PCNA in der Reaktion dessen Ergebnis in Spur 2 gezeigt ist.
0,3 μl Archeoglobus fu/g/dus-DNA-Polymerase (7.5 μg/μl Proteinkonzentration von AF497; Rohextrakt siehe Fig. 25) wurden zur Analyse einer Stimulation der PCR-Aktivität durch Archeoglobus fulgidus- PCNA (NiNTA Eluat; Fig.24) mit 0 μl und 0,01 μl individuell in PCR Reaktionen eingesetzt. Jede Reaktion enthielt neben dem Enzym und 0,05 μl (2.8 μg) des Gleitklammerproteins von Archaeglobus fulgidus (homolog zu proliferating-cell-nuclear antigen, PCNA) eines mittels PCR amplifizierten und nicht aufgereinigten PCNA-Gen-Fragments (PCR Reaktion zur spezifischen Amplifikation des PCNA-Fragments: 0,5 μl Archeoglobus fulgidus Polymerase; je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1 ,5 μM der spezifischen Primer (5'-ACG CGC GGA TCC ATA GAC GTC ATA ATG ACC GG-3' (SEQ ID No.: 49); 5'-TAC GGG GTA CCC GAG CCA AAA TTG GGT AAA G-3' (SEQ ID No.:50); 50 mM KCI; 2 mM MgCI2; 10 mM Tris-HCI (pH 7,5) sowie 50 ng eines pQE30 Plasmids, das die kodierenden Sequenzen von Archaeoglobus fulgidus PCNA in die BamHI- und Kpn I- Restriktionsstellen insertiert trägt, bei einem Gesamtvolumen von 50 μl pro Reaktion und bei einer Zyklenzahl von 40 bestehend aus 30 s bei 95°C; 30 s bei 61 °C; 240 s bei 68°C); je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1 ,5 μM der spezifischen Primer
(5'-ACG CGC GGA TCC ATA GAC GTC ATA ATG ACC GG-3' (SEQ ID No.: 51 ); und 5'-TAC GGG GTA CCC GAG CCA AAA TTG GGT AAA G-3' (SEQ ID No.: 52); 50 mM KCI; 2 mM MgCI2; 10 mM Tris HCI pH 7,5 bei einem Gesamtvolumen von 50 μl pro Reaktion. Die Proben durchliefen 40 Zyklen bestehend aus 30s bei 95°C; 120s bei 61 °C; 240s bei 68°C. Anschließend wurden 5 μl der Ansätze entnommen und auf ein 1 % Agarosegel in 1 x TAE Puffer (40 mM Tris-Acetat; 20 mM Natriumacetat; 10 mM EDTA; pH 7,2) mit 10 V/cm aufgetrennt.
Beispiel 9: Y2H-Experimente:
Interaktionen von Proteinen des erfindungsgemäßen Komplexes aus Archaeoglobus fulgidus wurden mit dem Y2H-System gezeigt. Die kodierenden Bereiche von Genen aus Archaeoglobus fulgidus, deren Genprodukte im erfindungsgemäßen thermostabilen in w'fro-Komplex verwendeten werden, wurden mittels PCR amplifiziert, in die Vektoren pGBT9 (vertikale Spalten der Fig. 27) und pGAD424 (horizontale Reihen der Fig. 27) kloniert und durch gap-repair in Hefe PJ69-4a (für pGAD424) und PJ69-4alpha (für pGBT9) als Hybridproteine zur Expression gebracht. Ebenso wurde eine positive Kontrolle mittels PCR amplifiziert, in die Vektoren pGBT9 (siehe auch vertikale Spalten der Fig. 27) und pGAD424 (siehe auch horizontale Reihen der Fig. 27) kloniert und durch gap-repair in den Hefestamm PJ69-4a (für pGAD424) und PJ69-4alpha (für pGBT9) als Hybridproteine zur Expression gebracht. Diploide Zellen, die beide Vektoren enthalten, wurden durch Paarung entsprechend dem gezeigten Raster in Fig. 27 erzeugt. Die Expression von drei unabhängigen Reportern (HIS3, ADE2 und MEL1) wurde gemessen. Gezeigt ist in Fig. 27 das Wachstum auf Medium ohne Histidin und Adenin. In diesem Experiment wachsen jene Zellen, die beide Vektoren tragen und in dessen zudem die Expressionsprodukte dieser beiden Vektoren einander binden. In Folge der Bindung der Expressionsprodukte wird Transkription der Reportergene initiiert, so daß die Histidin- und Adenin-Auxotrophie aufgehoben wird und diese Zellen in der Lage sind in besagtem Medium zu wachsen.
Alle hier positiven Klone waren auch positiv bezüglich der Expression des MEL ' -Gens. Die Handhabung des yeast two-hybrid (Y2H)systems erfolgte gemäß der Anleitung der Firma Clontech (yeast protocols handbook, PT3024-1 ). Fig. 27 zeigt eine Bindung zwischen den Proteinen der Positivkontrolle, dem Elongationsprotein und dem Gleitklammerprotein, dem Gleitklammerprotein und dem Gleitklammerprotein und dem Kopplungsprotein und dem Gleitklammerprotein.
Beispiel 10: Verwendung eines erfindungsgemäßen thermostabilen in vitro-Komplexes:
Der erfindungsgemäße thermostabile in w'fro-Komplex läßt sich sehr gut bei der Amplifikation von genomischen DNA Fragmenten einsetzen. Hierbei kommt es auch bei Verwendung von geringen Mengen eines Templates oder eines Elongationsproteins zu effizienter Amplifikation. In Beispiel 10 wurde eine Abschnitt des humanen Kollagen-Gens amplifiziert, einmal unter Verwendung des erfindungsgemäßen thermostabilen in w'fro-Komplexes und einmal unter Verwendung eines Elongatiosnproteins alleine. In einem Gesamtvolumen von 50 μl wurden 0,5 μl Nukleotidmix (25 mM Ausgangslösung beinhaltend jedes Nukleotid A, C, G und T), 0,2 μl jedes Primers (100 pmol/μl Ausgangslösung "Collagen Forward" 5'-TAA AGG GTC ACC GTG GCT TC-3' (SEQ ID NO.: 53), 100 pmol/μl Ausgangslösung "Collagen Reverse" 5'- CGA ACC ACA TTG GCA TCA TC-3' SEQ ID NO.: 54), 0,8 μl DNA (200 ng/μl human genomic DNA von Boehringer Mannheim), 5 μl 10 x PCR Puffer (pH 7.5) (100mM Tris-HCI pH7.5, 500 mM KCI,15 mM MgCI2), 1 μl Elongatinsprotein (AF1722, 7.5 μg/μl Proteinkonzentration) und 8 μl Gleitklammerprotein (AF 0335, Proteinkonzentration 0,3 μg/μl) eingesetzt und in einer PCR-Maschine dem folgenden Zyklus unterworfen, anfangs 5 min. bei 95°C und dann 30-mal, 30 s bei 95°C, 30 s bei 59°C und abschließend 6 min. bei 68°C. Die Fig. 28 zeigt deutlich den Vorteil der Verwendung des erfindungsgemäßen thermostabilen in w'fro-Komplexes.
Die in der vorstehenden Beschreibung sowie in den Ansprüchen offenbarten Merkmale der Erfindung können sowohl einzeln als auch in beliebiger Kombination für die Verwirklichung der Erfindung in ihren verschiedenen Ausführungsformen wesentlich sein.

Claims

Patentansprüche
1. Thermostabiler in w'fro-Komplex zur Template-abhängigen Elongation von Nukleinsäuren, umfassend ein thermostabiles
Gleitklammerprotein und ein thermostabiles Elongationsprotein.
2. Thermostabiler in w'fro-Komplex nach Anspruch 1 , dadurch gekennzeichnet, daß das Gleitklammerprotein mit einem Elongationsprotein verbunden ist.
3. Thermostabiler in w'fro-Komplex nach Anspruch 1 , dadurch gekennzeichnet, daß ein Gleitkammerprotein mit einem Elongationsprotein direkt verbunden ist.
4. Thermostabiler in w'fro-Komplex nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass das Gleitklammerprotein und das Elongationsprotein über ein Kopplungsprotein verbunden sind.
5. Thermostabiler in w'fro-Komplex nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass das Gleitklammerprotein und/oder das Elongationsprotein aus Archaebakterien stammen.
6. Thermostabiler in w'fro-Komplex nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass das Gleitklammerprotein eine ringförmige Struktur aufweist, welche die Template-Nukleinsäurestränge ganz oder teilweise umschließt.
7. Thermostabiler in w'fro-Komplex nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass das Gleitklammerprotein eine oder beide der folgenden
Aminosäurekonsensussequenzen umfaßt: SEQ ID No.:39 [GAVLIMPFW]-D-X-X-X-[GAVLIMPFW]-X-X-[GAVLIMPFW]-X- [GAVLIMPFW]-X-[GAVLIMPFW]-X-X-X-X-F-X-X-Y-X-X-D und / oder SEQ ID No.: 40 [GAVLIMPFW]-X(3)-L-A-P-[KRHDE]-[GAVLIMPFW]-E.
8. Thermostabiler in w'fro-Komplex nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass das Gleitklammerprotein zu der menschlichen (Eukaryonten) PCNA Aminosäuresequenz (SEQ ID NO. 11 ) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist und/oder das Gleitklammerprotein zu der bakterielle ß-clamp Sequenz aus E.coli (Eubakteria) (SEQ ID NO. 35) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist und/oder das Gleitklammerprotein zu der
Aminosäuresequenz des PCNA-Homologen aus Archaeoglobus fulgidus (SEQ ID NO. 12) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist.
9. Thermostabiler Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Gleitklammerprotein mit einem aus einem Alignment aus Fig. 12 generierten Hidden Markow Modell einen Score von mindestens 20 ergibt und/oder wobei das Gleitklammerprotein mit einem aus einem
Alignment aus Fig. 13 generierten Hidden Markow Modell einen Score von mindestens 25 ergibt.
10. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß das Gleitklammerprotein ein
Gleitklammerprotein ist, das aus einem Organismus stammt, der ausgewählt ist aus der Gruppe, die Archaeoglobus fulgidus, Methanoccus jannaschii, Pyrococcus horikoschii, Methanobacterium thermoautotrophicus, Aquifex aeolicus und Carboxydothermus hydrogenofhormans u mf a ßt.
11. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Gleitklammerprotein ausgewählt ist aus der Gruppe, die
AF0335 aus Archaeoglobus fulgidus, MJ0247 aus Methanococcus jannaschii, PHLA008 aus Pyrococcus horikoschii, MTH1312 aus Methanobacterium thermoautotrophicus sowie AE000761_7 aus Aquifex aeolicus umfaßt.
12. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden
Ansprüche, dadurch gekennzeichnet, dass das Elongationsprotein eine 5'-3'-Polymeraseaktivität und/oder eine Reverse-Transkriptaseaktivität aufweist.
13. Thermostabiler in w'fro-Komplex nach Anspruch 12, dadurch gekennzeichnet, dass das Elongationsprotein mindestens eine der folgenden Konsensussequenzen umfaßt und an nicht mehr als vier Positionen von dieser Sequenz abweicht: SEQ ID NO. 44: D-[GAVLIMPFW]-[GAVLIMPFW]-X-X-Y-N-X-X-X-F-D-X-P-Y- [GAVKUNOFW]-X-X-R-A SEQ ID NO. 45
A-[GAVLIMPFW]-R-T-A-[FAVLIMPFW]-A-[GAVLIMPFW]-[GAVLIMPFW]-T- E-G-[GAVLIMPFW]-V-X-A-P-[GAVLIMPFW]-E-G-I-A-X-V-[KRHDE]-I SEQ ID NO. 46
[GAVLIMPFW]-P-V-G-[GAVLIMPFW]-G-R-G-S-X-[GAVLIMPFW]-G-S- [GAVKUNOFW]-V-A-X-A-[GAVLIMPFW]-X-l-T-D-[GAVKUNOFW]-D-P- [GAVLIMPFW]-X-X-X-[GAVLIMPFW]-L-F-E-R-F-L-N-P-E-R-[GAVLIMPFW]- S-M-P-D.
14. Thermostabiler in w'fro-Komplex nach Anspruch 12, dadurch gekennzeichnet, dass das Elongationsprotein eine zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO. 22) auf einer Länge von mindestens 200 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist und/oder zur archaebakteriellen Aminosäuresequenz (SEQ ID NO. 27) auf einer Länge von mindestens 400 Aminosäuren bei einem Sequenzalignment eine mindestens 25 %ige Sequenzidentität aufweist und/oder zur eubakteriellen Aminosäuresequenz (SEQ ID NO. 37) auf einer Länge von mindestens 300 Aminosäuren bei einem Sequenzalignment eine mindestens 25 %ige Sequenzidentität aufweist.
15. Thermostabiler in w'fro-Komplex nach Anspruch 12, dadurch gekennzeichnet, dass das Elongationsprotein mit einem aus einem Alignment aus Fig. 17 generierten Hidden Markow Modell einen Score von mindestens 20 ergibt und/oder das Elongationsprotein mit einem aus einem Alignment aus Fig. 18 generierten Hidden Markow Modell einen Score von mindestens 35 ergibt und/oder das Elongationsprotein mit einem aus einem Alignment aus Abbildung 19 generierten Hidden Markow Modell einen Score von mindestens 20 ergibt.
16. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß das Elongationsprotein ein
Elongationsprotein ist, das aus einem Organismus stammt, der aus der Gruppe ausgewählt ist, die Archaeglobus fulgidus, Methanococcus jannaschii, Pyrococcus horikoschii, Methanobacterium thermoautotrophicus, Pyrococcus furiosus und Carboxydothermus hydrogenoformans umfaßt.
17. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Elongationsprotein ausgewählt ist aus der Gruppe, die
AF0497 oder AF1722 aus Archaoglobus fulgidus, MJ0885 oder MJ1630 aus Methanococcus jannaschii, PHBT047 oder PHBN021 aus Pyrococcus horikoschii, MTH1208 oder MTH1536 aus Methanobacterium thermoautotrophicus sowie PFUORF3 aus Pyrococcus furiosus umfaßt.
18. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kopplungsprotein die folgende Konsensussequenz beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz abweicht: (SEQ ID N0.43:)
[FL]-[GAVLIMPFW]-X-X-[GAVLIMPFW]-X-G-X(13)-[GAVLIMPFW]-X-[YR]- [GAVLIMPFW]-X-[GAVLIMPFW]-A-G-[DN]-[GAVLIMPFW]-[GAVLIMPFW]- [DS].
19. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kopplungsprotein zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 16 ) auf einer Länge von mindestens 150 Aminosäuren bei einem Sequenzalignment eine mindestens 18 %ige Sequenzidentität aufweist.
20. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kopplungsprotein mit einem aus einem Alignment aus Abbildung 16 generierten Hidden Markow Modell einen Score von mindestens 10 ergibt.
21. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß das Kopplungsprotein ein Kopplungsprotein ist, das aus einem Organismus stammt, der aus der Gruppe ausgewählt ist, die Archaeglobus fulgidus, Methanococcus jannaschii, Pyrococcus horikoschii, Methanobacterium thermoautotrophicus, Pyrococcus furiosus und Carboxydothermus hydrogenophormans umfaßt. 5
22. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kopplungsprotein augewählt ist aus der Gruppe, die AF1790 10 aus Archaeoglobus fulgidus, MJ0702 aus Methanococcus jannaschii,
PHBN023 aus Pyrococcus horikoschii, MTH1405 aus Methanobacterium thermoautothrophicum sowie PFUORF2 aus Pyrococcus umfaßt.
15 23. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der Komplex mit einem Protein assoziiert ist, welches als Gleitklammerlader fungiert. 0
24. Thermostabiler Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der Komplex mit ATP oder einem anderen Kofaktor assoziiert vorliegt. 25
25. Rekombinante DNA-Sequenz, dadurch gekennzeichnet, dass sie für einen thermostabilen in w'fro-Komplex gemäß einem der Ansprüche 1 bis 24. 30
26. Vektor,
dadurch gekennzeichnet, dass er eine für ein Gleitklammerprotein und ein Kopplungsprotein und/oder ein Elongationsprotein codierende, rekombinante DNA- 5 Sequenz enthält.
27. Vektor nach Anspruch 26, dadurch gekennzeichnet, dass er zusätzlich mindestens eine weitere DNA-Sequenz mit 10 mindestens einer geeigneten Restriktionsschnittstelle zur Insertion weiterer DNA-Sequenzen in einer solchen Anordnung enthält, dass sich ein Fusionsprotein aus Gleitklammerprotein und dem Expressionsprodukt der weiteren DNA-Sequenzen ergibt.
15 28. Vektor nach Anspruch 26 oder 27, dadurch gekennzeichnet, dass er geeignete, die Expression der DNA-Sequenz(en) steuernde Promotor- und/oder Operatorbereiche enthält.
20 29. Vektor nach Anspruch 28, dadurch gekennzeichnet, dass er mehrere Promotor- und/oder Operatorbereiche zur getrennten Expression mehrerer DNA-Sequenzen enthält.
25 30. Vektor nach einem der Ansprüche 26 bis 29, dadurch gekennzeichnet, dass er reprimier- und/oder induzierbare Promotor- und/oder Operatorbereiche enthält.
31. Vektor nach einem der Ansprüche 26 bis 30, dadurch gekennzeichnet, dass er eine DNA-Sequenz nach Anspruch 25 enthält.
5 32. Wirtszelle, dadurch gekennzeichnet, dass sie mit einem oder mehreren Vektoren nach einem der Ansprüche 26 bis 31 transformiert ist.
10 33. Verfahren zur Herstellung eines thermostabilen in w'fro-Komplexes gemäß einem der Ansprüche 1 bis 24, dadurch gekennzeichnet, dass eine entsprechende rekombinante DNA-Sequenz gemäß Anspruch 25 oder einen oder mehrere der Vektoren gemäß einem der 15 Ansprüche 26 bis 31 in eine Wirtszelle einbringt, die Expression der
Proteine bewirkt und diese aus dem Kulturmedium oder nach Zellaufschluss isoliert und gegebenenfalls noch mit weiteren Komplexbestandteilen koppelt.
20 34. Verfahren zur Template-abhängigen Elongation von Nukleinsäuren, wobei die Nukleinsäure nötigenfalls denaturiert wird, mit mindestens einem Primer unter Hybridisierungsbedingungen versehen wird, wobei der Primer hinreichend komplementär zu einem flankierenden Bereich einer gewünschten Nukleinsäuresequenz des Template-Strangs ist und 25 mit Hilfe einer Polymerase in Anwesenheit von Nukleotiden eine Primer-
Elongation erfolgt, dadurch gekennzeichnet, dass als Polymerase ein thermostabiler in w'fro-Komplex gemäß einem der Ansprüche 1 bis 24 verwendet wird.
35. Verfahren nach Anspruch 34, dadurch gekennzeichnet, dass man zur Amplifikation von DNA-Sequenzen zwei die gewünschte 5 Nukleinsäuresequenz flankierende Primer und Deoxynukleotide und/oder Derivate davon und/oder Ribonukleotide und/oder Derivate davon verwendet.
36. Verfahren nach Anspruch 35,
10 dadurch gekennzeichnet, dass man eine Polymerase-Ketten-Reaktion durchführt.
37. Verfahren nach Anspruch 34, dadurch gekennzeichnet,
15 dass man zur Reversen-Transkription von RNA in DNA einen thermostabilen in w'fro-Komplex gemäß einem der Ansprüche 1 bis 24 einsetzt, dessen Elongationsprotein Reverse-Transkriptase-Aktivität aufweist.
20 38. Verfahren nach einem der Ansprüche 34 bis 37 dadurch gekennzeichnet, dass man zur Sequenzierung von Nukleinsäuren ausgehend von einem Primer, der zu einem der zu sequenzierenden Nukleinsäure benachbarten Bereich komplementär ist, eine Template-abhängige Elongation bzw. 25 Reverse-Transkription unter Verwendung von Deoxynukleotiden und Dideoxynukleotiden oder deren jeweiligen Derivaten gemäß der Methode von Sanger durchführt.
31. Verfahren nach einem der Ansprüche 34 bis 38, dadurch gekennzeichnet, dass man bei der Elongation der Nukleinsäuren Markierungen einfügt.
5 40. Verfahren nach Anspruch 39, dadurch gekennzeichnet, dass man markierte Primer und/oder markierte Deoxynukleotide und/oder deren Derivate und/oder markierte Dideoxynukleotide und/oder deren Derivate und/oder markierte Ribonukleotide und/oder 10 deren Derivate einsetzt.
41. Verfahren zur Markierung von Nukleinsäuren durch Erzeugung einzelner Brüche in Phosphodiesterbindungen der Nukleinsäurekette und Ersatz eines Nukleotids an den Bruchstellen durch ein markiertes 15 Nukleotid mit Hilfe einer Polymerase, dadurch gekennzeichnet, dass als Polymerase ein thermostabiler in w'fro-Komplex nach einem der Ansprüche 1 bis 24 eingesetzt wird.
20 42. Reagenzien-Kit zur Elongation und/oder Amplifikation und/oder reversen Transkription und/oder Sequenzierung und/oder Markierung von Nukleinsäuren, enthaltend in einem oder mehreren getrennten Behältern a) einen thermostabilen in w'fro-Komplex nach einem der 25 Ansprüche 1 bis 24 oder b) einen thermostabilen in w'fro-Komplex nach einem der Ansprüche 1 bis 24 und separat davon ein Polymeraseaktivität aufweisendes Elongationsprotein, sowie gegebenenfalls Primer, Puffersubstanzen, Nukleotide, ATP, einen oder mehrere andere Kofaktoren und/oder Pyrophosphatase.
43. Kit nach Anspruch 42,
5 dadurch gekennzeichnet, dass er zur Amplifikation von Nukleinsäuren neben den Komponenten a) oder b), welche 5'-3'-Polymeraseaktivität aufweisen, Deoxynukleotide und/oder Derivate davon enthält.
10 44. Kit nach Anspruch 42, dadurch gekennzeichnet, dass er zur reversen Transkription die Komponenten a) oder b) enthält, welche reverse Transkriptase-Aktivität aufweisen, sowie Deoxynukleotide und/oder Derivate davon.
15
45. Kit nach einem der Ansprüche 42 bis 44, dadurch gekennzeichnet, dass er zur Sequenzierung neben Deoxynukleotiden oder Ribonukleotiden und/oder deren Derivaten, Dideoxynukleotide 20 und/oder deren Derivate enthält.
46. Kit nach einem der Ansprüche 42 bis 45, dadurch gekennzeichnet, dass er Primer und/oder Deoxynukleotide und/oder Dideoxynukleotide 25 in markierter Form enthält.
PCT/DE1999/002480 1998-08-06 1999-08-06 Thermostabiler in vitro-komplex mit polymeraseaktivität Ceased WO2000008164A2 (de)

Priority Applications (5)

Application Number Priority Date Filing Date Title
EP99942776A EP1100923A2 (de) 1998-08-06 1999-08-06 Thermostabiler in vitro-komplex mit polymeraseaktivität
JP2000563788A JP2002522042A (ja) 1998-08-06 1999-08-06 ポリメラーゼ活性を有する熱安定性invitro複合体
AU56171/99A AU5617199A (en) 1998-08-06 1999-08-06 Thermostable (in vitro) complex with polymerase activity
DE19981494T DE19981494D2 (de) 1998-08-06 1999-08-06 Thermostabiler in Vitro-Komplex mit Polymeraseaktivität
CA002338185A CA2338185A1 (en) 1998-08-06 1999-08-06 Thermostable in vitro complex with polymerase activity

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
DE19835653 1998-08-06
DE19835653.6 1998-08-06
DE19840771A DE19840771A1 (de) 1998-08-06 1998-09-07 Thermostabiler in vitro-Komplex mit Polymeraseaktivität
DE19840771.8 1998-09-07
EP99111795 1999-06-18
EP99111795.3 1999-06-18

Publications (2)

Publication Number Publication Date
WO2000008164A2 true WO2000008164A2 (de) 2000-02-17
WO2000008164A3 WO2000008164A3 (de) 2000-05-11

Family

ID=56289931

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE1999/002480 Ceased WO2000008164A2 (de) 1998-08-06 1999-08-06 Thermostabiler in vitro-komplex mit polymeraseaktivität

Country Status (5)

Country Link
EP (1) EP1100923A2 (de)
JP (1) JP2002522042A (de)
AU (1) AU5617199A (de)
CA (1) CA2338185A1 (de)
WO (1) WO2000008164A2 (de)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001011051A3 (de) * 1999-08-06 2001-06-21 Lion Bioscience Ag Chimäre proteine
WO2000065062A3 (fr) * 1999-04-21 2002-02-14 Centre Nat Rech Scient Sequence genomique et polypeptides de pyrococcus abissy, leurs fragments et leurs utilisations
WO2003014151A3 (en) * 2001-08-10 2003-09-04 Genset Sa Human secreted proteins, their encoding polynucleotides, and uses thereof
JP2010000089A (ja) * 2000-05-26 2010-01-07 Bio Rad Lab Inc 改良された核酸修飾酵素
EP3381947A4 (de) * 2015-11-27 2019-04-10 Kyushu University National University Corporation Dna-polymerasevariante

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016084880A1 (ja) * 2014-11-28 2016-06-02 東洋紡株式会社 Pcna単量体
WO2016084879A1 (ja) * 2014-11-28 2016-06-02 東洋紡株式会社 核酸増幅試薬

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993015115A1 (en) * 1992-01-24 1993-08-05 Cornell Research Foundation, Inc. E. coli dna polymerase iii holoenzyme and subunits
US5583026A (en) * 1994-08-31 1996-12-10 Cornell Research Foundation, Inc. Process for reconstituting the polymerase III* and other subassemblies of E. coli DNA polymerase III holoenzyme from peptide subunits
US5633159A (en) * 1995-03-10 1997-05-27 Becton, Dickinson And Company DNA polymerase III β-subunit from mycobacteriophage DS6A
AU7683998A (en) * 1997-04-08 1998-10-30 Rockfeller University, The Enzyme derived from thermophilic organisms that functions as a chromosomal replicase, and preparation and uses thereof
US6238905B1 (en) * 1997-09-12 2001-05-29 University Technology Corporation Thermophilic polymerase III holoenzyme
AU7105798A (en) * 1998-04-09 1999-11-01 Rockfeller University, The Enzyme derived from thermophilic organisms that functions as a chromosomal replicase, and preparation and uses thereof

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000065062A3 (fr) * 1999-04-21 2002-02-14 Centre Nat Rech Scient Sequence genomique et polypeptides de pyrococcus abissy, leurs fragments et leurs utilisations
WO2001011051A3 (de) * 1999-08-06 2001-06-21 Lion Bioscience Ag Chimäre proteine
JP2010000089A (ja) * 2000-05-26 2010-01-07 Bio Rad Lab Inc 改良された核酸修飾酵素
WO2003014151A3 (en) * 2001-08-10 2003-09-04 Genset Sa Human secreted proteins, their encoding polynucleotides, and uses thereof
EP3381947A4 (de) * 2015-11-27 2019-04-10 Kyushu University National University Corporation Dna-polymerasevariante

Also Published As

Publication number Publication date
JP2002522042A (ja) 2002-07-23
EP1100923A2 (de) 2001-05-23
WO2000008164A3 (de) 2000-05-11
AU5617199A (en) 2000-02-28
CA2338185A1 (en) 2000-02-17

Similar Documents

Publication Publication Date Title
DE69426400T2 (de) Thermostable Nukleinsäure Polymerase
DE69923180T2 (de) Thermostabiles Enzym welches die Genauigkeit thermostabiler DNA Polymerasen erhöht - zur Verbesserung der Nucleinsäuresynthese und in vitro Amplifikation
DE60112746T2 (de) Kälteempfindliche dna-polymerasemutanten
EP1050587B1 (de) Reaktionsgemisch und Verfahren für RT-PCR mittels einer homopolymeren Nukleinsäure
DE69838724T2 (de) Polymerase-verbessernder faktor (pef)-enthaltende extrakte, pef proteinkomplexe, isoliertes pef protein und verfahren zur reinigung und identifizierung
Ishino et al. DNA polymerases as useful reagents for biotechnology–the history of developmental research in the field
DE69730926T2 (de) Modifizierte thermostabile DNA Polymerase
DE69130800T2 (de) Verringerung von nicht spezifischer amplifikation während einer (in vitro) nukleinsäure amplifikation unter verwendung von modifizierten nukleinsäure basen
Makarova et al. Evolution of replicative DNA polymerases in archaea and their contributions to the eukaryotic replication machinery
DE69030386T2 (de) Bei hoher temperatur aktive reverse transkriptasen
DE69132477T2 (de) Gereinigte thermostabile nukleinsäurepolymerase aus thermosipho africanus
DE69118809T2 (de) Erhöhte Produktion von thermus aquaticus DNA Polymerase in E. coli
EP2077322B1 (de) Verfahren und Kit zur Amplifikation von heteropolymerer oder poly(C)- RNA
CN106164261A (zh) 适用于高温核酸合成的新颖逆转录酶
DE60301325T2 (de) Mutation von dna polymerasen aus archaeobakterien
Palanivelu Eukaryotic multi-subunit DNA dependent RNA Polymerases: An insight into their active sites and catalytic mechanism
DE112022003266T5 (de) Chimäre DNA-Polymerase und zugehöriges Herstellungsverfahren
EP1100923A2 (de) Thermostabiler in vitro-komplex mit polymeraseaktivität
Böhlke et al. Archaeal DNA replication: spotlight on a rapidly moving field
Kelman DNA replication in the third domain (of life)
DE19840771A1 (de) Thermostabiler in vitro-Komplex mit Polymeraseaktivität
JP5641939B2 (ja) 変異型逆転写dnaポリメラーゼ
EP1198571A2 (de) Chimäre proteine
EP1326964B1 (de) THERMOSTABILE POLYMERASE AUS i THERMOCOCCUS PACIFICUS /i
WO2007137701A1 (de) Mutierte dna-polymerase mit erhöhter reverse transkriptase aktivität

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AE AL AM AT AU AZ BA BB BG BR BY CA CH CN CR CU CZ DE DK EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MD MG MK MN MW MX NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT UA UG US UZ VN YU ZA ZW

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): GH GM KE LS MW SD SL SZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
AK Designated states

Kind code of ref document: A3

Designated state(s): AE AL AM AT AU AZ BA BB BG BR BY CA CH CN CR CU CZ DE DK EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MD MG MK MN MW MX NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT UA UG US UZ VN YU ZA ZW

AL Designated countries for regional patents

Kind code of ref document: A3

Designated state(s): GH GM KE LS MW SD SL SZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

WWE Wipo information: entry into national phase

Ref document number: 1999942776

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2338185

Country of ref document: CA

Ref document number: 2338185

Country of ref document: CA

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2000 563788

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 09744956

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 1999942776

Country of ref document: EP

REF Corresponds to

Ref document number: 19981494

Country of ref document: DE

Date of ref document: 20010830

WWE Wipo information: entry into national phase

Ref document number: 19981494

Country of ref document: DE

WWW Wipo information: withdrawn in national office

Ref document number: 1999942776

Country of ref document: EP