[go: up one dir, main page]

WO1998001579A1 - Systeme de detection des interactions proteine-proteine - Google Patents

Systeme de detection des interactions proteine-proteine Download PDF

Info

Publication number
WO1998001579A1
WO1998001579A1 PCT/FR1997/001133 FR9701133W WO9801579A1 WO 1998001579 A1 WO1998001579 A1 WO 1998001579A1 FR 9701133 W FR9701133 W FR 9701133W WO 9801579 A1 WO9801579 A1 WO 9801579A1
Authority
WO
WIPO (PCT)
Prior art keywords
protein
mutated
mutation
sequence
operator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/FR1997/001133
Other languages
English (en)
Inventor
Michèle GRANGER
Manfred Schnarr
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Original Assignee
Centre National de la Recherche Scientifique CNRS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National de la Recherche Scientifique CNRS filed Critical Centre National de la Recherche Scientifique CNRS
Priority to EP97930586A priority Critical patent/EP0909331A1/fr
Publication of WO1998001579A1 publication Critical patent/WO1998001579A1/fr
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1055Protein x Protein interaction, e.g. two hybrid selection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/73Fusion polypeptide containing domain for protein-protein interaction containing coiled-coiled motif (leucine zippers)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor

Definitions

  • the subject of the invention is a system for detecting protein-protein interactions, and more particularly DNA sequences for the implementation of this system, as well as cellular hosts containing said DNA sequences.
  • Such systems have been recently developed using yeast as a host and activation of the transcription of a specific gene as a "probe” (see Fields and Sternglanz, 1994). However, although already well used, this system has certain limits.
  • the other major difficulty consists in identifying proteins Y which interact with a protein X provided with a domain of activation of the transcription, since, in this case, the target protein (Gal4-X or LexA-X) will give a signal constitutive activation in the absence of any protein Y.
  • Gal4 is a modular protein of 881 amino acids with at least two functional domains.
  • a DNA binding domain comprising amino acids 1-94 and a transcription activation domain.
  • the activation function is in fact distributed over three different segments of the protein, namely 94-106, 148-196 and 768-881 (Marmorstein et al., 1992).
  • the structure of Gal4j.65 involved in a complex with DNA has been determined by X-ray crystallography (Marmorstein et al., 1992) while the structure of the activation domain remains very poorly defined.
  • the double-hybrid technique also allows the identification of an unknown partner from the moment when one is in possession of the gene for the target protein X.
  • the team by Stanley Fields was the first to exploit this possibility (Chien et a, 1991) by creating fusions between the activation domain 768-881 of Gal4 and protein sequences encoded by DNA fragments from a library of Genomic yeast DNA. This time, the activation domain was placed at the NH2-terminal end of this family of fusion proteins, in order to facilitate the construction of the hybrid proteins.
  • LexA is a protein of 202 amino acids, composed of two domains linked by a hinge region of approximately 30 amino acids. The first 70 amino acids constitute the DNA binding domain (Hurstel et al, 1986; Fogh et al, 1994) and amino acids 100 to 202 form the protein dimerization domain (Schnarr et al., 1985) . LexA recognizes sites palindromic DNA (SOS operators) and several adjacent operators can be occupied in a cooperative manner (Lloubès et al, 1991).
  • LexA as a DNA binding medium can have several advantages.
  • .LexA belongs to a heterologous organism (Escherichia coli), does not affect the growth of yeast, has no residual transcriptional activity (like segment 94-106 of Gal4) and can be used in strains of yeast gal + . Therefore, one of the hybrid proteins (usually the one containing the activation domain) can be placed under the control of Gal4. Thus, the hybrid protein will be expressed only in the presence of galactose, but not in the presence of glucose.
  • the field of activation used by Roger Brent's team also comes from Escherichia coli. It is one of the artificial activator domains isolated by Ma and Ptashne (1987b).
  • This domain (named B42) has a lower activation potential than the activation domains of Gal4 or VP16, which makes it possible to avoid the problems of toxicity linked to a possible "squelching" (the titration of an element essential of the transcription machinery by an activation domain).
  • a recent description of the double-hybrid system based on the use of LexA can be found in Golemis et al (1996) and Golemis and Brent (1996).
  • the double-hybrid system shows a strong polarity for the Myc / Max couple.
  • Myc is fixed on DBD and Max on AD
  • Max is fixed on DBD and Myc on AD
  • an activation is observed in agreement with biochemical data showing that the two proteins interact.
  • the indicator bacterial strain is deficient in LexA and carries the lacZ gene under the control of an SOS operator recognized by LexA (the sulA operator).
  • the hybrid protein placed under the control of the lacUVS promoter inducible by 1TPTG, is produced from a plasmid so as to be able to adapt the quantity of protein to experimental needs.
  • This system is perfectly suited to the study of a homodimeric complex, but its use becomes laborious the moment one wants to study the heterodimerization between two different proteins capable of also forming homodimers.
  • the invention particularly aims to solve the difficulties presented by the systems of the prior art and, in particular, the invention aims to allow the study of heterodimerization.
  • the subject of the invention is a system allowing the detection of interaction between two grafted proteins, by visualizing the repression of transcription and not by activating transcription. Unlike the yeast system, a protein with intrinsic activating activity could be used.
  • the subject of the invention is a system for detecting protein-protein interactions using a bacterium (Escherichia coli) as a host organism, commonly used in all molecular biology laboratories.
  • a bacterium Esscherichia coli
  • the subject of the invention is a system for detecting protein-protein interactions avoiding the problem of addressing fusion proteins in the nucleus as is the case in yeast, thanks to the non-compartmentalisation of E . coli, in particular the absence of a structured nucleus.
  • the subject of the invention is a system suitable for studying the interactions of proteins located in the cytoplasmic membrane.
  • the subject of the invention is a test (repression of transcription) potentially allowing the identification of proteins interacting with the activation domains of transcription factors, among which there are many oncogenic products involved in carcinogenesis, such as Jun, Fos. or ⁇ ts family members.
  • the subject of the invention is a system for studying protein-protein interaction (determination of interaction forces, identification of structural or sequence elements important for this interaction, analysis of the specificity of the interaction) more reliable than the yeast system (Estojak et al. 1995).
  • the subject of the invention is a system for studying protein-protein interaction making it possible to detect interactions when the "hook" protein (the one for which the partner (s) is sought) has intrinsic capacities for activating transcription ( Bartel et al. 1993, Golemis and Brent 1996, Golemis et al 1996) and this occurs quite frequently (Ma and Ptashne 1988), and therefore the invention relates to a system allowing the study of the interactions of a " true "domain of transcription activation;
  • the subject of the invention is a protein-protein interaction detection system allowing the examination of a large number of clones (> 10 6 ) thanks to the transfection efficiency of E. Coli which is clearly greater than that of yeast (of the order of 1000 times) and thus the screening of cDNA or genomic DNA libraries.
  • the invention relates to the use of a DNA sequence comprising:
  • nucleotide sequence being under the control of the above promoter comprising the above mutated operator containing two sequences and deriving from an operator containing two inverted repeated sequences (palindrome), this operator being such that, in the non-mutated state (wild), it leads to the repression of the transcription of the indicator gene, when regulatory proteins in the form of homodimer bind to each of said inverted repeat sequences via their DNA binding site, this mutated operator being such that the one of its sequences is mutated (mutation 1), while the other is in the wild, or mutated in a silent manner or comprises a different mutation (mutation 2) from the above mutation 1, the transcription of the indicator gene being repressed by regulatory proteins in the form of heterodimers via their DNA binding site, each monomer of these heterodimers being such that it one specifically recognizes the sequence comprising the mutation 1, the other the sequence which is in the wild state, or which is mutated in a silent manner or which comprises a mutation 2, the homodi
  • heterodimers comprising:
  • a regulatory protein for example LexA, regulates the expression of genes in vivo by binding to specific sequences located upstream of these genes (operator sequences).
  • the operator used in the context of the invention is a mutated operator deriving from a non-mutated operator which is such that, in the wild, its sequences are palindromic (repeated inverted) and recognized by homodimers of the regulatory protein .
  • the regulatory protein for example LexA, is organized into two domains, a DNA binding domain which specifically recognizes operator sequences and a dimerization domain through which the interactions between two protein monomers stabilize the interaction of dimers on DNA. Each monomer is fixed on a half-operator. By “half-operator” is meant the sequence specifically recognized by each monomer.
  • the operator sequence recognized by a regulatory protein has been modified so that a half-operator remaining wild will be recognized by the wild regulatory protein, for example LexA, while the other half operator will be mutated and recognized by a mutated form of the regulatory protein.
  • Each of these DNA binding domains can be fused to protein domains capable of heterodimerizing and any interaction between these domains is measured by a more or less significant repression of the indicator gene (also designated by "reporter gene”).
  • indicator gene is meant: - Or a gene coding for a protein whose activity on the one hand is revealed by the color which it confers on the bacterial clones producing it and on the other hand can be quantitatively measured, for example the lacZ gene, the gene coding for luciferase,
  • bacterium dies, for example the sulA gene.
  • the toxic gene is a gene coding for resistance to an antibiotic
  • the mixed operator op408 / opWT is placed in the promoter of the gene coding for the repressor of this antibiotic resistance gene.
  • homodimers denotes non-covalent associations of proteins in which the protein-protein interaction domains are identical and covalently linked to heterologous or homologous protein binding domains of DNA, which are themselves identical or different.
  • heterodimers non-covalent associations of proteins in which the protein-protein interaction domains are different and covalently linked to heterologous or homologous protein binding domains of DNA, which are themselves identical or different.
  • silent mutation carried by one of the operator's sequences is meant a mutation which does not affect the recognition of said sequence by the wild-type regulatory protein.
  • mutant 2 carried by the operator sequence is meant a mutation different from mutation 1, and which is such that the sequence comprising said mutation 2 is recognized by a regulatory protein which is not capable of recognizing the sequence carrying the mutation 1, the mutation 1 itself being as recognized by a regulatory protein which is not capable of recognizing the sequence carrying the mutation 2.
  • protein-protein interaction we mean the non-covalent assembly of two (or more) proteins by Van der Waals interaction (electrostatic interactions between opposite charges, hydrogen bonds, interactions hydrophobic). The area masked by such an interaction is generally from 1400 to 1600 A ° 2 (for a review see: J. Janin "Principles of protein / protein recognition from structure to thermodynamics” 1995, Biochemistry 27: 497-505).
  • DNA binding domain of a protein is defined the part of the protein whose integrity is essential for its non-covalent attachment to DNA.
  • interaction detection is meant a method for visualizing an interaction between two proteins.
  • protein capable of recognizing the sequence of an operator designates a protein capable of making non-covalent bonds with a particular DNA sequence.
  • binding domain fused to a protein designates a protein domain linked by a peptide bond to another protein or protein domain.
  • the regulatory protein is devoid of its dimerization domain, which can however be tolerated if the interactions resulting from the presence of the dimerization domain are weaker than those which it is desired to bring into play. evidence.
  • the invention also relates to a DNA sequence comprising:
  • a mutated operator said nucleotide sequence being under the control of a promoter comprising a mutated operator containing two sequences and deriving from an operator containing two inverted repeat sequences (palindrome), this operator being such that, in the non-mutated state (wild), it leads to the repression of the transcription of the indicator gene, when regulatory proteins in the form of homodimer bind to each of said inverted repeat sequences via their DNA binding site, this mutated operator being such that the one of its sequences is mutated (mutation 1), while the other is in the wild, or mutated in a silent manner or comprises a different mutation (mutation 2) from the above mutation 1, the transcription of the indicator gene being repressed by regulatory proteins in the form of heterodimers via their DNA binding site, each monomer of these heterodimers being such that it recognizes s one specifically the sequence with mutation 1, the other the sequence which is in the wild, or which is mutated in a silent manner or which contains a mutation 2, the homodimers
  • the invention relates to a DNA sequence characterized in that it comprises a mutated operator containing two sequences and derived from an operator containing two inverted repeat sequences (palindrome), one of these two sequences being mutated, and the another being in the wild.
  • the mutated sequence can be upstream or downstream of the sequence in the wild.
  • mutated operator contains the following sequence:
  • the CCGT and ACAG sequences correspond to the CTGT and ACAG sequences of the non-mutated operator respectively.
  • the present invention relates to a DNA sequence characterized in that the nucleotide sequence coding for the indicator protein is the lacZ gene in E. coli, coding for ⁇ -galactosidase, the mutated operator contains two sequences and is derived from an operator containing two inverted repeat sequences (palindrome), one of these two sequences being mutated, and the other being in the wild, the mutated sequence preferably being that located downstream of the sequence in the wild, the wild sequence being recognized specifically by the wild LexA protein or by a fragment of LexA containing the DNA binding site, in particular a fragment defined by positions 1 to x of LexA, x varying from 69 to 87, and in particular by fragments 1 to 69 or 1 to 87 of .LexA, and the mutated sequence being recognized by the mutated LexA protein or by a mutated fragment of LexA containing the DNA binding site, in particular a mutated fragment of LexA corresponding to that defined by positions 1 to x of LexA
  • dimerization domain is meant the part of the protein whose integrity is essential for non-covalent interaction with itself (homodimer) or with another dimerization domain (heterodimer).
  • the present invention also relates to a complex between - a DNA sequence comprising a nucleotide sequence coding for an indicator protein, said nucleotide sequence being under the control of a promoter comprising a mutated operator containing two sequences and derived from an operator containing two inverted repeat sequences (palindrome), this operator being such that, in the non-mutated (wild) state, it results in the repression of the transcription of the indicator gene, when regulatory proteins in the form of homodimer bind to each of the said inverted repeat sequences via their DNA binding site, this mutated operator being such that one of its sequences is mutated (mutation 1), while the other is in the wild, or mutated silently or contains a different mutation (mutation 2) from the above mutation 1, the transcription of the indicator gene being repressed by regulatory proteins in the form of heterodimers via their DNA binding site, each monomer of these heterodimers being such that it specifically recognizes one the sequence comprising the mutation 1, the other the sequence which is in the
  • the first monomer being such that it contains a first fusion protein containing the site of attachment to the DNA of a regulatory protein capable of specifically recognizing the sequence of the mutated operator containing the mutation 1, the aforementioned site of fixation being fused to one of the two proteins or to one of the two protein domains, involved in the above interactions,
  • the second monomer being such that it contains a second fusion protein containing the DNA binding site of a regulatory protein capable of specifically recognizing the sequence not mutated, or mutated silently or comprising the mutation 2 of the mutated operator, the above-mentioned binding site being fused to the other of the two proteins or to the other of the two protein domains, involved in the above interactions.
  • the invention also relates to a cell host containing a DNA sequence as described above.
  • the invention also relates to a method for detecting and quantifying interactions between two proteins or protein fragments, characterized
  • nucleotide sequences coding for the first and the second monomer respectively containing a first and a second fusion protein as defined above are brought into contact with a DNA sequence as described above, and
  • the invention relates to a method for identifying a protein interacting with a specific protein, characterized
  • genomic library containing in particular DNA fragments, and in particular cDNA, each capable of coding for a protein interacting with the determined protein, each of the different elements of the genomic library being respectively fused to the sequence coding for a protein regulatory as defined above,
  • the indicator gene is lacZ and has been placed under the control of a promoter / operator sequence characterized in that the operator has been mutated as indicated below.
  • This strain makes it possible to identify, on the basis of the color of the bacterial clones, the existence of protein-protein interactions between two proteins or protein domains fused respectively to the DNA binding domain of wild LexA and LexA408 as described below. This strain makes it possible to quantify and analyze this interaction by mutagenesis.
  • screening a DNA library requires the analysis of at least 10 ⁇ clones. This implies obtaining on an appropriate solid indicator medium (as indicated in FIG. 5) and the experiment of 10 ⁇ bacterial colonies whose color should be checked (white or pink in the event of interaction and red in the absence of interaction) . Although theoretically feasible, this is very costly not only in time, but also in disposable equipment.
  • the following selection system is advantageously used.
  • the protein-protein interactions are no longer visualized on the basis of the color of the bacterial clones, but on the simple fact of their existence. Indeed, if the indicator gene is replaced by a gene coding for a toxic protein:
  • the bacteria can then divide and give rise to a colony on solid culture medium.
  • the toxic gene used is the sulA gene. It codes for a protein, SULA, an inhibitor of cell division. In its presence, the bacteria no longer divides and dies.
  • Figure 1 relates to the principle of operation of the double-hybrid system in E. coli
  • the system is based on the fact that a mutated operator containing 1/2 wild operator (WT) and 1/2 mutated operator (408) is only recognized by a mixed LexAWT / .LexA408 dimer.
  • An indicator gene (lacZ represented by an empty rectangle) was put under the control of this mixed operator (represented by a black rectangle for the non-mutated and annotated WT part and by a hatched rectangle for the mutated and annotated part 408).
  • Proteins or subdomains of proteins X and Y capable of interacting are fused to the DNA binding domains of LexAi-87WT (represented by a black sphere) and LexAi-g7408 (represented by a hatched sphere).
  • LexAi-g7WT- X (represented by a hatched rectangle connected to a hatched sphere) and LexA 1-87408- Y (represented by a black rectangle connected to a black sphere) are cloned on compatible plasmids and their expression is controlled by a inducible promoter (lacUV5, Oertel-Buchheit P., Lamerichs RMJN, Schnarr M. and Granger-Schnarr M. 1990 Mol. Gen. Broom. 222: 40-48 Genetic analysis of the LexA repressor: isolation and characterization of LexA (Def) mutant proteins.).
  • the plasmids are represented by circles, a thickened part of which is separated into two, one represents the gene coding for the proteins, LexA ⁇ _87WT-X or LexA 1-87408-Y and the other for their promoter sequence, lacUV5).
  • These proteins, LexAi-87WT-X and LexAi-87408-Y can exist either in free form in the bacteria, or in form linked to DNA (represented by a black rectangle linked to a gray sphere interlaced with a hatched rectangle linked to a hatched sphere themselves connected to the black and hatched rectangles representing the mixed operator described above.).
  • the LacUV5 promoter is itself under the control of a regulatory protein, the lactose repressor (represented by a square with rounded corners and segmented into boxes).
  • the gene coding for this repressor (lacl gene) is cloned on an episome, factor F '(Willetts N. and Skurray R. in E. coli and Salmonella Typhimurium, Cellular and Molecular Biology Ed. Neidhardt FC 1987, pp 1110-1133 and Oertel-Buccheit et al 1990) itself represented by an arc of a circle.
  • the lactose repressor can exist either in free form in the bacterium, or in form linked to DNA (represented by a square with rounded corners and segmented in cartons linked to the promoter sequences, lacUV5 described above).
  • LexA means that the strain is devoid of endogenous LexA.
  • Figure 2 shows the construction of the indicator strain for the implementation of a double hybrid system in E. coli.
  • the plasmid pRS415 (represented by the circle containing inside the indication "pRS415" (SIMONS RW, HOUMAN F. & KLECKNER N. (1987). Improved single and multicopy lac-based cloning vectors for protein and operon fusions. Gene 52: 85-96) carries the lacZ gene, lacking a promoter / operator region (represented by a thickening of the line) and two unique cleavage sites for two restriction enzymes EcoRI and BamHI. "Lac” means that this plasmid is incapable of produce the lacZ gene product since it lacks a promoter / operator sequence. This plasmid is cut by these two enzymes and then ligated to an oligonucleotide of 70 base pairs (70 mer and represented by a black rectangle) whose sequence is the next one :
  • this oligonucleotide thus introduces before the lacZ gene a promoter / operator sequence allowing the lacZ gene to be transcribed and regulated by the mixed operator as defined in the legend for figure 1.
  • This ligation by an arrow between the plasmid and the 70mer creates the plasmid pGC202 (represented by the circle
  • “Lac” means that this plasmid is now capable of producing the lacZ gene product since it is provided with a promoter / operator sequence.
  • the indicator gene thus formed (represented by a black rectangle for the promoter / operator sequence and by a white rectangle for the lacZ gene) is then transferred to the DNA of a lambda phage ( ⁇ ) by a double recombination event between l Plasma and phage DNA (double recombination event is understood to mean a complex molecular mechanism occurring in vivo and resulting in the exchange of DNA fragments between partially homologous molecules, this is shown in the figure by two crosses between the plasmid pGC 202 and a line symbolizing the phage DNA) giving rise to the phage ⁇ GC 202.
  • This phage has the capacity to integrate into the bacterial chromosome by a complex mechanism taking place in vivo (Elledge et al. 1991).
  • the advantage of this system lies in the fact that the indicator gene will be on the bacterial chromosome and no longer on a plasmid, which makes it possible to use the plasmid vectors as a vehicle for fusion proteins.
  • Figure 3 concerns the characterization of the SU202 strain as a function of the quantity of proteins present in the cell.
  • the variation in the quantity of proteins is obtained by cultivating the bacteria in the presence of variable concentrations of IPTG, the genes coding for the chimeric proteins being under the control of the inducible promoter lacUV5.
  • the ⁇ -galactosidase units are measured according to the method described by Miller (1972).
  • the relative expression of ⁇ -galactosidase is calculated by making the ratio between the ⁇ -galactosidase units measured in the presence of the expression vectors and those measured in their absence, the latter correspond to the non-repressed state of the lacZ gene.
  • the white squares correspond to the values measured when the strain contains a plasmid expressing LexA 1-87408-cJunZip (pDL606, see Figures 6 and 7).
  • the white circles correspond to the values measured when the strain contains a plasmid expressing the DNA binding domain alone (JWL96, Little JW and Hill SA (1985) Deletion within the hinge region of a specifies DNA-binding protein Proc. Natl. Acad. Sci USA, 22: 2301-2305).
  • the white triangles correspond to the values measured when the strain contains a plasmid expressing LexAi-g7WT-cFosZip (pMS404, see Figures 8 and 9).
  • the black squares correspond to the values measured when the strain contains both the plasmid expressing the domain DNA binding alone (JWL96) and that expressing LexAi-87408-cJunZi ⁇ (pDL606, see Figures 6 and 7).
  • the black circles correspond to the values measured when the strain contains both the plasmid expressing LexAi-87408-cJunZip (pDL606, see Figures 6 and 7) and that expressing LexAi-87WT-cFosZip (pMS404, see Figures 8 and 9).
  • Figure 4 represents the bacterial strain SU202 which makes it possible to selectively measure the heterodimerization of fusion proteins capable of homodimerizing.
  • Fos leucine zipper mutants were constructed in the laboratory, these mutants acquired the ability to homodimerize (unlike Fos leucine zipper, which is incapable of this). Four of these mutants are used here and are described in: Porte D., Oertel-Buccheit P., Granger-Schnarr M. and Schnarr M. 1995 J. Biol. Chem. 22Q: 22721-22730 Fos leucine zipper variants with increased association capacity, These are:
  • the number of units measured remains constant, indicating that the gene coding for ⁇ -galactosidase is completely expressed, when the number of units measured decreases, this means that the gene coding for ⁇ -galactosidase is repressed , the intensity of the repression being a function both of the amount of protein present in the cell (it increases when the concentration of IPTG increases) and of the interaction strength of the proteins with each other.
  • strain SU202 (as described in this claim) does not "respond" to homodimerization (lacZ controlled by a mixed operator WT / 408).
  • This staining means that the ⁇ -galactosidase gene is not repressed by the fusion proteins and that the enzyme produced ferments the lactose in the medium.
  • the bacteria cotransformed by the two plasmids grow white, the ⁇ -galactosidase gene is suppressed.
  • Figure 6 shows the map of plasmid pDL606 (for cloning the "hook").
  • the restriction sites indicated are unique sites.
  • Ap represents the gene coding for resistance to ampicillin, p15, at the origin of replication of the plasmid.
  • the vector is of pACYC type (New England Biolabs, Inc): pACYC177.
  • Figure 7 shows the sequence of part of the plasmid pDL606 coding for the fusion protein LexAi-87408-cJunZip. The indicated sites make it possible to locate oneself on the map of figure 6.
  • Figure 8 shows the map of plasmid pMS404.
  • the restriction sites indicated are unique sites.
  • Tet represents the gene coding for resistance to tetracycline, Ori the origin of replication of the plasmid.
  • the vector is of the pUC type (New England Biolabs, Inc).
  • Figure 9 shows the sequence of part of the plasmid pMS404 encoding the fusion protein LexAi-87WT-cFosZip. The indicated sites make it possible to locate oneself on the map of figure 8.
  • Figure 10 shows the map of plasmid pL23B (plasmid vector for bank cloning for SU202). The restriction sites indicated are unique sites. Tet represents the gene coding for resistance to tetracycline, Ori the origin of replication of the plasmid.
  • This plasmid carries the DNA binding domain of a LexA mutant, LexA 1-823 (G-> S mutation in position 23). This mutation does not affect recognition specificity (LexA23 recognizes the same sequence as LexAWT) but does affect the strength with which this protein / DNA interaction occurs. In fact, to improve the system, we found that by decreasing the force of interaction between LexA and DNA, we gained in sensitivity.
  • This plasmid is intended for the cloning of a library.
  • Figure 11 shows the sequence of part of the plasmid pL23B coding for LexA 1-8723.
  • the bank can be cloned behind LexAi-8723 using one of the following unique sites: Xhol, EcoRI, Sfil. Downstream of these sites, three stop codons (TAA) were inserted into the three reading frames in order to limit the fusion protein. The indicated sites make it possible to locate oneself on the map of figure 10.
  • the double-hybrid system in E. coli is based on the use of LexA, a bacterial repressor. Wild LexA specifically recognizes and in the form of dimers a palindromic sequence of 16 base pairs, CTGT (N) 8 ACAG, called operator. The 4 external base pairs are highly conserved, while the central motif is more variable.
  • Each LexA monomer is composed of a DNA binding domain which recognizes the CTGT sequence and a dimerization domain essential for binding to DNA since the DNA binding domain lacking a dimerization domain, only fixes DNA very weakly.
  • LexA408 carries a triple mutation (P40 ⁇ A, N41- »S, A42 ⁇ S) and recognizes the following sequence CCGT (N) 8 ACGG.
  • the system according to the present invention is based on the fact that a mutated operator containing 1/2 wild-type operator and 1/2 mutated operator is recognized only by a mixed LexAWT / LexA408 dimer.
  • An indicator gene (lacZ) also designated by reporter gene was put under the control of this operator. Proteins or subdomains of proteins X and Y capable of interacting are then fused to the DNA binding domains, LexA _87WT and LexA ⁇ _ 87408.
  • FIG. 1 illustrates this system. LexA ⁇ _87WT-X and LexA ⁇ _87408-Y are cloned on compatible plasmids and their expression is controlled by an inducible promoter (lacUVS).
  • the indicator strain overexpressing the repressor of the lactose promoter (since lacF ⁇ ), one can then modulate the expression of LexA ⁇ _87WT-X and LexA ⁇ _87408-Y by adding variable concentrations of the inducer IPTG.
  • This system has two main uses:
  • I) - X and Y can be proteins or protein domains characterized and interacting with each other, they then give the hybrid proteins the ability to bind stably to DNA and thus repress the lacZ gene.
  • Such an interaction can be visualized on an appropriate indicator medium (for example Mac Conkey and described below) and can also be quantified by assaying the lacZ gene product, ⁇ -galactosidase according to the method described by Miller JH, 1972 "Experiments in Molecular Genetics, Cold Spring Harbor Lab. Cold Spring Harbor, NY); it is thus possible:
  • - X is a protein or a protein domain capable of interacting with a protein (s) still unknown that we want to identify.
  • a bank is then grafted onto Y (or X), this bank being cointroduced into the indicator strain with the gene coding for the hybrid protein for which the partner or partners are sought.
  • Any element of the coding bank for a protein or a protein domain interacting with X (or Y) gives rise to a bacterial clone whose color on an appropriate medium is different from those for which there is no interaction. This or these elements are then identified by sequencing.
  • the plasmid pRS415 carrying the lacZ gene devoid of promoter / operator region (Simons RW, Houman F. & Kleckner N. (1987). Improved single and multicopy lac-based cloning vectors for protein and operon fusions. Gene 5_2: 85-96 .) is open to EcoRI / BamHI restriction sites. Between these two unique restriction sites, the following double-stranded oligonucleotide has been inserted:
  • the strain JL1434 (LexA (Def), Lac "), transformed by the plasmids pGC202, was infected by the bacteriophage ⁇ d (Lac ⁇ ⁇ Hochschild A. & Ptashne M. (1988). Interaction at a distance between ⁇ repressors disrupts gene activation Nature 226: 353-357) whose genome carries immediately to the left of a lacZ gene devoid of promoter and initiation codon (ATG) of translation, a sequence derived from the vector pBR322 and which is also found to the left of the EcoRI cloning site of the plasmid pRS415 (see figure 2).
  • the lacZ gene is found under the control of the promoter / clone operator in pGC202 giving rise to phage ⁇ GC 202.
  • isolating lysogenic bacteria is to obtain stable integration of the recombinant phage into the bacterial chromosome, which is then in the prophage state. This is done from a second infection of the bacteria JL1434 with mini-preparations of the phage previously obtained in order to get rid of the initial plasmid and thus to ensure that the Lac character "* " is well carried by the phage.
  • the recombinant ⁇ phages After infection of the JL1434 strain, the recombinant ⁇ phages begin a lysogenic cycle which leads to stable integration by site-specific recombination of their genomes (and therefore of the lacZ gene controlled by the promoter / operator element described above) in the bacterial chromosome, at the att b site between the gay and organic operons.
  • the lysogenic Lac " * * SU202 strain was thus isolated.
  • This indicator strain carries the genes for resistance to Kanamycin and Chloramphenicol.
  • the genes coding for the hybrid proteins are carried by two compatible plasmid vectors carrying different origins of replication (pMBl or pl5A) as well as the selection for two different markers (tet ⁇ or amp ⁇ ) thus making it possible to maintain them simultaneously in the same bacterium. host.
  • the indicator strain SU202 was tested with the following chimeric proteins LexAi-87408-cJunZip and LexAi-87WT-cFosZip, they consist of the DNA binding domain (mutant 408 or wild-type (WT)) of the repressor LexA (aa 1 -87) and of the dimerization domain (leucine slide or "leucine zipper") of the oncoproteins cJun (aa 277-315) and cFos (aa 102-200).
  • FIG. 6 represents a map of the entire plasmid accompanied by the unique restriction sites
  • the vector is a pACYC177 (New England Biolabs, Inc.); it carries resistance to ampicillin and pi 5 A as the origin of replication.
  • FIG. 7 represents the part of the sequence of this plasmid corresponding to the fusion protein, this sequence being identifiable on the general map using the restriction sites.
  • FIG. 8 represents a map of the whole of the plasmid accompanied by the unique restriction sites
  • the vector is a plasmid related to a pBR322 (New England Biolabs, Inc.); it carries resistance to tetracycline and pMB1 as the origin of replication.
  • FIG. 9 represents the part of the sequence of this plasmid corresponding to the fusion protein, this sequence being identifiable on the general map using the restriction sites.
  • the genes encoding these two fusion proteins are controlled by the inducible promoter lacUV5.
  • lacUV5. The indicator strains overexpressing this repressor (since lacl' ⁇ ), make it possible to modulate the expression of LexAi- 87408-cJunZip and LexAi-87WT-cFosZip in the presence of different concentrations of inducer (IPTG).
  • the SU 202 strain is transformed either with each of the plasmids carrying the genes coding for the fusion proteins LexA ⁇ _87408-cJunZip and LexAi- 87WT-cFosZip or cotransformed with the two plasmids.
  • the transformed cells are left overnight at room temperature in LB (Maniatis et al.) Added respectively with either kanamycin, chloramphenicol, ampicillin or kanamycin, chloramphenicol, tetracycline or the four antibiotics: kanamycin, chloramphenicol, ampicillin and tetracycline, before d 'be spread on McConkey medium containing the same antibiotics.
  • Figure 5 shows, after transplanting onto the same box, the results obtained.
  • This type of culture medium contains inter alia lactose which is hydrolyzed by ⁇ -galactosidase to allolactose.
  • allolactose is the natural inducer of the lactose promoter, when the bacteria having one or both genes coding for the chimeric proteins are cultured on this medium, these are partially induced. It is estimated that the induction corresponds to that which one observed in LB medium supplemented with 10 " 5 M in IPTG. A significant difference was observed in the coloration of the bacterial clones indicating that the indicator strain constructed met the defined criteria, in fact:
  • the ⁇ -galactosidase is therefore not produced by the cells; this double transformation allows the cell to simultaneously produce the two chimeric proteins LexAi-87408-cJunZip and .LexAi-87WT-cFosZip; the absence of production of ⁇ -galactosidase indicates that the heterodimer LexA i -87408- cJunZip / LexA ⁇ _87WT-cFosZip, is unlike homodimers, capable of repressing the lacZ gene.
  • This indicator strain is therefore very functional, it makes it possible to highlight protein / protein interactions on the simple basis of the color of the clones, it is very specific and makes it possible to discriminate between homo- and heterodimerization.
  • the efficiency with which the indicator gene is suppressed can be quantitatively measured by in vitro assay of ⁇ -galactosidase activity. This test is carried out under the conditions described by Miller J.H. (1972) in Experiments in molecular genetics. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY
  • the values of the dosages described represent the average of at least three independent experiments and are carried out in the presence of variable concentrations of IPTG.
  • This strain can also be used to identify the determinants of these interactions either by random mutagenesis or by site-directed mutagenesis. For example, it was hypothesized that the specificity of heterodimerization between the zippers of Jun and Fos was due to the non-homodimerization of the zipper of Fos. This strain made it possible to show that this was not the case since Fos mutants capable of homodimerizing did not lose this specificity ( Figure 4).
  • the cells transformed only by the plasmids coding for the Fos mutants grow red on McConkey medium. Homodimerization is therefore not detected in this strain.
  • the bacteria also produce LexAi-87408-cJunZip, they grow white if the Fos mutants are improved in their protein / protein interaction compared to wild Fos, and pink if the Fos mutants are less good.
  • the intensity of the color is always inversely proportional to the capacity for heterodimerization ( ⁇ -galactosidase assay).
  • strain SU202 Use of the strain SU202 to identify the partner (s) of a protein or a characterized protein domain
  • FIG. 10 represents a map of the whole of the plasmid accompanied by the unique restriction sites, the vector is a plasmid related to a pBR322 (New England Biolabs, Inc.) it carries resistance to tetracycline and pMB1 as the origin of replication.
  • FIG. 11 represents the part of the sequence of this plasmid corresponding to the fusion protein, this sequence being identifiable on the general map using the restriction sites.
  • the two plasmids are simultaneously introduced into the SU202 strain and the transformed bacteria are:
  • Each clone carries a different library element coding for a different protein or protein domain, when this protein or protein domain is capable of establishing protein / protein interactions with the "hook", it gives rise to a clone white or pink among a carpet of red clones, which represent all the elements of the library coding for proteins or protein domains which do not interact with the hook.
  • This modification consists in introducing a point mutation in the natural operator sequence of sulA:
  • CTGTACATCCATACAG WT operator
  • CCGTACATCCATACAG mixed operator 408 / WT.
  • the sulA gene is in vivo repressed by LexA, the introduction of the op408 mutation prevents this repression, the gene product is then synthesized and the bacteria die, making the selection of such a construction impossible. It is therefore necessary to find a means other than suppression to control the production of SULA.
  • STOP codon is a specific sequence of three base pairs serving as a stop signal for the translational machinery.
  • a suppressor tRNA is tRNA capable of recognizing a STOP codon and of allowing further translation.
  • the bacterial host (SU202) which is used being carrying the suppressor tRNA SupE which, in place of the STOP codons (UAG), introduces a Glutamine residue, two to four glutamine residues have been replaced by TAG codons .
  • the sulA gene nailed into a plasmid was given by S. Cole (Institut Pasteur, Paris).
  • the STOP TAG codons were introduced at the level of Glutamines 42,47 on the one hand, and 42,47 55 and 56 on the other hand, giving rise to constructions called respectively sulA 2STOP and sulA 4STOP.
  • the 408 mutation was then introduced by the same mutagenesis process and identical results were obtained with sulA 2STOP and sulA 4STOP.
  • the constructions obtained were called op408 / opWT sulA 2STOP and op408 / opWT sulA 4STOP.
  • op408 / opWT sulA 2STOP or op408 / opWT sulA 4STOP can be introduced into the strain SU202 if they are co-transformed with plasmids carrying the genes coding for the fusion proteins LexA _ 7408- cJunZip and .LexA ⁇ _g7WT -cFosZip.
  • the sulA operation is not busy and the STOP codons are "read" by the suppressor tRNA, SupE.
  • the SULA protein is produced and causes the death of the bacteria.
  • the heterodimers LexA ⁇ _87408cJunZip / LexA -87 WT-cFosZip are able to bind to the operator of sulA and thus prevent the production of the protein SULA, the bacteria can divide and give rise to clones.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Hematology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

La présente invention concerne l'utilisation d'une séquence d'ADN comprenant: une séquence nucléotidique codant pour une protéine indicatrice (gène indicateur), un promoteur, un opérateur muté, ladite séquence nucléotidique étant sous le contrôle du susdit promoteur comprenant le susdit opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est par exemple à l'état sauvage, la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1, l'autre la séquence qui est à l'état sauvage, notamment pour détecter des interactions entre deux protéines, ces interactions étant révélées lorsqu'il y a répression de la transcription du susdit gène indicateur, cette répression résultant de la formation d'hétérodimères.

Description

SYSTEME DE DETECTION DES INTERACTIONS PROTEINE-PROTEINE
L'invention a pour objet un système de détection des interactions protéine- protéine, et plus particulièrement des séquences d'ADN pour la mise en oeuvre de ce système, ainsi que des hôtes cellulaires contenant lesdites séquences d'ADN.
Les interactions protéine-protéine jouent un rôle fondamental chez les organismes vivants supérieurs tant au niveau du développement normal de l'organisme qu'au niveau de certaines situations pathologiques. Les méthodes biochimiques et biophysiques existantes exigent d'une part que les différents partenaires aient été préalablement identifiés et, d'autre part, nécessitent de grandes quantités de protéines (donc leur clonage et leur purification). Il est donc indispensable de disposer d'outils permettant de réaliser l'étape initiale, c'est-à-dire permettant d'identifier et de cloner des protéines interagissant entre elles. De tels systèmes ont été récemment développés en utilisant la levure comme hôte et l'activation de la transcription d'un gène spécifique comme "sonde" (voir Fields et Sternglanz, 1994). Cependant, quoique déjà bien utilisé, ce système présente certaines limites.
L'étude de ces interactions protéine-protéine peut se faire en utilisant des techniques biochimiques et biophysiques in vitro. Mais celles-ci ne sont concevables que lorsque les protéines sont clonées et peuvent être produites et purifiées en grande quantité. D'autre part, elles ne permettent pas d'identifier de nouveau partenaire d'interaction.
Une alternative attrayante aux méthodes biochimiques consiste en une utilisation de banques d'expression d'ADNc (reflétant l'ensemble des ARN messagers) ou d'ADN génomique. L'avantage de ces stratégies réside dans le fait que les gènes des protéines ainsi identifiées sont immédiatement disponibles (pour une comparaison de ces méthodes voir Phizicky et Fields, 1995). Parmi les méthodes s'appuyant sur l'utilisation de banques d'expression, on peut distinguer celles qui utilisent une sélection in vitro (comme la révélation de plages de lyse par une protéine purifiée et marquée radioactivement interagissant avec une protéine inconnue) de celles utilisant une sélection in vivo. Dans ce dernier domaine, des progrès sensibles ont pu être réalisés grâce à la technique du "double-hybride" dans la levure (Ma et Ptashne, 1988; Fields et Song, 1989; Chien et al , 1991; Gyuris et al , 1993; Durfee et al , 1993; Vojtek et al , 1993; Le Douarin et al , 1995). Dans le système développé par Fields et Song (1989), permettant d'identifier in vivo chez la levure des protéines interagissant entre elles, une protéine X connue est greffée sur un domaine de fixation à l'ADN (Gal4 ou , LexA) et on cherche une deuxième protéine Y (greffée sur un domaine de l'activation ou "AD-activation domain" de la transcription) capable d'interagir avec la protéine X et de provoquer ainsi l'activation de la transcription. Dans une revue, Fields S. et Sternglanz R. ("The two-hybrid system: an assay for protein-protein interaction" (1994) TIG, JLQ:286-292) discutent les possibilités et les limites de cette méthode. Une des limites est que les deux protéines hybrides doivent parvenir dans le noyau de la cellule. L'autre difficulté majeure consiste à identifier des protéines Y qui interagissent avec une protéine X pourvue d'un domaine d 'activation de la transcription, puisque, dans ce cas, la protéine cible (Gal4-X ou LexA-X) donnera un signal d 'activation constitutif en absence de toute protéine Y.
S 'agissant de Gal4 comme support de fixation à l'ADN, elle a été initialement mise au point en utilisant le domaine de fixation à l'ADN ou DBD ("DNA binding domain") de la protéine Gal4 (Ma et Ptashne, 1988; Fields et Song, 1989). Gal4 est une protéine modulaire de 881 acides aminés possédant au moins deux domaines fonctionnels. Un domaine de fixation à l'ADN comprenant les acides aminés 1-94 et un domaine d'activation de la transcription. La fonction d'activation est en fait répartie sur trois segments différents de la protéine, à savoir 94-106, 148-196 et 768-881 (Marmorstein et al. , 1992). La structure de Gal4j.65 impliquée dans un complexe avec l'ADN a été déterminée par cristallographique aux rayons X (Marmorstein et al., 1992) tandis que la structure du domaine d'activation reste très mal définie.
Ainsi, Fields et Song (1989) ont greffé, d'une part la protéine SNF1 (une sérine/thréonine kinase) sur Gal4ι _j47, et d'autre part la protéine SNF4 sur le domaine d'activation 768-881 de Gal4. Aucune des deux protéines hybrides, Gal4ι_i47-SNF1 ou SNF4-Gal47-5g_ggι seules n'étaient capable d'activer la transcription du gène reporter lacZ placé sous le contrôle du promoteur G ALI . Par contre la coexpression des deux protéines hybrides a abouti à une activation de la transcription notable (180 unités), bien que nettement inférieure à l'activation observée avec la protéine Gal4 entière (4000 unités). Cette différence est imputable, d'une part à l'absence du domaine d'activation comprenant les acides aminés 148-196 et, d'autre part, au fait que l'interaction entre SNF1 et SNF4 ne remplace pas complètement une liaison covalente entre les deux domaines de Gal4. Une fusion directe entre Gal4ι .j47 et Gal476 _ggι provoque en effet seulement une réduction d'un facteur 2 par rapport à Gal4 entier (Ma et Ptashne, 1987a).
Depuis, des dizaines de couples de protéines X,Y ont été testées. De nombreuses combinaisons sont capables de restituer un activateur fonctionnel de la transcription (pour une revue, voir Bartel et a , 1993).
Outre l'analyse de l'interaction d'un couple de protéines connues, la technique du double-hybride permet également l'identification d'un partenaire inconnu du moment où on est en possession du gène de la protéine cible X. L'équipe de Stanley Fields a été la première à exploiter cette possibilité (Chien et a , 1991) en créant des fusions entre le domaine d'activation 768-881 de Gal4 et des séquences protéiques codées par des fragments d'ADN d'une banque d'ADN génomique de levure. Cette fois-ci, le domaine d'activation a été placé en extrémité NH2-terminale de cette famille de protéines de fusion, afin de faciliter la construction des protéines hybrides.
Afin d'éviter un trop grand nombre de clones faux-positifs, il est préférable d'insérer la banque dans le plasmide portant le domaine d'activation, puisque Ma et Ptashne (1987b) avaient montré auparavant, que de nombreux fragments protéiques fusionnés aux 147 premiers acides aminés de Gal4 étaient capables d'activer la transcription.
Depuis l'article de Chien et al. (1991) les souches et plasmides utilisés ont évolué. Notamment la combinaison d'une sélection métabolique associée à un crible lacZ s'est généralisée. Tandis que Chien et al. (1991) travaillaient uniquement sur la base du crible lacZ, des approches plus récentes utilisent également l'acquisition de la capacité à pousser sur un milieu manquant soit d'histidine, soit de leucine. En principe seules les cellules portant une protéine hybride issue de la banque, capable d'activer l'expression du gène de sélection (His3, Leu2) via une interaction X,Y formeront des colonies sur boîte. Une telle sélection permet l'analyse d'un plus grand nombre de clones.
Parallèlement à Gal41.147 comme support de fixation à l'ADN, l'équipe de Roger Brent (Harvard Médical School) a introduit le répresseur LexA d'Escherichia coli comme support (Golemis et Brent, 1992 ; Gyuris et a , 1993).
LexA est une protéine de 202 acides aminés, composée de deux domaines reliés par une région charnière d'environ 30 acides aminés. Les 70 premiers acides aminés constituent le domaine de fixation à l'ADN (Hurstel et al , 1986; Fogh et al, 1994) et les acides aminés 100 à 202 forment le domaine de dimérisation de la protéine (Schnarr et al. , 1985). LexA reconnaît des sites palindromiques sur l'ADN (les opérateurs SOS) et plusieurs opérateurs adjacents peuvent être occupés d'une façon coopérative (Lloubès et al , 1991).
L'utilisation de LexA comme support de fixation à l'ADN peut avoir plusieurs avantages. .LexA appartient à un organisme hétérologue {Escherichia coli), n'affecte pas la croissance de la levure, ne possède pas d'activité transcriptionnelle résiduelle (comme le segment 94-106 de Gal4) et peut être utilisé dans des souches de levure gal+. De ce fait, une des protéines hybrides (généralement celle contenant le domaine d'activation) peut être placée sous le contrôle de Gal4. Ainsi, la protéine hybride sera exprimée uniquement en présence de galactose, mais pas en présence de glucose. .Le domaine d'activation utilisé par l'équipe de Roger Brent est également issu à'Escherichia coli. Il s'agit d'un des domaines activateurs artificiels isolés par Ma et Ptashne (1987b). Ce domaine (nommé B42) possède un potentiel d'activation plus faible que les domaines d'activation de Gal4 ou de VP16, ce qui permet d'éviter les problèmes de toxicité liés à un éventuel "squelching" (la titration d'un élément essentiel de la machinerie de transcription par un domaine d'activation). Une description récente du système double-hybride s 'appuyant sur l'utilisation de LexA se trouve dans Golemis et al (1996) et Golemis et Brent (1996).
Malgré la fréquence d'utilisation des différents .systèmes double-hybride, peu d'études ont été menées cherchant à corréler des données obtenues in vivo avec des mesures d'affinité in vitro. Estojak et al. (1995) ont cherché à établir une telle corrélation dans le cas de plusieurs protéines à hélice-loop-hélice (Myc, Max, Mxi) et dans le cas de mutants du répresseur lambda. Leurs résultats sont quelque peu décevants.
En effet, le système double-hybride montre une forte polarité pour le couple Myc/Max. .Lorsque Myc est fixé sur DBD et Max sur AD, aucune activation de la transcription n'est observée. Par contre, lorsque Max est fixé sur DBD et Myc sur AD, on observe une activation en accord avec des données biochimiques montrant que les deux protéines interagissent. Lorsque cette dernière géométrie est utilisée avec des reporters lacZ ayant un nombre variable d'opérateurs en amont du gène, la hiérarchie des affinités apparentes in vivo entre les couples Max/Myc et Max/Mxi n'est pas la même selon le reporter utilisé.
La situation est encore plus confuse dans le cas des mutants du répresseur lambda. Des mutants ayant une capacité de dimérisation fortement amoindrie activent certains gènes reporters mieux que la protéine sauvage (Estojak et al. , 1995). Par ailleurs, bien que tous les variants activent assez fortement le gène lacZ, trois sur quatre sont incapables d'activer le gène leu2 et auraient, de ce fait, échappé à une sélection sur milieu dépourvu de leucine. En conclusion, Estojak et al. (1995) estiment qu'aucun gène reporter montre une corrélation satisfaisante avec les affinités mesurées in vitro.
Etant donné la complexité de l'assemblage d'un complexe d'initiation de la transcription chez les eucaryotes (voir : Hori et Carey, 1994 ; Maldonado et Reinberg, 1995) qui mobilise au moins une trentaine de protéines différentes, et le fonctionnement toujours mal compris des activateurs de la transcription, ces résultats ne sont pas tellement surprenants.
LexA est le répresseur du système SOS chez E.coli. LexA, composé de deux domaines, est inactivé in vivo suite à des dommages sur l'ADN par un clivage protéolytique localisé entre les deux domaines (pour une revue sur LexA, voir Schnarr et Granger-Schnarr, 1993). La séparation du domaine de fixation à l'ADN du domaine de dimérisation entraîne alors une diminution de l'affinité pour l'ADN d'environ 1000-fois, ne permettant plus une répression transcriptionnelle efficace. D'autre part, la constante de dimérisation de LexA (KA = 2 x 104 M-l) est relativement faible (Schnarr et al , 1985), ce qui suggère que la greffe d'un domaine de dimérisation hétérologue à affinité modeste devrait reconstituer un répresseur hybride fonctionnel. Schmidt-Dôrr et al (1991) ont pu montrer en effet que la fusion de la glissière à leucine ("leucine-zipper") de l'oncoprotéine Jun à LexAι_g7 restaure une répression transcriptionnelle. Par contre, la fusion de la glissière à leucine Fos ("leucine- zipper Fos"), qui est incapable de conférer l'homodimérisation, ne restaure pas la répression (Porte et al , 1995). En partant de cette observation, la partie glissière de Fos ("Fos-zipper") de la protéine de fusion a ensuite été mutagénéisée, afin de caractériser les anti-déterminants de l'homodimérisation de Fos (Porte et al. , 1995).
La souche bactérienne indicatrice est déficiente en LexA et porte le gène lacZ sous le contrôle d'un opérateur SOS reconnu par LexA (l'opérateur sulA). La protéine hybride, placée sous le contrôle du promoteur lacUVS inductible par 1TPTG, est produite à partir d'un plasmide de façon à pouvoir adapter la quantité de protéine aux nécessités expérimentales. Ce système est parfaitement adapté à l'étude d'un complexe homodimérique, mais son utilisation devient laborieuse du moment où l'on veut étudier l'hétérodimérisation entre deux protéines différentes capables de former également des homodimères.
Parallèlement au système LexA, l'équipe de James Hu a développé une approche voisine en utilisant le domaine de fixation à l'ADN du répresseur lambda (Hu, 1995). L'avantage de ce système est d'offrir les possibilités de sélection du phage lambda. Son inconvénient réside dans le fait que le domaine de fixation à l'ADN du répresseur lambda contient déjà un élément de dimérisation (l'hélice 5), qui peut masquer l'effet de domaines de dimérisation hétérologues relativement faibles.
L'invention a notamment pour objet de résoudre les difficultés présentées par les systèmes de l'art antérieur et, en particulier, l'invention a pour but de permettre l'étude de l'hétérodimérisation.
L'invention a pour objet un système permettant la détection d'interaction entre deux protéines greffées, par visualisation de la répression de la transcription et non pas par une activation de la transcription. En effet, contrairement au système levure, une protéine ayant une activité activatrice intrinsèque pourrait être utilisée.
L'invention a pour objet un système de détection des interactions protéine- protéine à l'aide d'une bactérie (Escherichia coli) comme organisme hôte, couramment utilisée dans tous les laboratoires de biologie moléculaire.
L'invention a pour objet un système de détection des interactions protéine- protéine évitant le problème de l'adressage des protéines de fusion dans le noyau comme c'est le cas dans la levure et ce, grâce à la non-compartimentation d'E. coli, notamment à l'absence d'un noyau structuré.
L'invention a pour objet un système adapté à l'étude des interactions de protéines situées dans la membrane cytoplasmique.
L'invention a pour objet un test (répression de la transcription) permettant potentiellement l'identification de protéines interagissant avec les domaines d'activation des facteurs de transcription, parmi lesquels on trouve de nombreux produits oncogéniques impliqués dans la cancérogénèse, comme Jun, Fos ou les membres de la famille Εts.
L'invention a pour objet un système d'étude d'interaction protéine- protéine (détermination des forces d'interaction, identification des éléments de structure ou de séquence importants pour cette interaction, analyse de la spécificité de l'interaction) plus fiable que le système levure (Estojak et al. 1995).
L'invention a pour objet un système d'étude d'interaction protéine- protéine permettant de détecter des interactions lorsque la protéine "hameçon" (celle pour laquelle on recherche le ou les partenaires) a des capacités intrinsèques d'activation de la transcription (revues Bartel et al. 1993, Golemis et Brent 1996, Golemis et al 1996) et ceci se produisant assez fréquemment (Ma et Ptashne 1988), et donc l'invention a pour objet un système permettant l'étude des interactions d'un "vrai" domaine d'activation de la transcription ; L'invention a pour objet un système de détection d'interaction protéine- protéine permettant l'examen d'un grand nombre de clones ( > 106) grâce à l'efficacité de transfection de E. Coli qui est nettement supérieure à celle de la levure (de l'ordre de 1 000 fois) et ainsi le criblage de banques d'ADNc ou d'ADN génomique.
L'invention concerne l'utilisation d'une séquence d'ADN comprenant :
- une séquence nucléotidique codant pour une protéine indicatrice (gène indicateur),
- un promoteur,
- un opérateur muté, ladite séquence nucléotidique étant sous le contrôle du susdit promoteur comprenant le susdit opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur étant tel que, à l'état non muté (sauvage), il entraîne la répression de la transcription du gène indicateur, lorsque des protéines régulatrices sous forme d'homodimère se fixent sur chacune desdites séquences répétées inversées via leur site de fixation à l'ADN, cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est à l'état sauvage, ou mutée de façon silencieuse ou comporte une mutation différente (mutation 2) de la susdite mutation 1 , la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1, l'autre la séquence qui est à l'état sauvage, ou qui est muté de façon silencieuse ou qui comporte une mutation 2, les homodimères susceptibles d'être formés à partir de chacun des monomères étant incapables de réprimer la transcription du susdit gène indicateur,
- pour détecter ou quantifier des interactions entre deux protéines ou domaines protéiques, ou cribler des protéines ou domaines protéiques présentant des interactions avec une protéine ou domaine protéique déterminé(e), ces interactions étant révélées lorsqu'il y a répression de la transcription du susdit gène indicateur, cette répression résultant de la formation d'hétérodimères comprenant :
1) un premier monomère contenant une première protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence de l'opérateur muté contenant la mutation 1, le susdit site de fixation étant fusionné à l'une des deux protéines ou à l'un des deux domaines protéiques, impliqué(e) dans les susdites interactions, 2) un deuxième monomère contenant une deuxième protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence non mutée, ou mutée de façon silencieuse ou comportant la mutation 2 de l'opérateur muté, le susdit site de fixation étant fusionné à l'autre des deux protéines ou à l'autre des deux domaines protéiques, impliqué(e) dans les susdites interactions.
L'utilisation selon l'invention repose sur le fait qu'une protéine régulatrice, par exemple LexA, régule in vivo l'expression de gènes en se fixant sur des séquences spécifiques situées en amont de ces gènes (séquences opérateur).
L'opérateur utilisé dans le cadre de l'invention est un opérateur muté dérivant d'un opérateur non muté qui est tel que, à l'état sauvage, ses séquences sont palindromiques (répétées inversées) et reconnues par des homodimères de la protéine régulatrice. La protéine régulatrice, par exemple LexA, est organisée en deux domaines, un domaine de fixation à l'ADN qui reconnaît spécifiquement les séquences opérateur et un domaine de dimérisation par lequel se font les interactions entre deux monomères protéiques stabilisant l'interaction des dimères sur l'ADN. Chaque monomère se fixe sur un demi-opérateur. Par "demi-opérateur" on désigne la séquence spécifiquement reconnue par chaque monomère. Ces séquences spécifiques sont identiques dans le cadre d'un opérateur sauvage ou doublement muté, et différentes dans le cadre d'un opérateur muté.
Cette fixation est renforcée par l'existence de contacts entre les domaines de dimérisation de chaque monomère. Le domaine de fixation à l'ADN seul (dépourvu du domaine de dimérisation) est incapable de fixer efficacement l'opérateur et donc de réguler l'expression d'un gène. Si on remplace le domaine de dimérisation de LexA par des motifs protéiques hétérologues mais susceptibles d'interagir, on restitue l'activité régulatrice de LexA.
Ceci étant, dans le cadre de l'invention, la séquence opérateur reconnue par une protéine régulatrice, par exemple LexA, a été modifiée de telle sorte qu'un demi-opérateur restant sauvage sera reconnu par la protéine régulatrice sauvage, par exemple LexA, tandis que l'autre demi-opérateur sera muté et reconnu par une forme mutée de la protéine régulatrice.
Chacun de ces domaines de fixation à l'ADN peut être fusionné à des domaines protéiques susceptibles d'hétérodimériser et toute interaction entre ces domaines est mesurée par une répression plus ou moins importante du gène indicateur (également désigné par "gène reporter").
On entend par gène indicateur : - soit un gène codant pour une protéine dont l'activité d'une part est révélée par la couleur qu'elle confère aux clones bactériens la produisant et d'autre part peut être dosée quantitativement, par exemple le gène lacZ, le gène codant pour la luciférase,
- soit un gène codant pour une protéine toxique pour la bactérie de telle sorte que si la protéine est produite, la bactérie meure, par exemple le gène sulA.
On peut également utiliser un système pour lequel :
- le gène toxique est un gène codant pour une résistance à un antibiotique,
- l'opérateur mixte op408/opWT est placé dans le promoteur du gène codant pour le répresseur de ce gène de résistance à un antibiotique.
En absence d'interaction entre LexA408-X et LexAWT-Y, le répresseur du gène en question est produit, la bactérie ne peut pas pousser sur un milieu de culture contenant cet antibiotique. Dans le cas contraire, la synthèse du répresseur n'a pas lieu, le gène de résistance à l'antibiotique est produit et les bactéries donnent lieu à des colonies sur un milieu de culture contenant cet antibiotique.
Par "homodimères", on désigne des associations non covalentes de protéines dans lesquelles les domaines d'interaction protéine-protéine sont identiques et liés de façon covalente à des domaines protéiques hétérologues ou homologues de fixation de l'ADN, eux-mêmes identiques ou différents.
Par "hétérodimères", on désigne des associations non covalentes de protéines dans lesquelles les domaines d'interaction protéine-protéine sont différents et liés de façon covalente à des domaines protéiques hétérologues ou homologues de fixation de l'ADN, eux-mêmes identiques ou différents.
Par "mutation silencieuse portée par l'une des séquences de l'opérateur", on désigne une mutation qui n'affecte pas la reconnaissance de ladite séquence par la protéine régulatrice sauvage.
Par "mutation 2 portée par la séquence de l'opérateur", on désigne une mutation différente de la mutation 1 , et qui est telle que la séquence comportant ladite mutation 2 est reconnue par une protéine régulatrice non susceptible de reconnaître la séquence portant la mutation 1, la mutation 1 étant elle-même telle qu'elle est reconnue par une protéine régulatrice qui n'est pas susceptible de reconnaître la séquence portant la mutation 2.
Par "interaction protéine-protéine", on désigne l'assemblage non covalent de deux (ou plusieurs) protéines par interaction Van der Waals (interactions électrostatiques entre charges opposées, liaisons hydrogène, interactions hydrophobes). La surface masquée par une telle interaction est généralement de 1400 à 1600 A°2 (pour une revue voir: J. Janin "Principles of protein/protein récognition from structure to thermodynamics " 1995, Biochimie 27:497-505).
Par "domaine de fixation à l'ADN d'une protéine", on définit la partie de la protéine dont l'intégrité est indispensable à sa fixation non covalente à l'ADN.
Par "détection de l'interaction", on désigne une méthode permettant de visualiser une interaction entre deux protéines.
Par "quantification de l'interaction", on désigne une méthode permettant de chiffrer la force de cette interaction.
L'expression "protéine susceptible de reconnaître la séquence d'un opérateur" désigne une protéine capable de faire des liaisons non covalentes avec une séquence particulière d'ADN.
L'expression "domaine de fixation fusionné à une protéine" désigne un domaine protéique relié par une liaison peptidique à une autre protéine ou domaine de protéine.
Selon un mode de réalisation avantageux de l'invention, la protéine régulatrice est dépourvue de son domaine de dimérisation, lequel peut toutefois être toléré si les interactions résultant de la présence du domaine de dimérisation sont plus faibles que celles que l'on veut mettre en évidence.
L'invention a également pour objet une séquence d'ADN comprenant :
- une séquence nucléotidique codant pour une protéine indicatrice (gène indicateur),
- un promoteur,
- un opérateur muté, ladite séquence nucléotidique étant sous le contrôle d'un promoteur comprenant un opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur étant tel que, à l'état non muté (sauvage), il entraîne la répression de la transcription du gène indicateur, lorsque des protéines régulatrices sous forme d'homodimère se fixent sur chacune desdites séquences répétées inversées via leur site de fixation à l'ADN, cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est à l'état sauvage, ou mutée de façon silencieuse ou comporte une mutation différente (mutation 2) de la susdite mutation 1, la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1, l'autre la séquence qui est à l'état sauvage, ou qui est muté de façon silencieuse ou qui comporte une mutation 2, les homodimères susceptibles d'être formés à partir de chacun des monomères étant incapables de réprimer la transcription du susdit gène indicateur, ladite mutation 1 étant en outre telle qu'elle est reconnue spécifiquement par une protéine régulatrice comportant un site de fixation à l'ADN entrant dans la constitution d'une première protéine de fusion, lequel site de fixation est fusionné avec une protéine ou un domaine protéique susceptible d'interagir avec une autre protéine ou un autre domaine protéique entrant dans la constitution d'une deuxième protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence non mutée, ou mutée de façon silencieuse ou comportant la mutation 2.
L'invention concerne une séquence d'ADN caractérisée en ce qu'elle comprend un opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), l'une de ces deux séquences étant mutée, et l'autre étant à l'état sauvage.
La séquence mutée peut être en amont ou en aval de la séquence à l'état sauvage.
L'invention a également pour objet une séquence d'ADN caractérisée en ce que l'opérateur muté contient les séquences suivantes :
CCGT et ACAG
espacées par une séquence d'environ 3 à environ 20 nucléotides, et notamment de 8 à 12, et avantageusement 8 nucléotides, et notamment caractérisée en ce que l'opérateur muté contient la séquence suivante :
5'-CGGAAπCAATAGGGπGATCTTTGTTGTCACTGGATGTACCGTACATCCATACAGTAACTCACAGGGGC-3'
Les séquences CCGT et ACAG correspondent aux séquences respectivement CTGT et ACAG de l'opérateur non muté.
La présente invention concerne une séquence d'ADN caractérisée en ce que la séquence nucléotidique codant pour la protéine indicatrice est le gène lacZ chez E. coli, codant pour la β-galactosidase, l'opérateur muté contient deux séquences et dérive d'un opérateur contenant deux séquences répétées inversées (palindrome), l'une de ces deux séquences étant mutée, et l'autre étant à l'état sauvage, la séquence mutée étant de préférence celle située en aval de la séquence à l'état sauvage, la séquence sauvage étant reconnue spécifiquement par la protéine LexA sauvage ou par un fragment de LexA contenant le site de fixation à l'ADN notamment un fragment défini par les positions 1 à x de LexA, x variant de 69 à 87, et notamment par les fragments 1 à 69 ou 1 à 87 de .LexA, et la séquence mutée étant reconnue par la protéine LexA mutée ou par un fragment muté de LexA contenant le site de fixation à l'ADN, notamment un fragment muté de LexA correspondant à celui défini par les positions 1 à x de LexA, x variant de 69 à 87, et notamment par les fragments 1 à 69 ou 1 à 87, et les mutations de LexA étant avantageusement P40 → A, N41 → S, A42 -» S, le domaine de dimérisation de .LexA étant absent à la fois de LexA ou du fragment de LexA et de LexA muté ou du fragment muté de LexA.
Les trois mutations simultanées P40 — » A, N41 → S, A42 → S dans LexA donnent lieu à un mutant désigné par LexA408.
Par "domaine de dimérisation", on désigne la partie de la protéine dont l'intégrité est indispensable à l'interaction non covalente avec elle-même (homodimère) ou avec un autre domaine de dimérisation (hétérodimère).
Il est nécessaire que le domaine de dimérisation de .LexA et de LexA408 ou du fragment utilisé de LexA et de LexA408 soient absents sinon lorsque les deux protéines (LexA et LexA408) sont coexprimees dans l'hôte cellulaire impliqué dans l'invention, le gène indicateur serait réprimé.
La présente invention a également pour objet un complexe entre - une séquence d'ADN comprenant une séquence nucléotidique codant pour une protéine indicatrice, ladite séquence nucléotidique étant sous le contrôle d'un promoteur comprenant un opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur étant tel que, à l'état non muté (sauvage), il entraîne la répression de la transcription du gène indicateur, lorsque des protéines régulatrices sous forme d'homodimère se fixent sur chacune desdites séquences répétées inversées via leur site de fixation à l'ADN, cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est à l'état sauvage, ou mutée de façon silencieuse ou comporte une mutation différente (mutation 2) de la susdite mutation 1, la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1, l'autre la séquence qui est à l'état sauvage, ou qui est muté de façon silencieuse ou qui comporte une mutation 2, les homodimères susceptibles d'être fournis à partir de chacun des monomères étant incapables de réprimer la transcription du susdit gène indicateur,
- et des hétérodimères dont les monomères les constituant (respectivement premier monomère et deuxième monomère) sont impliqués entre eux dans une interaction protéine/protéine :
1) le premier monomère étant tel qu'il contient une première protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence de l'opérateur muté contenant la mutation 1 , le susdit site de fixation étant fusionné à l'une des deux protéines ou à l'un des deux domaines protéiques, impliqué(e) dans les susdites interactions,
2) le deuxième monomère étant tel qu'il contient une deuxième protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence non mutée, ou mutée de façon silencieuse ou comportant la mutation 2 de l'opérateur muté, le susdit site de fixation étant fusionné à l'autre des deux protéines ou à l'autre des deux domaines protéiques, impliqué(e) dans les susdites interactions.
La présente invention concerne également un complexe caractérisé en ce que :
- la séquence d'ADN est telle que définie ci-dessus et en ce que
- les hétérodimères contiennent :
1) un monomère contenant une première protéine de fusion contenant le site de fixation à l'ADN de LexA muté ou d'un fragment muté de LexA reconnaissant la séquence de l'opérateur muté contenant la mutation 1 , lequel site de fixation est fusionné avec une protéine déterminée ou un fragment protéique déterminé susceptible d'être impliqué dans une interaction tel que décrite ci-dessus, laquelle protéine ou lequel domaine protéique contient par exemple un domaine d'activation ou de dimérisation,
2) un monomère contenant une deuxième protéine de fusion contenant le site de fixation à l'ADN de LexA sauvage, ou porteur d'une mutation silencieuse ou d'une mutation 2 ou d'un fragment de LexA reconnaissant la séquence non mutée de LexA ou mutée de façon silencieuse ou comportant une mutation 2, lequel site de fixation est fusionné avec une protéine déterminée ou un fragment protéique déterminé, contenant par exemple une protéine ou un domaine protéique susceptible d'interagir avec la protéine ou le fragment protéique défini en 1) ou avec les susdits domaines d'activation ou de dimérisation.
L'invention a également pour objet un hôte cellulaire contenant une séquence d'ADN telle que décrite ci-dessus.
L'invention a également pour objet un procédé pour détecter et quantifier des interactions entre deux protéines ou fragments de protéines, caractérisé
- en ce que l'on met en présence des séquences nucléotidiques codant respectivement pour le premier et le deuxième monomère contenant respectivement une première et une deuxième protéine de fusion telle que définie ci-dessus avec une séquence d'ADN telle que décrite précédemment, et
- en ce que l'on détecte l'éventuelle répression de la transcription du gène indicateur tel que défini ci-dessus, notamment par transfection d'un hôte cellulaire tel que décrit ci-dessus, avec des vecteurs contenant, d'une part, les susdites séquences nucléotidiques codant respectivement pour le premier et le deuxième monomère contenant respectivement la première et la deuxième protéine de fusion et, d'autre part, les éléments nécessaires à l'expression des susdits monomères.
L'invention concerne un procédé pour identifier une protéine interagissant avec une protéine déterminée, caractérisé
- en ce que l'on met en présence les éléments suivants :
. une séquence nucléotidique codant pour un premier monomère contenant une première protéine de fusion entre, d'une part, une protéine régulatrice selon l'invention et, d'autre part, la protéine déterminée,
. une banque génomique, contenant notamment des fragments d'ADN, et notamment d'ADNc, chacun étant susceptible de coder pour une protéine interagissant avec la protéine déterminée, chacun des différents éléments de la banque génomique étant respectivement fusionné à la séquence codant pour une protéine régulatrice telle que définie ci-dessus,
. une séquence d'ADN selon l'invention, et
- en ce que l'on détecte l'éventuelle répression de la transcription de la séquence nucléotidique codant pour une protéine indicatrice telle que décrite ci- dessus, notamment par transfection d'un hôte cellulaire selon la présente invention, d'une part, avec un vecteur contenant la séquence nucléotidique codant pour le susdit premier monomère contenant la première protéine de fusion et, d'autre part, un ensemble de vecteurs contenant une séquence nucléotidique codant pour un deuxième monomère contenant une deuxième protéine de fusion, chaque séquence nucléotidique codant pour chaque deuxième monomère contenant la séquence nucléotidique codant pour la protéine régulatrice selon la présente invention, et en aval de celle-ci l'un des éléments d'ADN de la susdite banque, tous les vecteurs contenant en outre les éléments nécessaires à l'expression des susdits monomères.
Ce procédé fait l'objet de l'exemple ci-après. Dans cet exemple, le gène indicateur est lacZ et a été placé sous le contrôle d'une séquence promoteur/opérateur caractérisée en ce que l'opérateur a été muté comme indiqué ci-après. Ceci a donné lieu à la construction d'une souche indicatrice (SU202). Cette souche permet d'identifier, sur la base de la couleur des clones bactériens, l'existence d'interactions protéine-protéine entre deux protéines ou domaines protéiques fusionnés respectivement au domaine de fixation à l'ADN de LexA sauvage et LexA408 tels que décrits ci-après. Cette souche permet de quantifier et d'analyser par mutagenèse cette interaction.
Cependant, le criblage d'une banque d'ADN nécessite l'analyse au minimum de 10^ clones. Ceci implique l'obtention sur milieu solide indicateur approprié (comme indiqué sur la figure 5) et l'expérience de 10^ colonies bactériennes dont il faudrait vérifier la couleur (blanches ou roses en cas d'interaction et rouges en absence d'interaction). Bien que théoriquement faisable, ceci est très coûteux non seulement en temps, mais également en matériel jetable.
Pour identifier de nouvelles interactions, on a avantageusement recours au système de sélection suivant. Dans ce type d'application, les interactions protéine-protéine ne sont plus visualisées sur la base de la couleur des clones bactériens, mais sur le simple fait de leur existence. En effet, si le gène indicateur est remplacé par un gène codant pour une protéine toxique :
- l'absence d'interaction protéine-protéine entre les parties Y et X de LexAι_ 7W -Y et de LexAι_g7408-X (comme décrit dans la figure 1) entraîne la production de la protéine toxique et donc la mort de la bactérie,
- l'existence de ces interactions entraîne la répression du gène toxique, la bactérie peut alors se diviser et donner lieu à une colonie sur milieu de culture solide.
Un tel système basé sur la survie des bactéries est bien évidemment plus facile à mettre en oeuvre. Il est cependant évident que, comme dans tous les systèmes de sélection, il faut compter avec ce que l'on appelle des "faux positifs", c'est-à-dire des clones qui survivent pour des raisons autres que celles que l'on identifier, par exemple, des mutations spontanées qui inactivent le produit du gène toxique. Pour lever cette ambiguïté, on utilise la souche indicatrice SU202. En effet, seuls les clones poussant blancs ou roses sont considérés comme "vrai positifs", les clones survivants dus à une mutation dans le gène toxique étant incapables de réprimer LacZ et poussant rouges.
Le gène toxique utilisé est le gène sulA. Il code pour une protéine, SULA, inhibitrice de la division cellulaire. En sa présence, la bactérie ne se divise plus et meurt.
Pour l'instant, la construction consistant à mettre sulA sous le contrôle d'un opérateur muté a été menée à bien. En utilisant le système modèle décrit ci-après avec les protéines hybrides de LexAι_g7408-cJunZip et LexAι_ 7WT- cFosZip, on a montré que le système fonctionne. En effet, la constniction (sulA sous le contrôle d'un opérateur muté) ne peut être propagée dans un hôte bactérien que si celui-ci porte également les gènes codant pour les protéines hybrides de LexAι_g7408-cJunZip et LexAι_g7WT-cFosZip.
La mise en évidence de nouvelles interactions protéine-protéine nécessite la constitution d'une banque d'ADN liguée en fusion à la suite du domaine de fixation. Pour cela, on a constitué une banque d'ADN qui est liguée en fusion à la suite du domaine de fixation à l'ADN de LexA sauvage ou d'un mutant de LexA reconnaissant la partie sauvage de l'opérateur mais avec une affinité moindre tels que ceux portant une des mutations suivantes G — » D ou G — > S en position 23 (réf. 21). Cette alternative a pour but de limiter l'apparition de clones "faux positifs" qui peuvent être dus à une interaction homodimérique trop forte d'une protéine ou domaine protéique présent dans la banque.
Description des figures :
- Figure 1 : la Figure 1 concerne le principe du fonctionnement du système double-hybride chez E. coli
Le système est basé sur le fait qu'un opérateur muté contenant 1/2 opérateur sauvage (WT) et 1/2 opérateur muté (408) n'est reconnu que par un dimère mixte LexAWT/.LexA408. Un gène indicateur (lacZ représenté par un rectangle vide) a été mis sous le contrôle de cet opérateur mixte (représenté par un rectangle noir pour la partie non mutée et annotée WT et par un rectangle hachuré pour la partie mutée et annotée 408). Des protéines ou des sous domaines de protéines X et Y susceptibles d'interagir sont fusionnés aux domaines de fixation à l'ADN de LexAi-87WT (représenté par une sphère noire) et de LexAi-g7408 (représentée par une sphère hachurée). .LexAi-g7WT- X (représenté par un rectangle hachuré relié à une sphère hachurée) et LexA 1-87408- Y(représenté par un rectangle noir relié à une sphère noire) sont clones sur des plasmides compatibles et leur expression est contrôlée par un promoteur inductible (lacUV5, Oertel-Buchheit P., Lamerichs R.M.J.N. , Schnarr M. and Granger-Schnarr M. 1990 Mol. Gen. Genêt. 222:40-48 Genetic analysis of the LexA repressor: isolation and characterization of LexA(Def) mutant proteins.). .Les plasmides sont représentés par des cercles dont une partie épaissie est séparée en deux, l'une représente le gène codant pour les protéines, LexAι_87WT-X ou LexA 1-87408- Y et l'autre pour leur séquence promoteur, lacUV5). Ces protéines, LexAi-87WT-X et LexAi-87408-Y peuvent exister soit sous forme libre dans la bactérie, soit sous forme liée à l'ADN (représentée par un rectangle noir relié à une sphère grisée entrelacé avec un rectangle hachuré relié à une sphère hachurée eux mêmes reliés aux rectangles noirs et hachurés représentant l'opérateur mixte ci-dessus décrit.). Le promoteur LacUV5 est lui même sous le contrôle d'une protéine régulatrice, le répresseur lactose (représenté par un carré aux coins arrondis et segmenté en cartiers). Le gène codant pour ce répresseur (gène lacl) est clone sur un épisome, le facteur F' (Willetts N. and Skurray R. in E. coli and Salmonella Typhimurium, Cellular and Molecular Biology Ed. Neidhardt F.C. 1987, pp 1110-1133 et Oertel- Buccheit et al 1990) lui même représenté par un arc de cercle. Le répresseur lactose peut exister soit sous forme libre dans la bactérie, soit sous forme liée à l'ADN (représenté par un carré aux coins arrondis et segmenté en cartiers relié aux séquences promoteurs, lacUV5 décrites ci-dessus). Le terme LexA(Def) signifie que la souche est dépourvue de LexA endogène.
- Figure 2 : la Figure 2 représente la construction de la souche indicatrice pour la mise en oeuvre d'un système double hybride chez E. coli.
Le plasmide pRS415 (représenté par le cercle contenant à l'intérieur l'indication "pRS415" (SIMONS R.W., HOUMAN F. & KLECKNER N. (1987). Improved single and multicopy lac-based cloning vectors for protein and operon fusions. Gène 52:85-96) porte le gène lacZ, dépourvu de région promoteur/opérateur (représenté par un épaississement du trait) et deux sites uniques de coupure pour deux enzymes de restriction EcoRI et BamHI. "Lac " signifie que ce plasmide est incapable de produire le produit du gène lacZ puisqu'il est dépourvu d'une séquence promoteur/opérateur. Ce plasmide est coupé par ces deux enzymes puis ligué à un oligonucléotide de 70 paires de bases (70mer et représenté par un rectangle noir) dont la séquence est la suivante :
GAATTCAATAGGGTTGATCTTTGTTGTCACTGGATGTACCGTACA TCCATACAGTAACTCACAGGGGCACCCTAGG-3' cet oligonucléotide introduit ainsi devant le gène lacZ une séquence promoteur/opérateur permettant au gène lacZ d'être transcript et régulé par l'opérateur mixte tel qu'il est défini dans la légende de la figure 1. Cette ligation symbolisée par une flèche entre le plasmide et le 70mer crée le plasmide pGC202 (représenté par le cercle
-I- contenant à l'intérieur l'indication "pGC202"). "Lac " signifie que ce plasmide est maintenant capable de produire le produit du gène lacZ puisqu'il est pourvu d'une séquence promoteur/opérateur. Le gène indicateur ainsi constitué (représenté par un rectangle noir pour la séquence promoteur/opérateur et par un rectangle blanc pour le gène lacZ) est ensuite transféré sur l'ADN d'un phage lambda (λ) par un double événement de recombinaison entre l'ADN plasmique et phagique (on entend par double événement de recombinaison un mécanisme moléculaire complexe se produisant in vivo et aboutissant à l'échange de fragments d'ADN entre des molécules partiellement homologues, ceci est matérialisé sur la figure par deux croix entre le plasmide pGC 202 et une droite symbolisant l'ADN du phage) donnant lieu au phage λGC 202. Ce phage a la capacité de s'intégrer dans le chromosome bactérien par un mécanisme complexe ayant lieu in vivo (Elledge et al. 1991). L'intérêt de ce système réside dans le fait que le gène indicateur sera sur le chromosome bactérien et non plus sur un plasmide, ce qui permet d'utiliser les vecteurs plasmidiques comme véhicule des protéines de fusion .
- Figure 3 : la Figure 3 concerne la caractérisation de la souche SU202 en fonction de la quantité de protéines présentes dans la cellule.
En abscisse, figurent les concentrations en IPTG (M) et en ordonnées, l'expression relative de la β-galactosidase.
La variation de la quantité de protéines est obtenue en cultivant les bactéries en présence de concentrations variables en IPTG, les gènes codants pour les protéines chimères étant sous le contrôle du promoteur inductible lacUV5. Les unités β-galactosidases sont mesurées selon la méthode décrite par Miller (1972). L'express ion relative de la β-galactosidase est calculée en faisant le rapport entre les unités β-galactosidases mesurées en présence des vecteurs d'expression et celles mesurées en leur absence, ces dernières correspondent à l'état non réprimé du gène lacZ. .Les carrés blancs correspondent aux valeurs mesurées lorsque la souche contient un plasmide exprimant LexA 1-87408- cJunZip (pDL606, voir figures 6 et 7). Les cercles blancs correspondent aux valeurs mesurées lorsque la souche contient un plasmide exprimant le domaine de fixation à l'ADN seul (JWL96, Little JW and Hill S.A. (1985) Deletion within the hinge région of a spécifie DNA-binding protein Proc. Natl. Acad. Sci USA, 22:2301-2305). Les triangles blancs correspondent aux valeurs mesurées lorsque la souche contient un plasmide exprimant LexAi-g7WT-cFosZip (pMS404, voir figures 8 et 9). Les carrés noirs correspondent aux valeurs mesurées lorsque la souche contient à la fois le plasmide exprimant le domaine de fixation à l'ADN seul (JWL96) et celui exprimant LexAi-87408-cJunZiρ (pDL606, voir figures 6 et 7). Les cercles noirs correspondent aux valeurs mesurées lorsque la souche contient à la fois le plasmide exprimant LexAi- 87408-cJunZip (pDL606, voir figures 6 et 7) et celui exprimant LexAi-87WT- cFosZip (pMS404, voir figures 8 et 9).
- Figure 4 : la Figure 4 représente la souche bactérienne SU202 qui permet de mesurer sélectivement l'hétérodimérisation de protéines de fusion susceptibles d'homodimériser.
En abscisse, figurent les concentrations en IPTG (M) et en ordonnées, l'expression relative de la β-galactosidase.
Des mutants de la glissière à leucine ("leucine zipper") de Fos ont été construits au laboratoire, ces mutants ont acquis la capacité à homodimériser (contrairement au leucine zipper de Fos qui lui en est incapable). Quatre de ces mutants sont utilisés ici et sont décrits dans: Porte D., Oertel-Buccheit P., Granger-Schnarr M. and Schnarr M. 1995 J. Biol. Chem. 22Q:22721-22730 Fos leucine zipper variants with increased association capacity, Il s'agit :
* d'un mutant pour lequel les cinq positions "a" de la glissière ("zipper") (définies dans Porte et al 1995) sont occupées par des résidus leucine (LexAi-87WT-cFosZipLLLLL) et qui est représenté par des cercles blancs dans les figures 4 A, B et C,
* d'un mutant pour lequel les cinq positions "a" de la glissière ("zipper") (définies dans Porte et al. 1995) sont occupées successivement par deux valines, une isoleucine, une phénylalanine et une valine (LexAi-87WT- cFosZipWIFV) et qui est représenté par des cercles noirs dans les figures 4A, B et C,
* d'un mutant pour lequel les cinq positions "a" de la glissière ("zipper") (définies dans Porte et al. 1995) sont occupées successivement par deux isoleucines, une leucine et deux isoleucines (LexAi-87WT-cFosZipIILII) et qui est représenté par des carrés blancs dans les figures 4A, B et C,
* d'un mutant pour lequel les cinq positions "a" de la glissière ("zipper") (définies dans Porte et al. 1995) sont occupées successivement par une isoleucine, une leucine, une phénylalanine, une leucine et une phénylalanine (LexAi-87WT-cFosZipILFLF) et qui est représenté par des carrés noirs dans les figures 4A, B et C,
* les triangles noirs représentent LexAi-87WT-cFosZip sauvage,
* les courbes en pointillés représentent les mesures faites en absence de plasmide. Chacune de ces constructions est soit introduite séparément dans les souches bactériennes indicatrices (figure 4A pour la souche SU202 et 4B pour la souche SU101) soit co-introduites avec la protéine de fusion LexAi-87408- cJunZip (figure 4C). L'activité β-galactosidase est ensuite mesurée dans les conditions décrites par Miller et al 1972 en fonction de concentrations variables en IPTG. En absence de protéine, le nombre d'unités mesurées reste constant, indiquant que le gène codant pour la β-galactosidase est complètement exprimé, lorsque le nombre d'unités mesurées diminue, cela signifie que le gène codant pour la β-galactosidase est réprimé, l'intensité de la répression étant fonction à la fois de la quantité de protéine présente dans la cellule (elle augmente lorsque l'on augmente la concentration en IPTG) et de la force d'interaction des protéines entre elles.
A- La souche SU202 (comme décrite dans cette revendication) ne "répond" pas à l'homodimérisation (lacZ contrôlé par un opérateur mixte WT/408).
B- L'homodimérisation des différentes protéines est mise en évidence dans une souche (SU101) dans laquelle lacZ est contrôlé par un opérateur WTC-La souche SU202 mesure sélectivement leur hétérodimérisation avec LexA408JunZip
- Figure 5 : sur la Figure 5, on voit que la souche SU 202 est transformée soit avec chacun des plasmides portant les gènes codant pour les protéines de fusion LexAi-87408-cJunZip et LexAj_87WT-cFosZip soit cotransformée avec les deux plasmides. Les cellules transformées sont laissées une nuit à température ambiante dans du LB additionné respectivement soit de kanamycine, chloramphenicol, ampicilline soit de kanamycine, chloramphenicol, tétracycline soit des quatre antibiotiques: kanamycine, chloramphenicol, ampicilline et tétracycline, avant d'être étalées sur milieu solide McConkey contenant les mêmes antibiotiques. Les cellules transformées par un seul des deux plasmides poussent rouges. Cette coloration signifie que le gène de la β-galactosidase n'est pas réprimé par les protéines de fusion et que l'enzyme produit fermente le lactose du milieu. Les bactéries cotransformées par les deux plasmides poussent blanches, le gène de la β-galactosidase est réprimé.
- Figure 6 : la Figure 6 représente la carte du plasmide pDL606 (pour le clonage de "l'hameçon"). Les sites de restrictions indiqués sont des sites uniques. Ap représente la gène codant pour la résistance à l'ampicilline, pl5A l'origine de replication du plasmide. Le vecteur est de type pACYC (New England Biolabs, Inc) : pACYC177. - Figure 7 : la Figure 7 représente la séquence d'une partie du plasmide pDL606 codant pour la protéine de fusion LexAi-87408-cJunZip. Les sites indiqués permettent de se repérer sur la carte de la figure 6.
- Figure 8 : la Figure 8 représente la carte du plasmide pMS404. Les sites de restriction indiqués sont des sites uniques. Tet représente le gène codant pour la résistance à la tétracycline, Ori l'origine de replication du plasmide. Le vecteur est de type pUC (New England Biolabs, Inc).
- Figure 9 : la Figure 9 représente la séquence d'une partie du plasmide pMS404 codant pour la protéine de fusion LexAi-87WT-cFosZip. Les sites indiqués permettent de se repérer sur la carte de la figure 8.
- Figure 10 : la Figure 10 représente la carte du plasmide pL23B (vecteur plasmidique pour clonage de banque pour SU202). Les sites de restriction indiqués sont des sites uniques. Tet représente le gène codant pour la résistance à la tétracycline, Ori l'origine de replication du plasmide. Ce plasmide porte le domaine de fixation à l'ADN d'un mutant de LexA, LexA 1-823 (mutation G- > S en position 23). Cette mutation n'affecte pas la spécificité de reconnaissance (LexA23 reconnaît la même séquence que LexAWT) mais affecte la force avec laquelle cette interaction protéine/ADN se produit. En effet, pour améliorer le système, nous avons trouvé qu'en diminuant la force d'interaction entre LexA et l'ADN, on gagnait en sensibilité. Ce plasmide est prévu pour le clonage d'une banque.
- Figure 11 : la Figure 11 représente la séquence d'une partie du plasmide pL23B codant pour LexA 1-8723. La banque peut être clonée derrière LexAi-8723 en utilisant l'un des sites uniques suivants: Xhol, EcoRI, Sfil. En aval de ces sites trois codons stops (TAA) ont été insérés dans les trois cadres de lecture afin de limiter la protéine de fusion. Les sites indiqués permettent de se repérer sur la carte de la figure 10.
L'invention sera complétée par la description détaillée et les exemples qui suivent, donnés à titre illustratif et non limitatif.
Principe du fonctionnement du système double-hybride chez E. coli Le système double-hybride chez E. coli est basé sur l'utilisation de LexA, répresseur bactérien. LexA sauvage reconnaît spécifiquement et sous forme de dimères une séquence palindromique de 16 paires de bases, CTGT (N)8 ACAG, appelée opérateur. Les 4 paires de bases externes sont fortement conservées, alors que le motif central est plus variable. Chaque monomère de LexA est composé d'un domaine de fixation à l'ADN qui reconnaît la séquence CTGT et d'un domaine de dimérisation indispensable à la fixation sur l'ADN puisque le domaine de fixation à l'ADN dépourvu de domaine de dimérisation, ne fixe que très faiblement l'ADN.
La littérature décrit des mutants de .LexA ayant une nouvelle spécificité de fixation à l'ADN. Celui qui a été utilisé, LexA408, porte une triple mutation (P40→A, N41-»S, A42→S) et reconnaît la séquence suivante CCGT (N)8 ACGG.
Le système selon la présente invention est basé sur le fait qu'un opérateur muté contenant 1/2 opérateur sauvage et 1/2 opérateur muté n'est reconnu que par un dimère mixte LexAWT/LexA408. Un gène indicateur (lacZ) également désigné par gène reporter a été mis sous le contrôle de cet opérateur. Des protéines ou des sous domaines de protéines X et Y susceptibles d'interagir sont ensuite fusionnés aux domaines de fixation à l'ADN, LexA _87WT et de LexAι_ 87408. La figure 1 illustre ce système. LexAι_87WT-X et LexAι_87408-Y sont clones sur des plasmides compatibles et leur expression est contrôlée par un promoteur inductible (lacUVS). La souche indicatrice surexprimant le répresseur du promoteur lactose (puisque lacF\), on peut alors moduler l'expression de LexAι_87WT-X et LexAι_87408-Y en ajoutant des concentrations variables de l'inducteur IPTG.
Ce système a deux utilisations principales:
I)- X et Y peuvent être des protéines ou des domaines de protéines caractérisés et interagissants entre eux, ils confèrent alors aux protéines hybrides la capacité de se fixer de façon stable sur l'ADN et ainsi de réprimer le gène lacZ. Une telle interaction peut être visualisée sur un milieu indicateur approprié (par exemple Mac Conkey et décrit ci-après) et peut également être quantifiée par dosage du produit du gène lacZ, la β-galactosidase selon la méthode décrite par Miller J.H., 1972 "Experiments in Molecular Genetics, Cold Spring Harbor Lab. Cold Spring Harbor, NY) ; il est ainsi possible :
1) de quantifier la force de cette interaction ;
2) d'identifier les déterminants de cette interaction (par mutagenèse par exemple) ;
3) d'identifier des molécules capables d'interférer avec cette interaction et susceptibles d'être utilisées in vivo ; petites molécules susceptibles d'être mises dans le milieu de culture et de passer à travers la paroi bactérienne.
II)- X (ou Y) est une protéine ou un domaine de protéine susceptible d'interagir avec une ou des protéine(s) encore inconnue(s) que l'on veut identifier. On greffe alors sur Y (ou X) une banque, cette banque étant cointroduite dans la souche indicatrice avec le gène codant pour la protéine hybride dont on cherche le ou les partenaires. Tout élément de la banque codant pour une protéine ou un domaine de protéine interagissant avec X (ou Y) donne lieu à un clone bactérien dont la couleur sur milieu approprié est différente de ceux pour lesquels il n'y a pas d'interaction. Ce ou ces éléments sont alors identifiés par séquençage.
EXEMPLE 1 :
Construction de la souche indicatrice pour la mise en oeuvre d'un système double hybride chez E. coli
Cette construction nécessite :
1) le clonage de lacZ sous le contrôle d'un promoteur régulé par un opérateur de type CCGT (N)8 ACAG;
2) de faire passer cette construction sur le chromose d'un hôte bactérien délété de son opéron lactose, déficient en LexA chromosomique et exprimant le répresseur lactose, souche JL1434 (Little J.W. & Hill S.A. 1985 Deletions within a hinge région of a spécifie DNA-binding protein. Proc. Natl. Acad. Sci. USA £2:2301-2305 et ceci par l'intermédiaire d'un phage lambda (Figure 2).
1. Construction de plasmides portant le gène lacZ placé sous le contrôle d'un opérateur muté WT / 408
Le plasmide pRS415 portant le gène lacZ, dépourvu de région promoteur/opérateur (Simons R.W., Houman F. & Kleckner N. (1987). Improved single and multicopy lac-based cloning vectors for protein and operon fusions. Gène 5_2:85-96.) est ouvert aux sites de restriction EcoRI/BamHI. Entre ces deux sites uniques de restriction, a été inséré l' oligonucléotide double brin suivant:
S,-GAATTC>VATAGGGTTGATCTTTGTTGTCACTGGATGTACCGTACATCCATACAGT ^ACTCACAGGGC.CACCCTAGG-3'
(bases en caractère gras = éléments du promoteur, bases soulignées = opérateur) créant ainsi le plasmide pGC202.
2. Isolement de bactériophages Lac + recombinants
La souche JL1434 (LexA(Def), Lac"), transformée par les plasmides pGC202, a été infectée par le bactériophage λφd (Lac~< Hochschild A. & Ptashne M. (1988). Interaction at a distance between λ repressors disrupts gène activation. Nature 226:353-357) dont le génome porte immédiatement à gauche d'un gène lacZ dépourvu de promoteur et de codon d'initiation (ATG) de la traduction, une séquence dérivant du vecteur pBR322 et que l'on retrouve également à gauche du site de clonage EcoRI du plasmide pRS415 (voir figure 2). Grâce aux séquences homologues situées de part et d'autre de la séquence "promoteur/opérateur/initiateur" et suite à un double événement de recombinaison entre l'ADN plasmique et phagique, le gène lacZ se retrouve sous le contrôle de la région promoteur/opérateur clone dans pGC202 donnant lieu au phage λGC 202.
3. Isolement de bactéries lysogènes pour les bactériophages Lac+ recombinants
L'isolement de bactéries lysogènes a pour but d'obtenir l'intégration stable du phage recombinant dans le chromosome bactérien, qui s'y trouve alors à l'état de prophage. Ceci se fait à partir d'une deuxième infection des bactéries JL1434 avec des minipréparations du phage précédemment obtenu afin de se débarrasser du plasmide initial et de s'assurer ainsi que le caractère Lac"*" est bien porté par le phage.
Après infection de la souche JL1434, les phages λ recombinants commencent un cycle lysogène qui conduit à l'intégration stable par recombinaison site-spécifique de leurs génomes (et donc du gène lacZ contrôlés par l'élément promoteurs/opérateurs décrit ci-dessus) dans le chromosome bactérien, au niveau du site att b entre les opérons gai et bio. La souche lysogène Lac"** SU202 a ainsi été isolée. Cette souche indicatrice porte les gènes de résistance à la Kanamycine et au Chloramphenicol.
Description des plasmides porteurs des protéines hybrides
Les gènes codant pour les protéines hybrides sont portés par deux vecteurs plasmidiques compatibles portant des origines de replication différentes (pMBl ou pl5A) ainsi que la sélection pour deux marqueurs différents (tet^ ou amp^ ) rendant ainsi possible leur maintien simultané dans la même bactérie hôte.
Utilisation de la souche SU202 pour identifier et quantifier des interactions protéine/protéine
La souche indicatrice SU202 a été testée avec les protéines chimères suivantes LexAi-87408-cJunZip et LexAi-87WT-cFosZip, elles sont constituées du domaine de fixation à l'ADN (mutant 408 ou sauvage (WT)) du répresseur LexA (aa 1-87) et du domaine de dimérisation (glissière à leucine ou "leucine zipper") des oncoprotéines cJun (aa 277-315) et cFos (aa 102-200).
Le gène codant pour LexAi-87408-cJunZiρ est porté par le plasmide pDL606 (voir figures 6 et 7). La figure 6 représente une carte de l'ensemble du plasmide accompagné des sites uniques de restriction, le vecteur est un pACYC177 (New England Biolabs, Inc.) ; il porte la résistance à l' ampicilline et pi 5 A comme origine de replication. La figure 7 représente la partie de la séquence de ce plasmide correspondant à la protéine de fusion, cette séquence étant repérable sur la carte générale à l'aide des sites de restriction.
Le gène codant pour LexAι_87WT-cFosZip est porté par le plasmide pMS404 (voir figures 8 et 9). La figure 8 représente une carte de l'ensemble du plasmide accompagné des sites uniques de restriction, le vecteur est un plasmide apparenté à un pBR322 (New England Biolabs, Inc.) ; il porte la résistance à la tétracycline et pMBl comme origine de replication. La figure 9 représente la partie de la séquence de ce plasmide correspondant à la protéine de fusion, cette séquence étant repérable sur la carte générale à l'aide des sites de restriction.
Ces domaines de dimérisation sont tels que les homodimères Jun Jun sont beaucoup moins stables que les hétérodimères Jun Fos, mais cependant davantage que les homodimères Fos/Fos qui n'existent pas in vivo (Sassone- Corsi P. , Ransone L.J., Lamph W.W. & Verma I.M. (1988). Direct interaction between fos and jun nuclear oncoproteins: rôle of the "leucine-zipper" domain. Nature (London) 2 :692-695.).
Les gènes codant pour ces deux protéines de fusion sont contrôlés par le promoteur inductible lacUV5. Les souches indicatrices surexp imant ce répresseur (puisque lacl'ï), permettent de moduler l'expression de LexAi- 87408-cJunZip et LexAi-87WT-cFosZip en présence de différentes concentrations en inducteur (IPTG).
Test qualitatif
La souche SU 202 est transformée soit avec chacun des plasmides portant les gènes codant pour les protéines de fusion LexAι_87408-cJunZip et LexAi- 87WT-cFosZip soit cotransformée avec les deux plasmides. Les cellules transformées sont laissées une nuit à température ambiante dans du LB (Maniatis et al.) additionné respectivement soit de kanamycine, chloramphenicol, ampicilline soit de kanamycine, chloramphenicol, tétracycline soit des quatre antibiotiques: kanamycine, chloramphenicol, ampicilline et tétracycline, avant d'être étalées sur milieu McConkey contenant les mêmes antibiotiques. La figure 5 montre, après repiquage sur une même boîte, les résultats obtenus.
Ce type de milieu de culture contient entre autre du lactose qui est hydrolyse par la β-galactosidase en allolactose. L' allolactose étant l'inducteur naturel du promoteur lactose, lorsque les bactéries possédant l'un ou les deux gènes codant pour les protéines chimères sont cultivées sur ce milieu, ceux-ci sont partiellement induits. On estime que l'induction correspond à celle que l'on observe en milieu LB additionné de 10"5 M en IPTG. II a été observé une différence importante dans la coloration des clones bactériens indiquant que la souche indicatrice construite répondait aux critères définis, en effet :
- les cellules transformées par un seul des deux plasmides poussent rouges; cette coloration signifie que le gène de la β-galactosidase n'est pas réprimé par les protéines chimères et que l'enzyme produit fermente le lactose du milieu; dans le cas LexAi-87408-cJunZip, les homodimères qui sont susceptibles de se former sont incapables in vivo de reconnaître l'opérateur muté et donc de réprimer le gène lacZ. En ce qui concerne la glissière à leucine ("leucine zipper") de Fos, la réponse était attendue puisqu'il n'homodimérise que très mal;
- les bactéries cotransformées par les deux plasmides poussent blanches, la β-galactosidase n'est donc pas produite par les cellules; cette double transformation permet à la cellule de produire simultanément les deux protéines chimères LexAi-87408-cJunZip et .LexAi-87WT-cFosZip; l'absence de production de la β-galactosidase indique que l'hétérodimère LexA i -87408- cJunZip/LexAι_87WT-cFosZip, est contrairement aux homodimères, capable de réprimer le gène lacZ.
Cette souche indicatrice est donc bien fonctionnelle, elle permet de mettre en évidence des interactions protéine/protéine sur la simple base de la couleur des clones, elle est très spécifique et permet de discriminer entre homo- et hétérodimérisation.
Test quantitatif
L'efficacité avec laquelle le gène indicateur est réprimée peut être mesurée quantitativement par dosage in vitro de l'activité β-galactosidase. Ce test est effectué dans les conditions décrites par Miller J.H. (1972) dans Experiments in molecular genetics. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY
.Les valeurs des dosages décrits représentent la moyenne d'au moins trois expériences indépendantes et sont réalisées en présence de concentrations variables en IPTG.
La figure 3 montre que:
* quelle que soit la concentration en IPTG, la souche non transformée produit le même nombre d'unités β-galactosidase (en moyenne 2500 unités);
* lorsqu'elle est transformée avec le plasmide codant pour LexAi-87WT- cFosZip et quelle que soit la concentration en IPTG (c'est-à-dire même en surexprimant la protéine chimère), le nombre d'unités ne varie pas; * lorsqu'elle porte les deux protéines chimères, on observe une répression très forte du gène reporter ( le nombre d'unités β-galactosidase chute à 20 pour les concentrations 10" et 10"3 M en IPTG);
* cette répression est due à l'interaction spécifique entre les parties glissière à leucine ("leucine zippers") des protéines chimères aboutissant à la formation d'hétérodimères actifs, et non pas à la simple coexistence de deux protéines chimères dont les domaines de liaison à l'ADN seraient capables de se fixer indépendamment sur chaque demi site de l'opérateur muté; en effet, lorsque la souche porte le gène codant pour le domaine de fixation à l'ADN WT de LexA dépourvu de son domaine de dimérisation et celui codant pour LexAi- 87408-cJunZip, on n'observe pas de répression du gène reporter.
On dispose donc d'un test permettant de mettre en évidence des interactions protéine/protéine utilisable comme crible mais aussi avec la possibilité de mesurer et de comparer la force de ces interactions.
Recherche et identification de mutants affectés dans ces interactions
Cette souche peut être également utilisée pour identifier les déterminants de ces interactions soit par mutagenèse aléatoire soit par mutagenèse dirigée. Par exemple, il avait été émis l'hypothèse que la spécificité d'hétérodimérisation entre les glissières ("zippers") de Jun et de Fos était due à la non homodimérisation de la glissière ("zipper") de Fos. Cette souche a permis de montrer que tel n'était pas le cas puisque de mutants de Fos capables d'homodimériser n'ont pas perdu cette spécificité (figure 4).
Les cellules transformées uniquement par les plasmides codant pour les mutants de Fos poussent rouges sur milieu McConkey. L'homodimérisation n'est donc pas détectée dans cette souche.
Dans le cas où les bactéries produisent en plus LexAi-87408-cJunZip, elles poussent blanches si les mutants de Fos sont améliorés dans leur interaction protéine/protéine par rapport à Fos sauvage, et roses si les mutants de Fos sont moins bons. L'intensité de la couleur est toujours inversement proportionnelle à la capacité d'hétérodimérisation (dosage β-galactosidase).
Utilisation de la souche SU202 pour identifier le ou les partenaires d'une protéine ou d'un domaine protéique caractérisé
Deux plasmides sont utilisés:
1- le plasmide portant la protéine ou le domaine de protéine caractérisé pour lequel on veut identifier le ou les partenaires fusionné(s) au domaine de fixation à l'ADN de LexA408, pDL606 : constituant "l'hameçon" . 2- le plasmide portant la banque, pLE23B (voir figures 10 et 11). La figure 10 représente une carte de l'ensemble du plasmide accompagné des sites uniques de restriction, le vecteur est un plasmide apparenté à un pBR322 (New England Biolabs, Inc.) il porte la résistance à la tétracycline et pMBl comme origine de replication. La figure 11 représente la partie de la séquence de ce plasmide correspondant à la protéine de fusion, cette séquence étant repérable sur la carte générale à l'aide des sites de restriction.
.Les deux plasmides sont simultanément introduits dans la souche SU202 et les bactéries transformées sont :
- soit directement sélectionnées sur milieu solide LB + antibiotiques (kanamycine, chloramphenicol, ampicilline et tétracycline), les clones positifs étant ensuite révélés par répliques des boîtes sur milieu indicateur McConkey + les mêmes antibiotiques,
- soit sélectionnées en milieu liquide LB + antibiotiques (kanamycine, chloramphenicol, ampicilline et tétracycline) pendant une nuit, puis révélées par étalement des cultures sur milieu indicateur McConkey + les mêmes antibiotiques.
Chaque clone porte un élément de banque différent codant pour une protéine ou un domaine de protéine différent, lorsque cette protéine ou ce domaine de protéine est susceptible d'établir des interactions protéine/protéine avec "l'hameçon", il donne lieu à un clone blanc ou rosé parmi un tapis de clones rouges, qui eux représentent tous les éléments de la banque codant pour des protéines ou des domaines de protéine n' interagissant pas avec l'hameçon.
La constitution de la banque passe par l'intermédiaire d'une navette phage Elledge S.J. et al , 1991, Proc. Natl. Acad. Sci. USA, .88:1731-1735. "λYes: multifunctional cDNA expression vector for the isolation of gènes by complémentation of yeast and E. coli mutations".
EXEMPLE 2 :
Construction du système de sélection mettant en oeuvre un gène indicateur codant pour une protéine toxique :
Modification de la séquence opérateur du gène sulA de manière à rendre son expression dépendante d'interactions hétérodimériques entre des protéines ou domaines protéiques X et Y fusionnés respectivement aux domaines de fixation à l'ADN de .LexA408 et .LexAWT.
Cette modification consiste à introduire une mutation ponctuelle dans la séquence opérateur naturelle de sulA :
CTGTACATCCATACAG = opérateur WT, CCGTACATCCATACAG = opérateur mixte 408/WT.
I gène sulA est in vivo réprimé par LexA, l'introduction de la mutation op408 empêche cette répression, le produit du gène est alors synthétisé et les bactéries meurent, rendant impossible la sélection d'une telle construction. Il est donc nécessaire de trouver un moyen autre que la répression pour contrôler la production de SULA.
Préalablement à l'instauration de cette mutation, on a introduit de deux à quatre codons STOP dans la phase codante de sulA (un codon STOP est une séquence spécifique de trois paires de bases servant de signal d'arrêt à la machinerie traductionnelle). Ainsi, seule une protéine tronquée inactive est produite et ceci permet l'instauration de la mutation op408.
Lorsque le système est mis en oeuvre, il suffit d'utiliser un hôte bactérien porteur d'un ARNt suppresseur de ce codon STOP (un ARNt suppresseur est ARNt capable de reconnaître un codon STOP et de permettre la poursuite de la traduction). L'hôte bactérien (SU202) que l'on utilise étant porteur de l'ARNt suppresseur SupE qui, à la place des codons STOP (UAG), introduit un résidu Glutamine, on a remplacé de deux à quatre résidus glutamine par des codons TAG.
Le gène sulA cloué dans un plasmide a été donné par S. Cole (Institut Pasteur, Paris). On a introduit les codons STOP TAG au niveau des Glutamines 42,47 d'une part, et 42,47 55 et 56 d'autre part, donnant lieu à des constructions appelées respectivement sulA 2STOP et sulA 4STOP. Ceci a été réalisé par mutagenèse dirigée selon la méthode décrite par Eckstein (Nakamaye, K. et Eckstein, F. Nucleic Acids Res. 1986, 14:9679-9698) et en utilisant un kit commercialisé par la société Amersham.
La mutation 408 a ensuite été introduite par le même procédé de mutagenèse et des résultats identiques ont été obtenus avec sulA 2STOP et sulA 4STOP. Les constructions obtenues ont été appelées op408/opWT sulA 2STOP et op408/opWT sulA 4STOP.
Mise en oeuvre du système de sélection ;
Le système a été testé dans la souche SU202 portant un ARNt suppresseur, SupE. Les résultats suivants ont été observés. i) op408/opWT sulA 2STOP ou op408/opWT sulA 4STOP ne peuvent pas être introduits dans la souche. En effet, quelle que soit la méthode de transformation utilisée (chlorure de calcium ou electroporation), aucun clone n'a été obtenu, alors qu'un plasmide identique mais ne portant pas la construction donne lieu à 200 ou 2000 clones par nanogramme de plasmide selon la méthode de transformation utilisée ; ii) par contre, op408/opWT sulA 2STOP ou op408/opWT sulA 4STOP peuvent être introduits dans la souche SU202 s'ils sont co-transformés avec des plasmides portant les gènes codant pour les protéine de fusion LexA _ 7408- cJunZip et .LexAι_g7WT-cFosZip.
Dans la première expérience, l'opération de sulA n'est pas occupé et les codons STOP sont "lus" par l'ARNt suppresseur, SupE. La protéine SULA est produite et provoque la mort de la bactérie.
Dans la deuxième expérience, les hétérodimères LexAι_87408cJunZip / LexA -87 WT-cFosZip sont capables de se fixer sur l'opérateur de sulA et empêchent ainsi la production de la protéine SULA, la bactérie peut se diviser et donner lieu à des clones.
REFERENCES
1. Bartel, P.L., Chien, C.-T. , Sternglanz, R. & Fields, S. (1993) "Using the two-hybrid system to detect protein-protein interactions", In: Cellular Interactions in Development: A practical approach (Oxford University Press, Oxford) pp. 153-179.
2. Chien, C.-T., Bartel, P.L., Sternglanz, R. & Fields, S. (1991), "The two-hybrid system: A method to identify and clone gènes for proteins that interact with a protein of interest", Proc. Natl Acad. Sel USA .88:9578-9582.
3. Durfee, T., Becherer, K., Chen, P.-L. , Yeh, S. -H. , Yang, Y. , Kilburn, A.E., Lee, W.-H. & Elledge, S.J. (1993), "The retinoblastoma protein associâtes with the protein phosphatase type 1 catalytic subunit" , Gènes and Dev. 2:555-569.
4. Estojak, J., Brent, R. & Golemis, E.A. (1995), "Corrélation of two- hybrid affinity data with in vitro measurements" , Mol. Cell Biol. JL5_:5820- 5829.
5. Fields, S. & Song, O.-K. (1989) "A novel genetic system to detect protein-protein interactions" , Nature 2fiû:245-246.
6. Fogh, R.H., Ottleben, G., Ruterjans, H., Schnarr, M. , Boelens, R. & Kaptein, R. (1994), "Solution structure of the LexA repressor DNA binding domain: détermination by 1H NMR spectroscopy", EMBO J. .0:3936-3944.
7. Golemis, E.A. & Brent, R. (1992), "Fused protein domains inhibit DNA binding by LexA", Mol. Cell Biol. 12:3006-3014.
8. Golemis, E.A. & Brent, R. (1996), "The interaction trap", In: Two- hybrid Systems: A practical approach (Oxford University Press, Oxford) Chapter 4.
9. Golemis, E.A., Gyuris, J. & Brent, R. (1996), "Interaction trap/two- hybrid system to identify interacting proteins", In: Current Protocols in Molecular Biology, John Wiley & Sons, New York (Eds: Ausubel, F. , Brent, R. , Kingston, R. , Moore, D., Seidmann, J., Smith, J.A. & Struhl, K.) Unit 20.1.
10. Gyuris, J. , Golemis, E.A., Chertkov, H. & Brent, R. (1993) "Cdil, a human Gl and S phase protein phosphatase that associâtes with Cdk2", Cell 25:791-803.
11. Hori, R. & Carey, M. (1994) "The rôle of activators in assembly of RNA polymerase II transcription complexes", Current Opinion in Genetics and Dev. 4:236-244.
12. Hu, J.C. (1995) "Repressor fusions as a tool to study protein-protein interactions", Structure 2:431-433.
13. Hurstel, S. , Granger-Schnarr, M. , Daune, M. & Schnarr, M. (1986), "In vitro binding of LexA repressor to DNA: évidence for the involvement of the amino-terminal domain", EMBO J. 5:793-798.
14. Le Douarin, B., Pierrat, B., vom Baur, E., Chambon, P. & Losson, R. (1995) "A new version of the two-hybrid assay for détection of protein- protein interactions", Nucl. Acids Res. .22: 876-878.
15. Lloubès, R., Granger-Schnarr, M. , Lazdunski, C. & Schnarr, M. (1991), "Interaction of a regulatory protein with a DNA target containing two overlapping binding sites", J. Biol Chem. 2^:2303-2312.
16. Ma, J. & Ptashne, M. (1987a), "Deletion analysis of Gal4 defines two transcrptional activating segments", Cell 48:847-853.
17. Ma, J. & Ptashne, M. (1987b), "A new class of yeast transcriptional activators", Cell 51: 113-119.
18. Ma, J. & Ptashne, M. (1988), "Converting a eucaryotic transcriptional inhibitor into an activator", Cell .55:443-446.
19. Maldonado, E. & Reinberg, D. (1995), "News on initiation and elongation of transcription by RNA polymerase II", Current Opinion in Cell Biol 2:352-361. 20. Marmorstein, R. , Carey, M., Ptashne, M. & Harrison, S.C. (1992), "DNA récognition by Gal4: structure of a protein-DNA complex" , Nature 256:408-414.
21. Oertel-Buchheit, P. , Lamerichs, R., Schnarr, M. & Granger-Schnarr, M. (1990), "Genetic analysis of the LexA repressor: isolation and characterization of LexA (Def) mutant proteins", Mol Gen. Genêt. 223:40-48.
22. Phizicky, E.M. & Fields, S. (1995), "Protein-protein interactions: methods for détection and analysis", Microbiol. Rev. 55:94-123.
23. Porte, D. , Oertel-Buchheit, P., Granger-Schnarr, M. & Schnarr, M. (1995), "Fos leucine zipper variants with increased association capacity", J. Biol. Chem. 22Q:22721-22730.
24. Schmidt-Dôrr, T., Oertel-Buchheit, P., Pernelle, C, Bracco, L., Schnarr, M. & Granger-Schnarr, M. (1991), "Construction, purification and characterization of a hybrid protein comprising the DNA binding domain of the LexA repressor and the Jun leucine zipper", Biochemistry 3_Q:9657-9664.
25. Schnarr, M. & Granger-Schnarr, M. (1993), "LexA, the self-cleaving transcriptional repressor of the SOS System", Nucleic Acids and Mol. Biol 7: 170-189 (Eds. F. Eckstein & D.M.J. Lilley)
26. Schnarr, M., Pouyet, J. , Granger-Schnarr, M. & Daune, M. (1985), "Large-scale purification, oligomerization equilibria, and spécifie interaction of the LexA repressor of Escherichia coli", Biochemistry 24:2812-2818.
27. Vojtek, A.B., Hollenberg, S.M. & Cooper, J. A. (1993), "Mammalian Ras interacts directly with the serine/threonine kinase Raf" , Cell 24:205-214.

Claims

REVENDICATIONS
1- Utilisation d'une séquence d'ADN comprenant :
- une séquence nucléotidique codant pour une protéine indicatrice (gène indicateur),
- un promoteur,
- un opérateur muté, ladite séquence nucléotidique étant sous le contrôle du susdit promoteur comprenant le susdit opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur étant tel que, à l'état non muté (sauvage), il entraîne la répression de la transcription du gène indicateur, lorsque des protéines régulatrices sous forme d'homodimère se fixent sur chacune desdites séquences répétées inversées via leur site de fixation à l'ADN, cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est à l'état sauvage, ou mutée de façon silencieuse ou comporte une mutation différente (mutation 2) de la susdite mutation 1 , la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1 , l'autre la séquence qui est à l'état sauvage, ou qui est muté de façon silencieuse ou qui comporte une mutation 2, les homodimères susceptibles d'être formés à partir de chacun des monomères étant incapables de réprimer la transcription du susdit gène indicateur,
- pour détecter ou quantifier des interactions entre deux protéines ou domaines protéiques, ou cribler des protéines ou domaines protéiques présentant des interactions avec une protéine ou domaine protéique déterminé(e), ces interactions étant révélées lorsqu'il y a répression de la transcription du susdit gène indicateur, cette répression résultant de la formation d'hétérodimères comprenant :
1) un premier monomère contenant une première protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence de l'opérateur muté contenant la mutation 1, le susdit site de fixation étant fusionné à l'une des deux protéines ou à l'un des deux domaines protéiques, impliqué(e) dans les susdites interactions,
2) un deuxième monomère contenant une deuxième protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence non mutée, ou mutée de façon silencieuse ou comportant la mutation 2 de l'opérateur muté, le susdit site de fixation étant fusionné à l'autre des deux protéines ou à l'autre des deux domaines protéiques, impliqué(e) dans les susdites interactions.
2. Séquence d'ADN comprenant :
- une séquence nucléotidique codant pour une protéine indicatrice (gène indicateur),
- un promoteur,
- un opérateur muté, ladite séquence nucléotidique étant sous le contrôle d'un promoteur comprenant un opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur étant tel que, à l'état non muté (sauvage), il entraîne la répression de la transcription du gène indicateur, lorsque des protéines régulatrices sous forme d'homodimère se fixent sur chacune desdites séquences répétées inversées via leur site de fixation à l'ADN, cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est à l'état sauvage, ou mutée de façon silencieuse ou comporte une mutation différente (mutation 2) de la susdite mutation 1 , la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1, l'autre la séquence qui est à l'état sauvage, ou qui est muté de façon silencieuse ou qui comporte une mutation 2, les homodimères susceptibles d'être formés à partir de chacun des monomères étant incapables de réprimer la transcription du susdit gène indicateur, ladite mutation 1 étant en outre telle qu'elle est reconnue spécifiquement par une protéine régulatrice comportant un site de fixation à l'ADN entrant dans la constitution d'une première protéine de fusion, lequel site de fixation est fusionné avec une protéine ou un domaine protéique susceptible d'interagir avec une autre protéine ou un autre domaine protéique entrant dans la constitution d'une deuxième protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence non mutée, ou mutée de façon silencieuse ou comportant la mutation 2.
3. Séquence d'ADN selon la revendication 2, caractérisée en ce qu'elle comprend un opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), l'une de ces deux séquences étant mutée, et l'autre étant à l'état sauvage.
4. Séquence d'ADN selon l'une des revendications 2 ou 3, caractérisée en ce que l'opérateur muté contient les séquences suivantes :
CCGT et ACAG
espacées par une séquence d'environ 3 à environ 20 nucléotides, et notamment de 8 à 12, et avantageusement 8 nucléotides, et notamment caractérisée en ce que l'opérateur muté contient la séquence suivante :
5 ' -CGGAATTC A ATAGGGTTGATCTTTGTTGTCACTGGATGT ACCGTACATCCATACAGTAACTCACAGGGGC-3'
5. Séquence d'ADN selon l'une des revendications 3 à 4, caractérisée en ce que la séquence nucléotidique codant pour la protéine indicatrice est le gène lacZ chez E. coli, codant pour la β-galactosidase, l'opérateur muté contient deux séquences et dérive d'un opérateur contenant deux séquences répétées inversées (palindrome), l'une de ces deux séquences étant mutée, et l'autre étant à l'état sauvage, la séquence mutée étant de préférence celle située en aval de la séquence à l'état sauvage, la séquence sauvage étant reconnue spécifiquement par la protéine .LexA sauvage ou par un fragment de LexA contenant le site de fixation à l'ADN notamment un fragment défini par les positions 1 à x de LexA, x variant de 69 à 87, et notamment par les fragments 1 à 69 ou 1 à 87 de LexA, et la séquence mutée étant reconnue par la protéine LexA mutée ou par un fragment muté de LexA contenant le site de fixation à l'ADN, notamment un fragment muté de LexA correspondant à celui défini par les positions 1 à x de LexA, x variant de 69 à 87, et notamment par les fragments 1 à 69 ou 1 à 87, et les mutations de LexA étant avantageusement P40 -→ A, N41 → S, A42 → S, le domaine de dimérisation de LexA étant absent à la fois de LexA ou du fragment de LexA et de LexA muté ou du fragment muté de LexA.
6. Complexe entre
- une séquence d'ADN comprenant une séquence nucléotidique codant pour une protéine indicatrice, ladite séquence nucléotidique étant sous le contrôle d'un promoteur comprenant un opérateur muté contenant deux séquences et dérivant d'un opérateur contenant deux séquences répétées inversées (palindrome), cet opérateur étant tel que, à l'état non muté (sauvage), il entraîne la répression de la transcription du gène indicateur, lorsque des protéines régulatrices sous forme d'homodimère se fixent sur chacune desdites séquences répétées inversées via leur site de fixation à l'ADN, cet opérateur muté étant tel que l'une de ses séquences est mutée (mutation 1), tandis que l'autre est à l'état sauvage, ou mutée de façon silencieuse ou comporte une mutation différente (mutation 2) de la susdite mutation 1, la transcription du gène indicateur étant réprimée par des protéines régulatrices sous forme d'hétérodimères via leur site de fixation à l'ADN, chaque monomère de ces hétérodimères étant tel qu'il reconnaisse spécifiquement l'un la séquence comportant la mutation 1, l'autre la séquence qui est à l'état sauvage, ou qui est muté de façon silencieuse ou qui comporte une mutation 2, les homodimères susceptibles d'être fournis à partir de chacun des monomères étant incapables de réprimer la transcription du susdit gène indicateur,
- et des hétérodimères dont les monomères les constituant (respectivement premier monomère et deuxième monomère) sont impliqués entre eux dans une interaction protéine/protéine :
1) le premier monomère étant tel qu'il contient une première protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence de l'opérateur muté contenant la mutation 1 , le susdit site de fixation étant fusionné à l'une des deux protéines ou à l'un des deux domaines protéiques, impliqué(e) dans les susdites interactions,
2) le deuxième monomère étant tel qu'il contient une deuxième protéine de fusion contenant le site de fixation à l'ADN d'une protéine régulatrice susceptible de reconnaître spécifiquement la séquence non mutée, ou mutée de façon silencieuse ou comportant la mutation 2 de l'opérateur muté, le susdit site de fixation étant fusionné à l'autre des deux protéines ou à l'autre des deux domaines protéiques, impliqué(e) dans les susdites interactions.
7. Complexe selon la revendication 6, caractérisé en ce que :
- la séquence d'ADN est telle que définie selon l'une quelconque des revendications 3 à 5, et en ce que
- les hétérodimères contiennent :
1) un monomère contenant une première protéine de fusion contenant le site de fixation à l'ADN de LexA muté ou d'un fragment muté de LexA reconnaissant la séquence de l'opérateur muté contenant la mutation 1, lequel site de fixation est fusionné avec une protéine déterminée ou un fragment protéique déterminé susceptible d'être impliqué dans une interaction selon la revendication 1 , laquelle protéine ou lequel domaine protéique contient par exemple un domaine d'activation ou de dimérisation,
2) un monomère contenant une deuxième protéine de fusion contenant le site de fixation à l'ADN de LexA sauvage, ou porteur d'une mutation silencieuse ou d'une mutation 2 ou d'un fragment de LexA reconnaissant la séquence non mutée de .LexA ou mutée de façon silencieuse ou comportant une mutation 2, lequel site de fixation est fusionné avec une protéine déterminée ou un fragment protéique déterminé, contenant par exemple une protéine ou un domaine protéique susceptible d'interagir avec la protéine ou le fragment protéique défini en 1) ou avec les susdits domaines d'activation ou de dimérisation.
8. Hôte cellulaire contenant une séquence d'ADN selon la revendication 2.
9. Procédé pour détecter et quantifier des interactions entre deux protéines ou fragments de protéines, caractérisé
- en ce que l'on met en présence des séquences nucléotidiques codant respectivement pour le premier et le deuxième monomère contenant respectivement une première et une deuxième protéine de fusion telle que définie dans la revendication 1, avec une séquence d'ADN selon l'une quelconque des revendications 2 à 5, et
- en ce que l'on détecte l'éventuelle répression de la transcription du gène indicateur tel que défini à la revendication 1, notamment par transfection d'un hôte cellulaire selon la revendication 8, avec des vecteurs contenant, d'une part, les susdites séquences nucléotidiques codant respectivement pour le premier et le deuxième monomère contenant respectivement la première et la deuxième protéine de fusion et, d'autre part, les éléments nécessaires à l'expression des susdits monomères.
10. Procédé pour identifier une protéine interagissant avec une protéine déterminée, caractérisé
- en ce que l'on met en présence les éléments suivants :
. une séquence nucléotidique codant pour un premier monomère contenant une première protéine de fusion entre, d'une part, une protéine régulatrice selon la revendication 1 et, d'autre part, la protéine déterminée,
. une banque génomique, contenant notamment des fragments d'ADN, et notamment d'ADNc, chacun étant susceptible de coder pour une protéine interagissant avec la protéine déterminée, chacun des différents éléments de la banque génomique étant respectivement fusionné à la séquence codant pour une protéine régulatrice selon la revendication 1 ,
. une séquence d'ADN selon l'une quelconque des revendications 2 à 5, et
- en ce que l'on détecte l'éventuelle répression de la transcription de la séquence nucléotidique codant pour une protéine indicatrice selon la revendication 1 , notamment par transfection d'un hôte cellulaire selon la revendication 8, d'une part, avec un vecteur contenant la séquence nucléotidique codant pour le susdit premier monomère contenant la première protéine de fusion et, d'autre part, un ensemble de vecteurs contenant une séquence nucléotidique codant pour un deuxième monomère contenant une deuxième protéine de fusion, chaque séquence nucléotidique codant pour chaque deuxième monomère contenant la séquence nucléotidique codant pour la protéine régulatrice selon la revendication 1, et en aval de celle-ci l'un des éléments d'ADN de la susdite banque, tous les vecteurs contenant en outre les éléments nécessaires à l'expression des susdits monomères.
PCT/FR1997/001133 1996-07-04 1997-06-25 Systeme de detection des interactions proteine-proteine Ceased WO1998001579A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP97930586A EP0909331A1 (fr) 1996-07-04 1997-06-25 Systeme de detection des interactions proteine-proteine

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9608337A FR2750705B1 (fr) 1996-07-04 1996-07-04 Systeme de detection des interactions proteine-proteine
FR96/08337 1996-07-04

Publications (1)

Publication Number Publication Date
WO1998001579A1 true WO1998001579A1 (fr) 1998-01-15

Family

ID=9493710

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR1997/001133 Ceased WO1998001579A1 (fr) 1996-07-04 1997-06-25 Systeme de detection des interactions proteine-proteine

Country Status (3)

Country Link
EP (1) EP0909331A1 (fr)
FR (1) FR2750705B1 (fr)
WO (1) WO1998001579A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8383589B2 (en) 2007-07-09 2013-02-26 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Aegyptin and uses thereof

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2861742B1 (fr) * 2003-10-31 2006-02-24 Centre Nat Rech Scient LIGANDS DU REPRESSEUR MYCOBATERIEN EthR, PROCEDES DE SELECTION ET APPLICATIONS
FR2861745A1 (fr) * 2003-10-31 2005-05-06 Centre Nat Rech Scient Ligands du repressseur mycobacterien ethr, procedes de selection et applications

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5283173A (en) * 1990-01-24 1994-02-01 The Research Foundation Of State University Of New York System to detect protein-protein interactions
WO1994010307A1 (fr) * 1992-10-29 1994-05-11 Medical Research Council Facteur de transcription dp-1

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5283173A (en) * 1990-01-24 1994-02-01 The Research Foundation Of State University Of New York System to detect protein-protein interactions
WO1994010307A1 (fr) * 1992-10-29 1994-05-11 Medical Research Council Facteur de transcription dp-1

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
COLE: "Characterisation of the promoter ....", MOLECULAR & GENERAL GENETICS, vol. 189, no. 3, 1983, BERLIN, pages 400 - 404, XP000197163 *
FEILDS ET AL.: "The two-hybrid system : an assay ....", TRENDS IN GENETICS, vol. 10, no. 8, August 1994 (1994-08-01), pages 286 - 292, XP000647708 *
LITTLE ET AL.: "Deletions within a hinge region ....", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCE USA, vol. 82, April 1985 (1985-04-01), WASHINGTON DC, pages 2301 - 2305, XP000647703 *
OERTEL-BUCHHEIT ET AL.: "Genetic analysis of the LexA repressor: ....", MOLECULAR & GENERAL GENETICS, vol. 223, 1990, BERLIN, pages 40 - 48, XP000647715 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8383589B2 (en) 2007-07-09 2013-02-26 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Aegyptin and uses thereof
US8980859B2 (en) 2007-07-09 2015-03-17 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Aegyptin and uses thereof
US9441022B2 (en) 2007-07-09 2016-09-13 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Aegyptin and uses thereof

Also Published As

Publication number Publication date
FR2750705A1 (fr) 1998-01-09
FR2750705B1 (fr) 1998-10-30
EP0909331A1 (fr) 1999-04-21

Similar Documents

Publication Publication Date Title
US20040146931A1 (en) Methods and compositions for interaction trap assays
US20090130676A1 (en) Interaction trap systems for detecting protein interactions
CA2274608C (fr) Systeme procaryote a deux hybrides
US6333154B1 (en) Bacterial multi-hybrid system and applications thereof
NZ502795A (en) Method of identifying molecular interactions employing counterselection and at least two hybrid molecules or two hybrid systems
WO2012125445A2 (fr) Intéines dépendantes de petite molécule et leurs utilisations
US5322801A (en) Protein partner screening assays and uses thereof
Ladant et al. Genetic systems for analyzing protein–protein interactions in bacteria
US6399296B1 (en) Interaction trap systems for detecting protein interactions
Hays et al. Two-hybrid system for characterization of protein-protein interactions in E. coli
WO1998001579A1 (fr) Systeme de detection des interactions proteine-proteine
US6326150B1 (en) Yeast interaction trap assay
EP2190989B1 (fr) Procédé de fabrication d&#39;un peptide modifié
WO1991016456A1 (fr) Techniques de triage de composes inhibant la liaison de c-myc a l&#39;adn
FR2734567A1 (fr) Proteines chimeriques activant la transcription par la polymerase iii, leur utilisation pour la detection et l&#39;analyse des interactions entre proteines, et genes codant pour lesdites proteines
Maier et al. Quantitative real-time PCR as a sensitive protein–protein interaction quantification method and a partial solution for non-accessible autoactivator and false-negative molecule analysis in the yeast two-hybrid system
US20040029223A1 (en) Bacterial two-hybrid system for protein interaction screening
EP1198586A1 (fr) Selection in vivo bibliotheque contre bibliotheque d&#39;interactions proteine-proteine optimisees
Ozawa et al. Peptide assemblies in living cells. Methods for detecting protein-protein interactions
Finley Jr et al. Two-hybrid analysis of genetic regulatory networks
van der Ploeg et al. Chapter In vivo bacterial morphogenetic protein interactions
Chibi A yeast 2-hybrid screen to identify and characterize interaction partners of the cancer associated protein Retinoblastoma binding protein 6
Möckli Development of a split-ubiquitin based, cytosolic yeast two-hybrid system and its application to the structure-function analysis of scUri1p
Damianidi Deciphering of the interactome of the oncogenic viral protein HTLV1-Tax
ETH Development of split-ubiquitin based

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH DE DK ES FI FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1997930586

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1997930586

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 09214299

Country of ref document: US

WWW Wipo information: withdrawn in national office

Ref document number: 1997930586

Country of ref document: EP