[go: up one dir, main page]

WO2016016358A1 - Targeting of non-viral integrative vectors in the nucleolar dna sequences of eukaryotes - Google Patents

Targeting of non-viral integrative vectors in the nucleolar dna sequences of eukaryotes Download PDF

Info

Publication number
WO2016016358A1
WO2016016358A1 PCT/EP2015/067472 EP2015067472W WO2016016358A1 WO 2016016358 A1 WO2016016358 A1 WO 2016016358A1 EP 2015067472 W EP2015067472 W EP 2015067472W WO 2016016358 A1 WO2016016358 A1 WO 2016016358A1
Authority
WO
WIPO (PCT)
Prior art keywords
viral
nucleolus
vector
interest
nucleolar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/EP2015/067472
Other languages
French (fr)
Inventor
Yves Bigot
Guillaume CARPENTIER
Sophie CASTERET
Benoit PIEGU
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Institut National de la Recherche Agronomique INRA
Original Assignee
Centre National de la Recherche Scientifique CNRS
Institut National de la Recherche Agronomique INRA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National de la Recherche Scientifique CNRS, Institut National de la Recherche Agronomique INRA filed Critical Centre National de la Recherche Scientifique CNRS
Publication of WO2016016358A1 publication Critical patent/WO2016016358A1/en
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases [RNase]; Deoxyribonucleases [DNase]
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0025Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/50Vectors comprising as targeting moiety peptide derived from defined protein
    • C12N2810/60Vectors comprising as targeting moiety peptide derived from defined protein from viruses
    • C12N2810/6045RNA rev transcr viruses
    • C12N2810/6054Retroviridae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/34Vector systems having a special element relevant for transcription being a transcription initiation element
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/80Vector systems having a special element relevant for transcription from vertebrates
    • C12N2830/85Vector systems having a special element relevant for transcription from vertebrates mammalian

Definitions

  • non-viral integrative vectors are vectors comprising sequences that can be integrated into the genome. This integration generally requires the intervention of enzymes capable of catalyzing or stimulating the integration of the sequence of interest into the DNA.
  • non-viral vector / integrative enzyme systems which operate according to various mechanisms. By way of example, it is possible to cite the transposable elements (TE), including transposons and retro-transposons, which allow the integration of sequences of interest when they are coupled to recombinases such as transposases or integrases. .
  • TE transposable elements
  • retro-transposons which allow the integration of sequences of interest when they are coupled to recombinases such as transposases or integrases.
  • plasmid / nuclease systems in which the enzyme stimulates the integration of the sequence of interest by homologous recombination.
  • transposable elements or mobile genetic elements (EGMs) are small DNA fragments that are able to move from one chromosomal site to another.
  • TE transposable elements
  • ECMs mobile genetic elements
  • ITRs inverted repeat sequences
  • Transposons have been identified in both prokaryotes and eukaryotes. In prokaryotes, a large number of transposons have been listed to date. Include, for example, insertion sequences such as IS1, and transposons, such as Tn5. In eukaryotes, class II elements comprise ten families: P, PiggyBac (including the Pokey transposon), hAT, helitron, Harbinger, En / Spm, Mutator, Transib, Pogo and IS630-Tc1 -mariner (including Sleeping Beauty).
  • Plasmid / nuclease systems are also routinely used to transfer genes of interest into the genome of eukaryotic cells in a targeted manner. These systems are, like the transposon / transposase systems, bipartite systems which generally comprise a plasmid whose sequence is defined so as to favor the transposition of a transgene by homologous recombination, and a nuclease of the meganuclease type, Zinc finger nuclease, TALEN, or CRISPR / Cas9 to specifically target integration to a chromosomal site at a high frequency.
  • bipartite systems which generally comprise a plasmid whose sequence is defined so as to favor the transposition of a transgene by homologous recombination, and a nuclease of the meganuclease type, Zinc finger nuclease, TALEN, or CRISPR / Cas9 to specifically target integration to a chromosomal
  • the principle of targeting these latter vectors is therefore based on the ability of cleavage of DNA at specific sites by the nucleases in question. This cleavage stimulates homologous recombination close to these sites, thus allowing the integration of exogenous sequences.
  • the molecular bases governing the link between the structure of these nucleases and the sites they recognize have been well studied. It is now possible with these systems to produce nucleases in a manner specifically targeting the DNA sequences in which integration is desired.
  • RNAs are privileged sites for optimal expression of transgenes in eukaryotes.
  • these sequences have the advantage of being grouped spatially at the level of the nucleolus, in specific genomic regions comprising, inter alia, clusters of repeated sequences (genes coding for the 5S, 5.8S, 18S and 28S rRNAs). .
  • the insertion of nucleic acid molecules into these regions is less likely to give rise to deleterious mutations.
  • Such an integration site has already been evaluated in the context of techniques without any link with the implementation of a transposable tool.
  • the means and methods of the invention make it possible to solve this technical problem in a simple and elegant manner, easy to implement and with integration rates in the targeted sites of particular interest.
  • Figure 1 Analysis of the quality of PNA plasmid complexes by agarose gel delay. All digestions were deposited on 1% agarose gel, 1 XTAE, 1 X GelRed. Well 1: Hindlll digested ⁇ DNA size marker; Well 2: BamHI / SpeI digested pBS-PB-PNABS-pPol1 h-NeoR-pASV40; Well 3: [pBS-PB-PNABS-pPol1h-NeoR-pASV40 / PNA-NoLS] complex hybridized in excess of X60 to oligonucleotide and then digested with BamHI / SpeI.
  • Figure 2 Epifluorescence microscopy analysis of HeLa cells transfected for 24 hours with YOYO-1 stained [plasmid / PNA-NoLS] complexes.
  • A epifluorescence observation of DNA-PEI complexes;
  • B white light localization of nucleoli in nuclei;
  • C the fusion of the two images (epifluorescence and white light) makes it possible to visualize the concentration of fluorescence in the nucleoli.
  • Figure 3 Epifluorescence microscopy analysis of HeLa cells transfected for 24 hours with PB-GFP.
  • FIG. 4 Epifluorescence microscopy analysis of HeLa cells transfected for 24 hours with NoLS PB-GFP.
  • A The nucleoli appear as zones fluorescent in the nucleus due to the presence of NoLS PB-GFP.
  • B Nucleolar localization controls fished at DsREd.
  • C The fusion of the two images reveals that the NoLS-PB transposase is actively internalized in the nucleoli.
  • the controls were obtained with an empty plasmid pCS2 as a negative source of transposase.
  • Figure 6 Percentage of different vector insertion events located in the chromosomal DNA of the nucleoplasmic nuclear compartment.
  • Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively.
  • the combinations of plasmids and RNA are indicated on the ordinate.
  • the gray bars indicate the percentage of loci affected by a vector insertion in this compartment.
  • the black bars indicate the percentage of sequences describing a vector insertion in this compartment.
  • the two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration.
  • Figure 7 Percentage of different vector insertion events located in the chromosomal DNA of the LAD nuclear compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration.
  • Figure 8 Percentage of different vector insertion events located in the chromosomal DNA of the nucleoplasmic nuclear compartment.
  • Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively.
  • the combinations of plasmids and RNA are indicated on the ordinate.
  • the gray bars indicate the percentage of loci affected by a vector insertion in this compartment.
  • the black bars indicate the percentage of sequences describing a vector insertion in this compartment.
  • the two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration.
  • Figure 9 Percentage of different vector insertion events located in the chromosomal DNA of the LAD nuclear compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration.
  • Figure 10 Percentage of different vector insertion events located in the chromosomal DNA of the nucleolar compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration.
  • Figure 1 1 Percentage of different vector insertion events located in the NAD regions contained in the nucleolar compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration.
  • Figure 12 Percentage of different vector insertion events located in the flanking regions of the boundary rDNAs in the nucleolar compartment.
  • Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively.
  • the combinations of plasmids and RNA are indicated on the ordinate.
  • the gray bars indicate the percentage of loci affected by a vector insertion in this compartment.
  • the black bars indicate the percentage of sequences describing a vector insertion in this compartment.
  • the two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration.
  • Figure 1 3 Percentage of different vector insertion events located in the rDNAs contained in the nucleolar compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration.
  • Figure 14 Efficacy of the IPCR to detect vectors inserted in the 3 main nuclear compartments, nucleoplasm, LAD, and nucleoli. The ordinate shows the results obtained with 8 molecular vector combinations.
  • Figure 15 Efficacy of LAM-PCR to detect vectors inserted in the 3 major nuclear compartments, nucleoplasm, LAD, and nucleoli. The ordinate shows the results obtained with 8 molecular vector combinations.
  • the inventors have developed a bi-partite molecular system for the integration of nucleic acid molecules of interest in the regions of the genome forming the nucleolus.
  • the molecular system of the inventors allows specific site integration in eukaryotic host cells, more particularly in the chromosomal regions associated with the nucleolus. Since the nucleolus is the most active transcription site of the nucleus, the sequences integrated thanks to the molecular system of the invention are stably expressed in time.
  • the molecular system of the invention comprises on the one hand a non-viral integrative vector, devoid of enzymatic activity allowing its integration into the genome, and, on the other hand, an enzyme allowing this integration.
  • This enzyme can thus be, for example, and depending on the type of integrative vector chosen, a recombinase, a transposase, an integrase, a nuclease.
  • the molecular system of the invention is particularly original in that both of these elements, both the non-viral integrative vector and the functional recombinase source, both possess the ability to localize near the targeted sites.
  • the inventors have developed molecular tools, in particular non-viral integrative vectors and functional recombinase sources (ie recombinases as well as their functional equivalents), localizing in the cell nucleus, and even in the nucleolus. .
  • This specific localization of the means of the molecular system of the invention makes it possible to dramatically increase the rate of integration into chromosomal regions associated with the nucleolus.
  • the inventors have designed in particular specific non-viral integrative vectors, whose ability to localize the nucleus and more particularly the nucleolus relies on the use of NoLS peptide localization signals.
  • NoLS localization signals are peptides conventionally used to allow the localization of peptides and proteins. It is therefore surprising to use this type of tool to locate molecules such as vectors, which are polynucleotides.
  • the use of such a technical solution may seem counterintuitive. Indeed, its implementation requires the development of additional connecting elements, for grafting the integrative non-viral vector to the NoLS location signal, which can make it a priori complex.
  • the nonviral integrative vectors of the invention are found to be particularly effective at integrating nucleic acid sequences of interest into the chromosomal regions constituting the nucleolus.
  • the invention firstly relates to a molecular system for integrating a nucleic acid molecule of interest into a chromosomal region associated with the nucleolus, comprising at least:
  • molecular system in the sense of the invention a set of molecular biology means. Within the meaning of the invention, these means are in particular adapted to the integration of nucleic acid molecules of interest within a chromosomal region. More particularly, within the meaning of the invention, the means of the molecular system according to the invention comprise at least (a) a non-viral integrative vector and (b) a functional recombinant enzyme source or a source of a functional equivalent of it.
  • the various enzymes referred to by the invention will be referred to hereinafter by their functional character, by grouping them under the terms "source of functional recombinase", it being understood that this source may consist of a recombinase. as such, or a functional equivalent, such as for example an integrase, a transposase or a nuclease.
  • the term “functional recombinase source” is intended to mean an enzyme source capable of fulfilling the same function as a recombinase.
  • the terms "activity”, “function”, “biological activity” and “biological function” are equivalent and correspond to the usual meaning in the technical field of the invention.
  • the recombinase included in the molecular system according to the invention is considered “functional” if it is able to catalyze the process of integration of the exogenous nucleotide sequence (s) of interest in the target chromosomal region.
  • recombinase of interest is "functional" within the meaning of the invention, by in vitro tests well known in the art.
  • This type of assay consists of performing a biochemical analysis of the binding and cleavage activities at the ends of the DNA by the recombinase as well as the analysis of the capacity of the recombinase to transfer DNA strands.
  • a nuclease one skilled in the art can easily verify that the enzyme of interest is functional by in vitro tests of specificity of DNA cleavage.
  • the functional recombinase source is preferably selected from transposases, nucleases, integrases and recombinases.
  • one skilled in the art will be able to choose, from among the various available enzymes, the one that will be best adapted to the integration of the sequence of interest, for example as a function of the non-viral integrative vector used.
  • the non-viral integrative vector is a transposon or pseudo-transposon
  • those skilled in the art can preferably choose a transposase to allow the transposition of the sequence of interest.
  • the functional recombinase source is a transposase.
  • the transposase according to the invention is chosen from the family of transposases DD [E / D], which notably comprises the transposases resulting from the transposons Sleeping Beauty, Prince Frog, MuA, Mos-1, Pokey, PiggyBac, Tol2, Tn3, Tn5, Tn7, Tn10, and Hermes.
  • This family of transposases has been described in detail in Nesmelova et al. (Adv Drug Deliv Rev.; 30; 62 (12): 1,187-95; 2010).
  • the integrase according to the invention is chosen from integrases of lentivirus or retrovirus.
  • the recombinase according to the invention is chosen from phage recombinases (such as for example PhiC31).
  • the nuclease according to the invention is chosen from the TALEN nucleases (for "Activator-Like Transcription (TAL) Effector Nudeoses"), or the zinc finger nucleases (ZFNs, for "Zinc-finger nucleases”), the meganuclease , or the Cas9 nucleases (used in the CRISPR / Cas9 system).
  • telomere source located in the nucleolus of the cell nucleus is meant within the meaning of the invention that the source of recombinase according to the invention is associated with a molecular system for its location in the nucleolus of the cell nucleus.
  • locating in the nucleolus of the cell nucleus means that the “functional recombinase source” molecules, whether transposases, nucleases, recombinases or integrases, are actively located in the eukaryotic cell of so that a very large majority of them, if not all, are in the nucleolus of the cell nucleus. This addressing of the molecules is easily followed, in particular by standard fluorescence microscopy techniques.
  • the cell nucleus is easily detectable in eukaryotic cells, and can in particular be observed by microscopy via a large number of usual techniques.
  • the nucleolus is an organelle devoid of membrane. Despite this, the nucleolus is individualized in the cell nucleus and the molecular exchanges are active and strictly regulated, and refractory to the diffusion of biological macromolecules.
  • the nucleolus is most often basophilic and therefore visible in light microscopy via basic dyes (Pyronine in red and Giemsa blue). It can be observed more precisely by using electron microscopy. The localization of the recombinase in the nucleolus of the cell nucleus is thus easily evaluable.
  • the functional recombinase source according to the invention comprises a nucleolar localization pattern or signal, or NoLS, which allows its localization to the nucleolus.
  • the functional recombinase source is provided in addition to the non-viral integrative vector, that is to say that it is provided under a distinct form of the nonviral integrative vector.
  • the functional recombinase source is provided in trans via an expression plasmid that will express the protein in the cell, or via a messenger RNA.
  • the source of functional recombinase can be provided in trans in the form of a protein, for example an isolated native protein, or, preferably, a purified recombinant protein.
  • Expression plasmids and / or recombinant proteins can be produced according to methods of molecular engineering and production of conventional recombinant proteins, well known to those skilled in the art.
  • non-viral integrative vector is intended to mean a vector in which all or part of the nucleotide sequence is intended to integrate into the genome.
  • non-viral integrative vectors comprise, for example, derivatives of mobile genetic elements such as transposons or pseudo-transposons, but also plasmids whose sequence is defined so as to favor the transposition of a transgene. by homologous recombination stimulated by a nuclease whose cut is specific.
  • transposons the integration of the nucleotide sequence is generally stimulated by the transposase for which they encode.
  • the integration of the nucleotide sequence is generally stimulated by a meganuclease, Zinc finger nuclease, TALEN, or CRISPR / Cas9 nuclease.
  • the integration of the nucleotide sequence is stimulated by the recombinase provided in trans.
  • the term "pseudo-transposon” is intended to mean a transposon devoid of the transposase activity.
  • the pseudo-transposon is a transposon whose gene encoding the original transposase has been deleted or mutated by molecular biology techniques.
  • a pseudo-transposon therefore has the ends ITR and UTR but is devoid of the transposase activity. It has therefore lost the ability to transpose, except to be associated with an external transposase activity (provided in trans).
  • the pseudo-transposon of the invention is a transposon devoid of the transposase activity, and chosen from the transposons Sleeping Beauty, Frog Prince, piggy Bac, MuA, Mos-1, Himarl, Hsmarl, Pokey, Tol2, Tn3, Tn5, Tn7, Tn10, and Hermes and their derivatives.
  • the pseudo-transposon of the invention is a transposon devoid of the transposase activity chosen from piggyBac and its derivatives.
  • non-viral integrative vector located in the nucleolus of the cell nucleus is meant within the meaning of the invention that the non-viral integrative vector according to the invention has, or is associated with, a molecular system allowing its active localization in the nucleolus of the cell nucleus.
  • located in the cell nucleus it is meant that the non-viral integrative vector molecules are localized in the eukaryotic cell such that a majority or all of them are in the core nucleolus. cellular. This majority localization of the molecules is easily identifiable, in particular by standard fluorescence microscopy techniques.
  • the inventors have determined that the most effective molecular signal for targeting the non-viral integrative vector into the nucleolus of the cell nucleus, and thus to promote the integration of the nucleic acid molecule of interest into an associated chromosomal region. to the nucleolus is, in a particularly surprising manner, the nuclear localization signal NoLS.
  • the non-viral integrative vector according to the invention comprises a nucleolar localization pattern, or NoLS, which allows its active localization in the nucleolus of the cell nucleus.
  • said non-viral integrative vector is localized to the nucleolus and / or said source of recombinase is localized to the nucleolus via a NoLS nucleolar localization signal.
  • the nucleolar localization signal NoLS is a peptide of sequence SEQ ID No.1: RQARRNRRRRWRERQRQI.
  • non-viral integrative vector according to the invention has, or is associated with, a NoLS peptide.
  • the NoLS location signal is a peptide; it is therefore composed of amino acids.
  • the non-viral integrative vector is conventionally a molecule consisting of nucleic acids.
  • the association of the non-viral integrative vector according to the invention with the NoLS localization signal is effected by means of a link element allowing a chemical or biochemical anchoring.
  • the molecular system of the invention further comprises a binding element of said NoLS localization signal to said non-viral integrative vector.
  • this connecting element is coupled to the NoLS location signal.
  • the binding element according to the invention is capable of hybridizing to the non-viral integrative vector, in particular to form a triple helix.
  • any molecule capable of hybridizing to a DNA molecule and capable of being coupled to a peptide may be used as a binding element.
  • hybridization is meant the process in which, under appropriate conditions, two polynucleotides, for example a polynucleotide and an oligonucleotide, bind with stable and specific hydrogen bonds to form a double-stranded complex.
  • a molecule is "able to hybridize with a DNA molecule” if said molecule forms a complex with the DNA molecule under stringent conditions, as defined generally accepted in the art.
  • the hybridization of two polynucleotides can be complete (the double-stranded complex obtained during this hybridization comprises only AT bonds and CG bonds), or partial (the double-stranded complex obtained comprises bases not linked to a complementary base) . hybridization between two polynucleotides depends on the operating conditions.
  • the hybridization temperature is between about 20 and 70 ° C, in particular between 35 and 65 ° C in a saline solution at a concentration of about 0, 5 to 1 M.
  • DNA binding protein domains Numerous DNA binding protein domains have already been described, such as, for example, LexA DNA binding domains (Schnarr et al., 1988, Oertel-Buchheit et al., 1993), N57SB10 (Izsvak). et al., 2002), and pZFD bcr abl (Me Namara et al., 2000).
  • the non-viral integrative vector comprises a sequence for the hybridization of the binding element.
  • the binding element according to the invention is a triplex-forming oligonucleotide (OFT), preferably chosen from the group of PNAs (peptide nucleic acids), LNAs (locked nucleic acids), PNA hybrids: PNA (“bisPNA”) and LNA hybrids: LNA (“Zorro LNA”).
  • OFT triplex-forming oligonucleotide
  • PNAs peptide nucleic acids
  • LNAs locked nucleic acids
  • PNA hybrids PNA
  • PNA hybrids PNA
  • LNA hybrids LNA
  • Zorro LNA LNA
  • the link element is a bisPNA coupled to the NoLS localization signal.
  • peptide nucleic acids for "peptide nucleic acids”
  • PNAs for "peptide nucleic acids”
  • their derivatives have the particular advantage of having a high affinity for DNA or RNA. This high affinity makes it possible to obtain a strong hybridization with the target DNA, in this case the pseudo-transposon DNA, including with the small peptide nucleic acids.
  • peptide nucleic acids are synthetic molecules that do not exist in the natural state, and are not recognized by nucleases or proteases. These molecules are therefore particularly resistant to enzymatic degradation.
  • the molecular system for locating the non-viral integrative vector to the nucleolus comprises a bisPNA binding element coupled to a NoLS location signal, said bisPNA link element coupled to said NoLS location signal having sequence: KKKLLTTCTTCTTTTLLLTTTTCTTCTTLLLKKKRQARRNRRRRWRERQRQI, wherein K, L, I, R, Q, A, N, W and E are amino acids, C and t are nucleotides.
  • the coupling between the linking element and the localization signal can easily be achieved via molecular biology techniques known to those skilled in the art, such as, for example, hybridization by TACH (for "Temperature-Assisted Cyclic Hybridization”). ", Detailed in Oprea et al., Mol e / oted7no /.; 45 (2): 171 -9; 2010).
  • chromosomal region is intended to mean a chromosome portion of variable size.
  • the chromosomal regions within the meaning of the invention may in particular comprise all or part of the chromosomal regions p and q (otherwise called “p-arm” and “q-arm” of the chromosomes) as conventionally defined in cell biology, although are not limited to these.
  • the nucleolus comprises different types of chromosomal regions, and especially NORs (for Nucleolus Organizer Re ion) which are chromosomal regions which participate in the formation of the nucleolus.
  • NORs include several tandem copies of genes encoding ribosomal RNAs, as well as nucleolus associated domains (or Nucleolus-Associated Chromatin Domains, NADs). These domains and regions have been described in Nemeth et al. (PLoS Genet 6: e1000889, 2010) and in Stults et al. (Genome Res 18: 13-18, 2008).
  • chromosomal region associated with the nucleolus is preferably understood to mean a region comprising an organizing region of the NOR nucleolus.
  • NORs have been identified in a large number of mammals. In humans, NORs contain genes for 5.8S, 18S and 28S rRNAs and are localized on the short arms of chromosomes 13, 14, 15, 21 and 22 (in other words, on the p-arms of acrocentric chromosomes). Sequences coding for 18S ribosomal RNA from more than 270,000 living species are listed in the Ribosomal dotabase project database and can be consulted at rdp.cme.msu.edu.
  • NORs can be localized indirectly, by identifying these regions by the technique of in situ hybridization (FISH) on mitotic chromosomes.
  • FISH in situ hybridization
  • NORs can be identified by karyotype following silver staining.
  • those skilled in the art can easily identify the chromosomal regions associated with the nucleolus and verify the effectiveness of the molecular system of the invention, regardless of the species of origin of the eukaryotic cell in which it is desired to perform the insertion. of the sequence of interest.
  • the term "integration" means the recombination process leading to the insertion of one molecule of nucleic acid into another.
  • the molecular system is capable of leading to the integration of said nucleic acid molecule of interest into the chromosomal target region of said eukaryotic host cell, namely in a chromosomal region associated with the nucleolus.
  • the term "eukaryotic host cell” is intended to mean a host cell comprising an individualized nucleus.
  • the eukaryotic host cell is chosen from fungi, plant and animal cells.
  • the term “animals” includes members of the animal kingdom, and in particular mammals, in particular humans.
  • nucleic acid molecule of interest is meant within the meaning of the invention any molecule of nucleic acid whose introduction into the genome of the cell Ekaryote according to the invention is desirable, such as for example a nucleic acid molecule coding for an RNA or a peptide whose expression is desired, preferably stable, or a nucleic acid molecule inducing a mutation of interest. .
  • the nucleic acid molecule is a gene, in particular a therapeutic gene, functional (we can speak of "transgene”).
  • therapeutic gene is meant that the gene itself or its expression product is of therapeutic interest.
  • a gene is said to be “functional” if the corresponding nucleotide sequence codes for an RNA, such as, for example, a structural RNA, a nucleic enzyme (RNAseP, ribozyme), an RNA involved in the mechanisms of the Interfering RNA (miRNA, shRNA), or code for a peptide.
  • the therapeutic gene encodes a peptide if it comprises at least one open reading frame (ORF), that is to say a coding sequence, capable of giving rise to an amino acid sequence presenting a therapeutic activity.
  • the functional therapeutic gene may be a gene of wild or mutated interest, that is to say a wild-type gene comprising one or more mutations, provided that the product of the mutated gene retains a therapeutic activity.
  • coding sequences devoid of their promoter are also encompassed.
  • the nucleic acid molecule of interest may be an antibiotic resistance gene, devoid of its promoter or not (for example, the neomycin resistance gene), or any other appropriate selection marker.
  • the nucleolus is the preferred site for the synthesis of ribosomal RNA molecules, and essentially comprises type I RNA polymerase molecules.
  • type I RNA polymerase molecules essentially comprises type I RNA polymerase molecules.
  • a “mutation” is in accordance with the usual meaning of biotechnology.
  • a mutation may be a substitution, addition or deletion of one or more bases in a nucleotide sequence, or one or more amino acids in a protein sequence.
  • a “mutation” can in particular designate a substitution of at least one base of a codon of a nucleotide sequence, said substitution resulting for example, during the translation of the nucleotide sequence in question, the incorporation of a different amino acid instead and place of the native amino acid in the resulting protein sequence.
  • the mutation (s) cause (s) no loss of the biological function of the mutated product.
  • a decrease in activity may possibly be tolerated.
  • a “genetic modification” is equivalent to one or more mutations. If a coding sequence is genetically modified, then, typically, it contains one or more mutations.
  • This lability can be used to prevent an untimely spread of transgenes. However, it may be desirable in some cases to stabilize transgene integration over time.
  • RNA polymerase I RNA polymerase II
  • RNA polymerase II RNA polymerase II
  • This feature is of particular interest in the context of the use of targeted vectors in the nucleolar regions.
  • the non-viral integrative vector according to the invention comprises a reporter gene whose expression depends on a promoter of the type I RNA polymerase.
  • the expression of this first reporter gene, which depends on type I RNA polymerase may subsequently be used to select cells in which the molecular system of the invention has effectively integrated the target site, namely the nucleolus.
  • the expression of this first reporter gene, which depends on the type I RNA polymerase may later be used to perform a "positive selection".
  • the non-viral integrative vector according to the invention comprises a reporter gene whose expression depends on a type II RNA polymerase promoter.
  • this second reporter gene which depends on type II RNA polymerase, may later be used to remove cells in which the transgene has integrated in a region other than the nucleolus.
  • the expression of this second reporter gene which depends on type II RNA polymerase, may subsequently be used to perform a "negative selection".
  • the gene encoding the thymidine kinase of human herpesvirus 1, which will make the clone susceptible to selection by ganciclovir, or else a gene encoding a fluorescent protein, which will make it possible to sort the gene, may be used as a negative selection gene. clones by flow cytometry.
  • the non-viral integrative vector according to the invention comprises a reporter gene whose expression depends on a type I RNA polymerase promoter and a reporter gene whose expression depends on a promoter of type II RNA polymerase.
  • the inventors have developed a method, implementing the transposition systems of the invention, and making it possible to increase very significantly the level of eukaryotic cells actually genetically modified by the integration of sequences of interest at the level of the nucleolus.
  • the method of the invention is based on the selection of characteristics of interest by simple methods that are simple and quick to implement, and which contribute to stabilizing the integration of the transgene over time.
  • the invention also relates to a method of genetic modification of at least one eukaryotic host cell, comprising:
  • step b) The selection of cells of step a), in which the nucleic acid molecule of interest is expressed;
  • step b) The selection of cells of step b), wherein the non-viral integrative vector is specifically integrated into a chromosomal region associated with the nucleolus.
  • the method of the invention refers to the host cell as previously defined in the present application.
  • the introduction of the transposition system into the eukaryotic host cell can be done according to any usual technique known to those skilled in the art.
  • the usual techniques notably include calcium phosphate transfection, liposome transfection, polycationic agent transfection, DEAE-Dextran, electroporation, and the particular properties of reagents such as GeneCellin and PEI Jet. or the copolymer blocks.
  • the eukaryotic host cell may be transfected simultaneously or separately with the non-viral integrative vector and the recombinase, and preferably with a linker coupled to the NoLS location signal.
  • the non-viral integrative vector (with or without the linking element coupled to the NoLS localization signal) and the recombinase may be transfected together or separately.
  • step a) can be carried out according to conventional methods, for example if the non-viral integrative vector comprises a reporter gene, by selecting the cells expressing this reporter gene.
  • the reporter gene genes for resistance to specific antibiotics, or genes encoding easily observable proteins (fluorescence, detectable enzymatic activity).
  • the cells will be selected according to the expression of a gene allowing positive selection.
  • the cells selected at the end of step b) are those that express the gene allowing positive selection.
  • the reporter gene is an antibiotic resistance gene
  • the use of this antibiotic will allow the selection of clones in which the nucleotide sequence of interest is expressed.
  • step b) can be carried out again according to conventional methods, for example if the non-viral integrative vector comprises a reporter gene whose expression depends on a type II RNA polymerase promoter and allowing a negative selection. .
  • the cells selected at the end of step c) are those not expressing the reporter gene. Cells expressing the reporter gene whose expression depends on a type II RNA polymerase promoter and allowing negative selection are eliminated.
  • the integration of the nucleic acid molecule of interest is carried out in vitro or ex vivo or in vivo. In vivo applications, the host cell is a eukaryotic cell preferably selected from fungi cells, plants, animal models.
  • the subject of the invention is also the use of at least one transposition system according to the invention for the genetic modification of at least one eukaryotic host cell, in particular for the controlled integration of at least one molecule. of nucleic acid of interest in the genome of a eukaryotic host cell.
  • controlled integration is meant within the meaning of the invention that the integration of the nucleic molecule of interest is controlled spatially.
  • controlled integration means that the integration is controlled to intervene in a chromosomal region associated with the nucleolus.
  • the invention also relates to a genetically modified eukaryotic host cell that can be obtained by the process of the invention.
  • the invention also relates to a genetically modified eukaryotic host cell:
  • nucleic acid molecule of interest in which at least one nucleotide molecule of interest is integrated into a chromosomal region associated with the nucleolus, according to the method described above.
  • a eukaryotic host cell will express the nucleic acid molecule of interest.
  • the invention also relates to a non-human transgenic eukaryotic organism, in particular a transgenic animal, of which at least one cell is a genetically modified cell according to the invention.
  • eukaryotic organism is meant here a fungus, a plant or an animal. This definition does not purport to refer specifically to plant varieties and animal breeds as such, but may include individuals belonging to plant varieties or animal breeds.
  • Such an organism will be, in particular, an animal model particularly useful as an animal biomarker (applicable, for example, in chemical analyzes environmental or materials). Examples of animal models are, without limitation: mammals (eg, cattle, pigs, goats, sheep, horses, rodents such as mice, rats, hamsters, domestic animals such as cats, dogs), birds (birds, poultry), fish.
  • the invention also relates to a kit for the integration of at least one nucleic acid molecule of interest into the genome of a eukaryotic host cell for the purpose of its expression, characterized in that it comprises at least:
  • kit may comprise one or more additional elements, such as, in particular, a buffer solution compatible with the recombinase or its functional equivalent, one or more control DNAs (reaction controls), oligonucleotides useful for sequencing allowing check the effectiveness of the reaction, the competent bacteria, instructions for use.
  • the kit according to the present invention may for example be used to modify the genome of eukaryotic cells. These modifications may, for example, make it possible to modify the metabolism of the target cells, in order to increase their yield in bioproduction. Alternatively, the modifications made may have therapeutic effects.
  • the kit according to the present invention may in particular be used to produce a protein of interest, in particular a protein of cosmetic interest, a protein of therapeutic interest or a cell expressing such a protein.
  • the "protein of interest” is here the product of expression of the nucleic acid molecule of integrated interest, thanks to the means of the invention, in the genome of the host cell.
  • a "cell expressing a protein of therapeutic interest” can be described as an implant, useful in particular in regenerative therapy.
  • the invention also provides a pharmaceutical composition comprising at least: a molecular system according to the invention, and / or a host cell genetically modified according to the invention
  • the physical source of transposase may be a plasmid or a messenger RNA synthesized from this plasmid. Both types of source can be transfected into the cells with a transfection agent.
  • JetPEl makes it possible to have a single transfection protocol for these two types of source.
  • the gene encoding the piggybac transposase was fused to an N-terminal with a particular oligonucleotide encoding a NoLS (RQARRNRRRRWRERQRQI, Cochrane et al 1990).
  • the physical source of transposon vector is a pBS plasmid containing the ends of a piggybac vector with a cassette encoding markers and a hybridization site for a bis-PNA oligonucleotide coupled to a NoLS (PNA-NoLS; KKK- LLTTCTTCTTTTLLLTTTTCTTCTT-LLL-KKK-RQARRNRRRRWRERQRQI wherein K, L, I, R, Q, A, N, W and E are amino acids, C and T are nucleotides).
  • Hybridization of PNA-NoLS is done using a protocol similar to a PCR. It is called TACH (Temperature-assisted cyclic hybridization, Oprea et al 2010).
  • the purification of [plasmid / PNA-NoLS] complexes is carried out using plasmid mini-purification kits or Qiagen-type PCR products. Masherey-Nagel, or Promega.
  • the hybridized NoLS on the plasmid allows the plasmid to be addressed to the nucleus and the nucleolus.
  • These [plasmid / PNA-NoLS] complexes are transfected into cells with a transfection agent (jetPE1).
  • Hybridization of a bis-PNA oligonucleotide on the DNA forms a structure resulting from a double hybridization on a DNA strand that is much more stable than that resulting from the simple hybridization of an oligonucleotide PNA.
  • This double hybridization makes it possible to produce [Plasmid / bis-PNA] complexes which are much more stable and specific at the time of hybridization than the [Plasmid / PNA] complexes.
  • sequence of the pBS plasmids having a binding site for the PNA-NoLS oligonucleotide and containing a piggybac vector into which a transgene is inserted corresponds to the sequences SEQ ID No.2 and SEQ ID No.3.
  • the bis-PNA-NoLS is added 20, 40 or 60 times in excess of the plasmid for hybridization.
  • the hybridization is carried out in 0.5mL PCR tubes:
  • Vf 20 il 20 ⁇ 20 ⁇ 20 ⁇
  • a drop of mineral oil is added to the surface of each mix to prevent evaporation during the hybridization reaction.
  • the hybridization reaction is carried out in a thermocycler.
  • the program used consists of 20 cycles of two phases. - 30s 80 ° C (de-hybridization)
  • the bis-PNA / DNA complexes are stable for at least 2-3 weeks at 20 ° C. At any time, the quality of a complex stock can be verified using the procedure described below.
  • Step I 5 ⁇ Digestion of Elua by BamHI-Spel
  • Plasmic DNAs were prepared using a Masherey-Nagel purification kit (endotoxin-free). a - Preparation of plasmids
  • the messenger RNAs to be prepared are cloned into the plasmid expression vector pCS2 + (see map below).
  • the plasmid To be used as a transcription matrix, the plasmid must be linearized by enzymatic cleavage with a restriction enzyme cutting downstream of the ORF.
  • cleavage For transcription to be effective, particularly its termination, cleavage must produce fragments with blunt or outgoing 5 'outward ends.
  • the enzymes used are located in the most proximal multi-site cloning (MCS) of the CMV promoter: NotI and Acc651 (KpnI isoschizomer with 5 'outward ends). The enzyme chosen for digestion should not cut into the ORF.
  • Step 1 Transcription and styling of RNAs
  • Step 4 Quality control of mRNAs
  • RNA samples for electrophoresis 1 ⁇ extract + 5 ⁇ H20 nuclease free + 6 ⁇ Loading Buffer II gel (2X, Ambion). Incubate for 5 min at 65 ° C and then 1 min on ice
  • Step 5 Preservation of mRNA at -80 ° C
  • Plasmids pCS2 expressing PB-GFP, HIV-NoLS-PB-GFP and DSRed-NoLS fusions were used to transfect HeLa cells to test for HIV-NoLS protein.
  • -PB has the property of being actively localized in the nucleoli.
  • transposases (Sleeping Beauty, Tol2, Mos1, ...) and integrases have a recombination activity which is diminished or canceled when they are fused with a peptide or an N-terminal and / or C-terminal protein domain. .
  • the activity of N-terminal HIV-NoLS-PB fusion was compared with that of native PB transposase in HeLa cell transposition assays (see protocol in the following section; 2 plasmids are used in each test condition: a source of transposase and a source of transposon).
  • Two types of transposon vector sources have been used, the sequences of which correspond to the sequences of SEQ ID No.3 and No.4. The results are presented in figure 5.
  • the first test involves two plasmids (a transposase source and a transposon source). In this test, expression of the transposase takes place for 7 to 8 days, the time that the transposase source plasmid is naturally eliminated by the cell.
  • the second type of test involves 1 mRNA (as a transposase source) and a plasmid (as a transposon source). In this assay, expression of the transposase takes place for 16 hours, a shorter duration than the freshly transfected HeLa cell division time.
  • transposase source ⁇ 200 ng
  • transposon vector source -200 ng
  • the details of the characteristics of these two sources of PB transposases and the conditions of the two types of transposition tests are described in Bire et al (2013). Briefly, for each test, a transposase source ( ⁇ 200 ng) and a transposon vector source (-200 ng) are transfected for 4 hours in 50,000 HeLa cells using jetPE1 as the transfection agent. From the perspective where the targeting works very precisely, we have retained non-optimal transposition conditions (in terms of the amount of transposon vector source) so that we can observe alongside the targeting of background noise in control. The cells are then cultured for 48 hours before being subjected to G418 selection for two weeks.
  • cloned cells of G418-resistant cells ie stably expressing the integrated transgene via the transposon vector in chromosomes
  • G418-resistant cells ie stably expressing the integrated transgene via the transposon vector in chromosomes
  • washed and pelleted to purify their DNA. genomics.
  • Each test is triplicate. The conditions used make it possible to obtain genetically modified cells by means of an average integration of 2 to 3 transposon vectors / haploid genome of cellular clone.
  • Tests 1 to 4 are transposition controls. An average of ⁇ 30 clones was observed for the tests N ° 1, 3, 5 and 7. An average of ⁇ 0 to 2 clones was observed for the tests N ° 2, 4, 6 and 8. These witnesses correspond to integration tests of transposon source plasmids by random recombination. In our experimental conditions, they indicate that the cryptic promoters of RNA polymerase 2 in the RNA polymerase 1 (pPoll h) promoter are ineffective in expressing a transgene in the nucleoplasm.
  • Table 3 summarizes the oligonucleotides for Illumina labeling of 5 'insertion site populations of piggybac vectors.
  • 01igoITR5oute AATGATAC G GAC GAC CAC C GAGATCTACACTCTTTC C CTAC SEQ ID No.9 rBCN ° 2 ACGACGCTCTTCCGATCTCTACGATAAAACACATGCGTCA
  • 01igoITR5out AATGATAC G GC GAC CAC C GAGATCTACACTCTTTC C CTAC SEQ ID NO.10 rBCN ° 3 ACGACGCTCTTCCGATCTGATCGATAAAACACATGCGTCA
  • 01igoITR5oute AATGATAC G GAC GAC CAC C GAGATCTACACTCTTTC C CTAC SEQ ID NO.11 rBCN ° 4 ACGACGCTCTTCCGATCTTGCCGATAAAACACATGCGTCA
  • LAM-PCR The LAM-PCR protocol used is that described in Bartholomae et al. 2012. This protocol has been defined to amplify lentivirus insertion sites. New oligonucleotides adapted to piggybac vectors have been defined used for the amplification of insertion site populations on their 5 'end, followed by their labeling. For each sample, 3 types of restriction enzyme digestions were performed: [Dpnll], [Pcil + Ncol + BspHI] (PNB) and [Spel + Avril + Nhel + Xbal] (SANX). Oligonucleotides for each of these cleavage types have been designated and synthesized.
  • Table 4 summarizes the biotynylated oligonucleotides (B) or not for the 3 amplifications nested at the 5 'end of the piggybac vectors.
  • Oligo II PNB CATGCCTAACTGCTGTGCCACTGAATTCAGATC SEQ ID No.17
  • Table 6 summarizes the oligonucleotides for lllumina labeling of 5 'insertion site populations of piggybac vectors. Sequence name SEQ ID NO: 1
  • 01igoITR5outerB AATGATACGGCGACCACCGAGATCTACACTCTTT SEQ ID No.1 9
  • 01igoITR5outerB AATGATACGGCGACCACCGAGATCTACACTCTTT SEQ ID No.20
  • 01igoITR5outerB AATGATACGGCGACCACCGAGATCTACACTCTTT SEQ ID No.21
  • 01igoITR5outerB AATGATACGGCGACCACCGAGATCTACACTCTTT SEQ ID No.22
  • Oligo II SANX CTAGCCTAACTGCTGTGCCACTGAATTCAGATC SEQ ID No.23
  • LAM-PCR is an approach whose objective is to determine the insertion profile of a vector in chromosomes. It is a qualitative approach and not very quantitative. In fact, the amplifications made by PCR systematically lead to the preferential amplification of fragments which represent for the most numerous 90% of the readings. This amplification bias is constant. Therefore, if a strict quantification of vector targeting efficiency can not be performed, the comparison of LAM-PCR results makes it possible to determine whether there are differences between samples taken from vector-based transposition assays. integrative with targeted insertion or not. Preamble on the chromosomal targets of targeting.
  • the targeting of the vectors of the invention is directed to the chromosomal regions associated with the nucleoli.
  • a haploid genome containing a maximum of 500 repeating units of the 18S-5.8S-28S rRNA genes, these represent -0.69% of the genome of a HeLa cell.
  • Their flanking regions and NADs represent respectively -0.55% and -2.92% of the genome.
  • Nuclear membrane-bound sequences, called lamina-associated domains (LADs) represent -36.83% of the genome (Guelen et al 2008). Their characteristic of being compacted on the nuclear membrane makes these sequences, in theory, less accessible to transposition. They were therefore retained as internal witnesses to our targeting experiments.
  • the results will strictly be able to answer only the following questions: 1 - Are the different combinations of vector sources, targeted or not, targeted in the nucleolar sequences?
  • TSD PB's canonical TSD is TTAA
  • LADs are nuclear compartments that contain highly heterochromatinized chromosomal domains. It is therefore expected that the genomic DNA regions contained in the LADS are less accessible to the integration of integrative vectors, in particular during the phases GO and G1 of the cell cycle.
  • the insertion profiles of 6 vector prototypes were therefore first analyzed in this perspective (see Figure 6 and 7).
  • the first observation is that the six vector prototypes tend to significantly fit into the DNA contained in the nucleoplasm.
  • the integration rates in the nucleoplasm are systematically higher than the expected rate by the simple effect of chance.
  • the second observation is that the six vector prototypes tend to significantly less fit into the DNA contained in the LADs.
  • the nucleolar regions were represented by the "Nucleolus-associated domains", the "rDNA repeats", and the "rDNA flanking regions”.
  • genomic DNA contained in the nucleolus is difficult to access for an integrative vector, even if targeted.
  • RNA polymerase I The integrative vector prototype whose two components are targeted in the nucleolus (pCS2-HIV-PB x pPol1 h-Neo-PNA) and whose expression of the marker is dependent on a nucleolar promoter (RNA polymerase I) is the most effective to integrate into the nucleolar sequences (relative ratio of 5 to 300 times, according to the test).
  • 3 - A vector targeted or not in the nucleolus and containing a selection marker whose expression is placed under the control of a non-nucleolar nuclear promoter (pSV40 - RNA polymerase II) is incapable of being retained by the process of cell selection. This inability arises from the absence of RNA polymerase II in the nucleolus.
  • the targeted vectors whose selection marker depends on RNA polymerase I, fit best and at a higher level than other vector prototypes.
  • the results obtained in IPCR suggest that the difference in the efficiency of the nucleolar targeting is more to the advantage of the targeted vector when the prototype consists of an mRNA and a plasmic than of two plasmid components.
  • RNA polymerase I RNA polymerase I
  • the polymerase DNAs used in PCR are much less effective for amplification on DNA templates having a GC level of 60 to 80% than on matrices with a GC level of -45%. In fact, rDNA insertion site amplifications are dramatically underrepresented in the final products of IPCR and LAM-PCR.
  • results indicate that the IPCR in our experimental conditions amplifies the sequences homogeneously, regardless of their nucleolar location and the sample.
  • the advantage of this quality of amplification is reduced by the fact that only 0.1 to 1% of the sequences produced do not come from artefactual amplification products.
  • the results indicate that LAM-PCR in our experimental conditions biased the sequences according to their nucleolar localization and the sample. This property is to be compared with the fact that the sequences recovered from LAM-PCR products are 70 to 99% mapping in silico.
  • composition in repetitive sequences in particular in sequence Alu ⁇ (300-bp) of the non-transcribed spacers (themselves at 60 to 80% of GC level) present between the transcribed regions in ribosomal RNA 18S-5.8S- 28S in the rDNA does not allow to map them correctly in silico
  • sequence of the regions containing the repeated units coding for the rRNA is not known 4.
  • the integrative vectors of the invention can be efficiently targeted in the nucleolar DNA.
  • the use of the targeted vectors can be done with two plasmid components or 1 mRNA and a plasmid.
  • Additional assays on the ability of the targeted vectors to integrate into the genes encoding 18S-5.8S-28S ribomosomal RNAs may have two origins. The first would be that the vectors can not access these chromosomal sequences because they would be protected in the nucleoli and would require a specific mechanism of access to these sequences. The second is related to certain amplification properties of the polymerases used in PCR and which are to amplify with greater efficiency the richest sequences of AT at the expense of those rich in GC.
  • the second hypothesis was tested using a LAM-PCR strategy targeted to the transcribed region of the genes encoding the 18S-5.8S-28S ribosomal RNAs of the specifically anchored oligonucleotides on the one hand in this region and, on the other hand, in the 5 'and 3' ends of the vectors used.
  • ITR5a SEQ ID No.36 - 5 'GAATTCGTCGACATCGATACCAAAAGTTTTGTTAC 3'
  • ITR3a SEQ ID No.38 - 5 'GCGGCGACTGAGATGTCCTAAATGCAC 3'
  • ITR3b SEQ ID No.39 - 5 'GCGACGGATTCGCGCTATTTAGAAAGAGAG 3'
  • Each linear PCR is amplified by 6 sets of oligonucleotides (1 end of the transposon and then 6 primers rDNA)).
  • Primer 1 ITR5a or ITR3a
  • Primer 2 18SF, 18SR, 28SFmid, 28SRMid, 28S Fend, 28SRend
  • Each PCR tube has its primer mix nested
  • Primer 1 ITR5b or ITR3b
  • Primer 2 18SF2, 18SR2, 28SFmid2, 28SRMid2, 28S Fend2, 28SRend2
  • DNA repeat analysis of the intergenic spacer. Genomics. 27: 320-328.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

The invention relates to a system for integrating a nucleic acid molecule of interest in a chromosome region associated with the nucleolus. Said system includes at least: - one non-viral integrative vector located in the nucleolus of the cell nucleus and lacking a functional recombinase source; and - one functional recombinase source that is located in the nucleolus of the cell nucleus and provided via transfer from said non-viral integrative vector.

Description

CIBLAGE DE VECTEURS INTEGRATI FS NON-VIRAUX DANS LES SEQUENCES D'ADN NUCLEOLAI RES CHEZ LES EUCARYOTES  TARGETING NON-VIRAL INTEGRATED FS VECTORS IN NUCLEOLAI RES DNA SEQUENCES IN EUKARYOTICS

De nombreuses techniques de transfert de séquences nucléotidiques exogènes ont été proposées dans le domaine de la thérapie génique, ou pour fabriquer des cellules et organismes génétiquement modifiés à des fins de production de protéines d'intérêt économique ou thérapeutique, ou encore pour la recherche fondamentale. Numerous exogenous nucleotide sequence transfer techniques have been proposed in the field of gene therapy, or for making cells and organisms genetically modified for the production of proteins of economic or therapeutic interest, or for basic research.

Ces techniques font notamment appel à systèmes comprenant des vecteurs intégratifs non viraux couplés à des enzymes spécifiques. Les vecteurs intégratifs non viraux sont des vecteurs comprenant des séquences susceptibles d 'être intégrées dans le génome. Cette intégration requiert généralement l'intervention d 'enzymes capables de catalyser ou de stimuler l'intégration de la séquence d 'intérêt dans l'ADN. Il existe plusieurs types de systèmes vecteurs non viraux/enzymes d'intégration, qui fonctionnent selon des mécanismes variés. A titre d 'exemple, on peut ainsi citer les éléments transposables (TE), dont les transposons et rétro- transposons, qui permettent l'intégration de séquences d 'intérêt lorsqu'ils sont couplés à des recombinases telles que des transposases ou des intégrases. Parmi les systèmes vecteurs non viraux/enzymes d 'intégration, on trouve aussi les systèmes plasmide/nucléase dans lesquels l'enzyme stimule l'intégration de la séquence d'intérêt par recombinaison homologue. These techniques include systems comprising non-viral integrative vectors coupled to specific enzymes. The nonviral integrative vectors are vectors comprising sequences that can be integrated into the genome. This integration generally requires the intervention of enzymes capable of catalyzing or stimulating the integration of the sequence of interest into the DNA. There are several types of non-viral vector / integrative enzyme systems, which operate according to various mechanisms. By way of example, it is possible to cite the transposable elements (TE), including transposons and retro-transposons, which allow the integration of sequences of interest when they are coupled to recombinases such as transposases or integrases. . Among the nonviral vector / integration enzyme systems are also the plasmid / nuclease systems in which the enzyme stimulates the integration of the sequence of interest by homologous recombination.

De manière générale, les éléments transposables (TE) ou éléments génétiques mobiles (EGM) sont des fragments d 'ADN de petite taille, capables de se déplacer d'un site chromosomique à un autre. I l existe diverses classes de TE, selon les mécanismes d 'intégration dans l'ADN mis en jeu par ces derniers. Dans le cas de transposons, qui sont des TE dits de classe II, ces fragments d'ADN sont caractérisés par des séquences répétées inversées (ITR) situées en positions 5' et 3' terminales. Une enzyme codée par les TEs eux-mêmes, la transposase, catalyse le processus de transposition de ces derniers. In general, transposable elements (TE) or mobile genetic elements (EGMs) are small DNA fragments that are able to move from one chromosomal site to another. There are various classes of TE depending on the mechanisms of integration in the DNA put into play by them. In the case of transposons, which are so-called class II TEs, these DNA fragments are characterized by inverted repeat sequences (ITRs) located at the 5 'and 3' terminal positions. An enzyme encoded by the TEs themselves, the transposase, catalyzes the transposition process of the latter.

Des transposons ont été identifiés tant chez les procaryotes que chez les eucaryotes. Chez les procaryotes, un grand nombre de transposons ont été répertoriés à ce jour. On peut citer, par exemple, des séquences d'insertion telles que IS1 , et des transposons, tel Tn5. Chez les eucaryotes, les éléments de classe I I comprennent dix familles : P, PiggyBac (incluant le transposon Pokey), hAT, hélitron, Harbinger, En/Spm, Mutator, Transib, Pogo et IS630-Tc1 -mariner (incluant Sleeping Beauty). Transposons have been identified in both prokaryotes and eukaryotes. In prokaryotes, a large number of transposons have been listed to date. Include, for example, insertion sequences such as IS1, and transposons, such as Tn5. In eukaryotes, class II elements comprise ten families: P, PiggyBac (including the Pokey transposon), hAT, helitron, Harbinger, En / Spm, Mutator, Transib, Pogo and IS630-Tc1 -mariner (including Sleeping Beauty).

Les systèmes plasmides/nucléases sont aussi régulièrement utilisés pour transférer des gènes d'intérêt dans le génome de cellules eucaryotes de manière ciblée. Ces systèmes sont, comme les systèmes transposon/transposase, des systèmes bipartites qui comprennent en général un plasmide dont la séquence est définie de façon à favoriser la transposition d'un transgène par recombinaison homologue, et une nucléase de type Méganuclease, Zinc finger Nucléase, TALEN, ou CRISPR/Cas9 pour cibler spécifiquement l'intégration à un site chromosomique à une fréquence élevée. Plasmid / nuclease systems are also routinely used to transfer genes of interest into the genome of eukaryotic cells in a targeted manner. These systems are, like the transposon / transposase systems, bipartite systems which generally comprise a plasmid whose sequence is defined so as to favor the transposition of a transgene by homologous recombination, and a nuclease of the meganuclease type, Zinc finger nuclease, TALEN, or CRISPR / Cas9 to specifically target integration to a chromosomal site at a high frequency.

Le principe du ciblage de ces derniers vecteurs repose donc sur la capacité de clivage de l'ADN à des sites spécifiques par les nucléases en question. Ce clivage stimule la recombinaison homologue à proximité de ces sites, permettant ainsi l'intégration de séquences exogènes. En outre, les bases moléculaires régissant le lien entre la structure de ces nucléases et les sites qu'elles reconnaissent ont été bien étudiées. Il est donc désormais possible avec ces systèmes de produire des nucléases à façon ciblant spécifiquement les séquences d'ADN dans lesquelles on souhaite effectuer l'intégration. The principle of targeting these latter vectors is therefore based on the ability of cleavage of DNA at specific sites by the nucleases in question. This cleavage stimulates homologous recombination close to these sites, thus allowing the integration of exogenous sequences. In addition, the molecular bases governing the link between the structure of these nucleases and the sites they recognize have been well studied. It is now possible with these systems to produce nucleases in a manner specifically targeting the DNA sequences in which integration is desired.

Toutefois, le transfert d'un ADN exogène à l'aide de ces moyens connus, qu'il s'agisse des systèmes dérivés des transposons ou des systèmes reposant sur des nucléases, n'est pas sans poser des difficultés, notamment du fait d'une efficacité, en particulier vis à vis de la taille du fragment à intégrer, et d'une spécificité d'intégration du transgène qui restent malgré tout très limitées. However, the transfer of an exogenous DNA using these known means, whether it is systems derived from transposons or systems based on nucleases, is not without difficulties, in particular because of an efficiency, particularly with respect to the size of the fragment to be integrated, and a specificity of integration of the transgene which remain nevertheless very limited.

En effet, ces systèmes n'excluent pas les insertions aléatoires. Or, celles-ci sont susceptibles d'avoir des effets délétères en mutant des gènes pour lesquels il n'existe qu'une copie dans le génome. En outre, il a été montré que les insertions aléatoires sont éteintes à 95% dans les cellules HeLa (Garisson et al. , 2007). Ainsi, il semblerait que certains transgènes, selon le site dans lequel ils ont été insérés, sont finalement reconnus par la cellule comme appartenant au non-soi et éteints. Ces résultats soulignent l'importance du site d'insertion en tant que tel pour la stabilité ultérieure de l'expression du transgène. Finalement, les propriétés du couple ADN intégré/site d'intégration sont essentielles pour obtenir une expression durable et contrôlable d'un transgène. Indeed, these systems do not exclude random insertions. However, these are likely to have deleterious effects by mutating genes for which there is only one copy in the genome. In addition, it has been shown that random insertions are 95% extinct in HeLa cells (Garisson et al., 2007). Thus, it would appear that some transgenes, depending on the site in which they were inserted, are eventually recognized by the cell as belonging to the non-self and extinct. These results emphasize the importance of the insertion site as such for the subsequent stability of transgene expression. Finally, the properties of the integrated DNA pair / integration site are essential to obtain a sustainable and controllable expression of a transgene.

Or, les recherches ont montré que les séquences codant pour les ARN ribosomaux étaient des sites privilégiés permettant une expression optimale des transgènes chez les eucaryotes. De plus, ces séquences présentent l'avantage d'être regroupées spatialement au niveau du nucléole, dans des régions génomiques spécifiques comprenant, entre autre, des clusters de séquences répétées (de gènes codant pour les ARNr 5S, 5.8S, 18S et 28S). Ainsi, l'insertion de molécules d'acide nucléique dans ces régions est moins susceptible de donner lieu à des mutations délétères. Un tel site d'intégration a d'ailleurs déjà été évalué dans le cadre de techniques sans aucun lien avec la mise en œuvre d'un outil transposable. Il a ainsi été démontré que l'inactivation, par intégration d'ADN, de 50% des gènes codant les ARNr 18S-5.8S-28S n'affecte pas la viabilité de la cellule ou de l'organisme. En effet, bien que leur nombre puisse varier d'un facteur 1 à 2 dans le génome d'une même espèce, ces séquences sont fortement répétées car elles sont essentielles à la synthèse protéique et, donc, à la viabilité de l'organisme. Utiliser les répétitions en tandem contenant les gènes des ARNr 18S-5.8S-28S comme cibles pour l'intégration permet en outre de limiter, voire supprimer, la diffusion indésirable des transgènes à des cultures non visées et des populations naturelles végétales et animales. However, research has shown that the coding sequences for ribosomal RNAs are privileged sites for optimal expression of transgenes in eukaryotes. In addition, these sequences have the advantage of being grouped spatially at the level of the nucleolus, in specific genomic regions comprising, inter alia, clusters of repeated sequences (genes coding for the 5S, 5.8S, 18S and 28S rRNAs). . Thus, the insertion of nucleic acid molecules into these regions is less likely to give rise to deleterious mutations. Such an integration site has already been evaluated in the context of techniques without any link with the implementation of a transposable tool. It has thus been shown that the inactivation by DNA integration of 50% of the genes encoding the 18S-5.8S-28S rRNA does not affect the viability of the cell or organism. Indeed, although their number may vary by a factor of 1 to 2 in the genome of the same species, these sequences are highly repeated because they are essential for protein synthesis and, therefore, the viability of the body. Using tandem repeats containing the 18S-5.8S-28S rRNA genes as targets for integration also makes it possible to limit or even eliminate the unwanted spread of transgenes to non-target crops and natural plant and animal populations.

Malgré cet intérêt pour l'intégration de transgènes au niveau du nucléole, et en particulier dans les régions comprenant des gènes codant les ARNr 18S-5.8S-28S, c'est-à-dire pour les régions chromosomiques associées au nucléole, il n'existe pas à l'heure actuelle de système performant garantissant une bonne efficacité d'intégration à ces sites, en particulier dans les génomes animaux et de plantes. Despite this interest in the integration of transgenes at the level of the nucleolus, and particularly in the regions comprising genes encoding the 18S-5.8S-28S rRNAs, that is to say for the chromosomal regions associated with the nucleolus, it is not There is currently no effective system guaranteeing a good integration efficiency at these sites, in particular in animal and plant genomes.

L'expression de transgènes intégrés à ces sites a été confirmée en cellules de mammifère dans un contexte de thérapie génique en utilisant la recombinaison homologue (Wen et al. , 2008). D'après les travaux rapportés, par recombinaison homologue, mécanisme d'intégration passif et aléatoire, l'efficacité d'intégration atteint 10"4 - 10"5, c'est-à-dire qu' 1 cellule sur 10 000 ou 1 cellule sur 100 000 possède le transgène correctement intégré dans le site chromosomique cible (Wen et al. , 2008 ; Liang et al. , 2007). Il est donc clair que les niveaux d'efficacité d'intégration susceptibles d'être obtenus par les différentes méthodes décrites jusque-là restent encore trop faibles pour les applications visées, et qu'il existe bien un besoin pour des moyens et méthodes permettant l'intégration de molécules d'acides nucléiques spécifiquement dans ces sites d'intérêt, à savoir dans les régions chromosomiques associées au nucléole. Expression of integrated transgenes at these sites has been confirmed in mammalian cells in a gene therapy context using homologous recombination (Wen et al., 2008). According to the reported work, by homologous recombination, passive and random integration mechanism, the integration efficiency reaches 10 "4 - 10 " 5 , that is to say that 1 cell out of 10,000 or 1 One in 100,000 cells has the transgene correctly integrated into the target chromosomal site (Wen et al., 2008, Liang et al., 2007). It is therefore clear that the levels of integration efficiency likely to be obtained by the various methods described until now are still too weak for the applications concerned, and that there is indeed a need for means and methods allowing integration of nucleic acid molecules specifically in these sites of interest, namely in chromosomal regions associated with the nucleolus.

Les moyens et méthodes de l'invention permettent de résoudre ce problème technique d'une manière simple et élégante, facile à mettre en œuvre et avec des taux d'intégration dans les sites visés particulièrement intéressants. The means and methods of the invention make it possible to solve this technical problem in a simple and elegant manner, easy to implement and with integration rates in the targeted sites of particular interest.

LEGENDE DES FIGURES LEGEND OF FIGURES

Figure 1 : Analyse de la qualité des complexes plasmide PNA par retard sur gel d'agarose. La totalité des digestions ont été déposées sur gel d'agarose 1 %, 1 XTAE, 1 X GelRed. Puits 1 : marqueur de taille λ DNA digéré par Hindlll; Puits 2 : pBS-PB- PNABS-pPol1 h-NeoR-pASV40 digéré par BamHI/Spel; Puits 3 : complexe [pBS-PB- PNABS-pPol1 h-NeoR-pASV40/PNA-NoLS] hybridé en excès de X60 en oligonucléotide puis digéré par BamHI/Spel. Figure 1: Analysis of the quality of PNA plasmid complexes by agarose gel delay. All digestions were deposited on 1% agarose gel, 1 XTAE, 1 X GelRed. Well 1: Hindlll digested λ DNA size marker; Well 2: BamHI / SpeI digested pBS-PB-PNABS-pPol1 h-NeoR-pASV40; Well 3: [pBS-PB-PNABS-pPol1h-NeoR-pASV40 / PNA-NoLS] complex hybridized in excess of X60 to oligonucleotide and then digested with BamHI / SpeI.

Figure 2 : Analyse en microscopie à épifluorecence de cellules HeLa transfectées depuis 24 heures avec des complexes [plasmide/PNA-NoLS] colorés au YOYO-1. A : observation en épifluorescence des complexes ADN-PEI; B: localisation en lumière blanche des nucléoles dans les noyaux; C: la fusion des deux images (épifluorescence et lumière blanche) permet de visualiser la concentration de fluorescence dans les nucléoles. Figure 2: Epifluorescence microscopy analysis of HeLa cells transfected for 24 hours with YOYO-1 stained [plasmid / PNA-NoLS] complexes. A: epifluorescence observation of DNA-PEI complexes; B: white light localization of nucleoli in nuclei; C: the fusion of the two images (epifluorescence and white light) makes it possible to visualize the concentration of fluorescence in the nucleoli.

Figure 3 : Analyse en microscopie à épifluorecence de cellules HeLa transfectées depuis 24 heures avec PB-GFP. A : les nucléoles apparaissent comme des zones sombres dans le noyau. B : témoins de localisation nucléolaire fusionné au DsREd. C : La fusion des deux images révèle que la transposase PB est activement internalisée dans les noyaux mais est exclue des nucléoles. Figure 3: Epifluorescence microscopy analysis of HeLa cells transfected for 24 hours with PB-GFP. A: The nucleoli appear as dark areas in the nucleus. B: nucleolar localization controls fused to DsREd. C: The fusion of the two images reveals that the transposase PB is actively internalized in the nuclei but is excluded from the nucleoli.

Figure 4 : Analyse en microscopie à épifluorecence de cellules HeLa transfectées depuis 24 heures avec NoLS PB-GFP. A : les nucléoles apparaissent comme des zones fluorescente dans le noyau à cause de la présence de NoLS PB-GFP. B: témoins de localisation nucléolaire fuisonné au DsREd. C : La fusion des deux images révèle que la transposase NoLS- PB est activement internalisée dans les nucléoles. Figure 5 : Résultats de tests de transposition réalisés sans transposase (témoin) ou avec (PB et NoLS- PB) et deux vecteurs contenant respectivement deux cassettes de résistance à la néomycine dépendantes de deux enzymes de transcription différentes : pSV40 = ARN polymérase II et pPollh = ARN polymérase I. En ordonnée est indiqué le nombre de colonies NéoR stables obtenues après 2 semaines de sélection. Ce nombre est proportionnel à l'efficacité de la transposition. Les témoins ont été obtenus avec un plasmide pCS2 vide comme source négative de transposase. Figure 4: Epifluorescence microscopy analysis of HeLa cells transfected for 24 hours with NoLS PB-GFP. A: The nucleoli appear as zones fluorescent in the nucleus due to the presence of NoLS PB-GFP. B: Nucleolar localization controls fished at DsREd. C: The fusion of the two images reveals that the NoLS-PB transposase is actively internalized in the nucleoli. Figure 5: Results of transposition assays performed without transposase (control) or with (PB and NoLS-PB) and two vectors respectively containing two cassettes of resistance to neomycin dependent on two different transcription enzymes: pSV40 = RNA polymerase II and pPoll = RNA polymerase I. The ordinate indicates the number of stable NeoR colonies obtained after 2 weeks of selection. This number is proportional to the efficiency of the transposition. The controls were obtained with an empty plasmid pCS2 as a negative source of transposase.

Figure 6 : Pourcentage d'événements d'insertion différents du vecteur localisés dans l'ADN chromosomique du compartiment nucléaire nucléoplasmique. Deux qualités nucléiques sont utilisées pour chaque vecteur comme source de transposase et de transposon : ADNp/ADNp et ARNm/ADNp respectivement. Les combinaisons de plasmides et d'ARN sont indiquées en ordonnées. Les barres grises indiquent le pourcentage de loci affectés par une insertion du vecteur dans ce compartiment. Les barres noires indiquent le pourcentage de séquences décrivant une insertion du vecteur dans ce compartiment. Les deux graphes du haut (A) décrivent des résultats obtenus par IPCR alors que ceux du bas (B) ont été obtenus par LAM-PCR. Dans chaque graphe, les deux barres grise et noire indiquent les pourcentages théoriques attendus dans le compartiment nucléaire considéré. Figure 7 : Pourcentage d'événements d'insertion différents du vecteur localisés dans l'ADN chromosomique du compartiment nucléaire LAD. Deux qualités nucléiques sont utilisées pour chaque vecteur comme source de transposase et de transposon : ADNp/ADNp et ARNm/ADNp respectivement. Les combinaisons de plasmides et d'ARN sont indiquées en ordonnées. Les barres grises indiquent le pourcentage de loci affectés par une insertion du vecteur dans ce compartiment. Les barres noires indiquent le pourcentage de séquences décrivant une insertion du vecteur dans ce compartiment. Les deux graphes du haut (A)décrivent des résultats obtenus par IPCR alors que ceux du bas (B) ont été obtenus par LAM-PCR. Dans chaque graphe, les deux barres grise et noire indiquent les pourcentages théoriques attendus dans le compartiment nucléaire considéré. Figure 8 : Pourcentage d'événements d'insertion différents du vecteur localisés dans l'ADN chromosomique du compartiment nucléaire nucléoplasmique. Deux qualités nucléiques sont utilisées pour chaque vecteur comme source de transposase et de transposon : ADNp/ADNp et ARNm/ADNp respectivement. Les combinaisons de plasmides et d'ARN sont indiquées en ordonnées. Les barres grises indiquent le pourcentage de loci affectés par une insertion du vecteur dans ce compartiment. Les barres noires indiquent le pourcentage de séquences décrivant une insertion du vecteur dans ce compartiment. Les deux graphes du haut (A) décrivent des résultats obtenus par IPCR alors que ceux du bas (B) ont été obtenus par LAM-PCR. Dans chaque graphe, les deux barres grise et noire indiquent les pourcentages théoriques attendus dans le compartiment nucléaire considéré. Figure 6: Percentage of different vector insertion events located in the chromosomal DNA of the nucleoplasmic nuclear compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration. Figure 7: Percentage of different vector insertion events located in the chromosomal DNA of the LAD nuclear compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration. Figure 8: Percentage of different vector insertion events located in the chromosomal DNA of the nucleoplasmic nuclear compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration.

Figure 9 : Pourcentage d'événements d'insertion différents du vecteur localisés dans l'ADN chromosomique du compartiment nucléaire LAD. Deux qualités nucléiques sont utilisées pour chaque vecteur comme source de transposase et de transposon : ADNp/ADNp et ARNm/ADNp respectivement. Les combinaisons de plasmides et d'ARN sont indiquées en ordonnées. Les barres grises indiquent le pourcentage de loci affectés par une insertion du vecteur dans ce compartiment. Les barres noires indiquent le pourcentage de séquences décrivant une insertion du vecteur dans ce compartiment. Les deux graphes du haut (A) décrivent des résultats obtenus par IPCR alors que ceux du bas (B) ont été obtenus par LAM-PCR. Dans chaque graphe, les deux barres grise et noire indiquent les pourcentages théoriques attendus dans le compartiment nucléaire considéré. Figure 10 : Pourcentage d'événements d'insertion différents du vecteur localisés dans l'ADN chromosomique du compartiment nucléolaire. Deux qualités nucléiques sont utilisées pour chaque vecteur comme source de transposase et de transposon : ADNp/ADNp et ARNm/ADNp respectivement. Les combinaisons de plasmides et d'ARN sont indiquées en ordonnées. Les barres grises indiquent le pourcentage de loci affectés par une insertion du vecteur dans ce compartiment. Les barres noires indiquent le pourcentage de séquences décrivant une insertion du vecteur dans ce compartiment. Les deux graphes du haut (A) décrivent des résultats obtenus par IPCR alors que ceux du bas (B) ont été obtenus par LAM-PCR. Dans chaque graphe, les deux barres grise et noire indiquent les pourcentages théoriques attendus dans le compartiment nucléaire considéré. Figure 1 1 : Pourcentage d'événements d'insertion différents du vecteur localisés dans les régions NAD contenus dans le compartiment nucléolaire. Deux qualités nucléiques sont utilisées pour chaque vecteur comme source de transposase et de transposon : ADNp/ADNp et ARNm/ADNp respectivement. Les combinaisons de plasmides et d'ARN sont indiquées en ordonnées. Les barres grises indiquent le pourcentage de loci affectés par une insertion du vecteur dans ce compartiment. Les barres noires indiquent le pourcentage de séquences décrivant une insertion du vecteur dans ce compartiment. Les deux graphes du haut (A) décrivent des résultats obtenus par IPCR alors que ceux du bas (B) ont été obtenus par LAM-PCR. Dans chaque graphe, les deux barres grise et noire indiquent les pourcentages théoriques attendus dans le compartiment nucléaire considéré. Figure 9: Percentage of different vector insertion events located in the chromosomal DNA of the LAD nuclear compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration. Figure 10: Percentage of different vector insertion events located in the chromosomal DNA of the nucleolar compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration. Figure 1 1: Percentage of different vector insertion events located in the NAD regions contained in the nucleolar compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration.

Figure 12 : Pourcentage d'événements d'insertion différents du vecteur localisés dans les régions flanquantes des rDNA limitrophes dans le compartiment nucléolaire. Deux qualités nucléiques sont utilisées pour chaque vecteur comme source de transposase et de transposon : ADNp/ADNp et ARNm/ADNp respectivement. Les combinaisons de plasmides et d'ARN sont indiquées en ordonnées. Les barres grises indiquent le pourcentage de loci affectés par une insertion du vecteur dans ce compartiment. Les barres noires indiquent le pourcentage de séquences décrivant une insertion du vecteur dans ce compartiment. Les deux graphes du haut (A) décrivent des résultats obtenus par IPCR alors que ceux du bas (B) ont été obtenus par LAM-PCR. Dans chaque graphe, les deux barres grise et noire indiquent les pourcentages théoriques attendus dans le compartiment nucléaire considéré. Figure 1 3 : Pourcentage d'événements d'insertion différents du vecteur localisés dans les rDNA contenus dans le compartiment nucléolaire. Deux qualités nucléiques sont utilisées pour chaque vecteur comme source de transposase et de transposon : ADNp/ADNp et ARNm/ADNp respectivement. Les combinaisons de plasmides et d'ARN sont indiquées en ordonnées. Les barres grises indiquent le pourcentage de loci affectés par une insertion du vecteur dans ce compartiment. Les barres noires indiquent le pourcentage de séquences décrivant une insertion du vecteur dans ce compartiment. Les deux graphes du haut (A) décrivent des résultats obtenus par IPCR alors que ceux du bas (B) ont été obtenus par LAM-PCR. Dans chaque graphe, les deux barres grise et noire indiquent les pourcentages théoriques attendus dans le compartiment nucléaire considéré. Figure 14 : Efficacité de la l'IPCR à détecter des vecteurs insérés dans les 3 principaux compartiments nucléaires, nucléoplasme, LAD, et nucléoles. En ordonnée sont représentés les résultats obtenus avec 8 combinaisons moléculaires de vecteur. Figure 15 : Efficacité de LAM-PCR à détecter des vecteurs insérés dans les 3 principaux compartiments nucléaires, nucléoplasme, LAD, et nucléoles. En ordonnée sont représentés les résultats obtenus avec 8 combinaisons moléculaires de vecteur. Figure 12: Percentage of different vector insertion events located in the flanking regions of the boundary rDNAs in the nucleolar compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration. Figure 1 3: Percentage of different vector insertion events located in the rDNAs contained in the nucleolar compartment. Two nucleic qualities are used for each vector as a source of transposase and transposon: pDNA / pDNA and mRNA / pDNA respectively. The combinations of plasmids and RNA are indicated on the ordinate. The gray bars indicate the percentage of loci affected by a vector insertion in this compartment. The black bars indicate the percentage of sequences describing a vector insertion in this compartment. The two graphs at the top (A) describe results obtained by IPCR while those at the bottom (B) were obtained by LAM-PCR. In each graph, the two gray and black bars indicate the theoretical percentages expected in the nuclear compartment under consideration. Figure 14: Efficacy of the IPCR to detect vectors inserted in the 3 main nuclear compartments, nucleoplasm, LAD, and nucleoli. The ordinate shows the results obtained with 8 molecular vector combinations. Figure 15: Efficacy of LAM-PCR to detect vectors inserted in the 3 major nuclear compartments, nucleoplasm, LAD, and nucleoli. The ordinate shows the results obtained with 8 molecular vector combinations.

DESCRIPTION DESCRIPTION

Les inventeurs ont mis au point un système moléculaire bi-partite permettant l'intégration de molécules d'acides nucléiques d'intérêt dans les régions du génome formant le nucléole. Le système moléculaire des inventeurs permet une intégration spécifique de site dans les cellules hôtes eucaryotes, plus particulièrement dans les régions chromosomiques associées au nucléole. Le nucléole étant le site de transcription le plus actif du noyau, les séquences intégrées grâce au système moléculaire de l'invention sont exprimées de manière stable dans le temps. Le système moléculaire de l'invention comprend d'une part un vecteur intégratif non viral, dépourvu d'activité enzymatique permettant son intégration dans le génome, et, d'autre part, une enzyme permettant cette intégration. The inventors have developed a bi-partite molecular system for the integration of nucleic acid molecules of interest in the regions of the genome forming the nucleolus. The molecular system of the inventors allows specific site integration in eukaryotic host cells, more particularly in the chromosomal regions associated with the nucleolus. Since the nucleolus is the most active transcription site of the nucleus, the sequences integrated thanks to the molecular system of the invention are stably expressed in time. The molecular system of the invention comprises on the one hand a non-viral integrative vector, devoid of enzymatic activity allowing its integration into the genome, and, on the other hand, an enzyme allowing this integration.

Cette enzyme peut ainsi être par exemple, et selon le type de vecteur intégratif choisi, une recombinase, une transposase, une intégrase, une nucléase. This enzyme can thus be, for example, and depending on the type of integrative vector chosen, a recombinase, a transposase, an integrase, a nuclease.

En outre, le système moléculaire de l'invention est particulièrement original en ce que ces deux éléments, à la fois le vecteur intégratif non viral et la source de recombinase fonctionnelle, possèdent tous deux la capacité de se localiser à proximité des sites ciblés. En effet, les inventeurs ont élaboré des outils moléculaires, en particulier des vecteurs intégratifs non viraux et des sources de recombinase fonctionnelle (c'est à dire des recombinases ainsi que leurs équivalents fonctionnels), se localisant dans le noyau cellulaire, et même au nucléole. Cette localisation spécifique des moyens du système moléculaire de l'invention permet d'augmenter de façon très importante le taux d'intégration dans les régions chromosomiques associées au nucléole. In addition, the molecular system of the invention is particularly original in that both of these elements, both the non-viral integrative vector and the functional recombinase source, both possess the ability to localize near the targeted sites. Indeed, the inventors have developed molecular tools, in particular non-viral integrative vectors and functional recombinase sources (ie recombinases as well as their functional equivalents), localizing in the cell nucleus, and even in the nucleolus. . This specific localization of the means of the molecular system of the invention makes it possible to dramatically increase the rate of integration into chromosomal regions associated with the nucleolus.

Pour obtenir ce résultat, les inventeurs ont conçu en particulier des vecteurs intégratifs non viraux spécifiques, dont la capacité de localisation au noyau et plus particulièrement au nucléole repose sur l'utilisation de signaux de localisation peptidique NoLS. Cette solution technique est particulièrement surprenante. En effet, les signaux de localisation NoLS sont des peptides classiquement utilisés pour permettre la localisation de peptides et de protéines. Il est donc étonnant de recourir à ce type d'outils pour localiser des molécules telles que des vecteurs, qui sont des polynucléotides. Le recours à une telle solution technique peut sembler contre-intuitif. En effet, sa mise en œuvre nécessite l'élaboration d'éléments de liaisons additionnels, permettant de greffer le vecteur intégratif non viral au signal de localisation NoLS, ce qui peut la rendre a priori complexe. Cependant, contre toute attente, les vecteurs intégratifs non viraux de l'invention se révèlent être particulièrement efficaces pour ce qui est d'intégrer des séquences nucléiques d'intérêt dans les régions chromosomiques constituant le nucléole. To obtain this result, the inventors have designed in particular specific non-viral integrative vectors, whose ability to localize the nucleus and more particularly the nucleolus relies on the use of NoLS peptide localization signals. This technical solution is particularly surprising. Indeed, NoLS localization signals are peptides conventionally used to allow the localization of peptides and proteins. It is therefore surprising to use this type of tool to locate molecules such as vectors, which are polynucleotides. The use of such a technical solution may seem counterintuitive. Indeed, its implementation requires the development of additional connecting elements, for grafting the integrative non-viral vector to the NoLS location signal, which can make it a priori complex. However, against all odds, the nonviral integrative vectors of the invention are found to be particularly effective at integrating nucleic acid sequences of interest into the chromosomal regions constituting the nucleolus.

Ainsi, l'invention vise en premier lieu un système moléculaire pour l'intégration d'une molécule d'acide nucléique d'intérêt dans une région chromosomique associée au nucléole, comprenant au moins : Thus, the invention firstly relates to a molecular system for integrating a nucleic acid molecule of interest into a chromosomal region associated with the nucleolus, comprising at least:

- un vecteur intégratif non viral se localisant dans le nucléole du noyau cellulaire, et dépourvu de source de recombinase fonctionnelle; et  a non-viral integrative vector locating in the nucleolus of the cell nucleus, and lacking a source of functional recombinase; and

- une source de recombinase fonctionnelle se localisant dans le nucléole du noyau cellulaire, fournie en trons dudit vecteur intégratif non viral.  a source of functional recombinase located in the nucleolus of the cell nucleus, provided in trons of said non-viral integrative vector.

Par « système moléculaire », on entend au sens de l'invention un ensemble de moyens de biologie moléculaire. Au sens de l'invention, ces moyens sont en particulier adaptés à l'intégration de molécules d'acides nucléiques d'intérêt au sein d'une région chromosomique. Plus particulièrement, au sens de l'invention, les moyens du système moléculaire selon l'invention comprennent au moins (a) un vecteur intégratif non viral et (b) une source d'enzyme recombinante fonctionnelle ou une source d'un équivalent fonctionnel de celle-ci. De manière générale, on désignera ci-après dans la demande les diverses enzymes visées par l'invention par leur caractère fonctionnel, en les regroupant sous les termes « source de recombinase fonctionnelle », étant entendu que cette source peut être constituée d'une recombinase en tant que telle, ou d'un équivalent fonctionnel, tel que par exemple une intégrase, une transposase ou une nucléase. By "molecular system" is meant in the sense of the invention a set of molecular biology means. Within the meaning of the invention, these means are in particular adapted to the integration of nucleic acid molecules of interest within a chromosomal region. More particularly, within the meaning of the invention, the means of the molecular system according to the invention comprise at least (a) a non-viral integrative vector and (b) a functional recombinant enzyme source or a source of a functional equivalent of it. In general terms, the various enzymes referred to by the invention will be referred to hereinafter by their functional character, by grouping them under the terms "source of functional recombinase", it being understood that this source may consist of a recombinase. as such, or a functional equivalent, such as for example an integrase, a transposase or a nuclease.

Par « source de recombinase fonctionnelle», on entend au sens de l'invention une source d'enzyme capable de remplir la même fonction qu'une recombinase. Les termes et expressions « activité », « fonction », « activité biologique » et « fonction biologique » sont équivalents et répondent à l'acception usuelle dans le domaine technique de l'invention. En particulier, la recombinase comprise dans le système moléculaire selon l'invention est considérée «fonctionnelle» si elle est apte à catalyser le processus d'intégration de la ou des séquences nucléotidiques exogènes d'intérêt dans la région chromosomique cible. For the purposes of the invention, the term "functional recombinase source" is intended to mean an enzyme source capable of fulfilling the same function as a recombinase. The terms "activity", "function", "biological activity" and "biological function" are equivalent and correspond to the usual meaning in the technical field of the invention. In particular, the recombinase included in the molecular system according to the invention is considered "functional" if it is able to catalyze the process of integration of the exogenous nucleotide sequence (s) of interest in the target chromosomal region.

L'homme du métier pourra aisément vérifier que la recombinase d'intérêt est « fonctionnelle » au sens de l'invention, par des tests in vitro bien connus dans le domaine. Ce type de tests consiste à réaliser une analyse biochimique des activités de liaison et de coupure aux extrémités de l'ADN par la recombinase ainsi que l'analyse de la capacité de la recombinase à transférer des brins d'ADN. Dans le cas d'une nucléase, l'homme du métier pourra aisément vérifier que l'enzyme d'intérêt est fonctionnelle par des tests in vitro de spécificité de clivage d'ADN. La source de recombinase fonctionnelle est de préférence choisie parmi les transposases, les nucléases, les intégrases et les recombinases. Notamment, l'homme du métier saura choisir, parmi les différentes enzymes disponibles, celle qui sera le mieux adaptée à l'intégration de la séquence d'intérêt, par exemple en fonction du vecteur intégratif non viral utilisé. Par exemple, lorsque le vecteur intégratif non viral est un transposon ou pseudo-transposon, l'homme du métier pourra choisir de préférence une transposase pour permettre la transposition de la séquence d'intérêt. De préférence, la source de recombinase fonctionnelle est une transposase. Those skilled in the art can easily verify that the recombinase of interest is "functional" within the meaning of the invention, by in vitro tests well known in the art. This type of assay consists of performing a biochemical analysis of the binding and cleavage activities at the ends of the DNA by the recombinase as well as the analysis of the capacity of the recombinase to transfer DNA strands. In the case of a nuclease, one skilled in the art can easily verify that the enzyme of interest is functional by in vitro tests of specificity of DNA cleavage. The functional recombinase source is preferably selected from transposases, nucleases, integrases and recombinases. In particular, one skilled in the art will be able to choose, from among the various available enzymes, the one that will be best adapted to the integration of the sequence of interest, for example as a function of the non-viral integrative vector used. For example, when the non-viral integrative vector is a transposon or pseudo-transposon, those skilled in the art can preferably choose a transposase to allow the transposition of the sequence of interest. Preferably, the functional recombinase source is a transposase.

Avantageusement, la transposase selon l'invention est choisie parmi la famille de transposases DD[E/D], laquelle comprend notamment les transposases issues des transposons Sleeping Beauty, Frog Prince, MuA, Mos- 1, Pokey, piggyBac, Tol2, Tn3, Tn5, Tn7, Tn10, et Hermès. Cette famille de transposases a notamment été décrite en détail dans Nesmelova et al. (Adv Drug Deliv Rev. ; 30;62(12): 1 187-95; 2010). Avantageusement, l'intégrase selon l'invention est choisie parmi les intégrases de lentivirus ou rétrovirus. Avantageusement, la recombinase selon l'invention est choisie parmi les recombinases de phages (telle que par exemple PhiC31 ). Avantageusement, la nucléase selon l'invention est choisie parmi les nucléases TALEN (pour « Transcription Activotor-Like (TAL) Effector Nudeoses »), ou les nucléases à doigts de zinc (ZFNs, pour « Zinc-finger nucléases »), la Méganuclease, ou les nucléases de type Cas9 (utilisée dans le système CRISPR/Cas9). Advantageously, the transposase according to the invention is chosen from the family of transposases DD [E / D], which notably comprises the transposases resulting from the transposons Sleeping Beauty, Prince Frog, MuA, Mos-1, Pokey, PiggyBac, Tol2, Tn3, Tn5, Tn7, Tn10, and Hermes. This family of transposases has been described in detail in Nesmelova et al. (Adv Drug Deliv Rev.; 30; 62 (12): 1,187-95; 2010). Advantageously, the integrase according to the invention is chosen from integrases of lentivirus or retrovirus. Advantageously, the recombinase according to the invention is chosen from phage recombinases (such as for example PhiC31). Advantageously, the nuclease according to the invention is chosen from the TALEN nucleases (for "Activator-Like Transcription (TAL) Effector Nudeoses"), or the zinc finger nucleases (ZFNs, for "Zinc-finger nucleases"), the meganuclease , or the Cas9 nucleases (used in the CRISPR / Cas9 system).

Par «source de recombinase fonctionnelle se localisant dans le nucléole du noyau cellulaire», on entend au sens de l'invention que la source de recombinase selon l'invention est associée à un système moléculaire permettant sa localisation dans le nucléole du noyau cellulaire. Ainsi, par «se localisant dans le nucléole du noyau cellulaire», on entend que les molécules de « source de recombinase fonctionnelle », qu'il s'agisse de transposases, nucléases, recombinases ou intégrases, sont activement localisées dans la cellule eucaryote de telle sorte qu'une très grande majorité d 'entre elles, voire la totalité, se situent dans le nucléole du noyau cellulaire. Cet adressage des molécules est facilement suivi, notamment par des techniques de microscopie de fluorescence usuelles. By "functional recombinase source located in the nucleolus of the cell nucleus" is meant within the meaning of the invention that the source of recombinase according to the invention is associated with a molecular system for its location in the nucleolus of the cell nucleus. Thus, "locating in the nucleolus of the cell nucleus" means that the "functional recombinase source" molecules, whether transposases, nucleases, recombinases or integrases, are actively located in the eukaryotic cell of so that a very large majority of them, if not all, are in the nucleolus of the cell nucleus. This addressing of the molecules is easily followed, in particular by standard fluorescence microscopy techniques.

Le noyau cellulaire est facilement détectable dans les cellules eucaryotes, et peut notamment être observé par microscopie via un grand nombre de techniques usuelles. Le nucléole est un organite dépourvu de membrane. Malgré cela, le nucléole est individualisé dans le noyau cellulaire et les échanges moléculaires sont actifs et strictement régulés, et réfractaires à la diffusion des macromolécules biologiques. Le nucléole est le plus souvent basophile et donc visible en microscopie optique via des colorants basiques (Pyronine en rouge et bleu de Giemsa). On peut l'observer plus précisément en ayant recours à la microscopie électronique. La localisation de la recombinase dans le nucléole du noyau cellulaire est ainsi facilement évaluable. The cell nucleus is easily detectable in eukaryotic cells, and can in particular be observed by microscopy via a large number of usual techniques. The nucleolus is an organelle devoid of membrane. Despite this, the nucleolus is individualized in the cell nucleus and the molecular exchanges are active and strictly regulated, and refractory to the diffusion of biological macromolecules. The nucleolus is most often basophilic and therefore visible in light microscopy via basic dyes (Pyronine in red and Giemsa blue). It can be observed more precisely by using electron microscopy. The localization of the recombinase in the nucleolus of the cell nucleus is thus easily evaluable.

Les systèmes moléculaires permettant la localisation ciblée de protéines dans le nucléole du noyau cellulaire sont bien connus de l'homme de l'art, et ne nécessitent pas d'être détaillés. Ces systèmes moléculaires comprennent notamment les peptides signaux de localisation nucléolaire NoLS. Ces peptides signaux sont bien connus dans le domaine de la biologie moléculaire et de nombreuses séquences ont été décrites dans la littérature (voir notamment Emmott and Hiscox, 2009; Christophe et al, 2000). Molecular systems for the targeted localization of proteins in the nucleolus of the cell nucleus are well known to those skilled in the art, and do not require not to be detailed. These molecular systems include nucleotide localization signal peptides NoLS. These signal peptides are well known in the field of molecular biology and many sequences have been described in the literature (see in particular Emmott and Hiscox, 2009, Christophe et al, 2000).

Préférentiellement, la source de recombinase fonctionnelle selon l'invention comprend un motif ou signal de localisation nucléolaire, ou NoLS, qui permet sa localisation au nucléole. Preferably, the functional recombinase source according to the invention comprises a nucleolar localization pattern or signal, or NoLS, which allows its localization to the nucleolus.

Par « fournie en trans dudit vecteur intégratif non viral», on entend au sens de l'invention que la source de recombinase fonctionnelle est fournie en complément du vecteur intégratif non viral, c'est-à-dire qu'elle est fournie sous une forme distincte du vecteur intégratif non viral. Par exemple, la source de recombinase fonctionnelle est fournie en trans via un plasmide d'expression qui exprimera la protéine dans la cellule, ou encore via un ARN messager. Alternativement, la source de recombinase fonctionnelle peut être apportée en trans sous la forme d'une protéine, par exemple d'une protéine native isolée, ou, préférentiellement, d'une protéine recombinante purifiée. Les plasmides d'expression et/ou les protéines recombinantes peuvent être produits selon des méthodes d'ingénierie moléculaire et de production de protéines recombinantes usuelles, bien connues de l'homme de l'art. By "provided in trans of said non-viral integrative vector" is meant within the meaning of the invention that the functional recombinase source is provided in addition to the non-viral integrative vector, that is to say that it is provided under a distinct form of the nonviral integrative vector. For example, the functional recombinase source is provided in trans via an expression plasmid that will express the protein in the cell, or via a messenger RNA. Alternatively, the source of functional recombinase can be provided in trans in the form of a protein, for example an isolated native protein, or, preferably, a purified recombinant protein. Expression plasmids and / or recombinant proteins can be produced according to methods of molecular engineering and production of conventional recombinant proteins, well known to those skilled in the art.

Par « vecteur intégratif non viral » on entend au sens de la présente invention un vecteur dont tout ou partie de la séquence nucléotidique est destinée à s'intégrer dans le génome. Au sens de l'invention, les vecteurs intégratifs non viraux comprennent par exemple les dérivés d'éléments génétiques mobiles tels que les transposons ou pseudo-transposons, mais aussi les plasmides dont la séquence est définie de façon à favoriser la transposition d'un transgène par recombinaison homologue stimulée par une nucléase dont la coupure est spécifique. Dans le cas des transposons, l'intégration de la séquence nucléotidique est généralement stimulée par la transposase pour laquelle ils codent. Dans le cas des plasmides visant une recombinaison homologue, l'intégration de la séquence nucléotidique est généralement stimulée par une nucléase de type Méganuclease, Zinc finger Nucléase, TALEN, ou CRISPR/Cas9. Dans le cas des vecteurs intégratifs non viraux au sens de l'invention, l'intégration de la séquence nucléotidique est stimulée par la recombinase apportée en trans. For the purposes of the present invention, the term "non-viral integrative vector" is intended to mean a vector in which all or part of the nucleotide sequence is intended to integrate into the genome. For the purposes of the invention, non-viral integrative vectors comprise, for example, derivatives of mobile genetic elements such as transposons or pseudo-transposons, but also plasmids whose sequence is defined so as to favor the transposition of a transgene. by homologous recombination stimulated by a nuclease whose cut is specific. In the case of transposons, the integration of the nucleotide sequence is generally stimulated by the transposase for which they encode. In the case of plasmids for homologous recombination, the integration of the nucleotide sequence is generally stimulated by a meganuclease, Zinc finger nuclease, TALEN, or CRISPR / Cas9 nuclease. In the case of non-viral integrative vectors within the meaning of the invention, the integration of the nucleotide sequence is stimulated by the recombinase provided in trans.

Par « pseudo-transposon», on entend au sens de l'invention un transposon dépourvu de l'activité transposase. Le plus souvent, le pseudo-transposon est un transposon dont le gène codant pour la transposase d'origine a été supprimé ou muté par des techniques de biologie moléculaire. Un pseudo-transposon possède donc les extrémités ITR et UTR mais est dépourvu de l'activité transposase. Il a par conséquent perdu la capacité à transposer, sauf à être associé à une activité transposase extérieure (fournie en trans). For the purposes of the invention, the term "pseudo-transposon" is intended to mean a transposon devoid of the transposase activity. Most often, the pseudo-transposon is a transposon whose gene encoding the original transposase has been deleted or mutated by molecular biology techniques. A pseudo-transposon therefore has the ends ITR and UTR but is devoid of the transposase activity. It has therefore lost the ability to transpose, except to be associated with an external transposase activity (provided in trans).

De préférence, le pseudo-transposon de l'invention est un transposon dépourvu de l'activité transposase, et choisi parmi les transposons Sleeping Beauty, Frog Prince, piggyBac, MuA, Mos- 1, Himarl, Hsmarl, Pokey, Tol2, Tn3, Tn5, Tn7, Tn10, et Hermès et leur dérivés. De préférence, le pseudo-transposon de l'invention est un transposon dépourvu de l'activité transposase choisi parmi piggyBac et ses dérivés. Preferably, the pseudo-transposon of the invention is a transposon devoid of the transposase activity, and chosen from the transposons Sleeping Beauty, Frog Prince, piggy Bac, MuA, Mos-1, Himarl, Hsmarl, Pokey, Tol2, Tn3, Tn5, Tn7, Tn10, and Hermes and their derivatives. Preferably, the pseudo-transposon of the invention is a transposon devoid of the transposase activity chosen from piggyBac and its derivatives.

Par «vecteur intégratif non viral se localisant dans le nucléole du noyau cellulaire», on entend au sens de l'invention que le vecteur intégratif non viral selon l'invention dispose de, ou est associé à, un système moléculaire permettant sa localisation active dans le nucléole du noyau cellulaire. Ainsi, par «localisé dans le noyau cellulaire», on entend que les molécules de vecteur intégratif non viral sont localisées dans la cellule eucaryote de telle sorte qu'une majorité d'entre elles, voire la totalité, se situent dans le nucléole du noyau cellulaire. Cette localisation majoritaire des molécules est facilement identifiable, notamment par des techniques de microscopie de fluorescence usuelles. By "non-viral integrative vector located in the nucleolus of the cell nucleus" is meant within the meaning of the invention that the non-viral integrative vector according to the invention has, or is associated with, a molecular system allowing its active localization in the nucleolus of the cell nucleus. Thus, by "located in the cell nucleus" it is meant that the non-viral integrative vector molecules are localized in the eukaryotic cell such that a majority or all of them are in the core nucleolus. cellular. This majority localization of the molecules is easily identifiable, in particular by standard fluorescence microscopy techniques.

Les inventeurs ont déterminé que le signal moléculaire le plus efficace permettant de cibler le vecteur intégratif non viral dans le nucléole du noyau cellulaire, et, ainsi, de favoriser l'intégration de la molécule d'acide nucléique d'intérêt dans une région chromosomique associée au nucléole est, de façon particulièrement surprenante, le signal de localisation nucléaire NoLS. Préférentiellement, le vecteur intégratif non viral selon l'invention comprend un motif de localisation nucléolaire, ou NoLS, qui permet sa localisation active dans le nucléole du noyau cellulaire. Ainsi, selon un mode de réalisation de l'invention, ledit vecteur integratif non viral se localise au nucléole et/ou ladite source de recombinase se localise au nucléole via un signal de localisation nucléolaire NoLS. Selon un mode de réalisation de l'invention, le signal de localisation nucléolaire NoLS est un peptide de séquence SEQ ID No.1 : RQARRNRRRRWRERQRQI. The inventors have determined that the most effective molecular signal for targeting the non-viral integrative vector into the nucleolus of the cell nucleus, and thus to promote the integration of the nucleic acid molecule of interest into an associated chromosomal region. to the nucleolus is, in a particularly surprising manner, the nuclear localization signal NoLS. Preferably, the non-viral integrative vector according to the invention comprises a nucleolar localization pattern, or NoLS, which allows its active localization in the nucleolus of the cell nucleus. Thus, according to one embodiment of the invention, said non-viral integrative vector is localized to the nucleolus and / or said source of recombinase is localized to the nucleolus via a NoLS nucleolar localization signal. According to one embodiment of the invention, the nucleolar localization signal NoLS is a peptide of sequence SEQ ID No.1: RQARRNRRRRWRERQRQI.

Par « via un signal de localisation NoLS », on entend au sens de l'invention que le vecteur intégratif non viral selon l'invention dispose de, ou est associé à, un peptide NoLS. By "via a NoLS localization signal" is meant within the meaning of the invention that the non-viral integrative vector according to the invention has, or is associated with, a NoLS peptide.

Le signal de localisation NoLS est un peptide ; il est donc constitué d'acides aminés. Le vecteur intégratif non viral quant à lui est classiquement une molécule constituée d'acides nucléiques. Ainsi, en pratique, l'association du vecteur intégratif non viral selon l'invention avec le signal de localisation NoLS s'effectue par le biais d'un élément de liaison permettant un ancrage chimique ou biochimique. Au sens de l'invention, le système moléculaire de l'invention comprend en outre un élément de liaison dudit signal de localisation NoLS audit vecteur intégratif non viral. The NoLS location signal is a peptide; it is therefore composed of amino acids. The non-viral integrative vector is conventionally a molecule consisting of nucleic acids. Thus, in practice, the association of the non-viral integrative vector according to the invention with the NoLS localization signal is effected by means of a link element allowing a chemical or biochemical anchoring. Within the meaning of the invention, the molecular system of the invention further comprises a binding element of said NoLS localization signal to said non-viral integrative vector.

De préférence, au sens de l'invention, cet élément de liaison est couplé au signal de localisation NoLS. En outre, l'élément de liaison selon l'invention est capable de s'hybrider au vecteur intégratif non viral, en particulier pour former une triple hélice. Au sens de l'invention, toute molécule capable de s'hybrider à une molécule d'ADN et capable d'être couplée à un peptide peut être utilisée comme élément de liaison. Preferably, within the meaning of the invention, this connecting element is coupled to the NoLS location signal. In addition, the binding element according to the invention is capable of hybridizing to the non-viral integrative vector, in particular to form a triple helix. Within the meaning of the invention, any molecule capable of hybridizing to a DNA molecule and capable of being coupled to a peptide may be used as a binding element.

Par hybridation, on entend le processus au cours duquel, dans des conditions appropriées, deux polynucléotides, par exemple un polynucléotide et un ollgonucléotide, se lient avec des liaisons hydrogènes stables et spécifiques pour former un complexe double brin. Dans le cadre de l'invention, une molécule est « capable de s'hybrider avec une molécule d'ADN » si ladite molécule forme un complexe avec la molécule d'ADN dans des conditions stringentes, selon la définition généralement acceptées dans le domaine. L'hybridation de deux polynucléotides peut être totale (le complexe double brin obtenu lors de cette hybridation comprend uniquement des liaisons A-T et des liaisons C-G), ou partielle (le complexe double brin obtenu comprend des bases non liées à une base complémentaire). L'hybridation entre deux polynucléotides dépend des conditions opératoires. Toutes ces données sont bien connues et les conditions appropriées peuvent être déterminées par l'homme du métier. En général, selon la longueur des polynucléotides que l'on souhaite hybrider, la température d'hybridation est comprise entre environ 20 et 70° C, en particulier entre 35 et 65° C dans une solution saline à une concentration d'environ 0,5 à 1 M. By hybridization is meant the process in which, under appropriate conditions, two polynucleotides, for example a polynucleotide and an oligonucleotide, bind with stable and specific hydrogen bonds to form a double-stranded complex. In the context of the invention, a molecule is "able to hybridize with a DNA molecule" if said molecule forms a complex with the DNA molecule under stringent conditions, as defined generally accepted in the art. The hybridization of two polynucleotides can be complete (the double-stranded complex obtained during this hybridization comprises only AT bonds and CG bonds), or partial (the double-stranded complex obtained comprises bases not linked to a complementary base) . hybridization between two polynucleotides depends on the operating conditions. All these data are well known and the appropriate conditions can be determined by those skilled in the art. In general, depending on the length of the polynucleotides that it is desired to hybridize, the hybridization temperature is between about 20 and 70 ° C, in particular between 35 and 65 ° C in a saline solution at a concentration of about 0, 5 to 1 M.

De nombreux domaines protéiques de liaison à l'ADN ont déjà été décrits, tels que par exemple les domaines de liaison à l'ADN de LexA (Schnarr et al. , 1988 ; Oertel- Buchheit et al., 1993), N57SB10 (Izsvak et al. , 2002), et pZFDbcr abl (Me Namara et al. , 2000). Numerous DNA binding protein domains have already been described, such as, for example, LexA DNA binding domains (Schnarr et al., 1988, Oertel-Buchheit et al., 1993), N57SB10 (Izsvak). et al., 2002), and pZFD bcr abl (Me Namara et al., 2000).

Toutefois, les inventeurs ont découvert, de façon tout à fait surprenante, que les molécules les plus efficaces en tant qu'élément de liaison du signal de localisation NoLS audit vecteur intégratif non viral sont les molécules choisies parmi les oligonucléotides formant des triplex (OFT), en particulier les acides nucléiques peptidiques et leurs dérivés. Préférentiellement, le vecteur intégratif non viral selon l'invention comprend une séquence pour l'hybridation de l'élément de liaison. Avantageusement, l'élément de liaison selon l'invention est un oligonucléotide formant des triplex (OFT), de préférence choisi dans le groupe des PNA (acides nucléiques peptidiques), des LNA (acides nucléiques verrouillés, « locked nucleic acids »), des hybrides PNA: PNA (« bisPNA ») et des hybrides LNA: LNA (« Zorro LNA »). En pratique les inventeurs ont déterminé que l'utilisation d'éléments de liaison de type bisPNA oligonucléotide permet la formation de complexes vecteur intégratif non viral /signal de localisation NoLS très stables. De manière avantageuse, l'élément de liaison est un bisPNA couplé au signal de localisation NoLS. However, the inventors have discovered, quite surprisingly, that the most effective molecules as a linkage element of the NoLS localization signal to said non-viral integrative vector are the molecules chosen from the triplex forming oligonucleotides (OFTs). , in particular peptide nucleic acids and their derivatives. Preferably, the non-viral integrative vector according to the invention comprises a sequence for the hybridization of the binding element. Advantageously, the binding element according to the invention is a triplex-forming oligonucleotide (OFT), preferably chosen from the group of PNAs (peptide nucleic acids), LNAs (locked nucleic acids), PNA hybrids: PNA ("bisPNA") and LNA hybrids: LNA ("Zorro LNA"). In practice, the inventors have determined that the use of bisPNA oligonucleotide-type binding elements enables the formation of non-viral integrative vector / highly stable NoLS location signal complexes. Advantageously, the link element is a bisPNA coupled to the NoLS localization signal.

Les acides nucléiques peptidiques (PNA pour « peptide nucleic acids ») et leurs dérivés ont notamment pour avantage de posséder une grande affinité pour l'ADN ou l'ARN. Cette grande affinité permet d'obtenir une hybridation importante avec l'ADN cible, en l'occurrence l'ADN du pseudo-transposon, y compris avec les acides nucléiques peptidiques de petite taille. En outre, les acides nucléiques peptidiques sont des molécules synthétiques qui n'existent pas à l'état naturel, et ne sont pas reconnues par les nucléases ou les protéases. Ces molécules sont par conséquent particulièrement résistantes aux dégradations enzymatiques. The peptide nucleic acids (PNAs for "peptide nucleic acids") and their derivatives have the particular advantage of having a high affinity for DNA or RNA. This high affinity makes it possible to obtain a strong hybridization with the target DNA, in this case the pseudo-transposon DNA, including with the small peptide nucleic acids. In addition, peptide nucleic acids are synthetic molecules that do not exist in the natural state, and are not recognized by nucleases or proteases. These molecules are therefore particularly resistant to enzymatic degradation.

Selon un mode de réalisation de l'invention, le système moléculaire permettant la localisation du vecteur intégratif non viral au nucléole comprend un élément de liaison bisPNA couplé à un signal de localisation NoLS, ledit élément de liaison bisPNA couplé audit signal de localisation NoLS ayant pour séquence la séquence : KKKLLTTCTTCTTTTLLLTTTTCTTCTTLLLKKKRQARRNRRRRWRERQRQI , dans laquelle K, L, I, R, Q, A, N, W et E sont des acides aminés, C et t sont des nucléotides. According to one embodiment of the invention, the molecular system for locating the non-viral integrative vector to the nucleolus comprises a bisPNA binding element coupled to a NoLS location signal, said bisPNA link element coupled to said NoLS location signal having sequence: KKKLLTTCTTCTTTTLLLTTTTCTTCTTLLLKKKRQARRNRRRRWRERQRQI, wherein K, L, I, R, Q, A, N, W and E are amino acids, C and t are nucleotides.

Le couplage entre l'élément de liaison et le signal de localisation pourra facilement être réalisé via des techniques de biologie moléculaire connues de l'homme de l'art, telle que par exemple l'hybridation par TACH (pour «Température- Assisted Cyclic Hybridiazation », détaillée dans Oprea et al. , Mol e/oted7no/. ;45(2): 171 -9; 2010). The coupling between the linking element and the localization signal can easily be achieved via molecular biology techniques known to those skilled in the art, such as, for example, hybridization by TACH (for "Temperature-Assisted Cyclic Hybridization"). ", Detailed in Oprea et al., Mol e / oted7no /.; 45 (2): 171 -9; 2010).

Par « région chromosomique», on entend au sens de l'invention une portion de chromosome de taille variable. Les régions chromosomiques au sens de l'invention peuvent notamment comprendre en tout ou partie, les régions chromosomiques p et q (autrement appelées « bras p » et « bras q » des chromosomes) telles que classiquement définies en biologie cellulaire, bien qu'elles ne se limitent pas à celles-ci. For the purposes of the invention, the term "chromosomal region" is intended to mean a chromosome portion of variable size. The chromosomal regions within the meaning of the invention may in particular comprise all or part of the chromosomal regions p and q (otherwise called "p-arm" and "q-arm" of the chromosomes) as conventionally defined in cell biology, although are not limited to these.

I l est bien connu dans le domaine technique de l'invention que le nucléole comprend différents types de régions chromosomiques, et notamment les NOR (pour Nucleolus Organizer Ré ion) qui sont des régions chromosomiques qui participent à la formation du nucléole. Les NOR comportent plusieurs copies en tandem des gènes codant pour les ARN ribosomiques, ainsi que les domaines de chromatine associés au nucléole (ou « Nucleolus- Associated Chromatin Domains », NADs). Ces domaines et régions ont été décrits dans Németh et al. (PLoS Genêt. 6:e1000889. 2010) et dans Stults et al. (Génome Res. 18: 13-18, 2008). It is well known in the technical field of the invention that the nucleolus comprises different types of chromosomal regions, and especially NORs (for Nucleolus Organizer Re ion) which are chromosomal regions which participate in the formation of the nucleolus. NORs include several tandem copies of genes encoding ribosomal RNAs, as well as nucleolus associated domains (or Nucleolus-Associated Chromatin Domains, NADs). These domains and regions have been described in Nemeth et al. (PLoS Genet 6: e1000889, 2010) and in Stults et al. (Genome Res 18: 13-18, 2008).

Préférentiellement, par « région chromosomique associée au nucléole», on entend au sens de l'invention une région comprenant une région organisatrice du nucléole NOR. Les NOR ont été identifiées chez un grand nombre de mammifères. Chez l'homme, les NOR contiennent des gènes pour les ARNr 5.8S, 18S et 28S et sont localisées sur les bras courts des chromosomes 13, 14, 1 5, 21 et 22 (autrement dit sur les bras p des chromosomes acrocentriques). Les séquences codant pour l'ARN ribosomique 18S de plus de 270 000 espèces vivantes sont recensées dans la base de donnée « Ribosomal dotabase project », et consultables à l'adresse rdp.cme.msu.edu. For the purposes of the invention, the term "chromosomal region associated with the nucleolus" is preferably understood to mean a region comprising an organizing region of the NOR nucleolus. NORs have been identified in a large number of mammals. In humans, NORs contain genes for 5.8S, 18S and 28S rRNAs and are localized on the short arms of chromosomes 13, 14, 15, 21 and 22 (in other words, on the p-arms of acrocentric chromosomes). Sequences coding for 18S ribosomal RNA from more than 270,000 living species are listed in the Ribosomal dotabase project database and can be consulted at rdp.cme.msu.edu.

Les régions associées au nucléole peuvent par conséquent facilement être visualisées par microscopie, selon des techniques de cytogénétique classiques bien établies. Par exemple, les NOR peuvent être localisées indirectement, en identifiant ces régions par la technique d'hybridation in situ (FISH) sur chromosomes mitotiques. Par ailleurs, les NOR peuvent être identifiées par caryotype, suite à une coloration à l'argent. En outre, il est relativement aisé de localiser par cette même technique les séquences d'intérêt que l'on a tenté d'intégrer dans le génome de la cellule. The nucleolus-associated regions can therefore easily be visualized by microscopy, according to well-established conventional cytogenetic techniques. For example, NORs can be localized indirectly, by identifying these regions by the technique of in situ hybridization (FISH) on mitotic chromosomes. In addition, NORs can be identified by karyotype following silver staining. In addition, it is relatively easy to locate by this same technique sequences of interest that we tried to integrate into the genome of the cell.

Ainsi, l'homme du métier peut aisément identifier les régions chromosomiques associées au nucléole et vérifier l'efficacité du système moléculaire de l'invention, quelle que soit l'espèce d'origine de la cellule eucaryote dans laquelle on souhaite effectuer l'insertion de la séquence d 'intérêt. Thus, those skilled in the art can easily identify the chromosomal regions associated with the nucleolus and verify the effectiveness of the molecular system of the invention, regardless of the species of origin of the eukaryotic cell in which it is desired to perform the insertion. of the sequence of interest.

Par « intégration », on entend au sens de l'invention le processus de recombinaison conduisant à l'insertion une molécule d'acide nucléique dans une autre. Ainsi, au sens de l'invention le système moléculaire est capable de conduire à l'intégration de ladite molécule d 'acide nucléique d'intérêt dans la région chromosomique cible de ladite cellule hôte eucaryote, à savoir dans une région chromosomique associée au nucléole. For the purposes of the invention, the term "integration" means the recombination process leading to the insertion of one molecule of nucleic acid into another. Thus, within the meaning of the invention, the molecular system is capable of leading to the integration of said nucleic acid molecule of interest into the chromosomal target region of said eukaryotic host cell, namely in a chromosomal region associated with the nucleolus.

Par « cellule hôte eucaryote», on entend au sens de l'invention une cellule hôte comprenant un noyau individualisé. Dans le cadre de la présente invention, la cellule hôte eucaryote est choisie parmi les cellules de fungi, de plantes et d 'animaux. Au sens de la présente invention, le terme « animaux » comprend les membres du règne animal, et notamment les mammifères, en particulier l'homme. For the purposes of the invention, the term "eukaryotic host cell" is intended to mean a host cell comprising an individualized nucleus. In the context of the present invention, the eukaryotic host cell is chosen from fungi, plant and animal cells. For the purposes of the present invention, the term "animals" includes members of the animal kingdom, and in particular mammals, in particular humans.

Par « molécule d 'acide nucléique d 'intérêt», on entend au sens de l'invention toute molécule d'acide nucléique dont l'introduction dans le génome de la cellule eucaryote selon l'invention est souhaitable, telle que par exemple une molécule d'acide nucléique codant pour un ARN ou un peptide dont on souhaite obtenir une expression, de préférence stable, ou encore une molécule d'acide nucléique induisant une mutation d'intérêt. By "nucleic acid molecule of interest" is meant within the meaning of the invention any molecule of nucleic acid whose introduction into the genome of the cell Ekaryote according to the invention is desirable, such as for example a nucleic acid molecule coding for an RNA or a peptide whose expression is desired, preferably stable, or a nucleic acid molecule inducing a mutation of interest. .

Selon un mode de réalisation préféré, la molécule d'acide nucléique est un gène, en particulier un gène thérapeutique, fonctionnel (on pourra parler de « transgène »). Par « gène thérapeutique », on entend que le gène lui-même ou son produit d'expression présente un intérêt thérapeutique. Au sens de l'invention, un gène est dit « fonctionnel » si la séquence nucléotidique correspondante code pour un ARN, tel que par exemple un ARN structural, une enzyme nucléique (RNAseP, ribozyme), un ARN impliqué dans les mécanismes de l'ARN interférant (miRNA, shRNA), ou code pour un peptide. Selon un mode de réalisation, le gène thérapeutique code pour un peptide s'il comprend au moins un cadre ouvert de lecture (ORF), c'est-à-dire une séquence codante, apte à donner lieu à une séquence en acides aminés présentant une activité thérapeutique. Le gène thérapeutique fonctionnel peut être un gène d'intérêt sauvage ou muté, c'est-à-dire un gène sauvage comprenant une ou plusieurs mutations, dès lors que le produit du gène muté conserve une activité thérapeutique. Ainsi, dans cette définition de « gène fonctionnel », on englobe également les séquences codantes dépourvues de leur promoteur. A titre d'exemple, la molécule d'acide nucléique d'intérêt peut être un gène de résistance à un antibiotique, dépourvu ou non de son promoteur (par exemple, le gène de résistance à la néomycine), ou n'importe quel autre marqueur de sélection approprié. Le nucléole est le site privilégié de la synthèse des molécules d'ARN ribosomal, et comprend essentiellement des molécules d'ARN polymerase de type I. Ainsi, pour faciliter l'expression de la séquence d'intérêt, lorsque les séquences codantes des gènes fonctionnels d'intérêt sont accompagnées d'un promoteur, il s'agit préférentiellement d'un promoteur dépendant de l'ARN polymérase de type I. According to a preferred embodiment, the nucleic acid molecule is a gene, in particular a therapeutic gene, functional (we can speak of "transgene"). By "therapeutic gene" is meant that the gene itself or its expression product is of therapeutic interest. Within the meaning of the invention, a gene is said to be "functional" if the corresponding nucleotide sequence codes for an RNA, such as, for example, a structural RNA, a nucleic enzyme (RNAseP, ribozyme), an RNA involved in the mechanisms of the Interfering RNA (miRNA, shRNA), or code for a peptide. According to one embodiment, the therapeutic gene encodes a peptide if it comprises at least one open reading frame (ORF), that is to say a coding sequence, capable of giving rise to an amino acid sequence presenting a therapeutic activity. The functional therapeutic gene may be a gene of wild or mutated interest, that is to say a wild-type gene comprising one or more mutations, provided that the product of the mutated gene retains a therapeutic activity. Thus, in this definition of "functional gene", coding sequences devoid of their promoter are also encompassed. By way of example, the nucleic acid molecule of interest may be an antibiotic resistance gene, devoid of its promoter or not (for example, the neomycin resistance gene), or any other appropriate selection marker. The nucleolus is the preferred site for the synthesis of ribosomal RNA molecules, and essentially comprises type I RNA polymerase molecules. Thus, to facilitate the expression of the sequence of interest, when the coding sequences of the functional genes of interest are accompanied by a promoter, it is preferentially a promoter dependent on the type I RNA polymerase.

Au sens de l'invention, une « mutation » est conforme à l'acception usuelle en biotechnologie. Ainsi, une mutation peut être une substitution, une addition ou une délétion d'une ou plusieurs bases dans une séquence nucléotidique, ou d'un ou plusieurs acides aminés dans une séquence protéique. Une «mutation» peut notamment désigner une substitution d'au moins une base d'un codon d'une séquence nucléotidique, ladite substitution entraînant par exemple, lors de la traduction de la séquence nucléotidique en cause, l'incorporation d'un acide aminé différent aux lieu et place de l'acide aminé natif, dans la séquence protéique résultante. En règle générale, dans le cas d'un gène fonctionnel, on préférera que la ou les mutations n'entraîne(nt) pas de perte de la fonction biologique du produit muté. En revanche, une diminution d'activité pourra éventuellement être tolérée. De manière générale, une « modification génétique » équivaut à une ou plusieurs mutations. Si une séquence codante est génétiquement modifiée, alors, typiquement, elle contient une ou plusieurs mutations. For the purposes of the invention, a "mutation" is in accordance with the usual meaning of biotechnology. Thus, a mutation may be a substitution, addition or deletion of one or more bases in a nucleotide sequence, or one or more amino acids in a protein sequence. A "mutation" can in particular designate a substitution of at least one base of a codon of a nucleotide sequence, said substitution resulting for example, during the translation of the nucleotide sequence in question, the incorporation of a different amino acid instead and place of the native amino acid in the resulting protein sequence. As a general rule, in the case of a functional gene, it will be preferred that the mutation (s) cause (s) no loss of the biological function of the mutated product. On the other hand, a decrease in activity may possibly be tolerated. In general, a "genetic modification" is equivalent to one or more mutations. If a coding sequence is genetically modified, then, typically, it contains one or more mutations.

Il a été montré qu'en l'absence de contre-sélection, l'intégration de vecteurs dans les répétitions en tandem codant les ARNr est labile dans les cellules germinales. Ce phénomène est dû à un mécanisme de contrôle appelé restauration, qui élimine, dans la lignée germinale (les cellules de la reproduction), en 2 à 5 générations, les copies des gènes contenant des intégrations ou des délétions. It has been shown that in the absence of counter-selection, the integration of vectors into the tandem repeats encoding the rRNAs is labile in germ cells. This phenomenon is due to a control mechanism called restoration, which eliminates, in the germ line (the cells of the reproduction), in 2 to 5 generations, the copies of the genes containing integrations or deletions.

Cette labilité peut être mise en profit pour prévenir une diffusion intempestive des transgènes. Toutefois, il peut être souhaitable dans certains cas de stabiliser l'intégration du transgène dans le temps. This lability can be used to prevent an untimely spread of transgenes. However, it may be desirable in some cases to stabilize transgene integration over time.

Pour cela, il peut être utile d'effectuer des sélections parmi les organismes clonaux obtenus grâce au système moléculaire de l'invention, selon les techniques et méthodes classiquement utilisées dans le domaine. Le nucléole est l'unique siège de transcription par l'ARN polymérase I et l'ARN polymérase II y est absente, sa localisation étant réduite au nucléoplasme (Malyavantham et al 2008; Németh et al 2010). Cette caractéristique présente un intérêt très particulier dans le contexte de l'utilisation de vecteurs ciblés dans les régions nucléolaires. For this, it may be useful to make selections from the clonal organisms obtained through the molecular system of the invention, according to the techniques and methods conventionally used in the field. The nucleolus is the only transcriptional site by RNA polymerase I and RNA polymerase II is absent, its location being reduced to the nucleoplasm (Malyavantham et al 2008, Németh et al 2010). This feature is of particular interest in the context of the use of targeted vectors in the nucleolar regions.

Les inventeurs ont utilisé certains aspects de la localisation des séquences chromosomiques cibles pour déterminer des modes de réalisation des systèmes moléculaires de l'invention qui sont particulièrement avantageux. Dans un mode de réalisation, le vecteur intégratif non-viral selon l'invention comprend un gène rapporteur dont l'expression dépend d 'un promoteur de l'ARN polymérase de type I. L'expression de ce premier gène rapporteur, qui dépend de l'ARN polymérase de type I , pourra ultérieurement être utilisée pour sélectionner les cellules dans lesquelles le système moléculaire de l'invention s'est effectivement intégré au site visé, à savoir le nucléole. Ainsi, l'expression de ce premier gène rapporteur, qui dépend de l'ARN polymérase de type I, pourra ultérieurement être utilisée pour effectuer une « sélection positive ». The inventors have used certain aspects of the location of the target chromosomal sequences to determine embodiments of the molecular systems of the invention which are particularly advantageous. In one embodiment, the non-viral integrative vector according to the invention comprises a reporter gene whose expression depends on a promoter of the type I RNA polymerase. The expression of this first reporter gene, which depends on type I RNA polymerase, may subsequently be used to select cells in which the molecular system of the invention has effectively integrated the target site, namely the nucleolus. Thus, the expression of this first reporter gene, which depends on the type I RNA polymerase, may later be used to perform a "positive selection".

Dans un autre mode de réalisation, le vecteur intégratif non-viral selon l'invention comprend un gène rapporteur dont l'expression dépend d 'un promoteur de l'ARN polymérase de type II. In another embodiment, the non-viral integrative vector according to the invention comprises a reporter gene whose expression depends on a type II RNA polymerase promoter.

L'expression de ce deuxième gène rapporteur, qui dépend de l'ARN polymérase de type I I , pourra ultérieurement être utilisée pour éliminer les cellules dans lesquelles le transgène s'est intégré dans une région autre que le nucléole. Dans cette perspective, l'expression de ce deuxième gène rapporteur, qui dépend de l'ARN polymérase de type I I, pourra ultérieurement être utilisée pour effectuer une « sélection négative». The expression of this second reporter gene, which depends on type II RNA polymerase, may later be used to remove cells in which the transgene has integrated in a region other than the nucleolus. In this perspective, the expression of this second reporter gene, which depends on type II RNA polymerase, may subsequently be used to perform a "negative selection".

A titre d 'exemple, on utilisera de préférence comme gène permettant une sélection positive des gènes de résistance à des antibiotiques spécifiques, ou encore des gènes codant pour des protéines pouvant être facilement observées (fluorescence, activité enzymatique détectable). On pourra par ailleurs utiliser comme gène permettant une sélection négative le gène codant la thymidine kinase de l'herpesvirus 1 humain, laquelle rendra le clone sensible à une sélection par ganciclovir, ou bien encore un gène codant pour une protéine fluorescente, qui permettra le tri des clones par cytométrie de flux. By way of example, it will be preferable to use a gene which makes it possible to select positive genes for resistance to specific antibiotics or genes coding for easily observable proteins (fluorescence, detectable enzymatic activity). The gene encoding the thymidine kinase of human herpesvirus 1, which will make the clone susceptible to selection by ganciclovir, or else a gene encoding a fluorescent protein, which will make it possible to sort the gene, may be used as a negative selection gene. clones by flow cytometry.

Selon un mode de réalisation particulièrement avantageux, le vecteur intégratif non- viral selon l'invention comprend un gène rapporteur dont l'expression dépend d'un promoteur de l'ARN polymérase de type I et un gène rapporteur dont l'expression dépend d'un promoteur de l'ARN polymérase de type II . Les inventeurs ont développé un procédé, mettant en œuvre les systèmes de transposition de l'invention, et permettant d'augmenter de manière très sensible le taux de cellules eucaryotes effectivement génétiquement modifiées par l'intégration de séquences d'intérêt au niveau du nucléole. Le procédé de l'invention repose sur la sélection de caractéristiques d'intérêt par des méthodes usuelles simples et rapides à mettre en œuvre, et qui contribuent à stabiliser l'intégration du transgène dans le temps. La mise en œuvre du procédé de l'invention permet ainsi d'obtenir une population dans laquelle 99,99% des cellules possèdent une modification génétique spécifique. Par « modification génétique spécifique », on entend au sens de la demande que la modification génétique est spécifiquement localisée dans une région chromosomique associée au nucléole de la cellule hôte. According to a particularly advantageous embodiment, the non-viral integrative vector according to the invention comprises a reporter gene whose expression depends on a type I RNA polymerase promoter and a reporter gene whose expression depends on a promoter of type II RNA polymerase. The inventors have developed a method, implementing the transposition systems of the invention, and making it possible to increase very significantly the level of eukaryotic cells actually genetically modified by the integration of sequences of interest at the level of the nucleolus. The method of the invention is based on the selection of characteristics of interest by simple methods that are simple and quick to implement, and which contribute to stabilizing the integration of the transgene over time. The implementation of the method of the invention thus makes it possible to obtain a population in which 99.99% of the cells have a specific genetic modification. By "specific genetic modification" is meant in the sense of the application that the genetic modification is specifically located in a chromosomal region associated with the nucleolus of the host cell.

L'invention vise aussi un procédé de modification génétique d'au moins une cellule hôte eucaryote, comprenant : The invention also relates to a method of genetic modification of at least one eukaryotic host cell, comprising:

a) L'introduction dans ladite cellule d'au moins un système selon l'invention, comprenant ledit vecteur intégratif non viral et ladite source de recombinase fonctionnelle, tel que décrit plus haut ;  a) introducing into said cell at least one system according to the invention, comprising said non-viral integrative vector and said functional recombinase source, as described above;

b) La sélection de cellules de l'étape a), dans lesquelles la molécule d'acide nucléique d'intérêt est exprimée ;  b) The selection of cells of step a), in which the nucleic acid molecule of interest is expressed;

c) La sélection de cellules de l'étape b), dans lesquelles le vecteur intégratif non viral est intégré spécifiquement dans une région chromosomique associée au nucléole.  c) The selection of cells of step b), wherein the non-viral integrative vector is specifically integrated into a chromosomal region associated with the nucleolus.

Le procédé de l'invention se réfère à la cellule hôte telle que précédemment définie dans la présente demande. The method of the invention refers to the host cell as previously defined in the present application.

L'introduction du système de transposition dans la cellule hôte eucaryote peut être faite selon toute technique usuelle connue de l'homme de l'art. A titre d'exemple, les techniques usuelles comprennent notamment la transfection par phosphate de calcium, la transfection par liposomes, la transfection par agents polycationiques, DEAE-Dextran, l'électroporation, et les propriétés particulières de réactifs comme le GeneCellin, le Jet PEI ou les blocks copolymères. En pratique, on pourra transfecter la cellule hôte eucaryote simultanément ou séparément avec le vecteur intégratif non viral et la recombinase, et de préférence avec un élément de liaison couplé au signal de localisation NoLS. Par exemple, le vecteur intégratif non viral (accompagné ou non de l'élément de liaison couplé au signal de localisation NoLS) et la recombinase peuvent être transfectés conjointement ou séparément. The introduction of the transposition system into the eukaryotic host cell can be done according to any usual technique known to those skilled in the art. By way of example, the usual techniques notably include calcium phosphate transfection, liposome transfection, polycationic agent transfection, DEAE-Dextran, electroporation, and the particular properties of reagents such as GeneCellin and PEI Jet. or the copolymer blocks. In practice, the eukaryotic host cell may be transfected simultaneously or separately with the non-viral integrative vector and the recombinase, and preferably with a linker coupled to the NoLS location signal. For example, the non-viral integrative vector (with or without the linking element coupled to the NoLS localization signal) and the recombinase may be transfected together or separately.

Par ailleurs il est possible d'assembler le vecteur intégratif non viral et l'élément de liaison couplé au signal de localisation NoLS préalablement à la transfection. Furthermore, it is possible to assemble the non-viral integrative vector and the linking element coupled to the NoLS localization signal prior to transfection.

La sélection de l'étape a) pourra être réalisée selon des méthodes classiques, par exemple si le vecteur intégratif non viral comprend un gène rapporteur, en sélectionnant les cellules exprimant ce gène rapporteur. A titre d'exemple, on utilisera de préférence comme gène rapporteur des gènes de résistance à des antibiotiques spécifiques, ou encore des gènes codant pour des protéines pouvant être facilement observées (fluorescence, activité enzymatique détectable). Ainsi, de préférence, pour cette étape, on sélectionnera les cellules selon l'expression d'un gène permettant une sélection positive. Dans ce cas, les cellules sélectionnées à l'issue de l'étape b) sont celles qui expriment le gène permettant la sélection positive. The selection of step a) can be carried out according to conventional methods, for example if the non-viral integrative vector comprises a reporter gene, by selecting the cells expressing this reporter gene. By way of example, it will be preferable to use, as the reporter gene, genes for resistance to specific antibiotics, or genes encoding easily observable proteins (fluorescence, detectable enzymatic activity). Thus, preferably, for this step, the cells will be selected according to the expression of a gene allowing positive selection. In this case, the cells selected at the end of step b) are those that express the gene allowing positive selection.

Dans le cas où le gène rapporteur est un gène de résistance à un antibiotique, l'utilisation de cet antibiotique permettra la sélection des clones dans lesquels la séquence nucléotidique d'intérêt est exprimée. In the case where the reporter gene is an antibiotic resistance gene, the use of this antibiotic will allow the selection of clones in which the nucleotide sequence of interest is expressed.

La sélection de l'étape b) pourra être effectuée là encore selon des méthodes classiques, par exemple si le vecteur intégratif non viral comprend un gène rapporteur dont l'expression dépend d'un promoteur de TARN polymérase de type II et permettant une sélection négative. Dans ce cas, les cellules sélectionnées à l'issue de l'étape c) sont celles n'exprimant pas le gène rapporteur. Les cellules exprimant le gène rapporteur dont l'expression dépend d'un promoteur de l'ARN polymérase de type II et permettant une sélection négative sont éliminées. En fonction des modes de réalisation, l'intégration de la molécule d'acide nucléique d'intérêt est réalisée in vitro ou ex vivo ou encore in vivo. Dans les applications in vivo, la cellule hôte est une cellule eucaryote de préférence choisie parmi les cellules de fungi, de plantes, de modèles animaux. The selection of step b) can be carried out again according to conventional methods, for example if the non-viral integrative vector comprises a reporter gene whose expression depends on a type II RNA polymerase promoter and allowing a negative selection. . In this case, the cells selected at the end of step c) are those not expressing the reporter gene. Cells expressing the reporter gene whose expression depends on a type II RNA polymerase promoter and allowing negative selection are eliminated. Depending on the embodiments, the integration of the nucleic acid molecule of interest is carried out in vitro or ex vivo or in vivo. In vivo applications, the host cell is a eukaryotic cell preferably selected from fungi cells, plants, animal models.

Ainsi, l'invention a aussi pour objet l'utilisation d'au moins un système de transposition selon l'invention pour la modification génétique d'au moins une cellule hôte eucaryote, en particulier pour l'intégration contrôlée d'au moins une molécule d'acide nucléique d'intérêt dans le génome d'une cellule hôte eucaryote. Thus, the subject of the invention is also the use of at least one transposition system according to the invention for the genetic modification of at least one eukaryotic host cell, in particular for the controlled integration of at least one molecule. of nucleic acid of interest in the genome of a eukaryotic host cell.

Par « intégration contrôlée », on entend au sens de l'invention que l'intégration de la molécule nucléique d'intérêt est contrôlée spatialement. En particulier, par « intégration contrôlée », on entend que l'intégration est contrôlée pour intervenir dans une région chromosomique associée au nucléole. By "controlled integration" is meant within the meaning of the invention that the integration of the nucleic molecule of interest is controlled spatially. In particular, "controlled integration" means that the integration is controlled to intervene in a chromosomal region associated with the nucleolus.

De plus, l'invention vise aussi une cellule hôte eucaryote génétiquement modifiée susceptible d'être obtenue par le procédé de l'invention. In addition, the invention also relates to a genetically modified eukaryotic host cell that can be obtained by the process of the invention.

En outre, l'invention vise aussi une cellule hôte eucaryote génétiquement modifiée:  In addition, the invention also relates to a genetically modified eukaryotic host cell:

- caractérisée en ce qu'elle contient au moins un système moléculaire selon l'invention; et/ou  characterized in that it contains at least one molecular system according to the invention; and or

- dans laquelle au moins une molécule nucléotidique d'intérêt est intégrée dans une région chromosomique associée au nucléole, conformément au procédé décrit plus haut. En particulier, une telle cellule hôte eucaryote exprimera la molécule d'acide nucléique d'intérêt.  in which at least one nucleotide molecule of interest is integrated into a chromosomal region associated with the nucleolus, according to the method described above. In particular, such a eukaryotic host cell will express the nucleic acid molecule of interest.

L'invention vise aussi un organisme eucaryote transgénique non humain, en particulier un animal transgénique, dont au moins une cellule est une cellule génétiquement modifiée selon l'invention. Par « organisme eucaryote », on désigne ici un fungus, une plante ou un animal. Cette définition ne prétend pas viser spécifiquement les variétés végétales et les races animales en tant que telles, mais peut inclure des individus appartenant à des variétés végétales ou des races animales. Un tel organisme sera, en particulier, un modèle animal notamment utile comme bio-marqueur animal (applicable, par exemple, dans des analyses chimiques environnementales ou de matériaux). Des exemples de modèles animaux sont, de manière non limitative : des mammifères (e.g., bovins, porcins, caprins, ovins, équins, rongeurs tels que souris, rats, hamsters, animaux domestiques tels que chats, chiens), des volatiles (oiseaux, volaille), des poissons. The invention also relates to a non-human transgenic eukaryotic organism, in particular a transgenic animal, of which at least one cell is a genetically modified cell according to the invention. By "eukaryotic organism" is meant here a fungus, a plant or an animal. This definition does not purport to refer specifically to plant varieties and animal breeds as such, but may include individuals belonging to plant varieties or animal breeds. Such an organism will be, in particular, an animal model particularly useful as an animal biomarker (applicable, for example, in chemical analyzes environmental or materials). Examples of animal models are, without limitation: mammals (eg, cattle, pigs, goats, sheep, horses, rodents such as mice, rats, hamsters, domestic animals such as cats, dogs), birds (birds, poultry), fish.

L'invention vise aussi un kit pour l'intégration d'au moins une molécule d'acide nucléique d'intérêt dans le génome d'une cellule hôte eucaryote en vue de son expression, caractérisé en ce qu'il comprend au moins : The invention also relates to a kit for the integration of at least one nucleic acid molecule of interest into the genome of a eukaryotic host cell for the purpose of its expression, characterized in that it comprises at least:

- un système moléculaire, et/ou  - a molecular system, and / or

- une cellule hôte génétiquement modifiée, et/ou - a genetically modified host cell, and / or

- un organisme eucaryote transgénique non humain,  a non-human transgenic eukaryotic organism,

selon l'invention. according to the invention.

En outre, un tel kit pourra comprendre un ou plusieurs éléments supplémentaires, tels que notamment, une solution tampon compatible avec la recombinase ou son équivalent fonctionnel, , un ou plusieurs ADN contrôles (témoins de réaction), des oligonucléotides utiles pour le séquençage permettant de contrôler l'efficacité de la réaction, des bactéries compétentes, une notice d'utilisation. Le kit selon la présente invention peut par exemple être utilisé pour modifier le génome de cellules eucaryotes. Ces modifications peuvent par exemple permettre de modifier le métabolisme des cellules cibles, afin d'augmenter leur rendement en bioproduction. Alternativement, les modifications effectuées peuvent avoir des effets thérapeutiques. In addition, such a kit may comprise one or more additional elements, such as, in particular, a buffer solution compatible with the recombinase or its functional equivalent, one or more control DNAs (reaction controls), oligonucleotides useful for sequencing allowing check the effectiveness of the reaction, the competent bacteria, instructions for use. The kit according to the present invention may for example be used to modify the genome of eukaryotic cells. These modifications may, for example, make it possible to modify the metabolism of the target cells, in order to increase their yield in bioproduction. Alternatively, the modifications made may have therapeutic effects.

Le kit selon la présente invention peut être notamment utilisé pour produire une protéine d'intérêt, particulier une protéine d'intérêt cosmétique, une protéine d'intérêt thérapeutique ou une cellule exprimant une telle protéine. La « protéine d'intérêt » est ici le produit d'expression de la molécule d'acide nucléique d'intérêt intégrée, grâce aux moyens de l'invention, dans le génome de la cellule hôte. Une « cellule exprimant une protéine d'intérêt thérapeutique» peut être qualifiée d'implant, utile notamment en thérapie régénérative. The kit according to the present invention may in particular be used to produce a protein of interest, in particular a protein of cosmetic interest, a protein of therapeutic interest or a cell expressing such a protein. The "protein of interest" is here the product of expression of the nucleic acid molecule of integrated interest, thanks to the means of the invention, in the genome of the host cell. A "cell expressing a protein of therapeutic interest" can be described as an implant, useful in particular in regenerative therapy.

L'invention vise par ailleurs une composition pharmaceutique comprenant au moins : - un système moléculaire selon l'invention, et/ou - une cellule hôte génétiquement modifiée selon l'invention The invention also provides a pharmaceutical composition comprising at least: a molecular system according to the invention, and / or a host cell genetically modified according to the invention

en association avec un support acceptable d'un point de vue pharmaceutique. in combination with a pharmaceutically acceptable carrier.

En tous les cas, les nombreuses applications des moyens de l'invention, pour lesquelles ceux-ci se révèlent d'un intérêt considérable et dont la liste fournie ici est loin d'être exhaustive, font appel à des techniques conventionnelles de biologie moléculaire bien connues de l'homme du métier. In any case, the numerous applications of the means of the invention, for which these are of considerable interest and whose list provided here is far from being exhaustive, call upon conventional techniques of molecular biology well. known to those skilled in the art.

Les exemples ci-après sont fournis à titre purement illustratif et ne limitent en aucune façon l'objet de la présente invention. The following examples are provided for purely illustrative purposes and in no way limit the subject of the present invention.

EXEMPLES EXAMPLES

Les travaux pour obtenir les résultats suivants, concernant les systèmes de l'invention ont été réalisés sur la lignée HeLa de cellule humaine. The work to obtain the following results concerning the systems of the invention was carried out on the human cell HeLa line.

1. Principe du ciblage dans le nucléole des deux composants du vecteur piggybac 1. Principle of targeting in the nucleolus of the two components of the piggybac vector

La source physique de transposase peut être un plasmide ou un ARN messager synthétisé à partir de ce plasmide. Ces deux types de source peuvent être transfectés dans les cellules avec un agent de transfection. L'usage de JetPEl permet d'avoir un seul protocole de transfection pour ces deux types de source. Pour être ciblé dans le nucléole, le gène codant la transposase piggybac a été fusionnée en N- terminal avec un oligonucléotide particulier codant un NoLS (RQARRNRRRRWRERQRQI ; Cochrane et al 1990). The physical source of transposase may be a plasmid or a messenger RNA synthesized from this plasmid. Both types of source can be transfected into the cells with a transfection agent. The use of JetPEl makes it possible to have a single transfection protocol for these two types of source. To be targeted in the nucleolus, the gene encoding the piggybac transposase was fused to an N-terminal with a particular oligonucleotide encoding a NoLS (RQARRNRRRRWRERQRQI, Cochrane et al 1990).

La source physique de vecteur transposon est un plasmide pBS contenant les extrémités d'un vecteur piggybac avec en son centre une cassette codant des marqueurs et un site d'hybridation pour un bis-PNA oligonucléotide couplé à un NoLS (PNA-NoLS ; KKK- LLTTCTTCTTTTLLLTTTTCTTCTT- LLL- KKK- RQARRNRRRRWRERQRQI dans lequel K, L, I, R, Q, A, N, W et E sont des acides aminés ; C et T sont des nucléotides). L'hybridation du PNA-NoLS se fait en utilisant un protocole similaire à une PCR. I l est appelé TACH (Temperature-assisted cyclic hybridization ; Oprea et al 2010). La purification des complexes [plasmide/PNA-NoLS] s'effectue en utilisant des kits de mini-purification de plasmides ou de produits de PCR de type Qiagen, Masherey-Nagel, ou Promega. Le NoLS hybridé sur le plasmide permet l'adressage du plasmide au noyau et au nucléole. Ces complexes [plasmide/ PNA- NoLS] sont transfectés dans les cellules avec un agent de transfection (jetPEl). L'hybridation d'un bis-PNA oligonucléotide sur l'ADN forme une structure résultant d'une double hybridation sur un brin d'ADN qui est beaucoup plus stable que celle résultant de l'hybridation simple d'un PNA oligonucléotide. Cette double hybridation permet de produire des complexes [Plasmide/bis-PNA] qui sont beaucoup plus stables et spécifiques au moment de l'hybridation que les complexes [Plasmide/ PNA] The physical source of transposon vector is a pBS plasmid containing the ends of a piggybac vector with a cassette encoding markers and a hybridization site for a bis-PNA oligonucleotide coupled to a NoLS (PNA-NoLS; KKK- LLTTCTTCTTTTLLLTTTTCTTCTT-LLL-KKK-RQARRNRRRRWRERQRQI wherein K, L, I, R, Q, A, N, W and E are amino acids, C and T are nucleotides). Hybridization of PNA-NoLS is done using a protocol similar to a PCR. It is called TACH (Temperature-assisted cyclic hybridization, Oprea et al 2010). The purification of [plasmid / PNA-NoLS] complexes is carried out using plasmid mini-purification kits or Qiagen-type PCR products. Masherey-Nagel, or Promega. The hybridized NoLS on the plasmid allows the plasmid to be addressed to the nucleus and the nucleolus. These [plasmid / PNA-NoLS] complexes are transfected into cells with a transfection agent (jetPE1). Hybridization of a bis-PNA oligonucleotide on the DNA forms a structure resulting from a double hybridization on a DNA strand that is much more stable than that resulting from the simple hybridization of an oligonucleotide PNA. This double hybridization makes it possible to produce [Plasmid / bis-PNA] complexes which are much more stable and specific at the time of hybridization than the [Plasmid / PNA] complexes.

2. Vérification du fonctionnement du ciblage dans le nucléole des deux composants des vecteurs piggybac 2. Verification of the functioning of targeting in the nucleolus of the two components of piggybac vectors

La séquence des plasmides pBS présentant un site de liaison pour l'oligonucléotide PNA-NoLS et contenant un vecteur piggybac dans lequel est inséré un transgène correspondent aux séquences SEQ ID No.2 et SEQ ID No.3. The sequence of the pBS plasmids having a binding site for the PNA-NoLS oligonucleotide and containing a piggybac vector into which a transgene is inserted corresponds to the sequences SEQ ID No.2 and SEQ ID No.3.

2.1. Protocole d'hybridation du bis-PNA sur le plasmide source de transposon a - Hybridation 2.1. Hybridization protocol for bis-PNA on the transposon source plasmid a-Hybridization

Le bis-PNA-NoLS est ajouté 20, 40 ou 60 fois en excès par rapport au plasmide pour l'hybridation. L'hybridation est effectuée dans des tubes PCR 0.5mL :  The bis-PNA-NoLS is added 20, 40 or 60 times in excess of the plasmid for hybridization. The hybridization is carried out in 0.5mL PCR tubes:

T x20 x40 x60 T x20 x40 x60

PBSK Néo (0.5Mg/ML final) 5.26 5.26 5.26 5.26  PBSK Neo (0.5Mg / ML final) 5.26 5.26 5.26 5.26

Bis-PNA 400μΜ 0 0.5 1 1.5  Bis-PNA 400μΜ 0 0.5 1 1.5

Tampon Phosphate 0.1M pH 5.8 4 4 4 4  0.1M Phosphate Buffer pH 5.8 4 4 4 4

EtOHabs 4 4 4 4  EtOHabs 4 4 4 4

H20 6,74 6.24 5.74 5.24  H20 6.74 6.24 5.74 5.24

Vf 20 [il 20μί 20μί 20μί  Vf 20 [il 20μί 20μί 20μί

Une goutte d'huile minérale est ajoutée à la surface de chaque mix pour éviter l'évaporation pendant la réaction d'hybridation. La réaction d'hybridation est réalisée dans un thermocycler. Le programme utilisé est constitué de 20 cycles de deux phases. - 30s 80° C (dés-hybridation) A drop of mineral oil is added to the surface of each mix to prevent evaporation during the hybridization reaction. The hybridization reaction is carried out in a thermocycler. The program used consists of 20 cycles of two phases. - 30s 80 ° C (de-hybridization)

- 2min 60° C (hybridation) À la fin du programme, l'ensemble du mix contenu dans le tube de 0,5 ml est déposé sur un morceau de parafilm afin de séparer l'huile minérale de la phase aqueuse contenant l'ADN. La séparation des deux phases s'effectue en faisant couler l'échantillon sur le parafilm. L'huile se sépare alors de la phase aqueuse que l'on peut récupérer avec un cône puis dans un micro tube de 1 ,5 mL. b - Purification des complexes bis-PNA/plasmide  - 2min 60 ° C (hybridization) At the end of the program, the whole of the mixture contained in the 0.5 ml tube is deposited on a piece of parafilm in order to separate the mineral oil from the aqueous phase containing the DNA . The two phases are separated by pouring the sample on the parafilm. The oil then separates from the aqueous phase, which can be recovered with a cone and then into a 1.5 ml micro-tube. b - Purification of bis-PNA / plasmid complexes

La purification est effectuée avec les réactifs Utilisation du kit Wizard SV Gel ou le PCR Clean-Up System de Promega : - 200μί Membrane Binding Solution (pour 2,5 μg d'ADN)  Purification is performed with the reagents Using the Wizard SV Gel Kit or the Promega PCR Clean-Up System: - 200μί Membrane Binding Solution (for 2.5 μg DNA)

Agiter doucement  Swirl gently

Déposer sur la colonne munie d'un tube collecteur  Place on the column equipped with a collector tube

Incuber sur la colonne pendant 1 min à température ambiante  Incubate on the column for 1 min at room temperature

Centrifuger 1 min à 1 000 rpm à température ambiante  Centrifuge 1 min at 1000 rpm at room temperature

- Éliminer l'éluat contenu dans le tube collecteur puis remettre la colonne sur le tube collecteur - Remove the eluate contained in the collecting tube and put the column back on the collector tube

Déposer sur la colonne 700 μί Membrane Wash Solution  Add to column 700 μί Membrane Wash Solution

Centrifuger 1 min à 14 000 rpm  Centrifuge 1 min at 14,000 rpm

Éliminer l'éluat contenu dans le tube collecteur puis remettre la colonne dans le tube collecteur  Eliminate the eluate contained in the collector tube and then put the column back into the collector tube

Déposer sur la colonne 500 μί Membrane Wash Solution  Deposit on the column 500 μί Membrane Wash Solution

Centrifuger 5 min à 14 000 rpm  Centrifuge 5 min at 14,000 rpm

Éliminer l'éluat contenu dans le tube collecteur puis remettre la colonne dans le tube collecteur  Eliminate the eluate contained in the collector tube and then put the column back into the collector tube

- Centrifuger 1 min à 14 000 rpm pour sécher la colonne (l'élimination des traces d'EtOH est cruciale) - Centrifuge 1 min at 14,000 rpm to dry the column (removal of traces of EtOH is crucial)

Transférer la colonne sur un nouveau microtube 1 de 0.5 mL  Transfer the column to a new 0.5 ml microtube 1

Éluer les complexes bis-PNA/ADN en incubant la colonne 1 min à température ambiante avec 50 μί « Nucléase-free » water  Elute the bis-PNA / DNA complexes by incubating the column for 1 min at room temperature with 50 μί "Nuclease-free" water

- Centrifuger 1 min à 14 000 rpm Re-éluer avec le premier éluat en réitérant les deux dernières étapes - Centrifuge 1 min at 14000 rpm Re-elute with the first eluate reiterating the last two stages

Dosage de la concentration des ARNs au BioSpec Nano avec 2 μΙ_ c - Contrôle de la qualité des complexes bis-PNA/plasmide  Assay of the concentration of the RNAs with BioSpec Nano with 2 μΙ_ c - Quality control of bis-PNA / plasmid complexes

Les complexes bis-PNA/ADN sont stables pendant au moins 2-3 semaines à 20° C. A tout moment, la qualité d'un stock de complexe peut être vérifiée en utilisant la procédure décrite au ci-dessous. The bis-PNA / DNA complexes are stable for at least 2-3 weeks at 20 ° C. At any time, the quality of a complex stock can be verified using the procedure described below.

Les sites PNABS-560 (fragments de 250 pb) étant clonés entre deux sites uniques dans nos constructions BamHI-Spel, des gels retards par électrophorèse sur gel d 'agarose peuvent être effectués pour vérifier la qualité de l'hybridation spécifique du bis-PNA sur le plasmide.  PNABS-560 sites (250 bp fragments) being cloned between two unique sites in our BamHI-SpeI constructs, agarose gel electrophoresis delayed gels can be performed to verify the quality of specific bis-PNA hybridization. on the plasmid.

Etape I : Digestion 5μί d'élua par BamHI-Spel Step I: 5μί Digestion of Elua by BamHI-Spel

Dans un microtube de 1 ,5 ml, mettre : In a microtube of 1.5 ml, put:

- 0,5 g de complexe - 0.5 g of complex

1 μί Tampon E 10x Promega  1 μί Promega 10x E Buffer

1 [il BSA 1 mg/mL  1 [he BSA 1 mg / mL

0.5 μί. BamHI  0.5 μί. Bam

0.5 ML Spel  0.5 ML Spel

- <¾;ρ Η2Ο έ 10 μί - <¾; ρ Η2Ο έ 10 μί

Incuber 1 h 37° C puis laisser à 4° C  Incubate 1 h 37 ° C then leave at 4 ° C

La totalité des digestions sont déposées sur gel d'agarose 1 %, 1 XTAE, 1 X GelRed Puits 1 : marqueur de taille λ DNA digéré par Hindi 11 All digestions are deposited on 1% agarose gel, 1 XTAE, 1 X GelRed Well 1: Hindi digested λ DNA size marker 11

Puits 2 : pBS-PB-PNABS-pPol1 h-NeoR-pASV40 digéré par BamHI/Spel Well 2: BamHI / Spel digested pBS-PB-PNABS-pPol1 h-NeoR-pASV40

Puits 3 : complexe [pBS-PB-PNABS-pPol1 h-NeoR-pASV40/PNA-NoLS] hybridé en excès de X60 en oligonucléotide puis digéré par BamHI /Spel  Well 3: [pBS-PB-PNABS-pPol1h-NeoR-pASV40 / PNA-NoLS] complex hybridized in excess of X60 to oligonucleotide and then digested with BamHI / Spel

Les résultats sont présentés à la figure 1 . Conclusions : La comparaison du profile central et du profil de droite (B et C) montre l'apparence qu'a le retard lorsque le PNA est hybridé sur l'ADN du plasmide (Disparition de la bande de 250 pb et apparition d'une traînée s'étalant du vecteur depuis le lieu de dépôt de l'échantillon). La méthode d'assemblage et de purification des complexes est donc fiable. 2.2. Vérification de la fonctionnalité du ciblage du plasmide source de transposon Des complexes [plasmide/PNA-NoLS] colorés avec le fluorochrome intercalant YOYO- 1 ont été utilisés pour transfecter des cellules HeLa dans l'objectif de vérifier s'ils ont la propriété d'être activement localisés dans les nucléoles. The results are shown in Figure 1. CONCLUSIONS: Comparison of the central and right profiles (B and C) shows the appearance of the delay when PNA is hybridized on the plasmid DNA (disappearance of the 250 bp band and appearance of dragging the vector from the place of deposit of the sample). The method of assembling and purifying the complexes is therefore reliable. 2.2. Verification of the Functionality of Transposon Source Plasmid Targeting Plasmid / PNA-NoLS complexes stained with YOYO-1 intercalating fluorochrome were used to transfect HeLa cells for the purpose of testing whether they have the property of be actively located in the nucleoli.

Les résultats sont présentés à la figure 2. The results are shown in Figure 2.

Conclusions : Nos résultats ont permis de vérifier que les complexes [plasmide/ PNA- NoLS] sont activement localisés dans les nucléoles. Cependant, cette vérification n'a pu être effectuée que dans des conditions où de faibles quantités de complexes sont transfectées (50 ng). Lorsque de fortes quantités sont utilisées, le système est saturé et des complexes [plasmide/ PNA-NoLS] sont visualisés dans tous les compartiments du noyau. 2.3. Préparation des sources de transposases Conclusions: Our results made it possible to verify that [plasmid / PNA-NoLS] complexes are actively located in the nucleoli. However, this verification could only be performed under conditions where small amounts of complexes are transfected (50 ng). When large amounts are used, the system is saturated and [plasmid / PNA-NoLS] complexes are visualized in all the compartments of the nucleus. 2.3. Preparation of transposase sources

Deux types de transposases ont été utilisées (PB et HIV-NoLS PB) à partir de deux supports : une plasmide vecteur d'expression (Annexe 3) ou un ARN messager. Les ADN plasmiques ont été préparés en utilisant un kit Masherey-Nagel de purification (endotoxine-free). a - Préparation des plasmides  Two types of transposases were used (PB and HIV-NoLS PB) from two supports: an expression vector plasmid (Appendix 3) or a messenger RNA. Plasmic DNAs were prepared using a Masherey-Nagel purification kit (endotoxin-free). a - Preparation of plasmids

Les d'ARN messager à préparer sont clonés dans le vecteur d'expression plasmidique pCS2+ (cf. carte ci-dessous). Pour être utilisé comme matrice de transcription, le plasmide doit être linéarisé par clivage enzymatique avec une enzyme de restriction coupant en aval de l'ORF. Pour que la transcription soit efficace, en particulier sa terminaison, il faut que le clivage produise des fragments avec des extrémités franches ou décalées 5' sortantes. Ici, les enzymes utilisées sont localisées dans le multi-site de clonage (MCS) le plus proximal du promoteur CMV : Notl et Acc65l (isoschizomère de Kpnl à extrémités 5' sortantes). L'enzyme retenue pour la digestion ne devra pas couper dans l'ORF.  The messenger RNAs to be prepared are cloned into the plasmid expression vector pCS2 + (see map below). To be used as a transcription matrix, the plasmid must be linearized by enzymatic cleavage with a restriction enzyme cutting downstream of the ORF. For transcription to be effective, particularly its termination, cleavage must produce fragments with blunt or outgoing 5 'outward ends. Here, the enzymes used are located in the most proximal multi-site cloning (MCS) of the CMV promoter: NotI and Acc651 (KpnI isoschizomer with 5 'outward ends). The enzyme chosen for digestion should not cut into the ORF.

Protocole de linéarisation du plasmide. Linearization protocol of the plasmid.

10 g d'ADN du plasmide  10 g of plasmid DNA

10 μί de 10X de tampon de digestion enzymatique (ici, NEB 3) 1 il De BSA 10mg/ml (final : 100 Mg/ml) 10 μl of 10X of enzymatic digestion buffer (here, NEB 3) 1lb of BSA 10mg / ml (final: 100mg / ml)

5 il d'enzyme de restriction (Notl ou Acc65l selon le plasmide), c.a.d. 50 unité (excès de 5 fois)  5 μl of restriction enzyme (NotI or Acc651 according to the plasmid), ie 50 units (5-fold excess)

ς5ρ 100 μΙ_  ς5ρ 100 μΙ_

Incuber 1 h30 heures à 37° C, puis prélever une aliquote de 5 [il pour contrôler la digestion sur minigel (1 X TAE, 0,8% agarose, 1 X GelRed ; Témoins : 500 ng de plasmide non digéré et 1 marqueur de taille). - Si la digestion est à saturation, incuber la digestion 5 min à 65° C, puis 1 min dans la glace. Incubate for 1 hour 30 hours at 37 ° C, then take a 5 μl aliquot to control digestion on minigel (1 X TAE, 0.8% agarose, 1 X GelRed, controls: 500 ng undigested plasmid and 1 cut). - If digestion is saturated, incubate digestion for 5 min at 65 ° C, then 1 min in ice.

Déproténéisation du plasmide linéarisé. Deprotenization of the linearized plasmid

5 μί. SDS 20%  5 μί. SDS 20%

- x ML protéinase K (final 100 Mg/ml) - ML ML proteinase K (final 100 Mg / ml)

qsp 200 il avec de l'eau stérile  qs 200 it with sterile water

Incuber 1 h heures à 37° C puis 5 minutes dans la glace Incubate 1 hour at 37 ° C and then 5 minutes in the ice

Extraire les protéines en condition volume/volume avec du phénol saturé (pH 6 à 8)/chloroforme (100 [il phénol + 100 μί. chloroforme/alcool iso-amylique 24/1 ) : vortexer 1 minute, puis centrifuger 5 minutes à 13500 rpm (15000 G), et enfin récupérer la phase aqueuse.  Extract the proteins in volume / volume conditions with saturated phenol (pH 6 to 8) / chloroform (100 μl phenol + 100 μl chloroform / isoamyl alcohol 24/1): vortex 1 minute, then centrifuge for 5 minutes at 13500 rpm (15000 G), and finally recover the aqueous phase.

Extraire les traces de phénol en condition volume/volume avec du chloroforme (+ 200 μί. chloroforme/alcool isoamylique 24/1 ) : vortexer 1 minute, puis centrifuger 5 minutes à 1 3500 rpm (15000 G), et enfin récupérer la phase aqueuse.  Extract traces of phenol under volume / volume conditions with chloroform (+200 μl chloroform / isoamyl alcohol 24/1): vortex 1 minute, then centrifuge for 5 minutes at 1 3500 rpm (15000 G), and finally recover the aqueous phase .

Précipiter les acides nucléiques en ajustant à 0,3 M acétate de sodium (solution mère à 3 M, donc plus de 20 μί.) et 3 volumes d 'éthanol absolu. Incuber 1 heure à -80° C ou 1 nuit à -20° C, puis centrifuger 15 min à 1 3500 rpm (1 5000 G), 4° C. Décanter le culot, laver avec 750 μί.) d'EtOH 70% (Le culot est lavé avec 250 μί d'EtOH 70 préparé avec de l'EtOH absolu + H20 Nucléase free (kit)) puis séché à la lampe sur la paillasse ou 10 min dans la cloche à vide.  Precipitate the nucleic acids by adjusting to 0.3 M sodium acetate (stock solution at 3 M, thus more than 20 μl.) And 3 volumes of absolute ethanol. Incubate for 1 hour at -80 ° C or overnight at -20 ° C, then centrifuge for 15 minutes at 1 3500 rpm (1 5000 G), 4 ° C. Decant the pellet, wash with 750 μl.) EtOH 70% (The pellet is washed with 250 μl of EtOH 70 prepared with absolute EtOH + H20 Nuclease free (kit)) and then lamp-dried on the bench or 10 min in the vacuum chamber.

Re-suspendre le culot de plasmide dans 20 μί d'eau RNase-Free  Re-suspend the plasmid pellet in 20 μl of RNase-Free water

Quantifier le plasmide sur le BioSpec Nano avec 2 μί. b - Synthèse des ARN messagers (ARNm) Quantify the plasmid on the BioSpec Nano with 2 μί. b - Synthesis of messenger RNAs (mRNA)

Etape 1 : Transcription et coiffage des ARN Step 1: Transcription and styling of RNAs

1 μg de plasmide linéarisé  1 μg of linearized plasmid

2 [il mix ATP/CTP/GTP1 /5/UTP  2 [he mix ATP / CTP / GTP1 / 5 / UTP

- 2 [il ARCA (tube indépendant du kit de synthèse) - 2 [he ARCA (tube independent of synthesis kit)

2 μΙ. réaction Buffer 10X  2 μΙ. 10X Buffer reaction

2 [il enzyme mix  2 [he enzyme mix

qsp 20 [il avec H20 RNase-Free Incubation 5 heures à 37° C  qsp 20 μl with H20 RNase-Free Incubation 5 hours at 37 ° C.

1 μΐ Turbo DNAse  1 μΐ Turbo DNAse

Incubation 15 min à 37° C Incubation 15 min at 37 ° C

Prélever 1 μΐ pour le contrôle ultérieur sur minigel (contrôle synthèse d 'ARN) Etape 2 : Polyadénylation des ARNs  Take 1 μΐ for subsequent control on minigel (RNA synthesis control) Step 2: Polyadenylation of the RNAs

- 37 μί Η20 - 37 μί Η20

20 il 5X-E-PAP Buffer  20 it 5X-E-PAP Buffer

10 [il MnCl2 25 mM  10 [25 mM MnCl2]

10 [il ATP 10 mM  10 [ATP 10 mM

A μΐ E-PAP (E. coli Poly(A) Polymerase I )  Μΐ E-PAP (E. coli Poly (A) Polymerase I)

νί = 100 Ι_ νί = 100 Ι_

Incubation 2h à 37° C  Incubation 2h at 37 ° C

ajouter 60 [il LiCl 7,5M (2,8125 M final)  add 60 [LiCl 7.5M (2.8125M final)

Précipitation sur la nuit à -20° C Precipitation on the night at -20 ° C

Centrifuger 1 5 min à 13500 rpm (15000 G), 4° C.  Centrifuge 1 5 min at 13500 rpm (15000 G), 4 ° C.

- Décanter le culot - Decant the pellet

Le culot est lavé avec 250 [il d'EtOH 70% préparé avec de l'EtOH absolu + H20 nucléase « free » (kit)  The pellet is washed with 250 μl of 70% EtOH prepared with absolute EtOH + H20 nuclease "free" (kit)

Sécher à la lampe sur la paillasse ou 10 min dans la cloche à vide.  Dry with a lamp on the bench or 10 min in the vacuum bell.

Le culot est repris dans 20 [il d'H20 nucléase free (kit de transcription) Etape 3 : Quantification des ARNm  The pellet is taken up in 20 μl of H20 nuclease free (transcription kit) Step 3: Quantification of the mRNAs

Dosage de la concentration des ARNs au BioSpec Nano avec 2 [il  Assay of the concentration of the RNAs at BioSpec Nano with 2 [he

Etape 4 : Contrôle de la qualité des ARNm Step 4: Quality control of mRNAs

Préparer un minigel en 1 X TAE (spécial ARN), 0,8% Argarose, 1 X GelRed Préparer les échantillons d'ARN pour l'électrophorèse : 1 μΐ d'extrait + 5 μΐ d'H20 nucléase free + 6 μΐ Gel Loading Buffer II (2X ; Ambion). Incuber 5 min à 65° C puis 1 min sur glace Prepare a minigel in 1 X TAE (special RNA), 0.8% Argarose, 1 X GelRed Prepare RNA samples for electrophoresis: 1 μΐ extract + 5 μΐ H20 nuclease free + 6 μΐ Loading Buffer II gel (2X, Ambion). Incubate for 5 min at 65 ° C and then 1 min on ice

Déposer les échantillons dans le gel  Deposit the samples in the gel

- Faire migrer 1 h à 90 V, un marqueur de PM ADN et ARN si disponible en parallèle des 2 échantillons : 1 μΐ Contrôle Synthèse d'ARN et 1 μΐ d'ARN finaux. Etape 5 : Conservation des ARNm à -80° C - To migrate for 1 hour at 90 V, a marker for PM DNA and RNA if available in parallel of the 2 samples: 1 μΐ RNA Synthesis Control and 1 μΐ of final RNA. Step 5: Preservation of mRNA at -80 ° C

Aliquoter les ARNm en 4 échantillons de 4 ί  Aliquot mRNAs in 4 samples of 4 ί

Conserver à -80° C  Store at -80 ° C

2.2. Vérification de la fonctionnalité du ciblage du plasmide source de transposon a - Fonctionnalité du ciblage dans les nucléoles 2.2. Verification of the Functionality of Transposon Source Plasmid Targeting a - Functionality of Targeting in Nucleoli

Des plasmides pCS2 exprimant des fusions PB-GFP, HIV-NoLS-PB-GFP et DSRed-NoLS (marqueur de localisation nucléolaire (Becherel et al. 2006) ont été utilisés pour transfecter des cellules HeLa afin de vérifier si la protéine HIV-NoLS-PB a la propriété d'être activement localisée dans les nucléoles.  Plasmids pCS2 expressing PB-GFP, HIV-NoLS-PB-GFP and DSRed-NoLS fusions (nucleolar localization marker (Becherel et al., 2006) were used to transfect HeLa cells to test for HIV-NoLS protein. -PB has the property of being actively localized in the nucleoli.

Les résultats sont présentés aux figures 3 et 4. Conclusions : Nos résultats ont permis de vérifier que la transposase HIV-NoLS-PB est activement localisée dans les nucléoles. Cependant, cette vérification n'a pu être effectuée que dans des conditions de faible expression de NoLS-PB. Lorsque de fortes expressions sont utilisées, le système est saturé et NoLS-PB est visualisée dans tous les compartiments nucléaires. b - Fonctionnalité de la transposase HIV-NoLS-PB The results are presented in Figures 3 and 4. Conclusions: Our results made it possible to verify that the HIV-NoLS-PB transposase is actively localized in the nucleoli. However, this verification could only be performed under conditions of low NoLS-PB expression. When strong expressions are used, the system is saturated and NoLS-PB is displayed in all nuclear compartments. b - Functionality of the HIV-NoLS-PB transposase

De nombreuses transposases (Sleeping Beauty, Tol2, Mos1 , ... ) et intégrases ont une activité de recombinaison qui est diminuée ou annulée lorsqu'elles sont fusionnées avec un peptide ou un domaine protéique en N-terminale et-ou en C-terminale. L'activité de la fusion N-terminale HIV-NoLS-PB a été comparée à celle de la transposase native PB dans des tests de transposition en cellule HeLa (voir protocole dans la section suivante ; 2 plasmides sont utilisés dans chaque condition de test : une source de transposase et une source de transposon). Deux types de sources de vecteurs transposon ont été utilisés, dont les séquences correspondent aux séquences des SEQ ID No.3 et No.4. Les résultats sont présentés figure 5. Many transposases (Sleeping Beauty, Tol2, Mos1, ...) and integrases have a recombination activity which is diminished or canceled when they are fused with a peptide or an N-terminal and / or C-terminal protein domain. . The activity of N-terminal HIV-NoLS-PB fusion was compared with that of native PB transposase in HeLa cell transposition assays (see protocol in the following section; 2 plasmids are used in each test condition: a source of transposase and a source of transposon). Two types of transposon vector sources have been used, the sequences of which correspond to the sequences of SEQ ID No.3 and No.4. The results are presented in figure 5.

Conclusions : Nos résultats indiquent que l'activité de transposition des deux transposases n'est pas différente quelle que soit la cassette de sélection utilisée dans les vecteurs transposons.  Conclusions: Our results indicate that the transposition activity of the two transposases is not different regardless of the selection cassette used in transposon vectors.

3.3. Conditions de transposition utilisées. 3.3. Transposition conditions used.

Deux types de tests de transposition ont été utilisés. Le premier test implique deux plasmides (une source de transposase et une source de transposon). Dans ce test, l'expression de la transposase a lieu pendant 7 à 8 jours, le temps que le plasmide source de transposase soit naturellement éliminé par la cellule. Le second type de test implique 1 ARNm (comme source de transposase) et un plasmide (comme source de transposon). Dans ce test, l'expression de la transposase a lieu pendant 16 heures, une durée inférieure à celle du temps de division de cellule HeLa fraîchement transfectées. Two types of transposition tests were used. The first test involves two plasmids (a transposase source and a transposon source). In this test, expression of the transposase takes place for 7 to 8 days, the time that the transposase source plasmid is naturally eliminated by the cell. The second type of test involves 1 mRNA (as a transposase source) and a plasmid (as a transposon source). In this assay, expression of the transposase takes place for 16 hours, a shorter duration than the freshly transfected HeLa cell division time.

Le détail des caractéristiques de ces deux sources de transposases PB et les conditions des deux types de tests de transposition sont décrits dans Bire et al (2013). Brièvement, pour chaque test, une source de transposase (~ 200 ng) et une source de vecteur transposon (- 200 ng) sont transfectées pendant 4 heures dans 50.000 cellule HeLa en utilisant du jetPEl comme agent de transfection. Dans la perspective où le ciblage fonctionne très précisément, nous avons retenu des conditions non-optimales de transposition (en terme de quantité de source de vecteur transposon) de façon à pouvoir observer à côté du ciblage du bruit de fond en contrôle. Les cellules sont ensuite cultivées pendant 48 h avant d'être soumise à une sélection en G418 pendant deux semaines. À la fin de la sélection, les cellules clones de cellules résistants au G418 (c.a.d. exprimant stablement le transgène intégré via le vecteur transposon dans les chromosomes) sont fixées et colorées avant d'être dénombrées ou trypsinisées, lavées et culottées afin de purifier leur ADN génomique. Chaque test est tripliqué. Les conditions utilisées permettent l'obtention de cellules génétiquement modifiées par une intégration moyenne de 2 à 3 vecteurs transposons / génome haploïde de clone cellulaire. The details of the characteristics of these two sources of PB transposases and the conditions of the two types of transposition tests are described in Bire et al (2013). Briefly, for each test, a transposase source (~ 200 ng) and a transposon vector source (-200 ng) are transfected for 4 hours in 50,000 HeLa cells using jetPE1 as the transfection agent. From the perspective where the targeting works very precisely, we have retained non-optimal transposition conditions (in terms of the amount of transposon vector source) so that we can observe alongside the targeting of background noise in control. The cells are then cultured for 48 hours before being subjected to G418 selection for two weeks. At the end of the selection, cloned cells of G418-resistant cells (ie stably expressing the integrated transgene via the transposon vector in chromosomes) are fixed and stained before being enumerated or trypsinized, washed and pelleted to purify their DNA. genomics. Each test is triplicate. The conditions used make it possible to obtain genetically modified cells by means of an average integration of 2 to 3 transposon vectors / haploid genome of cellular clone.

4. Vérification de la spécificité d'insertion des vecteurs piggybac dans des unités répétées en tandem contenant les gènes codant les ARNr 18S-5.8S-28S 4.1 . Production de populations de cellules HeLa génétiquement modifiées 4. Verification of the insertion specificity of piggybac vectors in tandem repeat units containing the genes encoding 18S-5.8S-28S rRNAs 4.1. Production of genetically modified HeLa cell populations

Quatorze tests de transposition (indiqués dans le tableau 1 ) ont été effectués avec les sources dont les séquences correspondent aux séquences SEQ ID No.2 à 4.  Fourteen transposition tests (indicated in Table 1) were performed with the sources whose sequences correspond to the sequences SEQ ID No.2 to 4.

Figure imgf000035_0001
Figure imgf000035_0001

Tableau 1 Les tests 1 à 4 sont des témoins de transposition. Une moyenne de ~ 30 clones a été observé pour les tests N ° 1 , 3, 5 et 7. Une moyenne de ~ 0 à 2 clones a été observé pour les tests N ° 2, 4, 6 et 8. Ces témoins correspondent à des tests d'intégration des plasmides sources de transposon par recombinaison aléatoire. Dans nos conditions expérimentales, ils indiquent que les promoteurs cryptiques de TARN polymérase 2 dans le promoteur à l'ARN polymérase 1 (pPoll h) sont inefficaces pour exprimer un transgène dans le nucléoplasme. Table 1 Tests 1 to 4 are transposition controls. An average of ~ 30 clones was observed for the tests N ° 1, 3, 5 and 7. An average of ~ 0 to 2 clones was observed for the tests N ° 2, 4, 6 and 8. These witnesses correspond to integration tests of transposon source plasmids by random recombination. In our experimental conditions, they indicate that the cryptic promoters of RNA polymerase 2 in the RNA polymerase 1 (pPoll h) promoter are ineffective in expressing a transgene in the nucleoplasm.

Des moyennes -1000 et 2000 clones ont été respectivement obtenues avec les tests N° 9 et 10. Des moyennes -50, 300, 200 et 300 clones ont été respectivement obtenues avec les tests N° 1 1 , 12, 13 et 14. Ces résultats indiquent que l'intégration de vecteurs dans les chromosomes par transposition dure probablement plus longtemps lorsque la transposition est effectuée avec deux plasmides plutôt qu'avec un ARNm et un plasmide. Cette différence entre les deux tests de transposition avait déjà été observée dans les tests de transposition non ciblés décrits dans Bire et al (2014). Mean -1000 and 2000 clones were respectively obtained with the tests No. 9 and 10. Mean -50, 300, 200 and 300 clones were respectively obtained with the tests No. 1 1, 12, 13 and 14. These The results indicate that the integration of vectors into transposing chromosomes probably lasts longer when transposition is performed with two plasmids rather than mRNA and plasmid. This difference between the two transposition tests had already been observed in the non-targeted transposition tests described in Bire et al (2014).

4.2. Vérification de la spécificité d 'insertion des vecteurs ciblés. a - Purification des ADN génomique des populations de clones 4.2. Verification of the specificity of insertion of the targeted vectors. a - Purification of genomic DNAs from clone populations

Des lots de 1000 clones de cellules ont été récoltés à partir des tests de transposition N° 9, 10, 1 1 , 12, 13 et 14. L'ADN génomique de ces populations de clones a ensuite été purifié en évitant les kits commerciaux et en utilisant la procédure décrite dans Ahmad et al. 1995. b - Détermination des populations de sites d 'insertions dans chaque population de clones  Lots of 1000 clones of cells were harvested from transposition tests Nos. 9, 10, 11, 12, 13 and 14. The genomic DNA of these clone populations was then purified by avoiding commercial kits and using the procedure described in Ahmad et al. 1995. b - Determination of insertion site populations in each population of clones

I PCR. Le protocole d' IPCR utilisé est celui décrit dans Wang et al. 2012a, le protocole détaillé ayant été à notre demande transmis par les auteurs (Wang et al. 2012b). De nouveaux oligonucléotides adaptés aux vecteurs piggybac ont été définis utilisés pour l'amplification des populations de sites d'insertion sur leur extrémité 5', puis leur marquage I llumina. Pour chaque échantillons, 3 types de digestions par enzymes de restriction a été réalisé : [Tail] , [BsaW1 + BsrF1 + Xmal] (BBX) et [Sau3AI] . Après purification des produits de digestion, les fragments d 'ADN à la concentration de -1 ng^L ont été circularisés pendant la nuit à 16° C par la T4 DNA ligase. Des oligonucleotides ont été conçus et synthétisés pour amplifier les produits d' I PCR puis les marquer pour le séquençage en Illumina (tableau 2). I PCR. The IPCR protocol used is that described in Wang et al. 2012a, the detailed protocol having been at our request transmitted by the authors (Wang et al., 2012b). Novel oligonucleotides adapted to piggybac vectors have been defined used for the amplification of insertion site populations on their 5 'end, then their labeling. For each sample, 3 types of restriction enzyme digestions were performed: [Tail], [BsaW1 + BsrF1 + Xmal] (BBX) and [Sau3AI]. After purification of the digests, the DNA fragments at the concentration of -1 ng / L were circularized overnight at 16 ° C by T4 DNA ligase. of the Oligonucleotides were designed and synthesized to amplify the PCR products and then label them for Illumina sequencing (Table 2).

Nom de Séquence SEQ ID  Sequence name SEQ ID

l'oligonucléotide oligonucleotide

ITR-UTR PB 5'sens ATAAACCTCGATATACAGACC SEQ ID No.5  ITR-UTR PB 5sens ATAAACCTCGATATACAGACC SEQ ID No.5

ITR-UTR PB 5'rev CGATAAMCACATGCGTCAAT SEQ ID No.6  ITR-UTR PB 5'rev CGATAAMCACATGCGTCAAT SEQ ID No.6

TABLEAU 2 Le tableau 3 récapitule les oligonucléotides pour le marquage I llumina des populations de site d'insertion en 5' des vecteurs piggybac.  TABLE 2 Table 3 summarizes the oligonucleotides for Illumina labeling of 5 'insertion site populations of piggybac vectors.

Nom de Séquence SEQ ID Sequence name SEQ ID

l'oligonucléot the oligonucléot

ide ide

Mega- CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCC SEQ ID No.7  Mega- CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCC SEQ ID No.7

Linkerlllumin TGCTGAACCGCTCTTCCGATCTAGTGGCACAGCAGTTAGG  Linkerlllumin TGCTGAACCGCTCTTCCGATCTAGTGGCACAGCAGTTAGG

Ά  Ά

01igoITR5oute AATGATAC G GC GAC CAC C GAGATCTACACTCTTTC C CTAC SEQ ID No.8 rBCN°l ACGACGCTCTTCCGATCTACGCGATAAAACACATGCGTCA  01igoITR5oute AATGATAC G GAC GAC CAC C GAGATCTACACTCTTTC C CTAC SEQ ID NO.8 rBCN ° l ACGACGCTCTTCCGATCTACGCGATAAAACACATGCGTCA

AT  AT

01igoITR5oute AATGATAC G GC GAC CAC C GAGATCTACACTCTTTC C CTAC SEQ ID No.9 rBCN°2 ACGACGCTCTTCCGATCTCTACGATAAAACACATGCGTCA  01igoITR5oute AATGATAC G GAC GAC CAC C GAGATCTACACTCTTTC C CTAC SEQ ID No.9 rBCN ° 2 ACGACGCTCTTCCGATCTCTACGATAAAACACATGCGTCA

AT  AT

01igoITR5oute AATGATAC G GC GAC CAC C GAGATCTACACTCTTTC C CTAC SEQ ID No.10 rBCN°3 ACGACGCTCTTCCGATCTGATCGATAAAACACATGCGTCA  01igoITR5out AATGATAC G GC GAC CAC C GAGATCTACACTCTTTC C CTAC SEQ ID NO.10 rBCN ° 3 ACGACGCTCTTCCGATCTGATCGATAAAACACATGCGTCA

AT  AT

01igoITR5oute AATGATAC G GC GAC CAC C GAGATCTACACTCTTTC C CTAC SEQ ID No.11 rBCN°4 ACGACGCTCTTCCGATCTTGCCGATAAAACACATGCGTCA  01igoITR5oute AATGATAC G GAC GAC CAC C GAGATCTACACTCTTTC C CTAC SEQ ID NO.11 rBCN ° 4 ACGACGCTCTTCCGATCTTGCCGATAAAACACATGCGTCA

AT AT

TABLEAU 3 LAM-PCR. Le protocole de LAM-PCR utilisé est celui décrit dans Bartholomae et al. 2012. Ce protocole a été défini pour amplifier des sites d 'insertion de lentivirus. De nouveaux oligonucleotides adaptés aux vecteurs piggybac ont été définis utilisés pour l'amplification des populations de sites d'insertion sur leur extrémité 5', puis leur marquage I llumina. Pour chaque échantillons, 3 types de digestions par enzymes de restriction a été réalisé : [Dpnll] , [Pcil + Ncol + BspHI] (PNB) et [Spel + Avril + Nhel + Xbal] (SANX). Des oligonucleotides pour chacun de ces types de coupure ont été désignés et synthétisés. TABLE 3 LAM-PCR. The LAM-PCR protocol used is that described in Bartholomae et al. 2012. This protocol has been defined to amplify lentivirus insertion sites. New oligonucleotides adapted to piggybac vectors have been defined used for the amplification of insertion site populations on their 5 'end, followed by their labeling. For each sample, 3 types of restriction enzyme digestions were performed: [Dpnll], [Pcil + Ncol + BspHI] (PNB) and [Spel + Avril + Nhel + Xbal] (SANX). Oligonucleotides for each of these cleavage types have been designated and synthesized.

Le tableau 4 récapitule les oligonucléotides biotynylés (B) ou non pour les 3 amplifications nichées de l'extrémité 5' des vecteurs piggybac. Table 4 summarizes the biotynylated oligonucleotides (B) or not for the 3 amplifications nested at the 5 'end of the piggybac vectors.

Nom de Séquence SEQ ID Sequence name SEQ ID

l'oligonucléotide oligonucleotide

(B)-ITR-UTR 5' PB (B)- SEQ ID No.12  (B) -ITR-UTR 5 'PB (B) - SEQ ID No.12

pSV40 I GACTTTCCACACCCTAACTGACAC pSV40 I GACTTTCCACACCCTAACTGACAC

(B)-ITR-UTR 5' PB (B)- SEQ ID No.13  (B) -ITR-UTR 5 'PB (B) - SEQ ID No.13

pPollh I GAT C C AT G AATT CGTCGACATCG pPollh I GAT C C AT G AATT CGTCGACATCG

ATACCA  ATACCA

(B)-ITR-UTR PB 5ΊΙ (B)- SEQ ID No.14  (B) -ITR-UTR PB 5ΊΙ (B) - SEQ ID No.14

ATAAAC CTC GATATAC AG AC C ATAAAC CTC GATATAC AG AC C

TABLEAU 4 Le tableau 5 récapitule les oligonucléotides utilisés pour chaque type de coupure par enzyme de restriction TABLE 4 Table 5 summarizes the oligonucleotides used for each type of restriction enzyme cleavage

Nom de Séquence SEQ ID  Sequence name SEQ ID

l'oligonucléotid the oligonucléotid

G  BOY WUT

Oligo I GACCCGGGAGATCTGAATTCAGTGGCACAGCAGT SEQ ID No.15  Oligo I GACCCGGGAGATCTGAATTCAGTGGCACAGCAGT SEQ ID No.15

TAGG  Tagg

Oligo II Dpnll GATCCCTAACTGCTGTGCCACTGAATTCAGATC SEQ ID No.16 Oligo II Dpnll GATCCCTAACTGCTGTGCCACTGAATTCAGATC SEQ ID No.16

Oligo II PNB CATGCCTAACTGCTGTGCCACTGAATTCAGATC SEQ ID No.17 Oligo II PNB CATGCCTAACTGCTGTGCCACTGAATTCAGATC SEQ ID No.17

TABLEAU 5  TABLE 5

Le tableau 6 récapitule les oligonucléotides pour le marquage I llumina des populations de site d'insertion en 5' des vecteurs piggybac. Nom de Séquence SEQ ID Table 6 summarizes the oligonucleotides for lllumina labeling of 5 'insertion site populations of piggybac vectors. Sequence name SEQ ID

l'oligonucléotide oligonucleotide

Mega- CAAGCAGAAGACGGCATACGAGATCGGTCTCGGC SEQ ID No.1 8  Mega- CAAGCAGAAGACGGCATACGAGATCGGTCTCGGC SEQ ID No.1 8

Linkerlllumina ATTCCTGCTGAACCGCTCTTCCGATCTAGTGGCA  Linkerlllumina ATTCCTGCTGAACCGCTCTTCCGATCTAGTGGCA

CAGCAGTTAGG  CAGCAGTTAGG

01igoITR5outerB AATGATACGGCGACCACCGAGATCTACACTCTTT SEQ ID No.1 9  01igoITR5outerB AATGATACGGCGACCACCGAGATCTACACTCTTT SEQ ID No.1 9

CN°1 CCCTACACGACG CTCTTCC GATCTAC GC GATAAA  CN ° 1 CCCTACACGACG CTCTTCC GATCTAC GC GATAAA

ACACATGCGTCAAT  ACACATGCGTCAAT

01igoITR5outerB AATGATACGGCGACCACCGAGATCTACACTCTTT SEQ ID No.20  01igoITR5outerB AATGATACGGCGACCACCGAGATCTACACTCTTT SEQ ID No.20

CN°2 CCCTACACGACGCTCTTCCGATCTCTAC GATAAA  CN ° 2 CCCTACACGACGCTCTTCCGATCTCTAC GATAAA

ACACATGCGTCAAT  ACACATGCGTCAAT

01igoITR5outerB AATGATACGGCGACCACCGAGATCTACACTCTTT SEQ ID No.21  01igoITR5outerB AATGATACGGCGACCACCGAGATCTACACTCTTT SEQ ID No.21

CN°3 CCCTACACGACGCTCTTCCGATCTGATCGATAAA  CN ° 3 CCCTACACGACGCTCTTCCGATCTGATCGATAAA

ACACATGCGTCAAT  ACACATGCGTCAAT

01igoITR5outerB AATGATACGGCGACCACCGAGATCTACACTCTTT SEQ ID No.22  01igoITR5outerB AATGATACGGCGACCACCGAGATCTACACTCTTT SEQ ID No.22

CN°4 CCCTACACGACGCTCTTCCGATCTTGCCGATAAA  CN ° 4 CCCTACACGACGCTCTTCCGATCTTGCCGATAAA

ACACATGCGTCAAT  ACACATGCGTCAAT

Oligo II SANX CTAGCCTAACTGCTGTGCCACTGAATTCAGATC SEQ ID No.23  Oligo II SANX CTAGCCTAACTGCTGTGCCACTGAATTCAGATC SEQ ID No.23

TABLEAU 6  TABLE 6

Le séquençage des populations de fragments correspondant à des sites d'insertion de vecteur piggybac a été réalisé en I llumina MiSeq, 300-pb par lecture. Environ 2 millions de lectures ont été obtenues par échantillon. c - Procédure d 'analyse des séquences Mi-Seq Sequencing of fragment populations corresponding to piggybac vector insertion sites was performed in Illumina MiSeq, 300-bp per reading. Approximately 2 million readings were obtained per sample. c - Sequence analysis procedure Mi-Seq

Préambule sur les limites de la LAM-PCR. Preamble on the limits of the AML-PCR.

La LAM-PCR est une approche dont l'objectif est de déterminer le profil d'insertion d'un vecteur dans les chromosomes. C'est une approche qualitative et peu quantitative. En effet, les amplifications faites par PCR conduisent systématiquement à l'amplification préférentielle de fragments qui représentent pour les 20 plus nombreux 90% des lectures. Ce biais d'amplification est constant. En conséquence, si une quantification stricte de l'efficacité du ciblage d'un vecteur ne peut pas être effectuée, la comparaison de résultats de LAM-PCR permet de déterminer s'il existe des différences entre échantillons provenant de test de transposition utilisant des vecteurs intégratif à insertion ciblée ou non. Préambule sur les cibles chromosomiques du ciblage. LAM-PCR is an approach whose objective is to determine the insertion profile of a vector in chromosomes. It is a qualitative approach and not very quantitative. In fact, the amplifications made by PCR systematically lead to the preferential amplification of fragments which represent for the most numerous 90% of the readings. This amplification bias is constant. Therefore, if a strict quantification of vector targeting efficiency can not be performed, the comparison of LAM-PCR results makes it possible to determine whether there are differences between samples taken from vector-based transposition assays. integrative with targeted insertion or not. Preamble on the chromosomal targets of targeting.

Le ciblage des vecteurs de l'invention est dirigé vers les régions chromosomiques associées aux nucléoles. Dans un génome haploïde contenant au maximum 500 unités de répétition des gènes codant les ARNr 18S-5.8S-28S, celles-ci représentent -0,69 % du génome d'une cellule HeLa. Leurs régions flanquantes et les NADs représentent respectivement -0,55% et -2,92% du génome. Les séquences liées à la membrane nucléaire, appelées lamina-associated domains (LADs), représentent -36,83 % du génome (Guelen et al 2008). Leur caractéristique d 'être compactée sur la membrane nucléaire fait que ces séquences sont, en théorie, moins accessible à la transposition. Elles ont donc été retenues comme témoins interne à nos expériences de ciblage.  The targeting of the vectors of the invention is directed to the chromosomal regions associated with the nucleoli. In a haploid genome containing a maximum of 500 repeating units of the 18S-5.8S-28S rRNA genes, these represent -0.69% of the genome of a HeLa cell. Their flanking regions and NADs represent respectively -0.55% and -2.92% of the genome. Nuclear membrane-bound sequences, called lamina-associated domains (LADs), represent -36.83% of the genome (Guelen et al 2008). Their characteristic of being compacted on the nuclear membrane makes these sequences, in theory, less accessible to transposition. They were therefore retained as internal witnesses to our targeting experiments.

Dans un test de transposition dans lequel l'insertion est aléatoire (non ciblée), il est donc attendu à ce que 4.4 à 4.5 % des insertions aient lieu dans ces séquences chromosomiques nucléolaires, si et seulement si ces séquences sont aussi accessibles que n'importe quelle autre séquence contenue dans le nucléoplasme. Cependant, comme l'entrée et la sortie de macromolécules dans le nucléole sont fortement contrôlées et nécessites des mécanismes actifs de transport, il est attendu que le vecteur n'ait pas ou très peu la capacité de diffuser dans cet organite. En conséquence, il est attendu que le niveau d'insertion des vecteurs non ciblés dans les régions chromosomiques nucléolaires soit faible, voir nul, du moins dans les tests dont la durée de transposition est inférieure à celle d 'un cycle de division des cellules. In a transposition test in which the insertion is random (non-targeted), it is therefore expected that 4.4 to 4.5% of the insertions will occur in these nucleolar chromosomal sequences, if and only if these sequences are as accessible as n any other sequence contained in the nucleoplasm. However, as the entry and exit of macromolecules in the nucleolus are highly controlled and require active transport mechanisms, it is expected that the vector has little or no ability to diffuse into this organelle. Therefore, it is expected that the level of insertion of the non-targeted vectors into the nucleolar chromosomal regions is low, or even zero, at least in tests whose transposition time is shorter than that of a cell division cycle.

Préambule sur les propriétés des populations de sites d'insertion obtenues par PCR. Impact de l'approche moléculaire. L'approche LAM-PCR (idem pour l'IPCR) produit des résultats qualitatifs sur la capacité ou non d 'un vecteur à intégrer une cible. Cette approche est limitée par des défauts inhérents (sensibilité au taux de GC des séquences à amplifier, les rDNA étant très riche en GC% (60 à 80%), vis à vis des autres séquences dont le GC% moyen est de 45% ; Aird et al 201 1 , Oyola et al 2012 ; van Heesch et al 2013) dès qu 'il s'agit d 'obtenir des résultats qualitatifs. Dans le cas des vecteurs de l'invention, où les séquences ciblées sont nucléolaires (au total -4,16 % du génome), les résultats ne vont strictement pouvoir répondre qu'aux questions suivantes : 1 - Les différentes combinaisons de sources de vecteurs, ciblées ou non, sont-elles ciblées dans les séquences nucléolaires ? Preamble on the properties of populations of insertion sites obtained by PCR. Impact of the molecular approach. The LAM-PCR approach (same for IPCR) produces qualitative results on the ability or not of a vector to integrate a target. This approach is limited by inherent defects (sensitivity to the GC level of the sequences to be amplified, the rDNA being very rich in GC% (60 to 80%), compared to the other sequences whose average GC% is 45%; Aird et al 201 1, Oyola et al 2012, van Heesch et al 2013) as soon as it is necessary to obtain qualitative results. In the case of the vectors of the invention, where the targeted sequences are nucleolar (in total -4.16% of the genome), the results will strictly be able to answer only the following questions: 1 - Are the different combinations of vector sources, targeted or not, targeted in the nucleolar sequences?

2 - Les combinaisons ciblées sont-elles plus efficaces pour cibler dans les séquences nucléolaires ?  2 - Are targeted combinations more effective for targeting in nucleolar sequences?

Les réponses à ces deux questions sont cependant nécessaires et suffisantes pour démontrer l'efficacité du ciblage. The answers to these two questions are, however, necessary and sufficient to demonstrate the effectiveness of targeting.

Impact de l'analyse informatique. Une chaîne complète d'analyse de banques de séquences d'ADN décrivant les populations de sites d'insertions obtenues par LAM- PCR ou par IPCR est disponible (HASTI ; Arens et al 2012). Cependant, HASTI ne permet pas l'automatisation de la séparation des séquences en fonction des tags (spécifiques de chaque conditions) et n'a pas une qualité de cartographie des locus suffisante pour nos travaux. Une chaîne de traitement maison a donc été créée pour traiter nos données. Impact of computer analysis. A complete chain of DNA sequence library analysis describing insertion site populations obtained by LAM-PCR or IPCR is available (HASTI, Arens et al 2012). However, HASTI does not allow the automation of the sequence separation according to the tags (specific to each condition) and does not have a quality of locus mapping sufficient for our work. A homemade processing chain was created to process our data.

Tout d'abord, au cours des étapes 1 à 3, sont retirés des séquences les fragments suivants : tag : 8 possibilités (acg cta gat tgc atc cet gta tgc) - obligatoire (les séquence ne le possédant pas sont exclues du traitement ultérieur) First, in steps 1 to 3, the following fragments are removed from the sequences: tag: 8 possibilities (acg cta gat tgc atc this gta tgc) - mandatory (the sequences that do not possess it are excluded from the subsequent processing)

· amorce : 2 possibilité (5' ou 3') - obligatoire · Primer: 2 possibilities (5 'or 3') - obligatory

• fragment piggybac (PB) : 1 possibilité mais différente suivant le type d'amorce (5' ou 3') - obligatoire  • fragment piggybac (PB): 1 possibility but different according to the type of primer (5 'or 3') - obligatory

TSD : le TSD canonique de PB est TTAA  TSD: PB's canonical TSD is TTAA

• le linker illumina 3' : peut être présent  • the linker illuminates 3 ': may be present

Une fois ces fragments retirés, les séquences restantes (la séquence flanquant le locus d'insertion) sont cartographiées sur le génome humain en utilisant bwa (Li and Durbin, 2010). Les locus cartographiés sont ensuite filtrés : ne sont conservés que les locus pour lesquels l'alignement de la séquence couvre au moins 95 % de celle-ci. d - Résultats de l'analyse qualitative du ciblage des prototypes de vecteur Once these fragments are removed, the remaining sequences (the sequence flanking the insertion locus) are mapped to the human genome using bwa (Li and Durbin, 2010). The mapped loci are then filtered: only the loci for which the alignment of the sequence covers at least 95% of it are conserved. d - Results of the qualitative analysis of the targeting of vector prototypes

Les analyses ont été réalisées avec les deux types de population de séquences produites par IPCR et LAM-PCR à partir d'amplification faites sur l'extrémité 5' du vecteur. Les résultats sont présentés sous forme graphique. Pour chaque prototype de vecteur, les résultats sont exprimés en pourcentages de locus (barres noires) et en pourcentages de séquences cartographiées (barres grises) dans chacune de des 6 catégories nucléaires suivantes : Nucléoplasme, « Lamina-associated domains », « Nucleolus-associated domains », « rDNA repeats », « rDNA flanking régions » et Total Nucléoles. Il a été considéré que les deux pourcentages devaient avoir la même tendance dans les 4 essais pour être pris en compte. En références ont été utilisés les pourcentages attendus dans chacun des compartiments si la transposition avait eu lieu de façon non ciblée et de façon équivalente dans tous les compartiments nucléaires. Le prototype de vecteur totalement ciblé pour ses deux composants et dont le gène marqueur dépend d'un promoteur nucléolaire (Poil) est indiqué en italique. d1 - Contrôle de l'aptitude de nos approches expérimentales à détecter tropismes d'insertion des vecteurs piggyBac en fonction de l'accessibilité à l'ADN chromosomique. Assays were performed with both population types of sequences produced by IPCR and LAM-PCR from amplification made on the 5 'end of the vector. The results are presented in graphical form. For each vector prototype, the results are expressed in percentages of locus (black bars) and in percentages of mapped sequences (gray bars) in each of the 6 following nuclear categories: Nucleolasm, "Lamina-associated domains", "Nucleolus-associated domains", "rDNA repeats", "rDNA flanking regions" and Total Nucleol. It was considered that the two percentages should have the same tendency in the 4 trials to be taken into account. In reference, the percentages expected in each of the compartments were used if the transposition had taken place in a non-targeted manner and in an equivalent manner in all the nuclear compartments. The prototype vector totally targeted for its two components and whose marker gene depends on a nucleolar promoter (Hair) is indicated in italics. d1 - Control of the aptitude of our experimental approaches to detect tropisms of insertion of the piggyBac vectors according to the accessibility to the chromosomal DNA.

Les LADs sont des compartiments nucléaires qui contiennent des domaines chromosomiques fortement hétérochromatinisés. Il est donc attendu que les régions d'ADN génomique contenues dans les LADS soient moins accessibles à l'intégration de vecteurs intégratifs, en particulier lors des phases GO et G1 du cycle cellulaire. Les profils d'insertion de 6 prototypes de vecteurs ont donc d'abord été analysés dans cette perspective (voir figure 6 et 7).  LADs are nuclear compartments that contain highly heterochromatinized chromosomal domains. It is therefore expected that the genomic DNA regions contained in the LADS are less accessible to the integration of integrative vectors, in particular during the phases GO and G1 of the cell cycle. The insertion profiles of 6 vector prototypes were therefore first analyzed in this perspective (see Figure 6 and 7).

La première observation est que les six prototypes de vecteurs tendent à significativement plus s'insérer dans l'ADN contenu dans le nucléoplasme. Les taux d'intégration dans le nucléoplasme sont systématiquement plus élevés que le taux attendu par le simple effet du hasard. The first observation is that the six vector prototypes tend to significantly fit into the DNA contained in the nucleoplasm. The integration rates in the nucleoplasm are systematically higher than the expected rate by the simple effect of chance.

La seconde observation est que les six prototypes de vecteurs tendent à significativement moins s'insérer dans l'ADN contenu dans les LADs. The second observation is that the six vector prototypes tend to significantly less fit into the DNA contained in the LADs.

Ces résultats ont été confirmés en utilisant non pas la quantité d'ADN présent dans chaque compartiment nucléaires, mais la quantité de sites d'insertion potentiels pour nos vecteurs piggyBac (tétranucléotide « TTAA »). These results were confirmed using not the amount of DNA present in each nuclear compartment, but the amount of potential insertion sites for our piggyBac (tetranucleotide "TTAA") vectors.

Proportions des catégories nucléaires / de la quantité dADNg ou du nombre de motifs TTAA dans la version hg19 du génome humain. Compartiments % dans l'ADNg % des motifs # de motifs Densité en nucléaires total TTAA totaux TTAA TTAA / MpbProportions of nuclear categories / amount of DNA or number of TTAA motifs in the hg19 version of the human genome. % Compartments in gDNA% of motifs # of units Total nuclear density TTAA totals TTAA TTAA / Mpb

Nucleoplasme 59,0057 53,0563 38092044 12304,85Nucleoplasm 59.0057 53.0563 38092044 12304.85

LADs 36,8351 43,5537 16590508 1 540,64LADs 36.8351 43.5537 16590508 1 540.64

NADs 2,9292 3,0033 1144020 12608,90NADs 2.9292 3.0033 1144020 12608.90

Flanking rDNA 0,5359 0,1898 72290 4354,82 rDNA 0,6941 0,1969 75000 3488,45Flanking rDNA 0.5359 0.1898 72290 4354.82 rDNA 0.6941 0.1969 75000 3488.45

Totale Nucléole 4,1591 3,3899 1291310 12028,86 Total Nucleolus 4,1591 3,3899 1291310 12028.86

TABLEAU 7  TABLE 7

Les résultats obtenus (voir les figures 8 et 9) en prenant en compte le nombre de sites TTAA par catégorie de domaines nucléaires confirment et même amplifient les conclusions tirées de la première analyse sur la différence d'accessibilité aux vecteurs intégratifs entre LADs et nucléoplasme. Ces contrôles ont permis de vérifier que les prédictions faites sur l'accessibilité de l'ADN chromosomique aux vecteurs intégratifs en fonction sa localisation dans le nucléoplasme ou les LADs sont systématiquement vérifiés dans les résultats de notre approche expérimentale. Les taux d'intégration sont systématiquement moins élevés que le taux aléatoire attendu dans le nucléoplasme. d2 - Présence d'insertion dans l'ADN génomique contenu dans l'ensemble des régions nucléolaires. The results obtained (see Figures 8 and 9) taking into account the number of TTAA sites by nuclear domain category confirm and even amplify the conclusions drawn from the first analysis on the difference in accessibility to integrative vectors between LADs and nucleoplasm. These controls made it possible to verify that the predictions made on the accessibility of the chromosomal DNA to integrative vectors as a function of its location in the nucleoplasm or the LADs are systematically verified in the results of our experimental approach. Integration rates are consistently lower than the expected random rate in the nucleoplasm. d2 - Presence of insertion in the genomic DNA contained in the set of nucleolar regions.

Les régions nucléolaires ont représentées par les « Nucleolus-associated domains », les « rDNA repeats », et les « rDNA flanking régions ». The nucleolar regions were represented by the "Nucleolus-associated domains", the "rDNA repeats", and the "rDNA flanking regions".

L'analyse des résultats (figure 10) fournis quatre informations. The analysis of the results (Figure 10) provided four pieces of information.

1 - L'ADN génomique contenu dans le nucléole est difficile d'accès pour un vecteur intégratif, même ciblé.  1 - The genomic DNA contained in the nucleolus is difficult to access for an integrative vector, even if targeted.

2 - Le prototype de vecteur intégratif dont les deux composants sont ciblés dans le nucléole (pCS2-HIV-PB x pPol1 h-Neo-PNA) et dont l'expression du marqueur est dépendante d'un promoteur nucléolaire (ARN polymerase I) est le plus efficace pour s'intégrer dans les séquences nucléolaire (ratio relatif de 5 à 300 fois, selon le test). 3 - Un vecteur ciblé ou non dans le nucléole et contenant un marqueur de sélection dont l'expression est placée sous la dépendance d'un promoteur nucléaire non nucléolaire (pSV40 - ARN polymerase II) est incapable d'être retenu par le processus de sélection cellulaire. Cette incapacité provient de l'absence de TARN polymérase II dans le nucléole. 2 - The integrative vector prototype whose two components are targeted in the nucleolus (pCS2-HIV-PB x pPol1 h-Neo-PNA) and whose expression of the marker is dependent on a nucleolar promoter (RNA polymerase I) is the most effective to integrate into the nucleolar sequences (relative ratio of 5 to 300 times, according to the test). 3 - A vector targeted or not in the nucleolus and containing a selection marker whose expression is placed under the control of a non-nucleolar nuclear promoter (pSV40 - RNA polymerase II) is incapable of being retained by the process of cell selection. This inability arises from the absence of RNA polymerase II in the nucleolus.

4 - Les transfections faites avec des vecteurs dont les deux composants sont plasmidiques seraient a priori un peu moins efficace pour le ciblage dans les séquences nucléolaires. d3 - Régions nucléolaires accessibles aux vecteurs intégratifs.  4 - Transfections made with vectors whose two components are plasmidic would be a priori a little less effective for targeting in the nucleolar sequences. d3 - Nucleus regions accessible to integrative vectors.

Pour ces analyses, les régions nucléolaires ont été subdivisées en trois catégories : les « Nucleolus-associated domains », les « rDNA repeats », et les « rDNA flanking régions ». L'analyse des résultats (figure 1 1 ) permet d'accéder à deux informations concernant l'accessibilité des trois catégories de régions nucléolaires aux vecteurs intégratifs utilisés, l'impact de la méthode de transfection. For these analyzes, the nucleolar regions were subdivided into three categories: "Nucleolus-associated domains", "rDNA repeats", and "rDNA flanking regions". The analysis of the results (Figure 1 1) gives access to two information concerning the accessibility of the three categories of nucleolar regions to the integrative vectors used, the impact of the transfection method.

C'est dans les régions NAD (catégorie de région nucléolaire) que les vecteurs ciblés, dont le marqueur de sélection dépend de l'ARN polymérase I, s'intègrent le mieux et à un niveau supérieur de ceux des autres prototypes de vecteurs. Dans ces séquences, les résultats obtenus en IPCR suggèrent que la différence d'efficacité du ciblage nucléolaire est plus à l'avantage du vecteur ciblé lorsque le prototype est constitué d'un ARNm et d'un plasmique que de deux composants plasmidiques. It is in the NAD (nucleolar region category) regions that the targeted vectors, whose selection marker depends on RNA polymerase I, fit best and at a higher level than other vector prototypes. In these sequences, the results obtained in IPCR suggest that the difference in the efficiency of the nucleolar targeting is more to the advantage of the targeted vector when the prototype consists of an mRNA and a plasmic than of two plasmid components.

Les conclusions tirées des résultats sur les régions chromosomiques flanquantes (figure 12) des gènes codant les ARNs ribosomaux 18S-5.8S-28S sont identiques à celles des NADs. Dans les limites d'efficacité de la préparation des banques de sites d'insertion des vecteurs par IPCR ou LAM-PCR, et de la sensibilité de nos analyses in silico, les résultats (figure 13) indiquent que nos prototypes de vecteurs sont incapables d'accéder aux gènes répétés en tandem codant les ARN ribomosomaux 18S-5.8S-28S et à leurs espaceurs non transcrits. Trois hypothèses non exclusives permettent d'expliquer ce phénomène : The conclusions drawn from the results on the flanking chromosomal regions (FIG. 12) of the genes encoding the 18S-5.8S-28S ribosomal RNAs are identical to those of the NADs. Within the efficiency limits of the preparation of IPCR or LAM-PCR libraries of vector insertion sites, and the sensitivity of our in silico analyzes, the results (Figure 13) indicate that our vector prototypes are unable to access to the tandem repeat genes encoding 18S-5.8S-28S ribomosomal RNAs and their non-transcribed spacers. Three non-exclusive hypotheses make it possible to explain this phenomenon:

1 - Les gènes codant les ARN ribomosomaux 18S-5.8S-28S sont beaucoup moins accessibles que les autres séquences nucléolaires, du fait de leur rôle essentiel dans la transcription par l'ARN polymérase I. 2 - Les ADNs polymérase utilisées en PCR sont beaucoup moins efficaces pour l'amplification sur des matrices d'ADN ayant un taux de GC de 60 à 80% que sur des matrices avec un taux de GC de -45%. De fait, les amplifications de site d 'insertion des rDNA sont dramatiquement sous représentées dans les produits finaux d 'IPCR et de LAM-PCR. 1 - The genes encoding ribosomal RNA 18S-5.8S-28S are much less accessible than other nucleolar sequences, because of their essential role in transcription by RNA polymerase I. 2 - The polymerase DNAs used in PCR are much less effective for amplification on DNA templates having a GC level of 60 to 80% than on matrices with a GC level of -45%. In fact, rDNA insertion site amplifications are dramatically underrepresented in the final products of IPCR and LAM-PCR.

Dans cette perspective, une analyse des taux d'efficacité d 'amplification des séquences par PCR a été effectuée. Les résultats (figures 14 et 1 5) indiquent que l'IPCR dans nos conditions expérimentales amplifie de façon homogène les séquences, quelle que soit leur localisation nucléolaire et l'échantillon. Cependant, l'intérêt de cette qualité d'amplification est minoré de par le fait que seulement 0,1 à 1 % des séquences produites ne proviennent pas de produits d'amplification artéfactuelle. À contrario, les résultats indiquent que la LAM-PCR dans nos conditions expérimentales amplifie de façon biaisée les séquences en fonction de leur localisation nucléolaire et de l'échantillon. Cette propriété est à mettre en parallèle du fait que les séquences récupérées à partir de produits de LAM-PCR sont de 70 à 99% cartographiables in silico. In this perspective, an analysis of PCR amplification efficiency levels was carried out. The results (FIGS. 14 and 15) indicate that the IPCR in our experimental conditions amplifies the sequences homogeneously, regardless of their nucleolar location and the sample. However, the advantage of this quality of amplification is reduced by the fact that only 0.1 to 1% of the sequences produced do not come from artefactual amplification products. In contrast, the results indicate that LAM-PCR in our experimental conditions biased the sequences according to their nucleolar localization and the sample. This property is to be compared with the fact that the sequences recovered from LAM-PCR products are 70 to 99% mapping in silico.

3 - La composition en séquences répétées (en particulier en séquence Alu\ (300-bp) des espaceurs non transcrits (eux-mêmes à 60 à 80% de taux de GC) présents entre les régions transcrites en ARN ribomosomaux 18S-5.8S-28S dans les rDNA ne permet pas de les cartographier correctement in silico. D'autre part la séquence exacte des régions contenant les unités répétées codant pour les ARNr n'est pas connue. 4. Conclusions sur l'efficacité des vecteurs ciblés 3 - The composition in repetitive sequences (in particular in sequence Alu \ (300-bp) of the non-transcribed spacers (themselves at 60 to 80% of GC level) present between the transcribed regions in ribosomal RNA 18S-5.8S- 28S in the rDNA does not allow to map them correctly in silico On the other hand the exact sequence of the regions containing the repeated units coding for the rRNA is not known 4. Conclusions on the effectiveness of the targeted vectors

Les résultats expérimentaux permettent de tirer différentes conclusions.  Experimental results allow us to draw different conclusions.

1 - Les vecteurs intégratifs de l'invention peuvent être efficacement ciblés dans l'ADN nucléolaire. The integrative vectors of the invention can be efficiently targeted in the nucleolar DNA.

2 - L'utilisation des vecteurs ciblés peut se faire avec deux composants plasmidique ou 1 ARNm et un plasmide.  2 - The use of the targeted vectors can be done with two plasmid components or 1 mRNA and a plasmid.

5. Analyse complémentaires sur l'aptitude des vecteurs ciblés à s'intégrer dans les gènes codant les ARN ribomosomaux 18S-5.8S-28S L'impossibilité de détecter des insertions de vecteurs dans les gènes codant les ARNs ribomosomaux 18S-5.8S-28S peut avoir deux origines. La première serait que les vecteurs ne peuvent accéder à ces séquences chromosomiques car elles seraient protégées dans les nucléoles et nécessiteraient un mécanisme spécifique d 'accès à ces séquences. La seconde serait liée à certaines propriétés d'amplification des polymérases utilisées en PCR et qui sont d 'amplifier avec une plus grande efficacité les séquences les plus riche en AT aux dépends de celles riches en GC. La seconde hypothèse a été testée en utilisant une stratégie de LAM-PCR ciblée sur la région transcrite des gènes codant les ARNs ribomosomaux 18S-5.8S-28S des des oligonucléotides spécifiquement ancrés d'une part dans cette région et, d'autre part, dans les extrémités 5' et 3' des vecteurs utilisés. 5. Additional assays on the ability of the targeted vectors to integrate into the genes encoding 18S-5.8S-28S ribomosomal RNAs The impossibility of detecting vector insertions in the genes encoding ribosomal RNAs 18S-5.8S-28S may have two origins. The first would be that the vectors can not access these chromosomal sequences because they would be protected in the nucleoli and would require a specific mechanism of access to these sequences. The second is related to certain amplification properties of the polymerases used in PCR and which are to amplify with greater efficiency the richest sequences of AT at the expense of those rich in GC. The second hypothesis was tested using a LAM-PCR strategy targeted to the transcribed region of the genes encoding the 18S-5.8S-28S ribosomal RNAs of the specifically anchored oligonucleotides on the one hand in this region and, on the other hand, in the 5 'and 3' ends of the vectors used.

Caractéristiques des oligonucléotides Characteristics of oligonucleotides

Primers ancrés dans les ADNr : Chaque paire de primers a été définie de façon à permettre une amplification nichée dans les ADNr. Ainsi dans le 18S, la première amplification est effectuée avec le 18F ou le 18R, la seconde étant respectivement faite avec les 18S F2 et 18S R2.  Primers anchored in rDNAs: Each pair of primers has been defined to allow nested amplification in rDNAs. Thus in the 18S, the first amplification is carried out with the 18F or the 18R, the second being respectively made with 18S F2 and 18S R2.

18S R - SEQ ID No.24 18S R - SEQ ID NO.24

5' GCTGAACGCCACTTGTCCCTCTAAGAAGT 3'  5 'GCTGAACGCCACTTGTCCCTCTAAGAAGT 3'

18S F - SEQ ID No.25 18S F - SEQ ID No.25

5' GGACACGGACAGGATTGACAGATTGATAGC 3'  5 'GGACACGGACAGGATTGACAGATTGATAGC 3'

18S R2 - SEQ ID No.26 18S R2 - SEQ ID No.26

5' GCTATCAATCTGTCAATCCTGTCCGTGTCC 3' 5 'GCTATCAATCTGTCAATCCTGTCCGTGTCC 3'

18S F2 - SEQ ID No.27 18S F2 - SEQ ID No.27

5' ACTTCTTAGAGGGACAAGTGGCGTTCAGC 3'  5 'ACTTCTTAGAGGGACAAGTGGCGTTCAGC 3'

28S Rmid - SEQ I D No.28 28S Rmid - SEQ I D No.28

5' GGGCTAGTTGATTCGGCAGGTGAGTTG 3' 5 'GGGCTAGTTGATTCGGCAGGTGAGTTG 3'

28S Fmid - SEQ ID No.29 28S Fmid - SEQ ID No.29

5' CTAGTAGCTGGTTCCCTCCGAAGTTTCCCT 3' 5 'CTAGTAGCTGGTTCCCTCCGAAGTTTCCCT 3'

28S Rmid2 - SEQ I D No.30 28S Rmid2 - SEQ I D No.30

5' GGGAAACTTCGGAGGGAACCAGCTACTA 3' 28S Fmid2 - SEQ ID No.31 5 'GGGAAACTTCGGAGGGAACCAGCTACTA 3' 28S Fmid2 - SEQ ID No.31

5' GTAACAACTCACCTGCCGAATCAACTAGCC 3'  5 'GTAACAACTCACCTGCCGAATCAACTAGCC 3'

28S Rend - SEQ I D No.32 28S Rend - SEQ I D No.32

5' CGACCCAGAAGCAGGTCGTCTACGAAT 3' 5 'CGACCCAGAAGCAGGTCGTCTACGAAT 3'

28S Fend - SEQ ID No.33 28S Fend - SEQ ID No.33

5' GGCGAAGCTACCATCTGTGGGATTATGACTG 3'  5 'GGCGAAGCTACCATCTGTGGGATTATGACTG 3'

28S Rend2 - SEQ I D No.34 28S Rend2 - SEQ I D No.34

5' CAGTCATAATCCCACAGATGGTAGCTTCGC 3' 5 'CAGTCATAATCCCACAGATGGTAGCTTCGC 3'

28S Fend2 - SEQ ID No.35 28S Fend2 - SEQ ID No.35

5' CGCTAAACCATTCGTAGACGACCTGCTTCTG 3' 5 'CGCTAAACCATTCGTAGACGACCTGCTTCTG 3'

Primers ancrés aux extrémités du vecteur piggybac Primers anchored to the ends of the piggybac vector

ITR 5' ITR 5 '

ITR5a - SEQ ID No.36 - 5' GAATTCGTCGACATCGATACCAAAAGTTTTGTTAC 3'  ITR5a - SEQ ID No.36 - 5 'GAATTCGTCGACATCGATACCAAAAGTTTTGTTAC 3'

ITR5b - SEQ I D No.37 - 5' CCTCGATATACAGACCGATAAAACACATGCGTCA 3' ITR5b - SEQ I D No.37 - 5 'CCTCGATATACAGACCGATAAAACACATGCGTCA 3'

ITR 3' ITR 3 '

ITR3a - SEQ ID No.38 - 5' GCGGCGACTGAGATGTCCTAAATGCAC 3'  ITR3a - SEQ ID No.38 - 5 'GCGGCGACTGAGATGTCCTAAATGCAC 3'

ITR3b - SEQ ID No.39 - 5' GCGACGGATTCGCGCTATTTAGAAAGAGAG 3' ITR3b - SEQ ID No.39 - 5 'GCGACGGATTCGCGCTATTTAGAAAGAGAG 3'

Echantillons utilisés Samples used

Deux paires d 'échantillons d'ADN génomiques provenant de vecteurs non-ciblés et ciblés ont été utilisés : N ° 9 et N ° 10, et Ν 2 et N° 14.  Two pairs of genomic DNA samples from non - targeted and targeted vectors were used: # 9 and # 10, and # 2 and # 14.

Procédure d'amplification des vecteurs intégrés dans les ADNr Amplification procedure of integrated vectors in rDNAs

a. PCR linéaire (1 échantillon = 2 PCR linéaire en 5' et en 3' ) at. Linear PCR (1 sample = 2 linear PCR in 5 'and 3')

Diluer les oligos (100 μΜ) au 1 /100 = 1 μΜ ADNg 50 à 100 ng Dilute the oligos (100 μΜ) to 1/100 = 1 μΜ 50 gDNA to 100 ng

Tampon 5X GC One Taq 10 μΐ  5X GC One Taq 10 μΐ buffer

dNTPs (10 mM each) 1 μΐ dNTPs (10 mM each) 1 μΐ

Primer (B) transposon I (1 μΜ) 4, 18 μΐ (83,5 nM)  Primer (B) transposon I (1 μΜ) 4, 18 μΐ (83.5 nM)

One Taq polymérase (NEB 51Ι/μΙ) 0,5 μί  One Taq polymerase (NEB 51Ι / μΙ) 0.5 μί

H20 QSP 50 μΐ Notes : H20 QSP 50 μΐ Notes:

-Primer (B) transposon I  -Primer (B) transposon I

Figure imgf000048_0001
Figure imgf000048_0001

-Faire un contrôle avec ADNg issus de cellules non transfectées -Make a control with gDNA from non-transfected cells

95°C 2 min 95 ° C 2 min

2 95°C 45 sec l 2 95 ° C 45 sec l

3 60°C 45 sec l x50 3 60 ° C 45 sec l x50

4 68°C 6 min l 68 ° C 6min

5 68°C 10 min 5 68 ° C 10 min

Ajouter 2,5 U (0,5 μΐ) de Taq polymérase par tube et réitérer tout le cycle de PCR b. Capture magnétique Add 2.5 U (0.5 μΐ) of Taq polymerase per tube and repeat the entire PCR cycle b. Magnetic catch

- Exposer 20 μΐ de particules magnétiques (10 μ /μΙ) (Dynabeads M-280 Streptavidin (Invitrogen, Carlsbad, USA) 60 secondes au champ magnétique du Single Place Magnetic Stand (Invitrogen, Carlsbad, USA) à TA.  - Expose 20 μl of magnetic particles (10 μ / μΙ) (Dynabeads M-280 Streptavidin (Invitrogen, Carlsbad, USA) 60 seconds to the magnetic field of the Single Place Magnetic Stand (Invitrogen, Carlsbad, USA) at RT.

- Enlever le surnageant en présence du champ magnétique.  - Remove the supernatant in the presence of the magnetic field.

- Resuspendre les particules dans 40 μΐ PBS-0,1% BSA (pH 7,5). Eliminer le surnageant en présence du champ magnétique. Recommencer cette étape une deuxième fois. (= - Resuspend the particles in 40 μΐ PBS-0.1% BSA (pH 7.5). Remove the supernatant in the presence of the magnetic field. Repeat this step a second time. (=

2 lavages des billes magnétiques en PBS-0.1 %BSA) 2 washes magnetic beads in PBS-0.1% BSA)

- Laver les particules avec 20 μΐ de LiCl 3M BW buffer (même procédure magnétique qu'avec les lavages en PBS-0.1%BSA). - Les resuspendre les billes dans 50 μΐ de LiCl 6M BW buffer.  - Wash the particles with 20 μΐ LiCl 3M BW buffer (same magnetic procedure as washing with PBS-0.1% BSA). - Resuspend the beads in 50 μΐ of LiCl 6M BW buffer.

Note : A partir des étapes suivantes, procéder avec le Side Skirted Magnetic device. - Transférer 50 μΐ de solution de particules magnétiques dans chaque produit de PCR linéaire (le ratio de produit PCR et la solution de LiCl doit toujours être de 1 : 1 ). Mélanger doucement. Note: From the following steps, proceed with the Side Skirted Magnetic device. - Transfer 50 μΐ of magnetic particle solution into each linear PCR product (the PCR product ratio and the LiCl solution should always be 1: 1). Mix gently.

- Incuber sur un agitateur à 300 rpm à TA (entre 20° C et 43°C) OVN (8h-48h).  - Incubate on an agitator at 300 rpm at RT (between 20 ° C and 43 ° C) OVN (8h-48h).

- Exposer l'échantillon 60 sec à un champ magnétique, éliminer le surnageant en présence du champ magnétique et laver les billes une fois avec 100 μΐ d'eau distillée. c - 1ère Amplification - Expose the 60 sec sample to a magnetic field, remove the supernatant in the presence of the magnetic field and wash the beads once with 100 μl of distilled water. c - 1st Amplification

Chaque PCR linéaire est amplifiée par 6 jeux d'oligonucleotides (1 extrémité du transposon puis 6 amorces rDNA)).  Each linear PCR is amplified by 6 sets of oligonucleotides (1 end of the transposon and then 6 primers rDNA)).

Par échantillons, on s'attend donc à récolter 12 produits de PCR (6 en 5' et 6 en 3'). Avec 4 échantillons on aura donc à ce stade 48 tubes de PCR. La 1ère PCR est réalisée sur 5 μί d'ADN linéarisé et purifié. Remettre en solution les billes dans 70 μΐ d'eau distillée  By samples, it is therefore expected to harvest 12 PCR products (6 in 5 'and 6 in 3'). With 4 samples we will have at this stage 48 PCR tubes. The first PCR is performed on 5 μί of linearized and purified DNA. Resuspend the beads in 70 μl of distilled water

Figure imgf000049_0002
Figure imgf000049_0002

Primer 1 = ITR5a ou ITR3a Primer 1 = ITR5a or ITR3a

Primer 2 = 18SF, 18SR, 28SFmid, 28SRMid, 28S Fend, 28SRend  Primer 2 = 18SF, 18SR, 28SFmid, 28SRMid, 28S Fend, 28SRend

Programme du thermocycleu Thermal Cycling Program

Hold à 94° C Hold at 94 ° C

X 35 cyclesX 35 cycles

Figure imgf000049_0001
Figure imgf000049_0001

6 min à 68° C 5min à 68 ° C 6 min at 68 ° C 5min to 68 ° C

Hold à 4°C  Hold at 4 ° C

Contrôle sur gel de la qualité des produits de PCR (5 °l) avec un gel 1.5 % Agarose, 1 X TBE, 1X Gelred. Gel control of the quality of the PCR products (5 ° l) with a gel 1.5% Agarose, 1 X TBE, 1X Gelred.

c. 2ème Amplification  vs. 2nd Amplification

Chaque tubes de PCR a son mix de primer niché  Each PCR tube has its primer mix nested

Figure imgf000050_0002
Figure imgf000050_0002

Primer 1 = ITR5b ou ITR3b Primer 1 = ITR5b or ITR3b

Primer 2 = 18SF2, 18SR2, 28SFmid2, 28SRMid2, 28S Fend2, 28SRend2  Primer 2 = 18SF2, 18SR2, 28SFmid2, 28SRMid2, 28S Fend2, 28SRend2

Programme du thermocycleur  Thermal Cycler Program

Hold à 94° C  Hold at 94 ° C

X 35 cyclesX 35 cycles

Figure imgf000050_0001
Figure imgf000050_0001

6 min à 68 ° C  6 min at 68 ° C

5min à 68 ° C  5min to 68 ° C

Hold à 4°C  Hold at 4 ° C

Contrôle sur gel de la qualité des produits de PCR (5 μΐ) avec un gel 1.5 % Agarose, TBE, 1X Gelred. d. Purification des produits de PCR et séquençage Gel control of the quality of the PCR products (5 μl) with a gel 1.5% Agarose, TBE, 1X Gelred. d. Purification of PCR products and sequencing

Pour chaque paire de primers, une comparaison des produits d'amplification a été effectuée entre d'une part les échantillons 9 et 10 et, d'autre part, les échantillons 12 et 14. Les fragments d'amplification présents dans les produits provenant des échantillons 10 ou 14, et respectivement absents dans les produits provenant des échantillons 9 ou 12 ont été purifiés puis séquencés par un prestataire par la méthode de Sanger. e. Résultats et conclusion For each pair of primers, a comparison of the amplification products was performed between samples 9 and 10 on the one hand and samples on the other hand 12 and 14. The amplification fragments present in the products from samples 10 or 14, respectively absent in the products from samples 9 or 12, were purified and sequenced by a provider by the Sanger method. e. Results and conclusion

Une trentaine de produits d'amplification ont été séquencés. Leur séquence a permis de démontrer que le vecteur est capable de s'intégrer dans différents motifs TTAA contenus dans les gènes codant les ARNs ribomosomaux 18S-5.8S-28S.  Thirty amplification products have been sequenced. Their sequence has demonstrated that the vector is capable of integrating into different TTAA motifs contained in the genes encoding the ribosomal RNAs 18S-5.8S-28S.

Ces résultats indiquent que les vecteurs ciblés dans le nucléole avec l'invention sont capables de s'intégrer dans toutes les séquences nucléolaires. These results indicate that the target vectors in the nucleolus with the invention are capable of integrating into all nucleolar sequences.

REFERENCES Ahmad NN, Cu-Unjieng AB, Donoso LA. 1995. Modification of standard proteinase K/phenol method for DNA isolation to improve yield and purity from frozen blood. J Med Genêt. 32: 129-130. REFERENCES Ahmad NN, Cu-Unjieng AB, Donoso LA. 1995. Modification of standard proteinase K / phenol method for DNA isolation to improve yield and purity of frozen blood. J Med Genet. 32: 129-130.

Aird D, Ross MG, Chen WS, Danielsson M, Fennell T, Russ C, Jaffe DB, Nusbaum C, Gnirke A. 201 1. Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries. Génome Biol. 12: R18.  Aird D, Ross MG, Chen WS, Danielsson M, Fennell T, Russ C, Jaffe DB, Nusbaum C, Gnirke A. 1. Analyze and minimizing PCR amplification bias in Illumina sequencing libraries. Genome Biol. 12: R18.

Arens A, Appelt JU, Bartholomae CC, Gabriel R, Paruzynski A, Gustafson D, Cartier N, Aubourg P, Deichmann A, Glimm H, von Kalle C, Schmidt M. 2012. Bioinformatic clonality analysis of next-generation sequencing-derived viral vector intégration sites. Hum Gene Ther Methods. 23:111 -1 18.  Arens A, Appelt JU, Bartholomae CC, Gabriel R, Paruzynski A, Gustafson D, Cartier N, Aubourg P, Deichmann A, Glimm H, von Kalle C, Schmidt M. 2012. Bioinformatic clonality analysis of next-generation sequencing-derived viral vector integration sites. Hum Gene Ther Methods. 23: 111-18.

Bartholomae CC, Glimm H, von Kalle C, Schmidt M. 2012. Insertion site pattern: global approach by linear amplification-mediated PCR and mass sequencing. Methods Mol Biol. 859:255-265. Bartholomae CC, Glimm H, von Kalle C, Schmidt M. 2012. Insertion site pattern: global approach by linear amplification-mediated PCR and mass sequencing. Methods Mol Biol. 859: 255-265.

Becherel OJ, Gueven N, Birrell GW, Schreiber V, Suraweera A, Jakob B, Taucher- Scholz G, Lavin MF. 2006. Nucleolar localization of aprataxin is dépendent on interaction with nucleolin and on active ribosomal DNA transcription. Hum Mol Genêt. 15:2239-2249.  Becherel OJ, Gueven N, Birrell GW, Schreiber V, Suraweera A, Jakob B, Taucher-Scholz G, Lavin MF. 2006. Nucleolar localization of aprataxin is dependent on nucleotide interaction and activates ribosomal DNA transcription. Hum Mol Genet. 15: 2239-2249.

Bire S, Ley D, Mermod N, Casteret S, Bigot Y, Rouleux-Bonnin F (2014) Monitoring the biosafety of the piggyBac transposon for gene delivery using mRNA and insulators. PloSOne. 8:e82559. Cadifianos J, Bradley A. 2007. Génération of an inducible and optimized piggyBac transposon system. Nucleic Acids Res. 35:e87. Bire S, Ley D, Mermod N, Casteret S, Bigot Y, Rouleux-Bonnin F (2014) Monitoring the biosafety of the piggyBac transposon for gene delivery using mRNA and insulators. PlosOne. 8: e82559. Cadifianos J, Bradley A. 2007. Generation of an inductive and optimized piggyBac transposon system. Nucleic Acids Res. 35: E87.

Catez F, Erard M, Schaerer-Uthurralt N, Kindbeiter K, Madjar JJ, Diaz JJ. 2002. Unique motif for nucleolar rétention and nuclear export regulated by phosphorylation. Mol Cell Biol. 22: 1 126-1 139.  Cate F, Erard M, Schaerer-Uthurralt N, Kindbeiter K, Madjar JJ, Diaz JJ. 2002. Unique motif for nucleolar retention and nuclear export regulated by phosphorylation. Mol Cell Biol. 22: 1,126-1,139.

Cochrane AW, Perkins A, Rosen CA. 1990. Identification of séquences important in the nucleolar localization of human immunodeficiency virus Rev: relevance of nucleolar localization to function. J Virol. 64:881 -885.  Cochrane AW, Perkins A, Rosen CA. 1990. Identification of important sequences in the nucleolar localization of human immunodeficiency virus. Rev: relevance of nucleolar localization to function. J Virol. 64: 881-885.

Di Matteo M, Mâtrai J, Belay E, Firdissa T, Vandendriessche T, Chuah MK. (2012) PiggyBac toolbox. Methods Mol Biol. 859:241 -254.  Di Matteo M, Matalai J, Belay E, Firdissa T, Vandendriessche T, Chuah MK. (2012) PiggyBac toolbox. Methods Mol Biol. 859: 241-254.

Emmott E, Hiscox JA. (2009) Nucleolar targeting: the hub of the matter. EMBO Rep. 10:231 -238.  Emmott E, Hiscox JA. (2009) Nucleolar targeting: the hub of the matter. EMBO Rep. 10: 231-238.

Floutsakou I , Agrawal S, Nguyen TT, Seoighe C, Ganley AR, McStay B. 2013. The shared genomic architecture of human nucleolar organizer régions. Génome Res. Oct 31 . [Epub ahead of print ; doi : 10.1 101 /gr.1 57941 .1 13]  Floutsakou I, Agrawal S, Nguyen TT, Seoighe C, Ganley AR, McStay B. 2013. The shared genomic architecture of human nucleolar organizer regions. Genome Res. Oct 31. [Epub ahead of print; doi: 10.1 101 /gr.1 57941 .1 13]

Gonzalez I L, Sylvester JE. 1995. Complète séquence of the 43-kb human ribosomal Gonzalez I L, Sylvester JE. 1995. Complete sequence of the 43-kb human ribosomal

DNA repeat: analysis of the intergenic spacer. Genomics. 27:320-328. DNA repeat: analysis of the intergenic spacer. Genomics. 27: 320-328.

Ide S, Miyazaki T, Maki H, Kobayashi T. 2010. Abundance of ribosomal RNA gene copies maintains génome integrity. Science327:693-696.  Ide S, Miyazaki T, Maki H, Kobayashi T. 2010. Abundance of ribosomal RNA gene copies maintains genome integrity. Science327: 693-696.

Li H, Durbin R. (2010) Fast and accurate long-read alignaient with Burrows-Wheeler transform. Bioinformatics. 26 : 589-595. Li H, Durbin R. (2010) Fast and accurate long-read aligned with Burrows-Wheeler transform. Bioinformatics. 26: 589-595.

Li MA, Turner DJ, Ning Z, Yusa K, Liang Q, Eckert S, Rad L, Fitzgerald TW, Craig NL, Bradley A. 201 1 . Mobilisation of giant piggyBac transposons in the mouse génome. Nucleic Acids Res. 39:e148.  Li MA, Turner DJ, Ning Z, Yusa K, Liang Q, Eckert S, Rad L, Fitzgerald TW, Craig NL, Bradley A. 201 1. Mobilization of giant piggyBac transposons in the mouse genome. Nucleic Acids Res. 39: E148.

Malyavantham KS, Bhattacharya S, Barbeitos M, Mukherjee L, Xu J, Fackelmayer FO, Berezney R. 2008. Identifying functional neighborhoods within the cell nucleus: proximity analysis of early S-phase replicating chromatin domains to sites of transcription, RNA polymerase I I, HP1 gamma, matrin 3 and SAF-A. J Cell Biochem. 105:391 -403. Malyavantham KS, Bhattacharya S, Barbeitos M, Mukherjee L, Xu J, Fackelmayer FO, Berezney R. 2008. Identifying functional neighborhoods within the cell nucleus: proximity analysis of early S-phase replicating chromatin domains to transcription sites, RNA polymerase II, HP1 gamma, matrin 3 and SAF-A. J Cell Biochem. 105: 391-403.

Németh A, Conesa A, Santoyo-Lopez J, Medina I, Montaner D, Péterfia B, Solovei I , Cremer T, Dopazo J, Làngst G. 2010. Initial genomics of the human nucleolus. PLoS Genêt. 6:e1000889. Németh A, Conesa A, Santoyo-Lopez J, Medina I, Montaner D, Péterfia B, Solovei I, Cremer T, Dopazo J, Làngst G. 2010. Initial genomics of the human nucleolus. PLoS Genet. 6: e1000889.

Oprea I I, Simonson OE, Moreno PM, Viola JR, Lundin KE, Smith Cl. (2010) Temperature-assisted cyclic hybridization (TACH): an improved method for supercoiled DNA hybridization. Mol Biotechnol. 45: 171 -179. Oyola SO, Otto TD, Gu Y, Maslen G, Manske M, Campino S, Turner DJ, Macinnis B, Kwiatkowski DP, Swerdlow HP, Quai l MA. 2012. Optimizing Illumina next-generation sequencing library préparation for extremely AT-biased génomes. BMC Genomics. 13:1. Oprea II, Simonson OE, Moreno PM, Viola JR, Lundin KE, Smith Cl. (2010) Temperature-Assisted Cyclic Hybridization (TACH): an improved method for supercoiled DNA hybridization. Mol Biotechnol. 45: 171-179. Oyola SO, Otto TD, Gu Y, Maslen G, Manske M, Campino S, Turner DJ, Macinnis B, Kwiatkowski DP, Swerdlow HP, Quay MA. 2012. Optimizing Illumina next-generation sequencing library preparation for extremely AT-biased genomes. BMC Genomics. 13: 1.

Palazzoli F, Carnus E, Wells DJ, Bigot Y. 2008. Sustained transgene expression using non-viral enzymatic Systems for stable chromosomal intégration. Curr Gene Ther. 8:367-390. Palazzoli F, Carnus E, Wells DJ, Bigot Y. 2008. Sustained transgene expression using non-viral enzymatic Systems for stable chromosomal integration. Curr Gene Ther. 8: 367-390.

Palazzoli F, Testu FX, Merly F, Bigot Y. 2010. Transposon tools: worldwide landscape of intellectual property and technological developments. Genetica. 138:285-299. Palmer TD, Miller AD, Reeder RH, McStay B. 1993. Efficient expression of a protein coding gene under the control of an RNA polymerase I promoter. Nucleic Acids Res. 21 :3451 -3457.  Palazzoli F, Testu FX, Merly F, Bigot Y. 2010. Transposon tools: worldwide landscape of intellectual property and technological developments. Genetica. 138: 285-299. Palmer TD, Miller AD, Reeder RH, McStay B. 1993. Efficient expression of a protein coding gene under the control of an RNA polymerase I promoter. Nucleic Acids Res. 21: 3451-3457.

Stults DM, Killen MW, Pierce HH, Pierce AJ. 2008. Genomic architecture and inheritance of human ribosomal RNA gene clusters. Génome Res. 18:13-18.  Stults DM, Killen MW, Pierce HH, Pierce AJ. 2008. Genomic architecture and inheritance of human ribosomal RNA gene clusters. Genome Res. 18: 13-18.

Sylvester JE, Whiteman DA, Podolsky R, Pozsgay JM, Respess J, Schmickel RD. 1986. The human ribosomal RNA gènes: structure and organisation of the complète repeating unit. Hum Genêt. 73:193-198. Sylvester JE, Whiteman DA, Podolsky R, Pozsgay JM, Respess J, Schmickel RD. 1986. The human ribosomal RNA genes: structure and organization of the complete repeating unit. Hum Broom. 73: 193-198.

van Heesch S, Mokry M, Boskova V, Junker W, Mehon R, Toonen P, de Bruijn E, Shull JD, Aitman TJ, Cuppen E, Guryev V. 2013. Systematic biases in DNA copy number originate from isolation procédures. Génome Biol. 14:R33. van Heesch S, Mokry M, Boskova V, Junker W, Mehon R, Toonen P, Bruijn E, Shull JD, Aitman TJ, Cuppen E, Guryev V. 2013. Systematic biases in DNA copy number originate from isolation procedures. Genome Biol. 14: R33.

Wang H, Mayhew D, Chen X, Johnston M, Mitra RD. 2012a. "Calling cards" for DNA- binding proteins in mammalian cells. Genetics. 190:941 -949.  Wang H, Mayhew D, Chen X, M Johnston, Mitra RD. 2012a. "Calling cards" for DNA-binding proteins in mammalian cells. Genetics. 190: 941-949.

Wang H, Mayhew D, Chen X, Johnston M, Mitra RD. 2012b. "Calling cards" for DNAbinding proteins in mammalian cells : protocol.  Wang H, Mayhew D, Chen X, M Johnston, Mitra RD. 2012b. "Calling cards" for DNA binding proteins in mammalian cells: protocol.

Claims

REVENDICATIONS 1 . Système moléculaire pour l'intégration d'une molécule d'acide nucléique d'intérêt dans une région chromosomique associée au nucléole, comprenant au moins : 1. Molecular system for integrating a nucleic acid molecule of interest into a chromosomal region associated with the nucleolus, comprising at least: - un vecteur intégratif non viral comprenant un motif de localisation nucléolaire, et dépourvu de source de recombinase fonctionnelle; et  a non-viral integrative vector comprising a nucleolar localization motif and lacking a source of functional recombinase; and - une source de recombinase fonctionnelle comprenant un motif de localisation nucléolaire, fournie en trans dudit vecteur intégratif non viral.  a functional recombinase source comprising a nucleolar localization motif, provided in trans of said non-viral integrative vector. 2. Système selon la revendication 1 , caractérisé en ce que le vecteur intégratif non viral est un pseudo transposon. 2. System according to claim 1, characterized in that the non-viral integrative vector is a pseudo transposon. Système selon la revendication 1 ou 2, caractérisé en ce que ledit vecteur intégratif non viral et ladite source de recombinase fonctionnelle se localise au nucléole comprenant un motif de localisation nucléolaire. System according to claim 1 or 2, characterized in that said non-viral integrative vector and said functional recombinase source is localized to the nucleolus comprising a nucleolar locating motif. Système selon l'une quelconque des revendications 1 à 3, caractérisé en ce que ledit motif de localisation nucléolaire est un motif de localisation nucléolaire NoLS. System according to any one of claims 1 to 3, characterized in that said nucleolar localization pattern is a nucleolar locating motif NoLS. 5. Système selon l'une quelconque des revendications 1 à 4, caractérisé en ce qu'il comprend en outre un élément de liaison dudit signal de localisation audit vecteur intégratif non viral. 5. System according to any one of claims 1 to 4, characterized in that it further comprises a connecting element of said location signal to said integrative vector non-viral. 6. Système selon la revendication 5, caractérisé en ce que ledit élément de liaison est un oligonucléotide formant des triplex (OFT), de préférence choisi dans le groupe des PNA (acides nucléiques de peptides, « peptide nucleic acids »), des LNA (acides nucléiques verrouillés, « locked nucleic acids »), des hybrides PNA: PNA (« bisPNA ») et des hybrides LNA: LNA (« Zorro LNA »). 6. System according to claim 5, characterized in that said linking element is a triplex forming oligonucleotide (OFT), preferably selected from the group of PNAs (peptide nucleic acids), LNAs ( locked nucleic acids, "locked nucleic acids"), PNA hybrids: PNA ("bisPNA") and LNA hybrids: LNA ("Zorro LNA"). 7. Système selon la revendication 6, caractérisé en ce que ledit élément de liaison est un bisPNA. 7. System according to claim 6, characterized in that said connecting element is a bisPNA. 8. Système selon l'une quelconque des revendications 1 à 7, caractérisé en ce que ledit vecteur intégratif non viral est un pseudo-transposon choisi parmi les transposons Sleeping Beauty, Frog Prince, piggyBac, MuA, Mos- 1, Pokey, , Tol2, Tn3, Tn5, Tn7, Tn10, Hermès et leurs dérivés. 8. System according to any one of claims 1 to 7, characterized in that said non-viral integrative vector is a pseudo-transposon selected from the transposons Sleeping Beauty, Prince Frog, piggyBac, MuA, Mos-1, Pokey, Tol2 , Tn3, Tn5, Tn7, Tn10, Hermes and their derivatives. 9. Système selon l'une quelconque des revendications 4 à 8, caractérisé en ce que ledit signal de localisation nucléolaire NoLS est un peptide de séquence SEQ ID No.1 : RQARRNRRRRWRERQRQ.I. 9. System according to any one of claims 4 to 8, characterized in that said nucleolar localization signal NoLS is a peptide of sequence SEQ ID No.1: RQARRNRRRRWRERQRQ.I. 10. Système selon la revendication 9, caractérisé en ce que le ledit élément de liaison bisPNA couplé à audit signal de localisation NoLS a pour séquence la séquence: KKKLLTTCTTCTTTTLLLTTTTCTTCTTLLLKKKRQARRNRRRRWRERQRQI, dans laquelle K, L, I, R, Q, A, N, W et E sont des acides aminés, C et T sont des nucléotides. The system of claim 9, characterized in that said bisPNA link member coupled to said NoLS location signal is sequenced by the sequence: KKKLLTTCTTCTTTTLLLTTTTCTTCTTLLLKKKRQARRNRRRRWRERQRQI, wherein K, L, I, R, Q, A, N, W and E are amino acids, C and T are nucleotides. 1 1 . Procédé in vitro de modification génétique d'au moins une cellule hôte eucaryote, comprenant : 1 1. In vitro method for genetically modifying at least one eukaryotic host cell, comprising: a) l'introduction dans ladite cellule d'au moins un système selon l'une des revendications 1 à 10;  a) introducing into said cell at least one system according to one of claims 1 to 10; b) la sélection de cellules de l'étape a), dans lesquelles la molécule d'acide nucléique d'intérêt est exprimée ;  b) selecting cells of step a), in which the nucleic acid molecule of interest is expressed; c) la sélection de cellules de l'étape b), dans lesquelles le vecteur intégratif non viral est intégré dans une région chromosomique associée au nucléole.  c) selecting cells from step b), wherein the non-viral integrative vector is integrated into a chromosomal region associated with the nucleolus. 12. Cellule hôte eucaryote génétiquement modifiée caractérisée en ce qu'elle contient au moins un système selon l'une quelconque des revendications 1 à 10. 12. Eukaryotic host cell genetically modified, characterized in that it contains at least one system according to any one of claims 1 to 10. 13. Cellule hôte eucaryote génétiquement modifiée susceptible d'être obtenue par le procédé selon la revendication 1 1 , caractérisée en ce qu'au moins une molécule d'acide nucléique d'intérêt est intégrée dans une région chromosomique associée au nucléole. A genetically modified eukaryotic host cell obtainable by the process according to claim 11, characterized in that at least one nucleic acid molecule of interest is integrated into a chromosomal region associated with the nucleolus. 1 . Organisme eucaryote transgénique non humain, en particulier animal transgénique, dont au moins une cellule est une cellule selon la revendication 12 ou 1 3. 1. Non-human transgenic eukaryotic organism, in particular a transgenic animal, of which at least one cell is a cell according to claim 12 or 1 3. 1 5. Kit pour l'intégration d 'au moins une molécule d 'acide nucléique d'intérêt dans le génome d'une cellule hôte eucaryote en vue de son expression, caractérisé en ce qu'il comprend au moins : A kit for integrating at least one nucleic acid molecule of interest into the genome of a eukaryotic host cell for expression thereof, characterized in that it comprises at least: un système moléculaire selon l'une quelconque des revendications 1 à 10 ; et/ou une cellule hôte selon la revendication 12 ou 13 ; et/ou a molecular system according to any one of claims 1 to 10; and / or a host cell according to claim 12 or 13; and or un organisme eucaryote transgénique non humain selon la revendication 1 . a transgenic non-human eukaryotic organism according to claim 1.
PCT/EP2015/067472 2014-07-30 2015-07-30 Targeting of non-viral integrative vectors in the nucleolar dna sequences of eukaryotes Ceased WO2016016358A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1457396 2014-07-30
FR1457396A FR3024464A1 (en) 2014-07-30 2014-07-30 TARGETING NON-VIRAL INTEGRATIVE VECTORS IN NUCLEOLAR DNA SEQUENCES IN EUKARYOTES

Publications (1)

Publication Number Publication Date
WO2016016358A1 true WO2016016358A1 (en) 2016-02-04

Family

ID=52423790

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2015/067472 Ceased WO2016016358A1 (en) 2014-07-30 2015-07-30 Targeting of non-viral integrative vectors in the nucleolar dna sequences of eukaryotes

Country Status (2)

Country Link
FR (1) FR3024464A1 (en)
WO (1) WO2016016358A1 (en)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US10113163B2 (en) 2016-08-03 2018-10-30 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US10167457B2 (en) 2015-10-23 2019-01-01 President And Fellows Of Harvard College Nucleobase editors and uses thereof
US10227581B2 (en) 2013-08-22 2019-03-12 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
CN110402305A (en) * 2016-11-30 2019-11-01 中国农业大学 A method for CRISPR library screening
US10508298B2 (en) 2013-08-09 2019-12-17 President And Fellows Of Harvard College Methods for identifying a target site of a CAS9 nuclease
US10597679B2 (en) 2013-09-06 2020-03-24 President And Fellows Of Harvard College Switchable Cas9 nucleases and uses thereof
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US10858639B2 (en) 2013-09-06 2020-12-08 President And Fellows Of Harvard College CAS9 variants and uses thereof
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
WO2022051555A2 (en) 2020-09-03 2022-03-10 Rampart Bioscience, Inc. Soluble alkaline phosphatase constructs and expression vectors including a polynucleotide encoding for soluble alkaline phosphatase constructs
US11306324B2 (en) 2016-10-14 2022-04-19 President And Fellows Of Harvard College AAV delivery of nucleobase editors
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11447770B1 (en) 2019-03-19 2022-09-20 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
WO2022197183A1 (en) 2021-03-19 2022-09-22 Wageningen Universiteit Methods for recombinant protein expression in eukaryotic cells
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11912985B2 (en) 2020-05-08 2024-02-27 The Broad Institute, Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
US12157760B2 (en) 2018-05-23 2024-12-03 The Broad Institute, Inc. Base editors and uses thereof
US12281338B2 (en) 2018-10-29 2025-04-22 The Broad Institute, Inc. Nucleobase editors comprising GeoCas9 and uses thereof
US12351837B2 (en) 2019-01-23 2025-07-08 The Broad Institute, Inc. Supernegatively charged proteins and uses thereof
US12390514B2 (en) 2017-03-09 2025-08-19 President And Fellows Of Harvard College Cancer vaccine
US12406749B2 (en) 2017-12-15 2025-09-02 The Broad Institute, Inc. Systems and methods for predicting repair outcomes in genetic engineering
US12435330B2 (en) 2019-10-10 2025-10-07 The Broad Institute, Inc. Methods and compositions for prime editing RNA
US12473543B2 (en) 2019-04-17 2025-11-18 The Broad Institute, Inc. Adenine base editors with reduced off-target effects
US12522807B2 (en) 2018-07-09 2026-01-13 The Broad Institute, Inc. RNA programmable epigenetic RNA modifiers and uses thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994024300A1 (en) * 1993-04-16 1994-10-27 Transgene S.A. Transposition assembly for gene transfer in eukaryotes
WO2004069995A2 (en) * 2003-02-10 2004-08-19 Max-Delbrück-Centrum Für Molekulare Medizin (Mdc) Transposon-based targeting system
WO2008060483A2 (en) * 2006-11-10 2008-05-22 Cellumen, Inc. Protein-protein interaction biosensors and methods of use thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994024300A1 (en) * 1993-04-16 1994-10-27 Transgene S.A. Transposition assembly for gene transfer in eukaryotes
WO2004069995A2 (en) * 2003-02-10 2004-08-19 Max-Delbrück-Centrum Für Molekulare Medizin (Mdc) Transposon-based targeting system
WO2008060483A2 (en) * 2006-11-10 2008-05-22 Cellumen, Inc. Protein-protein interaction biosensors and methods of use thereof

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BIRE SOLENNE ET AL: "Transposase concentration controls transposition activity: Myth or reality?", GENE, vol. 530, no. 2, 10 November 2013 (2013-11-10), pages 165 - 171, XP028728402, ISSN: 0378-1119, DOI: 10.1016/J.GENE.2013.08.039 *
DATABASE Geneseq [online] 24 July 2008 (2008-07-24), "Human immunodeficiency virus Rev protein localization domain, SEQ ID 4.", XP002740862, retrieved from EBI accession no. GSP:ARW31639 Database accession no. ARW31639 *
JIN-BON HONG ET AL: "A Nucleolus-Predominant piggyBac Transposase, NP-mPB, Mediates Elevated Transposition Efficiency in Mammalian Cells", PLOS ONE, vol. 9, no. 2, 24 February 2014 (2014-02-24), pages e89396, XP055195631, DOI: 10.1371/journal.pone.0089396 *
WEN ET AL: "Efficient protein expression from the endogenous RNA polymerase I promoter using a human ribosomal DNA targeting vector", BIOCHEMICAL AND BIOPHYSICAL RESEARCH COMMUNICATIONS, ACADEMIC PRESS INC. ORLANDO, FL, US, vol. 367, no. 4, 14 January 2008 (2008-01-14), pages 846 - 851, XP022449883, ISSN: 0006-291X, DOI: 10.1016/J.BBRC.2008.01.018 *

Cited By (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12006520B2 (en) 2011-07-22 2024-06-11 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US11920181B2 (en) 2013-08-09 2024-03-05 President And Fellows Of Harvard College Nuclease profiling system
US10954548B2 (en) 2013-08-09 2021-03-23 President And Fellows Of Harvard College Nuclease profiling system
US10508298B2 (en) 2013-08-09 2019-12-17 President And Fellows Of Harvard College Methods for identifying a target site of a CAS9 nuclease
US10227581B2 (en) 2013-08-22 2019-03-12 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US11046948B2 (en) 2013-08-22 2021-06-29 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US10858639B2 (en) 2013-09-06 2020-12-08 President And Fellows Of Harvard College CAS9 variants and uses thereof
US11299755B2 (en) 2013-09-06 2022-04-12 President And Fellows Of Harvard College Switchable CAS9 nucleases and uses thereof
US12473573B2 (en) 2013-09-06 2025-11-18 President And Fellows Of Harvard College Switchable Cas9 nucleases and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US10597679B2 (en) 2013-09-06 2020-03-24 President And Fellows Of Harvard College Switchable Cas9 nucleases and uses thereof
US10682410B2 (en) 2013-09-06 2020-06-16 President And Fellows Of Harvard College Delivery system for functional nucleases
US9999671B2 (en) 2013-09-06 2018-06-19 President And Fellows Of Harvard College Delivery of negatively charged proteins using cationic lipids
US10912833B2 (en) 2013-09-06 2021-02-09 President And Fellows Of Harvard College Delivery of negatively charged proteins using cationic lipids
US12215365B2 (en) 2013-12-12 2025-02-04 President And Fellows Of Harvard College Cas variants for gene editing
US10465176B2 (en) 2013-12-12 2019-11-05 President And Fellows Of Harvard College Cas variants for gene editing
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
US11124782B2 (en) 2013-12-12 2021-09-21 President And Fellows Of Harvard College Cas variants for gene editing
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
US12398406B2 (en) 2014-07-30 2025-08-26 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US10704062B2 (en) 2014-07-30 2020-07-07 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US11578343B2 (en) 2014-07-30 2023-02-14 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US12344869B2 (en) 2015-10-23 2025-07-01 President And Fellows Of Harvard College Nucleobase editors and uses thereof
US10167457B2 (en) 2015-10-23 2019-01-01 President And Fellows Of Harvard College Nucleobase editors and uses thereof
US12043852B2 (en) 2015-10-23 2024-07-23 President And Fellows Of Harvard College Evolved Cas9 proteins for gene editing
US11214780B2 (en) 2015-10-23 2022-01-04 President And Fellows Of Harvard College Nucleobase editors and uses thereof
US10113163B2 (en) 2016-08-03 2018-10-30 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US11999947B2 (en) 2016-08-03 2024-06-04 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US10947530B2 (en) 2016-08-03 2021-03-16 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US11702651B2 (en) 2016-08-03 2023-07-18 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
US12084663B2 (en) 2016-08-24 2024-09-10 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11306324B2 (en) 2016-10-14 2022-04-19 President And Fellows Of Harvard College AAV delivery of nucleobase editors
CN110402305A (en) * 2016-11-30 2019-11-01 中国农业大学 A method for CRISPR library screening
CN110402305B (en) * 2016-11-30 2023-07-21 北京复昇生物科技有限公司 A method for CRISPR library screening
US11820969B2 (en) 2016-12-23 2023-11-21 President And Fellows Of Harvard College Editing of CCR2 receptor gene to protect against HIV infection
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US12390514B2 (en) 2017-03-09 2025-08-19 President And Fellows Of Harvard College Cancer vaccine
US12516308B2 (en) 2017-03-09 2026-01-06 President And Fellows Of Harvard College Suppression of pain by gene editing
US12435331B2 (en) 2017-03-10 2025-10-07 President And Fellows Of Harvard College Cytosine to guanine base editor
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US12359218B2 (en) 2017-07-28 2025-07-15 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11932884B2 (en) 2017-08-30 2024-03-19 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US12406749B2 (en) 2017-12-15 2025-09-02 The Broad Institute, Inc. Systems and methods for predicting repair outcomes in genetic engineering
US12157760B2 (en) 2018-05-23 2024-12-03 The Broad Institute, Inc. Base editors and uses thereof
US12522807B2 (en) 2018-07-09 2026-01-13 The Broad Institute, Inc. RNA programmable epigenetic RNA modifiers and uses thereof
US12281338B2 (en) 2018-10-29 2025-04-22 The Broad Institute, Inc. Nucleobase editors comprising GeoCas9 and uses thereof
US12351837B2 (en) 2019-01-23 2025-07-08 The Broad Institute, Inc. Supernegatively charged proteins and uses thereof
US12281303B2 (en) 2019-03-19 2025-04-22 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
US11795452B2 (en) 2019-03-19 2023-10-24 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
US11447770B1 (en) 2019-03-19 2022-09-20 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
US12509680B2 (en) 2019-03-19 2025-12-30 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
US11643652B2 (en) 2019-03-19 2023-05-09 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
US12473543B2 (en) 2019-04-17 2025-11-18 The Broad Institute, Inc. Adenine base editors with reduced off-target effects
US12435330B2 (en) 2019-10-10 2025-10-07 The Broad Institute, Inc. Methods and compositions for prime editing RNA
US12031126B2 (en) 2020-05-08 2024-07-09 The Broad Institute, Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
US11912985B2 (en) 2020-05-08 2024-02-27 The Broad Institute, Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
WO2022051555A2 (en) 2020-09-03 2022-03-10 Rampart Bioscience, Inc. Soluble alkaline phosphatase constructs and expression vectors including a polynucleotide encoding for soluble alkaline phosphatase constructs
WO2022197183A1 (en) 2021-03-19 2022-09-22 Wageningen Universiteit Methods for recombinant protein expression in eukaryotic cells

Also Published As

Publication number Publication date
FR3024464A1 (en) 2016-02-05

Similar Documents

Publication Publication Date Title
WO2016016358A1 (en) Targeting of non-viral integrative vectors in the nucleolar dna sequences of eukaryotes
ES2985812T3 (en) High-throughput precision genome editing
Shatskikh et al. Functional significance of satellite DNAs: insights from Drosophila
JP2024023194A (en) Delivery and use of CRISPR-Cas systems, vectors and compositions for liver targeting and therapy
RU2721275C2 (en) Delivery, construction and optimization of systems, methods and compositions for sequence manipulation and use in therapy
RU2716421C2 (en) Delivery, use and use in therapy of crispr-cas systems and compositions for targeted action on disorders and diseases using viral components
US20200239863A1 (en) Tracking and Manipulating Cellular RNA via Nuclear Delivery of CRISPR/CAS9
EP1826215B1 (en) Method of obtaining the expression or improving the rate of expression of a gene
EP3350327B1 (en) Engineered crispr class 2 cross-type nucleic-acid targeting nucleic acids
CA3036926C (en) Modified stem cell memory t cells, methods of making and methods of using same
EP1062364B1 (en) Qualitative differential screening
KR20210077732A (en) Programmable DNA base editing by NME2CAS9-deaminase fusion protein
FR2821855A1 (en) SYNTHETIC GENES AND BACTERIAL PLASMIDS WITHOUT CPG
WO2016049024A2 (en) Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo
KR20180034402A (en) New CRISPR Enzymes and Systems
WO2016133165A1 (en) METHOD FOR TRANSFERRING Cas9 mRNA INTO MAMMALIAN FERTILIZED EGG BY ELECTROPORATION
KR20190089175A (en) Compositions and methods for target nucleic acid modification
HU230368B1 (en) A novel method to load a mammalian artificial chromosome with multiple genes
JP6952315B2 (en) Genome editing method
JP6958917B2 (en) How to make gene knock-in cells
JP2000515011A (en) Transformation-related recombination cloning
CN105624196A (en) Method for establishing CYP2C11 gene knockout rat model
EP1824984A2 (en) In-vitro method for producing oocytes or eggs having targeted genomic modification
KR102699756B1 (en) Prime editing-based gene editing composition with improved editing efficiency and use thereof
TW202309291A (en) Compositions and methods for indoor air remediation

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15752948

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15752948

Country of ref document: EP

Kind code of ref document: A1