[go: up one dir, main page]

LU82757A1 - Genes de la proinsuline humaine et de pre-proinsuline humaine,leur procede de preparation et leurs applications - Google Patents

Genes de la proinsuline humaine et de pre-proinsuline humaine,leur procede de preparation et leurs applications Download PDF

Info

Publication number
LU82757A1
LU82757A1 LU82757A LU82757A LU82757A1 LU 82757 A1 LU82757 A1 LU 82757A1 LU 82757 A LU82757 A LU 82757A LU 82757 A LU82757 A LU 82757A LU 82757 A1 LU82757 A1 LU 82757A1
Authority
LU
Luxembourg
Prior art keywords
sequence
proinsulin
human
coding
radical
Prior art date
Application number
LU82757A
Other languages
English (en)
Inventor
H Goodman
G Bell
W Rutter
R Pictet
Original Assignee
Univ California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ California filed Critical Univ California
Publication of LU82757A1 publication Critical patent/LU82757A1/fr

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/62Insulins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Plant Pathology (AREA)
  • Diabetes (AREA)
  • Endocrinology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Peptides Or Proteins (AREA)

Description

\ * k L'invention fournit le gène humain isolé et purifié (cloné) codant pour la proinsuline et le gène humain codant pour la pré-proinsuline, des procédés d’isolement et de purification des ijènes et un procédé de transfert des gènes à, et 5 de reproduction des gènes dans, un microorganisme. Les gènes isolés et purifiés sont exprimés par un microorganisme hôte lorsqu’ils sont fusionnés avec un gène de procaryote hôte exprimable. Les deux gènes sont utilisables dans la production d’insuline humaine dans des buts thérapeutiques.; 10 L'insuline est une hormone produite principalement par les cellules B du pancréas. Actuellement, l’utilisation de cette hormone dans le traitement du diabète est bien connue. Bien que les abattoirs fournissent des pancréas de boeuf et de porc comme sources d’insuline, une pénurie de cette hor-15 mone se fait sentir en raison du nombre croissant de diabétiques dans le monde. De plus, certains diabétiques sont allef-giques à l'insuline de boeuf et de porc, avec des effets néfastes. Une possibilité de produire de l'insuline humaine en quantités suffisantes pour satisfaire les besoins mondiaux 20 est donc hautement désirable. L’invention fournit des gènes qui sont insérables dans des microorganismes, qui sont utilisables dans la production d’inguline humaine.
* L’insuline est constitués de deux chaînes de polypep tides connues sous le nom de chaîne A et B, reliées ensembles 25 par des ponts disulfure. La chaîne A consiste en 21 acides aminés et la chaîne B en 30 acides aminés. Ces chaînes ne sont pas synthétisées indépendamment in vivo, mais dérivent d’un précurseur immédiat, appelé proinsuline. La proinsuline est une simple chaîne de polypeptide qui contient un peptide 30 appelé le peptide C qui relie les chaînes A et B. Voir Steiner D.F. et al., Science 157, 697 (1967). Ce peptide C est excisé pendant l’emmagasinage de l’insuline dans les granules secréteurs des cellules B du pancréas avant la secrétion. Voir Tager H.S. et al., Ann. Rev. Biochem. 43, 509 (1974). On pen-35 2 k se généralement que le rôle du peptide C consiste à ne fonctionner que pour former la structure tri-dimensionnelle de la molécule. La séquence d’acides aminés pour la proinsuline, déterminée par des techniques classiques, est indiquée dans 5 le tableau 1 suivant. Dans ce tableau, la chaîne C comprend les acides aminés 1 à 30, le peptide C les acides aminés 31 à 65 et la chaîne A les acides aminés 66 à 86.
TABLEAU 1 10 · 1 10 NH0-Phe-Val-Asn-Gln-His-Leu-Cys-Gly-Ser-His-Leu-Val-Glu-z 20
Ala-Leu-Tyr-Leu-Val-Cys-Gly-Glu-Arg-Gly-Phe-Phe-Try-Thr- 30 40
Pro-Lys-Thr-Arg-Arg-Glu-Ala-Giu-Asp-Leu-Gln-Val-Gly-Gln- 50
Val-Glu-Leu-Gly-Gly-Gly-Pro-Gly-Ala-Gly-Ser-Leu-Gln-Pro- ,, 60
Leu-Ala-Leu-Glu-Gly-Ser-Leu-Gln-Lys-Arg-Gly-Ile-Val-Glu- 70 v 80
Gln-Cys-Cys-Thr-Ser-Ile-Cys-Ser-Leu-Tyr-Gln-Leu-Glu-Asn- 86
Try-Cys-Asn __________________ 20 La synthèse chimique de cette séquence de 86 acides aminés, bien que réalisable, est difficile au moyen de techniques classiques.
Dans les cellules B du pancréas, le produit de translation initial n’est pas la proinsuline elle-même, mais une - 25 prê-proinsuline qui contient plus de 20 acides aminés supplé mentaires sur la terminaison amino de la proinsuline. Voir Cahn S.J. et al., Proc. Nat. Acad. Sei. USA 73, 1964 (1976) et Lomedico P.T. et al., Nucl. Acid Res. 3, 381 (1976). L’autre séquence d’acides aminés est appelée le peptide "signal”. 30 Dans la pré-proinsuline humaine (voir la Fig.2 des dessins annexés) le peptide signai comporte 24 acides amines et la
-24 -20 A
séquence est la suivante : NH^-Wtet-Ala-Leu-Trp-Met-Arg-Leu-
Leu-Pro-Leu-Leu-Ala-Leu-Leu-Ala-Leu-Trp-Gly-Pro-Asp-Pro-Ala- -1
Ala-Ala. On pense que la séquence de 24 acides aminés serait 35
V
3 un signal spécifique pour le transport vectorial du polypeptide synthétisé dans le réticulum endoplasmique de la cellule B, et est séparée de la proinsuline pendant cette phase. Voir Biobel G. et al., J. Cell. Biol. 67, 835 (1975).
5 On connaît plusieurs cas de peptides "signal11 pour des protéines d’eucaryotes a transporter à travers des barrières de membrane. Une enzyme de scission spécifique a été observée dans un système sans cellules qui hydrolyse la liaison peptidique entre le peptide signal et la protéine active 10 en même temps qu’un passage à travers une membrane cellulaire. (Voir Biobel G. et al., Proc. Nat. Acad. Sei. USA 75, 361 (1978) ).
De récents progrès en biochimie et dans la technologie de 1’ADN recombinant ont rendu possible la synthèse de 15 protéines synthétiques dans des conditions déterminées indépendantes de l’organisme supérieur dont elles sont normalement isolées. Ces procédés de synthèse biochimiques utilisent des enzymes et des constituants sous-cellulaires du mécanisme de synthèse des protéines des cellules vivantes, soit in vi-20 tro, dans des systèmes sans cellules, soit in vivo, dans des microorganismes. Dans l’un ou l’autre cas, l’élément clé est la fourniture d’un acide désoxyribonucléique (ADN) de séquence spécifique qui contient l'information nécessaire pour spécifier la séquence d’acides aminés désirée. Un tel ADN spéci-25 fique est appelé ici un gène. La relation codante où une séquence de désoxynucléotides est utilisée pour spécifier la séquence d’acides aminés d’une protéine est décrite brièvement, ci-dessous, et fonctionne selon un ensemble fondamental de principes qui prévalent dans la totalité du domaine connu 30 des organismes vivants.
Un gène cloné peut être utilisé pour spécifier la séquence d’acides aminés des protéines synthétisées par des systèmes in vitro. Des systèmes de synthèse des protéines à partir de l’ADN sont bien connus dans la technique, voir, par 35 exemple, Zubay G,, Ann. Rev. Genetics 7, 267 (1973). De plus,
V
4 un ADN à simple chaîne (spirale) peut être induit pour jouer le rôle d'ARN messager in vitro, fournissant une translation très fidèle de la séquence d’ADN (Salas, J. et al. J. Biol. Chem. 243, 1012 (1968). D’autres procédés bien connus dans 5 la technique peuvent être utilisés en combinaison avec les procédés ci-dessus pour augmenter les rendements.
Des développements concernant la technologie de 1’ ADN recombinant ont permis l’isolement de gènes ou de portions de gènes spécifiques à partir d’organismes supérieurs, ÎO tels que l’homme et d'autres mammifères, et de transférer les gènes ou fragments à un microorganisme, tel qu’une bactérie ou une levure. Le gène transféré est reproduit et propagé lorsque le microorganisme transformé est reproduit. Il en résulte que le microorganisme transformé peut devenir capable 15 de produire toute protéine pour laquelle code le gène ou le fragment, que ce soit une enzyme, une hormone, un antigène ou un anticorps ou une portion de ces substances. Le microorganisme transmet sa capacité à sa descendance, de sorte qu’en fait, le transfert a pour résultat une nouvelle souche, 20 possédant l’aptitude décrite. Voir par exemple Ullrich A. et al., Science 196, 1313 (1977) et Seeburg P.H. et al., Nature 270, 486 (1977). Un fait fondamental qui sert de base à l’application de cette technologie à des buts pratiques, est que l’ADN de tous les organismes vivants, des microbes à i 25 l’homme, est chimiquement le même, étant composé des quatre mêmes nucléotides. Les différences significatives résident dans les séquences de ces nucléotides dans la molécule d’ADN polymère. Les séquences de nucléotides sont utilisées pour spécifier les séquences d’acides aminés des protéines qui cons-30 tituent l’organisme. Bien que la plupart des protéines de différents organismes diffèrent les unes des autres, la relation codante entre une séquence de nucléotides et une séquence d’acides aminés est fondamentalement la même pour tous les organismes. Par exemple, la même séquence de nucléotides qui code 35 pour la séquence d’acides aminés de l’HGH (hormone gonadotrope ί 5 humaine) dans les cellules de l’hypophyse humaine, sera, une fois transférée à un microorganisme, reconnue comme codant pour la même séquence d'acides aminés.
Les abréviations utilisées ici sont expliquées dans .5 le Tableau 2.
TABLEAU 2 ADN = acide désoxyribonucléique ARN = acide ribonucléique cADN = ADN complémentaire 10 (synthétisé par voie enzymatique à partir d'une séquence de mARN) mARN = ARN messager dATP = désoxyadénosine triphosphate dGTP = désoxyguanosine triphosphate 15 dCTP = désoxycytidine triphosphate A = adénine T » thymine G = guanine C = cytosine 20 U - uracile ATP = adénosine triphosphate TTP = thymidine triphosphate EDTA = acide éthylène diamine tétraacétique - Les relations codantes entre une séquence de nucléo- tides dans l'ADN et une séquence d'acides aminés dans la protéine sont collectivement connues sous le nom de "code génétique", tel qu'indiqué dans le Tableau 3.
TABLEAU 3 CODE GENETIQUE
ju ......
Phénylalanine(Phe) TTK Histidine(His) CAK
Leucine(Leu) ΧΓΥ Glutamine(Gin) CAJ
Isoleucine(Ile) ATM Asparagine(Asn) AAK
Méthionine(Met) ATG Lysine(Lys) AAJ
V
6 *
Valine (Val) GTL Acide aspartique (Asp) GAK
Sérine(Ser) QRS Acide glutamique(Glu) GAJ
Proline(Pro) CCL Cystéine(Cys) TGK
Thréonine(Thr) ACL Tryptophane(Try) TGG
5 Alanine(Ala) GCL Arginine(Arg) W32
Tyrosine(Tyr) TAK Glycine(Gly) GGL
Signal de terminaison TA J
Signal de terminaison TGA
10
Explication î chaque triplet de désoxynucléotide, de 3 lettres, correspond à un trinucléotide de mARN, ayant une extrémité 5’ à gauche et une extrémité 3* à droite. Toutes les séquences d’ADN indiquées ici sont celles de la chaîne dont 15 la séquence correspond à la séquence de mARN, l’uracile étant remplacé par la thymine. Les lettres représentent les bases purine ou pyrimidine formant la séquence de désoxynucléotides. A = adénine J = A ou G
G — guanine K = T ou C
20 C = cytosine L = A, T, C ou G
T = thymine M = A, C ou T
X = T ou C si Y est A ou G
X = C si Y est C ou T
Y = A, G, C ou T si X est C 25 Y = A ou G si X est T
W 5 C ou A si Z est A ou G
W = C si Z est C ou T
Z = A, G, C ou T si W est C Z = A ou G si W est A
30 QR = TC si S est A, G, C ou T
QR — AG si S est T ou C
S = A, G, C ou T si QR est TC
S = T ou C si QR est AG
Une caractéristique importante du code, pour le but 7 de l’invention, réside dans le fait que chaque acide aminé est spécifié par une séquence de trinucléotide, également connue comme triplet de nucléotide. Les liaisons phospho-diester réunissant des triplets adjacents ne peuvent pas ê-5 tre chimiquement distinguées de toutes les autres liaisons internucléotides dans l’ADN. En conséquence la séquence de nucléotides ne peut pas être lue pour coder pour une séquence unique d’acides aminés/éans une autre information pour déterminer le cadre de lecture qui est le terme utilisé pour 10 indiquer le groupe de triplets utilisé par la cellule en décodant le message génétique.
De nombreuses techniques d’ADN recombinant utilisent deux classes de composés, les vecteurs de transfert et les enzymes de restriction, qui seront discutés successivement.
15 Un vecteur de transfert est une molécule d’ADN qui contient, entre autres, une information génétique qui assure sa propre reproduction lorsqu’elle est transférée à une souche de mi-aroorganisme hôte. Des exemples de vecteurs de transfert communément utilisés dans les génétiques bactériennes sont les 20 plasmides et l'ADN de certains bactériophages. Bien que des plasmides aient été utilisés comme vecteurs de transfert pour le travail décrit ici, il est évident que d’autres types de vecteurs de transfert peuvent être également utilisés. "Plasmide” est le terme appliqué à toute unité d’ADN à reproduc-1 25 tion autonome, qui peut être trouvée dans une cellule micro bienne, autre que le génome de la cellule hôte elle-même.
L‘ADN plasmique existe sous forme de structures cycliques à double chaîne, généralement de l’ordre de quelques millions de daltons de poids moléculaire, bien que certaines aient un 30 poids moléculaire supérieur à 10 daltons. Elles ne représentent normalement qu’un faible pourcentage de l’ADN total de la cellule. L’ADN du vecteur de transfert est normalement séparable de l’ADN de la cellule hôte grâce à la grande différence de dimension entre eux. Les vecteurs de transfert por-35 tent une information génétique les rendant capables de se re- t 8 produire dans la cellule hôte, dans la plupart des cas indépendamment de la vitesse de division de la cellule hôte. Certains plasmides ont la propriété d’avoir une vitesse de reproduction réglable par le chercheur en modifiant les con-5 ditions de croissance. Au moyen de techniques appropriés, le noyau de l’ADN plasmique peut être ouvert, un fragment d’ADN hétérologue inséré et le noyau refermé, formant une plus grosse molécule comprenant le segment d’ADN inséré. L'ADN bactériophage peut porter un segment d’ADN hétérologue insé-10 ré au lieu de certains gènes provenant d’autres phages non-essentiels. Dans l’un ou l’autre cas, le vecteur de transfert sert de support ou de vecteur pour un fragment d’ADN hétérologue inséré.
Le transfert a lieu selon un procédé connu comme é-15 tant une transformation. Pendant la transformation, les cellules bactériennes mélangées avec l’ADN plasmique incorporent des molécules entières de plasmide dans les cellules. Bien que le mécanisme du processus reste obscur, il est possible de maximaliser la proportion de cellules bactériennes capa-20 blés de fixer l’ADN plasmique et par conséquent de se transformer par certains traitements déterminés par voie empirique. Une fois qu’une cellule a incorporé un plasmide, ce dernier est reproduit dans la cellule et les répliques du plasmide sont réparties dans les cellules filles lorsque la cellule 25 se divise. Toute information génétique contenue dans la séquence de nucléotides de l’ADN plasmique peut, en principe^ être exprimée dapsla cellule hôte. Typiquement, une cellule hôte transformée est reconnue par son acquisition de caractères portés sur le plasmide, tels que la résistance à certains an- 30 tibiotiques. Des plasmides différents sont reconnaissables \ par les aptitudes différentes ou une combinaison différente d’aptitudes qu’ils confèrent à la cellule hôte les contenant. Tout plasmide donné peut être reproduit en quantité, en développant une culture pure de cellules contenant le plasmide 35 et en isolant l’ADN plasmique à partir de la culture.
i 9
V
Les endonucléases de restriction sont des enzymes hydrolytiques capables de catalyser une scission des molécules d’ADN en un site spécifique. Le lieu de l’action de l’endonucléase de restriction est déterminé par l’existence d'une 5 séquence de nucléotides spécifique. Une telle séquence est appelée le site de reconnaissance pour l'endonucléase de restriction. Des endonucléases de restriction de sources diverses ont été isolées et caractérisées en termes de la séquence de nucléotides de leurs sites de reconnaissance. Certaines 10 endonucléases de restriction hydrolysent les liaisons phospho-diester sur les deux chaînes au même point, produisant des extrémités tronquées. D’autres catalysent l’hydrolyse de liaisons séparées l’une de l’autre par quelques nucléotides, produisant des régions à simple chaîne libre à chaque extrémité 15 de la molécule scindée. Ces extrémités à simple chaîne sont auto-complémentaires, donc cohésives, et peuvent être utilisées pour réunir l’ADN hydrolysé. Etant donné que tout ADN capable d’être scindé par une telle enzyme doit contenir le même site de reconnaissance, les mêmes extrémités cohésives seront pro-20 duites, de sorte qu'il est possible de réunir des séquences hétérologues d’ADN qui ont été traitées avec une endonucléase de restriction à d’autres séquences ayant subi le même traitement. Voir Roberts R.J., Crit. Rev. Biochem., 4, 123 (1976).
Les sites de restriction sont relativement rares, mais l*:uti-25 lité générale des endonucléases de restriction a été considérablement élargie par la synthèse chimique d’oligonucléotides à double chaîne portant la séquence du site de restriction.
En conséquence, virtuellement tout segment d’ADN peut être accouplé à tout autre segment en fixant simplement l’oligonu-30 cléotide de restriction approprié aux extrémités de la molécule, et en soumettant le produit à l’action hydrolytique de l’endonucléase de restriction appropriée, d’où la production d’extrémités cohésives requises. Voir Heyneker H.L. et al. Nature 263, 748 (1976) et Scheller R.H. et al., Science 196, 35 177 (1977). Une caractéristique importante de la répartition i, c 10 des sites de reconnaissance d'une endonucléase de restriction est le fait qu'ils sont répartis au hasard quant au cadre de lecture. En conséquence, la scission par une endonucléase de restriction peut se produire entre deux codons 5 adjacents ou à l'intérieur d'un codon.
On dispose de procédés plus généraux de scission de l'ADN ou de modification de la séquence terminale. Un grand nombre d'endonucléases non-spécifiques peuvent être utilisées pour scinder statistiquement l’ADN, tel que discuté ci-10 dessous. Les séquences terminales peuvent être modifiées par la création de queues d'oligonucléotides de dA à une extrémité et de dT à l’autre, ou de dG et de dC, pour créer des sites de réunion sans avoir besoin de séquences de liaison spécifiques.
15 Le terme "expression" est utilisé pour souligner le fait qu'un organisme utilise rarement pour ne pas dire jamais, la totalité de ses aptitudes génétiques à un moment donné.
Même dans des organismes relativement simples tels que des bactéries, de nombreuses protéines que la cellule est capa-20 ble de synthétiser, ne sont pas synthétisées alors qu'elles pourraient l'être dans des conditions ambiantes appropriées. Lorsque le produit protéinique, codé par un gène donné, est synthétisé par l'organisme, le gène est dit "être exprimé".
Si le produit protéinique n'est pas réalisé, le gène n'est 25 pas exprimé. Normalement, l'expression des gènes dans E. coli est réglée tel que décrit généralement ci-après, de telle sorte que les protéines dont la fonction n'est pas utilisée dans un milieu donné, ne sont pas synthétisées et l'énergie métabolique est conservée.
30 Le mécanisme selon lequel l'expression du gène est réglée dans E. coli est bien connu, grâce aux études intensi-? - ves de ces vingt dernières années. Voir, en général, Hayes W., The Genetics of Bacteria and Their Viruses, 2ème édition, John Wiley et Sons, New York (1968) et Watson J.D.,The Molecu-35 3ar Biology of the Gene, 3ème édition, Benjamin, Menlo Park, l « 11
Californie (1976). Ces études ont révélé que plusieurs gènes, normalement ceux codant pour des protéines exerçant des fonctions apparentées dans la cellule, sont trouvés groupés ensemble dans une séquence continue. Le groupe est appelé un 5 »'opéron". Tous les gènes dans 1* opéron sont transcrits dans la même direction, en commençant avec les codons codant pour l'acide aminé N-terminal de la première protéine dans la séquence et en continuant jusqu'à l'extrémité C-terminale de la dernière protéine dans 1'opéron. Au commencement de 1'opéron, 10 il existe une région de l'ADN, appelée la région de contrôle, qui comprend une variété d'éléments de contrôle dont l'opérateur, le promoteur et les séquences pour les sites de liaison ribosomiques. Le rôle de ces sites est de permettre que, sous leur contrôle, l'expression de ces gènes réponde aux 15 besoins de l'organisme. Par exemple, les gènes codant pour des enzymes requises exclusivement pour l'utilisation du lactose ne sont normalement pas beaucoup exprimés à moins que le lactose ou un de ses analogues ne soit réellement présent dans le milieu. Les fonctions de la région de contrôle néces-20 saires à l'expression sont l'initiation de la transcription et l'initiation de la translation. L'expression du premier gène dans la séquence est initiée par l'initiation de la transcription et de la translation à la position codant pour l'acide aminé N-terminal de la première protéine de 1» opéron. L'ex-25 pression de chaque gène à partir de ce point est donc initiée à son tour, au moins jusqu'à ce qu'un signal de terminaison ou un autre opéron soit rencontré avec sa propre région de contrôle, accordée pour répondre à un jeu différent d'indications- ambiantes. Bien que les détails correspondant à ce sché-30 ma général puissent varier énormément, le fait important est que, pour être exprimé dans un procaryote tel que E. coli, un gène doit être convenablement situé quant à une région de contrôle ayant le rôle d'initiateur de transcription et d'initiateur de translation.
35 % 12
On a démontré que des gènes ne faisant pas normalement partie d’un opéron donné, peuvent être insérés dans l'o-péron et contrôlés par lui. La démonstration classique en a été faite par Jacob F., et al., J. Mol. Biol., 13, 704 (1965).
5 Dans cette expérience, des gènes codant pour des enzymes impliquées dans tin processus de biosynthèse de la purine, ont été transférés vers une région contrôlée par 1’opéron du lactose. L*e3q>ression de l’enzyme biosynthétique de purine était visiblement réprimée en l’absence de lactose ou d’un analo-10 gue du lactose, et ne répondait pas aux indications ambiantes réglant normalement son expression.
En plus de la région de l’opérateur réglant l’initiation de la transcription des gènes à partir d’elle, on sait qu’il existe des codons qui agissent comme des signaux d’ar-15 rêt, indiquant l’extrémité C-terminale d’une protéine donnée. Voir Tableau 3. Ces codons sont connus comme des signaux de terminaison et également comme des codons extravagants car ils ne codent normalement pas pour un acide aminé quelconque.
La suppression d’un signal de terminaison entre des gènes 20 structuraux d’un opéron crée un gène fusionné qui pourrait avoir pour résultat la synthèse d’une protéine chimérique constituée de deux séquences d’acides aminées codées par des gènes adjacents, réunies par une liaison peptidique. Cette synthèse de protéines chimériques lorsque des gènes sont fu-25 sionnés a été démontrée par Benzer S. et Champe S.P., Proc.
Nat. Acad. Sei. USA 48, 114 (1962).
Dès qu'un gène a été isolé, purifié et inséré dans un vecteur de transfert, le résultat global de ce qu’on appelle "faire un clone" à partir du gène, sa disponibilité en quan-30 tité substantielle est assurée. Le gène ainsi cloné est transféré dans un microorganisme approprié où le gène se reproduit lorsque le microorganisme prolifère et à partir duquel le gène peut être de nouveau isolé par des moyens classiques. Cette technique fournit donc une source continuellement renouvelable 35 du gène pour d'autres manipulations, modifications et transferts 4 13 à d’autres vecteurs ou en d’autres lieux dans le même vecteur.
L’expression est obtenue en transférant le gène cloné, dans une orientation et un cadre de lecture appropriés, dans une région de contrôle telle qu’une lecture complète à partir 5 du gène de procaryote se traduise par la synthèse d’une protéine chimérique comprenant la séquence d’acides aminés codés par le gène cloné. De nombreuses techniques de scission spécifique d’une protéine peuvent être utilisées pour scinder la protéine chimérique en un point désiré de façon à libérer 10 la séquence d'acides aminés recherchés qui peut alors être purifiée par des moyens classiques. Des techniques de construction d’un vecteur de transfert d’expression où le gène cloné est convenablement juxtaposé avec une région de contrôle, sont décrites par Polisky B. et al., Proc. Nat. Acad.
15 Sei. USA 73, 3900 (1976) ; Itakura K. et al., Science 198, 1056 (1977) ; Villa-Komaroff L. et al, Proc. Nat. Acad. Sei. USA 75, 3727 (1978) ; Mercereau-Puijalon O. et al., Nature 275, 505 (1978) ; Chang A.C.Y. et al., Nature 275, 617 (1978) et dans la demande de brevet US n° 933 035 de Rutter et al.
20 En résumé, le procédé qui permet de produire une pro téine de mammifère, telle qu’une pré-proinsuline ou un proinsuline humaine, en appliquant la technologie de l’ADN recombinant, requiert d’abord l’isolement et la purification du gène de mammifère. Une fois cloné, le gène peut être produit 25 en quantité, modifié par un moyen chimique ou enzymatique et transféré à un plasmide d’expression. Le gène cloné est également utilisable pour isoler des gènes voisins, ou si seul un fragment est cloné, pour isoler le gène entier, en utilisant le gène cloné comme modèle d’hybridation. De plus, le 30 gène cloné est utilisable pour prouver par hybridation l’identité ou le caractère homologue des isolats indépendants de gènes identiques ou apparentés. En raison de la nature du code génétique, le gène cloné, lorsqu’il est transmis dans le cadre de lecture approprié, ne dirige que la production de 35 la séquence d’acides aminés pour laquelle il code et aucune 4 14 autre.
L'isolement et la purification de la proinsuline du rat ont fait l'objet de divers travaux. Ullrich A. et al., voir ci-dessus, et Villa-Komaroff L. et al., voir ci-dessus, 5 décrivent l'isolement et la purification du gène de la proinsuline du rat et un procédé de transfert et de reproduction de ce gène dans un microorganisme« Ullrich et al. ont recueilli plusieurs plasmides recombinants qui contenaient la séquence de codage pour la proinsuline, la région non transmise 10 3' et une partie du pré-peptide. L'expression de l'ADN de rat contenant la séquence codant pour l'insuline a été décrite dans la demande de brevet US n° 933 035. Villa-Komaroff et al. ont recueilli un plasmide recombinant qui contenait la séquence codant pour les acides aminés 4 à 86 de la proinsu-15 line. Cette séquence de proinsuline a été séparée des acides aminés 24 à 182 de la pénicillinase ( p-lactamase) par la séquence codant pour six glycines. Cette séquence codant pour la proinsuline de pénicillinase a été exprimée pour produire une protéine fusionnée. Ces articles décrivent une partie des 20 procédés de base utilisés dans la technologie de l'ADN recombinant. Cependant, ils ne décrivent ni l'isolement, ni la purification du gène de la pré-proinsuline humaine ou du gène , de la proinsuline humaine.
Créa R. et al., Proc. Nat. Acad. Sei USA 75, 5765 25 (1978), ont suivi une voie différente pour obtenir de l’insu line humaine. Cette voie consiste à synthétiser chimiquement des séquences codant pour (1) la chaîne A et (2) la chaîne B de l'insuline humaine, en utilisant des codons favorisés par E« coli. Ces deux séquences peuvent alors être insérées dans 30 des plasmides qui peuvent être exprimés pour produire les chaînes A et B. L’insuline humaine pourrait alors être obtenue par formation des liaisons disulfure correctes entre les deux chaînes de protéine.
Le gène cloné pour la pré-proinsuline humaine est uti-35 lisable de diverses façons. La transposition à un vecteur de % 15 transfert d’expression permet la synthèse de la pré-proinsuline par un raicroorganisme hôte transformé par le vecteur portant le gène cloné. La prolifération de l’hôte transformé se traduit par la synthèse de la pré-proinsuline comme partie 5 d’une protéine chimérique. Si la portion de procaryote de la protéine fusionnée est la portion signal d’une protéine hôte excrétée ou sectionnée d’une autre façon en compartiments, l'excrétion ou la division én ccsmpartiments peuvent augmenter .de façon importante la stabilité''et la facilité de purification de la pro-10 téine fusionnée de pré-proinsuline. De plus, lorsque la portion de procaryote est courte, l’excrétion hors de l’hôte de procaryote peut être facilitée par le pré-peptide lui-même, si la pré-séquence fonctionne dans l’hôte de procaryote comme elle le fait dans la cellule d’eucaryote. Le gène de la pré-15 proinsuline peut également être utilisé pour obtenir le gène de la proinsuline en utilisant les techniques décrites ci-après.
Le gène cloné de la pré-proinsuline peut être utilisé dans diverses techniques pour produire la pré-proinsuline.
20 La pré-proinsuline elle-même est utilisable en raison du fait qu’elle peut être convertie en proinsuline par des techniques enzymatiques et chimiques connues. Par exemple, le prépeptide peut être éliminé par une préparation enzymatique soluble, tel que décrit par Blobel G. et al., ci-dessus, spécifique 25 pour l’élimination des peptides "signal’’. Le gène cloné de la proinsuline peut être utilisé dans diverses techniques pour la production de proinsuline. La proinsuline, produite à partir de l’un de ces gènes, est utilisable elle-même, car elle peut être convertie en insuline par des techniques enzymati-.30 ques et chimiques connues. Voir Kemmber W. et al., J. Biol. Chem. 242, 6786 (1971).
L’invention concerne un procédé de préparation d’un vecteur de transfert d’ADN, utilisable pour conserver et reproduire une séquence de désoxynucléotides codant pour la pré-35 proinsuline humaine, caractérisé en ce qu’on fait réagir une Λ 16 séquence de dé s oxynue1éotides codant pour la pré-proinsuline humaine avec une molécule d'ADN préparée par scission d'un vecteur de transfert par une enzyme de restriction.
Tel que décrit ici, un cADN ayant la séquence de base codant pour la pré-proinsuline humaine et un cADN ayant la séquence de base codant pour la proinsuline humaine sont isolés et purifiés (clonés). La structure des cADN clonés est vérifiée par analyse des séquences de nucléotides.
La source originale du matériau génétique est l'insu- 10
Imoma humain (une tumeur produisant de l'insuline). Un ARN messager est isolé des cellules.
Un ADN complémentaire à l'ARN messager isolé (cADN) est synthétisé en utilisant la transcriptase inverse, dans deux cycles de réaction pour former le cADN à double chaîne.
Le cADN â double chaîne, non-scindé, hétérogène, est traité pour fournir des séquences d'oligonucléotides de liaison, spécifiques, à chaque extrémité, afin de faciliter l'insertion dans un site de même spécificité de restriction sur un vecteur de transfert.
20
Pour l'isolement et la purification, on choisit un vecteur de transfert assurant une bonne sélection et des propriétés de reproduction stables. On insère le cADN traité dans un vecteur de transfert en un site prédéterminé sur le vecteur d'ADN pour former un vecteur de transfert recombinant, 25 . en utilisant des technxques courantes. Des cellules de micro organismes hôte sont transformées par le vecteur recombinant. Des agents de transformation ou transformants sont choisis selon les critères établis pour l'insertion en le site prédéterminé. Des colonies simples, dérivées chacune d'une seule 30 cellule de microorganisme transformée, sont rassemblées et multipliées dans des cultures individuelles afin de permettre la reproduction des clones d'ADN du vecteur de transfert recombinant. On sélectionne l'ADN du vecteur de transfert pour les séquences d'insuline par un procédé d'hybridation de co-35 lonies modifié. Des colonies donnant un ADN de vecteur de Λ 17 transfert recombinant pour les séquences d’insuline sont multipliées dans de plus grandes cultures individuelles pour isoler l’ADN du vecteur de transfert et le soumettre à une analyse. On choisi des clones appropriés pour une identifi-5 cation définitive de la séquence de nucléotides des gènes de pré-proineuline ou de proinsuline clonés, et pour le transfert à des plasmides d’expression appropriés.
L’invention fournit en outre un procédé de préparation d’une séquence de désoxynucléotides codant pour la pro-10 insuline humaine, utilisable dans la synthèse de l’insuline humaine, caractérisé en ce qu’on hydrolyse les extrémités 3’ d’une séquence de désoxynucléotides codant pour la pré-proin«, suline humaine, conservée et reproduite selon le procédé de l’invention, par un ou plusieurs cycles de digestion exonu-15 cléolytique progressive, catalysée par la T4 ADN polymérase agissant en présence d’un désoxynucléotide triphosphate, puis en hydrolysant les extrémités 5»de la séquence de désoxynucléotides par une digestion nucléolytique catalysée par une enzyme de nucléase spécifique pour un ADN à simple chaîne 20 ayant une extrémité 5*.
L’invention fournit en outre un procédé de synthèse de la proinsuline humaine comprenant des peptides A et B , séparés l’un de l’autre par un peptide C, caractérisé par l’incubation d’un microorganisme, transformé par un vecteur 25 de transfert d’expression comprenant une séquence de désoxynucléotides codant pour la proinsuline humaine préparée tel que décrit ici, dans des conditions appropriées pour l’expression de la séquence codant pour la proinsuline humaine, et la purification de la proinsuline humaine à partir du lysat ou 30 du milieu de culture du microorganisme.
L’invention fournit encore un procédé de synthèse de l’insuline humaine, caractérisé en ce qu’on oxyde des groupes sulfhydryle sur les peptides A et B de la proinsuline humaine, préparée tel que décrit ici, pour former des ponts disulfure 35 entre les peptides A et B, puis on excise le peptide C par une 18 hydrolyse catalysée par une enzyme, spécifique pour les liaisons réunissant le peptide C aux peptides A et B.
L'invention fournit les éléments génétiques essentiels, nécessaires à la production d'insuline humaine par 5 des techniques adaptables aux procédés industriels. On isole et purifie le gène structural naturel. Son expression dans un type de cellule hôte approprié donne un produit protéinique convertissable en insuline par des procédés connus. L'invention est fondamentalement basée sur la molécule de proin-10 suline et tire avantage du fait que la région du peptide C de la molécule de proinsuline permet un pliage spontané tel que les chaînes A et B sont convenablement juxtaposées.Dans cette configuration, l'appariement correct des groupes sulfhy-dryle est assuré et la formation des ponts disulfure, tels que 15 trouvé dans la molécule d'insuline active, est facile à réaliser. L'excision du peptide C est effectuée par l'utilisation combinée de la trypsine, ou d'une enzyme ayant une spécificité similaire pour un substrat, et de la carboxy-pepti-dase C ou de la cathepsine C pour éliminer l'arginine C-ter-20 minale sur la chaîne B, tel que décrit dans la technique antérieure .
La totalité de la partie structurale codante du gène • de l'insuline humaine est clonée tel que décrit ici, compre nant une partie de la région non-transférée 5», toute la sé-25 quence du prépeptide, la totalité de la séquence codant pour les peptides B, C et A et la totalité de la région non-transférée 3». Le choix de la cellule hôte décide des portions du gène cloné utilisées. La totalité de la séquence codant pour la pré-proinsuline sera utilisable pour transformer certaines 30 espèces de cellules d'eucaryotes supérieurs, car la préséquence agit comme un simple peptide pour promouvoir l'excrétion du peptide hors de la cellule. De plus, ces lignées de cellules d'eucaryotes capables de répondre au peptide signal, catalysent l'élimination spécifique de la préséquence pendant 35 le transport de la protéine à travers la membrane cellulaire.
» 19 *
En outre, ces cellules peuvent être capables de transformer ultérieurement le produit d’expression par une excision de la protéine C après la formation catalytique des ponts disulfure appropriés.
' 5 Dans les cellules hôtes de procaryotes, l’utilisation de la séquence codant pour la proinsuline est préférée selon l’invention. L’opération de conversion de la proinsuline en insuline est conduite en détail selon des procédés connus dans la technique. Deux types d’expression sont déjà connus, 10 impliquant tous les deux l’insertion de la séquence codant pour la proinsuline dans une région du vecteur de transfert d’ADN dont l’expression a été contrôlée par un promoteur de procaryote. Dans certains cas, une partie du gène structural de procaryote et du contrôle du promoteur est interposée de 15 telle sorte que le produit d’expression est une protéine fusionnée ayant sa portion N-terminale composée de la partie N-terminale de la protéine de procaryote et sa portion C-ter-minale est la séquence clonée, dans ce cas la proinsuline. L’expression de la proinsuline comme protéine humaine prêsen-20 te l’avantage que la protéine fusionnée peut être plus stable dans la cellule hôte que la proinsuline elle-même. De plus, lorsque la protéine d’eucaryote est celle qui est normalement , excrétée de la cellule hôte, la protéine fusionnée peut éga lement être excrétée, rendant le produit d’expression plus fa-• 25 eile à purifier. L’emploi de protéines fusionnées présente l’inconvénient que ces protéines doivent être scindées de façon spécifique pour obtenir le produit désiré. Dans le cas de la proinsuline, il existe des techniques qui tirent partie de la-séquence d’acides aminés de la protéine pour scinder 30 spécifiquement une protéine fusionnée, tel que décrit dans l’exemple 2.
La séquence de codage, clonée, peut également être exprimée directement dans la cellule de procaryote en insérant la séquence de façon qu’elle soit directement adjacente à un 35 promoteur. Cette conception est avantageuse en ce qu'une scis- * 20
V
sion spécifique est alors inutile. Mais elle présente l’inconvénient de nécessiter une autre purification.
L’expression des gènes de mammifères insérés dans E.coli a été maintenant obtenue par insertion près des proroo-* 5 teurs lac, trp- et JB-lactamase. Le promoteur lac est utilisa ble du fait que ses propriétés génétiques sont bien caracté- « risées. Il existe deux sites d’insertion possibles, fournissant des conducteurs de procaryotes longs et courts pour la protéine fusionnée. On dispose d’une grande variété de va-10 riants génétiques, ayant des niveaux différents de ré.presseur endogène, qui peuvent être induits par la chaleur, etc. Le promoteur trp a l’avantage de fournir de hauts niveaux d’expression lorsqu’il est induit. Des plasmides d’expression ayant des sites d’insertion dans le promoteur trp sont dispo-15 nibles pour les trois cadres de lecture. Le promoteur de bê-ta-lactamase fournit ce qui revient à une protéine signal de procaryote, car la lactamase est normalement excrétée. Le produit de fusion de JB-lactamase est également excrété ou trouvé dans l'espace périplasmique. En conséquence, il faut 20 moins d’opérations de purification pour obtenir la proinsuline pure.
L’invention tire avantage du rôle du peptide C de la , proinsuline, en fait pour faciliter le pliage spontané de la proinsuline qui amène les chaînes A et B dans une configura-25 tion correcte de telle sorte que les groupes sulfhydryle sont convenablement appariés et les ponts disulfure corrects sont formés, tel qu’on l’observe dans une insuline provenant de la nature. Une comparaison des séquences du peptide C de différentes espèces montre que les séquences de peptide C ne sont 30 pas beaucoup conservées pendant l’évolution. De nombreuses substitutions de la séquence d’acides aminés sont donc possibles dans le peptide C. En fait, le rôle du peptide C peut consister simplement à fournir une boucle d’acides aminés de longueur appropriée pour permettre aux chaînes A et B de se 35 replier ensemble dans la configuration convenable. En consé-
V
21 quence, pratiquement toute séquence de codage pourrait être insérée à la place de la séquence du peptide C de la proinsuline humaine sans modifier substantiellement sa fonction primaire. Mais certains avantages plaident en faveur de l’u-. 5 tilisation du peptide C naturel ; par exemple la séparation du peptide des préparations dTinsuline n’a pas besoin d'être * complète, car le peptide C est un constituant naturel des préparations d'insuline. De plus, il peut être avantageux de conférer la configuration appropriée sur l'insuline ou d’ef-10 fectuer la séparation par des enzymes.
L’invention démontre en outre l'universalité du code génétique. En particulier, des codons favorisés par les cellules de mammifères sont correctement transférés dans E.coli. Des codons de remplacement, codant pour le même acide aminé, 15 pourraient être substitués dans la séquence sans affecter la séquence ou la fonction de la protéine exprimée. L'invention concerne donc toute variance de codage synthétique de la séquence de codage de base réellement clonêe ici, dans la mesure où une telle variance code pour la pré-proinsuline humai-20 ne et la proinsuline humaine.
Les exemples non limitatifs suivants sont donnés à titre d'illustration de l’invention.
EXEMPLE 1
Gène cloné de la pré-proinsuline humaine 25 On clone le gène de l’insuline humaine à partir d’ARN
extrait d'un insulinoma humain selon le procédé décrit par Ullrich et al., ci-dessus, pour isoler l'ARN de cellules d’i-lots. On utilise l’ARN obtenu sous forme d’un culot après centrifugation dans CsCl 5,7 M contenant 100 roM d’EDTA, sans 30 fractionnement, comme modèle pour la synthèse du cADN en employant la transcriptase inverse et la SI nucléase, telqie décrit par Ullrich et al., ci-dessus. A partir de 130 pg d» ARN non-fractionné, on obtient environ 40 ng de cADN à double chaîne.
Λ 22 J*
On traite le cADN non-fractionné avec la transférase terminale en présence de dCTP pour obtenir des queues oligo-C sur les terminaisons 3* des molécules de cADN. De même, on scinde le vecteur de transfert plasmique pBR322 au moyen de 5 1 taidonucléase de restriction Pst I et on traite par une trans- fêrase terminale en présence de dGTP pour produire des queues oligo-dG sur les terminaisons 3’ de l’ADN plasmique linéaire. L’ADN plasmique ainsi traité ne peut pas former un ADN circulaire, car les extrémités des chaînes simples ne sont pas com-10 plémentaires. Toutefois, les extrémités oligo-dC du cADN traité sont complémentaires avec les extrémités oligo-dG du plas-mide et peuvent donc être utilisées pour former des plasmides circulaires dams lesquels le cADN est inséré au site Pst I.
De plus, l’insertion régénère les deux extrémités de la sé-15 quence de reconnaissance Pst I, aux deux extrémités de l’in-sert, permettant ainsi l’excision des séquences insérées (Voir Villa-Komaroff et al., ci-dessus).
On utilise le procédé de formation de queues ci-dessus pour produire des plasmides pBR-322 ayant une population 20 hétérogène d'inserts de cADN au site Pst I. Ces plasmides seraient sensibles à l’ampicilline, car le site Pst I est dans le gène de la ^-lactamase, mais ils restent résistants à la tétracycline. On transforme E.coli, souche X17776, par l’ADN plasmique contenant les inserts. On obtient 525 transformants 25 résistant à la tétracycline. On procède à une reproduction sur plaque et on sélectionne les séquences d’insuline par une hybridation des colonies in situ, essentiellement tel que décrit par Gruenstein et Hogness, Proc. Nat. Acad. S&i., USA 72, 3961 (1975). On utilise le cADN de la pré-proinsuline de 30 rat, préalablement isolé et purifié (Ullrich et al., ci-des-sus) comme modèle d’hybridation, après avoir marqué le cADN de rat par une translation en utilisant l’ADN polymérase I. Etant donné que les séquences d’acides aminés de l’insuline de rat et de l’insuline humaine sont tout à fait semblables 35 (insuline, 92 % d’homologie j proinsuline, 83 % d’homologie),
V
23 on suppose que le cADN de rat isolé et purifié s’hybride de façon croisée avec les séquences de l’insuline humaine dans des conditions de rigueur réduite, connues dans la technique. Une autoradiographie révèle que 2 des 525 colonies s’hybri-5 dent avec le modèle de prê-proinsuline I de rat cloné. Ces deux colonies sont sensibles à l’ampicilline. Les plasmides isolés des colonies ont environ 250 paires de base et 500 paires de base de plus que le pBR322 lui-même. Le plasmide le plus long est désigné par l’abréviation pcHI-1.
10 On détermine la séquence de nucléotides du fragment de cADN inséré de pcHI-1 par le procédé de Maxam et Gilbert, Proc. Nat. Acad. Sei. USA 74, 560 (1977). Une représentation schématique de l’insert est illustrée sur la Fig. 1 des dessins annexés. Toute la région codant pour la prê-proinsuline 15 humaine est contenue dans l’insert, avec une partie de la région 5’ non-transférée, toute la région 3* non-transférée et une partie de la région 3’-polydA. Les sites de restriction utilisés pour scinder l’insert pour obtenir les séquences sont également montrés sur la Fig. 1., avec la direction 20 de formation des séquences dans chaque fragment et les régions de chevauchement.
La séquence du mARN dérivée de la séquence du cADN, et la séquence d’acides aminés déduite de l’un des cadres de lecture sont représentées sur la Fig. 2 des dessins annexés.
* 25 La structure primaire de la proinsuline humaine déterminée de cette façon concorde de façon précise avec celle obtenue par des expériences de formation de séquences d'acides aminés (Dayhoff M.D., Atlas of Protein Sequence and Structure, 5, Suppl·. 2, pp. 127-130 (1976) et Suppl.3, pp. 150-151 (1978).
30 Les acides aminés de la séquence codant pour la proinsuline sont numérotés de 1 à 86, ceux de la pré-séquence sont numérotés de -24 à -1. La Fig. 2 montre en outre l’emplacement de certains sites de restriction utilisables pour la construction du gène de la proinsuline à partir de l’insert pcHI-1.
35 On comprendra que la séquence de cADN de la chaîne codante de
V
24 l’insert pcHI-1 est la même que celle représentée sur la Fig.
2 si ce n’est que la thymine (T) remplace l’uracile (U).
On prépare de grandes quantités de pcHI-1 et d’autres plasmides en transformant en outre E.coli HB-lOl. La souche 5 HB-lOl sert donc d’hôte approprié pour conserver et reproduire des plasmides ayant des inserts clonés, tel que décrit ici.
EXEMPLE 2
Construction du vecteur de transfert de la proinsuline 10 L’insert de cADN de pcHI-1 contient toute la séquence codant pour la pré-proinsuline humaine. Pour certaines applications, telles que le transfert à une autre espèce de cellule d’eucaryote, le processus normal et la séparation de la pré-séquence et du peptide C, et l’obtention d’une configurais tion convenablement repliée donnant une insuline active peuvent être nécessaires. Dans d’autres cas, un transfert à une cellule de procaryote telle qu’une bactérie, peut être nécessaire pour obtenir la protéine non-traitée. Dans cette dernière situation, la construction d’une séquence codant pour la 20 proinsuline est avantageuse, car la proinsuline est facilement convertie en une insuline active in vitro, en utilisant des procédés connus dans la technique. Voir Kemmler W. et al, J. Biol. Chem. 242, 6786 (1971). On décrit ici trois procédés possibles pour construire une séquence codant pour la proin-25 suline. Un vecteur de transfert plasmique comprenant pBR322 avec une séquence codant pour la proinsuline, insérée, est désigné par pcHP-1.
A, Une séquence codant pour la chaîne B de l’insuline humaine, synthétisée par voie chimique, a été décrite par 30 Créa R. et al. Proc. Nat. Acad. Sei. USA 75, 5765 (1978). La séquence de nucléotides, synthétique, diffère de la séquence naturelle décrite ici, car la séquence synthétique est conçue pour exploiter les attributions du codon plus favorisées par un hôte de procaryote, tel que E. coli. On incorpore donc un 35 triplet codant pour la méthionine, juste avant l’acide aminé 25 \ 1 (phe). Mais, par hasard, les deux séquences sont identiques dans la région des acides aminés 13-14, laquelle région ne contient que le site Alu I commun aux deux séquences. Les emplacements des sites Alu I sur la séquence naturelle sont 5 indiqüés sur la Fig.2.
On traite l’ADN de proinsuline synthétique par l’Alu I endonucléase pour obtenir deux fragments de 43 paires de base et environ 56 paires de base, respectivement. On scinde de même l’insert de cADN de pcHI-1, obtenu de préférence par 10 scission en Hha I tel que décrit dans l’exemple 2B, par line hydrolyse partielle catalysée par l’Alu X endonucléase pour former des fragments de 75, 90, 110, 135, 165, 200, 245, 275, 375 et 455 paires de base, respectivement ; on fractionne ces fragments par électrophorèse sur gel pour obtenir le frag-15 ment de 375 paires de base, le résultat d’une scission en un seul site dans le codon pour l'acide aminé numéro 14.
On réunit par une ligature des extrémités tronquées les fragments de scission du gène synthétique et le fragment de scission à un seul site, de 375 paires de base, de l’in-20 sert de cADN. Une réunion correcte du fragment synthétique à 43 paires de base avec le fragment de cADN à 375 paires de base est maximalisée en assurant un excès molaire du cADN à . 375 paires de base. Les possibilités d’une réunion incorrecte sont également réduites du fait que les fragments synthétiques 25 ont des extrémités saillantes à simple chaîne qui ne sont pas complémentaires avec celles du fragment de cADN à 375 paires de base.
La molécule ainsi formée, un composite de la séquence synthétique codant pour la méthionine suivie des acides ami-30 nés 1 à 13, et de la séquence naturelle codant pour les acides aminés 14 â 86 de la proinsuline, constitue une séquence codant pour la proinsuline. La séquence codant pour la proinsuline peut être insérée dans n’importe quel plasmide d’expression choisi, par remplissage ou excision des extrémités 35 a simple chaîne, puis fixation des oligonucléotides de liaison 26 * appropriés.
L'expression donne une protéine fusionnée qui peut être scindée au résidu méthionine par traitement au bromure de cyanogène pour obtenir la proinsuline. La proinsuline est 5 ensuite convertie en insuline par le procédé de Kemmler et al., ci-dessus.
B. L’insert de cADN de pcHI-1 a un site Hha I dans la séquence codant pour les acides aminés -14 à -13, tel que représenté sur la Fig. 2. De plus, le vecteur de transfert 10 pBR322 a un site Hha I juste à 22 paires de base du site Pst I à l'extrémité 5» de l'insert. Il est donc possible d'isoler de nouveau une séquence comprenant la totalité de la séquence codant pour la proinsuline et une région de 22 paires de base de ADN pBR322, en traitant pcHI-1 par l'Hha I endonucléase.
15 Ch préfère ce procédé à un nouvel isolement da l'insert avec 1& Pst I endonucléase, car l'insert contient deux sites Pst I internes et le rendement en ADN d'insert intact par un traitement à la Pst I endonucléase est faible. La séquence Hha I isolée est également parfaitement utilisable dans les procé-20 dés des exemples 2A et 2C décrits ici.
Le traitement de l'un ou l'autre des isolats par l'Hha I endonucléase se traduit par une scission de la chaîne plus entre les acides aminés -14 et -13 de la pré-séquence. (La chaîne plus est définie comme la chaîne dont la séquence i, 25 de nucléotides correspond à la séquence du mARN. La chaîne moins est la chaîne dont la séquence est complémentaire de la séquence du mARN). La pré-séquence restante peut être spécifiquement séparée en exploitant l'activité 3' à 5* exonucléase de la T4 ADN polymérase qui agit sur la chaîne moins 30 à l'extrémité de codage de la pré-séquence et sur la chaîne plus à l'extrémité opposée. La réaction exonucléolytique peut être arrêtée à un nucléotide défini en mettant le même nucléotide, sous la forme triphosphate, dans le mélange réactionnel. L'action exonucléolytique est alors contrecarrée 35 par l'activité de polymérase de l'enzyme qui remplace conti- •i 27 nuellement le nucléotide spécifique, tel que décrit par Engl und P.T. dans J. Biol. Chem. 246, 3269 (1971) et dans J.
Mol. Biol. 66, 209 (L972).
La pré-séquence restante peut être digérée spécifi-5 quement jusqu’au codon de phénylalanine N-terminal de l’acide aminé numéro 1 par trois cycles de digestion par la T4 polymérase. Le cycle 1 est effectué en présence de TTP qui termine la digestion à l’opposé du A du codon de glycine dans l’acide aminé en position -7. Le cycle 2 est effectué en pré-10 sence de dCTP qui termine la digestion à l'opposé du G du codon en position -5 (Asp). Le cycle 3 est effectué en présence de dATP qui termine la digestion à l’opposé du T qui est le premier nucléotide de position 1 de la proinsuline.
Après chaque cycle de digestion par la T4 polymérase, 15 le triphosphate du cycle juste complété doit être éliminé avant d’introduire le triphosphate nécessaire pour le cycle suivant. Pour séparer les triphosphates du mélange réactionnel, on utilise des minicolonnes de Sephadex G-75 (Marque déposée, Pharmacia Inc., Uppsala, Suède). Les colonnes peuvent 20 être équilibrées avec un tampon approprié et des échantillons recueillis dans un tampon contenant le triphosphate du cycle suivant. De cette façon, l'enzyme migrant avec l'ADN ne di-i gère pas l'ADN au-delà du prochain point d'arrêt choisi. Pour éviter une telle digestion dans la partie inférieure de la * 25 colonne après la résolution du triphosphate précédent, on effectue une chromatographie à froid (4 °C) et on active l'é-lution par centrifugation. On peut également inactiver l'enzyme par la chaleur, à 65 °C, avant l'opération de chromatographie. On amorce alors le cycle suivant par addition d'en-30 zyme active, fraîche. Les trois cycles de digestion par la T4 polymérase fournissent une digestion complète et spécifique de la chaîne moins d'ADN jusqu'au premier codon de la séquence codant pour la proinsuline. La séquence de la chaîne plus à l'extrémité opposée de la molécule qui a également une 35 extrémité 3’, est telle que seuls quelques nucléotides sont 28 éliminés par les cycles de digestion ci-dessus*
La chaîne plus à l’extrémité de la pré-séquence est alors spécifiquement digérée avec la SI exonucléase qui agit sur les extrémités à simple chaîne pour donner me molécule 5 aux extrémités tronquées. Des précautions doivent être prises pour éviter une digestion partielle par la SI nucléase au-delà du début du premier codon. Une telle digestion partielle peut avoir lieu en raison d’une "respiration" de l’hélice, un non-appariement partiel et provisoire des chaînes 10 d’ADN. La "respiration" a lieu dans toute la molécule, mais le plus fréquemment dans les régions riches en A-T et aux extrémités des molécules d’ADN. Un non-appariement provisoire au codon numéro 1, riche en A-T, pourrait permettre une action SI nucléolytique au-delà du point d’arrêt fixé. Cet in-15 convénient peut être évité en effectuant la digestion SI dans des conditions d’intégrité maximale de l’hélice ; faible température (température ambiante ou plus basse) et haute teneur en sel normalement utilisé dans le tampon pour une réaction SI. Des échantillons d'ADN obtenus aux stades successifs 20 de la digestion par la SI nucléase sont isolés et purifiés da>-ns un vecteur de transfert approprié selon des procédés connus dans la technique. On procède à une analyse de la séquence du plus petit fragment Alu I de ces clones pour sélectionner les clones codant pour la proinsuline, dont la pré-, 25 séquence a été totalement séparée.
Un procédé attrayant pour isoler et purifier le cADN codant pour la proinsuline implique l’incorporation de queues oligo-A, en utilisant une transférase terminale, sur les extrémités 3’ du cADN. Les queues oligo-T sont formées sur l’ex-30 trêmité 3* en un site approprié sur un vecteur de transfert d’expression, tel que le site EcoRl dans le gène de j^-galac-tosidase sur le plasmide pTS-1 (Ullrich A. et al.) (Voir également la demande de brevet US n° 933 035). L’insertion du cADN codant pour la proinsuline par le procédé ci-dessus four-35 nit un insert correctement orienté, en phase quant au cadre de 29 lecture avec le gène de la ß-galactidase du plasmide selon une probabilité de 1/6. L’expression des queues oligo-A se traduit par l’incorporation des résidus de lysine juste avant le début de la séquence de proinsuline. Une digestion modérée 5 de la protéine fusionnée par la trypsine fournit la proinsuline qui est convertie en insuline active tel que décrit précédemment. Selon un autre procédé, la protéine fusionnée est traitée par une combinaison de trypsine et de carboxypeptidase B (ou de catfeépsine B) pour donner une insuline active à 10 partir de la protéine fusionnée en une seule réaction.
C. On construit une séquence codant pour la proinsuline par scission sélective à un site interne dans la région codant pour la proinsuline, puis on fixe une séquence synthétisée par voie chimique, codant pour cette partie de la ré-15 gion codant pour la proinsuline éliminée par la scission précédente. Comme source de région codant pour la proinsuline, on utilise le plasmide pcHI-1 qui est sélectivement excisé par traitement avec la Pst I endonucléase ou de préférence par traitement avec la Hha I endonucléase, tel que décrit dans 20 1’exemple 2B.
Chaque fragment, après isolement, est traité par une phosphatase alcaline pour éliminer les groupes phosphate 5' terminaux, puis on scinde par traitement avec une endonucléase de restriction ayant un point de scission unique dans la sé-25 quence codant pour la proinsuline. Le site de restriction est de préférence proche d’une des extrémités de la séquence codant pour la proinsuline. Le site Alu I dans la région des acides aminés 13-14 fournit un point de scission approprié, (voir.Fig.2). Le fragment Hha I de pcHI-1 est partiellement 30 scindé par l’Alu I endonucléase pour fournir deux fragments d’environ 76 paires de base et 375 paires de base, respectivement. Les fragments Alu I sont fractionnés par électrophorèse sur gel, tel que décrit dans l’exemple 2A, et le fragment à 375 paires de base est recueilli.
35 On applique le procédé au phosphotriester (Itakura K.
30 \ et al., J. Biol. Chem. 250, 4592 (1975) et Itakura K. et al., J. Am. Chem. Soc. 97j 7327 (1975) ) pour synthétiser une séquence de nucléotides codant pour les 13 premiers acides aminés de la proinsuline avec un G terminal 5* (sur la chaîne 5 plus), pour compléter le codon pour l'alanine en position 14. La chaîne plus de l’ADN synthétique a la séquence 3'-TTTGTGAA-CCAACACCTGTGCGGCTCACACCTGGTGGAAG-5 * correspondant à la séquence naturelle. Cependant, il est possible de synthétiser d’autres séquences codant pour les mêmes acides aminés. De 10 façon générale, la séquence est : 3’-TXKGXLAAKCAJCAKXTYTGKG- GLQRSCAKXTYGTLCAJG-5'. La séquence obtenue est réunie par ses extrémités tronquées au fragment d’environ 375 paires de base du fragment Hha I de pcHI-1. Etant donné que ce dernier a un phosphate 5» uniquement à l’extrémité à réunir, les deux 15 fragments sont réunis dans un ordre correct. Le fragment synthétique est correctement réuni au plus grand fragment dans environ 50 % des réactions.
L'ADN traité par une ligase est alors cloné et inséré dans un plasmide d’expression approprié, soit en formant une 20 queue oligo-A, tel que décrit dans l’exemple 2B, soit en fixant des agents de liaison et en insérant dans des plasmides de cadres de lecture connus. Dans le cas d’inserts à queue oligo-A, on observe 1’expression de la proinsuline dans environ 1/12 des clones. Dans le cas d’une insertion directe, 25 lorsque le cadre de lecture est correct, la fréquence d’expression des clones est d’environ 50 %.
EXEMPLE 3
Expression de la pré-proinsuline et de la proinsuline humaines Les inserts isolés et purifiés codant pour la pré-30 proinsuline (exemple 1) ou la proinsuline (exemple 2) sont insérés dans un vecteur de transfert d’expression. Lorsque l’insertion a lieu dans l'orientation correcte eu égard à l'initiation du transfert au site d'insertion, et que l’insert est en phase du cadre de lecture avec le promoteur et le site 35 de fixation du ribosome, le produit protéinique du gène cloné 31 est synthétisé par les cellules hôtes de grande activité métabolique, transformées par le vecteur de transfert. Le produit protéinique est une protéine fusionnée si le vecteur de transfert d'expression contient une partie du gène de proca-5 ryote entre le promoteur et le site d'insertion. Mais l'insertion peut être immédiatement adjacente à un site de promoteur. Dans de tels cas, la protéine codée par l'insert est synthétisée directement. Les deux techniques présentent des avantages et des inconvénients. Les protéines fusionnées ont l'a-10 vantage d'avoir tendance à stabiliser la protéine étrangère codée par le gène inséré. Des propriétés fonctionnelles désirables, telles que l'excrétion de la cellule hôte, sont également conférées par la fusion avec certaines protéines hôtes telles que la j3-lactamase. D'autre part, la séquence codée 15 par l'insert est difficile à purifier, étant donné le désir général d'éliminer spécifiquement la portion hôte de la protéine fusionnée. Cette élimination se fait par des techniques connues telles que décrites dans les exemples 2A et 2B. La synthèse directe de la protéine désirée supprime la nécessité 20 d'une scission spécifique, mais élimine la possibilité d'excrétion hors de la cellule hôte.
On a développé des plasmides d'expression dans lesquels l'expression est réglée par le promoteur lac (Itakura et al., Science 198, 1056 (1977),Ullrich A. et al., Excerpta 25 Medica (1979) ), par le promoteur trp (Martial et al., Scien-ce 205 , 602 (1979) ); et par le promoteur de j8-lactamase, (demande de brevet US n° 44 647).
L'expression est décelée par la mesure d'un produit capable de s'associer par voie immunochimique avec un anti-30 corps anti-insuline ou un anticorps anti-proinsuline. On a recours à un dosage radioimmunologique dans lequel l'anticorps est marqué de façon radioactive et des paires antigène-anti-corps sont précipitées par une préparation de Staphyloccoccus aureus tués par la chaleur. (Voir Morgan et Lazarow, Diabetes, 35 12, 115 (1963) et Kessler S.W., J. Immunol. 115, 1617 (1975) ).
> 32
Pour déceler 1*expression dans des colonies de bactéries, on utilise le test de sélection radioimmun, tel que décrit par Erlich H.A. et al., Cell 10, 681 (1978) ou par Broome S. et Gilbert W., Proc. Nat. Acad. Sei, USA 75, 2746 (1978), 5 On décèle des protéines fusionnées indicatrices de l’expression en comparant les poids moléculaires de la protéine hôte contribuant à la partie N-terminale de la protéine fusionnée, dans les cellules hôtes transformées par des plasmides d’expression avec et sans insert. Une variante pré-10 férée consiste à utiliser comme hôte E. coli, souche P678-54, produisant des minicellules. Des acides aminés marqués par un radioisotope sont incorporés dans des protéines à minicel-lules, en comparant les souches transformées avec des vecteurs de transfert d’expression avec et sans insertion de la séquen-15 ce codant pour la proinsuline. Les protéines sont fractionnées par électrophorèse sur gel de SDS-acrylamide et les positions des protéines décelées par autoradiographie. L’expression de la proinsuline est indiquée par la présence d’une bande de protéine marquée, trouvée uniquement dans les mini-20 cellules transformées par le plasmide d’expression de la proinsuline. La position de la bande d’électrophorèse fournit une mesure du poids moléculaire de la protéine exprimée et est , conforme à la longueur connue du gène inséré et de la portion N-terminale du procaryote.
25 L’élimination de la portion de procaryote et la con version de la proinsuline en insuline, in vitro, sont effectuées par des procédés connus, tel que décrit en détail ci-dessus .

Claims (38)

1. Vecteur de transfert dfADN comprenant une séquence de dêsoxynucléotides codant pour la pré-proinsuline humaine.
2. Vecteur de transfert dTADN comprenant une séquen ce de dêsoxynucléotidescodant pour la proinsuline humaine.
3. Microorganisme transformé par le vecteur de transfert suivant la revendication 1 ou 2.
4. Vecteur de transfert d'ADN, caractérisé en ce 10 qu'il comprend une séquence de dêsoxynucléotides pour la prê-proinsuline humaine comportant une chaîne plus ayant la séquence : 5'-TCCTTCTGCCAIG_ 24GCL_ 23X_ 22TY_ 22TGG-21ATG-20W-19GZ-19X-18TÏ-18 X_ 2 7TY_ 2 7CCL_ 26X_ x 5TY_ 2 5X_14TY_!4GCL_ x 3X_12TY_12X_1jTY_ 3J GCL_10>’._ 9TY_ gTGG_ 8GGL_ ?CCL_ fiGAK_ 5CCL_ 4GCL_ 3GCL_ 2GCL_ jTTKj gtl2aak3caj4cak5x6ty6tgk7ggl8qr9s9cak10x11ty11gtl12gaj13 20 gcl14x15ty15tak16x17ty17gtl18tgk;19gcl20gaj21w22gz22gcl23 ttk24ttk25tak26acl27ccl28aaj29acl30w31gz31w32gz32gaj33 gcl34gaj35gak36x37ty37caj38gtl39ggl40caj41gil42gaj43x44 TY44GGL45GGL46GGL47CCL48GGL49GCL50GGL5iqR52S52X53TY53CAJ54 CCL55X56TY56GCL57X58TY58GAJ59GGL60QR61S61X62TY62CAJ63AAJ64 W65GZ65GGL66A™67GTL68GAJ69CAJ70TGK71TGK72ACL73QR74S74 atm75Tgk76qr77s77x78ty78tak79caj80x81ty81gaj82aak83iak84 TGK AAK-,TAGACGCAGCCCGCAGGCAGCCCCCCACCCGCCGCCTCCTGCACCG 30 85 86 AGAGAGATGGAATAAAGCCCTTGAACCAGC poly A-3' où : A est le radical désoxyadényle, G est le radical dêsoKy guanyle, Λ 34 C est le radical désoxycytosyle, T est le radical thymidyle, J est A ou G ; K est I ou C j 5 L est A, T, C ou G ; M est A, C ou T ; X est T ou C si Y est A ou G , et C si Y est C ou T : η n 7 n * Y est A, G, C ou T si X est C, et A ou G si X est T : η n 7 n W est C ou A si 2 est G ou A, et C si Z est C ou T ; π η n 10. est A. G, C ou T si ÎV est C, et A ou G si W est A : n 7 7 n 7 n 7 QR est TC si S est A, G, C ou T et AG si S est T ou C : η η n 7 S est A, G, C ou T si QR est TC et T ou C si QR est AG ; n 7 7 η n et les indices n indiquent la position dans la séquence décides aminés de la pré-proinsuline humaine, à laquelle cor- 15 respond chaque triplet dans la séquence de nucléotides, selon le code génétique, les positions des acides aminés étant numérotées à partir de 1*extrémité amino.
5,-TTK1GTL2AAK3CAJ4CAK5X6TY6TGK7GGL8QRgS9CAK10XnTY11GTL12GAJ13 GCL14X15IY15TAK16X17IY17GTL18TGK19GCL20GAJ21W22GZ22GCL23
5. Vecteur de transfert d'ADN, caractérisé en ce qu’il comprend une séquence de désoxynuclêotides codant pour 20 la proinsuline humaine comportant une chaîne plus ayant la séquence :
6. Microorganisme transformé par le vecteur de transfert selon la revendication 4 ou 5.
7. Plasmide pcHI-1.
8. Plasmide pcHP-1. • 25
9 - Microorganisme transformé par le plasmide selon la revendication 7 ou 8.
10. Microorganisme selon la revendication 9, caractérisé en ce que l'organisme est Escherichia coli.
11. Microorganisme selon la revendication 10, carac-30 térisé en ce que l'organisme est Escherichia coli HB-101,
12. Protéine fusionnée, caractérisée en ce qu'elle comprend la séquence d'acides aminés de la pré-proinsuline humaine comme séquence C-terminale et une portion d'une protéine de procaryote comme séquence N-terminale. N » 36
13. Protéine fusionnée, caractérisée en ce qu’elle comprend la séquence d’acides aminés de la proinsuline humaine comme séquence C-terrainale et une portion d’une protéine de procaryote comme séquence N-terminale.
14. Procédé de préparation d’une séquence de déso- xynucléotides codant pour la proinsuline humaine, caractérisé en ce que (1) on traite un fragment de cADN comprenant une séquence de nucléotides codant pour la pré-proinsuline 10 humaine avec une endonucléase de restriction ayant un site de restriction dans la région codant pour le pré-peptide de la pré-proinsuline ; (2) on traite la séquence de désoxynucléotides du stade (1) contenant la séquence codant pour la proinsuli- 15 ne avec la T4 ADN polymérase en présence d'un désoxynucléo-tide triphosphate, de telle sorte que la digestion exonucléo-lytique à partir des extrémités 3’ ait lieu jusqu'à un point d'arrêt défini par le désoxynucléotide triphosphate ; (3) on remplace le désoxynucléotide triphos- 20 phate par un désoxynucléotide triphosphate différent, de telle sorte que la digestion procède jusqu’à un second point d'arrêt défini ; (4) on renouvelle l'opération du stade (3), si nécessaire, pour effectuer la digestion de l’extrémité 3’ , 25 jusqu’au premier nucléotide de la séquence codant pour la proinsuline, la digestion finale étant conduite en présence de dATP ; et (5) on traite le produit de désoxynucléotide obtenu au stade (4), par la SI nucléase pour digérer l'extré- 30 mité 5' jusqu'au premier nucléotide de la séquence codant pour la proinsuline.
15 CCL55X56TY56GCL57X58TY58GAJ59GGL60QR61S61X62TY62CAJ63AAJ64 W65GZ65GGL66A™67GTL68GAJ68CAJ70TGK71TGK72ACL73QR74S74 A™75TGK76QR77S77X78TY78TAK79CAJ80X81TY81GAJ82AAK83TAK84 TGKocAAKocTAG-3 »' .OJ -0-0- 20 où A est le radical désoxyadényle,, G est le radical désoxyguanyle, C est le radical désoxycytosyle, 25. est le radical thymidyle J est A ou G ; K est T ou C ; L est A, T, C ou G j M est A, C ou T ; 30. est T ou C si Y est A ou G , et C si Y est C ou T ; Y est A, G, C ou X si X est C, et A ou G si X est X : π η n * W est C ou A si 2 est G ou A, et C si X est C ou X : η η n * Z est A, G, C ou X si W est C, et A ou G si W est A · η η n ’ QR est XC si S est A, G, C ou X, et AG si S est X ou C ; un n ’
15. Procédé selon la revendication 14, caractérisé en ce que l’endonucléase de restriction est Hha L
16. Procédé de préparation de la séquence de déso- 35 37 % l xynucléotides codant pour la proinsuline humaine, caractérisé en ce que : (1) on scinde en deux fragments une séquence de désoxynucléotides codant pour la chaîne B de l’insuline 5 humaine et ayant au moins un site de restriction en commun avec le cADN de la proinsuline humaine, la scission étant effectuée par une hydrolyse catalysée par une endonucléase de restriction reconnaissant le site de restriction commun ; (2) on scinde un cADN codant pour la pré-pro- 10 insuline humaine en deux fragments, la scission étant effectuée par une hydrolyse catalysée par la même endonucléase de restriction que celle utilisée au stade (1) ; et (3) on réunit par une liaison des extrémités ·: tronquées les fragments obtenus aux stades (1) et (2), qui 15 contiennent ensemble la séquence codant pour la proinsuline humaine.
17. Procédé selon la revendication 16, caractérisé en ce que l’endonucléase de restriction est Alu I.
18. Procédé de préparation de la séquence de désoxy- 20 nucléotides codant pour la proinsuline humaine, caractérisé en ce que : (1) on élimine une partie de la séquence de dé- - soxynuclêo tides codant pour la proinsuline humaine, en trai tant un cADN codant pour la pré-proinsuline humaine par une * 25 endonucléase de restriction ayant un site de reconnaissance dans la séquence codant pour la proinsuline ; (2) on synthétise une séquence de désoxynucléotides capable de remplacer la partie éliminée et codant pour les mêmes acides aminés codés par la partie éliminée ; et 30 (3) on réunit les séquences de désoxynucléoti des obtenues aux stades (1) et (2) en liant les extrémités tronquées.
19. Procédé selon la revendication 18, caractérisé en ce que l’endonucléase de restriction utilisée au stade (1) 35 est Alu I. < 38
20. Procédé de préparation d*insuline, caractérisé en ce que : (1) on construit un microorganisme ayant une séquence codant pour un peptide comprenant : (a) une séquen- 5 ce de désoxynucléotides ajrant une extrémité 5» et une extrémité 3', dans laquelle N , N et N peuvent être d, D O A, T. G ou C et j est un nombre entier de 0 à 100, N N. N n' étant pas TGA, TAA ou TAG, (b.) une séquence de désoxynucléotides codant pour la chaîne B de l'insuline humaine fixée à l'extrë- 10 mité S» de (N . j et (c) une séquence de désoxynucléo tides codant pour la chaîne A de l'insuline humaine fixée k l'extrémité 3» de (N N. N ) . ; v a b c'j (2) on fait proliférer le microorganisme dans des conditions appropriées pour 1'expression d'une séquence 15 de désoxynucléotides codant pour le dit peptide, afin de produire le peptide ayant la chaîne B de l'insuline humaine fixée à sa terminaison N et la chaîne A de l'insuline humaine fixée k sa terminaison C j (3) on purifie le peptide avec les chaînes A 20 et B fixées ; (4) on traite le peptide purifié pour former des ponts disulfure, tel que trouvés dans l'insuline, entre les chaînes A et B ; (5) on traite le peptide purifié réticulé avec . 25 une préparation d'enzyme capable d'exciser les chaînes A et B du peptide, les chaînes A et B excisées ayant les ponts disulfure, formant ainsi l'insuline j et (6) on purifie l'insuline produite au stade (5).
21. Procédé selon la revendication 20, caractérisé 30 en ce que la séquence de désoxynucléotides codant pour la chaîne B de l'insuline humaine comprend une chaîne plus ayant la séquence : 5 ' -TTK^GTLgAAKgCAJ^CAK^X^TY^TGK^GGLgQRgSg
22. Procédé de préparation d’un vecteur de transfert d’ADN utilisable pour conserver et reproduire une séquence de désoxynucléotides codant pour la pré-proinsuline humaine caractérisé en ce qu’on fait réagir une séquence de désoxy- 30 nucléotides codant pour la prê-proinsuline humaine avec une molécule d’ADN préparée en scindant un vecteur de transfert par une enzyme de restriction.
23. Procédé selon la revendication 22, caractérisé en 1' ' « 40 cg que la séquence de désoxynucléotides codant pour la pré-proinsuline humaine comprend une chaîne plus ayant la séquence : S 5'-ATG-24GCL-23X-22TÏ-22TGG-21ATG-20W-19G?'-19X-19TY-X8 X-17Ty-17CCL-16X-15TY-15X-14TY-14GCL-13X-12TÏ-12X-llTY-ll GCL_10X_nTY_QTGG_8GGL_7CCL_gGAK_gCCL_^GCL_3GCL_2GCL_1TTK_^ GTL2AAK3CAJ4CAK5X6TY6TGK7GGL8QRsSgCAK10 X11TY11GTL12GAJ13 lO GCL14Xi5Tyi5TAKi6Xi7TYi7GTLl8TGK19GCL20GAJ21W22GZ22GCL23 TTK24TTK25TAK26ACL27CCL2gAAJ2gACL30W31GZ31W32GZ32GAJ33 GCL34GAJ35GAK36X37TY37CAJ38GTL39GGL40CAJ41GTL42GAJ43X44 TY44GGL45GGL46GGL47CCL48GGL49GCL50GGL51QR52S52X53TY53CAJ54
24. Procédé de préparation d’une séquence de déso-xynucléotides codant pour la proinsuline humaine, utilisable dans la synthèse de l’insuline humaine, caractérisé en ce qu'on hydrolyse les extrémités 3' d'une séquence de désoxynu- 10 cléotides codant pour la pré-proinsuline humaine, conservée et reproduite selon le procédé de la revendication 22, par un ou plusieurs cycles d'une digestion exonucléolytique progressive, catalysée par la T4 ADN polymérase agissant en présence d'un désoxynucléotide triphosphate, puis on hydrolyse les ex-15 trémités 5' de la séquence de désoxynucléotides par une digestion nucléolytique catalysée par une en2yme du nucléase, spécifique pour l'ADN à une seule chaîne ayant une extrémité 5».
25 TAA ou TAG ; (b) une séquence de désoxynuclêotides codant pour la chaîne B de l’insuline humaine fixée à l’extrémité 5* de (NaNbNc)j 9 séquence de désoxynuclêotides codant pour la chaîne A de l’insuline humaine fixée à l’extrémité 3' de (N N N ) V a b cJj 30
25. Procédé selon la revendication 24, caractérisé en ce que la séquence codant pour la prêproinsuline humaine 20 est hydrolysée en un site spécifique dans une réaction catalysée par la Hhal endonucléase avant la digestion par la T4 ADN polymérase.
25 TTK24TTK25TAK26ACL27CCL28AAJ29ACL30W31GZ31W32GZ32GAJ33 GCL34GAJ35GAK36X37TY37CAJ38GTL39GGL40CAJ41GTL42GAJ43X44 TY44GGL45GGL46GGL47CCL48GGL49GCL50GGL51QR52S52X53TY53CAJ54 CCL55X56TY56GGL57X58TY58GAJ59GGL60QR61S61X62TY62CAJ63AAJ64 W65GZ65GGL66ATM67GTL68GAJ69CAJ70TGK71TGK72ACL73QR74S74 atm75tgk76qr77s77x78ty78tak79caj80x81ty81gaj82aak83tak84 TGK85AAK86TAG-3' où : 35 A est le radical désoxy adényle, G est le radical désoxyguanyle , C est le radical désoxycytosyle , 5. est le radical thymidyle, J est A ou G ; K est T ou C ; L est A, T, C, ou G ; M est A, C ou T ; 10. est T ou C si y est A ou G $ et C si Y est C ou T ; η η n Y est A, G, C ou X si X est C, et A ou G si X est T ; n 7 τι 1 n 7 W est C ou A si Z est G ou A, et C si Z est C ou T ; η n * n * Z est A, G, C ou T si W est C, et A ou G si W_ est A ; n n ' n QR est TC si S est A, G. C ou T, et AG si S est T ou C · η n 7 7 7 n 15. est A, G, C ou T si QR est TC, et T ou C est QR est AG : η n 7 n 7 et les indices n indiquent la position dans la séquence d'acides aminés de la proinsuline humaine, à laquelle correspond chaque triplet dans la séquence de nucléotides, selon le code génétique, les positions des acides aminés étant numéro-20 tées à partir de l'extrémité amino.
26. Procédé de préparation d'une séquence de désoxynucléotides codant pour la proinsuline humaine, utilisable . 25 dans la synthèse de l’insuline humaine, caractérisée en ce qu’on fait réagir un fragment de cADN codant pour une partie de la proinsuline humaine, préparée par scission d’un cADN codant pour la préproinsuline humaine, conservé et reproduit selon- le procédé de la revendication 22, avec une endonucléa-30 se de restriction ayant un site de reconnaissance unique dans sa séquence de désoxynucléotides, avec un ADN synthétisé par voie chimique dont la séquence de désoxynucléotides code pour la partie de la proinsuline humaine non-codêe par le fragment de cADN, dans une réaction de liaison des extrémités tronquées, 35 catalysée par l’ADN ligase. 42 % t *
27. Procédé selon la revendication 26, caractérisé en ce que 1*endonucléase de restriction est Alu I.
28. Procédé selon l*une quelconque des revendications 24 à 27, caractérisé en ce que la séquence de désoxy- 5 nucléotides codant pour la proinsuline humaine comprend une chaîne "plus" ayant la séquence : 3'-TTK1GTL2AAK3CAJ4CAK5X6TÏ6TGK7GGL8QR9X9CAK10X11TÏ1:lGTL:l2GAJ:l3 GCL14X15TÏ15TAK16X17TÏ17GTL13TGK19GCL20GAJ21K22GZ22GCL23 10 ttk24ttk25tak26acl27ccl28aaj29acl30w31gz3:lk32gz32gaj33 gcl34gaj35gak36x37ty37caj38gtl39ggl40caj41gtl42gaj43x44 TY44GGL45GGL46GGL47CCL47GGL49GCL50GGL51QR521 252X53TÏ53CAJ54 CCL55X56^Y56GCL57X58TY58GAJ59GGL60^R61G61X62TY62CAJ63AAiY64 W65GZ65GGL66ATM67GI'L68GAJ69CAJ70TGK71,I,GK72ACL73QR74174 ATM75TGK7gQR77E77X7gTY78TAK79CAJ80X81TYB1GAJ82AAK83TAK84 .TGKg5AAK8eTAG-3’ ' 20 où : A est le radical désoxyadênyle, G est le radical désoxyguanyle, » C est le radical désoxycytosyle, : X est le radical thymidyle, ’ 25 J est A ou G j K est T ou C ; L est A, T, C ou G j M est A, C ou T ; X est T ou C si Y est A ou G , et C si Y este C ou T ; I η n ’
29. Procédé de préparation du plasmide pcHI-1, selon l’une quelconque des revendications 22 ou 23, caractérisé en ce que la molécule d’ADN préparée par scission d’un vecteur de transfert avec une enzyme de restriction est pBR322 10 et l’enzyme de restriction est la Pst I endonucléase.
30. Procédé de préparation d’un vecteur de transfert d’ADN, utilisable pour conserver et reproduire une séquence de désoxynucléotides codant pour la proinsuline humaine, caractérisé en ce qu’on fait réagir une séquence de désoxynu-15 cléotides codant pour la proinsuline humaine, préparée selon l’une quelconque des revendications 24 à 28, avec une molécule d’ADN préparée en scindant un vecteur de transfert par une enzyme de restriction.
30 Yn est A, G, C ou T si X est C, et A ou G si X est T ; W est C ou A si Z est G ou A. et C si Z est C ou T ; n η n * Z est A, G, C ou T si W est C, et A ou G si W est A : η n QRn est TC si est A, G, C ou T, et AG si Sn est T ou C ; est A, G, C ou T si QR est TC, et T ou C si QR est AG : 2 II η n 7 i ' 43 % et les indices n indiquent la position dans la séquence d’acides aminés de la proinsuline humaine, à laquelle correspond chaque triplet dans la séquence de nucléotides, selon le code génétique, les positions des acides aminés étant nu-5 mérotées à partir de l’extrémité amino.
31. Procédé selon la revendication 30 pour la prê-20 paration du plasmide pcHP-1, caractérisé en ce que la molécule d’ADN préparée par scission d’un vecteur de transfert par une enzyme de restriction est pBR322 et l’enzyme de restriction est la Pst I endonucléase.
32. Procédé de préparation d’un vecteur de transfert 25 d’expression selon la revendication 22 ou 30, utilisable dans l’expression d’une séquence de désoxynucléotides codant pour la pré-proinsuline humaine ou la proinsuline humaine, caractérisé en ce que la molécule d’ADN préparée par scission d’un vecteur de transfert par une enzyme de restriction est scindée 30 en un point situé dans la région de contrôle de l’expression.
33. Procédé de préparation d’une protéine fusionnée, comprenant la séquence d’acides aminés de la pré-proinsuline humaine comme séquence C-terminale et une partie d’une protéine de procaryote comme séquence N-terminale, caractérisé én 35 ce qu’on incube un microorganisme transformé par un vecteur de % k- 44 * ' transfert d’expression comprenant une séquence de désoxynu-cléotides pour la pré-proinsuline humaine, préparé par le procédé selon la revendication 22 ou 23.
33 %
34. Procédé de préparation dTune protéine fusionnée 5 comprenant la séquence d’acides aminés de la proinsuline humaine comme séquence C-terminale et une partie d’une protéine de procaryote comme séquence N-terminale, caractérisé en ce qu’on incube un microorganisme transformé par un vecteur de transfert d’expression comprenant une séquence de désoxynu- 10 cléotides codant pour la proinsuline humaine, préparé par le procédé selon la revendication 30.
35. Procédé de synthèse de la proinsuline humaine comprenant des peptides A et B séparés l’un de l’autre par un peptide C, caractérisé en ce qu’on incube un microorganis-15 me, transformé par un vecteur de transfert d’expression comprenant une séquence de dêsoxynucléotides codant pour la proinsuline humaine, préparé selon l’une quelconque des revendications 24 à 28, dans des conditions appropriées pour l’expression de la séquence codant pour la proinsuline humaine, 20 et on purifie la proinsuline humaine à partir du lysat ou du milieu de culture du microôrganisme.
35 SR est A, G, C ou X si QRn est XC, et X ou C si QRn est AG ; V ' 41 et les indices n indiquent la position dans la séquence d'acides aminés de la proinsuline humaine, à laquelle correspond chaque triplet dans la séquence de nucléotides, selon le code génétique, les positions des acides aminés étant numêr’o-5 tées a partir de l'extrémité amino»
35 GCL20^J21W22GZ22G^23T^24TTK25T^K26ACL27CCL28^Jr29^'CL30”3 ' 39 * l ' et la séquence de désoxynucléotides codant pour la chaîne A de l’insuline humaine comprend une chaîne "plus" ayant la séquence ί 5 » “GGL^ATM^GTL^gGAJ^gCAJ^TGK^TGK^ACL^QR^ ^4^5^76^77^78^78^79^80^1^81^82^83 5 TAK^TGKgjAAK^-S. où : A est le radical désoxyadényle, G est le radical désoxyguanyle, C est le radical désoxyCytosyle, 10. est le radical thymidyle, v J est A ou G ; K est X ou C j L est A, T, C ou G ; M est A, C ou X j 15 est X ou C si YR est A ou G , et C si Yn est C ou X ; Y est A, G, C ou X si X est C, et A ou G si X est X j n * f η ’ n * W est C ou A si Z est G ou A, et C si Z est C ou X ; n n ’ n Z est A. G, C ou X si W est C, et A ou G si W est A : n 9 3 n 9 n QR est XC si S est A, G, C ou X, et AG si S est X ou C : η n * 1 n * 20 est A, G, C ou T si QRn est XC, et T ou C si QR^ est AG j et les indices n indiquent la position dans la séquence d’a- . eides aminés de la proinsuline humaine, à laquelle correspond chaque triplet dans la séquence de nucléotides, selon le co- * de génétique, les positions des acides aminés étant numérotés 25 à partir de l’extrémité amino.
36. Procédé selon la revendication 35, caractérisé en ce que la séquence de dêsoxynucléotides codant pour la , chaîne B de l’insuline humaine comprend une chaîne plus ayant 25 la séquence : 5 ’ «TTK^GT^AAK^C^^CAK^X^TY^TGKyjGLgQRçSg CAK10XllTYllGTL12GAJ13GCL14X15TY15TAK16X17TY17GTL18TGK19 GCL20GAJ21W22GZ22GCL23TTK24TYK25TAK26ACL27CCL28AAJ29ACL30-3' et la séquence de dêsoxynucléotides codant pour la chaîne A comprend une chaîne plus ayant la séquence : 5 ’ -GGL^ATM^ GTL68GAJ69CAJ70TGK71TGK72ACL73QR74S74A™75TGK76QR77S77X78IY78 ^79^80^^1^82^83^84^85^86-31 où : A est le radical dêsoxyadényle, (5 45 > * ' G est le radical désoxyguanyle, C est le radical désoxycytosyle, T est le radical thymidyle, J est A ou G j 5 K est T ou C ; L est A, T, C ou G j M est A, C ou T ; X est T ou C si Y est A ou G , et C si Y est C ou T î η η ’ n * Y est A, G. C ou T si X est C, et A ou G si X est T : η * * η * n * 10. est C ou A si Z est G ou A. et C si Z est C ou T ; η n * n ’ Z est A, G, C ou T si W est C, et A ou G si W est A · n ’ ’ n ’ n * QR est TC si S est A, G, C ou T, et AG si S est T ou C : η n 7 ’ * n * S est A, G, C ou T si QR est TC, et T ou C si QR est AG ; n * * n * n 9 - et les indices n indiquent la position dans la séquence décides aminés de la proinsuline humaine, à laquelle correspond chaque triplet dans la séquence de nucléotides, selon le code génétique, les positions des acides aminés étant numérotées à partir de l’extrémité amino.
37. Procédé selon la revendication 35, caractérisé 20 en ce que la séquence de désoxynuclêotides codant pour la proinsuline humaine comprend une chaîne plus ayant (a) la séquence de désoxynuclêotides (^ ayant une extrémité 5’ et une extrémité 3’, où N , N, et N peuvent être A, T, G ou C I 3. D C , et j est un nombre entier de O à 100, N N. N n’étant pas TGA, J 9 a b c r t
38. Procédé de synthèse de l’insuline humaine, caractérisé en ce qu’on oxyde des groupes sulfhydryle sur les peptides A et B de la proinsuline humaine, préparée selon l’une quelconque des revendications 35 à 37, pour former des 46 ponts disulfures entre les peptides A et B, puis on excise le peptide C par une hydrolyse catalysée par une enzyme, spécifique pour les liaisons reliant le peptide C aux peptides A et B. Λ * m
LU82757A 1979-09-12 1980-09-10 Genes de la proinsuline humaine et de pre-proinsuline humaine,leur procede de preparation et leurs applications LU82757A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US7519279A 1979-09-12 1979-09-12
US7519279 1979-09-12

Publications (1)

Publication Number Publication Date
LU82757A1 true LU82757A1 (fr) 1981-02-02

Family

ID=22124154

Family Applications (1)

Application Number Title Priority Date Filing Date
LU82757A LU82757A1 (fr) 1979-09-12 1980-09-10 Genes de la proinsuline humaine et de pre-proinsuline humaine,leur procede de preparation et leurs applications

Country Status (28)

Country Link
EP (1) EP0026598A1 (fr)
JP (1) JP2637393B2 (fr)
KR (1) KR870000501B1 (fr)
AT (1) AT377003B (fr)
AU (1) AU538154B2 (fr)
BE (1) BE885196A (fr)
BG (2) BG41137A3 (fr)
CA (1) CA1180289A (fr)
CZ (2) CZ278883B6 (fr)
DD (3) DD201693A5 (fr)
DK (1) DK385980A (fr)
ES (3) ES495030A0 (fr)
FI (1) FI802837A7 (fr)
FR (1) FR2464997B1 (fr)
GR (1) GR70279B (fr)
IE (1) IE52781B1 (fr)
IL (1) IL61041A (fr)
IT (1) IT1129250B (fr)
LU (1) LU82757A1 (fr)
NZ (1) NZ194786A (fr)
PH (1) PH26475A (fr)
PL (1) PL226725A1 (fr)
PT (1) PT71790B (fr)
RO (1) RO80005A (fr)
SK (1) SK621580A3 (fr)
SU (1) SU1491345A3 (fr)
YU (1) YU233480A (fr)
ZA (1) ZA805341B (fr)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4342832A (en) * 1979-07-05 1982-08-03 Genentech, Inc. Method of constructing a replicable cloning vehicle having quasi-synthetic genes
DE3001928A1 (de) * 1980-01-19 1981-08-06 Hoechst Ag, 6000 Frankfurt Genprodukt eines hoeheren organismus aus einem dieses gen enthaltenden mikroorganismus
US4249952A (en) * 1980-03-03 1981-02-10 Pennsylvania Engineering Corporation Method for producing cement clinker from cement kiln waste dust
AU545912B2 (en) * 1980-03-10 1985-08-08 Cetus Corporation Cloned heterologous jive products in bacillies
US4338397A (en) * 1980-04-11 1982-07-06 President And Fellows Of Harvard College Mature protein synthesis
NZ199391A (en) * 1981-01-02 1985-12-13 Genentech Inc Chimeric polypeptides comprising a proinsulin sequence,and preparation by recombinant dna technique;production of human insulin
ZA824218B (en) 1981-06-29 1983-04-27 Cetus Corp Plasmid for producing human insulin
EP0090433A1 (fr) * 1982-03-31 1983-10-05 Genetics Institute, Inc. Création des séquences d'ADN codant des précurseurs de proinsuline modifiée
US5023321A (en) * 1982-12-13 1991-06-11 Howard Florey Institute Of Experimental Physiology & Medicine Molecular cloning and characterization of a further gene sequence coding for human relaxin
NZ206534A (en) * 1982-12-13 1988-05-30 Florey Howard Inst Molecular cloning and characterisation of gene sequence coding for human relaxin
IL71991A (en) 1983-06-06 1994-05-30 Genentech Inc Preparation of human FGI and FGE in their processed form through recombinant AND tranology in prokaryotes
ATE212662T1 (de) * 1986-05-20 2002-02-15 Gen Hospital Corp Verfahren zur pharmakokinetischen studie der insulin-expression mit nicht-menschlichem transgen-säugetier
JP4383530B2 (ja) 1996-04-05 2009-12-16 ノバルティス バクシンズ アンド ダイアグノスティックス, インコーポレーテッド 細胞巨大分子合成の阻害が減少したアルファウイルスベクター
AUPP655698A0 (en) * 1998-10-16 1998-11-05 Commonwealth Scientific And Industrial Research Organisation Delivery system for porcine somatotropin

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ187300A (en) * 1977-05-27 1982-08-17 Univ California Dna transfer vector and micro-organism modified to contain a nucleotide sequence equivalent to the gene of a higher organism
ES474851A1 (es) * 1977-11-08 1979-12-01 Gementech Inc Mejoras en un procedimiento para la produccion de un produc-to que comprende una codificacion del gen estructural para la expresion microbiana de un polipeptido
YU257278A (en) * 1977-11-08 1984-02-29 Genentech Inc Process for obtaining a recombinat clone carrier
US4411994A (en) * 1978-06-08 1983-10-25 The President And Fellows Of Harvard College Protein synthesis
GR71912B (fr) * 1978-08-11 1983-08-16 Univ California

Also Published As

Publication number Publication date
CA1180289A (fr) 1985-01-02
DD155004A5 (de) 1982-05-05
IL61041A0 (en) 1980-11-30
JP2637393B2 (ja) 1997-08-06
GR70279B (fr) 1982-09-03
ES503568A0 (es) 1982-11-16
RO80005A (fr) 1983-07-07
DD208989A5 (de) 1984-04-18
ES503567A0 (es) 1983-04-01
RO80005B (ro) 1983-06-30
ES8305420A1 (es) 1983-04-01
ES8107307A1 (es) 1981-10-01
EP0026598A1 (fr) 1981-04-08
CZ621580A3 (en) 1994-03-16
PT71790B (en) 1981-07-07
AT377003B (de) 1985-01-25
KR830003576A (ko) 1983-06-21
SK278191B6 (en) 1996-03-06
IT1129250B (it) 1986-06-04
IE52781B1 (en) 1988-03-02
CZ548884A3 (en) 1996-08-14
ES8300857A1 (es) 1982-11-16
JPS5695199A (en) 1981-08-01
NZ194786A (en) 1984-02-03
IL61041A (en) 1984-02-29
DK385980A (da) 1981-03-13
AU6232480A (en) 1981-03-19
IE801912L (en) 1981-03-12
IT8068405A0 (it) 1980-09-11
ZA805341B (en) 1982-01-27
CZ278883B6 (en) 1994-08-17
SU1491345A3 (ru) 1989-06-30
BG41136A3 (bg) 1987-04-15
DD201693A5 (de) 1983-08-03
ATA458580A (de) 1984-06-15
BE885196A (fr) 1980-12-31
BG41137A3 (bg) 1987-04-15
ES495030A0 (es) 1981-10-01
FI802837A7 (fi) 1981-03-12
FR2464997B1 (fr) 1985-05-24
YU233480A (en) 1984-02-29
FR2464997A1 (fr) 1981-03-20
SK621580A3 (en) 1996-03-06
PT71790A (en) 1980-10-01
AU538154B2 (en) 1984-08-02
PL226725A1 (en) 1983-07-18
PH26475A (en) 1992-07-27
KR870000501B1 (ko) 1987-03-12

Similar Documents

Publication Publication Date Title
US4431740A (en) DNA Transfer vector and transformed microorganism containing human proinsulin and pre-proinsulin genes
DK166784B1 (da) Rekombinant dna-sekvens, en mikroorganisme indeholdende sekvensen og en fremgangsmaade til fremstilling af et eucaryot protein
CS250655B2 (en) Method of microorganisme&#39;s viable culture&#39;s cultivation with means content for asexual regeneration
JP2686090B2 (ja) 新規融合蛋白質およびその精製方法
CS219257B2 (en) Method of making the eukaryotic protein
FR2730495A1 (fr) Derive de proinsuline et procede pour la production d&#39;insuline humaine
KR101299417B1 (ko) 카복시-말단 아미드화 펩티드를 제조하는 방법
LU82757A1 (fr) Genes de la proinsuline humaine et de pre-proinsuline humaine,leur procede de preparation et leurs applications
FR2555199A1 (fr) Procede de clivage d&#39;adn bicatenaire en n&#39;importe quel point donne
JP2892596B2 (ja) ヒト−レラキシン遺伝子
JP2000504574A (ja) カルシトニン・フラグメントの組換え調製、ならびにカルシトニンおよび関連アナログの調製におけるその使用
WO1986005803A1 (fr) Procede d&#39;obtention d&#39;adn, arn, peptides, polypeptides ou proteines, par une technique de recombinaison d&#39;adn
Izard et al. Physical and conformational properties of synthetic idealized signal sequences parallel their biological function
JPS59156284A (ja) ヒト−レラキシンh2遺伝子
RU2144957C1 (ru) РЕКОМБИНАНТНАЯ ПЛАЗМИДНАЯ ДНК pPINS07, КОДИРУЮЩАЯ ГИБРИДНЫЙ ПОЛИПЕПТИД, СОДЕРЖАЩИЙ ПРОИНСУЛИН ЧЕЛОВЕКА, И ШТАММ БАКТЕРИЙ Escherichia coli - ПРОДУЦЕНТ ГИБРИДНОГО ПОЛИПЕПТИДА, СОДЕРЖАЩЕГО ПРОИНСУЛИН ЧЕЛОВЕКА
JPH0376580A (ja) 大腸菌発現ベクターとそれを利用した抗ウイルス性タンパク質の製造方法
JPH03503596A (ja) 蛋白質若しくはポリペプチドの調製方法、該ポリペプチドをコードするdna配列、該dna配列およびポリペプチドを有する微生物および該ポリペプチドの薬学的製剤としての利用
EP0252894A2 (fr) Polypeptides hybrides comprenant la somatocrinine et l&#39;alpha1-antitrypsine, méthode pour leur production à partir de clones bactériens et leur utilisation pour la production de somatocrinine
EP0259891B1 (fr) Motiline [leu 13], molécules d&#39;ADN encodant celle-ci, ainsi que ses méthodes de production
JP2612264B2 (ja) Dna配列体
KR0161656B1 (ko) 글루카곤의 생산방법
CA1302321C (fr) Preparation de polypeptides
JPS60502136A (ja) 微生物によるインタ−ル−キン2の形質発現
JPS60501989A (ja) インシュリン様成長因子の微生物発現
KR19980061879A (ko) 조피볼낙 성장 호르몬의 대량생산 방법