CN114380903A - 一种胰岛素或其类似物前体 - Google Patents
一种胰岛素或其类似物前体 Download PDFInfo
- Publication number
- CN114380903A CN114380903A CN202111615218.4A CN202111615218A CN114380903A CN 114380903 A CN114380903 A CN 114380903A CN 202111615218 A CN202111615218 A CN 202111615218A CN 114380903 A CN114380903 A CN 114380903A
- Authority
- CN
- China
- Prior art keywords
- insulin
- peptide
- precursor
- analogue
- analog
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 title claims abstract description 263
- 102000004877 Insulin Human genes 0.000 title claims abstract description 118
- 108090001061 Insulin Proteins 0.000 title claims abstract description 118
- 229940125396 insulin Drugs 0.000 title claims abstract description 116
- 239000002243 precursor Substances 0.000 title claims abstract description 97
- 108010075254 C-Peptide Proteins 0.000 claims abstract description 49
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 49
- 238000004153 renaturation Methods 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 32
- 150000001413 amino acids Chemical group 0.000 claims abstract description 23
- 108010033276 Peptide Fragments Proteins 0.000 claims abstract description 15
- 102000007079 Peptide Fragments Human genes 0.000 claims abstract description 15
- 150000007523 nucleic acids Chemical class 0.000 claims description 24
- 239000004026 insulin derivative Substances 0.000 claims description 23
- 108020004707 nucleic acids Proteins 0.000 claims description 21
- 102000039446 nucleic acids Human genes 0.000 claims description 21
- VOUAQYXWVJDEQY-QENPJCQMSA-N 33017-11-7 Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)NCC(=O)NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N1[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)CCC1 VOUAQYXWVJDEQY-QENPJCQMSA-N 0.000 claims description 17
- 108010057186 Insulin Glargine Proteins 0.000 claims description 17
- COCFEDIXXNGUNL-RFKWWTKHSA-N Insulin glargine Chemical group C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)NCC(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 COCFEDIXXNGUNL-RFKWWTKHSA-N 0.000 claims description 17
- 229960002869 insulin glargine Drugs 0.000 claims description 17
- 238000004925 denaturation Methods 0.000 claims description 15
- 230000036425 denaturation Effects 0.000 claims description 15
- 108010076181 Proinsulin Proteins 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 11
- 101000976075 Homo sapiens Insulin Proteins 0.000 claims description 7
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 claims description 7
- 229920001184 polypeptide Polymers 0.000 claims description 5
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 5
- 238000012258 culturing Methods 0.000 claims description 4
- 108010073961 Insulin Aspart Proteins 0.000 claims description 2
- 108010089308 Insulin Detemir Proteins 0.000 claims description 2
- 108010065920 Insulin Lispro Proteins 0.000 claims description 2
- RCHHVVGSTHAVPF-ZPHPLDECSA-N apidra Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3N=CNC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CNC=N1 RCHHVVGSTHAVPF-ZPHPLDECSA-N 0.000 claims description 2
- 239000012634 fragment Substances 0.000 claims description 2
- WNRQPCUGRUFHED-DETKDSODSA-N humalog Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 WNRQPCUGRUFHED-DETKDSODSA-N 0.000 claims description 2
- 229960004717 insulin aspart Drugs 0.000 claims description 2
- 229960003948 insulin detemir Drugs 0.000 claims description 2
- 108700039926 insulin glulisine Proteins 0.000 claims description 2
- 229960000696 insulin glulisine Drugs 0.000 claims description 2
- 229960002068 insulin lispro Drugs 0.000 claims description 2
- UGOZVNFCFYTPAZ-IOXYNQHNSA-N levemir Chemical compound CCCCCCCCCCCCCC(=O)NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CNC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H]1NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=2N=CNC=2)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=2N=CNC=2)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=2C=CC=CC=2)C(C)C)CSSC[C@@H]2NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(C)C)CSSC[C@H](NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC2=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H](CSSC1)C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 UGOZVNFCFYTPAZ-IOXYNQHNSA-N 0.000 claims description 2
- VOMXSOIBEJBQNF-UTTRGDHVSA-N novorapid Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 VOMXSOIBEJBQNF-UTTRGDHVSA-N 0.000 claims description 2
- FYZPCMFQCNBYCY-WIWKJPBBSA-N Insulin degludec Chemical compound CC[C@H](C)[C@H](NC(=O)CN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H]1CSSC[C@@H]2NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CSSC[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc3c[nH]cn3)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)Cc3ccccc3)C(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](Cc3c[nH]cn3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](Cc3ccc(O)cc3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC2=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccc(O)cc2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCCNC(=O)CC[C@H](NC(=O)CCCCCCCCCCCCCCC(O)=O)C(O)=O)C(O)=O)NC1=O)[C@@H](C)O)[C@@H](C)CC FYZPCMFQCNBYCY-WIWKJPBBSA-N 0.000 claims 1
- 108010050259 insulin degludec Proteins 0.000 claims 1
- 229960004225 insulin degludec Drugs 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 7
- 210000004027 cell Anatomy 0.000 description 42
- 239000013604 expression vector Substances 0.000 description 24
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 17
- 125000003275 alpha amino acid group Chemical group 0.000 description 17
- 210000003000 inclusion body Anatomy 0.000 description 13
- 125000005647 linker group Chemical group 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- 239000000243 solution Substances 0.000 description 11
- 241000588724 Escherichia coli Species 0.000 description 10
- 102000004142 Trypsin Human genes 0.000 description 9
- 108090000631 Trypsin Proteins 0.000 description 9
- 239000012588 trypsin Substances 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 238000000855 fermentation Methods 0.000 description 8
- 230000004151 fermentation Effects 0.000 description 8
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 8
- 239000006228 supernatant Substances 0.000 description 8
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 7
- 239000004471 Glycine Substances 0.000 description 7
- ODFBIJXEWPWSAN-CYDGBPFRSA-N Met-Ile-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O ODFBIJXEWPWSAN-CYDGBPFRSA-N 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- 102000035195 Peptidases Human genes 0.000 description 5
- 108091005804 Peptidases Proteins 0.000 description 5
- 239000004365 Protease Substances 0.000 description 5
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 239000004202 carbamide Substances 0.000 description 5
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 4
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000001976 enzyme digestion Methods 0.000 description 4
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 4
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 108010024636 Glutathione Proteins 0.000 description 3
- 108010053070 Glutathione Disulfide Proteins 0.000 description 3
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 3
- YPZRWBKMTBYPTK-BJDJZHNGSA-N glutathione disulfide Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@H](C(=O)NCC(O)=O)CSSC[C@@H](C(=O)NCC(O)=O)NC(=O)CC[C@H](N)C(O)=O YPZRWBKMTBYPTK-BJDJZHNGSA-N 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- YPZRWBKMTBYPTK-UHFFFAOYSA-N oxidized gamma-L-glutamyl-L-cysteinylglycine Natural products OC(=O)C(N)CCC(=O)NC(C(=O)NCC(O)=O)CSSCC(C(=O)NCC(O)=O)NC(=O)CCC(N)C(O)=O YPZRWBKMTBYPTK-UHFFFAOYSA-N 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- FAAHJOLJYDXKKU-ZHDGNLTBSA-N (2s)-6-amino-2-[[(2s)-1-[(2s,3r)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-hydroxybutanoyl]pyrrolidine-2-carbonyl]amino]hexanoic acid Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CN)C1=CC=C(O)C=C1 FAAHJOLJYDXKKU-ZHDGNLTBSA-N 0.000 description 2
- 108010006303 Carboxypeptidases Proteins 0.000 description 2
- 102000005367 Carboxypeptidases Human genes 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 2
- WTXCNOPZMQRTNN-BWBBJGPYSA-N Cys-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)O WTXCNOPZMQRTNN-BWBBJGPYSA-N 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 2
- XMVLTPMCUJTJQP-FXQIFTODSA-N Glu-Gln-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N XMVLTPMCUJTJQP-FXQIFTODSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 2
- DURWCDDDAWVPOP-JBDRJPRFSA-N Ile-Cys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N DURWCDDDAWVPOP-JBDRJPRFSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 2
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 2
- 239000006142 Luria-Bertani Agar Substances 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 241001052560 Thallis Species 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000009835 boiling Methods 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 239000007791 liquid phase Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 108010066381 preproinsulin Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000008213 purified water Substances 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 238000012807 shake-flask culturing Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- HQRHFUYMGCHHJS-UHFFFAOYSA-N 2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NCC(=O)NCC(=O)NC(C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-UHFFFAOYSA-N 0.000 description 1
- XJFPXLWGZWAWRQ-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O XJFPXLWGZWAWRQ-UHFFFAOYSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- 102100032378 Carboxypeptidase E Human genes 0.000 description 1
- 108010058255 Carboxypeptidase H Proteins 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- -1 Lys Chemical class 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 1
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 1
- SXWQMBGNFXAGAT-FJXKBIBVSA-N Met-Gly-Thr Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SXWQMBGNFXAGAT-FJXKBIBVSA-N 0.000 description 1
- MHQXIBRPDKXDGZ-ZFWWWQNUSA-N Met-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 MHQXIBRPDKXDGZ-ZFWWWQNUSA-N 0.000 description 1
- DYTWOWJWJCBFLE-IHRRRGAJSA-N Met-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CNC=N1 DYTWOWJWJCBFLE-IHRRRGAJSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- DJJBHQHOZLUBCN-WDSOQIARSA-N Met-Lys-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DJJBHQHOZLUBCN-WDSOQIARSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- ZIQQNOXKEFDPBE-BZSNNMDCSA-N Phe-Lys-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N ZIQQNOXKEFDPBE-BZSNNMDCSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 108010038088 glutamyl-glycyl-seryl-leucyl-glutamine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 230000003381 solubilizing effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013595 supernatant sample Substances 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/62—Insulins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Plant Pathology (AREA)
- Endocrinology (AREA)
- Microbiology (AREA)
- Diabetes (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
本申请的实施例公开了一种胰岛素或其类似物前体,包含第一肽段,所述第一肽段的氨基酸序列为MIVEF;第二肽段,所述第二肽段包含通过第一连接肽连接的胰岛素或其类似物的A链和B链;其中,所述第一肽段通过第二连接肽连接于所述第二肽段的N端。在本申请的胰岛素或其类似物前体中的第一肽段有助于复性过程中前体的正确折叠,提高了前体的复性得率,进而提升胰岛素或其类似物的产率。
Description
技术领域
本申请涉及一种胰岛素或其类似物前体,以及制备胰岛素或其类似物的方法。
背景技术
糖尿病是当今世界严重危害人类健康的疾病之一,胰岛素是目前临床上用于治疗糖尿病的重要药物。人类的天然胰岛素由21个氨基酸连接而成的A链和30个氨基酸连接而成的B链构成的多肽,A链内有1个二硫键,A和B链之间由两个二硫键连接。
胰岛素是在胰脏中胰岛的β细胞核糖体上最初作为前胰岛素原合成出来。前胰岛素原是含有由24个氨基酸组成的前导肽链(SP)、B链(B)、31个氨基酸组成的C肽(C)以及A链(A)按照以“SP-B-C-A”这个顺序直线排列的分子。当前胰岛素原进入内质网时,前导肽链被切掉,成为胰岛素原(B-C-A)。胰岛素原在内质网内形成二硫键。形成三维结构之后,激素原转化酶PC1/3将胰岛素原在B-C结合位点切断,然后转化酶PC2又将C-A结合位点切断。最后,当用PC1/3酶切时仍保留在B链的C末端,即,C肽上的N末端的2个碱性氨基酸被羧肽酶H剪切后成为胰岛素。
目前胰岛素及其类似物的生产主要采用两套系统,一套是酵母表达系统,另一套是大肠杆菌系统。US4430266中公开了一种采用大肠杆菌宿主直接表达胰岛素原(B-C-A),通过体外复性,然后利用Trypsin、CPB进行切割,获得正确序列和结构的胰岛素。
大肠杆菌表达系统具有发酵时间短,工艺较简单,表达水平高,生产成本低等优点。但大肠杆菌表达系统的高表达使表达产物以包涵体形式聚集在细胞内,需要将细胞破碎后对包涵体进行变复性等操作才能得到正确折叠的胰岛素及其类似物前体,包涵体复性效率直接影响着产量的高低。此外,从胰岛素及其类似物前体中切割去除前导肽和C肽获得成熟体的过程通常使用Trypsin、CPB等蛋白酶。使用Trypsin或多或少会导致各种错切,产生各类杂质,对后续精细纯化造成难度,不利于生产成本的降低。
因此,需要提高现有技术中胰岛素或胰岛素类似物前体的复性得率和酶切效率,提高产量,降低生产成本。
发明内容
本申请旨在提供一种新的胰岛素或胰岛素类似物前体,以及使用该前体制备胰岛素或其类似物的方法,该前体具有高复性得率,有助于在胰岛素或胰岛素类似物生产过程中获得高产量。
在本申请的第一个方面,本申请提供了一种胰岛素或其类似物的前体,该前体包含第一肽段和第二肽段,其中第一肽段的氨基酸序列为MIVEF,第二肽段中包含通过第一连接肽连接的胰岛素或其类似物的A链和B链,第一肽段通过第二连接肽连接于第二肽段的N端。本申请中惊奇的发现,在对该胰岛素或其类似物前体进行复性操作时,第一肽段有助于前体的正确折叠,从而显著提高前体的复性得率。
在本申请的第二个方面,本申请的胰岛素或其类似物前体中,所述第二连接肽的氨基酸序列为[GmSn]xR,其中,m为2-10之间的整数,n为0或1,x为1-10之间的整数,具有该氨基酸序列的第二连接肽包含能够被位点特异性蛋白酶,例如胰蛋白酶识别并切割的位点。
在本申请的第三个方面,本申请还提供一种制备胰岛素或胰岛素类似物的方法,该方法包括以下步骤:
在适合表达所述胰岛素或其类似物前体的培养条件下,培养包含编码本申请胰岛素或其类似物前体的核酸和/或表达载体的宿主细胞;
对宿主细胞表达的胰岛素或其类似物前体进行变性后再复性,得到正确折叠的胰岛素或其类似物前体;
切割所述胰岛素或其类似物前体,收集胰岛素或其类似物。
相比于现有技术中直接表达胰岛素原(B-C-A)的技术方案,在本申请的胰岛素或其类似物制备方法中,胰岛素或其类似物前体中的第一肽段有助于复性过程中前体的正确折叠,提高了前体的复性得率,进而提升胰岛素或其类似物的产率。
在本申请的另一些方面,本申请还提供了编码本申请胰岛素或其类似物前体的核酸、含有所述核酸的载体和宿主细胞。
具体实施方式
下面结合实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,在本文中所披露的范围的端点和任何值都不限于该精确的范围或值,这些范围或值应当理解为包含接近这些范围或值的值。对于数值范围来说,各个范围的端点值之间、各个范围的端点值和单独的点值之间,以及单独的点值之间可以彼此组合而得到一个或多个新的数值范围,这些数值范围应被视为在本文中具体公开。
实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
根据本申请的第一方面,本申请提供了一种胰岛素或其类似物前体,该前体包含第一肽段和第二肽段,其中第一肽段的氨基酸序列MIVEF,第二肽段中包含通过第一连接肽连接的胰岛素或胰岛素类似物的A链和B链,第一肽段通过第二连接肽连接于第二肽段的N端。本申请发现,该胰岛素或其类似物前体被宿主细胞表达后,通过先变性后复性的过程可获得折叠成正确结构的前体,而后通过切割去除第一肽段和第一连接肽可获得成熟胰岛素多肽。在其中先变性后复性的过程中,第一肽段可以帮助前体进行正确折叠,使得前体的复性得率明显提高,有助于提升胰岛素或其类似物的产率。
本文使用的术语“胰岛素类似物”是指修饰的胰岛素,其中胰岛素的A和/或B链的氨基酸序列中被取代、缺失和/或添加了一个或几个氨基酸残基,且仍具有与胰岛素相似的生物学功能。
本文中,胰岛素分子中的修饰表示为链(A或B)、位置和取代氨基酸残基的氨基酸残基的单字母编码。术语如“A1”、“A2”和“A3”等分别是指在胰岛素的A链中(自N-末端开始计数)的位置1、2和3等的氨基酸。同样,术语如B1、B2和B3等分别是指在胰岛素的B链中(自N-末端开始计数)的位置1、2和3等的氨基酸。使用氨基酸的单字母编码,术语如A21G、B28K和B29P是指A21位置的氨基酸是甘氨酸,位置28和29的氨基酸分别是赖氨酸和脯氨酸。
在一些实施方式中,本申请的胰岛素类似物包含一个或多个以下的突变:B28的Pro被Asp、Lys、Leu、Val或Ala取代和/或位置B29的Lys被Pro、Glu或Asp取代,B3的Asn被Thr、Lys、Gln、Glu或Asp取代,A21的氨基酸残基Asn被Ala、Gln、Glu、Gly、His、Ile、Leu、Met、Ser、Thr、Trp、Tyr、或Val取代,一个或多个氨基酸,例如Lys添加到A链和/或B链的C-末端,B1的氨基酸被Glu取代,B16的氨基酸被Glu或His取代,B30氨基酸缺失, B1氨基酸缺失、B28-30氨基酸缺失,B27氨基酸缺失,A链和/或B链具有N-末端延伸,A-链和/或B-链具有C-末端延伸,例如B链C-末端添加两个精氨酸残基。在另一些实施方式中,本申请的胰岛素类似物A14的氨基酸是Asn、Gln、Glu、Arg、Asp、Gly或His,位于B25的氨基酸是His,并且任选进一步包含一个或多个额外突变。在另一些实施方式中,本申请的胰岛素类似物A21的氨基酸残基是Gly,或在C-末端进一步延伸两个精氨酸残基。
在一些实施方式中,本申请的胰岛素类似物选自甘精胰岛素、门冬胰岛素、赖脯胰岛素、谷赖胰岛素、地特胰岛素或德谷胰岛素;优选为甘精胰岛素。
本文使用的术语“胰岛素或其类似物前体”是指通过一个或多个随后的化学和/或酶促步骤可以转变为胰岛素或其类似物的多肽。
本申请的胰岛素或其类似物前体中,第二肽段包含通过第一连接肽连接的胰岛素或其类似物的A链和B链,在一些实施方式中,第一连接肽在A1的氨基上与A链连接,在B29的氨基上或B30的羧基上与B链连接。
本申请的“第一连接肽”包括可以从A链和B链酶切或化学切割而不破坏A链和B链的任何合适的多肽片段。
在一些实施方式中,第一连接肽包含C肽,例如包含天然C肽,短C肽或修饰的C肽。可选的,本申请的胰岛素及其类似物前体中C肽直接与A链和/或B链连接,或者C肽分别通过一个或两个碱性氨基酸与A链和/或B链连接。在一些实施方式中,C肽通过RR与B链连接,通过KR与A链连接,在酶切过程中,蛋白酶特异性的从RR和KR处切下,使得A链和B链分离。
本文中的术语“C肽”是指胰岛素原B-C-A中的连接部分“C”,包括天然C肽,短C肽和修饰的C肽。天然C肽是指天然人胰岛素原中连接B链和A链的连接肽,其N末端和C末端各具有两个碱性氨基酸,以实现天然C肽的切除。短C肽的非限制性实例包括AAK、AAR和DKAAK。修饰的C肽是指对C肽进行修饰后得到的连接肽。
现有技术中已公开了大量用于连接A链和B链的天然C肽、短C肽和修饰的C肽的实例,例如,WO90/10075公开了具有C-肽AAK的胰岛素前体。WO01/49742公开了具有包含芳族氨基酸残基的C-肽的胰岛素前体。WO02/079251公开了具有包含Gly残基的C-肽的胰岛素前体。WO02/079250公开了具有包含Pro残基的C-肽的胰岛素前体。WO02/100887公开了具有包含糖基化位点的C-肽的胰岛素前体。WO2008/037735公开了具有包含kex2p切割位点的C-肽的胰岛素前体。可以理解,这些文献中公开的天然C肽、短C肽和修饰的C肽都可以用作本申请的第一连接肽。
在一些实施方式中,本申请胰岛素或其类似物前体的B链的氨基酸序列为FVNQHLCGSHLVEALYLVCGERGFFYTPKTRR(SEQ ID No.14)。A链的序列为GIVEQCCTSICSLYQLENYCG(SEQID No.16)。第一连接肽序列为EAEDLQVGQVELGGGPGAGSLQPLALEGSLQKR(SEQ ID No.15)。
在一些实施方式中,本申请胰岛素或其类似物前体的B链序列为FVNQHLCGSHLVEALYLVCGERGFFYTPKT(SEQ ID No.17),A链序列为GIVEQCCTSICSLYQLENYCN(SEQ ID No.19),第一连接肽序列为RREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKR(SEQ IDNo.18)。
在一些实施方式中,本申请胰岛素或其类似物前体中的第二肽段为胰岛素原或胰岛素原类似物。
在本申请的第二个方面,本申请的胰岛素或其类似物前体中,第二连接肽的氨基酸序列为[GmSn]xR,其中,m为2-10之间的整数,n为0或1,x为1-10之间的整数。第二连接肽可被位点特异性蛋白酶,例如胰蛋白酶识别并切割。
在一些实施方式中,n为0或1,第二连接肽的氨基酸序列为[GmS]xR,其中,m为2-10之间的整数,x为1-10之间的整数,所述的第一肽段+第二连接肽序列优选为SEQ ID No. 1-7。本申请意外的发现,在采用某些特定的第二连接肽序列时,胰岛素或其类似物前体被蛋白酶酶切的效率明显提高,酶切过程中产生的杂质较少,有利于进行后续精细纯化,生产成本得以降低。
本申请还提供了编码本申请胰岛素或其类似物前体的核酸、含有所述核酸的载体和宿主细胞。
本申请的核酸可以是 DNA分子或RNA分子,也可以是核酸类似物。在本申请中的核酸分子可以包含天然存在的核酸残基或人工生成的核酸残基。本申请的核酸分子可以是单链或双链的、线性或环状的、天然的或合成的,并且若没有另外指出,则没有任何大小限制。核酸分子还可以包含启动子,启动子可以是同源或异源的。
本申请的核酸分子可以克隆到载体中。本申请的“载体”包括质粒、粘粒、病毒、噬菌体和其它在遗传工程中通常使用的载体。在一些实施方式中,这些载体适用于转化细胞、真核生物细胞如真菌细胞、微生物的细胞诸如酵母或原核细胞。在一个优选的实施方案中,这些载体适用于细菌细胞的稳定转化,例如以转录本申请的核酸分子。
本申请的载体可以是表达载体。已经在文献中广泛描述的合适的表达载体都可用于本申请。在一个实施方案中,表达载体可以含有标志基因和确保在选择的宿主中复制的复制起点,以及启动子和转录终止信号。在启动子和终止信号之间,优选地,有至少一个能够插入期望表达的核酸序列/分子的限制性位点。优选的,本申请的表达载体选自pET系列表达载体、pGEX系列表达载体、pcDNA系列表达载体,更优选本申请的表达载体是pET22b表达载体或pET26b表达载体。
本文中的术语“宿主细胞”是指用于表达目标多肽的微生物。宿主细胞包括亲本细胞的因复制期间发生突变所致与亲本细胞不相同的任何后代。
本申请的宿主细胞可以是真核细胞或原核细胞,优选是原核细胞。在一些实施方式中,本申请的宿主细胞是大肠杆菌,例如大肠杆菌BL21。
在一些实施方式中,在宿主细胞中表达胰岛素或其类似物前体,随后分离胰岛素或其类似物前体。对于蛋白质表达,通过标准方法将编码蛋白质的核酸插入表达载体中。在合适的稳定宿主细胞中实施表达,并且从所述细胞(上清液或裂解后的细胞)中收集蛋白质。
在另一个实施方式中,可以将本申请的核酸和/或其中含有本申请核酸的载体转导、转化或转染、或者以其它方式导入宿主细胞中。
在本申请的第三个方面,本申请还提供一种制备胰岛素或胰岛素类似物的方法,该方法包括在适合表达胰岛素或其类似物前体的培养条件下,培养包含编码本申请胰岛素或其类似物前体的核酸和/或表达载体的宿主细胞。
在一些实施方式中,本申请的制备胰岛素或其类似物的方法还包括以下步骤:对宿主细胞表达的胰岛素或其类似物前体进行变性后再复性,得到正确折叠的胰岛素或其类似物前体;切割所述胰岛素或其类似物前体,收集胰岛素或其类似物。
在表达胰岛素或其类似物前体时,尤其是在大肠杆菌表达系统中表达时,胰岛素或其类似物前体通常会以包涵体形式聚集在细胞内,需要将细胞破碎后对包涵体进行变复性操作才能得到正确的胰岛素或其类似物前体。相比于现有技术中直接表达胰岛素原(B-C-A)的技术方案,在本申请的胰岛素或其类似物制备方法中,胰岛素或其类似物前体中的氨基酸序列为MIVEF的第一肽段有助于复性过程中前体的正确折叠,提高了前体的复性得率,进而提升胰岛素或其类似物的产率。
在一些实施方式中,本申请的制备胰岛素或胰岛素类似物的方法还包括以下步骤:构建包含编码本申请胰岛素或其类似物前体的核酸的表达载体,通过瞬时转染宿主细胞的方法构建包含表达载体的宿主细胞。
适合表达胰岛素或其类似物前体的培养条件对于本领域技术人员来说应该是已知的,本领域技术人员可根据经验选择适用的培养基,在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。在上面的方法中的胰岛素或其类似物前体可在细胞内、或在细胞膜上表达、或分泌到细胞外。
在一些实施方式中,本申请的制备胰岛素或胰岛素类似物的方法还包括细胞裂解和收集表达产物的步骤。对于细胞裂解和收集表达产物的方法没有特别的限制,优选使用50 mM PB、1 mM EDTA溶液破菌,离心收集表达产物。在一些实施方式中,宿主细胞表达的胰岛素或胰岛素类似物以包涵体的方式存在。
在一些实施方式中,本申请的制备胰岛素或胰岛素类似物的方法还包括溶解宿主细胞表达的胰岛素或胰岛素类似物的步骤。对于溶解的方法没有特别的限制,优选将收集获得的宿主细胞表达的胰岛素或胰岛素类似物溶解在含7M尿素、20mM甘氨酸的溶液中。
在一些实施方式中,本申请的制备胰岛素或胰岛素类似物的方法包括使宿主细胞表达的胰岛素或胰岛素类似物变性后再复性的步骤。对于包涵体胰岛素或胰岛素类似物的变性和复性的方法没有特别的限制。可选地,采用二硫苏糖醇进行变性。可选的,采用10倍稀释的含1mM氧化型谷胱甘肽、5mM还原型谷胱甘肽和20mM甘氨酸的复性液进行复性。
在一些实施方式中,进行复性处理前可对变性处理后的蛋白采用阴离子交换色谱进行蛋白的富集和浓缩。
在一些实施方式中,本申请的制备胰岛素或胰岛素类似物的方法包括切割胰岛素或其类似物前体以获得胰岛素或其类似物的步骤。优选的,通过胰蛋白酶酶切胰岛素或其类似物前体以获得胰岛素或其类似物。
在一些实施方式中,本申请的制备胰岛素或胰岛素类似物的方法还包括通过羧肽酶进行酶切的步骤。将胰蛋白酶切割后的产物用羧肽酶消化以从B链去除其C末端的精氨酸。
在一些实施方式中,本申请的制备胰岛素或胰岛素类似物的方法还包括采用反相色谱从消化的样品中纯化出成熟胰岛素或胰岛素类似物的步骤。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
实施例1
一、表达载体构建
利用大肠杆菌表达系统构建基因工程菌,选择大肠杆菌偏爱密码子,以pET22b为表达载体,在其多克隆位点NdeI和Hind III插入编码甘精胰岛素前体的核酸序列。
本实施例中甘精胰岛素前体的第一肽段序列为MIVEF,第二连接肽的序列为GGR,即第一肽段+第二连接肽的序列为MIVEFGGR(SEQ ID No.1)。第二肽段为B-C-A结构,其中B的氨基酸序列为FVNQHLCGSHLVEALYLVCGERGFFYTPKTRR(SEQ ID No.14);C的氨基酸序列为EAEDLQVGQVELGGGPGAGSLQPLALEGSLQKR(SEQ ID No.15);A的氨基酸序列为GIVEQCCTSICSLYQLENYCG(SEQ ID No.16)。
二、宿主细胞构建
将BL21(DE3)菌株使用CaCl2法制备感受态,将构建完成后的表达载体转化入BL21(DE3)感受态中,涂布在Amp抗性的LB琼脂培养基上37℃过夜培养。分别挑取单克隆于添加了Amp抗性的LB液体培养基中培养后进行保种。
三、摇瓶表达甘精胰岛素前体
将获得的菌株使用SOB进行摇瓶培养,待培养至OD600约1.0时加入终浓度为0.5mM的IPTG进行诱导表达。诱导12小时后收获发酵菌体。取20μl发酵菌体加入5XSDSloadingbuffer20μl,纯化水60μl,沸水浴10-15min后进行SDS-PAGE电泳检测表达情况,显示能正常表达。
四、甘精胰岛素前体的收集、变性及复性
正常表达产物的发酵菌体经10 mM磷酸盐(后文简称PB)、0.9%氯化钠溶液洗菌;采用50 mM PB、1 mM EDTA溶液破菌;采用20mmol/L PB、1mM EDTA、1.0mol/L尿素、1%氯化钠溶液洗涤菌体并离心得到甘精胰岛素前体包涵体;
用7M尿素、20mM甘氨酸(pH10.5)溶解甘精胰岛素前体包涵体并加入浓度为4mg/g(二硫苏糖醇/包涵体)的二硫苏糖醇室温进行变性1h;变性后使用1mM氧化型谷胱甘肽、5mM还原型谷胱甘肽、20mM甘氨酸溶液(pH10.5)稀释10倍,于2-8℃进行复性,最后得到正确折叠的产物。
分别取变性液上清和复性液上清进行液相分析,分析柱为Agilent PLRP-S 300A5μM 150*4.6mm,分析条件30%B,0-2.5min;30~60%B,2.5-25min;100%B,25-29.5min;30%B,29.5-35min(流动相A:0.1% TFA,流动相B: 0.1% TFA +80%ACN),流速1mL/min,柱温35℃,检测波长214nm,变性液上清稀释10倍,进样体积为20μL,复性液上清进样体积为20 μL,根据以下公式计算复性率:
复性得率= 复性样品峰面积 / 变性样品峰面积×100%。
结果显示,本实施例方法获得的甘精胰岛素前体复性得率为79.5%,复性效果较好。
实施例2
以实施例1所述的方法制备甘精胰岛素,不同的是采用与实施例1不同的第二连接肽序列,本实施例采用的第一肽段+第二连接肽的序列如下表:
| 序列编号 | 序列 | 复性得率(%) |
| SEQ ID No.2 | MIVEFGGGR | 76.9 |
| SEQ ID No.3 | MIVEFGGGGR | 75.8 |
| SEQ ID No.4 | MIVEFGGGGGGGGR | 73.2 |
| SEQ ID No.5 | MIVEFGGGGSR | 74.5 |
| SEQ ID No.6 | MIVEFGGGGSGGGGSR | 77.3 |
| SEQ ID No.7 | MIVEFGGGGSGGGGSGGGGSGGGGSGGGGSR | 76.8 |
实验结果显示,本实施例方法能够正常表达获得甘精胰岛素前体,复性效果较好。
实施例3
一、表达载体构建
利用大肠杆菌表达系统构建基因工程菌,选择大肠杆菌偏爱密码子,以pET26b为表达载体,在其多克隆位点NdeI和Hind III插入编码天然人胰岛素前体的核酸;
本实施例中天然人胰岛素前体的第一肽段+第二连接肽的序列为MIVEFGGR(SEQID No.1)。第二肽段为B-C-A结构,其中B的氨基酸序列为FVNQHLCGSHLVEALYLVCGERGFFYTPKT(SEQ ID No.17);C的氨基酸序列为RREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKR(SEQ ID No.18);A的氨基酸序列为GIVEQCCTSICSLYQLENYCN(SEQ IDNo.19)。构建完成后的表达载体称为RHI-pet26b。
二、宿主细胞构建
将BL21 StarTM(DE3)菌株使用CaCl2法制备感受态,将构建完成后的表达载体转化入BL21 StarTM(DE3)感受态中,涂布在Kan抗性的LB琼脂培养基上37℃过夜培养。分别挑取单克隆于添加了Kan抗性的LB液体培养基中培养后进行保种。
三、摇瓶表达
将获得的菌株使用TB培养基进行摇瓶培养,待培养至OD600约1.0时加入终浓度为0.5mM的IPTG进行诱导表达。诱导12小时后收获发酵菌体。取20μl发酵菌体加入5XSDSloadingbuffer 20μl,纯化水60μl,沸水浴10-15min后进行SDS-PAGE电泳检测表达情况,结果显示可正常表达。
四、人胰岛素前体收集、变性及复性
正常表达产物的发酵菌体经10 mM磷酸盐(后文简称PB)、0.9%氯化钠溶液洗菌;采用50 mM PB、1 mM EDTA溶液破菌;采用20mmol/L PB、1mM EDTA、1.0mol/L尿素、1%氯化钠溶液洗涤菌体并离心得到人胰岛素前体包涵体;
用7M尿素、20mM甘氨酸(pH10.5)溶解人胰岛素前体包涵体并加入浓度为4mg/g(二硫苏糖醇/包涵体)的二硫苏糖醇室温进行变性1h;变性后使用1mM氧化型谷胱甘肽、5mM还原型谷胱甘肽、20mM甘氨酸溶液(pH10.5)稀释10倍,于2-8℃进行复性,最后得到正确折叠的产物。
分别取变性液上清和复性液上清进行液相分析,分析柱为Agilent PLRP-S 300A5μM 150*4.6mm,分析条件30%B,0-2.5min;30~60%B,2.5-25min;100%B,25-29.5min;30%B,29.5-35min(流动相A:0.1% TFA,流动相B: 0.1% TFA +80%ACN),流速1mL/min,柱温35℃,检测波长214nm,变性液上清稀释10倍,进样体积为20μL,复性液上清进样体积为20 μL。结果显示人胰岛素前体的复性得率为92.61%,复性效果较好。
实施例4
取实施例1和实施例2收集的甘精胰岛素前体分别经过等电点沉淀后使用20mM碳酸氢钠缓冲液进行溶解,使用胰蛋白酶进行酶切,按酶量:目的蛋白1:1000加入胰蛋白酶,于常温pH8.5条件下进行酶切,获得甘精胰岛素。
经计算,甘精胰岛素前体的酶切得率约为56%-86%。
对比例
以实施例1所述的方法制备甘精胰岛素,不同的是采用与实施例1不同的第一肽段序列和/或第二连接肽序列,其中,所采用的第一肽段+第二连接肽的序列如下表所示:
| 序列名称 | 氨基酸序列 |
| SEQ ID No.8 | MHKSSPQGPDKLLIRLKHLIDIVESKSRSKSRASGSDVGGR |
| SEQ ID No.9 | MKKMNLAVKIATLKGTAGLKGTAVAGGR |
| SEQ ID No.10 | MGTAVAGGR |
| SEQ ID No.11 | MKWVTFLLLLSGGR |
| SEQ ID No.12 | MGWSLIILFLVATATGGR |
| SEQ ID No.13 | MEGNTREDNFKHLLGNDNVKRPSEAGR |
SDS-PAGE电泳检测表达情况如下表所示:
| 序列 | 表达情况 |
| SEQ ID No.8 | 正常表达 |
| SEQ ID No.9 | 正常表达 |
| SEQ ID No.10 | 未表达 |
| SEQ ID No.11 | 正常表达 |
| SEQ ID No.12 | 正常表达 |
| SEQ ID No.13 | 正常表达 |
复性率结果如下表所示:
| 序列名称 | 复性得率/% |
| SEQ ID No.8 | 复性得率<20 |
| SEQ ID No.9 | 复性得率<20 |
| SEQ ID No.11 | 复性得率<20 |
| SEQ ID No.12 | 复性得率<20 |
| SEQ ID No.13 | 21.4 |
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行修改、替换和变型。
SEQUENCE LISTING
<110> 上海仁会生物制药股份有限公司
<120> 一种胰岛素或其类似物前体
<130> 0000
<160> 19
<170> PatentIn version 3.5
<210> 1
<211> 8
<212> PRT
<213> 人工序列
<400> 1
Met Ile Val Glu Phe Gly Gly Arg
1 5
<210> 2
<211> 9
<212> PRT
<213> 人工序列
<400> 2
Met Ile Val Glu Phe Gly Gly Gly Arg
1 5
<210> 3
<211> 10
<212> PRT
<213> 人工序列
<400> 3
Met Ile Val Glu Phe Gly Gly Gly Gly Arg
1 5 10
<210> 4
<211> 14
<212> PRT
<213> 人工序列
<400> 4
Met Ile Val Glu Phe Gly Gly Gly Gly Gly Gly Gly Gly Arg
1 5 10
<210> 5
<211> 11
<212> PRT
<213> 人工序列
<400> 5
Met Ile Val Glu Phe Gly Gly Gly Gly Ser Arg
1 5 10
<210> 6
<211> 16
<212> PRT
<213> 人工序列
<400> 6
Met Ile Val Glu Phe Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Arg
1 5 10 15
<210> 7
<211> 31
<212> PRT
<213> 人工序列
<400> 7
Met Ile Val Glu Phe Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Arg
20 25 30
<210> 8
<211> 41
<212> PRT
<213> 人工序列
<400> 8
Met His Lys Ser Ser Pro Gln Gly Pro Asp Lys Leu Leu Ile Arg Leu
1 5 10 15
Lys His Leu Ile Asp Ile Val Glu Ser Lys Ser Arg Ser Lys Ser Arg
20 25 30
Ala Ser Gly Ser Asp Val Gly Gly Arg
35 40
<210> 9
<211> 28
<212> PRT
<213> 人工序列
<400> 9
Met Lys Lys Met Asn Leu Ala Val Lys Ile Ala Thr Leu Lys Gly Thr
1 5 10 15
Ala Gly Leu Lys Gly Thr Ala Val Ala Gly Gly Arg
20 25
<210> 10
<211> 9
<212> PRT
<213> 人工序列
<400> 10
Met Gly Thr Ala Val Ala Gly Gly Arg
1 5
<210> 11
<211> 14
<212> PRT
<213> 人工序列
<400> 11
Met Lys Trp Val Thr Phe Leu Leu Leu Leu Ser Gly Gly Arg
1 5 10
<210> 12
<211> 18
<212> PRT
<213> 人工序列
<400> 12
Met Gly Trp Ser Leu Ile Ile Leu Phe Leu Val Ala Thr Ala Thr Gly
1 5 10 15
Gly Arg
<210> 13
<211> 27
<212> PRT
<213> 人工序列
<400> 13
Met Glu Gly Asn Thr Arg Glu Asp Asn Phe Lys His Leu Leu Gly Asn
1 5 10 15
Asp Asn Val Lys Arg Pro Ser Glu Ala Gly Arg
20 25
<210> 14
<211> 32
<212> PRT
<213> 人工序列
<400> 14
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg
20 25 30
<210> 15
<211> 33
<212> PRT
<213> 人工序列
<400> 15
Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro
1 5 10 15
Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys
20 25 30
Arg
<210> 16
<211> 21
<212> PRT
<213> 人工序列
<400> 16
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
1 5 10 15
Glu Asn Tyr Cys Gly
20
<210> 17
<211> 30
<212> PRT
<213> 人工序列
<400> 17
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr
20 25 30
<210> 18
<211> 35
<212> PRT
<213> 人工序列
<400> 18
Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly
1 5 10 15
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
20 25 30
Gln Lys Arg
35
<210> 19
<211> 21
<212> PRT
<213> 人工序列
<400> 19
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
1 5 10 15
Glu Asn Tyr Cys Asn
20
Claims (15)
1.一种胰岛素或其类似物前体,其特征在于,包含
第一肽段,所述第一肽段的氨基酸序列为MIVEF;
第二肽段,所述第二肽段包含通过第一连接肽连接的胰岛素或其类似物的A链和B链;
其中,所述第一肽段通过第二连接肽连接于所述第二肽段的N端。
2.根据权利要求1所述的胰岛素或其类似物前体,其特征在于,所述第二连接肽的氨基酸序列为[GmSn]xR,其中,m为2-10之间的整数,n为0或1,x为1-10之间的整数。
3.根据权利要求1或2所述的胰岛素或其类似物前体,其特征在于,所述第一连接肽为可以从A链和B链酶切或化学切割的多肽片段。
4.根据权利要求1-3任一项所述的胰岛素或其类似物前体,其特征在于,所述第一连接肽包含C肽。
5.根据权利要求4所述的胰岛素或其类似物前体,其特征在于,所述C肽选自天然C肽、短C肽或修饰的C肽。
6.根据权利要求1所述的胰岛素或其类似物前体,其特征在于,所述第二肽段为胰岛素原或胰岛素原类似物。
7.根据权利要求1所述的胰岛素或其类似物前体,其特征在于,所述胰岛素类似物选自甘精胰岛素、门冬胰岛素、赖脯胰岛素、谷赖胰岛素、地特胰岛素或德谷胰岛素。
8.根据权利要求7所述的胰岛素或其类似物前体,其特征在于,所述胰岛素类似物为甘精胰岛素。
9.根据权利要求1所述得胰岛素或其类似物前体,其特征在于,所述胰岛素为天然人胰岛素。
10.一种核酸,其特征在于,所述核酸编码权利要求1-9任一项所述的胰岛素或其类似物前体。
11.一种载体,其特征在于,包含权利要求10所述的核酸。
12.一种宿主细胞,其特征在于,包含权利要求10所述的核酸或权利要求11所述的载体。
13.根据权利要求12所述的宿主细胞,其特征在于,所述宿主细胞为大肠杆菌细胞。
14.一种制备胰岛素或其类似物的方法,其特征在于,包括如下步骤:
在适合表达所述胰岛素或其类似物前体的培养条件下,培养权利要求12或13所述的宿主细胞。
15.如权利要求14所述的方法,其特征在于,还包括如下步骤:
对宿主细胞表达的胰岛素或其类似物前体进行变性后再复性,得到正确折叠的胰岛素或其类似物前体;
切割所述胰岛素或其类似物前体,收集胰岛素或其类似物。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202111615218.4A CN114380903B (zh) | 2021-12-28 | 2021-12-28 | 一种胰岛素或其类似物前体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202111615218.4A CN114380903B (zh) | 2021-12-28 | 2021-12-28 | 一种胰岛素或其类似物前体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN114380903A true CN114380903A (zh) | 2022-04-22 |
| CN114380903B CN114380903B (zh) | 2023-07-25 |
Family
ID=81198177
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202111615218.4A Active CN114380903B (zh) | 2021-12-28 | 2021-12-28 | 一种胰岛素或其类似物前体 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN114380903B (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114805610A (zh) * | 2022-06-23 | 2022-07-29 | 北京惠之衡生物科技有限公司 | 一种高表达甘精胰岛素前体的重组基因工程菌及其构建方法 |
Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1998001473A1 (en) * | 1996-07-05 | 1998-01-15 | Novo Nordisk A/S | Method for the production of precursors of insulin, precursors of insulin analogues, and insulin like peptides |
| WO2002100887A2 (en) * | 2001-06-08 | 2002-12-19 | Novo Nordisk A/S | Method for making insulin precursors and insulin precursor analogs |
| CN1415019A (zh) * | 1999-12-29 | 2003-04-30 | 诺沃挪第克公司 | 用于生产在酵母中具有改进发酵产量的胰岛素前体和胰岛素前体类似物的方法 |
| US20100184133A1 (en) * | 2006-09-27 | 2010-07-22 | Novo Nordisk A/S | Method for making maturated insulin polypeptides |
| CN102816785A (zh) * | 2012-05-24 | 2012-12-12 | 上海华谊生物技术有限公司 | 一种甘精胰岛素及其类似物的制备方法 |
| WO2013015697A1 (en) * | 2011-07-28 | 2013-01-31 | Mabion S.A. | A recombinant protein, a polynucleotide encoding it as well as a method of obtaining insulin or its an analogue |
| CN107446039A (zh) * | 2016-05-31 | 2017-12-08 | 江苏恒瑞医药股份有限公司 | 一种人胰岛素类似物前体及其制备方法 |
| CN112105635A (zh) * | 2018-06-18 | 2020-12-18 | 联合化学实验室有限公司 | 用于重组蛋白的更高表达的前导序列 |
-
2021
- 2021-12-28 CN CN202111615218.4A patent/CN114380903B/zh active Active
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1998001473A1 (en) * | 1996-07-05 | 1998-01-15 | Novo Nordisk A/S | Method for the production of precursors of insulin, precursors of insulin analogues, and insulin like peptides |
| CN1415019A (zh) * | 1999-12-29 | 2003-04-30 | 诺沃挪第克公司 | 用于生产在酵母中具有改进发酵产量的胰岛素前体和胰岛素前体类似物的方法 |
| WO2002100887A2 (en) * | 2001-06-08 | 2002-12-19 | Novo Nordisk A/S | Method for making insulin precursors and insulin precursor analogs |
| US20100184133A1 (en) * | 2006-09-27 | 2010-07-22 | Novo Nordisk A/S | Method for making maturated insulin polypeptides |
| WO2013015697A1 (en) * | 2011-07-28 | 2013-01-31 | Mabion S.A. | A recombinant protein, a polynucleotide encoding it as well as a method of obtaining insulin or its an analogue |
| CN102816785A (zh) * | 2012-05-24 | 2012-12-12 | 上海华谊生物技术有限公司 | 一种甘精胰岛素及其类似物的制备方法 |
| CN107446039A (zh) * | 2016-05-31 | 2017-12-08 | 江苏恒瑞医药股份有限公司 | 一种人胰岛素类似物前体及其制备方法 |
| CN112105635A (zh) * | 2018-06-18 | 2020-12-18 | 联合化学实验室有限公司 | 用于重组蛋白的更高表达的前导序列 |
Non-Patent Citations (4)
| Title |
|---|
| MARCIN ZIELIŃSKI ET AL.: "Expression and purification of recombinant human insulin from E. coli 20 strain", 《 PROTEIN EXPRESSION AND PURIFICATION》, vol. 157, pages 63 - 69 * |
| 房德兴,王永山,周宗安,翟春生,顾志香,王元伦: "人胰岛素原类似物(BKRA)基因的合成与表达", 中国生物化学与分子生物学报, no. 05, pages 518 - 524 * |
| 李晓红等: "重组人胰岛素制备工艺", 《四川大学学报》, no. 4, pages 79 - 83 * |
| 马雪: "重组人胰高血糖素样肽-1前药(Pro-rhGLP-1)的表达、纯化及药效学研究", 《全国优秀博士学位论文》, pages 1 - 128 * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114805610A (zh) * | 2022-06-23 | 2022-07-29 | 北京惠之衡生物科技有限公司 | 一种高表达甘精胰岛素前体的重组基因工程菌及其构建方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN114380903B (zh) | 2023-07-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU648670B2 (en) | A-C-B Proinsulin, method of manufacturing and using same, and intermediates in insulin production | |
| CN111072783B (zh) | 一种采用大肠杆菌表达串联序列制备glp-1或其类似物多肽的方法 | |
| US20140213514A1 (en) | Insulin production methods and pro-insulin constructs | |
| CN110724187B (zh) | 一种高效表达利拉鲁肽前体的重组工程菌及其应用 | |
| AU610135B2 (en) | Polypeptides with activity against gram-positive and gram-negative bacteria | |
| US20160168226A1 (en) | Process for production of insulin and insulin analogues | |
| CN114380903B (zh) | 一种胰岛素或其类似物前体 | |
| CN101172996A (zh) | 用于多肽融合表达的连接肽及多肽融合表达方法 | |
| CA2159079C (en) | Methods and dna expression systems for over-expression of proteins in host cells | |
| WO2020187270A1 (zh) | 含有荧光蛋白片段的融合蛋白及其用途 | |
| CA2050606C (en) | Enzymatic process for the conversion of preproinsulins into insulins | |
| CN118755746B (zh) | 重组质粒、构建方法及μ-芋螺毒素肽的原核表达方法 | |
| WO2012115638A1 (en) | Glargine proinsulin compositions and methods of producing glargine insulin analogs therefrom | |
| AU2019218315A1 (en) | Codon optimized precursor gene and signal peptide gene of human insulin analogue | |
| WO2019143193A1 (ko) | 재조합 폴리펩타이드 생산용 n-말단 융합 파트너 및 이를 이용하여 재조합 폴리 펩타이드를 생산하는방법 | |
| EP3344651B1 (en) | A process for obtaining insulin with correctly formed disulfide bonds | |
| CN113801234B (zh) | 一种索玛鲁肽衍生物及其应用 | |
| HK40072579A (zh) | 一种胰岛素或其类似物前体 | |
| CN110540601B (zh) | 重组PLB-hEGF融合蛋白及其应用 | |
| CN114933658B (zh) | 一种短肽元件及其应用方法 | |
| JP4386722B2 (ja) | アシル化されたポリペプチドの製造方法 | |
| HK40072579B (zh) | 一种胰岛素或其类似物前体 | |
| CN114686504B (zh) | Lpp或其突变体作为分子伴侣在大肠杆菌中分泌表达重组蛋白的应用 | |
| WO2012115640A1 (en) | Liquid insulin- containing compositions and methods of making the same | |
| EP1531836A2 (en) | Polypeptide cleavage process |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40072579 Country of ref document: HK |
|
| GR01 | Patent grant | ||
| GR01 | Patent grant |