MXPA06014083A - Estructura cristalina de dipeptidil peptidasa iv y usos de la misma. - Google Patents
Estructura cristalina de dipeptidil peptidasa iv y usos de la misma.Info
- Publication number
- MXPA06014083A MXPA06014083A MXPA06014083A MXPA06014083A MXPA06014083A MX PA06014083 A MXPA06014083 A MX PA06014083A MX PA06014083 A MXPA06014083 A MX PA06014083A MX PA06014083 A MXPA06014083 A MX PA06014083A MX PA06014083 A MXPA06014083 A MX PA06014083A
- Authority
- MX
- Mexico
- Prior art keywords
- dpp
- computer
- amino acid
- seq
- listed
- Prior art date
Links
- 101000930822 Giardia intestinalis Dipeptidyl-peptidase 4 Proteins 0.000 title claims abstract description 140
- 102000016622 Dipeptidyl Peptidase 4 Human genes 0.000 title claims abstract description 138
- 239000013078 crystal Substances 0.000 title claims abstract description 51
- 239000003446 ligand Substances 0.000 claims abstract description 71
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 56
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 78
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 64
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 62
- 150000001413 amino acids Chemical class 0.000 claims description 59
- 229920001184 polypeptide Polymers 0.000 claims description 57
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 38
- 230000027455 binding Effects 0.000 claims description 35
- 239000000203 mixture Substances 0.000 claims description 25
- 230000000694 effects Effects 0.000 claims description 18
- 150000001875 compounds Chemical class 0.000 claims description 17
- 238000013500 data storage Methods 0.000 claims description 17
- 125000000539 amino acid group Chemical group 0.000 claims description 12
- 238000002425 crystallisation Methods 0.000 claims description 12
- 230000008025 crystallization Effects 0.000 claims description 12
- 238000013461 design Methods 0.000 claims description 11
- 230000003936 working memory Effects 0.000 claims description 10
- 238000009510 drug design Methods 0.000 claims description 7
- 238000005094 computer simulation Methods 0.000 claims description 6
- 239000011550 stock solution Substances 0.000 claims description 6
- 239000011232 storage material Substances 0.000 claims description 6
- 239000000758 substrate Substances 0.000 claims description 6
- 238000002441 X-ray diffraction Methods 0.000 claims description 5
- 239000007788 liquid Substances 0.000 claims description 5
- 238000000502 dialysis Methods 0.000 claims description 4
- 238000009792 diffusion process Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 2
- 238000002156 mixing Methods 0.000 claims description 2
- 239000007864 aqueous solution Substances 0.000 claims 2
- 239000003112 inhibitor Substances 0.000 abstract description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 15
- 201000010099 disease Diseases 0.000 abstract description 13
- 235000001014 amino acid Nutrition 0.000 description 53
- 229940024606 amino acid Drugs 0.000 description 49
- 210000004027 cell Anatomy 0.000 description 40
- 239000013598 vector Substances 0.000 description 33
- 235000018102 proteins Nutrition 0.000 description 31
- 102000004190 Enzymes Human genes 0.000 description 20
- 108090000790 Enzymes Proteins 0.000 description 20
- 229940088598 enzyme Drugs 0.000 description 20
- 230000014509 gene expression Effects 0.000 description 20
- 108020004414 DNA Proteins 0.000 description 19
- 229940079593 drug Drugs 0.000 description 19
- 239000003814 drug Substances 0.000 description 19
- 239000000126 substance Substances 0.000 description 17
- 239000013604 expression vector Substances 0.000 description 16
- 102000039446 nucleic acids Human genes 0.000 description 16
- 108020004707 nucleic acids Proteins 0.000 description 16
- 150000007523 nucleic acids Chemical class 0.000 description 16
- 241000700605 Viruses Species 0.000 description 12
- 230000003197 catalytic effect Effects 0.000 description 11
- 229910052757 nitrogen Inorganic materials 0.000 description 11
- 208000008589 Obesity Diseases 0.000 description 10
- 235000020824 obesity Nutrition 0.000 description 10
- 239000008194 pharmaceutical composition Substances 0.000 description 10
- 108020003175 receptors Proteins 0.000 description 10
- 238000003860 storage Methods 0.000 description 10
- 208000011580 syndromic disease Diseases 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 9
- 241000701447 unidentified baculovirus Species 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 238000013459 approach Methods 0.000 description 8
- 230000004071 biological effect Effects 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 108091033319 polynucleotide Proteins 0.000 description 8
- 102000040430 polynucleotide Human genes 0.000 description 8
- 239000002157 polynucleotide Substances 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 8
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 229910052799 carbon Inorganic materials 0.000 description 7
- 238000000126 in silico method Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 6
- 241000238631 Hexapoda Species 0.000 description 6
- 208000001132 Osteoporosis Diseases 0.000 description 6
- 108020004511 Recombinant DNA Proteins 0.000 description 6
- 239000000556 agonist Substances 0.000 description 6
- 239000005557 antagonist Substances 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 239000011575 calcium Substances 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 208000004476 Acute Coronary Syndrome Diseases 0.000 description 5
- 241000282414 Homo sapiens Species 0.000 description 5
- 241000124008 Mammalia Species 0.000 description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 5
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 210000004899 c-terminal region Anatomy 0.000 description 5
- 229910052791 calcium Inorganic materials 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 206010012601 diabetes mellitus Diseases 0.000 description 5
- 238000007876 drug discovery Methods 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 229910052760 oxygen Inorganic materials 0.000 description 5
- 230000000144 pharmacologic effect Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 208000010444 Acidosis Diseases 0.000 description 4
- 208000007848 Alcoholism Diseases 0.000 description 4
- 208000019901 Anxiety disease Diseases 0.000 description 4
- 201000001320 Atherosclerosis Diseases 0.000 description 4
- 208000010392 Bone Fractures Diseases 0.000 description 4
- 208000002177 Cataract Diseases 0.000 description 4
- 208000000094 Chronic Pain Diseases 0.000 description 4
- 208000007342 Diabetic Nephropathies Diseases 0.000 description 4
- 208000032131 Diabetic Neuropathies Diseases 0.000 description 4
- 206010012689 Diabetic retinopathy Diseases 0.000 description 4
- 206010061818 Disease progression Diseases 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 208000002705 Glucose Intolerance Diseases 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 206010018473 Glycosuria Diseases 0.000 description 4
- 101000908391 Homo sapiens Dipeptidyl peptidase 4 Proteins 0.000 description 4
- 208000031226 Hyperlipidaemia Diseases 0.000 description 4
- 206010020772 Hypertension Diseases 0.000 description 4
- 208000031773 Insulin resistance syndrome Diseases 0.000 description 4
- 206010027417 Metabolic acidosis Diseases 0.000 description 4
- 208000029725 Metabolic bone disease Diseases 0.000 description 4
- 108090000189 Neuropeptides Proteins 0.000 description 4
- 206010049088 Osteopenia Diseases 0.000 description 4
- 208000002193 Pain Diseases 0.000 description 4
- 206010036049 Polycystic ovaries Diseases 0.000 description 4
- 208000020221 Short stature Diseases 0.000 description 4
- 206010049416 Short-bowel syndrome Diseases 0.000 description 4
- 208000013738 Sleep Initiation and Maintenance disease Diseases 0.000 description 4
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 4
- 208000025865 Ulcer Diseases 0.000 description 4
- -1 alkali metal salts Chemical class 0.000 description 4
- 230000036506 anxiety Effects 0.000 description 4
- 206010003246 arthritis Diseases 0.000 description 4
- 210000000988 bone and bone Anatomy 0.000 description 4
- 208000033679 diabetic kidney disease Diseases 0.000 description 4
- 230000006806 disease prevention Effects 0.000 description 4
- 206010015037 epilepsy Diseases 0.000 description 4
- 206010016256 fatigue Diseases 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000045598 human DPP4 Human genes 0.000 description 4
- 208000000509 infertility Diseases 0.000 description 4
- 230000036512 infertility Effects 0.000 description 4
- 231100000535 infertility Toxicity 0.000 description 4
- 230000002757 inflammatory effect Effects 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 206010022437 insomnia Diseases 0.000 description 4
- 208000002551 irritable bowel syndrome Diseases 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 230000004060 metabolic process Effects 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 201000010065 polycystic ovary syndrome Diseases 0.000 description 4
- 201000009104 prediabetes syndrome Diseases 0.000 description 4
- 238000007670 refining Methods 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 231100000397 ulcer Toxicity 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- 208000032781 Diabetic cardiomyopathy Diseases 0.000 description 3
- 208000030814 Eating disease Diseases 0.000 description 3
- 208000019454 Feeding and Eating disease Diseases 0.000 description 3
- 108010004460 Gastric Inhibitory Polypeptide Proteins 0.000 description 3
- 102100039994 Gastric inhibitory polypeptide Human genes 0.000 description 3
- 102400000322 Glucagon-like peptide 1 Human genes 0.000 description 3
- 101800000224 Glucagon-like peptide 1 Proteins 0.000 description 3
- DTHNMHAUYICORS-KTKZVXAJSA-N Glucagon-like peptide 1 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 DTHNMHAUYICORS-KTKZVXAJSA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- 206010056438 Growth hormone deficiency Diseases 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 208000001145 Metabolic Syndrome Diseases 0.000 description 3
- 238000005481 NMR spectroscopy Methods 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 241000700618 Vaccinia virus Species 0.000 description 3
- 201000000690 abdominal obesity-metabolic syndrome Diseases 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 150000005829 chemical entities Chemical class 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 235000014632 disordered eating Nutrition 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000035780 glucosuria Effects 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000000968 intestinal effect Effects 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- 229920002521 macromolecule Polymers 0.000 description 3
- 229910021645 metal ion Inorganic materials 0.000 description 3
- 230000037230 mobility Effects 0.000 description 3
- 238000000302 molecular modelling Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000003389 potentiating effect Effects 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 241001515965 unidentified phage Species 0.000 description 3
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 2
- 102000055025 Adenosine deaminases Human genes 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 101800001415 Bri23 peptide Proteins 0.000 description 2
- 102400000107 C-terminal peptide Human genes 0.000 description 2
- 101800000655 C-terminal peptide Proteins 0.000 description 2
- 108010012236 Chemokines Proteins 0.000 description 2
- 102000019034 Chemokines Human genes 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 239000007993 MOPS buffer Substances 0.000 description 2
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 2
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 2
- 102000003797 Neuropeptides Human genes 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 229940124639 Selective inhibitor Drugs 0.000 description 2
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 2
- 230000006044 T cell activation Effects 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 2
- 235000021229 appetite regulation Nutrition 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000003833 cell viability Effects 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005138 cryopreservation Methods 0.000 description 2
- 238000002050 diffraction method Methods 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000012595 freezing medium Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000000329 molecular dynamics simulation Methods 0.000 description 2
- 238000000324 molecular mechanic Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000000813 peptide hormone Substances 0.000 description 2
- 239000000816 peptidomimetic Substances 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 229940002612 prodrug Drugs 0.000 description 2
- 239000000651 prodrug Substances 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 239000001632 sodium acetate Substances 0.000 description 2
- 235000017281 sodium acetate Nutrition 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 238000002424 x-ray crystallography Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- IHBAVXVTGLANPI-QMMMGPOBSA-N 2-amino-3-methyl-1-pyrrolidin-1-yl-butan-1-one Chemical compound CC(C)[C@H](N)C(=O)N1CCCC1 IHBAVXVTGLANPI-QMMMGPOBSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- 101710129138 ATP synthase subunit 9, mitochondrial Proteins 0.000 description 1
- 101710168506 ATP synthase subunit C, plastid Proteins 0.000 description 1
- 101710114069 ATP synthase subunit c Proteins 0.000 description 1
- 101710197943 ATP synthase subunit c, chloroplastic Proteins 0.000 description 1
- 101710187091 ATP synthase subunit c, sodium ion specific Proteins 0.000 description 1
- 206010002383 Angina Pectoris Diseases 0.000 description 1
- 102000006410 Apoproteins Human genes 0.000 description 1
- 108010083590 Apoproteins Proteins 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 102100025012 Dipeptidyl peptidase 4 Human genes 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 108010037255 Member 7 Tumor Necrosis Factor Receptor Superfamily Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 101710182846 Polyhedrin Proteins 0.000 description 1
- 241000220010 Rhode Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 239000012505 Superdex™ Substances 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 229910052783 alkali metal Inorganic materials 0.000 description 1
- 229910052784 alkaline earth metal Inorganic materials 0.000 description 1
- 150000001342 alkaline earth metals Chemical class 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 230000003178 anti-diabetic effect Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000003472 antidiabetic agent Substances 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 239000013602 bacteriophage vector Substances 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000012867 bioactive agent Substances 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 230000036983 biotransformation Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000007910 cell fusion Effects 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 238000002288 cocrystallisation Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 210000004246 corpus luteum Anatomy 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 239000008150 cryoprotective solution Substances 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229910001873 dinitrogen Inorganic materials 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007247 enzymatic mechanism Effects 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 235000001727 glucose Nutrition 0.000 description 1
- 230000014101 glucose homeostasis Effects 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000004030 hiv protease inhibitor Substances 0.000 description 1
- 239000012510 hollow fiber Substances 0.000 description 1
- 235000012907 honey Nutrition 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000008991 intestinal motility Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 102000019758 lipid binding proteins Human genes 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 210000003712 lysosome Anatomy 0.000 description 1
- 230000001868 lysosomic effect Effects 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- STEPQTYSZVCJPV-UHFFFAOYSA-N metazachlor Chemical compound CC1=CC=CC(C)=C1N(C(=O)CCl)CN1N=CC=C1 STEPQTYSZVCJPV-UHFFFAOYSA-N 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000004001 molecular interaction Effects 0.000 description 1
- 208000031225 myocardial ischemia Diseases 0.000 description 1
- 239000006225 natural substrate Substances 0.000 description 1
- 239000002858 neurotransmitter agent Substances 0.000 description 1
- 230000036963 noncompetitive effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000011164 ossification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- GCYXWQUSHADNBF-AAEALURTSA-N preproglucagon 78-108 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 GCYXWQUSHADNBF-AAEALURTSA-N 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 210000000512 proximal kidney tubule Anatomy 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000036186 satiety Effects 0.000 description 1
- 235000019627 satiety Nutrition 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 230000036964 tight binding Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 229910052723 transition metal Inorganic materials 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2299/00—Coordinates from 3D structures of peptides, e.g. proteins or enzymes
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
Abstract
Una estructura cristalina de dipeptidil peptidasa IV (DPP-IV), y las coordenadas atomicas tridimensionales del dominio extracelular de DPP-IV, tal y como se describe y usa para la identificacion de ligandos, incluyendo inhibidores de DPP-IV, usados para el tratamiento de enfermedades que estan asociadas con proteinas que son objeto de procesamiento por parte de DPP-IV.
Description
ESTRUCTURA CRISTALINA DE DIPEPTIDIL PEPTIDASA IV Y USOS DE LA MISMA
CAMPO DE LA INVENCIÓN
La presente invención se refiere a composiciones cristalinas de dipeptidil peptidasa IV (DPP-IV) de mamífero, procedimientos para preparar dichas composiciones, procedimientos para determinar las coordenadas atómicas de rayos X tridimensionales (3-D) de dicha composición, procedimientos para identificar ligandos de DPP-IV usando diseño de fármacos basado en la estructura, el uso de las estructuras cristalinas 3-D para diseñar, modificar y evaluar la actividad de inhibidores potenciales, y al uso de dichos inhibidores para el tratamiento de, por ejemplo, diabetes, tolerancia a la glucosa, obesidad, regulación del apetito, lipidemia, osteoporosis, metabolismo de neuropéptidos y activación de células T, entre otros.
ANTECEDENTES DE LA INVENCIÓN
La serina peptidasa dipeptidil peptidasa IV (DPP-IV) es una glicoproteína de superficie celular de tipo II multifuncional, que se expresa ampliamente en una diversidad de tipos celulares, particularmente en células epiteliales diferenciales del intestino, hígado, tejido de la próstata, cuerpo lúteo, y túbulos proximales del riñon (Thoma y col., Structure, 11 , 947-959, 947 (2003) citando Hartel y col., Histochemistry 89, 151-161 (1988); McCaughan y col., Hepatology 11 , 534-544 (1990) así como subconjuntos de leucocitos (Thoma y col., (2003) citando a Gorrell y col., Cell. Immunol. 134, 205-215 (1991 )). DPP-IV tiene papeles en muchos procesos biológicos incluyendo su capacidad de modular la actividad biológica de varias hormonas peptídicas, quimioquinas y neuropéptidos por escisión específica después de una prolina o alanina en la posición de aminoácido 2 desde el extremo N-terminal, una etapa limitante de la velocidad en la degradación de péptidos (Mentlein, R. Regul Pept. 85, 9-24 (1999)). Por lo tanto, los sustratos naturales de DPP-IV incluyen varias quimioquinas, citoquinas, neuropéptidos, hormonas en la circulación, y péptidos bioactivos que como apreciarán los especialistas en la técnica, sugiere un papel regulador clave en el metabolismo de hormonas peptídicas y en el transporte de aminoácidos ((Lambeir y col., FEBS Lett. 507, 327-330 (2001 ); (Hildebrandt y col., Clin. Sci. 99, 93-104)). Se ha implicado la DPP-IV en el control de la homeostasis de la glucosa porque sus sustratos incluyen los péptidos de incretina péptido de tipo glucagón 1 (GLP-1 ) y polipéptido inhibidor gástrico (GIP). La escisión de los aminoácidos N-terminales de estos péptidos les vuelve funcionalmente inactivos. Como tal, GLP-1 ha demostrado ser una terapia anti-diabética eficaz en pacientes diabéticos de Tipo 2 y ha demostrado reducir los requisitos de insulina relacionados con la comida en pacientes diabéticos de Tipo 1.
Además, se cree que GLP-1 y/o GIP regulan la saciedad, lipidemia y osteogénesis, y por lo tanto se ha propuesto GLP-1 exógeno como tratamiento para pacientes que padecen síndrome coronario agudo, angina y enfermedad cardiaca isquémica. Como apreciarán los especialistas en la técnica, se han usado varios procedimientos en el pasado y continúan usándose para descubrir inhibidores selectivos de dianas biomoleculares tales como DPP-IV. Los diversos enfoques incluyen descubrimiento de fármacos dirigido por ligando (LDD), análisis de relación cuantitativa entre actividad y estructura (QSAR); y análisis comparativo de campo molecular (CoMFA). CoMFA es un tipo particular de procedimiento QSAR que usa técnicas de correlación estadística para el análisis de la relación cuantitativa entre la actividad biológica de un conjunto de compuestos con una alineación especificada, y sus propiedades electrónicas y estéricas tridimensionales. Otras propiedades tales como hidrofobicidad y formación de enlaces de hidrógeno también pueden incorporarse en el análisis. Un componente inapreciable de estos enfoques de descubrimiento de fármacos es el diseño basado en la estructura, que es una estrategia de diseño para nuevas entidades químicas, o de optimización de compuestos principales identificados por otros procedimientos, usando la estructura 3D de la macromolécula biológica diana obtenida por, por ejemplo, rayos X o estudios de resonancia magnética nuclear (RMN), o a partir de modelos de homología. Analizar estructuras 3-D de proteínas proporciona nuevas percepciones en el comportamiento y mecánica de la unión de fármacos y la actividad biológica. Acoplado con las técnicas por ordenador incluyendo el modelado y simulación, el estudio de las interacciones biomoleculares proporciona detalles de acontecimientos que pueden ser difíciles de investigar experimentalmente en el laboratorio, y puede ayudar a revelar características topológicas importantes para determinar el reconocimiento molecular. Como reconocerán los especialistas en la técnica, esta información puede, a su vez, usarse para predecir la formación de complejos ligando-receptor, y para diseñar ligando y mutaciones en las proteínas que produzcan interacciones ligando-receptor deseadas. Aunque se han descrito previamente estructuras cristalinas de DPP-IV, nadie ha sido capaz de resolver una estructura tridimensional con sólo una molécula por unidad asimétrica, proporcionando a su vez, una mayor ventaja para el diseño basado en la estructura iterativa. (Aertgeets y col., Protein Science, 13:412-421 (2004) hDPP-IV complexed with a decapaptide; Engel y col., PNAS, 100:9:5063-5068 (2003) crystal structure of native porcine DPP-IV; Hiramatsu y col., BBRC, 302:849-854 (2003) crystal structure of hDPP-IV at 2.6A resolution; Rasmussen y col., Nature Structural Biology, 10:19-25 (2003) 2.5A structure of the extracellular región of DPP-IV in complex with the inhibitor valine-pyrrolidide; Thoma y col., Structure, 11 :947-959 (2003) expressed and purified the ectodomain of human DPP-IV in Pichia pastoris and determined X-ray structure at 2.1Á resolution.) Para este fin, continúa la búsqueda de inhibidores de DPP-IV específicos y potentes para su uso en estudios fisiológicos y situaciones terapéuticas. Por tanto, obtener las estructuras tridimensionales (3D) de DPP, tales como DPP-IV como una única molécula de una unidad asimétrica por, por ejemplo, rayos X o estudios de RMN, o a partir de modelos de homología, y analizar las estructuras usando procedimientos computacionales, facilita dichos esfuerzos de descubrimiento.
BREVE DESCRIPCIÓN DE LA INVENCIÓN
La presente invención proporciona composiciones cristalinas de DPP-IV, y específicamente de DPP-IV, que tienen una molécula por unidad asimétrica. La invención proporciona adicionalmente procedimientos para preparar dichas composiciones, procedimientos para determinar las coordenadas atómicas de rayos X 3-D de dichas composiciones cristalinas, procedimientos para usar las coordenadas atómicas junto con procedimientos computacionales para identificar sitio o sitios de unión, procedimientos para dilucidar la estructura 3-D de homólogos de DPP-IV, y procedimientos para identificar ligandos que ¡nteraccionen con el sitio o sitios de unión para agonizar o antagonizar la actividad biológica de DPP-IV, procedimientos para identificar inhibidores de DPP-IV, composiciones farmacéuticas de inhibidores, y procedimientos de tratamiento de diabetes de Tipo 2, diabetes de Tipo 1 , tolerancia alterada a la glucosa, hipergiucemia, síndrome metabólico (síndrome X y/o síndrome de resistencia a insulina), glucosuria, acidosis metabólica, artritis, cataratas, neuropatía diabética, nefropatía diabética, retinopatía diabética, cardiomiopatía diabética, obesidad, afecciones exacerbadas por obesidad, hipertensión, hiperlipidemia, aterosclerosis, osteoporosis, osteopenia, debilidad, pérdida de masa ósea, fractura ósea, síndrome coronario agudo, baja estatura debida a deficiencia en la hormona del crecimiento, infertilidad debida al síndrome de ovario poliquístico, ansiedad, depresión, insomnio, fatiga crónica, epilepsia, trastornos de la alimentación, dolor crónico, adicción al alcohol, enfermedades asociadas con la movilidad intestinal, úlceras, síndrome del intestino irritable, síndrome inflamatorio del intestino; síndrome de intestino corto; y la prevención de la progresión de la enfermedad en diabetes de Tipo 2, usando dichas composiciones farmacéuticas. En una modalidad preferida la invención proporciona composiciones cristalinas del dominio extracelular de DPP-IV (restos 31-766 de SEC ID No. 1 ), por las que se obtiene la estructura cristalina a partir de mamífero, preferiblemente de seres humanos. Un aspecto de la presente invención proporciona procedimientos para cristalizar un polipéptido DPP-IV. Preferiblemente los procedimientos para cristalizar el polipéptido DPP-IV que comprende una secuencia de aminoácidos que abarca los aminoácidos 31 a 766 enumerados en la SEC ID No. 1 comprenden las etapas de: (a) preparar soluciones del polipéptido y precipitante; (b) hacer crecer un cristal que comprende moléculas del polipéptido de dicha solución de mezcla; y (c) separar dicho cristal de dicha solución. El crecimiento cristalino puede realizarse por diversas técnicas conocidas para los especialistas en la técnica, tales como por ejemplo, cristalización discontinua, cristalización por puente líquido, cristalización por difusión de vapor, cristalización, o cristalización por diálisis. Preferiblemente, el crecimiento cristalino se consigue usando técnicas de difusión por vapor. Una modalidad de la presente invención proporciona composiciones cristalinas de DPP-IV que comprenden una forma cristalina de un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , donde la composición cristalina tiene un grupo espacial P432?2 y dimensiones de celda unitaria a=b=68.7 A, c= 421 ,2 A. En un segundo aspecto, la presente invención proporciona vectores útiles en procedimientos para preparar un dominio extracelular sustancialmente purificado de DPP-IV que comprende el polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. Otra modalidad más de la presente invención proporciona un cristal de DPP-IV de la SEC ID No. 2, o un homólogo, análogo o variante del mismo. En un tercer aspecto, la presente invención proporciona procedimientos para determinar las coordenadas atómicas de rayos X de las composiciones cristalinas a una resolución de 2.7 A.
En un cuarto aspecto, la presente invención proporciona una molécula o complejo molecular cristalinos, donde el cristal tiene coordenadas atómicas sustancialmente similares a las coordenadas atómicas enumeradas en la figura 2 o partes de las mismas, o cualquier variación a escala de las mismas. En un quinto aspecto, la presente invención proporciona una molécula o complejo molecular cristalinos, donde el cristal comprende un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. Una modalidad adicional de la invención proporciona un cristal que comprende una secuencia de aminoácidos que es al menos el 98% o el 95% homologa a un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. Una modalidad adicional más de la invención proporciona un cristal que comprende una secuencia de aminoácidos que es al menos el 98% o el 95% homologa a un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , y que tiene las coordenadas atómicas enumeradas en la figura 2. En un sexto aspecto, la presente invención proporciona una molécula o complejo molecular crtistalinos, donde el cristal comprende un polipéptido, o una parte del mismo, con coordenadas atómicas que tienen una raíz de la desviación cuadrática media de los átomos de la estructura de la proteína (N, Ca, C, y O) enumeradas en la figura 2 de menos de 0.2, 0.5, 0.7, 1.0, 1.2, 1.5, 2.0 o 2.5 A. En un séptimo aspecto, la presente invención proporciona una configuración tridimensional que se puede ajustar a escala o trasladar, de puntos obtenidos de coordenadas estructurales de al menos una parte de una molécula o complejo molecular de DPP-IV que comprende un polipéptido con una secuencia de aminoácidos que abarca the aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. En una modalidad de este aspecto, la invención también comprende las coordenadas estructurales de al menos una parte de una molécula o un complejo molecular que es estructuralmente homólogo a una molécula o complejo molecular de DPP-IV. En una escala molecular, la configuración de puntos obtenidos de una molécula o complejo molecular homologa tiene una raíz de la desviación cuadrática media de menos de aproximadamente 0.2, 0.5, 0.7, 1.0, 1.2, 1.5, 2.0 o 2.5 A de las coordenadas estructurales proporcionadas en la figura 2. En un octavo aspecto, la invención proporciona ordenadores para producir una representación tridimensional del octavo aspecto de la presente invención que pueden usarse para diseñar e identificar ligandos o inhibidores potenciales de DPP-IV por, por ejemplo un software de modelado molecular disponible en el mercado junto con el diseño de fármacos basado en la estructura proporcionado en este documento. En un aspecto adicional, la presente invención proporciona un ordenador para producir representaciones tridimensionales de: a. una molécula o complejo molecular que comprende un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , o un homólogo, o una variante del mismo; b. una molécula o complejo molecular, donde los átomos de la molécula o complejo molecular se representan por coordenadas atómicas que son sustancialmente similares a, o son subconjuntos de, las coordenadas atómicas enumeradas en la figura 2; c. una molécula o complejo molecular, donde la molécula o complejo molecular comprende coordenadas atómicas que tienen una raíz de la desviación cuadrática media de menos de 0.2, 0.5, 0.7, 1.0, 1.2, 1.5, 2.0 o incluso 2.5 A de las coordenadas atómicas para los átomos de la estructura de carbono enumeradas en figura 2; o d. una molécula o complejo molecular, donde la molécula o complejo molecular comprende una cavidad o sitio de unión definido por las coordenadas estructurales que son sustancialmente similares a las coordenadas atómicas enumeradas en la figura 2, o un subconjunto de las mismas, o más preferiblemente las coordenadas estructurales de la figura 2 que corresponden a uno o más aminoácidos de DPP-IV, o reemplazos conservativos de los mismos, en la SEC ID No. 1 seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e Hís740; donde dicho ordenador comprende: (i) un medio de almacenamiento de datos legibles en ordenador que comprende un medio de almacenamiento de datos codificado con datos legibles en el ordenador, donde dichos datos comprenden las coordenadas estructurales de la figura 2, o partes de las mismas, o coordenadas sustancialmente similares de las mismas; (ii) una memoria de trabajo para almacenar instrucciones para procesar dichos datos legibles en el ordenador; (iii) una unidad de procesamiento central acoplada a dicha memoria de trabajo y a dicho medio de almacenamiento de datos legibles en el ordenador para procesar dichos datos legibles en el ordenador en dicha representación tridimensional; y (iv) una pantalla acoplada a dicha unidad de procesamiento central para presentar dicha representación. En un noveno aspecto, la presente invención proporciona procedimientos que implican el reemplazo molecular para obtener información estructural acerca de una molécula o complejo molecular de estructura desconocida. En una modalidad, el procedimiento incluye cristalizar la molécula o complejo molecular, generar un patrón de difracción de rayos X de la molécula o complejo molecular cristalizado, y aplicar al menos una parte de las coordenadas estructurales expuestas en la figura 2 al patrón de difracción de rayos X para generar un mapa de densidad electrónica tridimensional de al menos una parte de la molécula o complejo molecular.
En otro aspecto más, la presente invención proporciona procedimientos para generar coordenadas atómicas 3-D de homólogos proteicos, análogos, o variantes de DPP-IV usando las coordenadas de rayos X de DPP-IV descritas en la figura 2, que comprenden: a. identificar una o más secuencias de polipéptidos homólogos a
DPP-IV; b. alinear dichas secuencias con la secuencia de DPP-IV que comprende un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 ; c identificar las regiones estructuralmente conservadas y estructuralmente variables entre dicha secuencia o secuencias homologas y DPP-IV; d. generar coordenadas 3-D para restos estructuralmente conservados de dicha secuencia o secuencias homologas de los de DPP-IV usando las coordenadas enumeradas en la figura 2; e. generar conformaciones para los bucles en las regiones estructuralmente variables de dicha secuencia o secuencias homologas; f. construir las conformaciones de cadena lateral para dicha secuencia o secuencias homologas; y g. combinar las coordenadas 3-D de los restos conservados, bucles y conformaciones de cadena lateral para generar coordenadas 3-D completas o parciales para dichas secuencias homologas.
Modalidades del noveno aspecto proporcionan procedimientos que comprenden adicionalmente refinar y evaluar las coordenadas 3-D completas o parciales. Estos procedimientos pueden usarse de este modo, por ejemplo, para generar estructuras tridimensionales para proteínas para las que no se han determinado las coordenadas atómicas tridimensionales. Como tal, la estructura recién generada puede ayudar a dilucidar los mecanismos enzimáticos, o usarse junto con otras técnicas de modelado molecular en el diseño de fármacos basado en la estructura. En el décimo aspecto, la presente invención proporciona procedimientos para identificar inhibidores, ligandos, y similares, de DPP-IV proporcionando las coordenadas de una molécula de DPP-IV a un sistema de modelado computarizado; identificando entidades químicas que probablemente se unen o interaccionan con la molécula (por ejemplo, explorando una pequeña biblioteca molecular); y, opcionalmente, obteniendo o sintetizando y ensayando los compuestos o análogos derivados de los mismos para la bioactividad. Aspectos adicionales de la presente invención se refieren a procedimientos para identificar ligandos potenciales para DPP-IV u homólogos, o análogos o variantes de la misma que comprenden: a. presentar la estructura tridimensional de la enzima DPP-IV u homólogo o análogo o variante de la misma, definida por las coordenadas atómicas que son sustancialmente similares a las coordenadas atómicas enumeradas en la figura 2 en una pantalla de ordenador;
b. opcionalmente reemplazar uno o más restos aminoacídicos de la enzima enumerados en la SEC ID No. 1 , o preferiblemente uno o más restos aminoacídicos seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740, en dicha estructura tridimensional con un aminoácido de origen natural diferente o un aminoácido no natural para presentar una estructura variante; c. opcionalmente realizar ab intio, cálculos de mecánica molecular o dinámica molecular en la estructura tridimensional presentada para generar una estructura modificada; d. emplear dicha estructura tridimensional, estructura variante, o estructura modificada para diseñar o seleccionar dicho ligando; d. sintetizar u obtener dicho ligando; e. poner en contacto dicho ligando con dicha enzima en presencia de uno o más sustratos; y f. medir la capacidad de dicho ligando para modular la actividad de dicha enzima. Los especialistas en la técnica pueden apreciar que la información obtenida por los procedimientos para identificar inhibidores y ligandos de DPP-IV, como se ha descrito anteriormente, puede usarse para refinar o modificar iterativamente la estructura del ligando original. Por tanto, una vez que se ha encontrado un ligando para modular la actividad de dicha enzima, los aspectos estructurales del ligando pueden modificarse para generar un análogo estructural del ligando. Este análogo después puede usarse en los procedimientos anteriores para identificar ligandos de unión. Un especialista en la técnica conocerá los diversos modos en que puede modificarse una estructura. En modalidades, los procedimientos comprenden adicionalmente modificar computacionalmente la estructura del ligando; determinar computacionalmente el ajuste del ligando modificado usando las coordenadas tridimensionales descritas en la figura 2, o partes de las mismas; poner en contacto dicho ligando modificado con dicha enzima, u homólogo, o variante de la misma en una situación in vitro o in vivo; y medir la capacidad de dicho ligando para modular la actividad de dicha enzima. En un undécimo aspecto, la presente invención proporciona composiciones, tales como, composiciones farmacéuticas que comprenden los inhibidores o ligandos diseñados de acuerdo con cualquiera de los procedimientos de la presente invención. En una modalidad, se proporciona una composición que incluye un inhibidor o ligando diseñado o identificado por cualquiera de los procedimientos anteriores. En otra modalidad, la composición es una composición farmacéutica. El duodécimo aspecto de la presente invención son procedimientos para tratar la diabetes de Tipo 2, diabetes de Tipo 1 , tolerancia alterada a la glucosa, hipergiucemia, síndrome metabólico (síndrome X y/o síndrome de resistencia a insulina), glucosuria, acidosis metabólica, artritis, cataratas, neuropatía diabética, nefropatía diabética, retinopatía diabética, cardiomiopatía diabética, obesidad, afecciones exacerbadas por obesidad, hipertensión, hiperlipidemia, aterosclerosis, osteoporosis, osteopenia, debilidad, pérdida de masa ósea, fractura ósea, síndrome coronario agudo, baja estatura debida a deficiencia en la hormona del crecimiento, infertilidad debida al síndrome de ovario poliquístico, ansiedad, depresión, insomnio, fatiga crónica, epilepsia, trastornos de la alimentación, dolor crónico, adicción al alcohol, enfermedades asociadas con la movilidad intestinal, úlceras, síndrome del intestino irritable, síndrome inflamatorio del intestino; síndrome de intestino corto; y la prevención de la progresión de la enfermedad en diabetes de Tipo 2, que comprenden administrar composiciones farmacéuticas, identificadas por el diseño basado en la estructura usando las coordenadas atómicas, o partes de las mismas, enumeradas en la figura 2, eficaces para tratar los trastornos o afecciones.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
La figura 1 es una vista ortogonal de una modalidad de DPP-IV mostrada en una representación en cintas. También se representan los extremos N y C-terminales del polipéptido. La figura 2 es una lista de las coordenadas de rayos X de un cristal de DPP-IV como se describe en los Ejemplos.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
La presente invención se refiere a composiciones cristalinas de DPP-IV, coordenadas atómicas 3-D de rayos X de dichas composiciones cristalinas, procedimientos para preparar dichas composiciones, procedimientos para determinar las coordenadas atómicas 3-D de rayos X de dichas composiciones cristalinas, y procedimientos para usar dichas coordenadas atómicas junto con procedimientos computacionales para identificar sitio o sitios de unión, o identificar ligandos que interaccionen con dicho sitio o sitios de unión para agonizar o antagonizar DPP-IV. Por conveniencia, ciertos términos empleados en la memoria descriptiva, ejemplos, y reivindicaciones adjuntas se recogen ahora. Salvo que se definan de otro modo, todos los términos técnicos y científicos usados en este documento tienen el mismo significado que el entendido comúnmente por un especialista en la técnica. El término "afinidad" como se usa en este documento se refiere a la tendencia de una molécula a asociarse con otra. La afinidad de un fármaco es su capacidad de unirse a su diana biológica (receptor, enzima, sistema de transporte, etc.). Para receptores farmacológicos, la afinidad puede entenderse como la frecuencia con la que el fármaco, cuando se pone en proximidad de un receptor por difusión, se alojará en una posición de mínima energía libre en el campo de fuerza de ese receptor.
El término "agonista" como se usa en este documento se refiere a una sustancia endógena o un fármaco que pueda interaccionar con un receptor e iniciar una respuesta fisiológica o farmacológica característica de ese receptor (contracción, relajación, secreción, activación enzimática, etc.). El término "análogo" como se usa en este documento se refiere a un fármaco o compuesto químico cuya estructura está relacionada de algún modo con la de otro fármaco o compuesto químico, pero cuyas propiedades químicas y biológicas pueden ser bastante diferentes. El término "antagonista" como se usa en este documento se refiere a un fármaco o compuesto que se opone a los efctos fisiológicos de otro. Al nivel del receptor, es una entidad química que se opone a las respuestas asociadas al receptor normalmente inducidas por otro agente bioactivo. La expresión "unidad asimétrica" se refiere al motivo básico, que se repite en el espacio 3-D por los operadores de simetría del grupo espacial cristalográfico, del que se determinan las coordenadas de la estructura. Es la parte más pequeña de la estructura cristalina de la que puede construirse la estructura completa usando la simetría del grupo espacial. Como se usa en este documento la expresión "sitio de unión" se refiere a una región específica (o átomo) en una entidad molecular que es capaz de entrar en una interacción estabilizante con otra entidad molecular.
En ciertas modalidades la expresión también se refiere a las partes reactivas de una macromolécula que participan directamente en su combinación específica con otra molécula. En otras modalidades, un sitio de unión puede estar comprendido o definido por la disposición tridimensional de uno o más restos aminoacídicos en un polipéptido plegado. En otras modalidades adicionales, el sitio de unión comprende adicionalmente grupos prostéticos, moléculas de agua o iones metálicos que pueden interaccionar con uno o más restos aminoacídicos. Los grupos prostéticos, moléculas de agua, o iones metálicos pueden ser evidentes a partir de los datos cristalográficos de rayos X, o pueden añadirse a una apo-proteína o enzima usando procedimientos ín silico. El término "bioactividad" se refiere a la actividad de DPP-IV que muestra una propiedad biológica convencionalmente asociada con un agonista o antagonista de DPP-IV, tal como una propiedad que permitiría el tratamiento de una o más de las diversas enfermedades tales como, por ejemplo, diabetes, tolerancia a la glucosa, obesidad, regulación del apetito, lipidemia, osteoporosis, metabolismo de neuropéptidos y activación de células T, entre otras. La expresión "dominio catalítico" como se usa en este documento, se refiere al dominio catalítico de la clase de enzimas DPP-IV, que presenta un segmento conservado de aminoácidos en la parte carboxi-terminal de las proteínas, donde este segmento ha demostrado incluir el sitio catalítico de estas enzimas. Este dominio catalítico conservado se extiende aproximadamente desde el resto 552 hasta 766 de la enzima de longitud completa de DPP-IV (SEC ID No. 1 ).
"Clonar" como se usa en este documento, significa obtener copias exactas de una molécula polinucleotídica dada usando tecnología de ADN recombinante. Además, "clonar en" puede significar insertar una primera secuencia polinucleotídica dada en una segunda secuencia polinucleotídica, preferiblemente de forma que se produzca una unidad funcional que combine las funciones del primer y segundo polinucleótidos. Por ejemplo, sin limitación, un polinucleótido del que puede proporcionarse por traducción una proteína de fusión, comprendiendo dicha proteína de fusión secuencias de aminoácidos codificadas por la primera y segunda secuencias polinucleotídicas. Pueden encontrarse memorias descriptivas de clonación molecular en varios libros de protocolo de laboratorio habitualmente usados tales como Molecular Cloning: A Laboratory Manual, 2a Ed., ed. por Sambrook, Fritsch y Maniatis (Cold Spring Harbor Laboratory Press: 1989). El término "co-cristalización" como se usa en este documento se entiende que significa cristalización de un complejo proteína/ligando preformado. Los términos "complejo" o "co-complejo" se usan de forma intercambiable y se refieren a una molécula de DPP-IV, o una variante, u homólogo de DPP-IV en asociación covalente o no covalente con un sustrato, ligando, inhibidor. La expresión "poner en contacto" como se usa en este documento se aplica a experimentos in silico, in vitro, y/o in vivo.
"Enfermedades" y particularmente "enfermedades que están asociadas con proteínas que se someten a procesamiento por DPP-IV", incluyen, aunque sin limitación, por ejemplo, diabetes de Tipo 2, diabetes de Tipo 1 , tolerancia alterada a la glucosa, hipergiucemia, síndrome metabólico (síndrome X y/o síndrome de resistencia a insulina), glucosuria, acidosis metabólica, artritis, cataratas, neuropatía diabética, nefropatía diabética, retinopatía diabética, cardiomiopatía diabética, obesidad, afecciones exacerbadas por obesidad, hipertensión, hiperlipidemia, aterosclerosis, osteoporosis, osteopenia, debilidad, pérdida de masa ósea, fractura ósea, síndrome coronario agudo, baja estatura debida a deficiencia en la hormona del crecimiento, infertilidad debida al síndrome de ovario poliquístico, ansiedad, depresión, insomnio, fatiga crónica, epilepsia, trastornos de la alimentación, dolor crónico, adicción al alcohol, enfermedades asociadas con la movilidad intestinal, úlceras, síndrome del intestino irritable, síndrome inflamatorio del intestino; síndrome de intestino corto; y la prevención de la progresión de la enfermedad en diabetes de Tipo 2. La expresión "dominio extracelular" como se usa en este documento, se refiere al dominio extracelular de DPP-IV, que presenta un segmento conservado de aminoácidos, por el que este segmento ha demostrado incluir sitios de glicosilación, una región rica en cisteína y el sitio activo catalítico. Este dominio extracelular conservado se extiende aproximadamente desde el resto Gly31 hasta Pro766 de la enzima de longitud completa (SEC ID No. 1 ).
Como se usa en este documento, las expresiones "gen", "gen recombinante" y "construcción génica" se refieren a un ácido nucleico que comprende una fase de lectura abierta que codifica un polipéptido, incluyendo secuencias tanto exónicas como (opcionalmente) intrónicas. El término "intrón" se refiere a una secuencia de ADN presente en un gen dado que no se traduce en una proteína y generalmente se encuentra entre exones. "DPP-IV humana" (hDPP-IV) es una glicoproteína de membrana de tipo II de la superficie celular y también se llama proteína de unión a adenosina desaminasa (ADA) o CD26, que se conoce como un antígeno de activación de células T. hDPP-IV es una única cadena polipeptídica de 766 aminoácidos, que está constituida por cinco regiones: una región citoplásmica (restos aproximadamente 1-6), una región transmembrana (restos aproximadamente 7-28), una región altamente glicosilada (restos aproximadamente 29-323), una región rica en cisteína (restos aproximadamente 324-551 ), y una región catalítica (restos aproximadamente 552-766) (Hiramatsu y col., (2003)). La expresión "alta afinidad" como se usa en este documento significa fuerte afinidad de unión entre moléculas con una constante de disociación KD de no más de 1 µM. En un caso preferido, la KD es de menos de 100 nM, 10 nM, 1 nM, 100 pM, o incluso 10 pM o menos. En una modalidad más preferida, las dos moléculas pueden estar unidas covalentemente (KD es esencialmente 0).
El término "homólogo" como se usa en este documento significa una proteína, polipéptido, oligopéptido, o parte de los mismos, que tiene preferiblemente al menos el 95% de identidad de secuencia de aminoácidos con la enzima DPP-IV descrita en la SEC ID No. 1 o SEC ID No. 2 o con cualquier dominio extracelular descrito en este documento, o con cualquier dominio funcional o estructural de proteína de unión a lípidos. La SEC ID No. 1 es la secuencia de aminoácidos de longitud completa de una DPP-IV humana de tipo silvestre, mientras que la SEC ID No. 2 es la construcción de hDPP-IV incluyendo los restos 31-766 que, como se describe en los Ejemplos, se purificó, expresó y cristalizó. Los especialistas en la técnica entienden que un conjunto de coordenadas estructurales determinadas por cristalografía de rayos X no está sin error típico. Como se usa en este documento, y para el propósito de esta invención, la expresión "coordenadas atómicas sustancialmente similares" o coordenadas atómicas que son "sustancialmente similares" se refiere a cualquier conjunto de coordenadas estructurales de DPP-IV u homólogos de DPP-IV, o variantes de DPP-IV, fragmentos polipeptídicos, descritos por las coordenadas atómicas que tienen una raíz de la desviación cuadrática media para las coordenadas atómicas de los átomos de la estructura proteica (N, Ca, C, y O) de menos de aproximadamente 2.5, 2.0, 1.5, 1.2, 1.0, 0.7, 0.5, o incluso 0.2 A cuando se superponen usando átomos de la estructura de coordenadas estructurales enumeradas en la figura 2. Para el propósito de esta invención, las estructuras que tienen coordenadas sustancialmente similares a las enumeradas en la figura 2 se considerarán idénticas a las coordenadas enumeradas en la figura 2. La expresión "sustancialmente similar" también se aplica a un ensamblaje de restos aminoacídicos que pueden formar o no una cadena polipeptídica contigua, pero cuya disposición tridimensional de coordenadas atómicas tiene una raíz de la desviación cuadrática media para las coordenadas atómicas de los átomos de la estructura proteica (N, Ca, C, y O), o los átomos de las cadenas laterales, de menos de aproximadamente 2.5, 2.0, 1.5, 1.2, 1.0, 0.7, 0.5 o incluso 0.2 A cuando se superponen usando los átomos de la estructura, o los átomos de las cadenas laterales de las coordenadas atómicas de aminoácidos similares o ¡guales de las coordenadas enumeradas en la figura 2. Los especialistas en la técnica entienden adicionalmente que las coordenadas enumeradas en la figura 2 o partes de las mismas pueden transformarse en un conjunto diferente de coordenadas usando diversos algoritmos matemáticos sin alejarse de la presente invención. Por ejemplo, las coordenadas enumeradas en la figura 2, o partes de las mismas, pueden transformarse por algoritmos que trasladan o rotan las coordenadas atómicas. Como alternativa, la mecánica molecular, la dinámica molecular o los algoritmos ab intio pueden modificar las coordenadas atómicas. Las coordenadas atómicas generadas a partir de las coordenadas enumeradas en la figura 2, o partes de las mismas, usando cualquiera de los algoritmos mencionados anteriormente se considerarán idénticas a las coordenadas enumeradas en la figura 2.
La expresión "in silico" como se usa en este documento se refiere a experimentos realizados usando simulaciones por ordenador. En una modalidad, los procedimientos in silico son procedimientos de modelado molecular donde se generan modelos tridimensionales de macromoléculas o ligandos. En otras modalidades, los procedimientos in silico comprenden evaluar computacionalmente las interacciones de unión a ligando. El término "ligando" describe cualquier molécula, por ejemplo, proteína, péptido, peptidomimético, oligopéptido, molécula orgánica pequeña, polisacárido, polinucleótido, etc., que se une o interacciona, generalmente pero no necesariamente específicamente a o con otra molécula. En un aspecto el ligando es un agonista, por el que la molécula regula positivamente (es decir, activa o estimula, por ejemplo, agonizando o potenciando) la actividad, mientras que en otro aspecto de la invención el ligando es un inhibidor o antagonista, por el que la molécula regula negativamente (es decir, inhibe o suprime, por ejemplo antagonizando, disminuyendo o inhibiendo) la actividad. El término "modular" como se usa en este documento se refiere tanto a regulación positiva (es decir, activación o estimulación, por ejemplo, agonizando o potenciando) como a regulación negativa (es decir, inhibición o supresión, por ejemplo, antagonizando, disminuyendo o inhibiendo) de una bioactividad. El término "farmacóforo" como se usa en este documento se refiere al conjunto de características estéricas y electrónicas de una estructura particular que es necesaria para asegurar las interacciones supramoleculares óptimas con una estructura diana biológica específica y para desencadenas (o bloquear) su respuesta biológica. En una modalidad, un farmacóforo es un concepto abstracto que explica las capacidades de interacción molecular comunes de un grupo de compuestos hacia su estructura diana. En una modalidad adicional más, el término puede considerarse como el mayor denominador común compartido por un conjunto de moléculas activas. Las descripciones farmacofóricas se usan para definir un farmacóforo, incluyendo sitios de formación de enlaces de H, sitios de interacción hidrófoba y electrostática, definidos por átomos, centros de anillo y puntos virtuales. Por consiguiente, en el contexto de ligandos enzimáticos, tales como por ejemplo agonistas o antagonistas, un farmacóforo puede representar un conjunto de factores estéricos y electrónicos que son necesarios para asegurar las interacciones supramoleculares con una estructura diana biológica específica. Como tal, un farmacóforo puede representar un molde de propiedades químicas para un sitio activo de una proteína/enzima que representa la relación espacial de estas propiedades entre sí que teóricamente define un ligando que se uniría a ese sitio. El término "precipitante" como se usa en este documento incluye cualquier sustancia que, cuando se añade a una solución, provoca que se forme un precipitado o crezcan cristales. Los ejemplos de precipitantes adecuados incluyen, aunque sin limitación, sales de metales alcalinos (por ejemplo, Li, Na, o K), o de metales alcalino-térreos (por ejemplo, Mg, o Ca), y sales de metales de transición (por ejemplo, Mn, o Zn). Los contraiones comunes a los iones metálicos incluyen, aunque sin limitación, haluros, fosfatos, citratos y sulfatos. El término "profármaco" como se usa en este documento se refiere a fármacos que, una vez administrados, se modifican químicamente por procesos metabólicos para llegar a ser farmacéuticamente activos. En ciertas modalidades el término también se refiere a cualquier compuesto que experimenta biotransformación antes de mostrar sus efectos farmacológicos. Los profármacos por tanto pueden verse como fármacos que contienen grupos protectores no tóxicos especializados usados de un modo transitorio para alterar o eliminar propiedades, habitualmente no deseables, en la molécula parental. El término "receptor" como se usa en este documento se refiere a una proteína o un complejo proteico en o sobre una célula que reconoce específicamente y se une a un compuesto que actúa como un mensajero molecular (neurotransmisor, hormona, linfoquina, lectina, fármaco, etc.). En un sentido más amplio, el término receptor se usa de forma intercambiable con cualquier sitio de unión a fármaco específico (en oposición a no específico, tal como la unión a proteínas plasmáticas), también incluyendo ácidos nucleicos tales como ADN. La expresión "proteína recombinante" se refiere a un polipéptido que se produce por técnicas de ADN recombinante, donde generalmente, se inserta ADN que codifica un polipéptido en un vector de expresión adecuado que, a su vez, se usa para transformar una célula huésped para producir el polipéptido codificado por el ADN. Este polipéptido puede ser uno que se exprese de forma natural por la célula huésped, o puede ser heterólogo para la célula huésped, o la célula huésped puede haberse modificado por ingeniería genética para que haya perdido la capacidad de expresar el polipéptido que de lo contrario se expresa en las formas de tipo silvestre de la célula huésped. El polipéptido también puede ser, por ejemplo, un polipéptido de fusión. Además, la expresión "obtenido de", con respecto a un gen recombinante, se entiende que incluye en el significado de "proteína recombinante" las proteínas que tienen una secuencia de aminoácidos de un polipéptido nativo, o una secuencia de aminoácidos similar a la misma que se genera por mutaciones, incluyendo sustituciones, deleciones y truncamiento, de una forma de origen natural del polipéptido. Como se usa en este documento, la expresión "inhibidor selectivo de DPP-IV" se refiere a una sustancia, tal como por ejemplo, una molécula orgánica, que inhibe de forma eficaz una enzima de la familia de DPP-IV en un grado mayor que cualquier otra enzima DPP. Un inhibidor selectivo de DPP-IV es una sustancia, que tiene una K¡ para la inhibición de DPP-IV que es menos de aproximadamente un medio, un quinto, o un décimo de la K¡ que tiene la sustancia para la inhibición de cualquier otra enzima DPP. En otras palabras, la sustancia inhibe la actividad DPP-IV al mismo grado a una concentración de aproximadamente un medio, un quinto, un décimo o menos que la concentración requerida para cualquier otra enzima DPP. En general una sustancia se considera que inhibe de forma eficaz DPP-IV si tiene una CI50 o K¡ de menos de o aproximadamente 10 mM, 1 mM, 500 nM, 100 nM, 50 nM o 10 nM. Como se usa en este documento la expresión "moléculas pequeñas" se refiere a fármacos que están disponibles por vía oral (a diferencia de las proteínas que se deben administrar por inyección, por vía tópica o inhalación). El tamaño de las moléculas pequeñas está generalmente por debajo de 1000 Dalton, pero muchos estiman que parece variar entre 300 y 700 Dalton. La expresión "grupo espacial" se refiere a la red y simetría del cristal. En una designación de grupo espacial la letra mayúscula indica el tipo de red y los demás símbolos representan las operaciones de simetría que pueden realizarse en los contenidos de la unidad asimétrica sin cambiar su aspecto. Por cantidad "terapéuticamente eficaz" se entiende la cantidad que es capaz de invertir y/o tratar al menos parcialmente los síntomas de la enfermedad. Una cantidad terapéuticamente eficaz puede determinarse en una base individual y se basará, al menos en parte, en una consideración de la especie del mamífero, el tamaño del mamífero, el tipo de sistema de suministro usado, y el tipo de administración con relación a la progresión de la enfermedad. Una cantidad terapéuticamente eficaz puede determinarse por un especialista en la técnica.
Como se usa en este documento, el término "transfección" significa la introducción de un ácido nucleico, por ejemplo, mediante un vector de expresión, en una célula receptora por una transferencia génica mediada por ácido nucleico. "Transformación" se refiere a un proceso en el que se cambia el genotipo de una célula como resultado de la captación celular de ADN o ARN exógeno y, por ejemplo, la célula transformada expresa una forma recombinante de un polipéptido o, en el caso de expresión anti-sentido a partir del gen transferido, se interrumpe la expresión de una forma de origen natural del polipéptido. El término "variantes" en relación a la secuencia polipeptídica de la SEC ID No. 1 o SEC ID No. 2 incluye cualquier sustitución de, variación de, modificación de, reemplazo de, deleción de, o adición de uno o más aminoácidos de o a la secuencia proporcionando una secuencia polipeptídica resultante para una enzima que tiene actividad DPP-IV. Preferiblemente la variante, homólogo, fragmento o parte, de la SEC ID No. 1 o SEC ID No. 2, comprende una secuencia polipeptídica de al menos 5 aminoácidos contiguos, preferiblemente al menos 10 aminoácidos contiguos, preferiblemente al menos 15 aminoácidos contiguos, preferiblemente al menos 20 aminoácidos contiguos, preferiblemente al menos 25 aminoácidos contiguos, o preferiblemente al menos 30 aminoácidos contiguos. El término "vector" se refiere a una molécula de ácido nucleico capaz de transportar otro ácido nucleico al que se ha unido. Un tipo preferido de vector es un episoma, es decir, un ácido nucleico capaz de replicación extra-cromosómica. Los sistemas de huésped-vector adecuados incluyen, aunque sin limitación, sistemas celulares de mamífero infectados con virus (por ejemplo, virus vaccinia, adenovirus, etc.); sistemas de células de insecto infectados con virus (por ejemplo, baculovirus); microorganismos tales como levaduras que contienen vectores de levaduras; o bacterias transformadas con bacteriófagos, ADN, ADN plasmídico, o ADN cósmido. Los elementos de expresión de los vectores varían en sus potencias y especificidades. Como aquéllos dependientes del sistema huésped-vector utilizado, puede usarse uno cualquiera de varios elementos de transcripción y traducción adecuados. Los vectores preferidos son aquéllos capaces de replicación autónoma y/o expresión de ácidos nucleicos a los que están unidos. Los vectores capaces de dirigir la expresión de genes a los que están unidos de manera operativa se mencionan como "vectores de expresión". En general, los vectores de expresión de utilidad en las técnicas de ADN recombinante a menudo están en forma de "plásmidos" que generalmente se refieren a bucles de ADN bicatenario circular que, en su forma de vector no están unidos al cromosoma. En la presente memoria descriptiva, "plásmido" y "vector" se usan de forma intercambiable ya que el plásmido es la forma más habitualmente usada de vector. Sin embargo, la invención pretende incluir otras formas de vectores de expresión que ofrecen funciones equivalentes y que han llegado a ser conocidas posteriormente hasta ahora. Las siguientes abreviaturas de aminoácidos se usan en toda esta descripción: A = Ala = Alanina T = Thr = Treonina V = Val = Valina C = Cys = Cisteína L = Leu = Leucina Y = Tyr = Tirosina I = lie = Isoleucina N = Asn = Asparagina P = Pro = Prolina Q = Gln = Glutamina F = Phe = Fenilalanina D = Asp = Ácido aspártico W = Trp = Triptófano E = Glu = Ácido glutámico M = Met = Metionina K = Lys = Lisina G = Gly = Glicina R = Arg = Arginina S = Ser = Serina H = His = Histidina
A. Clones y Expresiones Como apreciarán los especialistas en la técnica, la secuencia de nucleótidos que codifica un polipéptido DPP-IV, o un fragmento funcional, incluyendo el fragmento peptídico C-terminal del dominio catalítico de la proteína DPP-IV, y/o derivados o análogos de la misma, incluyendo una proteína quimérica, de la misma, puede insertarse en un vector de expresión adecuado, es decir, un vector que contiene los elementos necesarios para la transcripción y traducción de la secuencia que codifica la proteína insertada. Los elementos mencionados anteriormente se llaman en este documento un "promotor". Por tanto, el ácido nucleico que codifica un polipéptido DPP-IV de la invención o un fragmento funcional que comprende el dominio extracelular de la proteína DPP-IV, o un homólogo, un análogo, o variante del mismo, está asociado de forma operativa con un promotor en un vector de expresión de la invención. En modalidades preferidas, el vector de expresión contiene la secuencia de nucleótidos que codifica el polipéptido que comprende la secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. Las secuencias tanto de ADNc y como genómicas pueden clonarse y expresarse bajo el control de dichas secuencias reguladoras. Un vector de expresión también incluye preferiblemente un origen de replicación. Las señales de transcripción y traducción necesarias pueden proporcionarse en un vector de expresión recombinante. Como se detalla a continuación, todas las manipulaciones genéticas descritas para el gen de DPP-IV en esta sección, también pueden emplearse para genes que codifican un fragmento funcional, incluyendo el fragmento peptídico C-terminal del dominio catalítico de la proteína DPP-IV, derivados o análogos de la misma, incluyendo una proteína quimérica de la misma. Los sistemas huésped-vector adecuados incluyen aunque sin limitación sistemas de células de mamífero infectados con virus (por ejemplo, virus vaccinia, adenovirus, etc.); sistemas de células de insecto infectados con virus (por ejemplo, baculovirus); microorganismos tales como levaduras que contienen vectores de levaduras; o bacterias transformadas con bacteriófagos, ADN, ADN plasmídico, o ADN cósmido. Los elementos de expresión de los vectores varían en sus potencias y especificidades. Como aquéllos que dependen del sistema huésped-vector utilizado, puede usarse uno cualquiera de varios elementos de transcripción y traducción adecuados.
Una proteína DPP-IV recombinante de la invención puede expresarse cromosómicamente, después de la integración de la secuencia codificante por recombinación. En este aspecto, puede usarse cualquiera de varios sistemas de amplificación para conseguir altos niveles de expresión génica estable. (Véase Sambrook y col., 1989, infra). Una célula adecuada para los propósitos de esta invención es una en la que se cultiva el vector recombinante que comprende el ácido nucleico que codifica la proteína DPP-IV en un medio de cultivo celular apropiado en condiciones que proporcionan la expresión de la proteína DPP-IV por la célula. Cualquiera de los procedimientos descritos previamente para la inserción de fragmentos de ADN en un vector de clonación puede usarse para construir vectores de expresión que contienen un gen constituido por señales de control de la transcripción/traducción adecuadas y las secuencias que codifican la proteína. Estos procedimientos pueden incluir técnicas de ADN recombinante y sintéticas in vitro, y recombinación in vivo (recombinación genética). La expresión de la proteína DPP-IV puede controlarse por cualquier elemento promotor/potenciador conocido en la técnica, con la condición de que estos elementos reguladores deben ser funcionales en el huésped seleccionado para la expresión, como apreciarán los especialistas en la técnica.
Los vectores que contienen un ácido nucleico que codifica una proteína DPP-IV de la invención pueden identificarse, por ejemplo, por cuatro enfoques generales: (1 ) amplificación por PCR del ADN plasmídico deseado o ARNm específico; (2) hibridación de ácidos nucleicos; (3) presencia o ausencia de las funciones de genes marcadores de selección; y (4) expresión de secuencias insertadas. La invención pretende incluir adicionalmente otras formas de identificación de vectores, que contienen un ácido nucleico que codifica una proteína DPP-IV de la presente invención, que ofrecen funciones equivalentes y que llegan a ser conocidas en la técnica posteriormente hasta ahora. En el primer enfoque, los ácidos nucleicos pueden amplificarse por PCR para proporcionar la detección del producto amplificado. En el segundo enfoque, la presencia de un gen extraño insertado en un vector de expresión puede detectarse por hibridación de ácidos nucleicos usando sondas que comprenden secuencias que son homologas a un gen marcador insertado. En el tercer enfoque, el sistema vector recombinante/huésped puede identificarse y seleccionarse en base a la presencia o ausencia de ciertas funciones de un gen "marcador de selección" (por ejemplo, actividad beta-galactosidasa, actividad timidina quinasa, resistencia a antibióticos, fenotipo de transformación, formación de cuerpos de oclusión en baculovirus, etc.) causadas por la inserción de genes extraños en el vector. En otro ejemplo, si el ácido nucleico que codifica la proteína DPP-IV se inserta en la secuencia del gen "marcador de selección" del vector, los vectores recombinantes que contienen el inserto de la proteína DPP-IV pueden identificarse por la ausencia de la función del gen de la proteína DPP-IV. En el cuarto enfoque, los vectores de expresión recombinantes pueden identificarse ensayando la actividad, bioquímica, o características inmunológicas del producto génico expresado por el vector recombinante, con la condición de que la proteína expresada adquiera una conformación funcionalmente activa. Puede emplearse una amplia diversidad de combinaciones huésped/vector de expresión para expresar las secuencias de ADN de esta invención como saben los especialistas en la técnica. Una vez que la molécula de ADN recombinante particular se ha identificado y aislado, pueden usarse varios procedimientos conocidos en la técnica para propagarla. Una vez que se han establecido el sistema huésped y las condiciones de crecimiento adecuados, los vectores de expresión recombinantes pueden propagarse y prepararse en grandes cantidades. Como se ha indicado anteriormente, los vectores de expresión que pueden usarse incluyen, aunque sin limitación, los siguientes vectores o sus derivados: virus de seres humanos o animales tales como virus vaccinia o adenovirus; virus de insecto tales como baculovirus; vectores de levadura; vectores bacteriófagos (por ejemplo, lambda); y vectores de ADN plasmídico y cósmido, por nombrar algunos. Los vectores pueden introducirse en las células huésped deseadas por procedimientos conocidos en la técnica, por ejemplo, transfección, electroporación, microinyección, transducción, fusión celular, DEAE dextrano, precipitación con fosfato calcico, lipofección (fusión de lisosomas), uso de una pistola génica, o un transportador de vectores de ADN (véase, por ejemplo, Wu y col., 1992, J. Biol. Chem. 267:963-967; Wu y Wu, 1988, J. Biol. Chem. 263:14621-14624; Hartmut y col., Solicitud de Patente Canadiense No. 2,012,311 , presentada el 15 de marzo de 1990).
B. Grupos Cristalinos y Espaciales Las coordenadas estructurales de rayos X definen una configuración única de puntos en el espacio. Los especialistas en la técnica entienden que un conjunto de coordenadas estructurales para una proteína o un complejo proteína/ligando, o una parte de las mismas, define un conjunto relativo de puntos que, a su vez, define una configuración en tres dimensiones. Una configuración similar o idéntica puede definirse por un conjunto completamente diferente de coordenadas, con la condición de que las distancias y ángulos entre las coordenadas atómicas permanezcan esencialmente iguales. Además, una configuración que se puede ajustar a escala de puntos puede definirse aumentando o disminuyendo las distancias entre las coordenadas por un factor de escala manteniendo los ángulos esencialmente iguales. Un aspecto de la presente invención se refiere a una composición cristalina que comprende un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1.
En otra modalidad, el complejo cristalizado se caracteriza por las coordenadas estructurales enumeradas en la figura 2, o partes de las mismas. En otras modalidades adicionales, los átomos del ligando están en aproximadamente 5 angstrom de uno o más aminoácidos de DPP-IV en la SEC ID No. 1 preferiblemente seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740. Una modalidad del complejo cristalizado se caracteriza como perteneciente al grupo espacial P432-|2 y dimensiones de celda unitaria a=b= 68.7 A, c= 421 ,2 A, a=ß=?=90.0°. Esta modalidad está abarcada por las coordenadas estructurales de la figura 2. El ligando puede ser una molécula pequeña que se une al dominio extracelular de DPP-IV definido por la SEC ID No. 2, o partes de la misma, con una K¡ de menos de aproximadamente 10 mM, 1 mM, 500 nM, 100 nM, 50 nM, o 10 nM. Pueden usarse diversos procedimientos computacionales para determinar si una molécula o una parte de la cavidad de unión de la misma es "estructuralmente equivalente", definido en términos de su estructura tridimensional, a toda o parte de DPP-IV o de su cavidad o cavidades de unión. Dichos procedimientos pueden realizarse en aplicaciones de software actuales, tales como la aplicación de similitud molecular de QUANTA (Accelrys Inc., San Diego, Calif.). La aplicación de similitud molecular permite comparaciones entre diferentes estructuras, diferentes conformaciones de la misma estructura, y diferentes partes de la misma estructura. El procedimiento usado en la similitud molecular para comparar estructuras se divide en cuatro etapas: (1 ) cargar las estructuras a comparar; (2) opcionalmente definir las equivalencias atómicas en estas estructuras; (3) realizar una operación de ajuste; y (4) analizar los resultados. Cada estructura se define por un nombre. Una estructura se define como la diana (es decir, la estructura fijada), mientras que todas las estructuras restantes son estructuras de trabajo (es decir, estructuras de movimiento). Aunque la equivalencia atómica en las aplicaciones de similitud molecular se define por una entrada de usuario, para el propósito de esta invención los átomos equivalentes se definen como los átomos de la estructura proteica (N, Ca, C, y O) para todos los restos conservados entre las dos estructuras que se están comparando. Un resto conservado se define como un resto que es estructural o funcionalmente equivalente (véase cuadro 2 infra). En modalidades adicionales se consideran operaciones de ajuste rígido. En otras modalidades, pueden considerarse operaciones de ajuste flexible. Cuando se usa un procedimiento de ajuste rígido, la estructura de trabajo se traslada y se rota para obtener un ajuste óptimo con la estructura diana. La operación de ajuste usa un algoritmo que calcula el traslado y rotación óptimos a aplicar a la estructura de movimiento, de modo que la raíz de la desviación cuadrática media del ajuste sobre los pares especificados de átomos equivalentes sea un mínimo absoluto. Este número, dado en angstrom ( ), es proporcionado por la aplicación de similitud molecular.
Cualquier molécula o complejo molecular o cavidad de unión de la misma, o cualquier parte de la misma, que tenga una raíz de la desviación cuadrática media de átomos de la estructura de restos conservados (N, Ca, C, y O) de menos de aproximadamente 2.5, 2.0, 1.5 A, 1.0 A, 0.7 A, 0.5 A o incluso 0.2 A, cuando se superponen sobre los átomos de estructura relevantes descritos por las coordenadas estructurales de referencia enumeradas en la figura 2, se considera "estructuralmente equivalente" a la molécula de referencia. Es decir, las estructuras cristalinas de esas partes de las dos moléculas son sustancialmente idénticas, en un error aceptable. Las moléculas o complejos moleculares estructuralmente equivalentes particularmente preferidos son los que se definen por el conjunto completo de coordenadas estructurales enumeradas en la figura 2, más o menos una raíz de la desviación cuadrática media de los átomos de la estructura conservada de los aminoácidos de no más de 2.5 A. Más preferiblemente, la raíz de la desviación cuadrática media es de menos de aproximadamente 1.0 A. La expresión "raíz de la desviación cuadrática media" significa la raíz cuadrada de la media aritmética de los cuadrados de las desviaciones. Es un modo de expresar la desviación o variación respecto a una tendencia u objeto. Para los propósitos de esta invención, la "raíz de la desviación cuadrática media" define la variación en la estructura de una proteína respecto de la estructura de DPP-IV o una parte de la cavidad de unión de la misma, definida por las coordenadas estructurales de DPP-IV descritas en este documento.
Las coordenadas de rayos X refinadas del dominio extracelular de DPP-IV (aminoácidos 38 a 766 enumerados en la SEC ID No. 2), Zn2+, Mg2+, y 32 moléculas de agua son como las enumeradas en la figura 2. Se muestra una vista ortogonal de la molécula en la figura 1. La estructura cristalina del dominio extracelular (aminoácidos 31 - 766 de la SEC ID No. 1 ) se resolvió a una resolución de 2.7 A. La unidad asimétrica está compuesta de un dímero. En la estructura de la presente invención la estructura incluye dos dominios, el dominio de hélice ß (restos 55-497) y el dominio catalítico (restos 508-766), junto con un par de regiones de engarce (1-54 y 498-507). El dominio de hélice está plegado contra el dominio hidrolasa, y la tríada catalítica de DPP-IV compuesta de los restos Ser630, His740 y Asp708, que se localizan en los últimos 140 restos de la región C-terminal está en la superficie de contacto de los dos dominios. La presente invención proporciona una molécula o complejo molecular que incluye al menos una parte de una DPP-IV y/o cavidad de unión al sustrato. En una modalidad, la cavidad de unión de DPP-IV incluye los aminoácidos enumerados en el cuadro 1 , estando definida la cavidad de unión por un conjunto de puntos que tienen una raíz de la desviación cuadrática media de menos de aproximadamente 2.5, 2.0, 1.5, 1.2, 1.0, 0.7, 0.5 o incluso 0.2 A, respecto de los puntos que representan los átomos de la estructura de los aminoácidos del cuadro 1. En otra modalidad, la cavidad de unión al sustrato de DPP-IV incluye los aminoácidos seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740 de la SEC ID No. 1.
CUADRO 1 Restos identificados a 5 A de la cavidad de unión de la estructura cristalina de DPP-IV.
C. Polipéptidos Aislados y Variantes Una modalidad de la invención describe un polipéptido aislado constituido por una parte de DPP-IV que funciona como el sitio de unión cuando se pliega en una orientación 3D. Una modalidad es un polipéptido aislado que comprende una parte de DPP-IV, donde la parte empieza en aproximadamente el resto aminoacídico Gly31 , y acaba en aproximadamente el resto aminoacídico Pro766 como se describe en la SEC ID No. 1 , o una secuencia que es al menos el 95% o el 98% homologa a un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. Otra modalidad comprende composiciones cristalinas que comprenden variantes de DPP-IV. Las variantes de la presente invención pueden tener una secuencia de aminoácidos que es diferente en una o más sustituciones de aminoácidos a la secuencia descrita en la SEC ID No. 1 o SEC ID No. 2. También se proporcionan modalidades que comprenden deleciones y/o adiciones de aminoácidos. La variante puede, por ejemplo, tener cambios conservativos (similitud de aminoácidos), donde un aminoácido sustituido tiene propiedades estructurales o químicas similares, por ejemplo, el reemplazo de leucina con isoleucina. Los especialistas en la técnica entenderán que la determinación de cuál y cuántos restos aminoacídicos pueden sustituirse, insertarse, o delecionarse sin afectar de forma adversa a la actividad biológica o farmacológica puede deducirse razonablemente a la vista de esta descripción, y puede descubrirse adicionalmente usando programas de ordenador bien conocidos en la técnica, por ejemplo, el software DNAStar® (DNAStar Inc. Madison, Wl). Como los especialistas en la técnica apreciarán, las sustituciones de aminoácidos pueden hacerse, por ejemplo, en base a la similitud de polaridad, carga, solubilidad, hidrofobicidad, hidrofilicidad, y/o la naturaleza anfífila de los restos con la condición de que se mantenga una actividad biológica y/o farmacológica de la molécula nativa. Los aminoácidos cargados negativamente incluyen ácido aspártico y ácido glutámico; los aminoácidos cargados positivamente incluyen lisina y arginina; los aminoácidos con grupos de cabeza polares no cargados que tienen valores de hidrofilicidad incluyen leucina, isoleucina, y valina; los aminoácidos con grupos de cabeza alifáticos incluyen glicina, alanina;
asparagina, glutamina, serina; y los aminoácidos con cadenas laterales aromáticas incluyen treonina, fenilalanina, y tirosina. Se exponen ejemplos de sustituciones conservativas en el siguiente cuadro 2:
CUADRO 2
"Homología" es una medida de la identidad de las secuencias de nucleótidos o secuencias de aminoácidos. Para caracterizar la homología, se alinean las secuencias objeto de modo que se obtenga el porcentaje más alto de homología (coincidencia), después de introducir huecos, si fuera necesario, para conseguir el porcentaje máximo de homología. Las extensiones N o C- terminales no deben considerarse como que afecten a la homología. "Identidad" per se tiene un significado reconocido en la técnica y puede calcularse usando técnicas publicadas. Los procedimientos de programas de ordenador para determinar la identidad entre dos secuencias, por ejemplo, incluyen el software DNAStar®; el paquete de programas GCG® (Devereux, J., y col. Nucleic Acids Research (1984) 12(1 ): 387); BLASTP, BLASTN, FASTA (Atschul, S.F. y col., J. Molec Biol (1990) 215: 403). Homología (identidad) como se define en este documento se determina convencionalmente usando el programa de ordenador bien conocido, BESTFIT® (Wisconsin Sequence Analysis Package, Versión 8 para Unix, Genetics Computer Group, University Research Park, 575 Science Drive, Madison, Wl, 53711 ). Cuando se usa BESTFIT® o cualquier otro programa de alineamiento de secuencias (tal como el algoritmo Clustal del software MegAlign (DNAStar®)) para determinar si una secuencia particular es, por ejemplo, aproximadamente el 95% homologa a una secuencia de referencia, de acuerdo con la presente invención, los parámetros se establecen de modo que el porcentaje de identidad se calcule sobre la longitud completa de la secuencia de nucleótidos o secuencia de aminoácidos de referencia y que se permitan huecos en homología de hasta aproximadamente el 90% de la cantidad total de nucleótidos en la secuencia de referencia. Por lo tanto se determina una homología del noventa por ciento, por ejemplo, usando el programa BESTFIT® con parámetros establecidos de modo que el porcentaje de identidad se calcule sobre la longitud completa de la secuencia de referencia, por ejemplo, SEC ID No. 1 , y donde hasta el 5% de los aminoácidos en la secuencia de referencia pueden sustituirse con otro aminoácido. Los porcentajes de homología se determinan del mismo modo, por ejemplo, para identificar especies preferidas, en el alcance de conformidad con las reivindicaciones adjuntas, que residen en el intervalo de aproximadamente el 95% al 100% de homología con la SEC ID No. 1 así como el sitio de unión de las mismas. Como se ha indicado anteriormente, las extensiones N o C-terminales no deben considerarse como que afecten a la homología. Por tanto, cuando se comparan dos secuencias, la secuencia de referencia generalmente es la más corta de las dos secuencias. Esto significa que, por ejemplo, si se compara una secuencia de 50 nucleótidos de longitud con identidad precisa con una región de 50 nucleótidos en un polinucleótido de 100 nucleótidos, hay un 100% de homología en oposición a solamente un 50% de homología. Aunque el polipéptido natural de la SEC ID No. 1 y un polipéptido variante pueden tener sólo un cierto porcentaje de identidad, por ejemplo, el 95%, realmente probablemente tengan un grado mayor de similitud, dependiendo de la cantidad de codones diferentes que son cambios conservativos. Las sustituciones conservativas de aminoácidos frecuentemente se pueden hacer en una proteína sin alterar la conformación o función de la proteína. La similitud entre las dos secuencias incluye coincidencias directas así como un sustituto de aminoácido conservado que tiene propiedades estructurales o químicas similares, por ejemplo, carga similar como se describe en el cuadro 2. El porcentaje de similitud (sustituciones conservativas) entre dos polipéptidos también puede valorarse comparando las secuencias de aminoácidos de los dos polipéptidos usando programas bien conocidos en la técnica, incluyendo el programa BESTFIT, empleando ajustes por defecto para determinar la similitud. Una modalidad adicional de la invención es un cristal que comprende las coordenadas de la figura 2, donde la secuencia de aminoácidos está representada por la SEC ID No. 1. Una modalidad adicional de la invención es un cristal que comprende las coordenadas de la figura 2, donde la secuencia de aminoácidos es al menos el 95% o el 98% homologa a la secuencia de aminoácidos representada por la SEC ID No. 1. Se describen diversos procedimientos para obtener coordenadas atómicas de moléculas y complejos moleculares estructuralmente homólogos usando modelado de homología en, por ejemplo, la Patente de Estados Unidos No. 6,356,845.
D. Diseño de Fármacos Basado en la Estructura Una vez que se ha determinado la estructura tridimensional de un cristal que comprende una proteína DPP-IV, un dominio funcional de la misma, un homólogo, análogo o variante de la misma, puede examinarse un ligando (antagonista o agonista) a través del uso de modelado por ordenador usando un programa de acoplamiento tal como GRAM, DOCK, o AUTODOCK (véase por ejemplo, Morris y col., J. Computational Chemistry, 19:1639-1662 (1998)). Este procedimiento puede incluir el ajuste in silico de ligandos potenciales a la estructura cristalina de DPP-IV para determinar cómo de bien se complementarán o interferirán la forma y la estructura química del ligando potencial con el dominio catalítico de DPP-IV. (Bugg y col., Scientific American, diciembre: 92-98 (1993); West y col., TIPS, 16:67-74 (1995)). Como los especialistas en la técnica pueden apreciar, también pueden emplearse programas de ordenador para estimar la atracción, repulsión, e impedimento estérico del ligando con el sitio de unión. Generalmente cuanto más ajustado es el ajuste (por ejemplo, cuanto menor es el impedimento estérico, y/o mayor es la fuerza de atracción) más potente será el fármaco potencial ya que estas propiedades son coherentes con una constante de unión más ajustada. Además, cuanto mayor es la especificidad en el diseño de un fármaco potencial más probable será que el fármaco no interfiera con las propiedades de otras proteínas. Esto minimizará los efectos secundarios potenciales debidos a las interacciones no deseadas con otras proteínas. Una modalidad de la presente invención se refiere a procedimientos para identificar agentes que se unen a un sitio de unión en el dominio extracelular de DPP-IV donde el sitio de unión comprende los restos aminoacídicos Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740 de la SEC ID No. 1 , que comprende: poner en contacto DPP-IV con un ligando de ensayo en condiciones adecuadas para la unión del compuesto de ensayo al sitio de unión, y determinar si el ligando de ensayo se une en el sitio de unión, donde si sucede la unión, el ligando de ensayo es un agente que se une en el sitio de unión. En modalidades adicionales, el ensayo se puede realizar in silico usando una diversidad de algoritmos de software de modelado molecular incluyendo, aunque sin limitación, DOCK, ALADDIN, CHARMM simulations, AFFINITY, C2-LIGAND FIT, Catalyst, LUDÍ, CAVEAT, y CONCORD. (Brooks, y col. CHARMM: a program for macromolecular energy, minimization, and dynamics calculations. J Comp. Chem 1983, 4:187-217; E.C. Meng, B.K. Shoichet & I.D. Kuntz. Automated docking with grid-based energy evaluation. J Comp Chem 1992, 13:505-524. En otra modalidad, puede obtenerse un ligando potencial explorando una biblioteca de péptidos aleatorios producida por un bacteriófago recombinante (Scott y Smith, Science, 249:386-390 (1990); Cwirla y col., Proc. Nati. Acad. Sci., 87:6378-6382 (1990); Devlin y col., Science, 249:404-406 (1990)) o una biblioteca química, o similares. Un ligando seleccionado de esta manera después puede modificarse sistemáticamente por programas de modelado por ordenador hasta que se identifique uno o más ligandos potenciales prometedores. Dicho análisis, por ejemplo, ha demostrado ser eficaz en el desarrollo de inhibidores de la proteasa de VIH. (Lam y col., Science 263:380-384 (1994); Wlodawer y col., Ann. Rev. Biochem. 62:543-585 (1993); Appelt, Perspectives in Drug Discovery and Design 1 :23-48 (1993); Erickson, Perspectives in Drug Discovery and Design 1 : 109-128 ( 1993)). El modelado por ordenador permite la selección de una cantidad finita de modificaciones químicas racionales, en oposición a la cantidad incontable de modificaciones químicas esencialmente aleatorias que podrían hacerse, de las que una cualquiera podría conducir a un fármaco útil. Cada modificación química requiere etapas químicas adicionales, que aunque siendo razonables para la síntesis de una cantidad finita de compuestos, rápidamente llega a abrumar si realmente se sintetizan todas las posibles modificaciones que se necesitan sintetizar. Por tanto, a través del uso de la estructura tridimensional descrita en este documento y el modelado por ordenador, puede explorarse rápidamente una gran cantidad de estos compuestos en un pantalla de ordenador, y pueden determinarse unos pocos candidatos probables sin la síntesis laboriosa de cantidades incontables de compuestos. Una vez que un ligando potencial (agonista o antagonista) se ha identificado, puede seleccionarse de una biblioteca de compuestos químicos que están disponibles en el mercado en la mayoría de las compañías químicas grandes o, como alternativa, el ligando potencial puede sintetizarse de novo. Como se ha mencionado anteriormente, la síntesis de novo de uno o incluso un grupo relativamente pequeño de compuestos específicos es razonable en la técnica de diseño de fármacos. El ligando potencial puede colocarse en cualquier ensayo de unión convencional bien conocido para los especialistas en la técnica para ensayar su efecto sobre la actividad DPP-IV. Cuando se identifica un fármaco adecuado, puede hacerse crecer un cristal suplementarios que comprende un complejo proteína-ligando formado entre una proteína DPP-IV y el fármaco. Preferiblemente, el cristal difracta rayos X permitiendo la determinación de las coordenadas atómicas del complejo proteína-ligando a una resolución de menos de 5.0 Angstrom, más preferiblemente menos de 3.0 Angstrom, e incluso más preferiblemente menos de 2.0 Angstrom. La estructura tridimensional del cristal suplementario puede determinarse por Análisis de Reemplazo Molecular. El reemplazo molecular usa una estructura tridimensional conocida como un modelo de búsqueda para determinar la estructura de una molécula o complejo proteína-ligando estrechamente relacionado en una nueva forma cristalina. Las propiedades de difracción de rayos X medidas del nuevo cristal se comparan con la estructura del modelo de búsqueda para calcular la posición y orientación de la proteína en el nuevo cristal. Los programas de ordenador que pueden usarse incluyen: X-PLOR y AMORE (J. Navaza, Acta Crystallographics ASO, 157-163 (1994)). Como los especialistas en la técnica pueden apreciar, una vez que se conoce la posición y la orientación, puede calcularse un mapa de densidad electrónica usando el modelo de búsqueda para proporcionar fases de rayos X. Después de esto, se inspecciona la densidad electrónica para detectar las diferencias estructurales, y se modifica el modelo de búsqueda para conformar la nueva estructura. Usando este enfoque, es posible usar la estructura de DPP-IV reivindicada para resolver las estructuras tridimensionales de cualquiera de dichas DPP-IV complejadas con un ligando. Otros programas de ordenador adecuados que pueden usarse para resolver las estructuras de dichos cristales STAT incluyen: QUANTA; CHARMM; INSIGHT; SYBYL; MACROMODEL; e ICM. Se describen procedimientos in silico adecuados para explorar, diseñar o seleccionar ligandos, por ejemplo, en la Patente de Estados Unidos No. 6,356,845.
E. Liqandos En un aspecto, la presente invención describe agentes de unión que interaccionan con un sitio de unión de DPP-IV definido por un conjunto de puntos que tienen una raíz de la desviación cuadrática media de menos de aproximadamente 2.5, 2.0, 1.7, 1.5, 1.2, 1.0, 0.7, 0.5 o incluso 0.2 A respecto de los puntos que representan los átomos de la estructura de los aminoácidos representados por las coordenadas estructurales enumeradas en la figura 2. Dichas modalidades representan variantes del cristal de DPP-IV. En otro aspecto, la presente invención proporciona ligandos que se unen a un polipéptido plegado que comprende una secuencia de aminoácidos que abarca los aminoácidos 31 a 766 enumerados en la SEC ID No. 1 , o un homólogo o variante del mismo. En modalidades adicionales, el ligando es un inhibidor competitivo o no competitivo de DPP-IV. En otras modalidades adicionales el ligando inhibe DPP-IV con una Cl50 o K¡ de menos de aproximadamente 10 mM, 1 mM, 500 nM, 100 nM, 50 nM o 10 nM. En otras modalidades adicionales, el ligando inhibe DPP-IV con una K, que es de menos de aproximadamente un medio, un quinto, o un décimo la K, que la sustancia tiene para la inhibición de cualquier otra enzima DPP-IV. En otras palabras, la sustancia inhibe la actividad DPP-IV al mismo grado a una concentración de aproximadamente un medio, un quinto, un décimo o menos de la concentración requerida para cualquier otra enzima DPP. Una modalidad de la presente invención se refiere a ligandos, tales como proteínas, péptidos, peptidomiméticos, moléculas orgánicas pequeñas, etc., diseñados o desarrollados con referencia a la estructura cristalina de DPP-IV representada por las coordenadas presentadas en este documento en la figura 2, y partes de las mismas. Dichos agentes de unión interaccionan con el sitio de unión de DPP-IV representado por uno o más restos aminoacídicos seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740.
F. Medios de Almacenamiento Legibles por una Máquina La transformación de las coordenadas estructurales para toda o una parte de DPP-IV o una de sus cavidades de unión, para moléculas estructuralmente homologas definidas a continuación, o para los equivalentes estructurales de cualquiera de estas moléculas o complejos moleculares definidos anteriormente, en representaciones gráficas tridimensionales de la molécula o complejo puede conseguirse convenientemente a través del uso de un software disponible en el mercado. La invención por tanto proporciona adicionalmente un medio de almacenamiento legible en una máquina que comprende un material de almacenamiento de datos codificado con datos legibles en una máquina que, cuando se usa una máquina programada con instrucciones para usar dichos datos, es capaz de presentar una representación tridimensional gráfica de cualquiera de las moléculas o complejos moleculares de esta invención que se han descrito anteriormente. En una modalidad preferida, el medio de almacenamiento de datos legibles en una máquina comprende un material de almacenamiento de datos codificado con datos legibles en una máquina que, cuando se usa una máquina programada con instrucciones para usar dichos datos, es capaz de presentar una representación tridimensional gráfica de una molécula o complejo molecular que comprende todo o cualquier parte de una cavidad de unión de DPP-IV, como se ha definido anteriormente. En otra modalidad preferida, el medio de almacenamiento de datos legibles en una máquina es capaz de presentar una representación tridimensional gráfica de una molécula o complejo molecular definido por las coordenadas estructurales de los aminoácidos enumerados en la figura 2, más o menos una raíz de la desviación cuadrática media respecto de los átomos de la estructura de dichos aminoácidos de no más de 2.0 A. En una modalidad alternativa, el medio de almacenamiento de datos legibles en una máquina comprende un material de almacenamiento de datos codificado con un primer conjunto de datos legibles en una máquina que comprende la transformada de Fourier de las coordenadas estructurales expuestas en la figura 2, y que, cuando se usa una máquina programada con instrucciones para usar dichos datos, puede combinarse con un segundo conjunto de datos legibles en una máquina que comprende el patrón de difracción de rayos X de una molécula o complejo molecular para determinar al menos una parte de las coordenadas estructurales que corresponden al segundo conjunto de datos legibles en una máquina. Por ejemplo, un sistema para leer un medio de almacenamiento de datos puede incluir un ordenador que comprende una unidad de procesamiento central ("CPU"), una memoria de trabajo que puede ser, por ejemplo, memoria RAM (memoria de acceso aleatorio) o "núcleo", memoria de almacenamiento en masa (tal como uno o más accesos de disco o accesos de CD-ROM), uno o más dispositivos de pantalla (por ejemplo, pantallas de tubo de rayos catódicos ("CRT"), pantallas de diodo emisor de luz ("LED"), pantallas de cristal líquido ("LCD"), pantallas electroluminiscentes, pantallas fluorescentes de vacío, pantallas de emisión de campo ("FED"), pantallas de plasma, paneles de proyección, etc.), uno o más dispositivos de entrada de usuario (por ejemplo, teclados, micrófonos, ratones, pantallas táctiles, etc.), una o más líneas de entrada, y una o más líneas de salida, todo lo cual está interconectado por un sistema bus bidireccional convencional. El sistema puede ser un ordenador de un único puesto de trabajo, o puede estar en red (por ejemplo, a través de redes de área local, redes de área amplia, intranets, extranets, o internet) con otros sistemas (por ejemplo, ordenadores, anfitriones, servidores, etc.). El sistema también puede incluir dispositivos controlados por ordenador adicionales tales como componentes electrónicos para el consumidor y aplicaciones. El hardware de entrada puede acoplarse al ordenador por líneas de entrada y puede aplicarse de una diversidad de modos. Los datos legibles en una máquina de esta invención pueden introducirse mediante el uso de un módem o módems conectados por una línea telefónica o línea de datos especializada. Alternativa o adicionalmente, el hardware de entrada puede comprender accesos de CD-ROM o accesos de disco. Junto con un terminal de pantalla, también puede usarse un teclado como dispositivo de entrada. El hardware de salida puede acoplarse al ordenador por líneas de salida y puede aplicarse de forma similar por dispositivos convencionales. A modo de ejemplo, el hardware de salida puede incluir un dispositivo de pantalla para presentar una representación gráfica de una cavidad de unión de esta invención usando un programa tal como QUANTA como se ha descrito en este documento. El hardware de salida también puede incluir una impresora, de modo que pueda producirse una copia impresa de salida, o un acceso de disco, para almacenar la salida del sistema para su uso posterior. En funcionamiento, una CPU coordina el uso de los diversos dispositivos de entrada y salida, coordina los accesos a los datos de los dispositivos de almacenamiento en masa, los accesos a y desde la memoria de trabajo, y determina la secuencia de etapas de procesamiento de datos.
Pueden usarse varios programas para procesar los datos legibles en una máquina de esta invención. Dichos programas se analizan con referencia a los procedimientos computacionales de descubrimiento de fármacos descritos en este documento. Se incluyen referencias a los componentes del sistema de hardware según sea apropiado en toda la siguiente descripción del medio de almacenamiento de datos. Los dispositivos de almacenamiento legibles en una máquina útiles en la presente invención incluyen, aunque sin limitación, dispositivos magnéticos, dispositivos eléctricos, dispositivos ópticos, y combinaciones de los mismos. Los ejemplos de dichos dispositivos de almacenamiento de datos incluyen, aunque sin limitación, dispositivos de disco duro, dispositivos de CD, dispositivos de discos de video digitales, dispositivos de disco flexible, dispositivos de disco duro portátil, dispositivos de disco magneto-óptico, dispositivos de cinta magnética, dispositivos de memoria instantánea, dispositivos de memoria de burbuja, dispositivos de almacenamiento holográfico, y cualquier otro dispositivo periférico de almacenamiento en masa. Debe entenderse que estos dispositivos de almacenamiento incluyen el hardware necesario (por ejemplo, accesos, controladores, suministros de potencia, etc.) así como cualquier medio necesario (por ejemplo, discos, tarjetas instantáneas, etc.) para posibilitar el almacenamiento de datos.
G. Composiciones Farmacéuticas La presente invención proporciona procedimientos para tratar ciertas enfermedades en un mamífero, preferiblemente un ser humano, en necesidad de dicho tratamiento usando los ligandos, y preferiblemente los inhibidores, descritos en este documento. El ligando puede formularse ventajosamente en composiciones farmacéuticas que comprenden una cantidad terapéuticamente eficaz del ligando, un vehículo farmacéuticamente aceptable y otros ingredientes compatibles, tales como adyuvantes, adyuvante completo o incompleto de Freund, adecuados para formular dichas composiciones farmacéuticas como saben los especialistas en la técnica. Las composiciones farmacéuticas que contienen el ligando pueden usarse para el tratamiento de enfermedades que están asociadas con proteínas que se someten a procesamiento por DPP-IV, tales como diabetes de Tipo 2, diabetes de Tipo 1 , tolerancia alterada a la glucosa, hipergiucemia, síndrome metabólico (síndrome X y/o síndrome de resistencia a insulina), glucosuria, acidosis metabólica, artritis, cataratas, neuropatía diabética, nefropatía diabética, retinopatía diabética, cardiomiopatía diabética, obesidad, afecciones exacerbadas por obesidad, hipertensión, hiperlipidemia, aterosclerosis, osteoporosis, osteopenia, debilidad, pérdida de masa ósea, fractura ósea, síndrome coronario agudo, baja estatura debida a deficiencia en la hormona del crecimiento, infertilidad debida al síndrome de ovario poliquístico, ansiedad, depresión, insomnio, fatiga crónica, epilepsia, trastornos de la alimentación, dolor crónico, adicción al alcohol, enfermedades asociadas con la movilidad intestinal, úlceras, síndrome del intestino irritable, síndrome inflamatorio del intestino; síndrome de intestino corto; y la prevención de la progresión de la enfermedad en diabetes de Tipo 2. La composición farmacéutica se administra al mamífero en una cantidad terapéuticamente eficaz de modo que suceda el tratamiento de la enfermedad. La presente invención se ilustra adicionalmente por los siguientes ejemplos, que no deben entenderse como limitantes de ningún modo. Los contenidos de todas las referencias citadas (incluyendo referencias a la bibliografía, patentes, solicitudes de patente publicada citadas en toda esta solicitud) se incorporan expresamente por la presente como referencia en sus totalidades. La práctica de la presente invención empleará, a menos que se indique otra cosa, técnicas convencionales de biología celular, cultivo celular, biología molecular, microbiología y ADN recombinante, cristalografía por rayos X, y modelado molecular que están dentro de la experiencia habitual de la técnica. Como los especialistas en la técnica entenderán, dichas técnicas se explican completamente en la bibliografía. Véase, por ejemplo, Molecular Cloning: A Laboratory Manual, 2a Ed., ed. Por Sambrook, Fritsch y Maniatis (Cold Spring Harbor Laboratory Press: 1989); DNA Cloning, Volúmenes I y II (D. N. Glover ed., 1985); Oligonucleotide Synthesis (M. J. Gait ed., 1984); Mullís y col. Patente de Estados Unidos No. 4,683,195; Nucleic Acid Hybridization (B. D. Hames & S. J. Higgins eds. 1984); Transcription and Translation (B. D. Hames & S. J. Higgins eds. 1984); B. Perbal, A Practical Guide To Molecular Cloning (1984); el tratrado, Methods In Enzymology (Academic Press, Inc., N.Y.); Methods In Enzymology, Vols. 154 y 155 (Wu y col. eds.), Crystallography Made Clear: A Guide For Users Of Macromolecular Models (Gales Rhodes, 2a Ed. San Diego: Academic Press, 2000).
EJEMPLOS
EJEMPLO 1 Clonación y Expresión de DPP-IV humana en células de insecto Sf21
A. Construcción de hDPP-IV: Se amplificaron los restos 31 a 766 de DPP-IV de tipo silvestre de homo sapiens (ser humano) (SEC ID No. 1 ) por PCR usando los siguientes cebadores DPPIV-Fc31- BamF (5'- TTAAGGATCCTGGCACAGATGATGCTACAGCTGAC-3' (SEC ID No. 3)), que introducía un sitio Bam Hl en el extremo N-terminal, y DPPIV-ChisT-XhoR (5'-AATTCTCGAGTTACTAGTGATGATGGTGGTGATGG CTGCCGCGCGGCACCAGAGGTAAAGAGAAACATTGTTTTATGAAGTGGC-3' (SEC ID No. 4)), que introducía un marca His6, un sitio de escisión por trombina y un sitio Xho I en el extremo C-terminal. El producto de PCR (2208 pb) purificado en columna spin (Roche Applied Sciences Indianapolis, IN) se digirió con las enzimas de restricción Bam Hl y Xho I y se subclonó en un vector de transferencia de baculovirus tratado con las enzimas correspondientes. El vector contenía un promotor de polihedrina y la señal de secreción de melitina de abejas para la secreción eficaz de alto nivel de la proteína recombinante.
B. Producción de baculovirus recombinante Las etapas de clonación se controlaron por mapeado de endonucleasas de restricción y análisis de secuenciación. Se obtuvieron clones de E. coli con bácmido recombinante después de la transformación de células de E. coli DHIOBac (Invitrogen Corp., Frederick, MD) con 5 ng de la construcción final que codifica los restos 31-766 de hDPP-IV en pMCG243 (vector de transferencia de baculovirus) (ADN plasmídico de DPPIV-HBM31 -HT) y se exploraron las azules/blancas de acuerdo con el protocolo del fabricante (Invitrogen Corp.). Se transfectaron monocapas de células Sf9 (20 X 106 células en un matraz de cultivo de 162 cm2) cubriendo con 20 ml de mezcla de transfección que contenía 100 µl de ADN de bácmido mini-prep y 100 µl de reactivo CelIFECTIN (Gibco BRL Gaithersburg, MD) en Sf-900 II SFM. La mezcla de transfección se retiró después de 5 h de incubación (27°C) y las células se cubrieron con 25 ml de Sf-900 II SFM. El virus recombinante se recogió a las 72 h después de la transfección y se consiguió una amplificación adicional del virus infectando 100 ml de células Sf-9 (1 ,2 X 106 células/ml) con 2 ml del virus recombinante durante 65-72 h. Se prepararon soluciones madre de Células de Insecto Infectadas con Baculovirus (BMC) del siguiente modo; cuando el diámetro celular aumentó en 2-4 µm por encima de la medida inicial (habitualmente 65-72 h) y mientras la viabilidad celular aún era > 80%, las BMC se centrifugaron suavemente y se resuspendieron en un medio de congelación (90% de SF900 II, 1% p/v de BSA, 10% v/v de DMSO) a 1 X 107 células viables/ml. Las BIIC se congelaron como alícuotas de 1 ml usando procedimientos de crioconservación normales y se almacenaron a -70°C o en nitrógeno líquido para un almacenamiento de larga duración.
C. Expresión de DPP-IV recombinante Las etapas de clonación se controlaron por mapeado de endonucleasas de restricción y análisis de secuenciación. Se obtuvieron clones de E. coli con bácmido recombinante después de la transformación de células de E. coli DHI OBac (Invitrogen Corp., Frederick, MD) con 5 ng del ADN plasmídico de DPPIV-HBM31-HT y se exploraron las azules/blancas de acuerdo con el protocolo del fabricante (Invitrogen Corp.). Se transfectaron monocapas de células Sf9 (20 X 106 células en un matraz de cultivo de 162 cm2) cubriendo con 20 ml de mezcla de transfección que contenía 100 µl de ADN de bácmido mini-prep y 100 µl de reactivo CelIFECTIN (Gibco BRL Gaithersburg, MD) en Sf-900 II SFM. La mezcla de transfección se retiró después de 5 h de incubación (27°C) y las células se cubrieron con 25 ml de Sf-900 II SFM. El virus recombinante se recogió a las 72 h después de la transfección y se consiguió una amplificación adicional del virus infectando 100 ml de células Sf-9 (1 ,2 X 106 células/ml) con 2 ml del virus recombinante durante 65-72 h. Se prepararon soluciones madre de Células de Insecto Infectadas con Baculovirus (BIIC) del siguiente modo; cuando el diámetro celular aumentó en 2-4 µm por encima de la medida inicial (habitualmente 65-72 h) y mientras la viabilidad celular aún era > 80%, las BMC se centrifugaron suavemente y se resuspendieron en un medio de congelación (90% de SF900 II, 1% p/v de BSA, 10% v/v de DMSO) a 1 X 107 células viables/ml. Las BIIC se congelaron como alícuotas de 1 ml usando procedimientos de crioconservación normales y se almacenaron a -70°C o en nitrógeno líquido para un almacenamiento de larga duración.
EJEMPLO 2 Purificación del dominio extracelular de tipo silvestre de DPP-IV marcado con His6
Después del aclaramiento por centrifugación y filtración, se concentraron 10-20 veces 10 litros de medio de cultivo que contenía DPP-IV-31-766-C-his6 humana secretada usando una unidad de filtración de fibra hueca que se había lavado con Tampón de intercambio A (Tris 50 mM, NaCI 0.3 M, TCEP 1 mM, pH 8). El medio concentrado se intercambió con 5 volúmenes de Tampón A. Después del aclaramiento por filtración se añadió imidazol hasta concentración 10 mM por la adición de Tampón B (TrisCI 50 mM, NaCI 0.3 M, imidazol 0,25 M, TCEP 1 mM, pH 8). Se aplicó la muestra a una columna de afinidad de metal inmovilizado de 40 ml (Ni-NTA Superflow, Qiagen), que se había equilibrado en Tampón A (TrisCI 50 mM, NaCI 0.3 M, TCEP 1 mM, pH 8) a 6-8 ml/min. La columna se lavó con Tampón A para conseguir una línea basal estable a 280 nm. La proteína unida se eluyó a un caudal inferior en un gradiente lineal de 0 - 20% de B en 4 volúmenes de columna (cv) (5% de B / cv) seguido por una etapa hasta 100% de B, mantenida ¡socráticamente para 4 cv. Las fracciones se analizaron por SDS-PAGE en bis-tris al 4-12% en tampón MOPS usando el sistema NuPAGE (Invitrogen). Las fracciones que contenían DPP-IV se combinaron y dializaron a 4 grados C frente a 2 cambios de tampón de diálisis (TrisCI 50 mM, NaCI 0.1 M, TCEP 1 mM, pH 8). Después de la diálisis, la muestra se concentró a 6-10 mg/ml y se fraccionó por cromatografía de exclusión por tamaño en Superdex 200 prep grade HiLoad 16/60 (Amersham Biosciences). DPP-IV eluyó como un dímero aparente. Las fracciones se analizaron por SDS-PAGE en bis-tris al 4-12% en tampón MOPS usando el sistema NuPAGE (Invitrogen). La DPP-IV aislada de esta manera se usó para la cristalización.
EJEMPLO 3 Cristalización de DPP-IV
Se concentró la DPP-IV del Ejemplo 2 en tampón que contenía
TrisCI 50 mM, NaCI 25 mM, TCEP 1 mM, pH 8, a 8-10 mg/ml. Se obtuvieron cabezas de serie a través de una exploración en matriz dispersa a 22°C. Los cristales optimizados crecieron en gotas hechas de 1.5 µl de proteína + 1.5 µl de solución de reserva (TrisCI 0.1 M, pH 8.5, acetato sódico 0.2 M, PEG 4000 al 10-16%) equilibrando sobre la misma solución de reserva. Los cristales se transfirieron a una solución que contenía TrisCI 0.1 M, pH 8.5, acetato sódico 0.2 M, PEG 4000 al 14-16%, y etilenglicol al 20%. Los cristales se congelaron instantáneamente en nitrógeno gaseoso o líquido para la recogida de datos.
EJEMPLO 4 Recogida de datos de rayos X, determinación de la estructura y refinamiento de DPP-IV
Los cristales preparados en el Ejemplo 3 se transfirieron a un solución crioprotectora, constituida por la solución de reserva, con etilenglicol al 15-25%, y después se congelaron instantáneamente en una corriente de nitrógeno gaseoso frío a 100K. Se recogió un conjunto completo de datos de un cristal congelado de este modo en el Advanced Photon Sources de Argonne National Laboratory en un detector ADSC Quantum 210 CCD. Los datos se procesaron usando el juego de software HKL2000 (Otwinowski, Z. & Minor, W. Methods Enzymology 276, 307-326 (1997)). La estadística de los datos recogidos se resume en el cuadro 3A. Los cristales pertenecen al grupo espacial P432-|2 con dimensiones de celda unitaria a=b= 68.7 A, c= 421.2 A, a=ß=?= 90°. Contienen una molécula del polipéptido por unidad asimétrica.
La estructura se resolvió por el procedimiento de reemplazo molecular, usando el programa AMORE (Navaza, J., Acta Cryst, 157-163 (1994)). La mosaicidad del cristal es 0.6 A. Los datos son un 96.5% completos
a una resolución de 2.7 A con una R erge de 0.062 y una redundancia media de 4.4. El modelo final se construyó con reconstrucción manual en la pantalla
de gráficos, usando el programa XtalView (McRee, D. E., Practical Protein Crystallography, Academic Press, San Diego, 1993). El refinado en Refmac se realizó usando todos los datos en el intervalo de resolución de 50.0-2.7 A. El
factor R para el modelo actual es 0.257 (factor R libre, 5% de los datos, 0.340). La estadística del refinado se resume en el cuadro 3B. El modelo actual contiene los restos 38-766 (los otros están
desordenados en el cristal), 12 moléculas de azúcar y 32 moléculas de agua.
CUADRO 3A Estadística de los datos
1 Los números entre paréntesis se refieren al intervalo de resolución más alto (2.80-2.70 A) 2 Rsim = ?(l-<l>)/?<l> CUADRO 3B Estadística del Refinado
D R - = ?|| Fobs| - Ar|Fcalc||/S|Fobs|
Equivalentes Aunque se han analizado modalidades específicas de la presente invención, la anterior memoria descriptiva es ilustrativa y no restrictiva. Muchas variaciones de la invención serán evidentes para los especialistas en la técnica después de la revisión de esta memoria descriptiva. Las reivindicaciones adjuntas deben interpretarse como referencia a las reivindicaciones, junto con su alcance completo de equivalentes, y la memoria descriptiva, junto con dichas variaciones.
Claims (1)
- NOVEDAD DE LA INVENCIÓN REIVINDICACIONES 1.- Una composición cristalina del dominio extracelular de la dipeptidil peptidasa IV (DPP-IV) de mamífero, caracterizada porque comprende una molécula por unidad asimétrica del cristal. 2.- El cristal de conformidad con la reivindicación 1 , caracterizado además porque dicho dominio extracelular tiene una estructura tridimensional caracterizada por las coordenadas atómicas estructurales de la figura 2. 3.- Un cristal de DPP-IV, caracterizado porque comprende la SEC ID No. 2, o un homólogo, análogo o variante del mismo. 4.- Un cristal que tiene una molécula por unidad asimétrica, caracterizado porque comprende un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , o un homólogo, análogo o variante del mismo. 5.- El cristal de conformidad con la reivindicación 4, caracterizado además porque el homólogo o variante tiene una identidad de aminoácidos de al menos el 95% con un polipéptido que tiene una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1. 6.- El cristal de conformidad con la reivindicación 4 ó 5, caracterizado además porque el homólogo o variante del mismo tiene una estructura proteica que comprende las coordenadas atómicas, o partes de las mismas, que están dentro de una raíz de la desviación cuadrática media de menos de 2.5, 2.0, 1.5, 1.2, 1.0, 0.7, 0.5, o 0.2 A de las coordenadas atómicas, o partes de las mismas, enumeradas en la figura 2. 7 '.- Un polipéptido caracterizado porque comprende la secuencia de aminoácidos expuesta en la SEC ID No. 1 o un homólogo, o variante del mismo, en el que las moléculas están dispuestas de un modo cristalino en un grupo espacial de P432?2 para formar una celda unitaria de dimensiones a=b= 68.7 A, c= 421.2 A y que difracta los rayos X de forma eficaz para la determinación de las coordenadas atómicas del polipéptido DPP-IV a una resolución de aproximadamente 2.7 A. 8.- Un cristal de una molécula proteína-ligando o complejo molecular, caracterizado porque comprende: (a) a polipéptido con una secuencia de aminoácidos desde Asp38 a Pro766 enumerados en la SEC ID No. 1 , o un homólogo, o variante del mismo; (b) un ligando; (c) y el cristal difracta los rayos X de forma eficaz para la determinación de las coordenadas atómicas del complejo proteína-ligando a una resolución de más de 2.7 Angstrom. 9.- Un procedimiento para diseñar un compuesto que se una a DPP-IV que comprende la secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , o un homólogo, o variante de la misma usando un cristal como el que se reclama en la reivindicación 1 , caracterizado porque comprende seleccionar un compuesto realizando el diseño de fármacos basado en la estructura con las coordenadas atómicas determinadas para el cristal, donde dicha selección se realiza junto con modelado por ordenador. 10.- Un procedimiento para cristalizar una molécula polipeptídica de DPP-IV o complejo molecular, caracterizado porque comprende: (a) preparar una mezcla de una solución acuosa que comprende un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , o un homólogo, o una variante del mismo; (b) mezclar dicha solución acuosa con una solución de reserva que comprende un precipitante para formar un volumen mixto; y (c) cristalizar dicho volumen mixto. 11.- El procedimiento de conformidad con la reivindicación 10, caracterizado además porque la etapa (c) se realiza por cristalización por difusión por vapor, cristalización discontinua, cristalización por puente líquido, o cristalización por diálisis. 12.- Un ordenador para producir una representación tridimensional de un polipéptido con una secuencia de aminoácidos que abarca los aminoácidos Gly31 a Pro766 enumerados en la SEC ID No. 1 , o un homólogo, o una variante del mismo, caracterizado porque comprende: un medio de almacenamiento de datos legible en ordenador que comprende un material de almacenamiento de datos codificado con datos legibles en ordenador, en el que dichos datos comprenden las coordenadas estructurales de la figura 2, o partes de las mismas; una memoria de trabajo para almacenar instrucciones para procesar dichos datos legibles en el ordenador, una unidad de procesamiento central acoplada a dicha memoria de trabajo y a dicho medio de almacenamiento de datos legibles en el ordenador para procesar dichos datos legibles en el ordenador en dicha representación tridimensional; y una pantalla acoplada a dicha unidad de procesamiento central para presentar dicha representación. 13.- Un ordenador para producir una representación tridimensional de una molécula o complejo molecular que comprende las coordenadas atómicas que tienen una raíz de la desviación cuadrática media de menos de 2.5, 2.0, 1.7, 1.5, 1.2, 1.0, 0.7, 0.5, o 0.2 A de las coordenadas atómicas para los átomos de la estructura de carbono enumeradas en la figura 2, caracterizado porque comprende: un medio de almacenamiento de datos legibles en ordenador que comprende un material de almacenamiento de datos codificado con datos legibles en ordenador, en el que dichos datos comprenden las coordenadas estructurales de la figura 2, o partes de las mismas; una memoria de trabajo para almacenar instrucciones para procesar dichos datos legibles en el ordenador; una unidad de procesamiento central acoplada a dicha memoria de trabajo y a dicho medio de almacenamiento de datos legibles en el ordenador para procesar dichos datos legibles en el ordenador en dicha representación tridimensional; y una pantalla acoplada a dicha unidad de procesamiento central para presentar dicha representación. 14.- Un ordenador para producir una representación tridimensional de una molécula o complejo molecular que comprende: un sitio de unión definido por las coordenadas estructurales de la figura 2, o las coordenadas estructurales de una parte de los restos de la figura 2, o las coordenadas estructurales de uno o más aminoácidos de DPP-IV de la SEC ID No. 1 seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740, dicho ordenador caracterizado porque comprende; un medio de almacenamiento de datos legible en ordenador que comprende un material de almacenamiento de datos codificado con datos legibles en ordenador, en el que dichos datos comprenden las coordenadas estructurales de la figura 2, o partes de las mismas; una memoria de trabajo para almacenar instrucciones para procesar dichos datos legibles en el ordenador; una unidad de procesamiento central acoplada a dicha memoria de trabajo y a dicho medio de almacenamiento de datos legibles en el ordenador para procesar dichos datos legibles en el ordenador en dicha representación tridimensional; y una pantalla acoplada a dicha unidad de procesamiento central para presentar dicha representación. 15.- Un procedimiento para identificar ligandos potenciales para DPP-IV, u homólogos, análogos o variantes de la misma, caracterizado porque comprende: presentar la estructura tridimensional de la enzima DPP-IV, o partes de la misma, definida por las coordenadas atómicas de la figura 2, en una pantalla de ordenador; opcionalmente reemplazar uno o más restos aminoacídicos de la enzima DPP-IV enumerados en la SEC ID No. 1 , o uno o más de los aminoácidos enumerados en el cuadro 1 , o uno o más restos aminoacídicos seleccionados entre Glu205, Glu206, Tyr547, Ser630, Tyr631 , Tyr662, Tyr666, Asp708, Asn710 e His740, en dicha estructura tridimensional con un aminoácido de origen natural diferente o un aminoácido no natural; emplear dicha estructura tridimensional para diseñar o seleccionar dicho ligando; poner en contacto dicho ligando con DPP-IV, o variante de la misma, en presencia de uno o más sustratos; y medir la capacidad de dicho ligando para modular la actividad DPP-IV.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US57687704P | 2004-06-03 | 2004-06-03 | |
| PCT/IB2005/001630 WO2005119526A1 (en) | 2004-06-03 | 2005-05-26 | Crystal structure of dipeptidyl peptidase iv (dpp-iv) and uses thereof |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| MXPA06014083A true MXPA06014083A (es) | 2007-02-15 |
Family
ID=34969993
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| MXPA06014083A MXPA06014083A (es) | 2004-06-03 | 2005-05-26 | Estructura cristalina de dipeptidil peptidasa iv y usos de la misma. |
Country Status (4)
| Country | Link |
|---|---|
| EP (1) | EP1756740A1 (es) |
| CA (1) | CA2569095A1 (es) |
| MX (1) | MXPA06014083A (es) |
| WO (1) | WO2005119526A1 (es) |
Families Citing this family (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1852108A1 (en) | 2006-05-04 | 2007-11-07 | Boehringer Ingelheim Pharma GmbH & Co.KG | DPP IV inhibitor formulations |
| MX2008014024A (es) | 2006-05-04 | 2008-11-14 | Boehringer Ingelheim Int | Formas poliformas. |
| PE20080251A1 (es) | 2006-05-04 | 2008-04-25 | Boehringer Ingelheim Int | Usos de inhibidores de dpp iv |
| US20200155558A1 (en) | 2018-11-20 | 2020-05-21 | Boehringer Ingelheim International Gmbh | Treatment for diabetes in patients with insufficient glycemic control despite therapy with an oral antidiabetic drug |
| JP2012519187A (ja) * | 2009-02-27 | 2012-08-23 | トラスティーズ オブ タフツ カレッジ | ソフトプロテアーゼ阻害剤およびそのプロソフト型 |
| WO2011037793A1 (en) * | 2009-09-25 | 2011-03-31 | Merck Sharp & Dohme Corp. | Substituted aminopiperidines as dipeptidyl peptidase-iv inhibitors for the treatment of diabetes |
| EP2366394A1 (en) * | 2010-03-17 | 2011-09-21 | IMTM GmbH | Characterization and validation of inhibitors and ligands of dipeptidyl aminopeptidase IV (DP IV) |
| EP2571876B1 (en) | 2010-05-21 | 2016-09-07 | Merck Sharp & Dohme Corp. | Substituted seven-membered heterocyclic compounds as dipeptidyl peptidase-iv inhibitors for the treatment of diabetes |
| EP2600888A2 (en) * | 2010-08-03 | 2013-06-12 | Cadila Pharmaceuticals Ltd. | Novel compounds as dpp-iv inhibitors and process for preparation thereof |
| AR083878A1 (es) | 2010-11-15 | 2013-03-27 | Boehringer Ingelheim Int | Terapia antidiabetica vasoprotectora y cardioprotectora, linagliptina, metodo de tratamiento |
| WO2012170702A1 (en) | 2011-06-08 | 2012-12-13 | Arena Pharmaceuticals, Inc. | Modulators of the gpr119 receptor and the treatment of disorders related thereto |
| EP4151218A1 (en) | 2012-05-14 | 2023-03-22 | Boehringer Ingelheim International GmbH | Linagliptin, a xanthine derivative as dpp-4 inhibitor, for use in the treatment of sirs and/or sepsis |
| US10155000B2 (en) | 2016-06-10 | 2018-12-18 | Boehringer Ingelheim International Gmbh | Medical use of pharmaceutical combination or composition |
-
2005
- 2005-05-26 CA CA002569095A patent/CA2569095A1/en not_active Abandoned
- 2005-05-26 EP EP05744309A patent/EP1756740A1/en not_active Withdrawn
- 2005-05-26 MX MXPA06014083A patent/MXPA06014083A/es unknown
- 2005-05-26 WO PCT/IB2005/001630 patent/WO2005119526A1/en not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| WO2005119526A1 (en) | 2005-12-15 |
| CA2569095A1 (en) | 2005-12-15 |
| EP1756740A1 (en) | 2007-02-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20050075795A1 (en) | Crystal structure of 3', 5'-cyclic nucleotide phosphodiesterase (PDE1B) and uses thereof | |
| WO2005113762A1 (en) | CRYSTAL STRUCTURE OF PROTEIN KINASE B-α (AKT-1) AND USES THEREOF | |
| US20080215249A1 (en) | Crystallization and structure determination of beta secretase and/or beta secretase-like proteins | |
| Kusano et al. | Crystal structure of the human receptor activity‐modifying protein 1 extracellular domain | |
| MXPA06014083A (es) | Estructura cristalina de dipeptidil peptidasa iv y usos de la misma. | |
| US20040171019A1 (en) | PIN1 peptidyl-prolyl isomerase polypeptides, their crystal structures, and use thereof for drug design | |
| US20050202550A1 (en) | Crystal structure of 3', 5'-cyclic nucleotide phosphodiesterase (PDE10A) and uses thereof | |
| Carafoli et al. | Crystal structure of the β‐chain of human hepatocyte growth factor‐like/macrophage stimulating protein | |
| WO2011033322A2 (en) | Crystal structure | |
| EP1301536B1 (en) | Modulation of tetraspanin function | |
| EP1265927B1 (en) | Crystal | |
| US20050085626A1 (en) | Polo domain structure | |
| US20080064052A1 (en) | Crystal of a Receptor-Ligand Complex and methods of use | |
| AU781654B2 (en) | Crystallization and structure determination of staphylococcus aureus thymidylate kinase | |
| EP4004925B1 (en) | Method for generating variants of a protein | |
| JP2003502036A (ja) | カスパーゼ−8の結晶、モデルおよび方法 | |
| US20060234293A1 (en) | Polypeptide methods and means | |
| EP4367226A1 (en) | Crystal structures of alk and ltk receptor tyrosine kinases and their ligands | |
| US20080020984A1 (en) | Crystal Structure of a Receptor-Ligand Complex and Methods of Use | |
| EP1393235A1 (en) | Crystallized human xenobiotic nuclear receptor pxr/sxr ligand binding domain polypeptide and screening methods employing same | |
| WO2004092217A1 (en) | Crystal structure of vegfrkd: ligand complexes and methods of use thereof | |
| MXPA06009940A (es) | Estructura cristalina de fosfodiesterasa del nucleotido 3´, 5´-ciclico (pde10a) y usos de la misma | |
| US20050131209A1 (en) | Crystallized hnf4 gamma ligand binding domain polypeptide and screening methods employing same | |
| WO2005103241A1 (en) | Crystal structure of 3', 5'-cyclic nucleotide phosphodiesterase 9a (pde9a) and uses thereof | |
| WO2005119525A1 (en) | 11βHSD1 CRYSTAL STRUCTURES FOR STRUCTURE BASED DRUG DESIGN |