PT1651166E - Polipeptidos para indução de uma resposta imunitária de protecção contra staphylococcus aureus - Google Patents
Polipeptidos para indução de uma resposta imunitária de protecção contra staphylococcus aureus Download PDFInfo
- Publication number
- PT1651166E PT1651166E PT04778847T PT04778847T PT1651166E PT 1651166 E PT1651166 E PT 1651166E PT 04778847 T PT04778847 T PT 04778847T PT 04778847 T PT04778847 T PT 04778847T PT 1651166 E PT1651166 E PT 1651166E
- Authority
- PT
- Portugal
- Prior art keywords
- lys
- thr
- glu
- ala
- ser
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 196
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 191
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 188
- 230000001681 protective effect Effects 0.000 title claims abstract description 44
- 230000028993 immune response Effects 0.000 title claims abstract description 22
- 230000001939 inductive effect Effects 0.000 title claims description 10
- 241000191967 Staphylococcus aureus Species 0.000 title description 3
- 230000014509 gene expression Effects 0.000 claims abstract description 107
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract 11
- 108090000623 proteins and genes Proteins 0.000 claims description 148
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 113
- 108020004705 Codon Proteins 0.000 claims description 107
- 150000001413 amino acids Chemical class 0.000 claims description 98
- 210000004027 cell Anatomy 0.000 claims description 61
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 51
- 150000007523 nucleic acids Chemical class 0.000 claims description 50
- 238000000034 method Methods 0.000 claims description 41
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 41
- 239000012634 fragment Substances 0.000 claims description 40
- 230000036039 immunity Effects 0.000 claims description 38
- 208000015181 infectious disease Diseases 0.000 claims description 38
- 108020004707 nucleic acids Proteins 0.000 claims description 34
- 102000039446 nucleic acids Human genes 0.000 claims description 34
- 230000002163 immunogen Effects 0.000 claims description 30
- 210000002421 cell wall Anatomy 0.000 claims description 20
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 19
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 18
- 230000002458 infectious effect Effects 0.000 claims description 15
- 238000000746 purification Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 13
- 239000002671 adjuvant Substances 0.000 claims description 12
- 239000002773 nucleotide Substances 0.000 claims description 12
- 125000003729 nucleotide group Chemical group 0.000 claims description 12
- 239000000203 mixture Substances 0.000 claims description 11
- 241000191940 Staphylococcus Species 0.000 claims description 8
- 239000013604 expression vector Substances 0.000 claims description 8
- 238000002360 preparation method Methods 0.000 claims description 8
- 230000001413 cellular effect Effects 0.000 claims description 5
- 239000003937 drug carrier Substances 0.000 claims description 4
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 239000003814 drug Substances 0.000 claims description 2
- 230000012010 growth Effects 0.000 claims description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 252
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 121
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 119
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 108
- 235000018102 proteins Nutrition 0.000 description 101
- 102000004169 proteins and genes Human genes 0.000 description 101
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 77
- 235000001014 amino acid Nutrition 0.000 description 76
- 229940024606 amino acid Drugs 0.000 description 72
- 241000588724 Escherichia coli Species 0.000 description 62
- 239000002609 medium Substances 0.000 description 59
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 47
- 108010009298 lysylglutamic acid Proteins 0.000 description 46
- 229960004452 methionine Drugs 0.000 description 45
- 108010049041 glutamylalanine Proteins 0.000 description 44
- 229930182817 methionine Natural products 0.000 description 43
- 239000000499 gel Substances 0.000 description 41
- 108010003700 lysyl aspartic acid Proteins 0.000 description 40
- 108010054155 lysyllysine Proteins 0.000 description 39
- 239000013592 cell lysate Substances 0.000 description 38
- 108010073969 valyllysine Proteins 0.000 description 38
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 36
- 238000004519 manufacturing process Methods 0.000 description 36
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 33
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 32
- 239000013598 vector Substances 0.000 description 31
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 30
- 238000005457 optimization Methods 0.000 description 29
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 28
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 28
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 27
- 108020004414 DNA Proteins 0.000 description 26
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 26
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 26
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 26
- 239000013612 plasmid Substances 0.000 description 26
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 25
- 238000001262 western blot Methods 0.000 description 25
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 24
- 108010092854 aspartyllysine Proteins 0.000 description 24
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 23
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 23
- 238000000855 fermentation Methods 0.000 description 23
- 230000004151 fermentation Effects 0.000 description 23
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 22
- 108010068265 aspartyltyrosine Proteins 0.000 description 22
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 21
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 21
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 21
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 21
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 21
- 108010015792 glycyllysine Proteins 0.000 description 21
- 108010057821 leucylproline Proteins 0.000 description 21
- 241000880493 Leptailurus serval Species 0.000 description 20
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 20
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 20
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 20
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 19
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 19
- 108091028043 Nucleic acid sequence Proteins 0.000 description 19
- 206010041925 Staphylococcal infections Diseases 0.000 description 19
- 108010089804 glycyl-threonine Proteins 0.000 description 19
- 208000015688 methicillin-resistant staphylococcus aureus infectious disease Diseases 0.000 description 19
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 18
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 18
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 18
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 18
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 18
- 108010005233 alanylglutamic acid Proteins 0.000 description 18
- 108010062796 arginyllysine Proteins 0.000 description 18
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 17
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 17
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 17
- 239000000975 dye Substances 0.000 description 17
- 239000002054 inoculum Substances 0.000 description 17
- 239000000047 product Substances 0.000 description 17
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 16
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 16
- 108091026890 Coding region Proteins 0.000 description 16
- KCIKTPHTEYBXMG-BVSLBCMMSA-N Phe-Trp-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCIKTPHTEYBXMG-BVSLBCMMSA-N 0.000 description 16
- 108010087924 alanylproline Proteins 0.000 description 16
- 238000002474 experimental method Methods 0.000 description 16
- 239000006166 lysate Substances 0.000 description 16
- 230000002441 reversible effect Effects 0.000 description 16
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 15
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 15
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 15
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 15
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 15
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 15
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 15
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 15
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 15
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 15
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 15
- 108010013835 arginine glutamate Proteins 0.000 description 15
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 15
- 229930027917 kanamycin Natural products 0.000 description 15
- 229960000318 kanamycin Drugs 0.000 description 15
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 15
- 229930182823 kanamycin A Natural products 0.000 description 15
- 108010061238 threonyl-glycine Proteins 0.000 description 15
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 14
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 14
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 14
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 14
- 241000699670 Mus sp. Species 0.000 description 14
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 14
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 14
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 14
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 14
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 14
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 14
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 14
- 210000004369 blood Anatomy 0.000 description 14
- 239000008280 blood Substances 0.000 description 14
- 238000010186 staining Methods 0.000 description 14
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 13
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 13
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 13
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 13
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 13
- 239000004471 Glycine Substances 0.000 description 13
- 101150009006 HIS3 gene Proteins 0.000 description 13
- 108010065920 Insulin Lispro Proteins 0.000 description 13
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 13
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 13
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 13
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 13
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 13
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 13
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 13
- 108010038633 aspartylglutamate Proteins 0.000 description 13
- 108010047857 aspartylglycine Proteins 0.000 description 13
- 230000003834 intracellular effect Effects 0.000 description 13
- 229960005486 vaccine Drugs 0.000 description 13
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 12
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 12
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 12
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 12
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 12
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 12
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 12
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 12
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 12
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 12
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 12
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 12
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 12
- MCNGIXXCMJAURZ-VEVYYDQMSA-N Met-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCSC)N)O MCNGIXXCMJAURZ-VEVYYDQMSA-N 0.000 description 12
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 12
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 12
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 12
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 12
- 108010034529 leucyl-lysine Proteins 0.000 description 12
- 239000000523 sample Substances 0.000 description 12
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 12
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 11
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 11
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 11
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 11
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 11
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 11
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 11
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 11
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 11
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 11
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 11
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 11
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 11
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 11
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 11
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 11
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 11
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 11
- SBMNPABNWKXNBJ-BQBZGAKWSA-N Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO SBMNPABNWKXNBJ-BQBZGAKWSA-N 0.000 description 11
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 11
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 11
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 11
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 11
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 11
- 239000000872 buffer Substances 0.000 description 11
- 239000008103 glucose Substances 0.000 description 11
- 239000000600 sorbitol Substances 0.000 description 11
- 210000005253 yeast cell Anatomy 0.000 description 11
- 229920001817 Agar Polymers 0.000 description 10
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 10
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 10
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 10
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 10
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 10
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 10
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 10
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 description 10
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 10
- 241001465754 Metazoa Species 0.000 description 10
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 10
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 10
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 10
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 10
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 10
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 10
- YKRQRPFODDJQTC-CSMHCCOUSA-N Thr-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN YKRQRPFODDJQTC-CSMHCCOUSA-N 0.000 description 10
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 10
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 10
- 239000008272 agar Substances 0.000 description 10
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 10
- 230000001965 increasing effect Effects 0.000 description 10
- 239000006228 supernatant Substances 0.000 description 10
- 239000000725 suspension Substances 0.000 description 10
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 9
- AXAVXPMQTGXXJZ-UHFFFAOYSA-N 2-aminoacetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound NCC(O)=O.OCC(N)(CO)CO AXAVXPMQTGXXJZ-UHFFFAOYSA-N 0.000 description 9
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 9
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 9
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 9
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 9
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 9
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 9
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 9
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 9
- IPSDPDAOSAEWCN-RHYQMDGZSA-N Lys-Met-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IPSDPDAOSAEWCN-RHYQMDGZSA-N 0.000 description 9
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 9
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 9
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 9
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 9
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 9
- KRCPXGSWDOGHAM-XIRDDKMYSA-N Trp-Lys-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O KRCPXGSWDOGHAM-XIRDDKMYSA-N 0.000 description 9
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- 238000011282 treatment Methods 0.000 description 9
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 8
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 8
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 8
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 8
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 8
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 8
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 8
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 8
- ICZWAZVKLACMKR-CIUDSAMLSA-N Asp-His-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 ICZWAZVKLACMKR-CIUDSAMLSA-N 0.000 description 8
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 8
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 8
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 8
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 8
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 8
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 8
- 239000006137 Luria-Bertani broth Substances 0.000 description 8
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 8
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 8
- 101150075484 MNN9 gene Proteins 0.000 description 8
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 8
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 8
- FSXRLASFHBWESK-HOTGVXAUSA-N Phe-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 FSXRLASFHBWESK-HOTGVXAUSA-N 0.000 description 8
- NHHZWPNMYQUNEH-ACRUOGEOSA-N Phe-Tyr-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N NHHZWPNMYQUNEH-ACRUOGEOSA-N 0.000 description 8
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 8
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 8
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 8
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 8
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 8
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 8
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 8
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 8
- 229960002885 histidine Drugs 0.000 description 8
- 230000003053 immunization Effects 0.000 description 8
- 238000002649 immunization Methods 0.000 description 8
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 8
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 7
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 7
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 7
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 7
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 7
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 7
- NTQDELBZOMWXRS-IWGUZYHVSA-N Asp-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O NTQDELBZOMWXRS-IWGUZYHVSA-N 0.000 description 7
- 241000283707 Capra Species 0.000 description 7
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 7
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 7
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 7
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 7
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 7
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 7
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 7
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 7
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 7
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 7
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 7
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 7
- RYJRPPUATSKNAY-STECZYCISA-N Pro-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@@H]2CCCN2 RYJRPPUATSKNAY-STECZYCISA-N 0.000 description 7
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 7
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 7
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 7
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 7
- UDNVOQMPQBEITB-MEYUZBJRSA-N Thr-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UDNVOQMPQBEITB-MEYUZBJRSA-N 0.000 description 7
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 7
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 7
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 7
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 7
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 7
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 7
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 7
- 238000010171 animal model Methods 0.000 description 7
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 7
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 7
- 210000004899 c-terminal region Anatomy 0.000 description 7
- 238000010367 cloning Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 230000003248 secreting effect Effects 0.000 description 7
- 239000007787 solid Substances 0.000 description 7
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 7
- 108010051110 tyrosyl-lysine Proteins 0.000 description 7
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 6
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 6
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 6
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 6
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 6
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 6
- LIQNMKIBMPEOOP-IHRRRGAJSA-N Asp-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)O)N LIQNMKIBMPEOOP-IHRRRGAJSA-N 0.000 description 6
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 6
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 6
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 6
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 6
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 6
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 6
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 6
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 6
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 6
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 6
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 6
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 6
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 6
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 6
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 6
- LDEBVRIURYMKQS-WISUUJSJSA-N Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO LDEBVRIURYMKQS-WISUUJSJSA-N 0.000 description 6
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 6
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 6
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 6
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 6
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 108010060035 arginylproline Proteins 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 229930182830 galactose Natural products 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 108010017391 lysylvaline Proteins 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 108010056582 methionylglutamic acid Proteins 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 108010053725 prolylvaline Proteins 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 238000004448 titration Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 5
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 5
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 5
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 5
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 5
- KWBQPGIYEZKDEG-FSPLSTOPSA-N Asn-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O KWBQPGIYEZKDEG-FSPLSTOPSA-N 0.000 description 5
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 5
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 5
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 5
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 5
- 102100028501 Galanin peptides Human genes 0.000 description 5
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 5
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 5
- GUOWMVFLAJNPDY-CIUDSAMLSA-N Glu-Ser-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GUOWMVFLAJNPDY-CIUDSAMLSA-N 0.000 description 5
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 5
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 5
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 5
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 5
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 5
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 5
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 5
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 5
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 5
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 5
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 5
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 5
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 5
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 5
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 5
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 5
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 5
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 5
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 5
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 5
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 5
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 5
- 206010057190 Respiratory tract infections Diseases 0.000 description 5
- RZEQTVHJZCIUBT-WDSKDSINSA-N Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-WDSKDSINSA-N 0.000 description 5
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 5
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 5
- 108091081024 Start codon Proteins 0.000 description 5
- 101150006914 TRP1 gene Proteins 0.000 description 5
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 5
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 5
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 5
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 5
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 5
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 5
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 5
- MVHHTXAUJCIOMZ-WDSOQIARSA-N Trp-Arg-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N MVHHTXAUJCIOMZ-WDSOQIARSA-N 0.000 description 5
- TZXFLDNBYYGLKA-BZSNNMDCSA-N Tyr-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 TZXFLDNBYYGLKA-BZSNNMDCSA-N 0.000 description 5
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 5
- KHUVIWRRFMPVHD-JYJNAYRXSA-N Tyr-Met-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O KHUVIWRRFMPVHD-JYJNAYRXSA-N 0.000 description 5
- LVILBTSHPTWDGE-PMVMPFDFSA-N Tyr-Trp-Lys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CC=C(O)C=C1 LVILBTSHPTWDGE-PMVMPFDFSA-N 0.000 description 5
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 5
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 5
- 208000027418 Wounds and injury Diseases 0.000 description 5
- 238000005119 centrifugation Methods 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- 239000013256 coordination polymer Substances 0.000 description 5
- 230000006378 damage Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 5
- 208000014674 injury Diseases 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 108010024607 phenylalanylalanine Proteins 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 229940035893 uracil Drugs 0.000 description 5
- WQZGKKKJIJFFOK-SVZMEOIVSA-N (+)-Galactose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-SVZMEOIVSA-N 0.000 description 4
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 4
- QXRNAOYBCYVZCD-BQBZGAKWSA-N Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN QXRNAOYBCYVZCD-BQBZGAKWSA-N 0.000 description 4
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 4
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 4
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 4
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 4
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 4
- VBKIFHUVGLOJKT-FKZODXBYSA-N Asn-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)N)O VBKIFHUVGLOJKT-FKZODXBYSA-N 0.000 description 4
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 4
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 4
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 4
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 4
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 4
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 4
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 102100039556 Galectin-4 Human genes 0.000 description 4
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 4
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 4
- SNFUTDLOCQQRQD-ZKWXMUAHSA-N Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SNFUTDLOCQQRQD-ZKWXMUAHSA-N 0.000 description 4
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 4
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 4
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 4
- PUFNQIPSRXVLQJ-IHRRRGAJSA-N His-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N PUFNQIPSRXVLQJ-IHRRRGAJSA-N 0.000 description 4
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 4
- DMSVBUWGDLYNLC-IAVJCBSLSA-N Ile-Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DMSVBUWGDLYNLC-IAVJCBSLSA-N 0.000 description 4
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 4
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 4
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 4
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 4
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 4
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 4
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 4
- FMIIKPHLJKUXGE-GUBZILKMSA-N Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN FMIIKPHLJKUXGE-GUBZILKMSA-N 0.000 description 4
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 4
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 4
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 4
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 4
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 4
- 239000004472 Lysine Substances 0.000 description 4
- 241000282560 Macaca mulatta Species 0.000 description 4
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 4
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 239000002033 PVDF binder Substances 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 4
- OKQQWSNUSQURLI-JYJNAYRXSA-N Phe-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N OKQQWSNUSQURLI-JYJNAYRXSA-N 0.000 description 4
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 4
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 4
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 4
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 4
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 4
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 4
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 4
- 238000002105 Southern blotting Methods 0.000 description 4
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 4
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 4
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 4
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 4
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 4
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 4
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 4
- OSXNCKRGMSHWSQ-ACRUOGEOSA-N Tyr-His-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OSXNCKRGMSHWSQ-ACRUOGEOSA-N 0.000 description 4
- RIFVTNDKUMSSMN-ULQDDVLXSA-N Tyr-His-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O RIFVTNDKUMSSMN-ULQDDVLXSA-N 0.000 description 4
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 4
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 4
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 4
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 4
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 4
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 4
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 4
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 4
- 108010070783 alanyltyrosine Proteins 0.000 description 4
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 4
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 4
- 235000011130 ammonium sulphate Nutrition 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 235000009697 arginine Nutrition 0.000 description 4
- AGOYDEPGAOXOCK-KCBOHYOISA-N clarithromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@](C)([C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)OC)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 AGOYDEPGAOXOCK-KCBOHYOISA-N 0.000 description 4
- 238000012258 culturing Methods 0.000 description 4
- 230000034994 death Effects 0.000 description 4
- 231100000517 death Toxicity 0.000 description 4
- 238000001962 electrophoresis Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000001502 gel electrophoresis Methods 0.000 description 4
- 150000004676 glycans Chemical class 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 239000002953 phosphate buffered saline Substances 0.000 description 4
- 229920001282 polysaccharide Polymers 0.000 description 4
- 239000005017 polysaccharide Substances 0.000 description 4
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 238000000751 protein extraction Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 3
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 3
- 102100030310 5,6-dihydroxyindole-2-carboxylic acid oxidase Human genes 0.000 description 3
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 3
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 3
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 3
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 3
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 3
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 3
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 3
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 3
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 3
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 3
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 3
- QJMCHPGWFZZRID-BQBZGAKWSA-N Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O QJMCHPGWFZZRID-BQBZGAKWSA-N 0.000 description 3
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 3
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 3
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 3
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 3
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 208000035473 Communicable disease Diseases 0.000 description 3
- 238000001712 DNA sequencing Methods 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 108010001496 Galectin 2 Proteins 0.000 description 3
- 102100021735 Galectin-2 Human genes 0.000 description 3
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 3
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 3
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 3
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 3
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 3
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 3
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 3
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 3
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 3
- KYFGGRHWLFZXPU-KKUMJFAQSA-N His-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N KYFGGRHWLFZXPU-KKUMJFAQSA-N 0.000 description 3
- DLTCGJZBNFOWFL-LKTVYLICSA-N His-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N DLTCGJZBNFOWFL-LKTVYLICSA-N 0.000 description 3
- UWBDLNOCIDGPQE-GUBZILKMSA-N Ile-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN UWBDLNOCIDGPQE-GUBZILKMSA-N 0.000 description 3
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- FSBIGDSBMBYOPN-VKHMYHEASA-N L-canavanine Chemical compound OC(=O)[C@@H](N)CCONC(N)=N FSBIGDSBMBYOPN-VKHMYHEASA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 3
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 3
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 3
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 3
- IGRMTQMIDNDFAA-UWVGGRQHSA-N Lys-His Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IGRMTQMIDNDFAA-UWVGGRQHSA-N 0.000 description 3
- 239000007993 MOPS buffer Substances 0.000 description 3
- CKAVKDJBSNTJDB-SRVKXCTJSA-N Met-Val-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCSC CKAVKDJBSNTJDB-SRVKXCTJSA-N 0.000 description 3
- RJQXTJLFIWVMTO-TYNCELHUSA-N Methicillin Chemical compound COC1=CC=CC(OC)=C1C(=O)N[C@@H]1C(=O)N2[C@@H](C(O)=O)C(C)(C)S[C@@H]21 RJQXTJLFIWVMTO-TYNCELHUSA-N 0.000 description 3
- FSBIGDSBMBYOPN-UHFFFAOYSA-N O-guanidino-DL-homoserine Natural products OC(=O)C(N)CCON=C(N)N FSBIGDSBMBYOPN-UHFFFAOYSA-N 0.000 description 3
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 3
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 3
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 3
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 3
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 3
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 3
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 3
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 3
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 3
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 3
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 3
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 3
- 241000295644 Staphylococcaceae Species 0.000 description 3
- 229930006000 Sucrose Natural products 0.000 description 3
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 3
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 3
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 3
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 3
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 3
- PJWCWGXAVIVXQC-STECZYCISA-N Tyr-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PJWCWGXAVIVXQC-STECZYCISA-N 0.000 description 3
- VNYDHJARLHNEGA-RYUDHWBXSA-N Tyr-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 3
- 101150050575 URA3 gene Proteins 0.000 description 3
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 3
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 3
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 3
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 3
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 229940047712 aluminum hydroxyphosphate Drugs 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 108010036533 arginylvaline Proteins 0.000 description 3
- 239000001045 blue dye Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 238000003306 harvesting Methods 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 210000000987 immune system Anatomy 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000012139 lysis buffer Substances 0.000 description 3
- 229960003085 meticillin Drugs 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 3
- 229920000053 polysorbate 80 Polymers 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 108010077112 prolyl-proline Proteins 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 238000011321 prophylaxis Methods 0.000 description 3
- 235000019419 proteases Nutrition 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 238000001542 size-exclusion chromatography Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 239000005720 sucrose Substances 0.000 description 3
- 230000000153 supplemental effect Effects 0.000 description 3
- -1 t-butyloxycarbonyl groups Chemical group 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 239000006150 trypticase soy agar Substances 0.000 description 3
- 229960004441 tyrosine Drugs 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- 238000002255 vaccination Methods 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- QDGAVODICPCDMU-UHFFFAOYSA-N 2-amino-3-[3-[bis(2-chloroethyl)amino]phenyl]propanoic acid Chemical compound OC(=O)C(N)CC1=CC=CC(N(CCCl)CCCl)=C1 QDGAVODICPCDMU-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 2
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 2
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 2
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 2
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 2
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 2
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 2
- ALZVPLKYDKJKQU-XVKPBYJWSA-N Ala-Tyr Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ALZVPLKYDKJKQU-XVKPBYJWSA-N 0.000 description 2
- SOTXLXCVCZAKFI-FXQIFTODSA-N Ala-Val-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O SOTXLXCVCZAKFI-FXQIFTODSA-N 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- QYLJIYOGHRGUIH-CIUDSAMLSA-N Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N QYLJIYOGHRGUIH-CIUDSAMLSA-N 0.000 description 2
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 2
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 2
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 2
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 2
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 2
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 2
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 2
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 2
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 2
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 2
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 2
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 2
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 102100029516 Basic salivary proline-rich protein 1 Human genes 0.000 description 2
- 101100163949 Caenorhabditis elegans asp-3 gene Proteins 0.000 description 2
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 230000005526 G1 to G0 transition Effects 0.000 description 2
- 101150038242 GAL10 gene Proteins 0.000 description 2
- 102100024637 Galectin-10 Human genes 0.000 description 2
- MPZWMIIOPAPAKE-BQBZGAKWSA-N Glu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MPZWMIIOPAPAKE-BQBZGAKWSA-N 0.000 description 2
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 2
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 2
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 2
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 2
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 2
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 2
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 2
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- WYKXJGWSJUULSL-AVGNSLFASA-N His-Val-Arg Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O WYKXJGWSJUULSL-AVGNSLFASA-N 0.000 description 2
- 101001125486 Homo sapiens Basic salivary proline-rich protein 1 Proteins 0.000 description 2
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 2
- WKXVAXOSIPTXEC-HAFWLYHUSA-N Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O WKXVAXOSIPTXEC-HAFWLYHUSA-N 0.000 description 2
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 2
- MUFXDFWAJSPHIQ-XDTLVQLUSA-N Ile-Tyr Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 MUFXDFWAJSPHIQ-XDTLVQLUSA-N 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- 108010002350 Interleukin-2 Proteins 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 235000019766 L-Lysine Nutrition 0.000 description 2
- FFEARJCKVFRZRR-UHFFFAOYSA-N L-Methionine Natural products CSCCC(N)C(O)=O FFEARJCKVFRZRR-UHFFFAOYSA-N 0.000 description 2
- QLROSWPKSBORFJ-BQBZGAKWSA-N L-Prolyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 2
- 229930182844 L-isoleucine Natural products 0.000 description 2
- 229930195722 L-methionine Natural products 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical group CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 2
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 2
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 2
- KVNLHIXLLZBAFQ-RWMBFGLXSA-N Lys-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N KVNLHIXLLZBAFQ-RWMBFGLXSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 2
- RNAGAJXCSPDPRK-KKUMJFAQSA-N Met-Glu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 RNAGAJXCSPDPRK-KKUMJFAQSA-N 0.000 description 2
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 2
- JKXVPNCSAMWUEJ-GUBZILKMSA-N Met-Met-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O JKXVPNCSAMWUEJ-GUBZILKMSA-N 0.000 description 2
- UDOYVQQKQHZYMB-DCAQKATOSA-N Met-Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDOYVQQKQHZYMB-DCAQKATOSA-N 0.000 description 2
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 2
- NTNWOCRCBQPEKQ-YFKPBYRVSA-N N(omega)-methyl-L-arginine Chemical compound CN=C(N)NCCC[C@H](N)C(O)=O NTNWOCRCBQPEKQ-YFKPBYRVSA-N 0.000 description 2
- 230000004988 N-glycosylation Effects 0.000 description 2
- 101100494726 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) pep-4 gene Proteins 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- 230000004989 O-glycosylation Effects 0.000 description 2
- 101150107982 ORF0 gene Proteins 0.000 description 2
- 101150101314 PRB1 gene Proteins 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- JMCOUWKXLXDERB-WMZOPIPTSA-N Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 JMCOUWKXLXDERB-WMZOPIPTSA-N 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 2
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 2
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 2
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 2
- UIUWGMRJTWHIJZ-ULQDDVLXSA-N Pro-Tyr-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O UIUWGMRJTWHIJZ-ULQDDVLXSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- 239000012506 Sephacryl® Substances 0.000 description 2
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 2
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 2
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 2
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 2
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-N Succinic acid Natural products OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 2
- 208000033809 Suppuration Diseases 0.000 description 2
- 102400000368 Surface protein Human genes 0.000 description 2
- 108020005038 Terminator Codon Proteins 0.000 description 2
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 2
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 2
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 2
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 2
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- KSVMDJJCYKIXTK-IGNZVWTISA-N Tyr-Ala-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 KSVMDJJCYKIXTK-IGNZVWTISA-N 0.000 description 2
- ONWMQORSVZYVNH-UWVGGRQHSA-N Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ONWMQORSVZYVNH-UWVGGRQHSA-N 0.000 description 2
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 2
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 2
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 2
- SOEGLGLDSUHWTI-STECZYCISA-N Tyr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 SOEGLGLDSUHWTI-STECZYCISA-N 0.000 description 2
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 2
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 2
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 2
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 2
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 230000005875 antibody response Effects 0.000 description 2
- 210000000612 antigen-presenting cell Anatomy 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- KDYFGRWQOYBRFD-NUQCWPJISA-N butanedioic acid Chemical compound O[14C](=O)CC[14C](O)=O KDYFGRWQOYBRFD-NUQCWPJISA-N 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 239000002775 capsule Substances 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 229920002301 cellulose acetate Polymers 0.000 description 2
- 239000007857 degradation product Substances 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000000994 depressogenic effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000008121 dextrose Substances 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 2
- 239000012153 distilled water Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 239000012510 hollow fiber Substances 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000003119 immunoblot Methods 0.000 description 2
- 239000007943 implant Substances 0.000 description 2
- 239000003999 initiator Substances 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- 101150057984 isdB gene Proteins 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 235000018977 lysine Nutrition 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 125000006239 protecting group Chemical group 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- IFGCUJZIWBUILZ-UHFFFAOYSA-N sodium 2-[[2-[[hydroxy-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyphosphoryl]amino]-4-methylpentanoyl]amino]-3-(1H-indol-3-yl)propanoic acid Chemical compound [Na+].C=1NC2=CC=CC=C2C=1CC(C(O)=O)NC(=O)C(CC(C)C)NP(O)(=O)OC1OC(C)C(O)C(O)C1O IFGCUJZIWBUILZ-UHFFFAOYSA-N 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 229960004799 tryptophan Drugs 0.000 description 2
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 230000002792 vascular Effects 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- 125000004080 3-carboxypropanoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C(O[H])=O 0.000 description 1
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- NJWJSLCQEDMGNC-MBLNEYKQSA-N Ala-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N)O NJWJSLCQEDMGNC-MBLNEYKQSA-N 0.000 description 1
- ZSOICJZJSRWNHX-ACZMJKKPSA-N Ala-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)[C@H](C)[NH3+] ZSOICJZJSRWNHX-ACZMJKKPSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 1
- FSHURBQASBLAPO-WDSKDSINSA-N Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)N FSHURBQASBLAPO-WDSKDSINSA-N 0.000 description 1
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 1
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 1
- 101100001210 Arabidopsis thaliana AGT3 gene Proteins 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 1
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 1
- 208000021421 Arm injury Diseases 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- SJUXYGVRSGTPMC-IMJSIDKUSA-N Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O SJUXYGVRSGTPMC-IMJSIDKUSA-N 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- DVUFTQLHHHJEMK-IMJSIDKUSA-N Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O DVUFTQLHHHJEMK-IMJSIDKUSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 1
- VGRHZPNRCLAHQA-IMJSIDKUSA-N Asp-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O VGRHZPNRCLAHQA-IMJSIDKUSA-N 0.000 description 1
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- XSXVLWBWIPKUSN-UHFFFAOYSA-N Asp-Leu-Glu-Asp Chemical compound OC(=O)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(O)=O)C(O)=O XSXVLWBWIPKUSN-UHFFFAOYSA-N 0.000 description 1
- LKVKODXGSAFOFY-VEVYYDQMSA-N Asp-Met-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LKVKODXGSAFOFY-VEVYYDQMSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- HTSSXFASOUSJQG-IHPCNDPISA-N Asp-Tyr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HTSSXFASOUSJQG-IHPCNDPISA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 208000031729 Bacteremia Diseases 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 206010006563 Bullous impetigo Diseases 0.000 description 1
- 101100275473 Caenorhabditis elegans ctc-3 gene Proteins 0.000 description 1
- 101100177348 Caenorhabditis elegans heh-1 gene Proteins 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 101100289888 Caenorhabditis elegans lys-5 gene Proteins 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- 101001007681 Candida albicans (strain WO-1) Kexin Proteins 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 206010007247 Carbuncle Diseases 0.000 description 1
- 206010057248 Cell death Diseases 0.000 description 1
- 206010007882 Cellulitis Diseases 0.000 description 1
- 241000252505 Characidae Species 0.000 description 1
- 102000009016 Cholera Toxin Human genes 0.000 description 1
- 108010049048 Cholera Toxin Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 101710196256 Collagen adhesin Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- QUSNBJAOOMFDIB-UHFFFAOYSA-N Ethylamine Chemical group CCN QUSNBJAOOMFDIB-UHFFFAOYSA-N 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 206010016936 Folliculitis Diseases 0.000 description 1
- 208000025516 Forearm injury Diseases 0.000 description 1
- 101150094690 GAL1 gene Proteins 0.000 description 1
- 102100039555 Galectin-7 Human genes 0.000 description 1
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- SXGAGTVDWKQYCX-BQBZGAKWSA-N Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SXGAGTVDWKQYCX-BQBZGAKWSA-N 0.000 description 1
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 1
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 241000125500 Hedypnois rhagadioloides Species 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- BKOVCRUIXDIWFV-IXOXFDKPSA-N His-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 BKOVCRUIXDIWFV-IXOXFDKPSA-N 0.000 description 1
- XMAUFHMAAVTODF-STQMWFEESA-N His-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XMAUFHMAAVTODF-STQMWFEESA-N 0.000 description 1
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 1
- WRPDZHJNLYNFFT-GEVIPFJHSA-N His-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O WRPDZHJNLYNFFT-GEVIPFJHSA-N 0.000 description 1
- 102100024594 Histone-lysine N-methyltransferase PRDM16 Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 1
- 101000608772 Homo sapiens Galectin-7 Proteins 0.000 description 1
- 101000686942 Homo sapiens Histone-lysine N-methyltransferase PRDM16 Proteins 0.000 description 1
- 101000632319 Homo sapiens Septin-7 Proteins 0.000 description 1
- 101000637726 Homo sapiens Toll/interleukin-1 receptor domain-containing adapter protein Proteins 0.000 description 1
- 101150017040 I gene Proteins 0.000 description 1
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- JWBXCSQZLLIOCI-GUBZILKMSA-N Ile-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C JWBXCSQZLLIOCI-GUBZILKMSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- XDUVMJCBYUKNFJ-MXAVVETBSA-N Ile-Lys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N XDUVMJCBYUKNFJ-MXAVVETBSA-N 0.000 description 1
- WMDZARSFSMZOQO-DRZSPHRISA-N Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WMDZARSFSMZOQO-DRZSPHRISA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- KLJKJVXDHVUMMZ-KKPKCPPISA-N Ile-Phe-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N KLJKJVXDHVUMMZ-KKPKCPPISA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 206010021531 Impetigo Diseases 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000013462 Interleukin-12 Human genes 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 244000285963 Kluyveromyces fragilis Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 240000006024 Lactobacillus plantarum Species 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- 241000283953 Lagomorpha Species 0.000 description 1
- 208000018982 Leg injury Diseases 0.000 description 1
- 101100533567 Leptosphaeria maculans sirH gene Proteins 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- 206010061225 Limb injury Diseases 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- BTSXLXFPMZXVPR-DLOVCJGASA-N Lys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BTSXLXFPMZXVPR-DLOVCJGASA-N 0.000 description 1
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical group [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- NQOQDINRVQCAKD-ULQDDVLXSA-N Lys-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N NQOQDINRVQCAKD-ULQDDVLXSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 108090000988 Lysostaphin Proteins 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- QTZXSYBVOSXBEJ-WDSKDSINSA-N Met-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O QTZXSYBVOSXBEJ-WDSKDSINSA-N 0.000 description 1
- ZYTPOUNUXRBYGW-YUMQZZPRSA-N Met-Met Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCSC ZYTPOUNUXRBYGW-YUMQZZPRSA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- MSFSPUZXLOGKHJ-UHFFFAOYSA-N Muraminsaeure Natural products OC(=O)C(C)OC1C(N)C(O)OC(CO)C1O MSFSPUZXLOGKHJ-UHFFFAOYSA-N 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- MDSUKZSLOATHMH-UHFFFAOYSA-N N-L-leucyl-L-valine Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(O)=O MDSUKZSLOATHMH-UHFFFAOYSA-N 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 206010031252 Osteomyelitis Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108010013639 Peptidoglycan Proteins 0.000 description 1
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 1
- MIDZLCFIAINOQN-WPRPVWTQSA-N Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 MIDZLCFIAINOQN-WPRPVWTQSA-N 0.000 description 1
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 1
- XXAOSEUPEMQJOF-KKUMJFAQSA-N Phe-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XXAOSEUPEMQJOF-KKUMJFAQSA-N 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 1
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 1
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 1
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 1
- OCYROESYHWUPBP-CIUDSAMLSA-N Pro-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 OCYROESYHWUPBP-CIUDSAMLSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- AWJGUZSYVIVZGP-YUMQZZPRSA-N Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 AWJGUZSYVIVZGP-YUMQZZPRSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101100408135 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) phnA gene Proteins 0.000 description 1
- 241000220010 Rhode Species 0.000 description 1
- 208000021326 Ritter disease Diseases 0.000 description 1
- 101150014136 SUC2 gene Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 206010040070 Septic Shock Diseases 0.000 description 1
- 102100027981 Septin-7 Human genes 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 1
- QSHKTZVJGDVFEW-GUBZILKMSA-N Ser-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N QSHKTZVJGDVFEW-GUBZILKMSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 1
- 108010034546 Serratia marcescens nuclease Proteins 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 206010041929 Staphylococcal scalded skin syndrome Diseases 0.000 description 1
- 241000344863 Staphylococcus aureus subsp. aureus COL Species 0.000 description 1
- 241000191963 Staphylococcus epidermidis Species 0.000 description 1
- 241000191984 Staphylococcus haemolyticus Species 0.000 description 1
- 241000192086 Staphylococcus warneri Species 0.000 description 1
- 244000057717 Streptococcus lactis Species 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- LUMXICQAOKVQOB-YWIQKCBGSA-N Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O LUMXICQAOKVQOB-YWIQKCBGSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 1
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- WCRFXRIWBFRZBR-GGVZMXCHSA-N Thr-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WCRFXRIWBFRZBR-GGVZMXCHSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- 206010044248 Toxic shock syndrome Diseases 0.000 description 1
- 231100000650 Toxic shock syndrome Toxicity 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- LCPVBXOHXMBLFW-JSGCOSHPSA-N Trp-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)=CNC2=C1 LCPVBXOHXMBLFW-JSGCOSHPSA-N 0.000 description 1
- DZHDVYLBNKMLMB-ZFWWWQNUSA-N Trp-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 DZHDVYLBNKMLMB-ZFWWWQNUSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 1
- KYPMKDGKAYQCHO-RYUDHWBXSA-N Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KYPMKDGKAYQCHO-RYUDHWBXSA-N 0.000 description 1
- ZSXJENBJGRHKIG-UWVGGRQHSA-N Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UWVGGRQHSA-N 0.000 description 1
- AKRHKDCELJLTMD-BVSLBCMMSA-N Tyr-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N AKRHKDCELJLTMD-BVSLBCMMSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- UBTBGUDNDFZLGP-SRVKXCTJSA-N Val-Arg-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UBTBGUDNDFZLGP-SRVKXCTJSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- OBTCMSPFOITUIJ-FSPLSTOPSA-N Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O OBTCMSPFOITUIJ-FSPLSTOPSA-N 0.000 description 1
- BNQVUHQWZGTIBX-IUCAKERBSA-N Val-His Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CN=CN1 BNQVUHQWZGTIBX-IUCAKERBSA-N 0.000 description 1
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- GVRKWABULJAONN-VQVTYTSYSA-N Val-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVRKWABULJAONN-VQVTYTSYSA-N 0.000 description 1
- 108010059993 Vancomycin Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000009102 absorption Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- ZVDPYSVOZFINEE-BQBZGAKWSA-N alpha-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O ZVDPYSVOZFINEE-BQBZGAKWSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 239000002956 ash Substances 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- 125000001584 benzyloxycarbonyl group Chemical group C(=O)(OCC1=CC=CC=C1)* 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229920001400 block copolymer Polymers 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000023715 cellular developmental process Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000001332 colony forming effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- CTMZLDSMFCVUNX-VMIOUTBZSA-N cytidylyl-(3'->5')-guanosine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=C(C(N=C(N)N3)=O)N=C2)O)[C@@H](CO)O1 CTMZLDSMFCVUNX-VMIOUTBZSA-N 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 239000003398 denaturant Substances 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 238000011026 diafiltration Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 206010014665 endocarditis Diseases 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 208000030533 eye disease Diseases 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 102000025748 fibrinogen binding proteins Human genes 0.000 description 1
- 108091009104 fibrinogen binding proteins Proteins 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000003167 genetic complementation Methods 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000003365 glass fiber Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 229960004198 guanidine Drugs 0.000 description 1
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 230000007124 immune defense Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000003308 immunostimulating effect Effects 0.000 description 1
- 238000002650 immunosuppressive therapy Methods 0.000 description 1
- 238000005470 impregnation Methods 0.000 description 1
- 201000007119 infective endocarditis Diseases 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 231100000225 lethality Toxicity 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 150000002614 leucines Chemical class 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 229940087875 leukine Drugs 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 101150110704 melC2 gene Proteins 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- MGJXBDMLVWIYOQ-UHFFFAOYSA-N methylazanide Chemical compound [NH-]C MGJXBDMLVWIYOQ-UHFFFAOYSA-N 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 239000006151 minimal media Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 1
- 125000001446 muramyl group Chemical group N[C@@H](C=O)[C@@H](O[C@@H](C(=O)*)C)[C@H](O)[C@H](O)CO 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 229940046166 oligodeoxynucleotide Drugs 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 210000003800 pharynx Anatomy 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 229960005190 phenylalanine Drugs 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- UYWQUFXKFGHYNT-UHFFFAOYSA-N phenylmethyl ester of formic acid Natural products O=COCC1=CC=CC=C1 UYWQUFXKFGHYNT-UHFFFAOYSA-N 0.000 description 1
- 229920002627 poly(phosphazenes) Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 229940068965 polysorbates Drugs 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 238000002731 protein assay Methods 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000020029 respiratory tract infectious disease Diseases 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 108010038379 sargramostim Proteins 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000003307 slaughter Methods 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000028070 sporulation Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- RTKIYNMVFMVABJ-UHFFFAOYSA-L thimerosal Chemical compound [Na+].CC[Hg]SC1=CC=CC=C1C([O-])=O RTKIYNMVFMVABJ-UHFFFAOYSA-L 0.000 description 1
- 229940033663 thimerosal Drugs 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 101150044170 trpE gene Proteins 0.000 description 1
- 239000001974 tryptic soy broth Substances 0.000 description 1
- 108010050327 trypticase-soy broth Proteins 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- ACWBQPMHZXGDFX-QFIPXVFZSA-N valsartan Chemical class C1=CC(CN(C(=O)CCCC)[C@@H](C(C)C)C(O)=O)=CC=C1C1=CC=CC=C1C1=NN=NN1 ACWBQPMHZXGDFX-QFIPXVFZSA-N 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 108010021889 valylvaline Proteins 0.000 description 1
- MYPYJXKWCTUITO-LYRMYLQWSA-N vancomycin Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1=C2C=C3C=C1OC1=CC=C(C=C1Cl)[C@@H](O)[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@H]3C(=O)N[C@H]1C(=O)N[C@H](C(N[C@@H](C3=CC(O)=CC(O)=C3C=3C(O)=CC=C1C=3)C(O)=O)=O)[C@H](O)C1=CC=C(C(=C1)Cl)O2)=O)NC(=O)[C@@H](CC(C)C)NC)[C@H]1C[C@](C)(N)[C@H](O)[C@H](C)O1 MYPYJXKWCTUITO-LYRMYLQWSA-N 0.000 description 1
- 229960003165 vancomycin Drugs 0.000 description 1
- MYPYJXKWCTUITO-UHFFFAOYSA-N vancomycin Natural products O1C(C(=C2)Cl)=CC=C2C(O)C(C(NC(C2=CC(O)=CC(O)=C2C=2C(O)=CC=C3C=2)C(O)=O)=O)NC(=O)C3NC(=O)C2NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(CC(C)C)NC)C(O)C(C=C3Cl)=CC=C3OC3=CC2=CC1=C3OC1OC(CO)C(O)C(O)C1OC1CC(C)(N)C(O)C(C)O1 MYPYJXKWCTUITO-UHFFFAOYSA-N 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/085—Staphylococcus
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2/00—Peptides of undefined number of amino acids; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P11/00—Drugs for disorders of the respiratory system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/02—Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P29/00—Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/305—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F)
- C07K14/31—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F) from Staphylococcus (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/35—Fusion polypeptide containing a fusion for enhanced stability/folding during expression, e.g. fusions with chaperones or thioredoxin
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Mycology (AREA)
- Communicable Diseases (AREA)
- Epidemiology (AREA)
- Physical Education & Sports Medicine (AREA)
- Oncology (AREA)
- Microbiology (AREA)
- Rheumatology (AREA)
- Gastroenterology & Hepatology (AREA)
- Pain & Pain Management (AREA)
- Biomedical Technology (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Neurology (AREA)
- Ophthalmology & Optometry (AREA)
- Pulmonology (AREA)
- Dermatology (AREA)
- Neurosurgery (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Description
1
DESCRIÇÃO "POLIPEPTIDOS PARA INDUÇÃO DE UMA RESPOSTA IMUNITÁRIA DE PROTECÇÃO CONTRA STAPHYLOCOCCUS AUREUS"
REFERÊNCIA CRUZADA PARA PEDIDOS DE PATENTE RELACIONADOS O presente pedido de patente de invenção reivindica o privilégio do pedido provisório US n° 60/489 840, depositado a 24 de Julho de 2003 e do pedido provisório US n° 60/520 115, depositado a 14 de Novembro de 2003.
ANTECEDENTES DA INVENÇÃO
As referências citadas ao longo do presente pedido de patente de invenção não são consideradas como técnica anterior relativamente à invenção reivindicada. O microrganismo Staphylococcus aureus é um agente patogénico responsável por uma grande variedade de doenças e patologias. Como exemplos de doenças e patologias provocadas por S. aureus refere-se as seleccionadas entre bacteremia, endocardite infecciosa, foliculite, furúnculos, carbúnculo, impetigo, impetigo bulhoso, celulite, botriomiose, síndroma do choque tóxico, síndroma da pele escaldada, infecções do sistema nervoso central, doenças oculares infecciosas e inflamatórias, osteomielite e outras infecções de articulações e ossos e ainda infecções do aparelho respiratório. (The
Staphylococci in Human Disease, Crossley e Archer (eds.), Churchill Livingstone Inc. 1997). 2 É possível recorrer a estratégias de base imunológica para tentar combater infecções de S. aureus e a disseminação de S. aureus. As estratégias de base imunológica compreendem as imunizações passiva e activa. Na imunização passiva são utilizadas imunoglobulinas direccionadas contra S. aureus. A imunização activa induz respostas imunitárias contra S. aureus.
As vacinas potenciais contra S. aureus têm como alvo polissacarídeos e polipeptidos de S. aureus. 0 ataque pode ser efectuado utilizando como componentes da vacina polissacarídeos ou polipeptidos adequados de S. aureus. Como exemplos de componentes polissacarídicos potenciais para vacinas refere-se os polissacarídeos capsulares de tipo 5 e de tipo 8. (Shinefield et al., N. Eng. J. Med. 346:491-496, 2002). Como exemplos de polipeptidos que é possível utilizar como possíveis componentes de vacinas refere-se a adesina do colagénio, as proteínas de ligação do fibrinogénio e o "clumping factor". (Mamo et al., FEMS Immunology and Medicai Microbiology 10:47-54, 1994, Nilsson et al., J. Clin. Invest. 101:2640-2649, 1998, Josefsson et al., The Journal of Infectious Diseases 184:1572-1580, 2001). A informação respeitante às sequências polipeptídicas de S. aureus foi obtida a partir da sequenciação do genoma de S. aureus. (Kuroda et al., Lancet 357:1225-1240, 2001, Baba et al., Lancet 359:1819-1827, 2000, Kunsch et al., publicação da patente de invenção europeia EP 0 786 519, com data de 30 de Julho de 1997) . Recorreu-se a aplicações da bioinformática numa tentativa de caracterizar as sequências polipeptídicas obtidas a partir da sequenciação do genoma. (Kunsch et al., publicação da patente de 3 invenção europeia EP 0 786 519, com data de 30 de Julho de 1997). É possivel utilizar técnicas tais como as que implicam tecnologias de phage display e soros provenientes de pacientes infectados, como parte do esforço de se tentar identificar genes que codifiquem antigénios potenciais. (Foster et al., publicação da patente de invenção internacional com o número WO 01/98499, com data de 27 de Dezembro de 2001, Meinke et al., publicação da patente de invenção internacional número WO 02/059148, com data de 1 de Agosto de 2002).
DESCRIÇÃO ABREVIADA DA INVENÇÃO A presente invenção tem por objecto proporcionar polipeptidos que compreendem uma sequência de aminoácidos estruturalmente conotada com a SEQ ID NO: 1, as utilizações de tais polipeptidos e sistemas de expressão para a produção desses polipeptidos. A SEQ ID NO: 1 é um derivado truncado de um polipeptido de comprimento completo de S. aureus. O polipeptido de comprimento completo recebe aqui a designação de ""ORF0657n" de comprimento completo. Verificou-se que os polipeptidos que contêm a sequência de aminoácidos designada por SEQ ID NO: 1 produzem uma resposta imunitária protectora contra S. aureus. O termo "imunidade protectora" ou "resposta imunitária" indica um nivel detectável de protecção contra uma infecção provocada por S. aureus. O nivel de protecção por ser avaliado recorrendo a modelos com animais, tais como os aqui descritos. 4
Assim, a presente invenção proporciona um imunogénio polipeptidico que compreende uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 1, em que o polipeptido não contém uma terminal carboxilo proporcionado pelos aminoácidos 609-645 de SEQ ID NO: 2 e em que o polipeptido confere imunidade protectora contra S. aureus. A SEQ ID NO: 2 proporciona um polipeptido ORF0657n de comprimento completo, em que os aminoácidos 609-645 proporcionam o domínio do terminal carboxilo que começa no motivo LPXTG (aqui designado por "sinal de selecção da parede celular"). O termo "imunogénio" indica aptidão para conferir imunidade protectora. A frase "que compreende uma sequência de aminoácidos pelo menos 90% idêntica à SEQ ID NO: 1" indica que uma região associada à SEQ ID NO: 1 se encontra presente e que podem estar presentes outras regiões polipeptídicas suplementares. Se estiverem presentes outras regiões polipeptídicas suplementares, então o polipeptido não possui um motivo LPXTG no terminal carboxilo, conforme proporcionado pelos aminoácidos 609-645 da SEQ ID NO: 2.
De acordo com um outro dos seus aspectos, a presente invenção descreve um imunogénio que compreende uma sequência de aminoácidos que confere imunidade protectora contra S. aureus. 0 imunogénio compreende uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 1 e uma ou várias regiões ou radicais suplementares ligados, de forma covalente, ao terminal carboxilo ou ao terminal amino, em que as referidas regiões ou radicais suplementares não providenciam um terminal carboxilo que contenha os aminoácidos 609-645 da SEQ ID NO: 2, em que 5 cada região ou radical é seleccionado independentemente entre regiões ou radicais que possuam pelo menos uma das propriedades seguintes: reforçar a resposta imunitária, facilitar a purificação ou facilitar a estabilidade dos polipeptidos. 0 termo "região ou radical suplementar" designa uma região ou radical diferente de um polipeptido aparentado com ORF0657n, que poderia ser produzido num hospedeiro biológico, tal como um hospedeiro procariótico ou eucariótico. A região ou radical suplementar pode ser, por exemplo, uma região polipeptídica suplementar ou uma região não peptidica suplementar.
De acordo com um outro dos seus aspectos, a presente invenção descreve uma composição capaz de induzir imunidade protectora contra S. aureus num paciente. A composição compreende um veiculo aceitável sob o ponto de vista farmacêutico e uma quantidade imunologicamente eficaz de um imunogénio, conforme descrito antes, que confere imunidade protectora contra S. aureus. Uma quantidade imunologicamente eficaz é uma quantidade suficiente para conferir imunidade protectora contra uma infecção provocada por S. aureus. A quantidade deve ser suficiente para reduzir significativamente a probabilidade ou a gravidade de uma infecção provocada por S. aureus.
De acordo com um outro dos seus aspectos, a presente invenção descreve um ácido nucleico correspondente um gene recombinante que codifica um polipeptido, conforme descrito antes, que confere imunidade protectora contra S. aureus. Um gene recombinante contém ácido nucleico recombinante que codifica um polipeptido conjuntamente com elementos reguladores para a transcrição e para o processamento 6 correctos (o que pode incluir elementos traduccionais e pós-traduccionais). 0 gene recombinante pode existir independentemente de um genoma hospedeiro ou pode ser parte de um genoma hospedeiro.
Um ácido nucleico recombinante é um ácido que, em virtude da sua sequência e/ou da sua forma, não ocorre na natureza. Como exemplos de ácidos nucleicos recombinantes refere-se um ácido nucleico purificado, duas ou mais regiões de ácidos nucleicos combinadas conjuntamente para gerarem um ácido nucleico diferente de qualquer outro existente na natureza, e a ausência de uma ou várias regiões de ácidos nucleicos (v.g., regiões a montante ou a jusante) que estejam naturalmente associadas entre si.
De acordo com outro dos seus aspectos, a presente invenção descreve uma célula recombinante. A célula compreende um gene recombinante que codifica um polipeptido, conforme descrito antes, que confere imunidade protectora contra S. aureus.
De acordo com um outro dos seus aspectos, a presente invenção descreve um processo para a produção de um polipeptido, conforme descrito antes, que confere imunidade protectora contra S. aureus. 0 processo consiste em criar em cultura uma célula recombinante que contenha um ácido nucleico recombinante que codifique o polipeptido, purificando-se depois esse polipeptido.
De acordo com um outro dos seus aspectos, a presente invenção descreve um polipeptido, conforme descrito antes, que confere imunidade protectora contra S. aureus, produzido por um processo que compreende o passo que consiste em criar em cultura uma célula recombinante que contenha um ácido nucleico recombinante que codifique o 7 polipeptido numa célula hospedeira e o passo que consiste em purificar o polipeptido. É possível utilizar diferentes células hospedeiras. De acordo com uma variante da presente invenção, a célula hospedeira é uma célula de uma levedura.
De acordo com um outro dos seus aspectos, a presente invenção descreve um imunogénio, conforme descrito antes, para induzir uma resposta imunitária protectora num paciente, contra S. aureus. 0 imunogénio é administrado ao paciente numa quantidade imunologicamente eficaz que confere imunidade protectora contra S. aureus.
De acordo com um outro dos seus aspectos, a presente invenção descreve um imunogénio, conforme descrito antes, para induzir uma resposta anamnéstica num paciente. 0 processo compreende o passo que consiste em administrar a um paciente uma quantidade eficaz de um imunogénio para produzir uma resposta anamnéstica.
De acordo com um outro dos seus aspectos, a presente invenção descreve um ácido nucleico que codifica um polipeptido aparentado com ORF0657n, que é optimizado para expressão numa levedura. São optimizados um ou mais codões para expressão na levedura.
De acordo com um outro dos seus aspectos, a presente invenção descreve um processo para produzir um polipeptido, conforme descrito antes, que confere imunidade protectora contra S. aureus, numa célula recombinante de levedura. 0 processo compreende os passos seguintes: (a) criar em cultura uma célula recombinante de levedura em condições em que o polipeptido seja expresso, em que a célula recombinante de levedura compreende um gene recombinante que codifica o polipeptido e em que o polipeptido é um polipeptido aparentado com ORF0657n de 8 comprimento completo que confere imunidade protectora contra uma infecção provocada por S. aureus, ou um seu fragmento que compreende uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 1; e (b) purificar o polipeptido. A não ser que termos particulares sejam mutuamente exclusivos, a utilização do termo "ou" indica uma ou ambas as possibilidades. Ocasionalmente, são utilizadas frases tais como "e/ou" para evidenciar uma ou ambas as possibilidades. A utilização de termos não restritivos, tais como "compreende", permite a introdução de elementos ou passos suplementares. Ocasionalmente, são utilizadas frases tais como "um ou mais", conjuntamente ou não com termos não restritivos para evidenciar a possibilidade de haver elementos ou passos suplementares.
Salvo se for explicitamente estipulado, a utilização de termos tais como "um" ou "uma" não significa qualquer limitação a um caso singular. Por exemplo, "uma célula" não exclui o termo "células". Ocasionalmente, são utilizadas frases tais como "um ou mais" para evidenciar a presença de um grande número. Há outras particularidades e vantagens da presente invenção que se tornarão evidentes a partir do texto descrito subsequente aqui apresentado, conjuntamente com os diferentes exemplos. Os exemplos apresentados ilustram diferentes componentes e metodologias úteis na prática da presente invenção. Os exemplos não limitam a invenção reivindicada. Com base no texto presente, um especialista na matéria consegue identificar e utilizar outros componentes e metodologias úteis para a prática da presente invenção. 9
DESCRIÇÃO ABREVIADA DOS DESENHOS
As figuras ΙΑ, 1B, 1C e 1D correspondem a um esquema que ilustra as regiões polipeptidicas associadas a ORFO657n, pesquisadas para protecção em animais, e algumas sequências diferentes de ORF0657n. A figura IA ilustra um esquema de polipeptidos que foram testados e para os quais se concluiu que conferiam protecção (representados por rectângulos a cheio), polipeptidos que foram experimentados e para os quais e concluiu que não conferiam protecção (representados por rectângulos em branco) e um polipeptido não experimentado (rectângulo tracejado). A figura 1B ilustra uma sequência de comprimento completo, utilizada como referência para a figura IA (SEQ ID NO: 2). A figura 1C ilustra a SEQ ID NO: 28. A SEQ ID NO: 28 contém uma "cauda de His" no terminal carboxilo (LEHHHHHH; SEQ ID NO: 64) . A SEQ ID NO: 2 8 que contém uma cauda de His no terminal carboxilo também é aqui designada por "His-identificador ORF0657n". A figura ID ilustra uma sequência de ORF0657nI+.
As figuras 2A-2E permitem fazer uma comparação entre diferentes sequências associadas a ORF0657n ao longo de toda a região ORF0657nH. A terminologia 'SEQ ID NOs:' está indicada na figura simplesmente por "ID".
As figuras 3A, 3B e 3C ilustram a aptidão dos polipeptidos aparentados com ORF0657n, que proporcionam a sequência de comprimento completo, a região OFR0657nH e a região ORF0657nI, para conferir imunidade protectora contra S. aureus Becker. Os polipeptidos foram utilizados com um adjuvante de hidroxifosfato de alumínio (AHP). A figura 3A ilustra os resultados obtidos com a SEQ ID NO: 28. A figura 10 3Β ilustra os resultados obtidos com a SEQ ID NO: 4 que contém uma cauda de His no terminal carboxilo. A figura 3C ilustra os resultados obtidos com a SEQ ID NO: 5 que contém uma cauda de His no terminal carboxilo. A utilização do termo "uma cauda de His no terminal carboxilo" indica que se encontra presente o grupo LEHHHHHH (SEQ ID NO: 64), cauda de His, no terminal carboxilo.
As figuras 4A-4H ilustram a aptidão dos polipeptidos aparentados com ORF0657n para conferirem imunidade protectora contra diferentes infecções provocadas por S. aureus. Utilizou-se como imunogénio o polipeptido de SEQ ID NO: 28. A figura 4A mostra os resultados obtidos quando é utilizada a estirpe infecciosa CL-10 (2,2 X 108 UFC/mL). A figura 4B mostra os resultados obtidos quando é utilizada a estirpe infecciosa CL-10 (2,1 X 108 UFC/mL). A figura 4C mostra os resultados obtidos quando é utilizada a estirpe infecciosa CL-13 (2,9 X 108 UFC/mL). A figura 4D mostra os resultados obtidos quando se utiliza a estirpe infecciosa CL-13 (2,8 X 108 UFC/mL). A figura 4E mostra os resultados obtidos quando se utiliza a estirpe infecciosa CL-30 (3,1 X 108 UFC/mL). A figura 4F mostra os resultados obtidos quando se utiliza a estirpe infecciosa CL-30 (3, 0 X 108 UFC/mL). A figura 4G mostra os resultados alcançados quando se utiliza a estirpe infecciosa CL-18 (1,0 X 108 UFC/mL. A figura 4H mostra os resultados conseguidos quando se utiliza a estire infecciosa CL-21 (1,6 X 108 UFC/mL).
As figuras 5A e 5B ilustram mapas plasmídicos de plasmideos de expressão de S. cerevisiae. A figura 5A representa um mapa plasmidico do vector pGALHO. A figura 5B representa um mapa plasmidico para piUC-I, representando 11 uma sequência optimizada por codões de leveduras, clonada sob o controlo do promotor GALl de pGALHO.
As figuras 6A e 6B representam transferências de 'Western' que traduzem a expressão intracelular de um ORF0657n de comprimento completo que possui os aminoácidos 1-646 da SEQ ID NO: 28 (SEQ ID NO: 28 sem a cauda de His no terminal carboxilo). Pista 1, padrões de pesos moleculares; pista 2, região ORF0657n recombinante de comprimento completo (SEQ ID NO: 28), purificada e produzida E. coli, 100 ng; as pistas 3-6 contêm 20 pg de lisado de células de leveduras; pistas 3 e 4, lisados de células provenientes de fermentações de transformantes, feitas em duplicado, das estirpes 1260 (figuras 6A) e 1309 (figura 6B) contendo apenas o vector pGALHO; pistas 5 e 6, lisados de células provenientes de fermentações de transformantes, feitas em duplicado, das estirpes 1260 (figura 6A) e 1309 (figura 6B) contendo pRUnkC-pGALHO que expressa a região ORF0657n de comprimento completo (SEQ ID NO: 28 sem a cauda de His do terminal carboxilo).
As figuras 7A e 7B correspondem a uma coloração com o corante de Coomassie num gel para o protocolo de SDS-PAGE e uma transferência de 'Western', respectivamente, representando a expressão intracelular em S. cerevisiae a partir de um ácido nucleico que codifica a SEQ ID NO: 3. Pista 1, painel A, BSA, 1,25 pg; painel B, ORF0657n recombinante de comprimento completo, purificado, de E. coli (SEQ ID NO: 28), 100 ng; pista 2, lisado de células proveniente do produtor de ORF0657nH (SEQ ID NO: 4 com uma cauda de His no terminal carboxilo) em E. coli; painel A, 1,25 pg, painel B, 0,5 pg. Pistas 3-7, os painéis A e B contêm, respectivamente, 1,25 e 0,5 pg de lisado de células 12 de leveduras: pista 3, transformante que contém apenas o vector pGALHO; pista 4, transformante que contém ORF0657n de comprimento completo (SEQ ID NO: 28 sem a cauda de His no terminal carboxilo); pistas 5, 6 e 7, transformante 1-1 que contém piUC-S(-) que expressa a região ORF0657nH madura (SEQ ID NO: 3); a pista 7 contém um lisado de células (do transformante 1-1) que foi congelado e subsequentemente descongelado. Pista 8, contém padrões de pesos moleculares.
As figuras 8A-8U correspondem a exemplos de diferentes sequências de ácidos nucleicos que codificam os polipeptidos conotadas com ORF0657n. A figura 8A corresponde a uma sequência de ácidos nucleicos (SEQ ID NO: 29) que codifica a SEQ ID NO: 2, mais uma cauda de His no terminal carboxilo. A figura 8B corresponde a uma sequência de ácidos nucleicos (SEQ ID NO: 30) que codifica a SEQ ID NO: 4 mais uma cauda de His no terminal carboxilo. A figura 8C corresponde a uma sequência optimizada de ácidos nucleicos de leveduras (SEQ ID NO: 31), que codifica a SEQ ID NO: 28 sem uma cauda de His no terminal carboxilo. A figura 8D corresponde a uma sequência optimizada de ácidos nucleicos de leveduras (SEQ ID NO: 32), que codifica a SEQ ID NO: 3. A figura 8E corresponde a uma sequência optimizada de ácidos nucleicos de leveduras (SEQ ID NO: 33), que codifica a SEQ ID NO: 1.
As figuras 8F-8M correspondem a sequências optimizadas de ácidos nucleicos de leveduras (SEQ ID NOs: 34, 35, 36, 37, 38, 39, 40 e 41), que codificam a SEQ ID NO: 7 que contém um resíduo metionina no terminal amino. As figuras 8N-8U correspondem a sequências optimizadas de ácidos nucleicos de leveduras (SEQ ID NOs: 46-53), que codificam 13 diferentes polipeptidos aparentados com ORF0657n, com base na SEQ ID NO: 17 ou na SEQ ID NO: 20. A figura 9 apresenta uma transferência de 'Western' que compara a expressão intracelular de polipeptidos aparentados com ORF0657n em S. cerevisiae. Pistas 1 e 18, padrões de pesos moleculares. Pistas 2 e 3, respectivamente 50 e 100 ng de ORF0657nH purificado produzido em E. coli (SEQ ID NO: 4 mais uma cauda de His no terminal carboxilo). A pista 5 contém 500 ng de proteínas do lisado celular proveniente do transformante de controlo do vector de S. cerevisiae. As pistas 7, 8 e 9 contêm 1,0, 2,0 e 4,0 yg de proteínas do lisado celular proveniente do transformante de S. cerevisiae que produz a SEQ ID NO: 2 8 sem uma cauda de His no terminal carboxilo. As pistas 11 e 12 contêm, respectivamente, 50 e 100 ng de lisado celular proveniente do transformante de S. cerevisiae que produz ORF0657nH (SEQ ID NO: 3). As pistas 14 e 15 contêm, respectivamente, 250 e 500 ng de proteínas do lisado celular proveniente do transformante de S. cerevisiae que produz ORF0657nG (SEQ ID NO: 44) . A pista 17 contém 250 ng de proteína do lisado celular proveniente do produtor E. coli de ORF0657nG (SEQ ID NO: 44 mais uma cauda de His no terminal carboxilo). As pistas 4, 6, 10, 13 e 16 estão vazias. A figura 10 ilustra dados sobre a imunidade protectora para os polipeptidos aparentados com ORF0657n, produzidos em E. coli e em leveduras. O ORF0657nH (E. coli) corresponde à SEQ ID NO: 4 com uma cauda de His no terminal carboxilo. "ORF0657nI (E. coli)11 corresponde à SEQ ID NO: 5 com uma cauda de His no terminal carboxilo. "ORF0657nC (E. coli) 11 corresponde à SEQ ID NO: 28. "ORF0657nH (levedura)" corresponde à SEQ ID NO: 3. 14 A figura 11 traduz uma transferência de 'Western' exemplificativa da expressão intracelular de ORF0657nI em S. cerevisiae. Pistas 1 e 25: padrões de pesos moleculares. Pistas 2, 3 e 24: respectivamente 25, 50 e 100 ng, de região ORF0657nH purificada (SEQ ID NO: 4 com uma cauda de His no terminal carboxilo) produzida em E. coli. As pistas 4-23 contêm lisado celular proteico proveniente de transformantes de leveduras. As pistas 13-21 correspondem a lisados celulares, feitos em duplicado, preparados a partir da mesma amostra de fermentação utilizada para os lisados correspondentes às pistas 4-12. As pistas 4 e 13 contêm 200 ng de proteína proveniente do transformante de controlo do vector que contém pGALHO. As pistas 5 e 14 contêm 100 ng de proteínas provenientes do transformante 1-1 que produz a região ORF0657nH (SEQ ID NO: 3) . As pistas 6 e 15 contêm 200 ng de proteínas provenientes do transformante 1-1. As pistas 7 e 16 contêm 100 ng de proteínas e as pistas 8 e 17 contêm 200 ng de proteínas provenientes do transformante II. As pistas 9 e 18 contêm 100 ng de proteínas e as pistas 10 e 19 contêm 200 ng provenientes do transformante 12. As pistas 11 e 20 contêm 100 ng de proteínas e as pistas 12 e 21 contêm 200 ng de proteínas provenientes do transformante 13. As pistas 22 e 23 contêm 100 e 200 ng de proteínas de lisados celulares previamente preparados a partir de uma fermentação prévia do transformante 1-1. A figura 12 proporciona dados de imunização de macacos Rhesus. Os macacos Rhesus foram imunizados com o polipeptido aparentado com ORF0657n (ORF0657nH, SEQ ID NO: 3) produzido por leveduras, ou com o polipeptido aparentado com ORF0657n (ORF0657nC de comprimento completo, SEQ ID NO: 28) , expresso em E. coli, numa formulação contendo ou não 15 ΑΗΡ. Os macacos do grupo vacinado receberam 50 pg de polipeptidos aparentados com ORF0657n por via intramuscular.
DESCRIÇÃO MINUCIOSA DA INVENÇÃO
Concluiu-se que os polipeptidos aparentados com ORF0657n, incluindo os derivados de comprimento completo e de comprimento mais curto que contêm a região ORF0657nI, conferiam imunidade protectora contra S. aureus, utilizando um modelo com animais. A figura la ilustra a localização de diferentes regiões de polipeptidos aparentados com ORF0657n que conferem imunidade protectora contra uma infecção provocada por S. aureus, e regiões que não conferem imunidade protectora. Na figura la, o termo ORF0657n designa uma sequência de comprimento completo correspondente à SEQ ID NO: 2, o termo ORF0657nI designa uma região correspondente à SEQ ID NO: 1 (sem a metionina do terminal amino) e o termo ORF0657nH designa uma região correspondente à SEQ ID NO: 3 (sem a metionina do terminal amino).
Um polipeptido "aparentado" com ORF0657n contém uma região estruturalmente conotada com ORF0657n de comprimento completo, ou com um seu fragmento. Os polipeptidos aparentados com ORF0657n são polipeptidos que possuem pelo menos cerca de 90% de identidade sequencial com uma região correspondente de um 0RF0657n que ocorra naturalmente. O ORF0657n de referência, ilustrado na figura 1, corresponde ao ORF0657n proveniente de S. aureus COL (SEQ ID NO: 2). A identidade percentual com uma sequência de referência é determinada alinhando a sequência 16 polipeptídica com a sequência de referência e determinando o número de aminoácidos idênticos. Divide-se este número pelo número total de aminoácidos da sequência de referência e depois multiplica-se por 100 e arredonda-se para o número inteiro mais próximo. A figura la ajuda a ilustrar a importância de uma região central que compreende uma sequência de aminoácidos estruturalmente conotada com SEQ ID NO: 1. A SEQ ID NO: 1 compreende os aminoácidos 42-486 de ORF0657n COL. A SEQ ID NO: 1 contém também uma metionina no terminal amino, para facilitar a expressão. Os fragmentos polipeptídicos obtidos a partir dos aminoácidos 461-609, a partir dos aminoácidos 82-486 ou a partir dos aminoácidos 42-196 da SEQ ID NO: 2 não conferiram protecção.
Ao longo desta memória descritiva são referidas diferentes sequências de aminoácidos e de ácidos nucleicos. O quadro 1 agrupa um conjunto de algumas sequências polipeptidicas, indicando a região da figura 1 e modificações suplementares. O quadro 2 apresenta um resumo de algumas sequências de ácidos nucleicos.
Quadro 1
SEQ ID NOs: Região ORF0657n Mais modificações/mais informação 1 ORFO 657nl Metionina no terminal amino 2 Comprimento completo 3 ORFO 657nH Metionina no terminal amino 4 ORFO 657nH Metionina-glicina no terminal amino 5 ORFO 657nl Metionina-glicina no terminal amino 6 ORFO 657nH 7 ORFO 657nH 17 SEQ ID NOs: Região ORF0657n Mais modificações/mais informação 8 ORFO 657nH 9 ORFO 657nH 10 ORFO 657nH 11 ORFO 657nH 12 ORFO 657nH 13 ORFO 657nH 14 ORFO 657nH 15 ORFO 657nH 16 ORFO 657nH 17 ORFO 657nH 18 ORFO 657nH 19 ORFO 657nH 20 ORFO 657nH 21 ORFO 657nH 22 ORFO 657nH 23 ORFO 657nH 24 ORFO 657nH 25 ORFO 657nH 26 ORFO 657nH 27 ORFO 657nH 28 Comprimento completo SEQ ID NO: 2 modificada para conter uma glicina a seguir à metionina do terminal amino e uma cauda de His no terminal carboxilo 42 ORFO 657nl + Aminoácidos 1-481 da SEQ ID NO: 3 44 ORFO 657nG Metionina no terminal amino mais os aminoácidos 42-645 da SEQ ID NO: 2 54-63 ORFO 657nH Proveniente de S. aureus diferentes 106 e 107 Comprimento completo Proveniente de S. aureus diferentes Quadro 2 SEQ ID NO:
Região
Outra informação 18 SEQ ID NO: Região Outra informação 29 Comprimento completo Codifica a SEQ ID NO: 2 (nucleótidos 1-1935) + uma cauda de His no terminal carboxilo 30 ORF0657nH Codifica a SEQ ID NO: 4 (nucleótidos 1-1710) + uma cauda de His no terminal carboxilo 31 Comprimento completo Codifica a SEQ ID NO: 28 sem uma cauda de His no terminal carboxilo e com optimização de codões para expressão em leveduras 32 ORF0657nH Codifica a SEQ ID NO: 3 e com optimização de codões para expressão em leveduras 33 ORF0657nI Codifica a SEQ ID NO: 1 e com optimização de codões para expressão em leveduras 34 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 35 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 36 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 37 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 38 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com 19 SEQ ID NO: Região Outra informação optimização de codões para expressão em leveduras 39 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 40 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 41 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 43 ORF0657nI+ Codifica a SEQ ID NO: 42 e com optimização de codões para expressão em leveduras 45 ORF0657nG Codifica a SEQ ID NO: 44 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 46 ORF0657nH Codifica a SEQ ID NO: 17 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 47 ORF0657nI+ Codifica a região da SEQ ID NO: 17 I+, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina 48 ORF0657nI Codifica a região da SEQ ID NO: 17 I, com optimização de codões para 20 SEQ ID NO: Região Outra informação expressão em leveduras e codifica um codão de iniciação da metionina 49 Comprimento completo Codifica o ORF0657n de comprimento completo que contém a SEQ ID NO: 17 (SEQ ID NO: 106) modificada para conter uma glicina a seguir à metionina do terminal amino e com optimização de codões para expressão em leveduras 50 ORF0657nH Codifica a SEQ ID NO: 20 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 51 ORF0657nI+ Codifica a região da SEQ ID NO: 20 I+, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina 52 ORF0657nI Codifica a região da SEQ ID NO: 20 I, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina 53 Comprimento completo Codifica o ORF0657n de comprimento completo que contém a SEQ ID NO: 17 (SEQ ID NO: 106) modificada para conter uma glicina a seguir à metionina do terminal amino e com optimização de codões para expressão em leveduras
Polipeptidos aparentados com a SEQ ID NO: 1
Uma região polipeptídica estruturalmente conotada com a SEQ ID NO: 1 contém uma identidade de aminoácidos que é pelo menos igual a 90% da SEQ ID NO: 1. Os polipeptidos que contêm uma região estruturalmente conotada com a SEQ ID NO: 21 1 podem ser concebidos com base nas orientações aqui apresentadas para a obtenção de polipeptidos que conferem protecção contra S. aureus.
Utilizando a SEQ ID NO: 1 como estrutura de referência, é possível fazer alterações tomando em consideração a sequência de aminoácidos de diferentes polipeptidos aparentados com os ORF0657n que ocorrem naturalmente e tendo em consideração as propriedades conhecidas dos aminoácidos. As alterações compreendem uma ou várias adições, delecções e/ou substituições de aminoácidos. 0 efeito global das diferentes alterações pode ser avaliado recorrendo a técnicas aqui descritas para confirmar a aptidão de um polipeptido particular para conferir imunidade protectora.
Concluiu-se que o ORF0657n está bem conservado em toda uma colecção de isolados clínicos de S. aureus, patológica e taxonomicamente diversos. (Ver o exemplo 5, infra). A figura 2 ilustra uma comparação entre sequências de aminoácidos, para diferentes sequências que contêm uma SEQ ID NO: 1. A comparação ilustrada de sequências é para a região ORF0657nH. A região ORF0657nH compreende a região ORF0657nI protectora mais pequena. 3-6 e 8-26 correspondem a A figura 2 ilustra uma comparação de sequências, entre as SEQ ID NO: 1 e 3-27. A comparação ilustra as diferenças de aminoácidos entre isolados clínicos de S. aureus, que podem ser utilizados para permitir a manipulação de potenciais alterações para proporcionar polipeptidos aparentados com S. aureus, tais como os de SEQ ID NOs: 1 e 3. Além disso, é possível fazer as alterações tomando em considerações propriedades conhecidas dos aminoácidos. As sequências SEQ ID NOs: 1, 22 sequências que ocorrem naturalmente, começando na posição número 3 e em que os números de posição 1 e 2 ilustram a adição de metionina ou de metionina-glicina ao terminal amino de algumas sequências. As SEQ ID NOs: 11-26 foram obtidas a partir de diferentes isolados clínicos. As SEQ ID NOs: 7 e 27 são variantes da região ORF0657nH de SEQ ID NO: 4, que contém cinco substituições de aminoácidos numa região fora da região central da SEQ ID NO: 1. É possível utilizar outras sequências de ORF0657n na comparação de sequências, para ajudar a fazer as alterações. Como exemplos de outras sequências da região ORF0657nH de S. aureus refere-se as SEQ ID NOs: 54-63 e como exemplos de sequências de comprimento completo, para as SEQ ID NOs: 17 e 20, refere-se as SEQ ID NOs: 106 e 107.
De um modo geral, ao substituir diferentes aminoácidos para conservar a actividade, é preferível substituir aminoácidos que possuam propriedades semelhantes. Os factores que podem ser tomados em consideração para as substituições de aminoácidos são o tamanho dos aminoácidos, a carga eléctrica, a polaridade e a sua hidrofobicidade. Os efeitos de grupos R de diferentes aminoácidos sobre as propriedades dos aminoácidos são bem conhecidos na especialidade. (Ver, por exemplo, Ausubel, Current Protocols in Molecular Biology, John Wiley, 1987-2002, Appendix 1C).
Na substituição de aminoácidos, para manter a actividade, a substituição de um aminoácido deve conservar uma ou várias propriedades semelhantes, tais como, aproximadamente, a mesma carga eléctrica e/ou o mesmo tamanho e/ou a mesma polaridade e/ou a mesma hidrofobicidade. Por exemplo, a substituição de leucina por valina, de lisina por arginina e de glutamina por 23 asparagina são operações adequadas para que não haja uma alteração da função do polipeptido.
As alterações para se conseguir obter um efeito particular compreendem aquelas que são concebidas para facilitar a produção ou a eficácia do polipeptido; ou a clonagem do ácido nucleico codificado. A produção do polipeptido pode ser facilitada mediante a utilização de um codão de iniciação (v.g., que codifique a metionina) conveniente para uma expressão recombinante. A metionina pode ser removida depois durante o processamento celular. A clonagem pode ser facilitada, por exemplo, pela introdução de locais de restrição, o que pode estar associado a adições ou trocas de aminoácidos. A eficácia de um polipeptido para induzir uma resposta imunitária pode ser aumentada mediante uma beneficiação do epitopo. A beneficiação de epítopos pode ser realizada recorrendo a diferentes técnicas, tais como as que implicam a alteração de resíduos de fixação para melhorar a afinidade do péptido para moléculas do MHC e também aquelas que aumentam a afinidade do complexo de péptido-MHC para um receptor de células T. (Berzofsky et al., Nature Review 1:209-219, 2001).
Em variantes diferentes, relativamente à região polipeptídica conotada com a SEQ ID NO: 1, a região é pelo menos 90%, pelo menos 94% ou pelo menos 99% idêntica à SEQ ID NO: 1; difere da SEQ ID NO: 1 por 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 alterações, ou até 50 alterações, ou consiste numa região conotada com OPR0657nI, seleccionada entre o conjunto constituído por: aminoácidos 1-442 das SEQ ID NOs: 11, 15, 16, 18 ou 54; 24 aminoácidos 1-443 da SEQ ID NO: 63; aminoácidos 1-444 das SEQ ID NOs: 57 ou 59; aminoácidos 1-445 das SEQ ID NOs: 7, 8, 9, 10, 12, 13, 14, 17, 19, 20, 55, 56 ou 58; aminoácidos 1-446 das SEQ ID NOs: 23 ou 24, aminoácidos 1-446 ou 2-446 das SEQ ID NOs: 1 ou 3; aminoácidos 1-447 das SEQ ID NOs: 25 ou 26; ou aminoácidos 1-447, 2-447 ou 3-4,47 das SEQ ID NOs: 4, 5 ou 27; aminoácidos 1-449 das SEQ ID NOs: 61 ou 62; aminoácidos 1-453 da SEQ ID NO: 60; e aminoácidos 1-454 das SEQ ID NOs: 6, 21 ou 22.
Podem estar presentes outros aminoácidos suplementares. Os aminoácidos suplementares podem estar no terminal carboxilo ou no terminal amino. Em variantes diferentes estão presentes 1, 2, 3, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 aminoácidos suplementares. Em variantes preferenciais, a metionina está presente no terminal amino; ou o grupo metionina-glicina está presente no terminal amino.
De acordo com uma variante da presente invenção, o polipeptido é constituído por uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 42 ou a um seu fragmento que compreende uma sequência de aminoácidos estruturalmente conotada com a SEQ ID NO: 1. Num variante diferente da SEQ ID NO: 42, o polipeptido é pelo menos 94% ou pelo menos 99% idêntico à SEQ ID NO: 42; difere da SEQ ID NO: 42 por 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 alterações, até 50 alterações ou até 65 alterações; ou é constituído pela SEQ ID NO: 42 ou por uma região conotada 25 com OFR0657nI, seleccionada entre o conjunto constituído por: aminoácidos 1-477 das SEQ ID NOs: 11, 15, 16, 18 ou 54; aminoácidos 1-478 da SEQ ID NO: 63;
Aminoácidos 1-479 das SEQ ID NOs: 57 ou 59; aminoácidos 1-480 das SEQ ID NOs: 7, 8, 9, 10, 12, 13, 14, 17, 19, 20, 55, 56 ou 58; aminoácidos 1-481 das SEQ ID NOs: 23 ou 24; aminoácidos 1-481 ou 2-481 das SEQ ID NOs: 1 ou 3; aminoácidos 1-482 das SEQ ID NOs: 25 ou 26; aminoácidos 1-482, 2-482 ou 3-482 das SEQ ID NOs: 4, 5 ou 27; aminoácidos 1-484 das SEQ ID NOs: 61 ou 62; aminoácidos 1-488 da SEQ ID NO: 60; e aminoácidos 1-489 das SEQ ID NOs: 6, 21 ou 22;
De acordo com uma outra variante da presente invenção, o polipeptido é constituído por uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 3 ou a uma seu fraqmento que compreende uma sequência de aminoácidos estruturalmente conotada com a SEQ ID NO: 1. Em variantes diferentes, relativamente à SEQ ID NO: 3, o polipeptido é pelo menos 94% ou pelo menos 99% idêntico à SEQ ID NO: 3; difere da SEQ ID NO: 3 por 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 1 5, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 alterações, até 50 alterações ou até 65 alterações; ou é constituído por uma sequência de aminoácidos seleccionada entre o conjunto constituído por SEQ ID NOs: 3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, \—1 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 54, 55, 55, 57, 55, 59, 60, 61, 62 e 63. 26
De acordo com uma outra variante, o polipeptido é constituído pela SEQ ID NO: 2, modificada pela inserção de uma glicina a seguir à metionina inicial, ou é um polipeptido com tal sequência, sem a metionina inicial.
De acordo com uma variante suplementar, o polipeptido é um polipeptido purificado. Um "polipeptido purificado" encontra-se presente no ambiente onde estão ausentes um ou vários outros polipeptidos com os quais se encontra naturalmente associado e/ou é representado pelo menos por cerca de 10% da proteína total presente. Em variantes diferentes, o polipeptido purificado representa pelo menos cerca de 50%, pelo menos cerca de 75% ou pelo menos cerca de 95% da proteína total existente numa amostra ou numa preparação.
De acordo com uma outra variante, o polipeptido é "substancialmente purificado". Um polipeptido substancialmente purificado está presente no ambiente em que faltam todos ou a maior parte de outros péptidos com os quais o péptido se encontra naturalmente associado. Por exemplo, um polipeptido de S. aureus, substancialmente purificado, está presente num ambiente onde falta a totalidade ou a maior parte de outros péptidos de S. aureus. Um ambiente pode ser, por exemplo, uma amostra ou uma preparação.
Os termos "purificado" ou "substancialmente purificado" não significam que um polipeptido seja sujeito a qualquer tipo de purificação, e podem abranger, por exemplo, um polipeptido sintetizado por via química, que não tenha sido purificado. É possível aumentar a estabilidade dos polipeptidos, modificando os terminais carboxilo ou amino do polipeptido. Como exemplos de modificações possíveis refere-se a 27 modificação de grupos de protecção do terminal amino, tais como os grupos acetilo, propilo, succinilo, benzilo, benziloxicarbonilo ou t-butiloxicarbonilo; e a modificação dos grupos de protecção do terminal carboxilo, tais como os grupos amida, metilamida e etilamida.
De acordo com uma variante da presente invenção, o polipeptido protector faz parte de um imunogénio constituído pelo polipeptido e por uma ou várias regiões ou radicais suplementares unidos de forma covalente ao polipeptido no terminal carboxilo ou no terminal amino. Cada região ou radical deve ser seleccionado independentemente entre regiões ou radicais que possuam pelo menos as seguintes propriedades: aumentem a resposta imunitária, facilitem a purificação ou facilitem a estabilidade do polipeptido. A estabilidade do polipeptido pode ser reforçada, por exemplo, utilizando grupos tais como um polietileno-glicol que pode estar presente nos terminais amino ou carboxilo. A purificação do polipeptido pode ser reforçada acrescentando um grupo aos terminais carboxilo ou amino, para facilitar a purificação. Como exemplos de grupos que é possível utilizar para facilitar a purificação refere-se os polipeptidos que proporcionam identificadores por afinidade. Como exemplos de identificadores por afinidade refere-se um identificador de hexa-histidina, trpE, glutationa e uma proteína de ligação à maltose. A aptidão de um polipeptido para produzir uma resposta imunitária pode ser reforçada recorrendo a grupos que geralmente reforçam uma resposta imunitária. Como exemplos de grupos que é possível juntar a um polipeptido para reforçar uma resposta imunitária contra o polipeptido 28 refere-se as citoquinas, tais como a IL-2. (Buchan et ai., 2000. Molecular Immunology 37:545-552).
Produção de polipeptidos
Os polipeptidos podem ser produzidos recorrendo a técnicas convencionais, incluindo as que implicam a síntese química e as que implicam a purificação a partir de uma célula que produza os polipeptidos. As técnicas para a síntese química de polipeptidos são perfeitamente conhecidas na especialidade. (Ver, v.g., Vincent, Peptide and Protein Drug Delivery, New York, N.Y., Decker, 1990). As técnicas para a purificação de polipeptidos a partir de uma célula estão ilustradas nos exemplos apresentados adiante. Há outros exemplos de técnicas de purificação, perfeitamente conhecidos na especialidade. (Ver, por exemplo, Ausubel, Current Protocols in Molecular Biology, John Wiley, 1987-2002). A obtenção de polipeptidos a partir de uma célula é facilitada utilizando técnicas recombinantes de ácidos nucleicos para produzir os polipeptidos. As técnicas recombinantes de ácidos nucleicos para a produção de um polipeptido prevêem a introdução ou a produção de um gene recombinante que codifique o polipeptido numa célula e a expressão do polipeptido.
Um gene recombinante contém um ácido nucleico que codifica um polipeptido conjuntamente com elementos reguladores para a expressão do polipeptido. O gene recombinante pode estar presente num genoma celular ou pode fazer parte de um vector de expressão. 29
Os elementos reguladores que podem estar presentes, como parte de um gene recombinante, compreendem os que estão naturalmente associados à sequência que codifica o polipeptido e os elementos reguladores exógenos que não estão naturalmente associados à sequência codificadora do polipeptido. Os elementos reguladores exógenos, tais como um promotor exógeno, podem ser úteis para expressar um gene recombinante num hospedeiro particular ou para aumentar o nivel de expressão. De um modo geral, os elementos reguladores, que estão presentes num gene recombinante, compreendem um promotor transcricional, um local de ligação ribossómica, um terminador e um operador, facultativamente presente. Um elemento preferível para o processamento em células eucarióticas é um sinal de poliadenilação. A expressão de um gene recombinante numa célula é facilitada mediante a utilização de um vector de expressão. De preferência, um vector de expressão, para além de um gene recombinante, contém também uma origem de replicação para replicação autónoma numa célula hospedeira, um marcador seleccionável, um número limitado de locais de enzimas de restrição e um potencial para um elevado número de cópias. Como exemplos de vectores de expressão refere-se os vectores de clonagem, os vectores de clonagem modificados, os plasmídeos especificamente concebidos e os vírus.
Devido à degeneração do código genético, é possível utilizar um grande número de diferentes sequências de ácidos nucleicos codificadoras, para codificar um polipeptido particular. A degeneração do código genético aparece porque quase todos os aminoácidos são codificados por diferentes combinações de tripletos de nucleótidos ou 30 "codões". Os aminoácidos são codificados por codões, do modo seguinte:
A=Ala=alanina: codões GCA, GCC, GCG, GCU C=Cys=cisteína: codões UGC, UGU D=Asp=ácido aspártico: codões GAC, GAU E=Glu=ácido glutâmico: codões GAA, GAG F=Phe=fenilalanina: codões UUC, UUU G—Gly—glicina: codoes GGA, GGC, GGG, GGU H=His=histidina: codões CAC, CAU I=Ile=isoleucina: codões AUA, AUC, AUU K=Lys=lisina: codões AAA, AAG
L=Leu=leucina: codões UUA, UUG, CUA, CUC, CUG, CUU M=Met=metionina: codão AUG N=Asn=asparagina: codões AAC, AAU P=Pro=prolina: codões CCA, CCC, CCG, CCU Q=Gln=glutamina: codões CAA, CAG
R=Arg=arginina: codões AGA, AGG, CGA, CGC, CGG, CGU S=Ser=serina: codões AGC, AGU, UCA, UCC, UCG, UCU T=Thr=treonina: codões ACA, ACC, ACG, ACU V=Val=valina: codões GUA, GUC, GUG, GUU W=Trp=triptofano: codão UGG Y=Tyr=tirosina: codões UAC, UAU
As células convenientes para a expressão de ácidos nucleicos recombinantes de polipeptidos aparentados com ORF0657n são células procarióticas e eucarióticas. Como exemplos de células procarióticas refere-se as de E. coli; os membros do género Staphylococcus, tais como S. aureus; os membros do género Lactobacillus, tais como L. plantarum; os membros do género Lactococcus, tais como L. lactis; e os membros do género Bacillus, tais como B. subtilis. Como exemplos de células eucarióticas refere-se as células de 31 mamíferos; as células de insectos; as células de leveduras, tais como os membros do género Saccharomyces (v.g., S. cerevisiae) , os membros do género Pichia (v.g., P. pastoris), os membros do género Hansenula (v.g., H. polymorpha), os membros do género Kluyveromyces (v.g., K lactis ou K. fragilis) e os membros do género Schizosaccharomyces (v.g., S. pombe) .
As técnicas para a produção recombinante de genes, para a introdução numa célula e para a expressão recombinante de genes, são perfeitamente conhecidas na especialidade. Como exemplos de tais técnicas refere-se as que vêm citadas em obras tais como as de Ausubel, Current Protocols in Molecular Biology, John Wiley, 1987-2002 e Sambrook et al., Molecular Cloning, A Laboratory Manual, 2a edição, Cold Spring Harbor Laboratory Press, 1989.
Se desejado, é possível reforçar a expressão num hospedeiro particular, mediante a optimização dos codões. A optimização dos codões inclui a utilização de codões mais preferenciais. As técnicas para a optimização de codões em diferentes hospedeiros são perfeitamente conhecidas na especialidade.
Os polipeptidos aparentados com ORF0657n podem conter modificações pós-traduccionais, por exemplo, uma glicosilação ligada a N, uma glicosilação ligada a O ou uma acetilação. Os termos "polipeptido" ou uma sequência de "aminoácidos" de um polipeptido designam polipeptidos que contenham um ou vários aminoácidos que possuam uma estrutura de uma modificação pós-traduccional proveniente de uma célula hospedeira, por exemplo, uma célula hospedeira de um mamífero, de um insecto ou de uma levedura. 32
As modificações pós-traduccionais podem ser produzidas quimicamente ou recorrendo a hospedeiros convenientes. Por exemplo, em S. cerevisiae parece que a natureza do penúltimo aminoácido determina se a metionina do terminal N é removida. Mais ainda, a natureza do penúltimo aminoácido também determina se o aminoácido do terminal N é Να-acetilado (Huang et al., Biochemistry 26:8242-8246, 1987). Um outro exemplo compreende um polipeptido destinado a secreção devido à presença de um lider secretor (v.g., um péptido de sinal), se o polipeptido for modificado por glicosilação ligada a N ou ligada a 0. (Kukuruzinska et al., Ann. Rev. Biochem. 56:915-944, 1987).
Expressão em leveduras
Os polipeptidos aparentados com ORF0657n são expressos, preferencialmente, em leveduras utilizando ácidos nucleicos codificadores que contenham codões optimizados para expressão em leveduras. A expressão em leveduras pode ser efectuada utilizando um gene recombinante que codifique um polipeptido aparentado com ORF0657n, e regiões reguladoras para a expressão em leveduras. Consoante o sistema de expressão utilizado, assim a proteína produzida pode permanecer intracelular ou ser excretada para fora da célula.
De preferência, o promotor para a expressão de genes recombinantes é um promotor induzível, tal como um promotor obtido a partir do "cluster" (grupo) de genes da galactose de leveduras (um promotor GAL, tal como GALl, GAL7, GAL10, MELl), ou o promotor da fosfatase ácida PH05, ou o promotor da desidrogenase II do álcool ADH2, ou o promotor da 33 metalotioneína regulado pelo cobre CUP1. Como exemplos de promotores "constitutivos" que é possível utilizar refere-se os promotores GAP (TDH) , PGK ou TPI. (Romanos et al., YEAST 8:423-488, 1992). A célula hospedeira de levedura, utilizada para a expressão recombinante, pode ser seleccionada ou geneticamente manipulada para facilitar a expressão de genes recombinantes. São tipicamente desejáveis mutações tais como as mutações mnn9, prbl e/ou pep4. Para aumentar a expressão a partir de promotores GAL, pode ser efectuada a sobreexpressão do factor de transcrição GAL4 (Hopper et al., patente de invenção norte-americana n° 5 068 185).
Efectua-se a optimização de codões para um hospedeiro particular substituindo os codões, que tenham um nível fraco ou moderado de expressão, por codões que tenham um nível de expressão elevado. A percentagem de codões óptimos presentes numa sequência codificadora pode variar. De acordo com diversas variantes, o número óptimo de codões (incluindo os codões inicialmente presentes e os codões introduzidos) é pelo menos 50%, pelo menos 75%, pelo menos 95% ou 100% do número total de codões. A optimização dos codões pode ser efectuada do modo seguinte: 1. para um codão particular, comparar a frequência característica do codão com a frequência global do codão utilizável pelos genes da levedura; 2. se o codão não for um daqueles que são vulgarmente utilizados pela levedura, substitui-lo por um codão óptimo para expressão elevada em células de leveduras; 3. repetir os passos (1) e (2) com diferentes codões até se obter o nível desejado de optimização dos codões; 34 4. inspeccionar a nova sequência codificadora para pesquisar sequências indesejadas que tenham sido geradas, tais como sequências indesejadas de locais de enzimas de restrição, de locais de junção, de promotores, sequências indesejadas de palindromas ou repetições, sequências terminadoras de transcrição e frequência elevada de bases GC; remover as sequências indesejadas, utilizando um codão alternativo. 0 recurso a um codão alternativo está descrito na obra de Lathe, J. Molec. Biol., 183:1-12, 1985. A maneira de utilizar codões em diferentes leveduras hospedeiras é perfeitamente conhecida na especialidade. Por exemplo, Sharp et al., Yeast 7:657-678, 1991, descrevem a maneira de utilizar codões sinónimos em Saccharomyces cerevisiae.
As figuras 8C-8M ilustram sequências optimizadas de ácidos nucleicos de leveduras. A figura 8C indica uma sequência optimizada de ácidos nucleicos de leveduras (SEQ ID NO: 31) que codifica a SEQ ID NO: 28 sem um identificador d mHis no terminal carboxilo. A figura 8D indica uma sequência optimizada de ácidos nucleicos de leveduras (SEQ ID NO: 32) que codifica a SEQ ID NO: 3. A figura 8E indica uma sequência optimizada de ácidos nucleicos de leveduras (SEQ ID NO: 33) que codifica a SEQ ID NO: 1. As figuras 8F-8M indicam sequências optimizadas de ácidos nucleicos de leveduras (SEQ ID NOs: 34-41) que codificam a SEQ ID NO: 7 que contém uma metionina no terminal amino. As figuras 8N-8U indicam sequências optimizadas de ácidos nucleicos de leveduras (SEQ ID NOs: 46-53) que codificam diferentes polipeptidos aparentados com ORF0657n, com base na SEQ ID NO: 17 ou SEQ ID NO: 20. 35 A expressão em leveduras pode ser conseguida utilizando sequências optimizadas e sequências não optimizadas para a expressão em leveduras (v.g., os nucleótidos 1-1935 ou 124-1458 da SEQ ID NO: 29, ou os nucleótidos 1-1710 da SEQ ID NO: 30) . Nos exemplos infra estão ilustradas técnicas para a expressão em leveduras, utilizando sequências optimizadas e sequências não optimizadas. A ORF0657n é uma proteína da superfície que contém um sinal de endereçamento para a parede celular do terminal C com 36 aminoácidos, com um motivo conservado "LPXTG". (Schneedwind et al. 1993, EMBO, 12: 4803-4811,1993). As proteínas que contêm um sinal de endereçamento para a parede celular estão presas ao invólucro da parede celular por meio de um mecanismo de transpeptidação catalisado pela sortase, que é uma proteína ligada à membrana (Mazmanian et al, Science 299:906-909, 2001). Para ficar presa, a proteína da superfície tem de conter também um péptido de sinal do terminal N exportável para a via secretora. Na via secretora, o péptido de sinal é removido e o sinal de selecção da parede celular facilita a retenção na via secretora. A sortase realiza então a clivagem entre a treonina e a glicina do motivo LPXTG e catalisa a formação de uma ponte amida entre o grupo carboxilo da treonina e o grupo amino das pontes cruzadas do peptidoglicano.
Concluiu-se que a expressão em leveduras aumentava significativamente removendo a sequência de endereçamento para a parede celular. Em diversas variantes, às construções codificadoras de polipeptidos falta-lhes uma sequência que codifique o endereçamento para a parede celular funcional e, mais preferencialmente, faltam-lhes as 36 sequências que codificam o endereçamento para a parede celular funcional e o péptido de sinal. Aos correspondentes péptidos preferenciais aparentados com ORF0657n falta-lhes uma sequência de endereçamento para a parede celular funcional ou faltam-lhes simultaneamente as sequências de endereçamento para a parede celular e do péptido de sinal.
Noutras variantes, não estão presentes, no polipeptido ou no ácido nucleico que codifica o polipeptido, pelo menos quase toda a sequência de endereçamento para a parede celular ou simultaneamente ambas as sequências de endereçamento para a parede celular e do péptido de sinal. Noutras variantes, a expressão da proteína aumenta pelo menos cerca de 10 vezes, pelo menos cerca de 15 vezes ou pelo menos cerca de 20 vezes, removendo pelo menos quase toda a sequência de endereçamento para parede celular ou ambas as sequências de endereçamento para a parede celular e do péptido de sinal. Mais preferencialmente, a construção codificadora contém também um ou vários codões optimizados para expressão em leveduras (v.g., S. cerevisiae).
No que diz respeito à SEQ ID NO: 2, é possível ilustrar exemplos de regiões muito parecidas, com sequências de péptido de sinal e de endereçamento para a parede celular de ORF0657n. Os aminoácidos 1-42 contêm a sequência do péptido de sinal. Os aminoácidos 609-645 contêm a sequência de endereçamento para a parede celular.
Adjuvantes
Os adjuvantes são substâncias que podem ajudar um imunogénio a produzir uma resposta imunitária. Os adjuvantes podem actuar por meio de diferentes mecanismos, 37 tais como um ou vários dos seguintes: aumentar o período de semi-vida imunológica ou biológica do antigénio; melhorar o fornecimento de antigénios às células que apresentam antigénios; melhorar o processamento de antigénios e a sua apresentação por células que apresentam antigénios; e induzir a produção de citoquinas imunomoduladoras. (Vogel, Clinicai Infectious Diseases 30 (suppl. 3):S266-270, 2000). É possível utilizar um conjunto de diferentes tipos de adjuvantes para ajudar a produzir uma resposta imunitária. Como exemplos de adjuvantes particulares refere-se os seleccionados entre hidróxido de alumínio, fosfato de alumínio ou outros sais de alumínio, fosfato de cálcio, motivos CpG de ADN, lípido A monofosforílico, toxina da cólera, toxina de E. coli instável ao calor, toxina da tosse convulsa, dipeptido muramílico, adjuvante incompleto de Freund, MF59, SAF, complexos imunoestimuladores, lipossomas, microesferas biodegradáveis, saponinas, copolímeros de bloco não iónicos, análogos do péptido muramílico, polifosfazeno, polinucleótidos sintéticos, IFN-γ, IL-2, IL-12 e ISCOMS. (Vogel Clinicai Infectious Diseases 30 (suppl 3):S266-270, 2000, Klein et al., Journal of Pharmaceutical Sciences 89:311-321, 2000, Rimmelzwaan et al., Vaccine 19:1180-1187, 2001, Kersten Vaccine 21:915-920, 2003, 0'Hagen Curr. Drug
Target Infect. Disord., 1:273-286, 2001).
Pacientes para lhes induzir imunidade protectora O termo "paciente" designa qualquer mamífero que possa ser infectado com S. aureus. É possível tratar um paciente profilática ou terapeuticamente. O tratamento profilático confere uma imunidade protectora suficiente para reduzir a 38 probabilidade ou a gravidade de uma infecção provocada por S. aureus. 0 tratamento terapêutico pode ser efectuado com a finalidade de se reduzir a gravidade de uma infecção provocada por S. aureus. É possível fazer um tratamento profilático utilizando uma vacina que contenha um imunogénio aqui descrito. Tal tratamento é efectuado, preferencialmente, num ser humano. As vacinas podem ser administradas, generalizadamente, a uma população ou às pessoas sujeitas e um maior risco de infecção provocada por S. aureus.
As pessoas sujeitas a um risco maior de infecção provocada por S. aureus são os trabalhadores que prestam cuidados de saúde, os pacientes hospitalizados, os pacientes com um sistema imunitário deprimido, os pacientes sujeitos a cirurgia, os pacientes que tenham recebido implantes corporais exógenos, tais como um cateter ou um dispositivo vascular, os pacientes sujeitos a uma terapia que reduza a imunidade, as pessoas com queimaduras ou ferimentos e as pessoas que trabalhem em profissões em que haja um risco maior de queimaduras ou lesões. (The Staphylococci in Human Disease, Crossley and Archer (ed.), Churchill Livingstone Inc. 1997).
Os pacientes não humanos que podem ser infectados com S. aureus são seleccionados entre bovinos, suínos, ovinos, caprinos, lagomorfos, equídeos, cães, gatos e murganhos. 0 tratamento de pacientes não humanos é útil para protecção de animais de companhia e animais de abate e também para avaliar a eficácia de um tratamento particular. 39
Resposta anamnéstica
Concluiu-se que os polipeptidos aparentados com ORF0657n produzem uma resposta imunitária rápida e eficaz em macacos Rhesus após uma dose única. (Ver o exemplo 17, infra). A resposta observada foi consistente com uma resposta anamnéstica. A produção de uma resposta anamnéstica proporciona vantagens significativas, tais como a aptidão para conferir uma imunidade eficaz, utilizando uma dose única, e para conferir a imunidade eficaz num curto intervalo de tempo. Em variantes diferentes, a resposta amnéstica tem como resultado um aumento da média geométrica das titulações pelo menos igual a 3 vezes, pelo menos igual a 5 vezes ou pelo menos igual a 6 vezes, comparativamente com as titulações preexistentes, sendo o número de vezes desses aumentos produzido ao fim de 3, 5, 7, 9, 14 ou 21 dias. A aptidão para gerar rapidamente uma resposta imunitária eficaz permite uma redução de custos, comparativamente com as vacinações de doses múltiplas, e pode servir para vacinar um paciente sujeito a um risco maior de infecção provocada por S. aureus. As pessoas sujeitas a um risco maior de infecção provocada por S. aureus são os trabalhadores que prestam cuidados de saúde, os pacientes hospitalizados, os pacientes com um sistema imunitário deprimido, os pacientes sujeitos a cirurgia, os pacientes que tenham recebido implantes corporais exógenos, tais como um cateter ou um dispositivo vascular, os pacientes sujeitos a uma terapia que reduza a imunidade, as pessoas com queimaduras ou ferimentos e as pessoas que trabalhem em profissões em que haja um risco maior de 40 queimaduras ou lesões. (The Staphylococci in Human Disease, Crossley and Archer (ed.), Churchill Livingstone Inc. 1997). Em variantes diferentes, um paciente é vacinado imediatamente ou ao fim de 3, 5, 7, 9, 14 ou 21 dias após um procedimento médico.
Vacinas combinadas
Os polipeptidos aparentados com ORF0657n, que conferem imunidade protectora, podem ser utilizados por si sós ou em combinação com outros imunogénios, para indução de uma resposta imunitária. Os outros imunogénios suplementares que também podem estar presentes são: um ou vários imunogénios suplementares de S. aureus, tais como os referenciados nos 'antecedentes da invenção', supra; um ou vários imunogénios que ataquem um ou vários organismos Staphylococcus diferentes, tais como S. epidermidis, S. haemolyticus, S. warneri ou S. lugunensis; e um ou vários imunogénios que ataquem outros organismos infecciosos.
Sistema de modelo com animais
Utilizou-se um sistema de modelo com animais para avaliar a eficácia de um polipeptido para produzir uma resposta imunitária protectora contra S. aureus. Foram encontrados dois obstáculos na concepção de um modelo de protecção com animais, designadamente: (1) a necessidade de uma dose estimulante muito elevada para superar a imunidade inata e (2) o ritmo a que os animais morrem é demasiadamente rápido para permitir a detecção de uma resposta protectora. Concretamente, os murganhos sucumbiram 41 à infecção em menos de 24 horas após terem sido infectados com as bactérias, o que não proporciona um período suficiente para que as respostas imunitárias concretas resolvam a infecção. Quando se reduziu a dose, tanto os murganhos de controlo como os murganhos imunizados sobreviveram à infecção.
Os obstáculos foram ultrapassados recorrendo a um modelo de letalidade com cinética reduzida, envolvendo o microrganismo S. aureus, a partir de células em fase estacionária, com titulação conveniente e com administração por via intravenosa. Esta cinética lenta, em termos de mortes, proporciona um tempo suficiente para que as defesas imunitárias específicas possam combater a infecção bacteriana (v.g., 10 dias em vez de 24 horas).
As células de S. aureus em fase estacionária podem ser obtidas a partir de células criadas em meio sólido. Também podem ser obtidas a partir de um meio líquido; no entanto, os resultados obtidos com células criadas em meio sólido foram mais reproduzíveis. As células podem ser criadas, convenientemente, de um dia para outro em meio sólido. Por exemplo, é possível criar S. aureus num período compreendido entre cerca de 18 e 24 horas, em condições em que o tempo para sua duplicação é de cerca de 20-30 minutos.
Os microrganismos Staphylococcus podem ser isolados a partir de meios sólidos ou líquidos, recorrendo a técnicas convencionais para manter a potência dos Staphylococcus. Os Staphylococcus isolados podem ser guardados, por exemplo, a -70°C, sob a forma de uma suspensão de alta densidade (> 109 unidades formadoras de colónias (UFC)/mL) em soluto salino tamponado com fosfato, contendo glicerol. 42 0 inoculo de Staphylococcus deve ter uma potência que determine entre cerca de 80 e 90% de mortes no modelo com animais ao longo de um período de cerca de 7 a 10 dias, começando no primeiro ou no segundo dias. As experiências de titulação podem ser realizadas utilizando os modelos com animais para monitorizar a potência do inoculo de Staphylococcus. As experiências de titulação podem ser realizadas cerca de uma a duas semanas antes de uma experiência de inoculação. A potência inicial para as experiências de titulação podem basear-se em experiências prévias. Para a estirpe 'Becker' do modelo animal, concluiu-se que um inoculo adequado de S. aureus está compreendido, geralmente, no intervalo entre 5 x 108 e 8 x 108 UFC/mL.
Administração
Os imunogénios podem ser formulados e administrados a um paciente utilizando os preceitos aqui apresentados, conjuntamente com técnicas bem conhecidas na especialidade. Por exemplo, é possível encontrar linhas de orientação para administração farmacêutica, em geral, nas obras 'Vaccines Eds. Plotkin e Orenstein, W.B. Sanders Company, 1999; Remington's Pharmaceutical Sciences 20a Edição, Ed. Gennaro, Mack Publishing, 2000; e Modern Pharmaceutics 2a Edição, Eds. Banker e Rhodes, Mareei Dekker, Inc., 1990.
Os veículos farmaceuticamente aceitáveis possibilitam a armazenagem e a administração de um imunogénio a um paciente. Os veículos farmaceuticamente aceitáveis podem conter diversos componentes, tais como tampões, água estéril para injecções, soluto salino normal ou soluto 43 salino tamponado com fosfato, sacarose, histidina, sais e polissorbatos.
Os imunogénios podem ser administrados por vias diferentes, tais como as vias subcutânea, intramuscular ou pelas mucosas. A administração subcutânea e intramuscular pode ser feita utilizando, por exemplo, agulhas ou injectores de jacto. os regimes adequados de doseamento são determinados, preferencialmente, tomando em consideração factores perfeitamente conhecidos na especialidade, incluindo a idade, a massa corporal, o sexo e o estado de saúde do paciente; a via de administração; o efeito desejado; e o composto particular utilizado. 0 imunogénio pode ser utilizado em protocolos de vacinação de doses múltiplas. Admite-se que uma dose possa estar contida no intervalo entre 0,1 pg e 1,0 mg de polipeptido total. Noutras variantes da presente invenção, o intervalo está compreendido entre 0,01 mg a 1,0 mg e entre 0,1 mg a 1,0 mg. A posologia irá depender de factores perfeitamente conhecidos na especialidade. Após a primeira administração, se tal for necessário para um determinado indivíduo, é possível administrar-lhe depois uma ou várias doses de reforço para manter as concentrações de anticorpos ou para as reforçar. Um exemplo de um regime de dosagem poderia ser uma administração no Io dia, uma administração ao fim de 1 mês, uma terceira dose ao fim de 4, 6 ou 12 meses e doses suplementares de reforço em datas mais afastadas, se necessário. 44
Geração de anticorpos E possível utilizar um polipeptido aparentado com ORF0657, capaz de induzir imunidade protectora, para gerar anticorpos e fragmentos de anticorpos que se ligam ao polipeptido ou a S. aureus. Tais anticorpos e fragmentos de anticorpos têm aplicações diferentes, incluindo a sua utilização na purificação de polipeptidos, na identificação de S. aureus ou no tratamento terapêutico ou profilático contra uma infecção provocada por S. aureus.
Os anticorpos podem ser policlonais ou monoclonais. As técnicas para a produção e utilização de anticorpos são perfeitamente conhecidas na especialidade. Como exemplo de tais técnicas refere-se as descritas por Ausubel em 'Current Protocols in Molecular Biology', John Wiley, 1987-1998, Harlow et al., Antibodies, A Laboratory Manual, Cold Spring Harbor Laboratory, 1988 e Kohler et al., Nature 256:495-497, 1975.
EXEMPLOS
Os exemplos adiante descritos servem para ilustrar diferentes particularidades da presente invenção. Os exemplos também ilustram uma metodologia útil para a prática da invenção. Estes exemplos não limitam a invenção reivindicada.
Exemplo 1: utilização da região ORFQ657n para conferir imunidade protectora
Este exemplo ilustra a aptidão da região ORF0657n de comprimento completo para conferir imunidade protectora. 45
Clonagem e expressão de ORFO657n
Foram concebidos iniciadores de PCR para amplificar o gene que codifica ORF0657n, começando no primeiro residuo asparagina e terminado antes do codão de terminação no residuo asparagina terminal. Estes iniciadores de PCR continham também os locais suplementares Ncol (iniciador directo) e Xhol (iniciador reverso) para facilitar a clonagem no vector de expressão. A proteína codificada foi concebida para ser expressa a partir do vector pET28 com os resíduos His terminais e com codão de terminação codificado pelo vector. Além disso, acrescentou-se um resíduo glicina à proteína a seguir ao iniciador metionina. A sequência resultante de ADN amplificado codifica ORF0657n com uma cauda de His no terminal carboxilo (SEQ ID NO: 28).
As sequências amplificadas por PCR foram ligadas ao vector pET28 (Novagen), utilizando os locais Ncol/Xhol que haviam sido geneticamente manipulados nos iniciadores de PCR e introduzidos na estirpe DH5a de E. coli (Invitrogen), por choque térmico. A mistura de transformação ficou a desenvolver-se de um dia para o outro em placas de ágar 'Luria-Bertani (LB)' contendo canamicina na concentração de 100 yg/mL, a 37°C. Efectuou-se a selecção das colónias que ficaram depois a desenvolver-se em LB contendo canamicina na concentração de 30 yg/mL, foram feitas minipreparações de ADN (Promega) e determinou-se a integridade da inserção por digestão de restrição e PCR. Efectuou-se a sequenciação de quatro minipreparações com um tamanho de inserção correcto, utilizando os iniciadores M13F (SEQ ID NO: 65), 46 M13R (SEQ ID NO: 66), ORF0657nF (SEQ ID NO: 67) e ORF0657nR (SEQ ID NO: 68) . Seleccionou-se um clone que não continha nenhumas alterações de ADN, a partir da sequência desejada. Efectuou-se a transformação de células HMS174(DE3) de E. coli (Novagen) que ficaram a desenvolver-se em placas de LB contendo canamicina (30 pg/mL); foram seleccionadas 3 colónias (UnkC-1, UnkC-2 e UnkC-3) para testes de expressão. As culturas líquidas de LB (canamicina) ficaram a incubar a 37°C, a 250 r.p.m., até se observar um valor A60o compreendido entre 0,6 e 1,0 e depois foram induzidas pela adição de IPTG até à concentração final de 1 mM, seguindo-se mais três horas de incubação. Efectuou-se uma colheita das culturas por centrifugação a 5000 x g durante 5 minutos a 4°C. Com as células preparou-se nova suspensão em 500 pL de tampão de lise (Bug Buster, com inibidores das proteases, Novagen). Acrescentou-se igual volume de tampão de carga (enriquecido com β-mercaptoetanol a 5% no volume final), antes de se ter aquecido as amostras a 70°C durante 5 minutos. Os extractos foram experimentados sobre géis 'Novex' contendo 4-20% de Tris-glicina, tendo as proteínas sido visualizadas (por coloração com o corante azul de Coomassie) e transferidas para nitrocelulose e hibridadas com uma sonda com anticorpos anti-HIS6 (Zymed).
Purificação de ORF0657n
Realizou-se um aumento directo, à escala, do processo em pequena escala descrito antes, em fermentadores de depósitos agitados (escala correspondente a 75 litros), com um volume de trabalho de 50 litros. Produziu-se uma cultura 47 de inoculo num balão de 250 mL contendo 50 mL de meio de Luria-Bertani (LB) (mais canamicina) e inoculou-se com 1 mL de uma cultura inoculante congelada e subsequente cultura durante 3 horas. Utilizou-se 1 mL deste inoculo para inocular um balão de 2 litros contendo 500 mL de meio LB (mais canamicina) e manteve-se tudo a incubar durante 16 horas. Produziu-se uma cultura num grande fermentador, à escala (escala de 75 litros,) contendo 50 litros de meio LB (mais canamicina). Os parâmetros de fermentação no fermentador foram os seguintes: pressão = 5 psig, velocidade de agitação = 300 r.p.m., caudal de ar = 15 litros/minuto e temperatura = 37°C. As células ficaram a incubar até se obter uma densidade óptica (DO) igual a 0,8 unidades de densidade óptica, para um comprimento de onda de 600 nm, com indução feita com isopropil-p-K-tiogalactosido (IPTG) com uma concentração igual a 1 mM. 0 período de indução, com IPTG, foi de três hortas. Efectuou-se a colheita das células diminuindo a temperatura para 15 °C e depois fez-se uma concentração recorrendo a uma passagem através de um cartucho de fibras ocas de 500KMWCO, com a subsequente centrifugação a 9 000 vezes o valor da gravidade a 4°C durante 20 minutos. Fez-se a decantação dos sobrenadantes e congelou-se a -70°C os agregados celulares húmidos de E. coli.
Com células recombinantes de E. coli (19,2 g de células húmidas) preparou-se uma suspensão em tampão de lise (Tris-HC1 50 mM a pH 8,0, NaCl 0,1 M, MgCl2 2 mM, imidazol 10 mM, 0,1 % de Tween 80™ e guanidina-HCl 6 M), à razão de 8 mL por grama de células húmidas. Acrescentou-se à suspensão uma mistura iniciadora de proteases para utilização com proteínas com identificador de poli-histidina (Sigma, P8849), à razão 48 de 0,05 mL por grama de massa celular. Além disso, acrescentou-se lisozimas até à concentração de 1 mg/mL e acrescentou-se também Benzonase™ (EM Ind.), à razão de 1 pL/mL. A citólise foi efectuada fazendo passar a suspensão através de um microfluidificador a trabalhar a 14 000 psi (modelo 110S da Microfluidics) , quatro vezes a 4°C. Juntou-se os resíduos celulares a 11 000 x g durante 30 minutos a 4°C e conservou-se o sobrenadante.
As proteínas portadoras da cauda de His foram purificadas a partir do sobrenadante. Misturou-se o sobrenadante com 20 mL de agarose Ni+-NTA (Qiagen) a 4°C, com inversões suaves durante 24 horas. Verteu-se a mistura numa coluna aberta (1,5 cm x 20 cm) e recolheu-se uma massa com a fracção não ligada. Lavou-se a coluna com tampão de lavagem (Tris-HCl 20 mM a pH 8,0, NaCl 0,15 M, 0,1% de Tween 80™) . O ORF0657n com o identificador de His foi objecto de eluição com um gradiente escalonado de imidazol 300 mM, Tris-HCl 20 mM a pH 7,5, NaCl 0,15 M, 0,1% Tween 80™.
As fracções que continham o ORF0657n (SEQ ID NO: 28) com a cauda de His foram detectadas pelo protocolo de SDS-PAGE e coloração com o corante de Coomassie, tendo sido todas reunidas. As fracções reunidas foram filtradas através de um filtro de 0,2 pm, para remoção do material constituído por partículas diminutas, e depois foram aplicadas numa coluna de exclusão de tamanhos (coluna de 'Sephacryl S-300 26/60', Amersham Biosciences) e fez-se a eluição com uma caudal de 1 mL/minuto, em que se utilizou MOPS 10 mM a pH 7,1 e NaCl 150 mM. As fracções que continham o ORF0657n com a cauda de His foram detectadas pelo protocolo de SDS-PAGE, com coloração com o corante de 49
Coomassie e pela transferência de 'Western' (anti-tetra His Mab, Qiagen). Removeu-se a endotoxina por filtração através de um biofiltro 'Zeta-Plus™' (CUNO). Determinou-se a concentração das proteínas por BCA (Pierce). Determinou-se a pureza por densitometria dos géis corados com o corante de Coomassie.
Exemplo 2: preparação do inoculo de S. aureus
Produziu-se S. aureus em placas de ágar de soja tríptica (TSA) (Becton Dickinson, Sparks, MD) a 37°C, de um dia para o outro. As bactérias foram removidas das placas de TSA por lavagem, acrescentando 5 mL de PBS a uma placa e recolocando suavemente em suspensão as bactérias com um espalhador estéril. Centrifugou-se a suspensão bacteriana a 6000 r.p.m. durante 20 minutos, utilizando uma centrifugadora 'Sorvall RC-5B' (DuPont Instruments). Com a massa obtida preparou-se nova suspensão em glicerol a 16%, tendo sido guardadas aliquotas congeladas a -70°C.
Antes da sua utilização, os inóculos foram descongelados, convenientemente diluídos e utilizados para provocar a infecção. Cada lote foi titulado pelo menos 3 vezes para se determinar a dose adequada para induzir, em cinética retardada, a morte de murganhos vulgares. A potência do inoculo bacteriano (aptidão para aniquilar 80 a 90% dos murganhos) foi monitorizada constantemente para se garantir a reprodutibilidade do modelo. Dez dias antes de cada experiência com o inoculo infeccioso, preparou-se um grupo de 10 animais de controlo (imunizados apenas com adjuvante) que foram depois monitorizados. 50
Exemplo 3: estudos de protecção utilizando polipeptidos aparentados com ORFQ657n com a cauda de His
Efectuou-se a imunização de 25 murganhos BALB/c com três doses de ORF0657n (SEQ ID NO: 28) com a cauda de His, à razão de 20 pg por dose, em adjuvante de hidroxifosfato de alumínio (450 pg por dose) . 0 adjuvante de hidroxifosfato de alumínio (AHP) foi descrito por Klein et ai., Journal of Pharmaceutical Sciences 89, 311-321, 2000. As doses foram administradas sob a forma de duas injecções intramusculares de 50 pL nos dias 0, 7o e 21°. Retirou-se o sangue dos murganhos ao 28° dia, tendo os seus soros sido pesquisados pelo protocolo de ELISA para se investigar a reactividade ao ORF0657n com a cauda de His.
Ao 35° dia da experiência, os murganhos foram inoculados por injecção intravenosa de S. aureus, segundo uma dose de 7,3 x 108 UFC/mL, determinada em experiências de titulação, para provocar a morte ao longo de um período aproximadamente entre 2 e 7 dias. Avaliou-se a sobrevivência neste modelo letal, com mortes com uma cinética retardada, por comparação com um conjunto de murganhos de controlo que haviam sido apenas pseudo-imunizados com AHP. Os murganhos foram monitorizados ao longo de um período de 14 dias para se verificar a sua sobrevivência (Figura 3A) . No final da experiência sobreviveram 11 murganhos do grupo imunizado com ORF0657n, comparativamente com três que sobreviveram no grupo de controlo em que os animais receberam AHP.
As figuras 3B e 3C ilustram a protecção utilizando os polipeptidos correspondentes às regiões ORF0657nH e ORF0657nI. A figura 3B ilustra a protecção com a SEQ ID NO: 51 4 que contém uma cauda de His no terminal carboxilo. A figura 3C ilustra os resultados obtidos com a SEQ ID NO: 5 que contém uma cauda de His no terminal carboxilo.
Exemplo 4: obtenção de sequências de ORFQ657n
Tem sido atribuído ao ORF0657n uma função na aquisição de ferro em S. aureus. (Andrade et al., Genome Biology 3(9):47.1-47.5, 2003). Têm sido atribuídas às sequências de ORF0657n, algumas delas provenientes de fontes diferentes, designações diferentes em obras diferentes. (Ver, por exemplo, Et z et al., PNAS USA, 99:6573-6578, 2002 (LPXTGVI); Baba et al. , The Lancet 359:1819-1827, 2002 (MW1011); Kuroda, et al . , The Lancet 357, 1225-1240, 2001 (SA0976); Andrade et al., Genome Biology 3(9):47.1-47.5, 2003 (S_aur2); Mazmanian et al., Science 299:906-909, 2003 (isdB); Mazmanian et al., Molecular Microbiology 40:1049-1057, 2001. (sasJ); e Taylor et al., Mol. Microbiol. 43:1603-1614, 2002 (sirH). Há uma sequência polipeptídica, correspondente a uma sequência de uma proteína ORF0 657n que vem sendo apresentada em diversas publicações de patentes de invenção (Meinke et al., patente de invenção internacional número WO 02/059148, publicada a 1 de Agosto de 2002, Wang et al., patente de invenção internacional número WO 02/077183, publicada a 3 de Outubro de 2002, Masignani et al., patente de invenção internacional número WO 02/094868, publicada a 28 de Novembro de 2002, Foster et al. , patente de invenção internacional número WO 02/102829, publicada a 27 de Dezembro de 2002 e Foster et al., patente de invenção 52 internacional com o número WO 03/011899, publicada a 13 de Fevereiro de 2003) . O ADN genómico foi obtido a partir de diversos isolados clínicos de S. aureus. Acrescentou-se os isolados clínicos a 3 mL de caldo de soja tríptico da Difco (Becton Dickinson, Sparks, MD) e manteve-se tudo a incubar de um dia para o outro a 37°C e a 150 r.p.m.. As culturas produzidas de um dia para o outro foram centrifugadas em tubos de Eppendorf de 1,5 mL a 14 000 r.p.m. durante 5 minutos. Decantou-se o caldo de cultura e com as massas obtidas preparou-se nova suspensão em 500 pL de tampão para a nova suspensão (25% de sacarose, Tris 10 mM a pH 7,5) . Acrescentou-se uma aliquota de uma solução de lisostafina (Sigma-Aldrich, St. Louis, MO), com uma concentração de 2 mg/mL, a cada massa recolocada em suspensão. As suspensões ficaram depois a incubar a 37°C durante 1 hora.
No final do período de incubação, acrescentou-se 250 pL de SDS a 2% a cada tubo e remexeu-se vigorosamente até a viscosidade da solução diminuir declaradamente. Acrescentou-se 250 pL de uma solução de fenol-clorofórmio-isoamilo (25:24:1, v/v) (Gibco/Invitrogen Corporation, Grand Island, NY) . Remexeu-se a mistura vigorosamente durante 30 segundos e centrifugou-se durante 5 minutos a 14 000 r.p.m.. Removeu-se a fase aquosa superior e repetiu-se os passos de precipitação até não haver praticamente nenhuma interface. Acrescentou-se 0,1 volume de NaOAc 3M a pH 4,8 a cada tubo e misturou-se. Depois acrescentou-se 1 volume de isopropanol e misturou-se outra vez. Manteve-se os tubos a incubar durante 5 minutos à temperatura ambiente e depois foram centrifugados a 14 000 r.p.m. durante 15 minutos. Decantou-se o sobrenadante e deixou-se os tubos secar, com a parte de 53 cima voltada para baixo, sobre tecido. Com as massas obtidas preparou-se nova suspensão em 50 pL de H20 estéril. O ADN isolado foi utilizado como um molde para a PCR. Amplificou-se o gene utilizando um iniciador directo (ORF0657nF, SEQ ID NO: 67) e um iniciador reverso (ORF0657nR, SEQ ID NO: 68). Os produtos de PCR foram sequenciados recorrendo aos protocolos convencionais ' Big Dye' .
Exemplo 5: comparação de diversos ORFQ657n provenientes de diferentes isolados de S. aureus
Verificou-se que o ORF0657n está bem conservado em todo um conjunto de isolados clínicos de S. aureus patológica e taxonomicamente diversificados. O quadro 3 apresenta um resumo dos valores percentuais de identidade entre diferentes isolados, incluindo os isolados clínicos.
Quadro 3
Estirpe MLST Fonte País CP ORF0657n % ID CL-1 1 Isolado hipervirulento de sangue de pessoas contagiadas Reino Unido MSSA 8 99 MW2 1 Isolado hipervirulento de sangue de pessoas contagiadas E.U.A. MRSA 8 99 54
Estirpe MLST Fonte País CP ORF0657n % ID CL-2 1 Lesão do antebraço esquerdo E.U.A. MSSA 8 99 CL-3 1 Lesão do braço E.U.A. MSSA 8 99 CL-4 5 Pé esquerdo E.U.A. MRSA 5 99 CL-5 5 Lesão E.U.A. MRSA 5 100 Um 5 0 5 Pus, infecção da lesão cirúrgica JAPÃO VISA 5 100 N315 5 Esfregaço da faringe Japão MRSA 5 100 CL-6 5 CDC3 E.U.A. MRSA/VISA 5 97 CL-7 8 Sangue Alemanha MRSA 5 98 NCTC8325 8 Estirpe laboratorial de MSSA E.U.A. MSSA 5 99 CL-8 8 Lesão da perna direita E.U.A. MRSA 5 99 CL-90 9 Narinas Reino Unido MSSA 5 97 CL-10 9 Sangue Reino Unido MSSA 5 97 CL-11 12 Sangue Holanda MSSA 8 97 CL-12 12 Narinas Reino Unido MSSA 8 97 CL-13 15 Pele do dedo esquerdo E.U.A. MSSA 8 99 CL-14 15 Pus, 'anaresle' esquerda E.U.A. MSSA 8 99 CL-15 15 Sangue Reino Unido MSSA 8 99 CL-16 22 Sangue Canadá MSSA 5 99 CL-17 22 'MRSA Barnin' Alemanha MRSA 5 98 55
Estirpe MLST Fonte País CP ORF0657n % ID CL-18 25 Sangue Canadá MRSA 5 97 CL-19 25 Sangue Reino Unido MSSA 5 97 CL-20 25 Narinas Reino Unido MSSA 5 97 CL-21 30 Fonte desconhecida mecIV Suécia MRSA 8 94 CL-22 30 Fonte desconhecida mecIV Alemanha MRSA 8 94 CL-23 36 Sangue epidémico com MRSA Reino Unido MRSA 8 94 CL-24 45 Pus do coto da perna esquerda E.U.A. MRSA 8 95 CL-25 45 Narinas E.U.A. MRSA 8 95 Becker 45 Estirpe protótipo da cápsula 8 E.U.A. MSSA 8 95 COL 88 Estirpe laboratorial MRSA E.U.A. MRSA 5 100 CL-26 97 Sangue Holanda MSSA 5 98 CL-27 97 Sangue Canadá MSSA 5 99 CL-28 97 Narinas Reino Unido MSSA 5 99 CL-29 121 Narinas, doença contagiosa Reino Unido MSSA 8 96 CL-30 121 Sangue Reino Unido MSSA 8 96 56
Estirpe ML ST Fonte País CP ORF0657n % ID CP, tipo de cápsula; MLST, sequência Multilocus característica de agrupamentos taxonómicos; MRSA S. aureus resistente à meticilina; MSSA, 5. aureus sensível à meticilina; "CL" significa isolado clínico. "ID" significa identidade. "VISA" significa S aureus intermediário de vancomicina.
Determinou-se a identidade percentual (% ID) alinhando a sequência polipeptidica com a SEQ ID NO: 2 e determinando o número de aminoácidos idênticos. Dividiu-se este número pelo número total de aminoácidos (da SEQ ID NO: 2) e depois multiplicou-se por 100 e arredondou-se para o número inteiro mais próximo.
Exemplo 6: protecção contra diferentes isolados clínicos de S. aureus
Avaliou-se a eficácia de ORF0657n como imunogénio contra diferentes isolados clínicos de S. aureus utilizando como imunogénio o ORF0657n com cauda de His (SEQ ID NO: 28) . Como inóculos infecciosos utilizou-se um subconjunto de isolados taxonomicamente diversificados, descritos no Quadro 3. As sequências de ORF0657n destes diferentes isolados eram diferentes da sequência da OFR0657n utilizada como vacina.
As estirpes infecciosas obtidas foram preparadas utilizando as técnicas descritas no Exemplo 2. Os murganhos foram imunizados e infectados utilizando as técnicas descritas no Exemplo 3, com monitorização durante 10 dias. Os inóculos infecciosos, vulgarmente utilizados nos 57 modelos, excederam bastante aqueles que são normalmente encontrados em infecções de seres humanos.
Demonstrou-se a protecção contra estirpes sensíveis e contra estirpes resistentes à meticilina. Os resultados estão ilustrados nas figuras 4A-4H.
Exemplo 7; optimização dos codões da SEQ ID NO; 28 para expressão em leveduras. A sequência de ácidos nucleicos que codifica os aminoácidos 1-646 da SEQ ID NO: 28 foi objecto de optimização dos codões para expressão em leveduras. Na figura 8C (SEQ ID NO: 31) está indicada uma sequência, com optimização dos codões, para os aminoácidos 1-646 da SEQ ID NO: 28.
Utilizou-se a SEQ ID NO: 29, sem a região codificadora da cauda de His do terminal carboxilo, como construção inicial para a optimização. A distribuição geral de utilização dos codões da sequência codificadora, antes da optimização, era: 28% de codões (179) eram muito raros ou nunca utilizados por genes de leveduras com expressão elevada e 20% (126) eram moderadamente raros.
Efectuou-se a optimização dos codões dos ácidos nucleicos que codificam os aminoácidos 1-646 da SEQ ID NO: 28, para substituir os codões que têm uma expressão diminuta ou moderada por codões com elevada expressão em leveduras. Além disso, acrescentou-se um codão de glicina à segunda posição. A optimização dos codões foi feita utilizando o programa informático MacDNAsis Pro V3.0. O quadro de parâmetros utilizados para se fazer a tradução inversa de proteínas indica a existência de codões 58 fortemente expressos em S. cerevisiae. No programa informático MacDNAsis Pro, a função utilizada foi "Translate > [Protein -->DNA]". Os resultados são gerados com o titulo "Conversão de Aminoácidos" ("Amino Acid Conversion").
Em alguns casos, há mais do que um codão fortemente expresso para um determinado aminoácido. Por exemplo, a serina é codificada por "TCT" ou "TCC". Nestes casos, utilizou-se aproximadamente números iguais dos dois codões diferentes. 0 Quadro 4 agrupa um conjunto de codões fortemente expressos em S. cerevisiae.
Quadro 4
Aminoácido codão(ões) óptimo(s) Aminoácido codão(ões) óptimo(s) Phe TTC His CAC Leu TTG Gin CAA Ile ATT, ATC Asn AAC Met ATG Lys AAG Vai GTT, GTC Asp GAC Ser TCT, TCC Glu GAA Pro CCA Cys TGT Thr ACT, ACC Trp TGG Ala GCT Arg AGA Tyr TAC Gly GGT
Todos os codões considerados como não óptimos foram trocados por codões existentes em genes fortemente expressos em leveduras, com a excepção de dois codões da alanina que foram trocados por codões existentes em genes moderadamente expressos (GCG começando nos nucleótidos 505 e 1546) de SEQ ID NO: 31. 59
Preparou-se a sequência global que codifica o ORF0657n, fazendo a hibridação e a extensão de 25 oligómeros (SEQ ID NOs: 69-93), concebidos para codificarem a sequência final desejada. Os oligómeros tinham um comprimento de 85-110 pb. Os oligómeros eram a sequência codificadora de ORF0657n. Cada oligómero tinha uma sobreposição complementar de 25-29 pb com o oligómero adjacente e o duplex tinha um valor de Tm de 80-84°C. Calculou-se este valor manualmente, atribuindo a um par de bases GC um valor de 4°C e a um par de bases AT um valor de 2 °C.
Foram realizadas sete reacções de extensão separadas, utilizando três ou quatro oligómeros sobrepostos adjacentes e iniciadores directos e reversos de PCR com um comprimento de (23-26) nt com o duplex com um valor Tm=70-72°C. Utilizou-se polimerase de ADN de Pfu espontânea (STRATAGENE, La Jolla, CA) para as reacções de PCR, tendo sido utilizado um protocolo de amplificação com as características seguintes: 95°C durante 90 segundos, um ciclo; 95°C durante 30 segundos, 55°C durante 30 segundos, 68°C durante 3 minutos para 5 ciclos, seguindo-se imediatamente uma segunda serie de reacções; 95°C durante 30 segundos, 52°C durante 30 segundos, 68°C durante 3 minutos para 20 ciclos. A reacção foi completada por incubação a 68°C durante 7 minutos. Como resultado destas reacções de PCR foram criados sete fragmentos colineares do gene (doravante aqui designados, por razões de conveniência, pelos números 1, 2, 3, 4, 5, 6 e 7).
Os fragmentos foram isolados por electroforese em gel de agarose e os produtos com as dimensões adequadas foram excisados e purificados utilizando o método 'GENE CLEAN® 60 II' (QBIOgene, Carlsbad, CA), em conformidade com as recomendações do fabricante. Os fragmentos colineares 1, 2 e 3, os fragmentos colineares 4 e 5 e os fragmentos colineares 6 e 7 foram combinados, em reacções subsequentes de PCR, com os iniciadores adequados para se obter os fragmentos A, B e C, respectivamente. O gene completo para o ORF0657n foi depois montado por meio de uma reacção suplementar de PCR em que os fragmentos A, B e C foram combinados utilizando os iniciadores distais directo e reverso. Os produto de PCR final foi isolado em gel e clonado em pCR®-BluntII-TOPO® (INVITROGEN, Carlsbad, CA), conforme recomendado pelo fabricante. Obteve-se a sequência de ADN de diversos clones independentes, tendo sido identificados os erros.
Procedeu-se a uma correcção dos erros em diferentes segmentos dos clones independentes, pUC3, pUC4 e pUC6, quer sequencialmente, utilizando o estojo de mutagenese dirigida ao local 'QUIK-CHANGE', quer simultaneamente, com o estojo de multimutagenese dirigida ao local 'QUIK-CHANGE' (STRATAGENE, La Jolla, CA) , em conformidade com as recomendações do fabricante. Obteve-se a sequência corrigida final permutando os fragmentos de restrição reparados, obtidos a partir dos três clones. Com um fragmento de Xmnl de 1,1 kb do clone pUC4 substitui-se o correspondente fragmento Xmnl de pUC3 para se construir o pUnkC 13. Com um fragmento Accl de 456 pares de bases de pUC6 substitui-se o correspondente fragmento de pUnkC 13 para se construir o pUnkCRl, tendo sido verificada a sequência de ADN. 61
Exemplo 8: construção de estirpes de Saccharomyces cerevisiae para expressão de genes recombinantes
Este exemplo ilustra as técnicas que podem ser utilizadas para se obter estirpes de Saccharomyces cerevisiae para a expressão de genes recombinantes. A criação das estirpes designadas por 1260 e 1309 está descrita adiante. Como as condições genéticas naturais de uma estirpe podem influenciar bastante as propriedades de uma estirpe para a expressão de proteínas heterólogas, considerou-se desejável construir estirpes de leveduras com diferentes condições naturais genéticas, que contivessem também diversos marcadores genéticos desejáveis: (1) uma mutação mnn9 para impedir a hiperglicosilação das proteínas segregadas, (2) mutações das proteases prbl e/ou pep4 para redução dos problemas relacionados com a proteólise e (3) sobreexpressão do factor de transcrição GAL4 com a finalidade de se aumentar a expressão a partir dos promotores GAL.
Construção da estirpe S. cerevisiae designada por 1260
Construiu-se uma estirpe inicial de S. cerevisiae da maneira a seguir descrita. Cruzou-se a estirpe Y379-5D de S. cerevisiae (MATCC, cyh2, nibl, rho~, cir°) (Livingston, Genetics 86:73-84, 1977) com a estirpe DC04 (MATCC, adel, adeX, leu2-04r cir°) (Broach et al., Cell 21:501-508, 1980) . Depois de a estirpe diplóide resultante ter sido esporulada, as tetradas foram dissecadas por procedimentos convencionais. Um dos esporos haplóides deu origem à 62 estirpe 2150-2-3 (MATOC, adel, leu2-04, cir°) . A estirpe LB-347-1C de S. cerevisiae, de tipo emparelhamento (X (MATCC, mnn9) , é a estirpe X2180-1B de S. cerevisiae (MATCC, SUC2, mal, mel, gal2, CUPl; ATCC número 204504) que contém uma mutação mnn9. A estirpe LB-347-1C foi emparelhada com a estirpe típica 2150-2-3 (MATCC, leu2-04, adel), misturando as estirpes numa placa de ágar com meios completos YEHD (Carty et al., J. Ind. Micro 2:117-121, 1987). Para a selecção dos diplóides, as estirpes emparelhadas foram replicadas em placas sobre meios mínimos sem leucina e que continham 2% de sacarose, enquanto fonte exclusiva de carbono. Após o isolamento de colónias singulares e subsequente esporulação dos diplóides, dissecou-se um asei por técnicas convencionais. Isolou-se a estirpe KHY-107, enquanto esporo haplóide singular, tendo sido caracterizado como ADEl, leu2 e mnn9 (pela técnica de coloração de Schiff). Preparou-se um lote congelado em glicerol e guardou-se a -70°C. A partir do lote congelado a -70°C preparou-se uma cultura de KHY-107 (cir+) e transformou-se com o vector pCl/1 de levedura, que contém o gene LEU2-d de levedura e que está aparentado como pJDB219 (Beggs, Nature 275:104-109, 1978), com a excepção de o ADN de pMB9 ter sido substituído pelo ADN de pBR322. Produziu-se uma cultura de transformante isolado em meio líquido selectivo (ao qual lhe faltava leucina e que continha sorbitol 1M) , tendo sido depois multiplicado através de diversas passagens por meio enriquecido (contendo sorbitol 1 M) para perder simultaneamente o ADN de pCl/1 e de 2μ. As colónias que tinham perdido pCl/1 (incapazes de se multiplicarem em meio a que faltava leucina) foram verificadas por hibridação de 63 tipo ADN-ADN para se pesquisar a presença de ADN de 2μ. Escolheu-se um clone isolado, KHY-107(cir°)-1, que não revelou a presença de nenhum ADN de 2μ, e guardou-se como lote congelado (-70°C) em glicerol.
Por disrupção de genes fez-se com que a estirpe KHY-107 (cir°)-l ficasse ura3. Construiu-se um plasmídeo contendo o gene URA3 de S. cerevisiae desmembrado por duas cópias do gene Aph3'I de Tn903. Excisou-se a cassete 5'-URA3-Aph3'I-URA3-3' para fora do vector e utilizou-se para transformar KHY-107(cir°)-1. Os transformantes que haviam integrado a cassete ura3 desmembrada foram seleccionados sobre placas de ácido 5-flúor-orótico (Kaiser, C. et al., Methods in Yeast Genetics - edição de 1994, Cold Spring Harbor Laboratory Press, (Cold Spring Harbor, Nova Iorque; 1994) paginas 214-215), e depois verificou-se que eram incapazes de se multiplicarem no meio a que faltava uracilo. Escolheu-se um clone isolado, KHY-107ura3(PN2) , e guardou-se um lote congelado (-70°C) em glicerol.
Deixou-se a estirpe KHY-107ura3(PN2) multiplicar-se em meio complexo (contendo sorbitol 1 M) e depois distribuiu-se por placas em meio sintético contendo canavanina em vez de arginina, tendo sido obtidos mutantes resistentes à canavanina (canR) . Foram produzidas preparações raiadas de mutantes espontâneos canR, para colónias isoladas, em meio sintético sólido contendo canavanina em vez de arginina. Comprovou-se que as colónias isoladas eram canl, por meio de testes convencionais de complementação genética. Escolheu-se uma colónia isolada de canl, designada por DMY10, e conservou-se sob a forma de um lote congelado (-70 °C) em glicerol. 64
Para se realizar a sobreexpressão do factor de transcrição de GAL4 de leveduras, integrou-se o gene de fusão GAL10p-GAL4 no gene HIS3 de DMY10. Excisou-se a cassete 5'-HIS3-GALl0p-GAL4-URA3-HIS3-3' para fora do pKHint-C (Schultz et al., Gene 61:123-133, 1987) e utilizou-se para transformar DMY10. Os transformantes que tinham integrado a cassete foram seleccionados sobre meio sintético sólido ao qual lhe faltava uracilo e depois verificou-se que eram incapazes de se multiplicarem no meio a que faltava histidina. Verificou-se por hibridação 'Southern' a integração da cassete apenas no local HIS3. Escolheu-se um integrante isolado, DMY10int-3, e guardou-se como lote congelado (-70°C) em glicerol. Esta estirpe recebeu a designação de CF52. 0 plasmídeo FP8ÁH portador do gene PRBI de S. cerevisiae (Moehle et al.r Genetics 115:255-263, 1987) foi digerido com HindIII mais Xhol e o fragmento de ADN de 3,2 kpb, portador do gene PRBI, foi purificado em gel e cortado com as extremidades a condizer por tratamento com polimerase de ADN de T4. 0 plasmídeo pUC18 foi digerido com BamRI, purificado em gel e cortado com a extremidades a condizer por tratamento com polimerase de ADN de T4. Ligou-se o fragmento do vector resultante com o fragmento do gene PRBI, referido anteriormente, para se obter o plasmídeo pUC18-PRBl. 0 plasmídeo YEp6 (Struhl et ai., Proc. Natl. Acad. Sei., USA 76:_1035, 1979), que continha o gene HIS3, foi digerido com BamHI. 0 fragmento de BamRI de 1,7 kpb resultante, portador do gene HIS3 funcional, foi purificado em gel e depois foi cortado com as extremidades a condizer por tratamento com polimerase de ADN de T4. 0 vector pUC18-PRBl foi digerido com EcoRV mais Ncol que efectua o corte 65 dentro da sequência codificadora de PRBl e que remove o local activo da protease B e a sequência de flanqueamento. 0 fragmento EcoRV-Ncol de 5,7 kpb, portador das porções residuais 5' e 3' da sequência codificadora de PRBl em pUC18, foi purificado em gel, cortado com as extremidades a condizer por tratamento com polimerase de ADN de T4, desfosforilado com fosfatase alcalina e ligado ao fragmento HIS3 com as extremidades a condizer descrito anteriormente. 0 plasmideo resultante (designado por pUC18-prbl::HIS3, lote #1245) contém o gene HIS3 no lugar da parcela do gene PRBl que havia sido suprimida anteriormente. 0 vector (pUC18-prbl::HIS3) de desmembramento do gene PRBl foi digerido com Saci mais XbaI para gerar uma cassete de desmembramento prbl::HIS3 e foi utilizado para transformação da estirpe CF52 pelo processo do acetato de litio (Ito et al., J Bacteriol. 153:163, 1983). Efectuou-se a selecção dos transformantes His+ sobre meio de ágar sintético ao qual lhe faltava histidina, tendo servido para se fazer uma preparação raiada no mesmo meio utilizado para os isolados clonais. Preparou-se ADN genómico a partir de diversos isolados His+ resultantes, o qual foi digerido com EcoRI e depois submeteu-se a electroforese sobre géis de agarose a 0,8%. As análises de transferência de 'Southern' confirmaram a presença do desejado desmembramento do gene prblA::HIS3.
Um dos isolados que continha o desejado desmembramento do gene prblA::HIS3 foi seleccionado para utilização subsequente e depois atribui-se-lhe a designação de estirpe #1260. Efectuou-se a preparação de lotes congelados em glicerol para a estirpe #1260 para armazenagem a -70°C. O genótipo resultante da estirpe 1260 é o seguinte: MATa, 66 leu2-2,112, mnn9, ura3D, canl, his3A::GALlOp-GAL4-URA3, prblÁ::HIS3, cir°.
Construção da estirpe de S. cerevisiae designada por 1309 A estirpe BJ1995 de S. cerevisiae (MATa, leu2, trpl, ura3-52, prbl-1122, pep4-3, gal2) foi já descrita anteriormente (Jones, E. W., Tackling the Protease Problem in Saccharomyces cerevisiae, Methods in Enzymology 194 (1991), páginas 428-453). Isolou-se um derivado cir° de BJ1995, ao qual lhe faltava o ADN do plasmideo 2μ endógeno, utilizando o procedimento descrito na construção da estirpe 1260. O isolado cir° resultante recebeu a designação de estirpe 91 e foi guardado como lote congelado (-70°C) em glicerol.
Depois construi-se um derivado da estirpe 91 que produz em excesso o factor de transcrição GAL4, com a finalidade de se aumentar a transcrição a partir dos promotores de GAL. Fez-se digerir o plasmideo pKHint-C (Schultz et ai., Gene 61:123-133, 1987) com BamEI e utilizou-se a cassete resultante 5'-HIS3-GAL10p-GAL4-URA3-HIS3-3' para transformar a estirpe 91. Os transformantes que tinham integrado a cassete foram seleccionados sobre meio sintético sólido ao qual lhe faltava uracilo, tendo-se verificado depois que eram incapazes de se multiplicarem no meio a que faltava histidina. A desejada integração da cassete no locus HIS3 foi verificada por hibridação 'Southern', utilizando uma sonda hibridante para o gene HIS3 de levedura. Escolheu-se um integrante isolado, BJ1995cir°int #22, e guardou-se como lote congelado (-70°C) 67 em glicerol. Este isolado recebeu a designação de estirpe 1282.
Depois isolou-se um derivado da estirpe 1282 que continha um desmembramento do gene MNN9, praticando o conjunto de passos a seguir descritos. Para se desmembrar o gene MNN9 foi necessário clonar, em primeiro lugar, o gene MNN9 a partir de ADN genómico de S. cerevisiae com o intuito de se preparar um vector de desmembramento do gene. Isto foi feito recorrendo a uma tecnologia convencional de PCR. Concebeu-se um iniciador directo no sentido 5' e um iniciador reverso no sentido 3' para a PCR da sequência codificadora de MNN9 de comprimento completo, com base na sequência publicada para o gene MNN9 de levedura (MacKay et al., publicação da patente de invenção europeia número EP0314096, publicação da patente de invenção internacional com a data de 3 de Maio de 1989) . Foram utilizados os seguintes iniciadores oligodesoxinucleotidicos que contêm os locais de flanqueamento HindiII (sublinhados): iniciador de sentido directo (SEQ ID NO: 94) : 5'-CTT AAA GCT TAT GTC ACT TTC TCT TGT ATC G-3'; iniciador de sentido reverso (SEQ ID NO: 95): 5'-TGA TAA GCT TGC TCA ATG GTT CTC TTC CTC-3'. 0 codão de metionina iniciador para o gene MNN9 está evidenciado a negrito.
Efectuou-se a PCR utilizando como molde ADN genómico de S. cerevisiae. 0 fragmento de 1,2 kpb resultante da PCR, portador do gene MNN9, foi digerido com HindIII, purificado em gel e ligado com fosfatase alcalina digerida com HindlII, tratada com pUC13. 0 plasmideo resultante recebeu a designação de pll83. Isolou-se o gene TRPl de levedura a partir de YRp7 (Struhl et al., Proc. Natl. Acad. Sei. USA 76:1035-1039, 1979) sob a forma de um fragmento de 0,85 kb 68 de EcóRI-BglII que foi cortado com as extremidades a condizer e inserido depois no local Pinll do plasmideo pll83. 0 local PmlI está no meio da sequência codificadora de MNN9, pelo que a inserção do qene TRPl nesse local tem como resultado o desmembramento do gene. 0 plasmideo resultante pUC13-mnn9::TRPl (pH11885-239-l) foi depois digerido com Hpal mais EcoRI e utilizou-se a cassete 5' -mnn9-TRPl-mnn9-3' para transformação da estirpe 1282 pelo método do acetato de litio. (Ito et al.r J Bacteriol. 153:163, 1983).
Efectuou-se a selecção dos transformantes Trp+ sobre placas de ágar em meio sintético a que faltava triptofano e produziu-se uma preparação raiada sobre as mesmas placas para os isolados de colónias singulares. Preparou-se o ADN genómico a partir de alguns dos isolados Trp+ resultantes, digeriu-se com HindIII e depois submeteu-se a electroforese sobre géis de agarose a 0,8%. As análises pela transferência de 'Southern' confirmaram a presença do desejado desmembramento do gene mnn9::TRP1. Um destes isolados, que continha o desejado desmembramento do gene mnn9::TRPl, foi seleccionado para utilização posterior e recebeu a designação de estirpe 1309. Com a estirpe 1309 procedeu-se à preparação de lotes congelados em glicerol para armazenagem a -70°C. O genótipo da estirpe 1309 é o seguinte: MATa, leu2, mnn9::TRPl, trpl, ura3-52, his3A::GALl0p-GAL4-URA3, prbl-1122, pep4-3, gal2, cir°.
Exemplo 9: expressão da região ORFQ657n de comprimento completo
Após a expressão de ORF0657n de comprimento completo em E. coli (SEQ ID NO: 28; His-Tag ORF0657n) e em S. 69 cerevisiae (aminoácidos 1-646 de SEQ ID NO: 28), efectuou-se a comparação dos produtos de expressão.
Expressão em S. cerevisiae 0 ADN que codifica a proteína ORF0657n com os codões optimizados para a expressão em leveduras foi amplificado a partir do clone final corrigido, pUnkCRl (Exemplo 7), utilizando os seguintes iniciadores directo e reverso, respectivamente, UnkCY-F (SEQ ID NO; 96), 5'AAC CGG TTT GGA TCC CAC AAA ACA AAA TGG GTA ACA AGC AAC AAA AGG AAT TC3' e UnkCY-R (SEQ ID NO: 97), 5'AAC CGG TTT GGA TCC TTA GTT CTT TCT CTT TCT TGG CAA GAC3', contendo locais de flanqueamento e restrição BamHI. 0 iniciador de sentido directo contém uma sequência de 5' não traduzida e o codão ATG e o iniciador de sentido reverso contém TAA enquanto codão de terminação. 0 produto de 1,9 kb resultante foi isolado em gel e clonado no vector pCR2.1 'TOPO TA' (INVITROGEN CORPORATION, Carlsbad, CA) , de acordo com as instruções do fabricante, para se construir o plasmídeo UnkC-Bl. Depois verificou-se a sequência de ADN da inserção. 0 fragmento BamEI foi isolado em gel e subclonado com a orientação correcta dentro de um vector de levedura (pGALHO, Fig. 5A) para construção de pRUnkC-pGALllO. Verificou-se a sequência da inserção por sequenciação do ADN.
Utilizou-se o ADN plasmídico proveniente de pRUnkC-pGALHO para transformar estirpes de S. cerevisiae que contêm uma mutação leu2 para prototrofia da leucina (Leu+) , recorrendo a um protocolo de transformação com esferoplastos (Hinnen et al., Proc. Natl. Acad. Sei. U.S.A, 70 75:1929-33, 1978). A construção das estirpes 1260 e 1309 está indicada no Exemplo 8, supra.
Efectuou-se a selecção de transformantes sobre meio de ágar sintético a que faltava leucina e que continha sorbitol 1M. Os meios de ágar sintéticos, superior e inferior, a que falta leucina e que contêm sorbitol 1M, foram obtidos em REMEL, Lenexa, KS (cat #09459 e 92155, respectivamente). Os isolados Leu+ clonais foram obtidos por multiplicação em série sobre placas SD menos leucina (KD MEDICAL, Columbia MD).
Para a pesquisa de transformantes múltiplos foram produzidas culturas de 5,0 mL que ficaram a desenvolver-se em tubos de cultura sujeitos a rotação lenta a 30°C. Depois confirmou-se a produção para transformantes seleccionados em culturas de 25 mL produzidas num balão de 125 mL. Em ambos os casos, foram produzidas culturas de inóculos de 5 mL desenvolvidas a 30°C em meio '5X menos leucina' contendo 4,0% de glicose e sorbitol 0,1 M, durante 18-24 horas, até se obter um valor DC>6oo entre 1,5-3,0/mL. O meio ' 5X menos leucina' contém os componentes a seguir indicados, por litro: base azotada de levedura sem acréscimo de aminoácidos ou de sulfato de amónio, 8,5 g; adenina, 0,40 g; L-tirosina, 0,25 g; uracilo, 0,20 g, ácido succinico, 10,0 g, sulfato de amónio, 5,0 g e 50 mL de solução número 3 menos leucina. A solução número 3 menos leucina contém, por litro de água destilada, os seguintes componentes: L-arginina, 2 g; L-histidina, 1,0 g; L-isoleucina, 6 g; L-lisina 4,0 g; L-metionina, 1,0 g; L-fenilalanina, 6,0 g; L-triptofano, 4,0 g. Ajustou-se o valor do pH do meio para 5,3 com uma solução de hidróxido de sódio a 50% 71
Para a produção em tubos, transferiu-se uma aliquota de 0,3 mL da cultura de inoculo para 5,0 mL de meio ' 5X menos leucina' contendo 2% de glicose, 4% de galactose ou meio YEHDG, durante 72 horas, até se obter um valor final D060o entre 5-16, 0/mL. O meio YEHDG contém, por litro: L-Hy-peptona de soja-Sheffield, 10 g; extracto de levedura, 20 g; L-dextrose, 16 g; D ( + ) galactose, 40 g. Para a produção em balões, transferiu-se uma aliquota de 1,5 mL da cultura de inoculo para 25 mL de meio e esperou-se que o desenvolvimento ocorresse conforme descrito antes, com rotação a 220 r.p.m..
Após a colheita de 10 unidades de DO por amostra, fez-se o desmembramento das massas celulares com esférulas de vidro em 0,3 mL de tampão de lise (tampão de fosfato de sódio 0,1 M a pH 7,2, NaCl 0,5 M e PMSF 2 mM). Recuperou-se o lisado por centrifugação, efectuou-se a lavagem das esférulas/células não desmembradas com 0,3 mL de tampão de lisado e depois combinou-se os sobrenadantes clarificados. Determinou-se a concentração de proteínas pelo sistema do reagente corante no ensaio proteico 'BIO-RAD' (BIO-RAD, Hercules, CA), em conformidade com as instruções do fabricante. Efectuou-se a análise dos lisados celulares para pesquisa da expressão de ORF0657n por análise de imunoblot após a electrof orese em gradiente de géis de Tris-glicina entre 4-20% (INVITROGEN, Carlsbad, CA) em tampão IX Tris-glicina SDS (BIO-RAD) em condições redutoras e desnaturantes. As amostras continham 20 pg de proteína celular total. Efectuou-se uma electroblot dos géis sobre filtros de membranas de nitrocelulose de 0,45 pm (Optitran de Schleicher e Schuell, Keene, NH) . Para se estimar o tamanho das proteínas, foram executadas, paralelamente com 72 os lisados, experiências com padrões previamente colorados, com massas atómicas entre 6,4 e 203 kDa (padrão previamente colorado de espectro largo para o protocolo de SDS-PAGE, BIO-RAD).
Padrão de E. coli
Como padrões utilizou-se o ORF0657n com cauda de His (SEQ ID NO: 28) purificado a partir da cultura de E. coli produtora (estirpe hospedeira HMS 174 (DE3) de E. coli, NOVAGEN, Madison, WI), induzida para produzir ORF0657n, e um lisado de células. A estirpe E. coli foi transformada com um vector de expressão que expressa o ORF0657n com cauda de His. O crescimento da cultura de E. coli decorreu de um dia para o outro em caldo LB contendo canamicina na concentração de 30 pg/mL a 37°C. No dia seguinte, utilizou-se 60 pL da cultura produzida de um dia para o outro para inocular 6,0 mL de caldo LB mais canamicina na concentração de 30 pg/mL. A cultura desenvolveu-se a 37°C durante um período aproximado de 3 horas até se obter um valor D06oo compreendido entre 0,4-1,0. Induziu-se a expressão com IPTG 1 mM durante 2 horas a 37°C. Efectuou-se a colheita das células e guardou-se a massa de células a -80°C.
Preparou-se o lisado de E. coli utilizando o reagente de extracção de proteínas 'Bugbuster' (NOVAGEN, Madison, WI), em conformidade com o protocolo do fabricante. Efectuou-se a imunodetecção das proteínas por transferência de 'Western', utilizando um anticorpo monoclonal de murinos ("designado por "2H2B8") contra ORF0657n, enquanto anticorpo primário, e utilizou-se como anticorpo secundário o anticorpo inteiro de cabra anti-IgG (H+L) de murganho 73 ligado à peroxidase de rábano (HRP) (ZYMED LABORATORIES, South San Francisco, CA) . 0 mAb 2H2B8 foi gerado por imunização de murganhos com ORF0657n de comprimento completo purificada, produzida por E. coli. Seleccionou-se o mAb 2H2B8 pelo protocolo ELISA e comprovou-se que era especifico para ORF0657n. 0 processamento dos filtros foi feito utilizando o estojo que contém o substrato de conjugado com HRP da BIO-RAD.
Produtos de expressão de E. coli e de S. cerevisiae A partir da pesquisa inicial de transformantes de leveduras seleccionou-se um transformante de cada uma das estirpes de leveduras 1260 e 1309, por serem as estirpes que melhor produzem a região ORF0657n de comprimento completo (SEQ ID NO: 2 8 sem a cauda de His do terminal carboxilo) . Nas figuras 6A e 6B está ilustrado um exemplo da sua produção da região ORF0657n de comprimento completo ao fim de 72 horas de fermentação em meio YEHDG, comparativamente com a produção da região ORF0657n (SEQ ID NO: 28) em E. coli. A proteína principal detectada pela análise de transferência de 'Western' com o mAb 2H2B8 tinha aproximadamente 105-110 kDa, conforme ilustrado na figura 6A (estirpe 1260) e 6B (estirpe 1309): pistas 5 e 6. A proteína que tem aproximadamente 105-110 kDa corresponde, em tamanho, à maior proteína detectada na amostra de ORF0657n recombinante purificada, produzida em E. coli (SEQ ID NO: 28; pista 2) ou num extracto de uma cultura em que se induziu a produção de ORF0657n de E. coli (esta última não está incluída nos géis da figura 6) . As proteínas de 74 105-110 kDa produzidas por E. coli e por S. cerevisiae possuem um peso molecular maior do que o peso molecular previsto no nosso sistema de electroforese em gel. Faz-se observar que as espécies predominantes detectadas nos controlos de E. coli eram mais pequenas, aproximadamente 95 kDa, e migraram conjuntamente com uma quantidade menor de proteína produzida na levedura. Admite-se que a proteína que tem -105-110 kDa corresponda à ORF0657n de comprimento completo que foi expressa com a líder secretora de E. coli, tanto em E. coli como em S. cerevisiae, e admite-se que as proteínas de 95 kDa sejam um produto de degradação. Não foi observada nenhuma detecção com um extracto de um transformante de controlo obtido com o vector pGALHO por si só (pistas 3 e 4).
Uma estimativa da quantidade de região ORF0637n (SEQ ID NO: 28 sem a cauda de His no terminal carboxilo) , produzida pelos transformantes 1260 e 1309, foi -10 pg de ORF0657n/mL de meio YEHDG com a região ORF0657n a conter -2% da proteína total, conforme determinado por análise semi-quantitativa por transferência de 'Western' utilizando como padrão 100 ng de ORF0657n (SEQ ID NO: 28) . Tanto a quantidade expressa como a percentagem (%) de região ORF0657n (SEQ ID NO: 28 sem a cauda de His no terminal carboxilo) da proteína total foram maiores ao fim de 72 horas, comparativamente com os resultados obtidos ao fim de 48 horas, em ambas as estirpes (dados não apresentados). O título da região ORF0657n (SEQ ID NO: 28 sem cauda de His no terminal carboxilo), produzido pelos transformantes da estirpe 1260 em meio '5X leucina' contendo 2% de glicose e 4% de galactose, foi -8,0 pg/mL e a percentagem total de proteína foi de 2,0%. 75
Exemplo 10: Expressão da sequência secretada optimizada ao nível dos codões que codifica uma região ORFQ657nH O vector pKH4-3B (Carty et al., Biotechnol. Lett. 12:879-884, 1990) contém a líder secretora pré-pro do factor oc de levedura (MFal) . A fusão de uma proteína desejada com esta líder tem como resultado um produto de tradução que é clivado primeiro pela peptidase de sinal de S. cerevisiae. Subsequentemente, a protease Kex2 cliva a sequir ao "resíduo Lis Arq" na líder secretora, sendo libertada a proteína madura. Utilizou-se o promotor GAL10 induzível em S. cerevisiae para comandar a expressão da proteína.
Utilizou-se o vector pKH4-3B para expressar um gene optimizado pelo codão, que codifica uma SEQ ID NO: 3 alterada. A SEQ ID NO: 3 foi alterada mediante a remoção de uma metionina do terminal amino e acrescentando uma sequência líder ao terminal amino. A região que codifica a SEQ ID NO: 3 de codões optimizados é constituída pelos nucleótidos 4-1710 da SEQ ID NO: 32, e a sequência que codifica a líder é constituída pelo vector pKH4-3B preparado conforme adiante se descreve.
Fez-se uma fusão concatenada da líder secretora pré-pro do factor cc do vector pKH4-3B para a região ORF0657nH de SEQ ID NO: 3. Isto foi realizado fazendo digerir o vector pKH4-3B com SphI, seguindo-se o tratamento com polimerase de ADN de T4 para remoção da formação saliente SphI, criando uma extremidade a condizer no terminal 5' com o codão adequado da líder. A seguir, fez-se digerir o vector com BamHI para criar o local de clonagem em 3' . A 76 construção exige um produto de PCR com uma extremidade de 5' correspondente a condizer com o segundo codão para reconstrução da região ORF0657nH (SEQ ID NO: 32), e uma extremidade 3' com um codão de terminação num local de restrição BamHI.
0 ADN que codifica a região ORF0657nH com os codões optimizados para a expressão em leveduras foi amplificado a partir de pUnkCR 1 (Exemplo 7), utilizando correspondentemente os iniciadores directo e reverso a seguir indicados: UCKHS2 (SEQ ID NO: 98), 5' GCTGAAGAAACTGGTGGTACCAAC3f e UCKHA2, (SEQ
ID NO: 99) 5'GTCACGGATCCTTAAGACTTAGCCTTGTTTTCTTGAGTGTTC3'. A extremidade 5' do iniciador directo, GCT, codifica alanina, que é o terminal N previsto para a região ORF0657nH. 0 iniciador reverso contém um codão de terminação TAA e um local BamHI (sublinhado) . 0 produto da PCR de 1,7 kb dai resultante foi isolado em gel e clonado em pH4-3B (preparado conforme descrito antes) para construção do pUS38. Verificou-se a sequência de ADN total da inserção e verificou-se a sequência parcial do vector, tendo sido comprovado que estava feita a desejada fusão com a secretora. Uma clivagem adequada, feita por Kex2p, da proteína inicial expressa a partir desta construção teria como resultado uma proteína correspondente à SEQ ID NO: 3 sem metionina no terminal N.
Utilizou-se o plasmídeo pUS38 para transformar as estirpes 1260 e 1309 de S. cerevisiae para prototrofia à leucina (Leu+) , recorrendo a um protocolo de transformação dos esferoplastos (Hinnen et ai., Proc. Natl. Acad. Sei. U.S.A. 75:1939-33, 1978). Efectuou-se a selecção dos transf ormantes em meio de ágar sintético a que faltava leucina e que continha sorbitol 1 M. Os meios de ágar sintéticos, superior e inferior, a que faltava leucina e 77 que continha sorbitol 1M provieram de REMEL, Lenexa, KS (cat #09459 e 92155, respectivamente). Os isolados Leu+ clonais foram obtidos por meio de culturas em serie feitas sobre placas de SD menos leucina (KD MEDICAL, Columbia MD).
Para a pesquisa de transformantes múltiplos foram produzidas culturas de inóculos de 5 mL a 30°C em meio '5X menos leucina' contendo 4,0% de glicose e sorbitol 0,1 M, durante 18-24, horas até se obter um valor D060o entre 1,5-3,0/mL. O meio '5X menos leucina' contém os componentes a seguir indicados, por litro: base azotada de levedura sem acréscimo de aminoácidos ou de sulfato de amónio, 8,5 g; adenina, 0,40 g; L-tirosina, 0,25 g; uracilo, 0,20 g, ácido succinico, 10,0 g, sulfato de amónio, 5,0 g e 50 mL de solução número 3 menos leucina. A solução número 3 menos leucina contém, por litro de água destilada, os seguintes componentes: L-arginina, 2 g; L-histidina, 1,0 g; L-isoleucina, 6 g; L-lisina 4,0 g; L-metionina, 1,0 g; L-fenilalanina, 6,0 g; L-triptofano, 4,0 g. Ajustou-se o valor do pH do meio para 5,3 com uma solução de hidróxido de sódio a 50%. Para a produção em tubos, transferiu-se uma aliquota de 0,3 mL da cultura de inoculo para 5,0 mL de meio ' 5X menos leucina' contendo 2% de glicose, 4% de galactose ou meio YEHDG, durante 72 horas, até se obter um valor final ϋΟεοο entre 10-20,0/mL. O meio YEHDG contém, por litro: L-Hy-peptona de soja-Sheffield, 10 g; extracto de levedura, 20 g; L-dextrose, 16 g; D(+)galactose, 40 g.
Efectuou-se a colheita dos produtos de fermentação, removendo as células das leveduras e analisando os sobrenadantes directamente para se pesquisar a expressão da região ORF0657nH (SEQ ID NO: 3) por análise de transferência de 'Western' ou pelo protocolo de SDS-PAGE e 78 coloração dos géis com o corante de Coomassie. Para a análise de imunoblot, foram utilizadas amostras de 10 a 25 pL que foram submetidas a electroforese em géis contendo Tris-HCl com um gradiente entre 4-15% (BIORAD, Hercules, CA) em tampão IX SDS contendo Tris-glicina (BIORAD, Hercules, CA) em condições redutoras e desnaturantes. Os geís foram objecto de electroblot sobre filtros constituídos por membranas de PVDF de 0,2 pm. As proteínas foram imunodetectadas com o anticorpo monoclonal 2H2B8, enquanto anticorpo primário, e com o anticorpo inteiro de cabra anti-IgG (H+L) de murganho ligado à peroxidase de rábano (ZYMED LABORATORIES, South San Francisco, CA), enquanto anticorpo secundário. O mAb 2H2B8 está descrito no Exemplo 9. O processamento dos filtros foi feito utilizando o estojo 'WESTERN LIGHTNING™ Chemiluminesence Reagent Plus' (PERKIN ELMER, Wellesley, MA).
Para a análise da expressão da região de ORF0657nH recombinante da levedura (SEQ ID NO: 3) por coloração dos géis de SDS-PAGE com o corante de Coomassie, submeteu-se as amostras a electroforese sobres géis com Tris-HCl em gradiente variável em 4-15% (BIO-RAD) em tampão IX SDS contendo Tris-glicina (BIO-RAD), em condições redutoras e desnaturantes. Os géis foram corados com corante de Coomassie 'Βίο-Safe', que é um corante Coomassie G250, em conformidade com o protocolo de fabricante (BIO-RAD).
Como padrão qualitativo utilizou-se um lisado celular obtido a partir da cultura de E. coli produtora de ORF0657nH (SEQ ID NO: com uma cauda de His no terminal carboxilo). A sequência prevista de aminoácidos da região ORF0657nH expressa em E. coli é idêntica à sequência de aminoácidos prevista para a região ORF0657nH expressa 79 internamente em S. cerevisiae (SEQ ID NO: 3), com a excepção da presença de glicina a seguir à metionina do terminal N na construção de E. coli.
Para se obter a região ORF0657nH em E. coli, deixou-se crescer a cultura produtora de um dia para o outro em caldo LB contendo canamicina com a concentração de 50 pg/mL, a 37°C. Utilizou-se a SEQ ID NO: 4 codificadora de pET28, com uma cauda de His no terminal carboxilo, para se conseguir a expressão da proteína. No dia seguinte, utilizou-se 500 pL da cultura produzida de um dia para o outro para inocular 5,0 mL de caldo LB contendo canamicina na concentração de 50 pg/mL. Deixou-se esta cultura crescer a 37°C durante aproximadamente 3 horas até se obter um valor DCpoo igual a 0,6. A expressão foi induzida com IPTG 1 mM durante 3,5 horas a 37°C. Efectuou-se a colheita das células e guardou-se a massa celular a -80°C. Preparou-se o lisado de E. coli utilizando o reagente de extracção de proteínas 'Bugbuster' (NOVAGEN, Madison, WI), em conformidade com o protocolo do fabricante.
Também se incluiu como padrão a proteína proveniente do lisado celular do transformante 1-1 de S. cerevisiae em que tem lugar a expressão interna da região ORF0657nH (SEQ ID NO: 3), conforme descrito e preparado no Exemplo 11, infra. Para se avaliar o tamanho das proteínas, foram feitas experiências paralelamente para comparação de padrões previamente corados, variando entre 10 e 250 kDa (BIO-RAD), com as amostras de géis para o protocolo de SDS-PAGE, corados com o corante de Coomassie, e por avaliação por transferência de 'Western'. A produção das espécies desejadas foi obtida em meio ' 5X menos leucina' contendo 2% de glicose mais 4% de 80 galactose. Os transformantes que continham o pUS38 de ambas as estirpes 1260 e 1309 segregaram uma proteína de ~80 kDa que migrou conjuntamente e em estreita associação com a região ORF0657nH expressa internamente na levedura (a partir da SEQ ID NO: 3 codificadora de ácido nucleico) e com a ORF0657nH expressa em E. coli (a partir da SEQ ID NO: 4 codificadora de ácido nucleico, com uma cauda de His do terminal carboxilo), que foi detectada por transferência de 'Western' e por coloração com o corante de Coomassie. Segundo uma experiência típica, submeteu-se a electroforese 500 ng destes lisados de contraprova e 25 pL de sobrenadante do meio. A detecção foi específica; a proteína de 80 kDa não foi detectada num sobrenadante de um vector que contém um transformante, nem por transferência de 'Western' nem por coloração com o corante de Coomassie. A proteína segregada, com ~80 kDa poderia corresponder à região ORF0657nH não glicosilada madura (SEQ ID NO: 3) ou então, em alternativa, podia conter alguns resíduos glicosilo. Foi detectada pelo anticorpo uma espécie de peso molecular maior nos sobrenadantes, e também duas proteínas com um peso molecular menor, tendo sido todas coloradas com o corante azul de Coomassie. A espécie de peso molecular maior poderia conter a líder não processada e/ou poderia ser gl icosilada. É provável que as duas espécies de peso molecular menor sejam produtos de degradação.
Uma estimativa da quantidade de espécie de 80 kDa segregada pelos transformantes de ambas as estirpes 1260 e 1309 foi de 2 pg/mL de meio de cultura. Fez-se esta determinação comparando o sinal 'Western' a 80 kDa com o da amostra do lisado de células de levedura que contém a região ORF0657nH (SEQ ID NO: 3), sugerindo isso que a 81 região ORF0657nH constitui pelo menos 50% da proteína total. Fez-se uma estimativa sobre a titulação combinada das espécies restantes da região ORF0657n e concluiu-se que era aproximadamente igual a 50 pg/mL de meio de cultura.
Exemplo 11: expressão intracelular das regiões ORFQ657nH (SEQ ID NO: 3) em S. cerevisiae
Obteve-se um nível bastante elevado de produção de proteínas com tamanhos distintos, por expressão intracelular da SEQ ID NO: 3 em S. cerevisiae. A expressão foi conseguida utilizando uma sequência optimizada de ácidos nucleicos, codificadora da levedura. A região ORF0657nH codificadora do ADN, com codões optimizados para a expressão em levedura (SEQ ID NO: 32) foi amplificada a partir de pUnkCRl (Exemplo 7), utilizando correspondentemente os iniciadores directo e reverso a seguir indicados: (SEQ ID NO: 100) 5'GGGG GGATCC CACAAAACAAA ATG GCT GAA GAA ACT GGT GG3' e (SEQ ID NO: 101) 5'GGG GGG GGATCC TTA AGA CTT AGC CTT GTT TTC TTG AGT3', com os locais de restrição BamEI flanqueadores (sublinhados). O iniciador directo contém a sequência líder não traduzida de 5' e o codão ATG e o iniciador reverso contém TAA, enquanto codão de terminação. O produto de 1,7 kb resultante foi isolado em gel e clonado no vector pCR2.1 'TOPO TA' (INVITROGEN CORPORATION, Carlsbad, CA) , em conformidade com as recomendações do fabricante, para se construir o plasmídeo pCR__iUC-S. Determinou-se depois a sequência de ADN da inserção a partir de dois clones independentes, pCR_iUCS2.2 e pCR_iUCS-2.4. Encontrou-se um único erro de PCR em cada uma 82 das inserções, localizado em fragmentos diferentes HindiII de cada plasmídeo. Obteve-se um plasmídeo com a sequência correcta, substituindo com o fragmento HindiII de 1,3 kb de pCR_iUC-S2.2, com a sequência correcta, o correspondente fragmento de pCR__iUC-S2.4 . 0 fragmento de 1,3 kb de pCR_iUC-S2.2 e o fragmento de 4,3 kb de pCR_iUC-S2.4 foram isolados em gel e ligados. Seleccionou-se um clone com os fragmentos desejados, pCR_iUC-S, e verificou-se a orientação adequada e a sequência nucleotidica por sequenciação do ADN. Seguidamente, efectuou-se a subclonagem do fragmento Bamhl de 1,7 kb em pGALHO (figura 5A) para se construir piUCS-S (-) .
Utilizou-se o ADN plasmidico de piUC-S(-) para transformar as estirpes 1260 e 1309 de S. cerevisiae para prototrofia à leucina (Leu+) , recorrendo a um protocolo de transformação e esferoplastos (Hinnen et ai., Proc. Natl. Acad. Sei. U.S.A. 75:1939-33, 1978). Efectuou-se a selecção dos transformantes em meio de ágar sintético a que faltava leucina e que continha sorbitol 1 M. Os meios de ágar sintéticos, superior e inferior, a que faltava leucina e que continha sorbitol 1M provieram de REMEL, Lenexa, KS (cat #09459 e 92155, respectivamente). Os isolados Leu+ clonais foram obtidos por meio de culturas em serie feitas sobre placas de SD menos leucina (KD MEDICAL, Columbia MD).
Foram pesquisados múltiplos transformantes para se investigar a produção da região ORF0657nH, utilizando as condições de fermentação descritas no Exemplo 9. Efectuou-se a análise dos lisados celulares para se pesquisar a produção da região ORF0657nH, recorrendo à análise de transferência de 'Western' e à análise de géis para SDS-PAGE corados com o corante azul de Coomassie. 83
Para a análise de transferência de 'Western' submeteu-se as amostras a electroforese sobre géis 'Criterion' em gradiente de Tris-HCl variando entre 4-15% (BIO-RAD, Hercules, CA) em tampão de IX SDS contendo Tris-glicina (BIORAD) em condições redutoras e desnaturantes. Efectuou-se a electroblot dos géis para transferência para filtros de membrana de PVDF de 0,2 pm. As proteínas foram imunodetectadas por transferência de 'Western', utilizando um anticorpo monoclonal para a ORF0657n de comprimento completo (SEQ ID NO: 28), designado por 2H2B8, enquanto anticorpo primário, e um anticorpo inteiro de cabra anti-IgG (H+L) de murganho ligado à peroxidase de rábano (ZYMED LABORATORIES, South San Francisco, CA) , enquanto anticorpo secundário. O mAb 2H2B8 foi descrito no Exemplo 9. Efectuou-se o processamento dos filtros utilizando o estojo 'WESTERN LIGHTNINGTm Chemiluminesence Reagent Plus' (PERKIN ELMER, Wellesley, MA).
Para a análise de expressão da ORF0657nH recombinante de levedura (codificada pela SEQ ID NO: 32), corando com o corante de Coomassie os géis para o protocolo de SDS-PAGE, submeteu-se as amostras a electroforese sobre géis 'Criterion' em gradiente de Tris-HCl variando entre 4-15% (BIORAD) em tampão de IX SDS contendo Tris-glicina (BIORAD), em condições redutoras e desnaturantes. Os géis foram corados com o corante Coomassie 'Bio-Safe', um corante Coomassie G250 (BIO-RAD), em conformidade com o protocolo do fabricante.
As amostras do lisado de células de leveduras, sujeitas a electroforese, continham 0,5 e 1,25 pg de proteínas celulares totais das leveduras, respectivamente para a transferência de 'Western' e para a coloração com o 84 corante de Coomassie. Como padrão quantitativo para a coloração com o corante de Coomassie utilizou-se BSA purificada (100X, NEW ENGLAND BIOLABS, Beverly, MA) . Para as absorções 'Western' utilizou-se como padrão quantitativo a região ORF0657n recombinante e purificada de comprimento completo de E. coli (SEQ ID NO: 28). Para ambas as avaliações utilizou-se como padrão qualitativo um lisado celular proveniente da cultura de E. coli que produz a região ORF0657nH (SEQ ID NO: 4 com uma cauda de His do terminal carboxilo), induzida a produzir ORF0657nH.
Para a produção da região ORF0657nH (SEQ ID NO: 4 mais uma cauda de His no terminal carboxilo) em E. coli, deixou-se a cultura produtora desenvolver-se de um dia para o outro em caldo LB contendo canamicina com uma concentração de 50 pg/mL, a 37°C. No dia seguinte, utilizou-se 500 pL da cultura obtida de um dia para o outro para inocular 5,0 mL de caldo LB contendo canamicina na concentração de 50 pg/L. Deixou-se a cultura desenvolver-se a 37 °C durante aproximadamente 3 horas até se obter um valor D060o igual a 0,6. A expressão foi induzida com IPTG 1 mM durante 3,5 horas a 37°C. Efectuou-se a colheita de células e guardou-se a massa de células a -80°C. Preparou-se o lisado de E. coli utilizando para tal o reagente de extracção de proteínas 'Bugbuster' (NOVAGEN, Madison, WI), executando o protocolo do fabricante. Para se estimar o tamanho das proteínas foram efectuadas experiências com padrões previamente colorados, variando entre 10 e 250 kDa, paralelamente com os lisados (BIO-RAD). A partir da pesquisa inicial, escolheu-se um transformante da estirpe 1260 de levedura, designado por 1-1, como sendo o melhor produtor da região QRF0657nH (SEQ ID NO: 85 3). Nas figuras 7A e 7B está ilustrado um exemplo da produção da região ORF0657nH ao fim de 72 horas de fermentação em meio complexo YEHDG em balões agitados. A proteina principal detectada quer pela coloração com o corante de Coomassie (A) quer pelo anticorpo (B) tinha ~85 kDa (ver as pistas 5, 6 e 7) e migrou conjuntamente com a ORF0657nH de E. coli (SEQ ID NO: 4 com uma cauda de His do terminal carboxilo; pista 2). 0 peso molecular da ORF0657n expressa em E. coli e da ORF0657n expressa na levedura foi maior do que o valor previsto no nosso sistema de electroforese em gel. A detecção da proteina com ~85 kDa foi especifica; não foi observada nenhuma detecção num lisado de células obtido a partir de um transformante que contém apenas o vector pGALHO (pista 3). Foi produzida significativamente mais região ORF0657nH (SEQ ID NO: 3), comparativamente com a região ORF0657n de comprimento completo (SEQ ID NO: 28 sem uma cauda de His no terminal carboxilo); comparar as pistas 5, 6 e 7 com a pista 4. 0 transf ormante que contém a ORF0657n de comprimento completo ficou a fermentar simultaneamente com o transformante que contém a região ORF0657nH (SEQ ID NO: 3) e em condições idênticas. Foram observadas provas insignificantes de degradação da região ORF0657nH expressa na levedura madura.
Para se avaliar a estabilidade da proteína, incluiu-se no gel uma amostra do lisado celular do transformante 1-1 que havia estado congelado durante vários dias e que depois foi descongelado (figura 7, pista 7). Pode concluir-se que a integridade e a quantidade desta amostra são semelhantes às amostras recém-preparadas (pistas 5 e 6). Confirmou-se a inexistência de degradação e a estabilidade da região ORF0657nH (SEQ ID NO: 3) por transferência de 'Western', 86 utilizando um anticorpo policlonal de cabra e desenvolvido contra a ORF0657n de comprimento completo de E. coli (SEQ ID NO: 28) (dados não apresentados).
Uma estimativa da quantidade de região ORF0657nH (SEQ ID NO: 3), a partir da transferência de 'Western' e pela coloração do gel com o corante de Coomassie foi de -360 pg por mL de meio YEHD e a percentagem (%) de proteínas totais foi estimada em 50%. A quantidade produzida no meio definido foi de 225 pg/mL de meio de cultura e a percentagem (%) da proteína total foi também 50%. A quantidade de região ORF0657nH (SEQ ID NO: 3) comparada com a quantidade de região ORF0657n de comprimento completo (SEQ ID NO: 28 sem uma cauda de His do terminal carboxilo) foi superior (350 vs 10 pg/mL, respectivamente) e a percentagem (%) de proteínas totais também foi superior (50 vs 2,0).
Exemplo 12: expressão intracelular da região ORFQ657nG (SEQ ID NO: 44) em S. cerevisiae
Avaliou-se a expressão intracelular dos polipeptidos aparentados com ORF0657n no exemplo a seguir descrito, utilizando uma construção de ADN que codifica a região ORFO 657nG (SEQ ID NO: 44) . A ORF0657nG (SEQ ID NO: 44) é uma versão truncada da SEQ ID NO: 2, à qual lhe falta a sequência de sinal do terminal amino. A SEQ ID NO: 44 conserva a metionina do terminal N e os aminoácidos 42-645 da SEQ ID NO: 2. O ADN optimizado que codifica a região ORF0657nG da levedura (SEQ ID NO: 44) foi amplificado a partir de pUnkCRl (Exemplo 7), utilizando os seguintes iniciadores directo e 87 reverso, respectivamente 5'GGGGGGATCCCACAAAACAAAATGGCTGAAGAAACTG GTGG3' (SEQ ID NO: 102) e 5'GGGGGGGATCCTTAGTTCTTTCTCTTTCTTGG3' (SEQ ID NO: 103) com os locais de restrição BamEI de flanqueamento. O iniciador directo contém a sequência líder não traduzida em 5' e o codão ATG e o iniciador reverso contém TAA, enquanto codão de terminação. O produto resultante de 1,8 kb foi isolado em gel e clonado no vector pCR2.1 TOPO TA, em conformidade com as orientações do fabricante (INVTTROGEN CORPORATION, Carlsbad, CA), para se construir o plasmídeo pCR_iUC-L4. A análise da sequência de ADN confirmou que ocorreu uma única delecção na extremidade 5'.
Obteve-se um clone com a sequência correcta substituindo com o fragmento HindiII-HindiII de 1,3 kb de pCR_iUCS2.2, que contém a sequência correcta (ver o Exemplo 11), o correspondente fragmento de pCR_iUC-L4. O fragmento de 1,3 kb de pCR_iUCS2.2 e o fragmento de 4,4 kb de pCR_iUC-LA foram isolados em gel e ligados. Seleccionou-se um clone com os fragmentos desejados, pCR_iUC-L, e verificou-se a orientação adequada e a sequência nucleotídica por sequenciação do ADN. Depois, efectuou-se a subclonagem de um fragmento BamEI de 1,8 kb em pGALHO para a construção de piUC-L(-) e verificou-se a sequência de ADN. Utilizou-se o ADN plasmídico de piUC-L(-) para transformar a estirpe 12 60 de S. cerevisiae para prototrofia à leucina (Leu+) , conforme descrito no Exemplo 9. Foram pesquisados diversos transformantes de levedura para produção intracelular da região ORF0657nG (SEQ ID NO: 44) , utilizando as condições de fermentação e de desmembramento de células descritas no Exemplo 11. Analisou-se 0,25-0,5 pg de proteínas do lisado celular para a produção da região ORF0657nG, pelo protocolo de transferência de 'Western', conforme descrito no Exemplo 11. Utilizou-se a região ORF0657nH purificada de E. coli (SEQ ID NO: 4 sem uma cauda de His no terminal carboxilo) como padrão quantitativo e utilizou-se como padrão qualitativo um lisado celular proveniente da cultura de E. coli produtora da região ORF0657nG (SEQ ID NO: 44 com uma cauda de His no terminal carboxilo), induzida para produzir a região ORF0657nG. Submeteu-se as amostras a electroforese em géis 'Criterion' em gradiente de Tris-HCl variando entre 4-15% (BIO-RAD, Hercules, CA) em tampão IX SDS contendo Tris-glicina (BIO-RAD) em condições redutoras e desnaturantes. Efectuou-se a electroblot dos géis com transferência para filtros de membrana de PVDF com 0,2 pm (BIO-RAD).
Efectuou-se a imunodetecção das proteínas pela transferência de 'Western' utilizando um anticorpo policlonal contra a ORF0657n de comprimento completo purificada produzida por E. coli (SEQ ID NO: 28 sem uma cauda de His no terminal carboxilo), enquanto anticorpo primário, e o anticorpo inteiro de cabra anti-IgG (H+L) de murganho ligado à peroxidase de rábano (ZYMED LABORATORIES; South San Francisco, CA), enquanto anticorpo secundário. 0 anticorpo policlonal foi gerado por imunização com a região ORF0657n de comprimento completo purificada, produzida por E. coli (SEQ ID NO: 28) . Efectuou-se o processamento dos filtros utilizando o estojo 'WESTERN LIGHTNINGTm Chemiluminesence Reagent Plus' (PERKIN ELMER, Wellesley, MA) .
Para efeitos de comparação, efectuou-se a clonagem de uma região ORF0657nG (SEQ ID NO: 44 com uma cauda de His no 89 terminal carboxilo) num vector de expressão de E. coli, conforme descrito no Exemplo 1, tendo lugar a expressão. Para a produção da região ORF0657nG em E. coli, a cultura produtora ficou a desenvolver-se de um dia para o outro em caldo LB contendo canamicina na concentração de 50 pg/mL, a 37°C. No dia seguinte, utilizou-se 500 pL da cultura obtida de um dia para o outro para inocular 5,0 mL de caldo LB contendo canamicina na concentração de 50 pg/mL. Deixou-se esta cultura crescer a 37°C durante aproximadamente 3 horas até se obter um valor D06oo igual a 0,6. A expressão foi induzida com IPTG lmM durante 3,5 horas a 37°C. Efectuou-se a colheita das células e guardou-se a massa celular a -80°C. Preparou-se o lisado de E. coli utilizando o reagente de extracção de proteínas 'Bugbuster' (NOVAGEN, Madison, WI), em conformidade com o protocolo do fabricante. Para se estimar o tamanho das proteínas foram efectuadas experiências com padrões previamente colorados, variando entre 10 e 250 kDa, paralelamente com os lisados (BIO-RAD). A partir da pesquisa inicial, escolheu-se um transformante da estirpe 1260 de levedura, designado por ÍUC-L3, como sendo um bom produtor da região ORF0657nG ao fim de 72 horas de fermentação em meio complexo YEHDG em tubos de cultura, conforme descrito no Exemplo 11. A proteína principal detectada por coloração com o corante de Coomassie ou pelo anticorpo tinha 85 kDa e migrou conjuntamente com a região ORF0657nG de E. coli (SEQ ID NO: 44 com uma cauda de His no terminal carboxilo) . Os pesos moleculares da região ORF0657nG expressa em E. coli e da região ORF0657nG expressa em levedura tinham um valor maior do que o previsto pelo nosso sistema de electroforese em gel. A detecção da proteína de 85 kDa foi específica; não 90 foi verificada nenhuma detecção no lisado de células provenientes de um transformante que continha apenas o vector pGALHO. A concentração média de ORF0657nG, determinada nas experiências de transferência de 'Western', foi de 30 pg por mL de meio YEHDG e a percentagem (%) de proteína total foi estimada em 10,0% (ver o Exemplo 13, infra) .
Exemplo 13: a remoção do sinal de selecção da parede celular aumenta a expressão intracelular
Estudou-se o efeito de se remover apenas a região ORF0657n codificadora do terminal C da sortase celular e também a combinação com a remoção da região do sinal do terminal N, utilizando os genes de ORF0657n, com codões optimizados, de SEQ ID NOs: 31, 32 e 45. A SEQ ID NO: 31 codifica a região ORF0657n de comprimento completo. A SEQ ID NO: 32 codifica a região ORF0657nH, à qual lhe falta simultaneamente uma sequência de sinal no terminal N e uma região de selecção do terminal C da parede celular. A SEQ ID NO: 45 codifica a região ORF0657nG a que falta apenas a sequência do péptido de sinal.
Deixou-se fermentar cada um dos transformantes que expressam a região ORF0657n de comprimento completo (SEQ ID NO: 28 sem a cauda de His do terminal carboxilo; transformante rUnkCl), a região ORF0657nH (SEQ ID NO: 3; transf ormante 1-1) e a região ORF0657nG (SEQ ID NO: 44, transformante ÍUC-L3), tendo sido preparados lisados celulares que foram analisados conforme descrito no Exemplo 11. Na figura 9 está ilustrada uma transferência de 'Western' representativa. A quantidade de lisado celular proteico, 91 carregada no gel, a partir dos diferentes transformantes, não foi igual para se poder compensar os níveis diferentes de expressão das regiões ORF0657n das que codificam as três construções. Em cada caso, foram carregadas pelo menos duas quantidades diferentes de lisado celular proteico proveniente de cada transformante contendo a região ORF0657n.
Na figura 9 estão indicados resultados típicos que demonstram a região ORF0657nH (SEQ ID NO: 3) foi expressa significativamente melhor do que a região ORF0657n de comprimento completo (SEQ ID NO: 2 8 sem a cauda de His do terminal carboxilo) ou a região ORF0657nG (SEQ ID NO: 44) . Foi detectado um sinal substancial apenas com 50 e 100 ng de proteínas do lisado celular proveniente do produtor de região ORF0657nH, conforme se observa nas pistas 11 e 12. Em contraposição, utilizou-se 1,0 e 2,0 pg de proteínas de lisado celular do produtor de região ORF0657nC de comprimento completo, como se observa respectivamente nas pistas 7 e 8. Foi detectado um sinal bom para a região ORF0657nG com menos proteína, com 250 e 500 ng de proteína carregados conforme se observa nas pistas 14 e 15. O quadro 4 apresenta uma comparação das concentrações médias de cada uma das três regiões ORF e a percentagem (%) de proteínas totais, obtidas a partir de três absorções 'Western' independentes. Foram preparados lisados celulares de propósito para cada transferência de 'Western'. As médias foram obtidas a partir de duas fermentações independentes. Determinou-se a quantidade de ORF0657n específica, relativamente ao padrão de ORF0657nH purificada de E. coli (SEQ ID NO: 4 mais uma cauda de His do terminal carboxilo). 92
Quadro 4 ORF 0 6 5 7 n concentração, pg/mL % de proteínas produzida de meio YEHDG totais C 10,0 4,0 G 30,0 10,0 H 425, 0 80,0 A remoção da sequência do péptido de sinal aumentou a percentagem de proteínas totais e a concentração entre 2,5-3 vezes, conforme determinado comparando a expressão da região ORF0 657n de comprimento completo (SEQ ID NO: 2 8 sem uma cauda de His no terminal carboxilo) e da região ORF0657nG (SEQ ID NO: 44). A remoção do péptido de sinal e da sequência de selecção da parede celular aumentou a expressão entre 8-14 vezes, comparativamente com a remoção apenas da sequência do péptido de sinal (comparar as regiões G e H) e aumentou a expressão entre 20-42,5 vezes, comparativamente com a proteína de comprimento completo (comparar as regiões C até H). A amplitude do aumento da expressão após a remoção da sequência de selecção da parede celular não era previsível.
Exemplo 14: expressão intracelular da região ORFQ657nI em S. cerevisiae
Amplificou-se o ADN que codifica a região ORF0657nI com os codões optimizados para expressão em leveduras (SEQ ID NO: 33) a partir de pUnkCRl (Exemplo 7), utilizando correspondentemente os iniciadores directo e reverso a seguir indicados: 5'CTCCGGATCCCACAAAACAAAATGGCTGAAGAAACTGGT 3' (SEQ ID NO: 104) e 5' GCTGCCGGGATCCTTATGGGGTTGGCT- 93 TAGATGGGGTAG 3' (SEQ ID NO: 105) com os locais de restrição BamHI de flanqueamento (sublinhados). O iniciador directo contém a sequência líder não traduzida de 5' e o codão ATG e o iniciador reverso contém TAA, enquanto codão de terminação. O produto resultante de 1,3 kb foi isolado em qel e clonado no pGALHO (Fiq. 5A) para se construir o piUC-I (Fig. 5B) e verificou-se a sequência de ADN.
Utilizou-se o ADN plasmídico proveniente de piUC-I para transformar a estirpe 1260 de S. cerevisiae para prototrofia à leucina (Leu+) , conforme descrito no Exemplo 9. Efectuou-se uma pesquisa dos transformantes Leu+ para tirar conclusões sobre a produção intracelular da região ORF0657nI (SEQ ID NO: 1), utilizando as condições para uma fermentação em pequena escala (culturas de 5,0 mL) , conforme descrito no Exemplo 9.
Comparou-se a produção com a da região ORF0657nH (SEQ ID NO: 3) produzida pelo transformante 1-1 de S. cerevisiae (ver o Exemplo 11) . Os lisados celulares foram preparados conforme descrito no Exemplo 9 e efectuou-se a análise de 100 e 200 ng de proteínas de lisados de células de leveduras para se pesquisar a produção de ORF0657nI e de ORF0657nH, pelo protocolo de transferência de 'Western' semi-quantitativo, conforme descrito no Exemplo 11. Utilizou-se a ORF0657nH purificada de E. coli (SEQ ID NO: 4 com uma cauda de His do terminal carboxilo) como padrão quantitativo. As amostras foram submetidas a electroforese em géis 'Criterion' em gradiente de Tris-HCl variando entre 10-20% (BIO-RAD, Hercules, CA) em tampão de IX SDS contendo Tris-glicina (BIORAD) em condições redutoras e desnaturantes. Efectuou-se uma electroblot dos géis para transferência para filtros de membrana de PVDF de 0,2 pm 94 (BIO-RAD). Efectuou-se a imunodetecção das proteínas por transferência de 'Western', utilizando um anticorpo policlonal para a ORF0657n de comprimento completo purificada de E. coli (SEQ ID NO: 28), enquanto anticorpo primário, e o anticorpo de cabra anti-IgG (H+L) de murganho inteiro ligado à peroxidase de rábano (ZYMED LABORATORIES; South San Francisco, CA), enquanto anticorpo secundário. 0 anticorpo policlonal foi gerado por imunização com a ORF0657n de comprimento completo purificada, produzida por E. coli (SEQ ID NO: 28) . Efectuou-se o processamento dos filtros utilizando o estojo 'WESTERN LIGHTNINGTm Chemiluminesence Reagent Plus' (PERKIN ELMER, Wellesley, MA). Para se estimar o tamanho das proteínas foram efectuadas experiências em paralelo com padrões previamente colorados, com dimensões entre 10 e 250 kDa (BIO-RAD), conjuntamente com os lisados. A figura 11 ilustra os resultados obtidos ao fim de uma fermentação de 72 horas em meio YEHDG complexo, em tubos de cultura. Obteve-se uma forte detecção da região ORF0657nH (SEQ ID NO: 3) expressa nas leveduras, conforme se observa nas pistas 5, 6, 14, 15, 21 e 22. Também foi facilmente detectada uma proteína de 60 kDa nos transformantes construídos para a expressão de ORF0657nI (SEQ ID NO: 1), conforme se observa nas pistas 7-12 e 16-21. A ORF0657nI (SEQ ID NO: 1) expressa nas leveduras migrou conjuntamente com a ORF0657nI (SEQ ID NO: 5 com uma cauda de His do terminal carboxilo), expressa e purificada a partir de E. coli (dados não apresentados) . Os pesos moleculares da região ORF0657nI expressa em E. coli e da região ORF0657nI expressa em leveduras foram maiores do que os valores previstos pelo nosso sistema de electroforese em 95 gel. A proteína de 60 kDa detectada nos transf ormantes construídos para expressão da região ORF0657nI (SEQ ID NO: 1) foi específica; não foi detectada nenhuma proteína no lisado celular proveniente de um transformante de controlo do vector (pistas 4 e 13).
Estimou-se a quantidade de região ORF0657nH (SEQ ID NO: 3) e de região ORF0657nI (SEQ ID NO: 1) no gel a partir da transferência de 'Western' semi-quantitativa, por comparação com uma quantidade conhecida de ORF0657nH purificada (SEQ ID NO: 4 com uma cauda de His no terminal carboxilo) . As concentrações e a percentagem total de proteínas foram calculadas em termos de média determinada a partir de lisados em duplicado que continham duas quantidades diferentes de proteína no gel. As concentrações volumétricas de região ORF0657nH (SEQ ID NO: 3), determinadas a partir de uma amostra recém-fermentada e de um lisado de células congeladas, foram comparáveis, sendo -500 e -550 yg/mL de meio de cultura, para uma produção de 320 yg de região ORF0657nI (SEQ ID NO: 1) por mL de meio de cultura (a concentração para a região ORF0657nI é para o transformante 1-1) . O valor percentual de região ORF0657nH (SEQ ID NO: 3) da proteína total foi estimado respectivamente em 78% e 80%, ao passo que a ORF0657nI (SEQ ID NO: 1) correspondeu a 45% da proteína total.
Assim, a região ORF0657nI teve uma boa expressão em S. cerevisiae, com uma concentração cerca de 1,5 vezes inferior à da ORF0657nH (SEQ ID NO: 3) e a percentagem (%) de proteína total foi cerca de 1,3 vezes inferior. A boa expressão da região ORF0657nI na levedura foi confirmada por coloração com o corante de Coomassie num protocolo de SDS-PAGE sobre gel contendo os lisados celulares. A 96 expressão da região ORF0657nI no meio YEDHG foi multiplicada à escala: a produção em balões agitados de 125 mL ou de 2 litros foi comparável à expressão em pequena escala em tubos de cultura. A região ORF0657nI (SEQ ID NO: 1) também teve boa expressão em meio definido '5X menos leucina' (o meio descrito no Exemplo 9). A concentração foi apenas ~1,5 vezes inferior à concentração no meio complexo YEHDG, ao passo que a percentagem (%) de proteínas totais foi comparável nos dois meios. A integridade da ORF0657nI foi boa nos dois meios, sem ter sido detectada nenhuma degradação significativa. A produção de ORF0657nI foi mais elevada ao fim de 72 horas do que ao fim de 96 horas, tanto no meio complexo como no meio ' 5X menos leucina', quando testada nas fermentações em balões agitados.
Exemplo 15: fermentações em grande escala da estirpe de levedura produtora de ORFQ657nH (SEQ ID NO: 3)
Utilizou-se o lote inoculante congelado da estirpe 1-1 de levedura (estirpe 1260 transformada com o plasmídeo piUC-S(-); conforme descrito no Exemplo 11) para fermentação e purificação em grande escala. O balão que continha o lote inoculante foi descongelado e depois utilizou-se 1,0 mL para inocular um balão de Erlenmeyer de 250 mL contendo 50 mL de um meio selectivo isento de leucina (meio 5XLeu-, Bayne et al., Gene 66(2):235-44, 1988), contendo 4% de glicose. Manteve-se o balão a incubar a 28°C num aparelho de agitação rotativa a 250 r.p.m..
Decorridas 24 horas (com glicose residual igual a 23,5 g/L) , acrescentou-se um volume de cultura igual a 13 mL a 97 um balão de 2 L que continha 877 mL do mesmo meio. Mais uma vez, manteve-se o balão a incubar a 28°C com agitação a 250 r.p.m.. Decorridas 24 horas, (com glicose residual igual a 4,04 g/L) , utilizou-se o conteúdo do balão de 2 L para inocular um reactor de 20 L que continha um meio quimicamente definido (Oura, Biotechnol. Bioengineer. 16:1197, 1974) que foi optimizado para as estirpes utilizadas. Este meio continha glicose com a concentração de 20 g/L, seguindo-se uma adição de galactose na concentração de 25 g/L para indução. O reactor trabalhou a 28°C, com uma caudal de 4,7 L/min, à pressão de 15 psig e a 300 r.p.m.. Nestas condições, os níveis de oxigénio dissolvido foram mantidos em valores superiores a 30% da saturação. O desenvolvimento celular foi monitorizado pelo consumo de glicose, pela densidade óptica (A6oo nm, cadinhos de 1 cm), pelo peso das células anidras, pela utilização da galactose e pela produção de etanol. A cultura prosseguiu durante 90 horas até alcançar um valor A6oo igual a 33,9 e uma proporção de células anidras igual a 17,5 g/L.
Efectuou-se uma colheita da cultura por filtração do fluxo tangencial a fibras ocas (cartucho Hump01-43 da AMICON), utilizando um estojo de colheita DC-10 da AMICON (NELLEPORE, Billerica, MA) . Deitou-se fora o produto da impregnação e fez-se uma concentração das células, com diafiltração com PBS e subsequente colheita por centrifugação a 8000 r.p.m. a 4°C durante 20 minutos, utilizando um equipamento 'Sorvall Evolution RC' (rotor SLA 3000). As células foram guardadas a -70°C.
Para se avaliar a produção de ORF0657nH pela estirpe 1-1 numa fermentação em grande escala, fez-se uma preparação de lisados de células a partir de 10 unidades de 98 D06oo da cultura colhida, tendo a avaliação sido feita conforme descrito minuciosamente no Exemplo 11 (resultados não apresentados). Avaliou-se também a produção de ORF0657nH proveniente da fermentação em balão agitado (72 horas, meio YEHDG complexo). Os resultados da análise de transferência de 'Western' (efectuada conforme descrito no Exemplo 11) demonstraram que a proteína produzida a partir de uma fermentação em grande escala migraram conjuntamente com a ORF0657nH produzida numa fermentação em balão agitado (resultados não apresentados). Estimou-se em 739 pg por mL a concentração da ORF0657nH obtida a partir da fermentação em grande escala (20 L) e a percentagem (%) de proteínas totais foi estimada em 55%, comparativamente com os valores de 732 pg/mL e 58% de proteínas totais obtidos na fermentação em balão agitado (utilizando o processo da transferência de 'Western' semi-quantitativa, descrito no Exemplo 11). Os resultados permitem concluir que a produção de ORF0657n pode ser multiplicada à escala em leveduras.
Exemplo 16: imunidade protectora dos polipeptidos aparentados com ORFQ657n produzidos em leveduras
Avaliou-se a aptidão dos polipeptidos congéneres de ORF0657n produzidos em leveduras para conferirem imunidade protectora, realizando a expressão do polipeptido de SEQ ID NO: 3 em leveduras. Utilizou-se como controlos a ORF0657nC de comprimento completo (SEQ ID NO: 28), a ORF0657nH (SEQ ID NO: 4 com uma cauda de His no terminal carboxilo) e a ORF0657nI (SEQ ID NO: 5 com uma cauda de His do terminal carboxilo), expressas em E. coli, e também adjuvante por si so. 99
Obteve-se um polipeptido aparentado com ORF0657n de SEQ ID NO: 3a partir de leveduras e utilizou-se num modelo com animais para conferir imunidade protectora. 0 polipeptido de SEQ ID NO: 3 foi expresso conforme descrito no Exemplo 11.
Com células recombinantes congeladas de S. cerevisiae, que expressam a ORF657nH (SEQ ID NO: 3), preparou-se nova suspensão, à razão de 5 mL por grama de células húmidas, em meio MOPS 0,2 M a pH 7,0 com inibidores de proteases (sem EDTA). Preparou-se um lisado fazendo quatro passagens através de um microfluidificador a trabalhar a 14 000 psi (Microfluidics Model 110S) . Clarificou-se o lisado por centrifugação (10 000 X g, 20 minutos, 2-8°C), seguindo-se uma filtração grosseira (pré-filtro de fibras de vidro, Millipore) e uma filtração refinada (sobre acetato de celulose de 0,2 pm, Whatman).
Fraccionou-se o lisado clarificado numa coluna de cromatografia de exclusão dimensional (SEC) (Pharmacia HiPrep 26/60 Sephacryl S-300 HR, fase móvel: MOPS 0,2 M a pH 7,0) . Efectuou-se a análise das fracções pelo protocolo de SDS-PAGE com detecção pelo corante de Coomassie e por transferência de 'Western', utilizando um anti-soro especifico para a proteína ORF0657n (produzido contra a ORF0657n de comprimento completo, SEQ ID NO: 28). Juntou-se as fracções que continham o produto.
Filtrou-se esterilmente o produto resultante da SEC, através de acetato de celulose de 0,2 pm, em condições assépticas. A pureza do produto filtrado estéril foi h 94% nas análises por SDS-PAGE e por transferência de 'Western'. Com o produto filtrado e estéril preparou-se uma formulação com AHP e Timerosal na concentração de 0,2 mg/mL. 100 A aptidão dos polipeptidos aparentados com ORF0657n, produzidos nas leveduras, para conferirem imunidade protectora, está ilustrada na figura 10. A ORF0657nH (SEQ ID NO: 3) expressa nas leveduras conferiu uma imunidade protectora equivalente à dos polipeptidos expressos em E. coli.
Exemplo 17: resposta anamnéstica em primatas não humanos
Efectuou-se a imunização de três grupos de macacos Rhesus com o polipeptido aparentado com ORF0657n produzido em leveduras (ORF0657nH, SEQ ID NO: 3) ou com o polipeptido aparentado com ORF0657 expresso em E. coli (ORF0657n de comprimento completo, SEQ ID NO: 28), em formulações com ou sem AHP. Os macacos do grupo vacinado receberam 50 pg de polipeptidos congéneres de ORF0657n, por via intramuscular.
Conforme se observa na figura 12, o grupo de animais vacinados respondeu, ao fim de uma única dose, com um aumento de 3 a 6 vezes os valores das concentrações médias geométricas, comparativamente com as concentrações modestas existentes previamente, sugerindo isso a existência de uma resposta amnéstica. Pelo contrário, as concentrações médias geométricas nos animais do grupo de contraprova continuaram a ser as mesmas (no intervalo de variabilidade do ensaio com anticorpos). Após uma segunda dose de vacina, as médias geométricas das concentrações após a primeira dose, nos grupos vacinados e de contraprova, variaram muito pouco comparativamente com as concentrações após a segunda dose.
Para se observar o desenvolvimento de respostas de anticorpos após a administração de uma única dose, acompanhou-se o grupo que recebeu a região ORF0657H (SEQ ID 101 NO: 3) expressa em leveduras, durante 3 meses (último momento testado). As concentrações de anticorpos continuaram a aumentar após 9 dias, atingindo niveis que não foram ultrapassados mesmo após 2 ou 3 doses de vacina.
Estas observações sugerem que uma dose de vacina pode induzir respostas de anticorpos substanciais e duradouras após a estimulação natural do sistema imunitário, provavelmente devido à exposição ambiental a S. aureus. Um estudo sobre concentrações de anticorpos previamente existentes em seres humanos demonstrou a presença de concentrações modestas de anticorpos contra ORF0657n em todas as amostras analisadas (dados não apresentados). 102 LISTAGEM DAS SEQUÊNCIAS <110> Merck & Co, Inc,
<12 0> POLIPEPTIDOS PARA INDUÇÃO DE UMA RESPOSTA IMUNITÁRIA DE PROTECÇÃO CONTRA STAPHYLOCOCCUS AUREUS <130> 21669Y PCT <150> 60/489, 840 <151> 2003-07 -24 <150> 60/520, 115 <151> 2003-11 -14 <160> 107 <170> FastSEQ para Windows versão 4.0
<210> 1 <211> 446 <212> PRT <213> Sequência Artificial <22 0> <223> ORF0657nI com metionina no terminal amino <4 0 0> 1 103
Má Alá v: > :X Via stsr Qly Sly T&r ?iMi TM 1« Ala r* i *x Prs by% Thr 1 Si. H Ú AM. Ml Klv $*S% Tâp: T::r fhr S*r «M f..ys Ai* Prí> UM Thr ή as 10 Ly& ?;: Vai XX*. míi Alá. Ysl S-i- ml Mr A®a Vai ala. Am 1$. 40 ÂS ί'Χ'ν TM Mr ulu T).x Lys Sltt Má, Ly:« SM mi Ma am mi iy- Ala Se 55 50 Lys OÍ;í TM m Sis ml Frh Ala Ala Ala T;tr Asm Mn §5 Tá 15 «Q TM- Tf* M» 11¾ LM .Mn CM fílu tass A*S? SH Α1® n« l,yt5 .Asa ?XVS §3 ts ss λ 1 -¾ n« Lys A.;p Lyã Μρ m» Mr álã Pro Mm ler Ari Prv I,lA 1.30 Kiá MS UÔ phí*. VM. mt tva Lys lyjp M>! Thr sa.õ GU Pí». Tyr MM ”yr Ai A ÍUS Uá 115 Mr as* mi lys iro Alâ- Arg Vai íis FM Tfer Ã-SP á#r '-·:/s SM 110 11S 14a li& l« siy iaj «M Mr My Slft PSe frp Mi Lya Fhè Cila Vai us ΪΜ Í5S ise Tyr SIíí èly ÂMp. ξ*# Lsu V.i:<3 Ile Lyv L&V mi Mr Tyr &SP" Tl;r ,US lie 17:3 Vai Lfã Asp 1!ví A'U Tyr tis Mi ?&r ml S»r Asa Gíy Thr LyS· Í3S tas 1Μ Ala VIL -VS I Í8 YAl S«r s«r t&r HM PiA 1.3T Aáá ira Vi 1 si Ίΐτ K0S 1.¾¾ *00 MS 104
Tyr Asp Tyr Thr L#U «es Glu Phe Ala Gin- Fro n« Tyr ASO Ser Ala 210 21$ 220 Asp Lys Fhe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala 225 230 23S 240 Pro Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu Asm 24$ 350 25$ Lys 11© Gin Asp Lys Léu Fm Glu Lys Leu Lys Ala Glu Tyr Lys Lys 210 365 270 Lys Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala 275 280 285 lie Thr Glu Fhe Gin Asn Vai Glu Pro Thr ASO GlU Lys Mtefc Thr Asp 290 295 300 Leu Gin ASp Thr Lys Tyr val Vai Tyr Glu Ser Val Glu Asm Asm Glu 38$ 310 315 320 Ser Mât Hejfc Asp Thr Phe vai Lys lis Pr© 11# Lys Thr Gly Mefc Leu 325 330 335 A®n Gly Lys Lys Tyr Wer Val Met Gi« Thr Thr A$FS Asp ASp Tyr Trp 348 345 350 Lys Asp Fhé Het v&l Glu Gly Gin Arg Val ATf Thr Ile Ser Lys Asp 355 360 365 Ale Lys Asa Asm Thr Arg Thr Xle lie Phe Fro Tyr Vãl Glu Gly Lys 370 375 380 Thr Leu Tyr Asp Ala lie Val Lys Val Hls val Lys Thr Tle Asp Tyr 385 330 335 400 Asp Gly Glo Tyr Hls VAI Arg lie val Asp Lys Glu Ala Phe Thr Lys 405 410 415 Ala ASA Thr Asp Lys Ser Asn. Lys Lys Glu Gin Gin Asp Asm Ser Ala 420 425 430 Lys Lys Glu Ala Thr Pm Ala Thr Pro Ser Lys Fm Thr Pm 435 440 445 <210> 2 <211> 645 <212> PRT <213> S. aureus <400> 2 105
Heh 1 Asn Lys Gin Gla Lys Glu Phe Lys Ser fhe Tyr Ser na Arg Lys 5 10 15 Ser Ser Leu Gly Vai Ala Ser Vai Ala Ile Ser Thr Leu Leu Leu Leu 20 25 30 Ser Asn Gly Glu Ala Gin Ala Ala Ala Glu Glu Thr Gly Gly Thr 35 40 45 hm Thr Glu Ala Gin Pr© Lys Thr Glu Ala Vai Ala Ser Pr© Thr Thr so 55 m Thr Ser Glu Lys Ala Pr© Glu Thr Lys Pr© Vai Ala Asn Ala Vai Ser 65 70 75 80 Vai Ser Asn Lys Glu Vai Glu Ala Fro Thr Ser Glu Thr Lys Glu Ala 85 50 95 Lys €lu Vai Lys Glu vai Lys Ala Pr© Lys Glu Thr Lys' Glu vai Lys 1QG 105 110 Pro Ala Ala Lys Ala Thr Asn Asn Thr Tyr Pr© Ile Leu Asn Gin Glu 115 120 125 Leu Arg eiu Ala n© Lys Asn Pr© Ala xle Lys Asp Lys Asp Mis Ser 130 13 S 140 106
Alâ Fr© Mn Ser Arg Pr© Ha Asp Phe Glu Met Lys Lys Lys Asp Gly 145 150 155 160 Thr Gin Gin Ph» Tyr Mis Tyr Ala Ser Ser Vai Lys Pr© Ala Arg vai 165 170 175 ϊΐδ Phe Thr Asp Ser Lys Pr© Glu XI* Glu Leu Gly Leu Gin Ser Gly 180 .185 190 Gin Phe Trp Arg Lys Phe Glu Vai Tyr Glu Gly Asp Lys Lys Leu Pr© 185 ' 200 205 Ile Lys Leu Vai Ser Tyr Asp Thr Vai Lys Asp Tyr Ala TVr He Arg 210 215 220 Pis® Ser Vai Ser Asn Gly Thr Lys Ala Vai Lys He Vai Ser Se r Thr 225 230 235 240 His Phe Asn Asn Lys Glu Glu Lys. Tyr Asp Tyr Thr Leu Met Glu Phe 245 250 255 Alâ Sln Fr© Ile Tyr Asá Ser Ala Asp Lys Phe Lys Thr Glu Glu Asp 260 265 270 Tyr hys jklâ ôlu Lys Leu Leu Ala Fr© Tyr Lys Lys Ala Lys Thr Leu 275 280 285 Glu Arg Gin Vai Tyr Glu Leu Asn Lys He Gin Asp Lys Leu Fr© Glu 290 29S 300 Lys Leu Lys Ala Glu Tyr Lys Lys Lys Leu Glu Asp Thr lys Lys Ala 305 no 315 320 Leu Asp Glu Gin Vai Lys Ser Ala Ile Thr Glu Phe Gin Asn Vai Gin i 325 330 335 Fr© Thr Mn Gin Lys Met Thr Asp Leu Gin Asp Thr Lys Tyr val vàl 340 345 350 Tyr Glu Ser Vai Glu Asn Asn Glu Ser Met Met Asp Thr Phe Vai Lys 355 360 36S Hls Pr© lie Lys Thr Giy Met Leu Asn Gly Lys Lys Tyr Met Val Met 370 375 380 Gl» Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Met Vai Glu Gly Gin 385 350 395 400 Arg Vai Arg Thr Ile Ser Lys Asp Ala Lys Asn As» Thr Arg Thr He 405 410 415 He phs Fr© Tyr Vai Glu Gly Lys Thr Leu Tyr Asp Ala He val Lys 420 425 430 Vai His Vai Lys Thr Ile Asp Tyr Asp Gly Gin Tyr Hl» Vai Arg Ile 435 440 445 Vai Asp Lys Glu Ala Phe Thr Lys Ala Asn Thr Asp Lys Ser Asn Lys 450 455 460 Lys Glu Gin Gin A$p Asa Ser Ala Lys Lys Glu .Ala Thr Fr© Alá Thr 465 470 47 S 480 Fro ser Lys Fr© Thr pr© ser Pr© Val Glu Lys Glu Ser Gllli Lys Gin 485 490 495 Asp Ser Gin Lys Asp Asp Asn Lys· Gin Leu Fr© Ser val Glu Ly» Glu 500 SOS 510 Asn Asp Ala Ser Ser Glu Ser Gly Ly» Asp Lys Thr Fr© Ala Thr Lys 515 520 525 Pr© Thr Lys Gly Glu Vai Glu Ser Ser Ser Thr Thr Fr© Thr Lys Val 530 4 535 540 Vai Ser Thr Thr Gin Asn Vai Ala Lys Pr© Thr Thr Á.l â Ser Ser Lys 545 550 555 560 Thr Thr Lys Asp Vai Vai Gin Thr Ser Ala Gly Ser Ser Glu Ala Lys 565 578 575 107 107 Asn Thr Asn Asp Gly 590 Glu Asn Lys Ala Lys 605 Asp Met Thr Leu Pro 620 Ala Phe vai Leu Pro 640
Asp ser Ala His Thr Gin 595 Ser Leu Pr© 610 Leu Met Ala 62:5 Arg Lys Arg
Pro Léu ©In Lys Ala Asn He Lys 580 S8$
Ee-r ©In Asn Asn Lys Aon Thr Gin 6ÓÓ
Gin Thr Gly Glu Glu. Ser Asn Lys «15
Leu Leu Ala Leu ser Ser lie vai 830 63$
Lys Asn 645
<210> 3 <211> 569 <212> PRT <213> Sequência Artificial <220> <223> ORF0657nH com metionina no terminal amino <400> 3 108
Mac Mm Glu Glu Thr Gly Gly Thr Asa Thr Glu Ala Glu Pro Lys Thr 1 S 10 15 Glu .Ala Vai Ala Ser Pro Thr Thr Thr Ser Glu Lys Ala Pro Glu Thr 20 25 30 Lys Pro Vai Ala Aso. Ala Vai Ser Vai Ser Asn Lys Glu Vai Glu Ala Pro Thr 35 40 45 .Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Glu Vai Lys Ala 50 SS 60 , Pro Lys Glu Thr Lys Glu vai Lys Pro Ala Ala Lys Ala Thr Asn Asn. €5 20 75 80 Thr Tyr Pro 11© Leu As» Glu Glu Leu Arg Glu Ala fie Lys Asn Pro 85 80 05 Ma Xis Lys Asp Lys Asp His Ser Ala Pro Asft Ser Arg Pro lie ASp 100 105 110 Fhe Glu mt Lys Lys Lys Agp Gly Thr Gin Glu Phe Tyr His Tyr Ala lis 120 125 Ser Ser vai Lys Pro Ala Aro Vai Xle Fhe Thr Asp ser Lys Pro Glu 130 135 140 XI© Glu Leu Gly Leu Gin Sor Gly Gin Fhe Trp Arg Lys Phe Glu Vai 145 150 155 160 Tyr Glu Gly Asp Lys Lys Leu Pro X le Lys Leu Vai Ser Tyr Asp Thr 165 170 175 Vai Lys Asp Tyr Ala tyr Xle Arg Phe Ser' Vai Ser Asn Gly Thr Lys ISO 185 ISO ' Ma Vai Lys Xle Vai Ser Ser Thr HiS Phe Asn Asa Lys Glu Glu Lys 1&5 200 205 ' Tyr Asp Tyr Thr Leu Met Glu Ph© Ala Gin Pro Xle Tyr Asa Ser Ala 210 215 220 Ãsp Lys Pbe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala '225 230 235 240 Pro Tyr Lys Lys Ala Lys Thr Leu Glu Arg Glu Vai Tyr Glu Leu Asn 245 250 25S Lys 11« Gin ASp Lys Leu Pro GlU Lys Leu Lys Ala Glu Tyr Lys Lys 2Ê0 265 270 109
Lys Leu Glu 275 Asp Thr Lys Lys Ala 280 Ile Thr Glu 290 Phe Gin Asn vai 295 Gin Leu Gin Asp 305 Thr Lys Tyr 310 Vai Vai Ser Met Met Asp Thr 325 Phe Vai Lys Asn Gly Lys Lys 340 Tyr Ket Vai Hat Lys Asp Fhs 355 Met Vai Glu Gly Gin 360 Ala Lys As» 370 ASP Thr Arp Thr 375 lie Thr Leu Tyr 385 ASp Ala’ Ile 390 Vai Lys Asp Gly Gin Tyr HiS 405 val Arg Ile Ala Asm Thr Asp 420 Lys Ser Asa Lys Lys Lys Glu 435 Ala Thr Pro Ala Thr 440 Vai Glu Lys 450 G!u Ser ain Lys 455 Gin Gin Leu Tro 455 Ser Vai Glu 470 Lys Glu Lys Asp Lys Thr Pro 483 Ala Thr Lys Ser Ser Thr Thr 500 Pro Thr' Lys Vai Lys Pro Thr 515 Thr Ala Ser Ser Lya 520 Ser Ala Gly 330 Ser Ser Glu Ala 535 Lys Asn ile Lys S4S ASU Thr Asa 550 Asp Gly Asn Thr Gin Glu Asn 565 Lys Ala Lys
<210> 4 <211> 570 <212> PRT <213> Sequência Artificial
Leu Asp Glu Glu Val 285 Lys Ser Ala Pro Thr Asft Glu 300 Lys Met Thr Asp Tyr Glu Ser 315 Val Glu As» Asn Glu 320 His pro 330 He Lys Thr Gly Met 335 Leu Glu 345 Thr Thr Am Asp Asp 350 Tyr Trp Arg val Arg Thr Ile 365 Ser Lys Asp Ilô Phe Pro Tyr 380 Val Glu Gly Lys val HiS Val 395 Lys Thr Ile Asp Tyr 400 Vai ASp 410 Lys Glu Ala Phe Thr «15 Lys Lys 425 Glu Gin Gin Asp As» 430 Ser Ala Pro Ser Lys Pro Thr 445 Pro Ser pro Asp Ser Gin Lys 460 Asp Asp Asn Lys Am Asp Ala 475 Ser Ser Glu Ser Gly 480 Pro Thr 400 Lys Gly Glu Val Glu .495 Ser Val SOS Ser Thr Thr Gin Asn 510 Vai Ala Thr Thr Lys Asp Val Khfi Val Gin Thr Asp Ser Ala Pro 540 ,%5 £. a3 Leu Gin Lys Ala His Ser Thr Gin 555 Ser Gin Asn Asn Lys soo <22 0> 110 <223> ORF0657nH com metionina-glicina no terminal amino <400> 4
Gl« Pro I*ys 15 Ala Pro Glu 30 Glu Vai Glu
Hat Gly Ala Glu Ola Thr Giy Gly Thr Asn Thr Glu Ala 1 5 10
Thr Sl« Ala vai Ala Ser Pro Thr Thr Thr Ser Glu kya 20 25
Thr hys Pro Vai Ala Asn Ala Vai Ser Vai Ser Asn tya 35 40 45 111
Ala Pro Thr Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Glu val Lys SÔ 55 60 Ala Pro Lys GlU Thr. Lys Glu Vai Lys Pro Ala Ala Lys Ala Thr Asn 65 70 75 80 Asn Thr Tyr. Pro Ile Leu Asa Gin Glu Leu Arg Glu Ala Ile Lys Asn 8S 90 95 Pro Alá Ile Lys Asp Lys Asp Kis Ser Ala Pr© AS» Ser Arg Pro Ile 100 105 110 ASp Ph« Glu Met Lys Lys Lye Asp Gly Thr Gin Gin Fhe Tyr His Tyr 115 120 125 Ala Sor Ser Vai Lys Pro· Ala .Arg Vai ile Phe Thr Asp Ser Lys Pro 130 135 140 Glu Ile Glu Leu Gly Leu Gin Ser Gly Gin Fhe Trp Arg Lys Phe Glu 145 150 155 150 Vai. Tyr Glu Gly Asp Lys Lys Leu Pro Ile Lys Leu Val Ser Tyr Asp 165 170 175 Thr Vai Lys Asp Tyr Ala Tyr Ile Arg Fhe Ser Val Ser Asn Gly Thr 180 185 190 Lys Ala val Lys Ile Vai Ser Ser Thr HiS Fhe ASP Asn Lys Glu Glu 195 200 205 Lys Tyr Asp Tyr Thr Leu Met Glu Fhe Ala Gin Pro Ile Tyr Asn Ser aio 215 220 Ala Asp Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala GlU Lys Leu Leu 225 230 235 240 Ala Pro Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Val tyr Glu Leu 245 250 255 Aon Lys lie Gin Asp Lys Leu Pro Siu Lys Leu Lye Ala Glu Tyr Lys 260 2:65 270 lys Lys Leu Glu Asp Thr Lys Lys Ala Leu ASp Glu Gin Val Lys Ser 275 280 285 Ala 11« Thr Glu The Gin Asa Vai Gin Pro Thr Asn Glu Lys Met Thr 230 295 300 Asp Leu Glu Asp Thr Lys Tyr Vai Vai Tyr Glu Ser Val Glu Asn Asn 305 310 31S 320 Glu Ser Met Met Asp Thr Fhe Vai Lys His Pro ile Lys Thr Gly Hat 325 330 335 Leu Aso Gly Lys Lye Tyr Met Vai Met Glu Thr Thr Asn Asp Asp Tyr 340 345 350 Trp Lys Asp Fhe Met Vai Glu Gly Gin Arg Vai Arg Thr lie Ser Lys 355 380 365 Asp Ala Lys Asa Asn Thr Arg Thr Ile Ue Fhe Pro Tyr Val Glu Gly 370 375 380 Lys Thr Leu Tyr Asp Ala Ile Vai Lys Vai Mís Val Lys Thr Ile Asp 385 300 395 400 Tyr Asp Gly Gin Tyr Síis Vai 'Arg Ile val Asp Lys Glu Ala Fhe Thr 405 410 415 Lys Ala Asa Thr Asp Lys Ser Asn Lys Lys Glu Gin Glu Asp Asn Ser 420 425 43Q Ala Lys Lys Glu Ala Thr Pro Ala Thr Pro Ser Lys Pro Thr Pro Ser 435 440 445 Pro vai Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn 450 455 460 Lys Glu Leu Pro Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser 465 47G 475 460 112 112 Gly Lys Ser Ser Ala Lys Thr Ser S30 Ala Asn 545 L.ys Aán
Aep.Lys Thr Fr© 485
Ser Thr Thr Pr© 500
Pr© Thr Thr Ala 515
Ala Gly Ser Ser lie Lys Asn Thr 550
Thr Gin 01« Asn 5S5
Ala Thr Lys Pr© 450
Thr Lys Vai vai 505
Ser Ser Lys Thr 520
Glu Ala !*ys Asp 535
Asn Ae|» Gly His tya Ala W9 Ser 5?0
Thr Lys Gly Glu. Vai Glu 435 Ser Thr Thr Gin Asn Vai 510 Thr Lys Asp Vai Vai Gla 525 Ser Ala Pr© Leu Gin Ly$ 540 Thr Gin Ser Gin Asn Asm 555 550
<210> 5 <211> 447 <212> PRT <213> Sequência Artificial <220> <223> ORF0657nH com metionina-glicina no terminal amino <400> 5 113
Hefc Gly Ala Glu Glu Thr Gly eiy Thr Aso Thr Glu Ala Gin Pr© Lys ι 5 10 IS Thr Val Ala Ser Pr© Thr Thr Thr Ser Glu Lys Ala Fr© Glu 20 25 30 Thr Lys Pr© Val Ala Asa Ala Val Ser Val Ser Asn Lys Glu val Glu 35 40 45 Ala Pr© Thr Ser Glu Thr Lys Glu Ala Lys Glu Val Lys Glu Val Lys 50 55 60 Ala Pr© Ly« Glu Thr Lys Gly Val Lys Pr© Ala Ala Lys Ala Thr Asn 65 70 75 80 ASE Thr Tyr Pr© Ile Leu Asp Gin Glu Leu Arg Glu Ala ile Lys Asn as m 95 Pr© Ala xis' Lys Asp Lys Asp His Ser Ala Fro Asa Ser Arg Pr© Ile im 105 110 ÃSP Fhe Glu «et Lys Lys Lys ASp Gly Thr Glu Gin Phe Tyr His Tyr 115 120 125 Ala Ser Ser Val Lys Pr© Ala Arg Val ile Fhe Thr ASp Ser Lys Pr© 130 135 140 Glu Ile Glu Leu Çly Leu Sln Ser Gly Gin Fhe Trp Arg Lys Phe Glu 145 150 155 160 val Tyr Glu Gly Asp Lys Lys Leu Pr© ile Lys Leu Val Ser Tyr Asp 165' 170 175 Thr Val Lys Asp Tyr Ala Tyr lie Arg Phe Ser Val Ser ASn Gly Thr ISO 185 ISO Lys Ala val Lys ile val ser Ser Thr M.S Phe Âsn AS» Lys Glu Glu 195 200 205 hy® Tyr Asp Tyr Thr Leu wet Glu The Ala Gin Pr© lie Tyr Asn Ser 210 215 220 Ala Asp Lys Fhe Lys Thr Glu Glu ASp Tyr Lys Ala Glu lys Leu Leu 225 230 235 240 Ala Pr© Tyr Ly® Lys Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu 245 250 255 114
Asa Lys Ile Gin Asp Lys Leu Fr© Glu Lys Leu Lys Ala. Glu Tyr Lys 260 265 270 hy& Lys Leu. Glu Asp Thr Lys Lys Ala Leu Asp GlU Gin Vai Lys Ser 275 200 205 Ala lis Thr Glu Fhe Gin Asa Vai Gin Fr© Thr Asa Glu Lys Met Thr 290 295 300 Asp Leu Gin Asp Thr Lys Tyr Vai Vai Tyr'Glu Ser Vai Glu Asn Asn 305 310 315 320 Glu Ser hefc ííet ASp Thr Phe Vai Lys His Fr© Ile Lys Thr Gly JCet 3:25 330 335 Leu Asa Gly Lys Lys Tyr Met Vai Httt Glu Thr Thr Asn ASp ASP Tyr 340 345 350 Trp Lys Asp Fhe Met ¥«í Glu Gly Gin Arg Vai Arg Thr Ile Ser Lys 355 350 305 Asp Ala Lys Asn Asn Thr Arg Thr Ile ile The Fro Tyr vai Glu Gly 370 375 300 Lys mr Leu Tyr Asp Ala lie Vai Lys Vai His Vai Lys Thr lie Asp 3S5 390 395 400 'Tyr Asp Gly Gin Tyr Eis Vai am Ile Va i Asp Lys Glu Ala Fhe Thr 40S 410 415 Lys Ala Asa Thr Asp Lys Ser As*» Lys Lys Glu Gin Gin Asp Asn Ser 420 425 436 Ala Lys Lys Glu Ala Thr Pr© Ala Thr Fr© Ser Lys Fr© Thr Fr© 43-5 440 445
<210> 6 <211> 576 <212> PRT Λ 00 \—1 CM V Sequência Artificial <22 0> <223> ORFO 657nH < 4 Ο Ο > 6 115
Ale Glu Glu Thr Giy Val Thr Aon Thr Glu Ala Gin Pro Lys Thr Glu 1 5 10 15 Ala val Ala ..Ser Pro Thr Thr Thr Thr Thr Glu Lys Ala Pro Glu Ala 20 25 10 Lys Pro Vâl Ala Lys Pro val Ala ASO Ala Val Ser Val Ser Asn Lys 35 40 45 Glu Val Val Ala Pr© Thr Thr Glu Thr Lys Glu Ala Lys Glu Val Lys 50 55 60 Ala val Lys Glu Vai Lys Ala Pr© Lys Glu Ala Lys Glu Glu Lys Pro 65 70 75 80 Ala Ma Lys Ala Asp Asn Asn Thr Tyr Pro lie Leu Asn Gin Glu Leu 85 90 95 Arg Glu Ala Ile Lys Asn Pro Ala Xle Lys Asp Lys ASp «is Ser Ala > 100 y 105 110 Pro Asm Ser Mg Pro ile Asp Fhe GlU mt Lys Lys Lys ASp Gly Thr 115 128 125 Gin Gin Pita Tyr His Tyr Ma Ser Ser Val Lys Pro Ala Argr Val Ile 130 =* 135 148 Phe Thr Asp Ser Lys Pro Glu lie Glu Leu Gly Leu Gin Ser Gly Gin 145 ISO 155 160 116
Phe Trp Arg Lys Phe Glu Val Tyr Glu Gly Asp Lys Lys Leu Pro Ile 165 170 175 Lys Leu Vai Ser Tyr Asp Thr Val Lys Asp tyr Ala Tyr Ile Arg' Phe 180 185 190 ser Vai Ser Asn Gly Thr Lys Ala val Lys 11e vai Ser Ser Thr His 155 200 205 Phe Asn Asn Lys Gin Glu Lys Tyr Asp Tyr Thr Leu Met Glu Phe Ala 210 21S 220 Gin Pr» lie Tyr Asn Ser Ala Asp Lys Phe Lys Thr Glu Glu Asp Tyr 225 230 235 240 Lys Ala Glu Lys Leu Leu Ala Pre Tyr Lys Lys Ala Lys Thr Leu Glu 245 250 255 Arg Gin Vai Tyr Gin Leu Asn Lys Ue Gin Asp Lys Leu Pro GiU Lys 280 265 270 Leu Lys Ala Gin Tyr Lys Lys Lys Leu Glu Glu Thr Lys Lys Ala Leu 275 280 285 Asp Glu Gin Vai Lys Ser Ala 11a Thr Glu Phe Gin Asn val Gin Pro 290 295 300 Thr Asn Gin Lys Met Thr Asp Leu Gin Asp Thr Lys Tyr val Val Tyr 305 310. 315 320 Glu Ser Vai Gin Asn Asn Glu Ser Met Met Asp Ala Phe Val Lys His 325 330 335 Pro Ile Lys Thr Gly Met Leu Asn Gly Lys Lys Tyr Met Val Met Glu 340 345 350 Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Met Val Glu Gly Gin Arg 355 360 365 Vai Arg Thr Ue Ser Lys Asp Ala Lys Asn Asn Thr Arg Thr lie Ile 370 375 380 Phe Pr» Tyr Vai Glu Gly Lys Thr Leu Tyr Asp Ala Ile val Lys Val 385 390 395 400 His Vai Lys Thr Xle Asp Tyr Asp Gly Gin Tyr Mis Val Arg Ile val 405 410 415 Asp Lys Gin Ala Phe Thr Lys Ala Asn Ala Asp Lys Thr Asn Lys Lys 420 425 430 Glu Gin Gin Asp Asn Ser Ala Lys Lys Glu Thr Thr Pro Ala Met Pro 435 440 445 Ser Lys Pr» Thr Thr Pro Pr» val Glu Lys Glu Ser Gin Lys Gin Asp 450 455 460 Ser Gin Lys Asp Asp Asn Lys Gin Ser pro Ser Val Glu Lys Glu Asn 485 470 475 480 Asp Ala Ser Ser Glu Ser Gly Lys Asp Lys Met Pro Val Thr Lys Pro 485 490 495 Ala Lys Ala Gin val Glu Ser Ser Ser Thr Thr Pro Thr Lys Val Val 500 SOS 510 Ser Thr Thr Gin Asn Val Ala Lys Pro Thr Thr Ala Ser Ser Glu Thr 515 520 525 Thr Lys ASp Vai val Gin Thr Ser Ala Gly Ser Ser Glu Ala Lys Asp 530 535 540 Ser Ala Pro Leu Gin Lys Ala Asn lie Lys Asn Thr Asn Asp Gly His 545 550 555 560 Thr Gin ser Gin Asn Asn Lys Asn Thr Gin Glu Asn Lys Ala Lys Ser 565 570 573 117
<210> 7 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <4Ο0> 7 118
Ala Glu Glu Thr Gly siy Thr AS» 1 5 Ala Vai Ala Ser Pro Thr Thr Thr v 29 Pro Vai Ala Asn Ala vai Ser Vai 35 40 Thr Ser Glu Thr Lys Glu Ala Lys 50 55 Lys Glu Thr Lys Glu Vai Lys Pr» £5 78 Tyr Pro Ile Leu AS» Gin Glu Leu 85 n« Lys Asp Lys 1tfkfS Ââp Hifl Ser Ala Glu Ket Lys 115 AVW Lys Lys ASP Gly Thr 128 Ser Vai Lys Pro Ala Arg Vai Ile 130 135 Glu Leu Gly Leu Gin Ser Gly Gin 14 S 150 Glu Gly Asp Lys Lys Leu Pr» Ile .165 Lys Asp Tyr Ala Tyr lie Arg Phe 180 Vai Lys Ile Vai Ser Ser Thr His 195 208 Asp Tyr Thr Leu mt Glu Phe Ala 210 215 Lys Phe Lys Thr Glu Glu Asp Tyr 225 230 Tyr Lys Lys Ala Lys Thr Leu Glu 245 Ile Gin Asp Lys Leu Pro Glu Lys 260 Leu Glu mp Thr Lys Lys Ala Leu 275 288 Thr Glu Phe Gin Asn Vai Gin Pr» 290 295 Gin Asp Thr Lys Tyr vai Vai Tyr 305 310 Hat Met ASp Thr Phe Vai Lys Mi® 325 Gly Lys Lys Tyr '«et vai pet Glu 340 Asp Phe Hat vai Glu Gly Gin Arg 355 368 Lys Asn As» Thr Arg Thr Ile Ile 370 575
Thr Glu 10 Ala Gin pro Lys Thr 15 Glu Ser 25 Glu Lys Ala Pro Glu 30 Thr Lys Ser Asn Lys Glu Vai 45 GlU Ala Pro Glu Vai Lys Glu 60 Vai Lys Ala Pro Ala Ala Lys 75 Ala Thr Asn Asn Thr 80 Arg Glu 90 Ala Ile Lys Asn Pr» 95 Ala Pr» 105 'Asn Ser Arg Pr» Ile 110 Asp Phe Gin Gin Phe Tyr Mis 125 Tyr Ala Ser Phe Thr Asp Ser 140 Lys Pro Glu Ile Phe Trp Arg 155 Lys Phe Glu Vai Tyr ISO Lys Leu 170 Vai Ser Tyr Asp Thr 175 Vai Ser 185 Vai Ser Asn Gly Thr 198 Lys Ala Phe Asn Asn Lys Glu 285 Glu Lys Tyr Gin Pro Ile Tyr 320 Asn Ser Ala Asp Lys Ala Glu 235 Lys Leu Leu Ala Pro 248 Arg Gin 250 Vai Tyr Glu Léu Asn 255 Lys Leu 265 Lys Ala Glu Tyr Lys 278 Lys Lys ASp Glu Gin vai Lys 285 Ser Ala ile Thr Asn Glu Lys 300 »eL Thr Asp Leu Glu Ser Vai 315 Glu Asn Asn Glu Ser 320 Pro Ile 330 Lys Thr Gly Mut Leu 335 Asn Thr 345 Thr Asn Asp Asp Tyr 350 Trp Lys Vai Arg Thr Ile Ser 365 Lys Asp Ala Phe Pro Tyr Vai 3ã0 Glu Gly Lys Thr 119
Leu Tyr Asp Ale Ile Vai Lys Vai His Vai Lys Thr ile ASp Tyr ASp 385 390 395 400 Gly Gin Tyr His Vai Arg 11« Vai Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asn Thr Asp Lys ser Asn Ly® Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Lys; Glu Ala Thr Pr© Ala Thr Pr© Ser Lys Pr© Thx Fr© Ser Pro Val 43S 440 445 Glu Lys Glu Ser Gin Lys Gin Agp Ser Gin Lys Asp ASP Asn Lys Gin 450 455 460 Leu Pre Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 475 480 Gly Vai Thr Leu Ala Thr Lys Pr© Thr Lys Gly Glu Val Glu Ser Ser 485 490 495 Ser 1¾¾1 Thr pm Thr Ly® Vai Vai Ser Thr Thr Gin Asn Val Ala Lys soo 505 S10 Pr© Thr Thr Gly Ser Ser Lys Thr Thr Lys Asp Vai val Gin Thr Ser 515 520 525 Ais Gly Ser Ser Clu Ala Lys Asp Ser Ala Pr© Leu Gin Lys Ala Asn 530 S35. 540 Ile Lys His Thr Asn Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn 145 550 555 560 Thr Gin Glu Asn Lys Ma Lys Ser $65-
<210> 8 <211> 568 <212> PRT <213> Sequência Artificial <220> <223> ORFO 657nH <400> 120
Ala -Glu 01« Thr Gly Gly Thr Asn Thr Glu Ala 01© Pro Lys Thr Glu i 5 10 15 Ala Val Ala Ser Pr© Thr Thr Thr Ser 01« Lys Ala Pro 01« Thr Lys 20 25 30 Pro V&l Ala As© Ala Val Ser Val Ser A$n Lys 01« Val Glu Ala Pr© 35 40 45 Thr Ser 01« Thr Lys 01« Ala Lys 01« Val Lys 01« val Lys Ala Pro m 55 60 tys 01 u Thr Lys 01« Val Lys Pro Ala Ala. Lys Ala Thr As© As© Thr 65 70 75 80 Tyr Pro lie Leu AS© 01© 01« Leu Arg Glu Ala tle Lys .As© Pro Ala 85 90 05 Ile Lys Asp Lys Asp His Ser Ala Pro Asn Ser .An Pro Si© Asp Phe ISO 105 110 01« Met Lys Lys Lys Asp Gly Thr 01© Gl© Phe Tyr Mis Tyr Ala Ser 115 120 125 Ser Val Lys Pro Ala Arg Vai n« Phe Thr Asp Ser Lys Pr© 01« Ile 130 135 140 01« Leu Oly Leu 01© Ser Gly 01© phe Trp Arg Lys Phe Glu Val Tyr 145 150 155 ISO 121
Glu Gly Asp Lys Lys Leu Pr© Xle Lys Leu Val Ser Tyr Asp Thr val 165 170 175 lys Asp Tyr Ale Tyr 11« Arg Phe Ser Val Ser Asn Gly Thr Lys Ala 180 185 ISO vai Lys 11« Vai Ser Ser Thr His Phe Asn AS© Lys Glu Glu Lys Tyr 195 200 205 Asp Tyr Thr Leu het Glu Phe Ala Gin Pr© 11« Tyr Asn ler Ala Asp 210 215 220 Lys 'Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pr© 225 230 235 240 Tyr Lys Lys Ala Ly» Thr Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys 245 250 255 11« Gin asp Lys Leu pr© Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 265 270 Leu Gin Asp Thr Lys Lys Ala Leu ASp Glu Gin Val Lys Ser Ala U« 275 280 285 Thr Gin Fhe Gin Asn Val Gin Pr© Thr Asn Glu Lys Mefc Thr Asp Leu 290 295 300 Gin Asp Thr Lys Tyr Val Val Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 310 315 320 Het Met Asp Thr Phe Val Lys His Pr© lie Lys Thr Gly Hat Leu Asn 325 330 335 Gly Lys Lys Tyr Met Val Het Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Asp Phe Het Vai Glu Gly Gin Arg Val Arg Thr lie Ser Lys Asp Ala 355 360 365 Lys Asn Asrt Thr Arg Thr 11« 11« Phe Pr© Tyr val Glu Qiy Lys Thr 370 3?S 380 Leu Tyr ASp Ala lie Val Lys Val His Val Lys Thr lie Asp Tyr Asp 385 390 395 400 Gly Gin Tyr His Val Arg lie Val Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Agn Thr ASp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Ay» Glu Ala Thr Pr© Alã Thr Pr© Ser Lys Pr© Thr Pr© Ser Pr© vai 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp ASp Asn Lys Gin 450 455 460 Leu Pr© Ser Val Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 455 470 475 480 Asp Lya Thr Fr© Ala Thr Lys Pr© Thr Lys Gly Glu val Glu Ser ser 48S 490 495 Ser Thr Thr Pr© Thr Lys Val. Val Ser Thr Thr Gin Asn Val Ala Lys 500 SOS 510 Pro Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser. SIS 520 §25 AÍ» Gly ser Ser Glu Aia Lys Asp Ser Ala Pr© Leu Gin Lys Ala Asn 530 535 540 lie Lys Asn Thr Asii Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn 545 550 555 560 Thr Gin Glu Asn Lys Ala Lys Ser 565' 122
<210> 9 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <4Ο0> 9 123 123 Vai Lys Leu Glu Glu Thr Gly Gly Thr Asn Thr Glu Ma Gin Fr© Lys Thr Glu 5 10 15 Ala Ser Pro Thr Thr Thr Ser Glu Lya Ala Pr© Glu Thr Lys 20 25 30 Ala Am Ala Vai Ser Vai Ser Asn Lys Glu Val Glu Ala Fr© 35 40 45 Glu Thr Lys Glu Ala Lys Glu Val Lys Glu Val Lys Ala Fr© 55 60 Thr Lys Ala Vai Lys Pr© Ala Ala Lya Ala Thr As n Asn Thr 70 75 @0 lie Leu Asn Gin Glu Leu Arg Glu Ala lie Lys Asn Fr© Ala 85 90 95 Asp Lys Asp His Ser Ala Fr© Asn Ser Arg Pr© Ile Asp Fhe 100 105 110 Lys Lys Glu Am Gly Glu Gin Gin Phe Tyr His Tyr Ala Ser :U5 120 125 Lys Fr© Ala Arg Vai lie Fhe Thr Asp Ser Lys Pr© Glu lie 135 140 Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Phe Glu Val Tyr 150 155 160 Asp Lys Lys Leu Fr© Ile Lys Leu Val Ser Tyr Asp Thr Val 165. 170 * 175 Tyr Ala Tyr ila Arg. Phe Ser Val Ser Asn Gly Thr Lys Ala ISO 185 190 11« Vai Ser Ser Thr His Phe Asn Asn Lys Glu Glu Lys Tyr 195 200 205 Thr Leu Mte& Glu Ph© Ãla Gin Pr© 11* Tyr Asn Ser Ala Asp 215 220 Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pr© 230 235 240 Lys Ala Lya Thr Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys 245 250 255 Asp Lys Leu Pr© Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 265 270 Asp Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala lie 275 210 285 Phe Gin Asn vai Gin Pr© Thr Asn Glu Lys Met Thr Asp Leu 295 300 Thr Lys Tyr vsi vai Tyr Glu Ser val Glu Asn Asn Glu Ser 310 315 320 Asp Thr Fhe Vai Lys Mis Fr© Ile Lys Thr %%ú Gly Met Leu Asn Lys Tyr Met Vai Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Met Vai Glu Gly Gin Arg Vai Arg Thr Ile Ser Lys Asp Ala 355 360 v 365 Asn Thr Arg Thr 11® Ile Phe Fr© Tyr val Glu Gly Lys Thr 375 . 380
Ala Glu 1
Ala vai
Fr© Vai
Thr Ser 50
Lys Glu 65
Tyr Pro
Ile Lys
Glu Met
Ser Vai 130 Glu Leu 145
Glu Gly
Asp Tyr 210 Lys Phe 225
Tyr Lys lie Gin
Thr Glu 290 Gin Asp 305
Met Met
Gly Lys
Asp Phe
Lys Asn 370 124 hm. Tyr Ásp Ala 11* vai Lys Vai His Val Lys Thr íle Asp Tyr Asp 3®§ 390 305 40© Gly Gin Tyr Si a vai Àrg lie val Asp Lys Glu Ala phe Thr Lys Ala 405 410 41S hsn Thr Asp Lys Ser Asn Lys Lys Glu Glrs Gin Asp Asn Ser Ala Lys 430 425 430 Lys Glu Ale Thr Pr* Ala Thr Fro Ser Lys Pm Thr Pro Ser Pro val 435 440 445 Glu Lys Cia Ser Gin Lys Gin ÂSp Ser Gin Lys Asp ASp Asn Lys Gin 450 455 460 Leu Pro Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 475 460 Asp Lys Thr Pm Ala Thr Lys Pm Thr Lys Gly Glu Val Glu Ser Ser 48S 490 405 Ser Thr Thr Fro Thr Lys Vai vai Ser Thr Thr Gin Asn Val Ala Lys SCO SOS 510 Pm Thr· Thr Ala Ser Ser Lys Thr Thr Lys Asp val Val Gin Thr Ser 515 520 525 Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala fm Leu Gin Lys Ala Asn 530 535 540 Zle Lys Aso Thr Asn Ásp Gly fíis Thr Gin Ser Gin Asn Asn Lys Asn 545 550 555 560 •Thr Gin aiu Ase Lys Ma Lys Ser 565
<210> 10 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <4 0 0> 10 125 Mâ Glu 61« Thr Giy Gly Thr Asn Thr Glu Ala Gin Pro Lys Thr Glu ι 5 10 15 ; Al-a Val Ala'Ser Pm Thr Thr Thr Ser Glu Lys Ale Pro Glu Thr Lys 20 25 30 pro Vai Ala Asm Ala Vai Ser Vai Ser Asn Lys Glu Vai Glu Ala Pm 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Glu val Lys Ala Pm 50 SS 50 Lys Glu Thr Lys Glu Vai Lys Pro Ala Ala Lys Ala Thr Asn Asn Thr €5 70 75 30 Tyr Pro Ile Leu Asn Gin Glu Leu Arg Glu Ala Ile Lys Asn Pro Ala , 35 90 95 Ile Lys Asp Lys Asp Hls ser Ala Pro Asn Ser Arg pro ile Asp Phe 100 10$ 110 Glu Met Lys LyS' Lys Asp Gly Thr Gin Gin Phe Tyr His Tyr Ala Ser 115 120 m Ser Vai Lys Pro Ala Arg Vai Ile Phe Thr Asp Ser Lys Pro Glu lie 130 135 140 Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Phe Glu Val Tyr 145 A i 50 155 100 126
Pro Ile Lys Leu val Arg Phe Ser 185 líM Val Ser Thr Hís Phe Asn Asn *UU Phe Ala 215 Gin Pro Ile Asp Tyr Lys Ala Glu 235 Leu Glu Arg Gin 250 vai Glu Lys Leu 265 Lys Ala Ala Leu 280 Asp Glu Gin Gin Pro 295 Thr Asn Glu val Tyr Glu Ser Val *1 <5 Lys Hís pro Ile Lys Met Glu Thr 345 jjy Thr Asn Gin Arg 360 Val Arg Thr lie lie 375 Phe Pro Tyr Lys Val HÍS Val Lys 305 11® val ASp Lys 410 Glu Lys Lys Glu 42$ Gin Gin Thr Pro 440 Ser Lys Pro Gin Asp 455 Ser Gin Lys Glu Asn Asp Ala Ser 475 Lys Pro Thr Lys 490 Gly Val Val Ser 505 Thr Thr Lys Thr 520 Thr Lys Asp Lys Asp $35 Ser Ala Pro Gly His Lys Ser Thr Gin Ser 555
Glu Gly Asp Lys Lys Leu 1δ5 Lys Asp Tyx Ala Tyr Ile 180 Vai Lys II® Vai Ser Ser 195 Asp Tyr Thr Leu HeC Glu 210 Lys Pb® Lys Thr Glu Glu 225 230 Tyr Lys Lys Ala Lys Thr 245. Ile Gin Asp Lys Leu Pr® 2S0 Leu Glu Asp Thr Lys Lys 215 Thr Glu Ph© Gin Lys vai 290 Gin Asp Thr Lys Tyr vai 305 310 K»t Mefc Asp Thr Ph» Vai 325 Gly Lys Lys Tyr «et Vai 340 Asp Phe mt Vai Glu Gly 355 - Lys Asn Asn Thr Arg Thr 310 Léu Tyr Asp Ala 11® Vai 385 3m Gly Gin Tyr Hts Vai Arg 405 Asn.Thr Asp Lys Ser Asn . 420 Lys Glu Ala Thr Pro Ala 435 Glu Lys Glu Ser Gin Lys 450 Leu Pro Ser Vai Glu Lys 465 470 Asp Lys Thr Pro Ala Thr 4SS Ser Thr Thr Pro Thr Lys 500 Pro Thr Thr Ala Ser Ser 515 Ala Gly Ser Ser Glu Ala S3Ô Ile Lys Asn Thr Asn Asp 545 550 Thr Gin Glu Asn Lys Ala 565
Ser Tyr Asp Thr Vai 175
Asn Gly Thr Lys Ala 150
Lys Glu Glu Lys Tyr 205
Tyr Asn Ser Ala Asp 220
Lys Leu Leu Ala Pro 240
Tyr Glu Leu Asn Lys 255
Glu Tyr Lys Lys Lys 270
Vai Lys Ser Ala Ile 285
Lys mt Thr Asp Leu 300
Glu Asn Asn Glu Ser 320
Thr Gly Met Leu Asn 335
Asp Asp Tyr Trp Lys 350
Ile ser Lys Asp Ala 365
Vai Glu Gly Lys Thr 380
Thr Ile Asp Tyr Asp 400
Ala Phe Thr Lys Ala 415
Asp Asn Ser Ala Lys 430
Thr Pro Ser Pro Vai 44S
Asp Asp Asn Lys Gin 460
Ser Glu Ser Gly Lys 480
Glu Vai Glu Ser Ser 485
Gin Asn val Ala Lys 510
Val Val Gin Thr Ser 525
Leu Gin Lys Ala Asn 540
Gin Asn Asn Lys Asn 560 127
<210> 11 <211> 565 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <4 Ο 0> 11 128
Ma Glu Glu fhr Gly Gly Thr &SO fhr Glu Ma Gin Pro Lys Thr G i u I 5 10 15 Ma Vai Ma Ser Pro Thr fhr Thr Thr Glu Lys Ala Pro Glu Ala Lys 20 25 30 Pro val Ma Asn Ala val Ser vaX Ser Aso Lys Glu val Glu Ala Pro 35 40 45 fhr Ser Gi» Thr Lys Glu Ala Lys Glu Val Lys Ala Pro Lys Glu fhr 50 55 c· 60 Lys Ma Vai Lys Pro Ala Ala Lys Ala Asp Asn Asn Thr Tyr .Pro Xle 65 70 ?S 80 teu te Glà Glu Leu Arg Glu Ma Xle Lys Asn Pro Ala Xle Lys Asp m 90 95 . Lys Asp His Ser Ma Pro Asn Ser Arg Pro xle Asp phe Glu Met Lys 100 105 110 Lys Glu Asn Gly Glu Gls Gin Phe Tyr HiS Tyr Ala Ser Ser Val Lys 115 120 125 Pro Ma Arg Vai Ile Phe Thr Asp ser Lys Pro Glu Xle Glu Leu Gly 130 135 140 teu. Gin Ser Gly Gin Phe Trp Arg Lys Phe Glu val Tyr Glu Gly Asp 14 5 150 155 160 Lys Lys Leu Pro Ile Lys Leu val Ser Tyr Asp fhr vai Lys Asp Tyr 165 170 175 Ala Tyr Xle Arg Phe Ser Val Ser Aso Gly Thr Lys A,ls Val Lys ile 180 185 190 val Ser Ser fhr His Phe ASO ASO Lys GlU Glu Lys Tyr Asp Tyr fhr 195 200 205 teu Het Glu Phe Ala Gin Pro Ile Tyr Asn Ser Ala Asp LyS Phe Lys 210 215 220 Thr Glu Gin Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pro Tyr Lys Lys 325 230 235 240 Ma Lys Thr Leu 01» Arg Gin Val Tyr Glu Leu Asn Lys Ile Gin Asp 245 250 255 Lys Lè» Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys Lgu Glu Asp 260 265 270 fhsr Lys Lys Ala. La» ASp Glu Gin val Lys Ser Ala Xle Thr Glu Phe 375 280 285 Gin Asn Vai 01a Pro Thr ASO. Gl» Lys Het Thr Asp Leu Gin Asp Thr a m * 295 300 Lys tyr Vai Vai Tyr Glu Ser Val Glu A$n Asn Glu Ser «et Het Asp 305 310 315 520 Thr Phe vai Lys His Pro Xle Lys Thr Gly Hat Leu Asn Gly Lys Lys 325 330 335 Tyr Met Vai Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe het 340 345 350 Vai Glu Gly Gin Arg Vai Arg fhr Xle Ser Lys Asp Ala Lys Asn Asn 355 3S0 365 fhr Arg fhr Ile Ile Phe Pro Tyr Val Õlu Gly Lys Thr Leu Tyr Asp 370 37S 380 ’ 129
Ala Ile Vai Lys Vai His Val Lys Thr Ile Asp Tyr Asp Gly Gin Tyr MS 390 395 400 Mis mi Arg lie val ASp Lys GÍU Ala Phe Thr Lys Ala Asn Thr Asp 405 410 415 Lys Ser .Asn Lys Lys Glu Gin Gin Asp Aso Ser Ala Lys Lys Glu Ala 410 425 430 Thr Pro Ale Thr p.r© Ser Lys Pro Thr Pro Ser Pro val GlU Lys Glu- 435 440 445 Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin Leu Pro Ser 450 455 400 Val Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys Asp Lys Thr 45$ 470 47$ 480 Pro .ÃjLifâ Thr Lys Pr® Ala Lys Gly Glu Val Glu Ser Ser Ser Thr Thr 48$ 490 495 Pro Thr Lys Vai; Val Ser Thr Thr Gin Asn Val Ala Lys Pro Thr Thr 500 505 510 Ma Ser Ser Lys Thr Thr Lys Asp Vâl Val Gin Thr Ser Ala Ser Ser 515 520 525 Ser Glu AX& Lys Asp Ser Ala Pro Leu Gin Lya Ala Asn He Ly® Asm 530 535 540 Thr Asn Asp Gly Hia Thr Gin Ser Olá Asn Asn Lys Asn Thr Gin Glu 545 550 5$5 540 Asn Lys Alá Lys Ser 5«$
<210> 12 <211> 566 <212> PRT <213> Sequência Artificial <220> <223> ORFO657ηΗ <400> 12 130
Ms Glu 6lu Thr Giy Giy Thr Asn Thr Glu Ala Gin Pro Lys Thr Glu 1 5 10 15 Ma Vai Ma Ser Pro Thr Thr Thr Ser Glu Lys Ala Pro Glu Thr Lys 20 25 30 Pro val Aàíi Ala vai Ser Vâl Ser Asn Lys Glu vai Glu Ala Pró 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Val Lys Glu Vai Lys Ala Pro 50 55 60 Lys Glu thr Lys Ala Vai Lys pro Ala Ala Lys Ala Thr Asn As» Thr 63 70 75 BG Tyy Pro lie Leu Aso Glu Glu Leu Arg Glu Ala lie Lys Asn Pro Ala as 90 95 Ile Lys Asp Lys Asp Kis Ser Ala Pro As» Ser Arg Pro Ile Aãp Phe 100 105 110 Glu Hat Lys Lys Glu ASA Gly Glu Gin Gin Phe Tyr Sis Tyr Ala Ser 115 120 125 Ser Val Lys Pro AiA Arg vai Ile Phe Thr Asp Ser Lys Pro Glu Ile 130 135 140 Glu Leu Gly Leu Glu Ser Gly Gin Phe Trp Arg Lys Pbe Glu Val Tyr 145 ISO 155 ΐέο 131
Glu Gly Asp Lys Lys Léu Fr© Ile Lys Leu Val Ser Tyr Asp Thr val 165 170 175 Lys Asp Tyr Ale Tyr Ha Arg Phe Ser Vai -Ser Asn Gly Thr Lys Ala - ISO 185 190 Vai Lys ile Vai Ser Ser Thr His phe Asn Asn Lys Glu Glu Lys Tyr 195 200 205 Asp Tyr Thr Leu Met Glu Fhe Ala Gin Pr© Ile Tyr Asn Ser Ala ASp 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pro 225 230 235 240 Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys 245 250 255 Ile Gin Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 265 270 Leu Glu Asp Thr Lys Lys Ala Leu· Asp Glu Gin Val Lys ser Ala Ile 275 280 28S Thr Gin Phe Gin Asn Vai Gin Fr© Thr Asn Glu Lys Héfc Thr ASp: Leu 290 295 300 Gin Asp Thr Lys Tyr Vai vai Tyr Glu Ser Vai Glu Àsn Asn Glu Ser 305 310 315 320 Mac Hat Asp Thr Phe Val Lys His Pro Ile Lys Thr Gly «se Leu Asn 325 330 335 Gly Lys Lys Tyr Mee Val Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Asp Phe Met Vai Glu Gly Gin Arg Val Arg Thr Ile Ser Lys Asp Ala 355 360 365 Lys Asn Asa Thr Arg Thr Ile Ile Phe Fr© Val Glu Gly Lys Thr 370 375 380 Leu Tyr Asp Ala Ile val Lys Val His Val Lys Thr lie Asp Tyr Asp 385 390 395 400 Gly Gin Tyr Mis Val Arg Ile Val Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asn Thr Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Lys Glu Ala Thr Pr© Ala Thr Pr© Ser Lys Pr© Thr Pro Ser Pr© Val. 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin 450 455 460 Leu Pr© Ser Vai Glu LyS Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 455 470 475 480 Asp Lys Thr Pr© Ala Thr Lys Fr© Thr Lys Gly Glu Val Glu Ser Ser 485 490 495 Thr Thr Pro Thr Lys Val Vai Ser Thr Thr Gin Asn Val Ala Lys Pro 500 50$ 510 Thr Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser Ala Gly 515 520 525 Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn Ile Lys 530 535 540 Asn Thr Asn Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin 545 550 555 56Ô Glu Asm Lys Ala Lys Ser 5,65 13 132 <210> <211> <212> <213> <22 0> <223> <4 Ο 0> 568 PRT Sequência Artificial ORFO 657ηΗ 13 133
Ala Glu Glu Thr Gly Gly Thr A$t% Thr Glu Ala Gin Fro Lys Thr Glu 1 S 18 1$ Ala Vai Ala Ser Fr© Thr Thr Thr Ser Glú Lys Ala fr© GlU Thr Lys 20 25 30 Fro Vai Ala Asn Ala vai Ser Vai Ser Asn Lys Glu Val Glu Ala Fro 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Glu Val Lys Ala Fr© 50 55 60 Lya Glu Thr Lys Glu Vai Lys Fr© Ala Ala Lys Ala Thr Asn Asn Thr m 70 75 80 Tyr Fro Ile Leu Asa Gin Glu Leu Arg Glu Ala Ile Lys Asn Fr© Ala 85 90 95 lie Lys Asp Lys Asp· Hl S Ser Ala pr© Asa Ser Arg Fro Ile Asp Phe 100 105 110 Glu Met Lys Lys Lys Asp Gly Thr Gin Gin Phe Tyr BiS Tyr Ala Ser 115 120 125 Ser Vai Lya Fr© Ala Arg Vai Ile Phe Thr Asp Ser Lys pr© Glu XI© 130 135 140 Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Ffee Glu Vai Tyr 145 150 155 160 Glu. Gly Asp Lys Lys Leu Fr© 11© Lys Leu Vai Ser Tyr Asp Thr Val 165 170 175 Lys Asp Tyr Ala Tyr Ile Arg Phe Ser Vai Ser Asa Gly Thr Lys Ala ISO 185 190 Vai Lys Ile Vai Ser Ser Thr 81* Phe Asn Asn Lys Glu Glu Lys Tyr 105 200 r 205 Asp Tyr Tbr Leu. Met Glu Phe Ala Gin Pr© Ile Tyr Asn Ser Ala Asp 210 215 220 Lys Fhe 'Lya Thr Glu Glu ASP Tyr Lys Ala Glu Lys Leu Leu Ala Fro 225 230 235 240 Tyr Lys Lya Ala Lys Thr Leu Glu Arg Gin Vai Tyr Glu Leu Asn Lys 245 250 255 Ile Gin Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 ' 265 270 Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala lie 275 280 285 Thr Glu Fhe Gin Asa vai Gin Fr© Thr Asn Glu Lys «et Thr Asp Leu 200 295 300 Gin Aôp Thr Lys Tyr vai Vai fyr Glu Ser Vai Glu Asn Asn Glu Ser 305 310 315 320 Met «et Asp Thr Phe Vai Lys Bis Pr© Ile Lys Thr Gly Met Leu Asn 325 330 335 Gly Lys Lya Tyr fíet Vai «et Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Asp Fhe «et Vai Glu Gly Gin Arg Vai Arg Thr lie Ser Lys Asp Ala 355 360 365 Lys Asa Asn Thr Arg Thr lie Ue Phe Pr© Tyr Vai Glu Gly Lys Thr 370 375 380 134
Leu Tyr Asp Ale ile Vai Lys Val His vai Lys Thr Ile Asp Tyr Asp 385 350 395 400 Gly Gin Tyr Hie Vai &rg Ile Vai Asp Lys Glu Ala Phe Thr Lys Ala 405 410 4X5 hsn Thr Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asa Ser Ala Lys 420 425 410 Lys Glu Ala Thr Fro Ala Thr Fro Ser Lys ?ro Thr Pro Ser Fro Val 435 440 445 Glu Lys Glu Ser GXn LyS Gin Asp Ser Gin Lys Asp Asp Asa Lys Gin 4S8 455 460 Leu Fro Ser Vai Glu Lys Glu ASO Asp Ala ser Ser Glu Ser Gly Lys 465 470 475 480 Asp Lys Thr Pr® Ala. Thr Lys Fro Thr Lys Gly Lys val Glu Ser Ser 485 400 495 Ser Thr Thr Pro Thr Lys Vai val Ser Thr Thr Gin Asn Vai Ala Lys 500 SOS 510 Fro Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser 515 520 525 Ma Gly Ser Ser Glu Ala Lys ASp Ser Ala Pr© Leu Gin Lys Ala Asa ,530 535 540 Ile Lys ASTi Thr Asn Asp Gly Hls Thr Gin Ser Gin Asn Asa Lys Asa 545 550 555 560 Thr Gin Glu Asa Lys Ala Lys Ser 565
<210> 14 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657nH <4 Ο 0> 14 135
Ala GXu GXu Thr eiy Gly Thr Asn Thr Glu Ala Gin pro Lys Thr Glu 1 5 10 15 Ala Vál Ala Ser Pro Thr Thr Thr Ser Glu Lys Ala pro Glu Thr Lys 20 25 30 Pro Vai Ala Asn Ala Vai Ser Vai Ser Asn Lys Glu Val Glu Ala Pro 3$ 40 45 Thr Ser GXu Thr Lys Glu Ala Lys Glu Vai Lys Glu val Lys Ala Pro 50 55 60 Lys Glu Thr Lys Glu Vai Lys Pro Ala Ala •Lys Ala Thr Mn Asn Thr 65 70 75 80 Tyr Pro 11· Leu Ma Gin Glu Leu Argr Glu Ala lie Lys Mn Pró Glu 85 80 95 Ile Lys tep Lys Mp Ris Ser Ala Pro Asn Ser Arg Pro Ile Asp Phe 10Ô 105 no Glu Hat Lys Lys Lys Asp Gly Thr Gin Gin Phe Tyr His Tyr Ala Ser 115 12Ô 125 Ser Vai Lys Pro Ala Arg Vai lie Fhe Thr Asp Ser Lys Pro Glu Ile 130 13 S 140 Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Phe Glu val Tyr 145 150 15$ ISO 136
Glu Gly Asp Lys Lys Leu Pro Ue Lys Leu Ala Ser Tyr Asp Thr Val 165 170 175 Lys Asp Tyr Ala Tyr Ile Arg Phe Ser Ile Ser Asn Cly Thr Lys Ala ISO 185 ISO Vai Lys Ilt Vai Ser Ser Thr His Phe Asn Asn Lys Glu Glu Lys Tyr 19S 200 205 Asp Tyr Thr Leu Met Glu Phe Ala Gin Pro Ile Tyr Asn. Ser Ala Asp 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pro 225 230 , 235 240 Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Val fyr Glu Leu Asn. Lys 245 250 255 Ile Gin Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 268 265 270 Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala lie 275 280 285 Thr Glu Phe Gin Asn Vai Gin Pro Thr Asn Glu Lys Met Thr Asp Leu 290 295 300 Gin Aspt Thr Lys Tyr Vai val Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 310 315 320 Hat Met Asp Thr Phe Val Lys His Pro Ile Lys Thr Gly Met Leu Asn 325 330 335 Gly t.ys Lys Tyr Me* vai Met Glu Thr Thr As n Asp Asp Tyr Trp Lys 340 345 350 Asp Phe Met Vai Glu Gly Gin Arg val Arg Thr Ile Ser Lys Asp Ala ,· 355 360 365 Lys Asn Asn Thr Arg Thr Ile Ile Phe Pro Tyr Val Glu Gly Lys Thr 370 375 3SÕ Leu Tyr Asp Ala Ile Val Lys val His Val Lys Thr Ile Asp Tyr Asp 385 390 395 400 Gly Gin Tyr His Val Arg Ile Val Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asn Thr Asp Lys Ser Asn Lys Lys GlU Gin Gin Asp Asn Ser Ala Lys 429 425 430 Lys Glu Ala Thr Pro Ala Thr Pro Ser Lys Pro Thr Pro Ser Pro Val 43S 440 44S Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys ASp Asp Asn Lys Gin 450 455 460 Leu Pro Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 47$ 480 Asp Lys Thr Pro Ala Thr Lys Pro Ala Lys Gly Glu Val Glu Ser Ser 485 490 495 Ser Thr Thr Pro Thr Lys Val Val S«r Thr Thr Gin Asn Vai val Lys 500 505 510 Pró Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser 515 520 525 Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala pró Leu Gin Lys Ala Asn 539 535 540 lie Lys Asn Thr Asn Asp Gly HiS Thr Gin Ser Gin Asn Asn Lys Asn 545 550 555 569
Thr Sln Glu hm Lys Ala Lys Ser 563 137
<210> 15 <211> 564 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4 Ο 0> 15 138
Ala 61tt Glu Thr Gly Gly Thr ASO Thr Glu AXft Gi» Pro Lys Thr Glu 1 5 10 15 Ala Vai Ala Ser Pro Thr Thr Thr Thr Glu Lys Ala Pro Glu Ala Lya 20 25 30 ?το Vai Ala As» Ala Val Ser val Ser As» Lys Glu Val Glu Ala Pro 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Val Lys Al a Pro Lys Glu Thr 50 55 60 Lys ala Vai Lys Pro Ala Ala Lys Ala Asp As» As» Thr Tyr Pro Ue 65 70 75 30 Leu As» Gin Glu Leu Arg Glu Ala Ile Lys As» Pro Ala Ile Lys Asp 85 00 55 Ly& Asp KiS Ser Ala Pro Asn Ser Arg Pro lie Asp Phe Glu Met Lys 100 105 no Lys Glu Asn Gly Glu Glu Glu Phe Tyr His Tyr Ala Ser Ser Val Lys us 120 125 Pro Ala Arg val Ile Phe Thr Asp Ser Lys Pro Glu lie Glu Leu Gly IM 135 140 Leu Gin Ser Gly Gin Phe Trp .Arg Lys. Phe Glu Val -Tyr Glu Gly Asp 145 ISO 155 150 Lys Lys Leu Pro Ile Lys Leu val Ser Tyr Asp Thr Val Lys Asp Tyr 165 170 175 ala Tyr He Arg Phe Ser Val ser ASn Gly Thr Lys Ala Val Lys Ile 180 IBS ISO vai ser ser Thr His Phe as» as» Lys Glu Glu Lys Tyr Asp Tyr Thr l§5 200 205 Leu Mefc Glu· phe Ala Gin Pro Ile Tyr As» Ser Ala ASp Lys Phe Lys 210 225 320 - Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pro Tyr Lys Lys 22S 230 235 240 Ala Lys Thr Leu Glu Arg Glu Val Tyr Glu Leu AS& Lys Ile 61a ASp 245 250 255 Lys Leu Pro Glu Lys Leu Lys Alá Glu Tyr Lys Lys Lys Leu Glu Asp 260 285 270 Thr Lys Lys Ala Leu Asp Glu Glu Val Lya Ser Ala Ile Thr Glu phe 275 290 2S5 61a Asa Vai Glu Pro Thr As» Glu Lys Met Thr Asp Leu Gl» Asp Thr 2S0 205 380 Lys Tyr Vãl Val TVr Glu Ser Val Glu As» As» Glu Ser Met Mêt Asp 305 310 315 320 Thr Phe Val Lys His Pro Ile Lys Thr Gly Het Leu Asn ©ly Lys Lys 325 330 335 Tyr «et val Het Glu Thr Thr hsn Asp Asp Tyr Trp Lys Asp Phe Hefc 340 345 350 Vai Glu fíly 61fl Arg Val Arg Thr Ile Ser Lys Asp Ala Lys As» As» 355 360 365 *m*r Arg Thr ile Ile Phe Pro Tyr Val Glu Gly Lys Thr Leu Tyr ASp 310 37S 380 139
Ala xla Val Lys Val Kls Val Lys Thr lie Asp Tyr **P Gly Gin Tyr 38S 390 395 400 His Val Arg íle Va l Asp Lys Glu Ala Pt» Thr Lys Ala Asn Thr Asp 405 410 415 Lys ser Asíi Lys Lys Glu Gin Gin, Asp Asn Ser Ala Lys Lys Glu Ala 420 425 430 Thr Fr© Ala Thr Fro Ser Lys Pro Thr Fro Ser Pro Val Glu Lys Glu 435 440 445 Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin Leu Fro Ser 450 455 460 Vai Glu Lys Glu Asn Asp Ala Ser' Ser Glu Ser Gly Lys A®p Lys Thr 465 470 475 480 Fro Ala Thr Lys Fro Ala Lys Gly Glu Val Glu Ser Ser Ser Thr Thr 485 450 495 Pro fhr Lys Val Val Ser Thr Thr Gin Asn Val Ala Lys Fro Thr Ala 500 505 510 Ser Ser Lys Thr Thr Ly s Aep Val Val Gin- Thr Ser Ala Ser Ser Ser 515 520 525 Glu Ala Lys Asp Ser Ala Fro- Leu Gin LyS Ala aso. Ile Lys Asn Thr 530 535 540 Ase Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin Glu Asn 545 55Θ 555 560 Lys Ala Lys Ser
<210> 16 <211> 565 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <400> 16 140
Ala Glu.Glu Thr Gly Gly Thr Asn Thr Glu Ala Gin Pr© Lys Thr Glu 1 5 10 15 Ala" vai Ala sèr Pr© Thr Thr Thr Thr Glu Lys Ala Pr© Glu Ala Lys 20 25 30 Fr© mi Ala Asn Ala Vai Ser Vai Ser Asn Lys Glu Vai Glu Ala Fr© 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Ala Pr© Lys Glu Thr 50 55 60 Lys Ala Vai Lys Fr© Ala Ala Lys Ala Asp Asn Asn Thr Tyr Pr© Ile 65 70 75 @0 Leu Asn Gin Glu Leu Aro GlU Ala ile Lys Asn Pr© Ala lie Lys Asp SS PO SS Lys Asp Hís Ser Ala Fr© Asn Ser Arg Fr© lie Asp Phe Glu :Wefc Lys 100 105 110 Lys Glu Asn Gly Glu Gin Gin Phe Tyr Hls Tyr Ala Ser Ser Vai Lys 115 120 125 Pro Ala Arg Vsl Ile Fh* Thr Asp Ser Lys Pr© Glu Ile Glu Leu Gly 1.30 135 140 Leu Gin Ser Gly Gin Fhe Trp Arg Lys Fhe Glu Vai Tyr Glu Gly ASp US 150 155 ISO 141
Lys Lys Leu Pr© 11© Lys Leu Val Ser Tyr Asp Thr Vai Lys Asp Tyr 165 179 175 Ala Tyr He Arg Fhe Ser Val Ser Asn Gly Thr Lys Ala val Lys 11« 160 135 190 Vai Ser Ser Thr Kis Phe Aãn Asn Lys Glu Glu Lys Tyr Asp Tyr Thr 195 290 205 Leu Met Glu Fhe Ala Gin Pr© 11« Tyr Asn Ser Ala Asp Lys Phe Lys 219 215 - 220 Thr Glu Gltt Asp Tyr LyS Ala Glu Lys Leu Leu Ala Fr© Tyr Lys Lys 225 230 235 240 Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys He Gin Asp '245 250 255 Lys Leu Pr© Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys Leu Glu Asp 260 265 270 Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala 11© Thr 01« Phe 2? 5 280 285 Gin Asa vai Gin Pr© Thr' Asn Glu Lys M«t Thr Asp Leu Gin Asp Thr 299 295 300 . Lys Tyr Vai Vai Tyr Glu Ser Val Glu Asn Asn Glu Ser Het Met Asp 3 OS 310 315 320 Thr Fhe vai Lys His Fr© lie Lys Thr Gly Met Leu Asn Gly Lys Lys 325 330 335 Tyr Met Vai Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Het 340 345 350 Vai Glu Gly Gin Arg val Arg Thr lie Ser Lys Asp Ala Lys Asn Asn 355 360 365 Thr Arg Thr 11e XI© Phe Pr© Tyr Val Glu Gly Lys Thr Leu Tyr Asp 370 375 380 Ala n* val Arg val Kis Val Lys Thr He ASp Tyr Asp Gly Gin Tyr 385 390 395 400 His Vai Arg lie Val Asp Lys Glu Ala Phe Thr Lys Ala Asn Thr Asp 405 410 415 LyS Ser Asn Lys Lys Glu Gin Glu Asp Asn Ser Ala Lys Lys Glu Ala 420 425 430 Thr Pro Ala Thr Fr© Ser Lys Pr©' Thr Pr© Ser Pr© Val Glu Lys Glu 435 440 445 Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin Leu Pr© Ser 459 455 460 Vai Glu Lys Glu Asn ASp Ala Ser $er Glu Ser Gly Lys Asp Lys Thr 465 470 475 480 Fr© Ala Thr Lys Pr© Ala Lys Gly Glu Val Glu Ser Ser Ser Thr Thr 485 490 495 Pr© Thr Lys val val Ser Thr Thr Gin Asn val Ala Lys Pr© Thr Thr 500 505 510 Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser Ala Gly Ser 515 520 525 Ser Glu Ala Lys Asp Ser Ala Pr© Leu Gin Lys Ala Asn lie Lys Asn 530 535 540 Thr Asn A$p Gly His Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin Glu 545 550 555 560
Asn Lys Ala Lys Ser ‘ 565 142
<210> 17 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4 Ο 0> 17 143
Ma Glu Glu Thr Gly Gly Thr Asn Thr Glu Ala Gin Fro Lys Thr Glu i 5 10 15 Ala Leu Ala Ser p*e Thr Thr Thr Thr Glu Lys Ala Fro Glu Thr Lys 20 25 30 Fro Vai Aia Asp Ala Vai Ser ¥al Ser Asa Lys Glu Vai Glu Ala Fro 35 40 45 Th* Ser Glu Thr Lys. ,GlU Aia Lys Glu Vai Lys Glu Vai Lys Ala Fro se - 55 60 Lys 0.lu Thr Lys Ala val. Lys Fro Ala Ala Lys Ala Asp Asn Asn Thr 6S 70 75 80 Tyr Fro 11# Leu Asa Gla Glu Leu Arg Glu Ala Ile Lys Asn Fro .Ala 85 90 95 11# Lys Asp Lys Asp His Ser Ala Fro Asa Ser Arg Fro Ile Asp Fhe 100, 105 110 GXu Mefc Lys Lys Glu Asn Gly Glu Gin Glu Fhe Tyr HÍS Tyr Ala ser 115 128 125 Ser vai Lys Fro Ala Arg Vai XI# Phe Thr Asp .Ser Lys Fro Glu Ile 130 135 140 Glu Leu Gly Leu Gin Ser Gly Glu Phe Trp Arg Lys Fhe Glu Vai Tyr 145 ‘ 150 155 160 Glu Gly Asp Lys Lyá Leu. Fro ile Lys Leu Vai Ser Tyr Asp Thr Vai IÊ5 170 175 Lys Asp Tyr Ala Tyr 11© Arg Fhe Ser Vai Ser Asa Gly Thr Lys Ala ISO ISS 190 vai Lys lie vai Ser Ser Thr Bis Fhe Asa Asn Lys Glu Glu Lys Tyr 185 200 205 Asp Tyr Thr Leu Mefc Glu Phe Ala Gin Fro Ile Tyr' Asn Ser Ala Asp 210 215 220 Ly$ Fhe Lys Thr Glu, Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Fro 225 230 235 240 Tyr Lys Lys Ala Lys Thr Leu Glu Mg Gla Vai Tyr Glu Leu Asn Lys 245 *· 250 255 lie Gin Asp Lys Leu Fro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 205 270 Leu Glu As;p Thr Lys Lys Ala Leu ASP Glu Gin Vai Lys Ser Ala Ile 275 280 285 Thr Glu Fhe Gin Asa Vai Gin Fro Thr Asn Glu Lys «et Thr Asp Leu 290 295 300 Gin Asp Thr Lys Tyr Vai Vai Tyr €lu Ser Vai Glu Asn Asn Glu Ser 305 310 315 320 Mèt Met Asp Thr Phe Vai Lys His pro 11# Lys Thr Gly mt Leu As» 325 330 335 Gly Lys Lys Tyr Met Vai H$r Glu Thr Thr Asn Asp Asp Tyr Tzp Lys 340 345 350 Asp Phe Met Vai Glu Gly Gin Arg Vai Arg Thr Ile Ser Lys Asp Ala „ 355 300 - MS He Asn Asp Thr Arg Thr Ile Ile Fh© Fro Tyr Vai Glu Gly Lys Thr 37Q 375 380 144
Leu Tyr Asp Ai a Ile vai Lys Vai HÍS Vai Lys Thr ile Asp Tyr Asp 385 390 395 400 Gly Gin Tyr His vai Ile Vai Asp Lys Glu Ala Ftee Thr Lys Ala 405 410 415 hm Thr Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Lys Glu Ala Thr Pro Ala Thr Pro Ser Lys Pro Thr Pro Ser Pro Val 435 - 440 445 Gitt Lys Glu Ser Gin Lys Gin ASp Ser Gin Lys ASp ASP Asn Lys Gin 450 455 450 Leu Pro"Ser Vai Giu Lys Glu Asa Asp Ala Ser Ser Glu Ser Gly Lys 455 470 475 480 Asp Lys Thr PrO Ala Thr Lyâ Pró Ala Lys Gly Giu val Glu Ser Ser. 48$ 490 495 Set Thr Thr Pro Thr Lys Vai Vai Ser Thr Thr Gin Asn val Ala Lys 500 505 510 pro Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Vai Vai Gin Thr Ser 515 520 525 Ale. Gly Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn 530 535 540 Ile Lys Asn Thr Asa Asp Gly Mis Thr Gin Ser Grltt Asn Asn Lys Asn S4S 550 555 550 Thr Gin Glu Asa Lys Ala Lys Ser S65
<210> 18 <211> 565 <212> PRT <213> Sequência Artificial <220> <223> ORFO657ηΗ <400> 18 145
Ala Glu Glu Thr Gly Gly Thr Asm Thr Glu Ala Gin Pro Lys Thr Glu 1 5 10 15 Ala Vai Ala Ser Pro Thr Thr Thr Thr Glu Lys Ala Pro Glu Ala Lys 20 25 30 Pro Vai Ala Aso Ala Vai Ser Vai Ser Asn Lys Glu Vai Glu Ala Pro 35 40 45 Thr Ser Glu Thr Lys GlU Ala Lys Glu vai Lys Ala Pro Lys Glu Thr $0 55 60 Lys Ala Vai Lys Pro Ala Ala Lys Ala Asp Asn Asn Thr Tyr Pro Ile $5 70 75 00 Lèu Asn Glu Glu Leu Arg Glu Ala Ile Lys Asa Pro Ala Ile Ly s Asp §5 90 0$ Lys Asp His Ser Ala Pro Asm Ser Arg Pro ile Asp Phe Glu Stefc Lys 100 105 no Lys Glu Asn Giy Glu Gin Glu Phe Tyr His Tyr Ala Ser Ser vai Lys 115 120 125 Pro Ala Arg vel Ile phe Thr Asp Ser Lys Pro Glu Ile Glu Leu Gly 130 135- 140 Leu Gin Ser Gly Gin Phe Trp Arg Lys Phe Glu Vai Tyr Glu Gly Asp 145 150 155 160 146
Lys Lys Leu Fro 11* Lys Leu Val Ser Tyr Asp Thr Val Lys Asp Tyr 165 170 175 Ma fyr Ile Arg Phe S«r Val Ser Asn Gly Thr Lys Ala Val Lys lie ISO 185 190 Vai Ser Ser Thr Eis Fhe Asn Asn Lys Glu Glu Lys tyr Asp Tyr Thr 155 200 205 Lee «et Glu Phe Ala Glu Fro ile tyr Asn Ser Aia Asp Lys Fhe Lys 210 215 220 - Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Fro Tyr Lys Lys 235 * 230 235 240 Ala Lys Thr Leu Glu Arg Gin Vai Tyr Glu Leu Asn Lys Xle Gin Asp 245 250 255 lys Leu Pro Glu Lys Leu Lys Ala Glu tyr Lys Lys Lys Leu Glu Asp 200 265 270 Thr Lyss Lys Ala Leu Asp Glu Gin val Lys Ser Ala xle Thr Glu Fhe 275 280 28$ Gin Asa Vai Gin Fro Thr Asn Glu Lys Met Thr Asp Leu Gin Asp Thr 250 295 300 Lys Tyr vai Vai Tyr Glu Ser Vai Glu Asn Asn Glu Ser Met Met Asp 305 310 315 320 Thr Fhe Val Lys Eis Fro 11 e Lys Thr Gly Met Leu Asn Gly Lys Lys 325 330 335 Tyr «et vai Met Glu Thr Thr Asn Asp Asp tyr Trp Lys Asp Fhe Met 340 345 350 Vai Glu Gly Gin A r g Va l Arg Thr lie Ser Lys Asp Ala Lys Asn Asn 355 360 365 Thr Arg Thr 11« He Fhe Fro Tyr Val Glu Gly Lys Thr Leu tyr Asp 370 375 380 Ala iie Vai Lys Val His vai Lys Thr lie Asp Tyr Asp Gly Gin Tyr 385 390 395 400 Mía Vai ATS 11« val Asp Lys Glu Ala Fhe Thr Lys Ala Asn Thr ASp 405 410 415 Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys Lys Glu Ala 420 425 430 Thr Pro Aia Thr Fro Ser Lys Pro Thr Fro Ser Fro val Glu Lys Glu 435 440 445 Ser GÍn Lys Glft Asp Ser Gin Lys Asp Asp Asn Lys Fro Leu Fro Ser 450 455 460 Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys Asp Lys Thr 465 470 475 480 Fro Âla Thr Lys Fro Ale Lys Gly Glu Val Glu Ser Ser Ser Thr Thr 485 490 495 Pro Thr Lys Val Val Ser Thr Thr Gin Asn Val Ala Lys Pro Thr Thr 500 505 510 Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser Ala Ser Ser 515 520 525 Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn He Lys S30 535 540 Thr Asn Asp Gly Eis Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin Glu 545 550 555 560 Asn Lys Ala Lys Ser
56S 147
<210> 19 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4 Ο 0> 19 148
Ala Glu Glu Thr Gly Gly Thr Asn Thr Glu Ala Gin Pro Lys Thr Glu 1 S 10 15' Ala Vai Ala Ser Pro Thr Thr Thr Ser Glu Lys Ala Pro Glu Thr Lys 20 25 30 Pro Vai Ala Asn. Ala Vai Ser Vai Ser ASR Lys Glu Vai Glu Ala Pro 35 40 4S Thr Ser Glu Thr Lys Gl» Ala Lys Glu Vai Lys Glu Vai Lys Ala Pro 50 55 60 Lys Glu Thr' lys .Ala Vai Lys Pro Ala Thr Lys Ala Asp Asn Asn Thr 65 70 75 80 Tyr Pro lie leu Asn Gin Glu Leu Arg Glu Ala lie Lys Asn Pro Ala 85 90 95 lie Lys Asp Lys ASp HiS Ser Ala Pro Asn Ser Arg Pro ile Asp phe 3.00 105 110 Glu «et Lys Lys 61» Asn Gly Glu Gin Gin Phe Tyr His Tyr Ala. Ser 115: 130 125 Ster Vai Lys Pr© Ala Arg Vai lie Phe Thr Asp Ser Lys Pro Glu Xis 130 135 MO Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Phe G l u Vai Tyr 145 150 155 160 Glu Gly Asp Lys Lys Leu Pro lie Lys Leu Vai Ser Tyr Asp Thr Vai 165 170 115 Lys Asp Tyr Ala Tyr iie Arg Phe Ser vai Ser Asn Gly Thr Lys Ala 180 185 190 Vai Lys Ile Vai Ser Ser Thr H is Phe Asn Asn Lys Glu Glu Lys Tyr 135 200 205 Asp Tyr Thr Leu «et Glu Phe Ala Gin Pro lia Tyr Asn Ser Ala Asp 210 215 320 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pro 225 230 235 340 Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Vai Tyr Glu Leu Asn Lys 243 250 255 Ile Gin Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 265 270 Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin Vai Lys Ser Ala Xle 275 230 - 285 Thr Glu Phe Gin Asn Vai Gin Pro Thr Asn Glu Lys Met Thr Asp Leu 230 295 300 Gin Asp Thr Lys Tyr vai vai Tyr Glu ser vai GiU Asn Asn Glu ser 305 310 315 320 Met Met Asp Thr Phe Vai Lys Hís Pro lie Lys Thr Gly Met Leu Asn 325 330 335 Gly Lys Lys Tyr Met Vai «et Glu Thr Thr Asn ASp Asp Tyr Trp Lys 340 345 350 Asp Phe Met Vai Glu Gly Gin Ãrg Vai Arg Thr lie Ser Lys Asp Ale 355 360 365 Lys As« Asn Thr Ar§ Thr lie Ilô Phe Pro Tyr val Glu Gly Lys Thr 370 375 380 149
Leu Tyr Asp Ala lia Vai Lys Vai His Vai Lys Thr lie ASp tyr ASp 385 380 305 400 Gly Gin Tyr Eis vai Arg Ile Vai Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asa Thr Asp Lys Ser Aan Lys Lys Olu Gin Gin Asp ASn Ser Ala Lys 420 425 430 Arg Giu Ala Thr Pm Ala Thr Pro Ser Lys Pro Thr Pm Ser Pm Vai 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asa Lys' Gin 450 455 460 Leu Pr© Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 475 480 Asp Lys Thr Pro Ala Thr Lys Pro Ala Lys Gly Glu Vai Glu Ser Ser 485 400 405 Ser Thr Thr Pro Thr Lys Vai Vai Ser Thr Thr Gin Asn Vai Ala Lys 500 SOS 510 Pro Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Vai Vai Gin Thr Sêr 515 520 525 Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asa 530 535 540 lie Lys Aen Thr As» Aãp Giy His Thr Gin Ser Gin Asa A$» Lys Asa 545 550 555 560 Thr Gin Glti Asn Lys Ala Lys Ser
5SS
<210> 20 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <400> 20 150
Ma Glu Glu Thr Gly Gly Thr As© Thr Glu Ala Gin Pr© Lys Thr Glu 1 5 10 15 Ala val Ale Ser Pr© Thr Thr Thr Ser Glu Lys Ala Pro Glu Thr Lys 20 25 10 Fr © Val Ais Asn Ala Vai Ser val Ser Asn Lys Glu Val Glu Ala Pr© 35 40 45 Thr Ser Glu fhr Lys Glu Ala Lys Glu Val Lys Glu Val Lys Ala Pro 50 55 60 Lys Glu Thr Lys Ala vai Lys Pr© Ala Thr Lys Ala Asp Asn Asn Thr 65 70 7S 80 Tyr Pr© Ile Leu Asa Gin Glu Leu Arg Glu Ala ile Lys ASft Pr© Ala SS 50 $5 , lis Lys Asp Lys Asp HiS Ser Ala Pr© Asn Ser Arg Pro ile Asp Phe 100 105 no Glu Met Lys Lys Glu Asn Gly Glu Gin Gin Phe Tyr Hls Tyr Ala Ser 115 13 D 125 Ser Val Lys Pr© Ala Arg vai Ile Phe Thr Asp Ser Lys Pro Glu Ile no ns 140 Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp •Arg Lys Phe Glu val Tyr 145 ISO 155 160 151
Glu Gly Asp Lys Lys Leu Pro Ile Lys Leu Val Ser Tyr Asp Thr val 165 170 175 Lys ASp Tyr Alá Tyr Ile Arg Phe Ser Val Ser Asn Gly Thr Lys Ala 180 185 190 Vai Lys 11« Vai Ser Ser Thr His Phe Asn Asn Lys Glu Glu Lys Tyr 195 200 205 Asp Tyr Thr Leu Hefc Glu Phe Ala Gin Pro Ile Tyr Asn Ser Ala Asp 210 215 220 Lys The Lys Thr Glu Glu ASP Tyr Lys Ala Glu Lys Leu Leu Ala Pro 225 230 235 240 7¾¾ Lys Lys Ala Lys Thr Leu Glu Arg Gl» Val Tyr Glu Leu Asn Lys 245 250 255 'Π® Gin Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 280 265 270 L«« Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala Ile 275 280 285 Thr Glu Phe Gin Asn Vai Gin Pro Thr Asn Glu Lys H«t Thr Asp Leu 298 295 300 Gin Asp Thr Lys Tyr Val Val Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 310 315 320 mt Met Asp Thr Phe Val Lys Hís Pro Ile Lys Thr Gly «et Leu Asn 325 330 335 Gly Lys Lys Tyr Met Val Met- Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Asp sh» M»t Vai Glu Gly Gin Arg Val Arg Thr Ile Ser Lys Asp Ala 355 360 365 Lys Asa Asft Thr Ar§ Thr Ile lie Phe Pro Tyr Val Glu Gly Lys Thr 370 375 380 Leu Tyr ASp Ala 11« val Lys val His val Lys Thr Ile Asp Tyr Asp 385 396 395 400 Gly Glu Tyr Hís Vai Arg Ue Val Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asn Thr Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn ser Ala Lys 420 425 430 Lys Glu, Alá Thr Pr© Ala Thr Pro Ser Lys Pro Thr Pro Ser Pro Val 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin 450 - 455 460 Leu Pro Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 47 S 480 Mp Lys· Thr pro Ala Thr Lys pro Ala Lys Gly Glu Val Glu Ser Ser 485 4§Ó 4 §5 Ser Thr Thr Pr© Thr Lys Val Val Ser Thr Thr Gin Asn Val Ala Lys 500 505 510 Pro Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser 515 520 S.25 Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn 510 535 540 ile Lys Asn Thr Aán Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn 54 S 550 555 560 Thr Glu Glu Asn Lys Ala Lys Ser 565 152
<210> 21 <211> 576 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4Ο0> 21 153
Ala Glu Glu Thr Gly Val Thr Asn Thr Glu Ala Gin pro Lys Thr Glu 1 ' 5 IO 15 Ala val Ala Ser Pr© Thr Thr Thr Thr Thr Glu Lys Ala Pro Glu Ala 20 25 30 Lys Pr© val Ala Lys Pro val Ala Asn Ala val $er Val Ser Asn Lys 35 40 45 Glu Vai Val Ala Pr© Thr Thr Glu Thr Lys Glu Ala Lys Glu Vàl Lys 50 S5 68 Ala Vai Lys Glu Val Lys Ala Pr© lys Glu Ala Lys Glu Glu Lys Pro 6$ 70 75 80 Ala Ala Lys Ala Asp Asn Asn Thr Tyr Pr© Ile Leu Asn Gin Glu Leu 85 98 95 Arg Glu Ala lie lys Asn Pro Ala Ile Lys Asp Lys Asp His Ser Ala 100 105 - 110 Pro Asa Ser Arg Pro Ile Asp Phe Glu Met Lys Lys Lys Asp Gly Thr 115 120 125 Gin Gin Phe Tyr His Tyr Ala Gly Ser Val Lys Pro Ala Arg val ile 130 135 140 Phe Thr Asp Ser Lys Pro Glu Ile Glu Leu Gly Leu Gin Ser Gly Gin 14 S ISO 155 16Θ Fhe Trp Arg Lys Phe Glu vai Tyr Glu Gly Asp Lys Lys Leu Pro Ile 165 17Ô 175 Lys Leu Val Ser Tyr Asp Thr val Lys Asp Tyr Ala Tyr ile Arg Phe 180 185 - 190 Ser vai Ser Asn Gly Thr Lys Ala Val Lys He Val Ser Ser Thr His 195 200 205 PA® Asa Asa Lys Glu Glu Lys Tyr Asp' Tyr Thr Leu Het Glu Phe Ala 210 215 220 Gin :Pr© lia Tyr Asn Ser Ala Asp Lys Phe Lys Thr Glu Glu Asp Tyr 225 230 235 240 Lys Ala Glu Lys Leu Leu Ala Pro Tyr Lys Lys Ala Lys Thr Léu Glu 245 250 255 Arg Gin Val Tyr Glu Leu Asn Lys Ile Gin Asp Lys Leu Pro Glu Lys 260 265 270 Leu Lys Alá Glu Tyr Lys Lys Lys Leu Glu Glu Thr Lys Lys Ala Leu 275 280 285 Asp Glu Gin Val Lys Ser Ala Ile Thr Glu Phe Gin Asn Val Gin Pro 290 295 300 Thr Asn Glu Lys Het Thr Asp Leu Gin Asp Thr Lys Tyr Val Val Tyr 305 310 315 320 Glu Ser Val Glu Asn Asn Glu Ser Wet Met Asp Thr Phe Val Lys His 325 330 335 Pro Ile Lys Thr Gly Met Leu Asn Gly Lys Lys Tyr het Vâl Mefc Glu 340 345 350 Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Met Val Glu Gly Gin Arg 355 360 365 Vai Arg Thr Ile Ser Lys Asp Ala Lys Asn Asn Thr Arg Thr Ile Ile 320 375 380 154
Phe Pr© Tyr Vai Glu Gly Lys Thr Leu Tyr Asp Ala Xle Val Lys Val 385 390 395 400 His Vai Lys Thr Ile Asp Tyr Asp Gly Gin Tyr His Val Arg n« Val 405 410 415 ASp Lys Glu Ala Phe Thr Lys Ala Asn Ala Asp Lys Thr Asn Lys Lys 42 0 425 430 Glu Gin Gin Asp Asn Ser Ala Lys Lys Glu Thr Thr Pro Ala Mefc Pro 435 440 445 Ser Lys Pro Thr Thr Pro Pm Val Glu Lys Glu Ser Gin Lys Gin Asp 450 455 460 Ser Gin Lys Asp ASp Asn Lys Gin- Ser Pro Gly val Glu Lys Glu Asn 465 470 * 475 · 480 ASP Ala ser Ser Glu Ser Gly Lys Asp Lys Met Pro Val Thr Lys Pro 485 490 495 Ala Lys Ala Glu Val Glu Ser Ser Ser Thr Thr Pro Thr Lys val val 500 505 510 Ser Thr Thr Gin Asn Val Ala Lys Pro Thr Thr Ala Ser Ser Glu Thr 515 520 525 Thr Lys Asp vai Val Gin Thr Ser Ala Gly Ser Ser Glu Ala Lys Asp 530 535 540 Ser Ala Pro Leu Gin Lys Ala Asn Xle Lys Asn Thr Aon Asp Gly His 543 550 555 560 Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin Glu Asn Lys Ala Lys Ser 565 570 575
<210> 22 <211> 576 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <4Ο0> 22 155
AI» Glu Glu Thr Gly Vai Thr M Thr Glu Ala Gin Pro Lys Thr Glu :ι 5 10 15 Ma vai Ala Ser pro Thr fkr Thr Thr Thr Glu Lys Ala Pro Glu Ala 20 25 30 Lys Pro Vai Ala Lys Pro Vai Ala Asa Ala Vai Ser Vai Ser Asn Lya 35 40 45 Glu Vâl Vai Ala Pro Thr Thr Glu Thr Lys Glu. Ala Lys Glu Vâl Lys 50 55 m Alô Vai Lys Glu Vai Lys Ala Pro Lys Glu Ala. Lys Glu Glu Lys Pro ss 70 75’ @0 Ala Ala Lys Ala Asp Aèr Asa Thr Tyr Pro 11© Leu Asn Gin Glu Leu 85 90 95 ΑΓ0 Glii Alâ 11© Lys Asa Pro Ala 11© Lys Asp Lys ASp His Ser Ala 100 105 110 fr© Asn Ser Arg Pro Ile Asp Phe Glu Met Lys Lys Lys Asp Gly Thr 115 120 125 61 n Gin Ph© Tyr Bis Tyr Ala Ser Ser Vai Lys Pro Ala Arg Vai Ile Í30 135 140 Fixe Thr Asp Ser Lys Pro Glu Ile Glu Lm Gly Leu Gin Sor Gly Glu «5 ISO 155 ISO 156
Phe Trp Arg Lys Phe Glu vai Tyr Glu Gly Asp Lys Lys Leu Pr© Xle 165 170 175 Lys Leu Vai Ser Tyr Asp Thr val Lys ASp Tyr Ala Tyr lie Arg Phe ISO 185 190 Ser Vai Ser Asn Gly Thr Lys Ala Val Lys lie Val Ser Ser Thr His 195 200 205 Phe hm As» Lys Glu Glu Lys Tyr Asp Tyr Thr Leu Met Glu Phe Ala 210 215 220 Gin Pr© xle Tyr Asa Ser Ala Asp Lys Phe Lys Thr ©lu Glu Asp Tyr 22$ 230 235 240 Lys Ala Glu Lys Leu Leu Ala Pr© tyr Lys Lys Ala Lys Thr Leu Glu 245 250 255 Arg Gin Vai Tyr Glu Leu Asn Lys lie Gin Asp Lys Leu Pro.Glu Lys , 260 265 270 Leu Lys Ma Glu Tyr Lys Lys Lys Leu Glu Glu Thr Lys Lys Ala Leu 275 280 285 Asp Glu Gin Vai Lys Ser Ala lie Thr Glu Phe Gin Asn Val Gin Pr© 290 205 300 Thr Asn Glu Lys Het Thr Asp Leu Gin Asp Thr Lys Tyr Val Val Tyr 305 310 315 320 Glu Ser Vai Glu Asn Asn Glu Ser Met Met Asp Thr Phe Val Lys His 325 330 335 Pr© Ile Lys Thr Gly Met Leu Asn Gly Lys Lys tyr Met val Met Glu 340 345 350 Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Met Val Glu Gly Gin Arg 355 360 365 Val Arg Thr 1.1a Ser Lys Asp Aia Lys Asn Asn Thr Arg Thr lie Xle 3?0 375 380 Phe Pr© Tyr Vai Glu Gly Lys Thr Leu Tyr Asp Ala lie Val Lys Val 385 300- 395 400 His Vai Lys Thr lie Asp Tyr Asp ©ly Gin Tyr HÍS Val Arg Xle Val 405 410 415 Asp Lys Glu Ala Phe Thr Lys Ala Asn Ala Asp Lys Thr Asn Lys Lys 420 425 430 Glu Gin Gin .ASp Asn Ser Ala Lys Lys Glu Thr Thr Pr© Ala Met Pr© 435 440 445 Ser Lys Pr© Thr Thr Pr© Pr© Val Glu Lys Glu Ser Gin Lys Gin Asp 450 455 460 Ser Gin Lys Asp Asp Asa Lys Gin Ser Pr© Ser Val Glu Lys Glu ASh 465 470 475 480 Asp Ala Ser Ser Glu Ser Gly Lys ASP Lys Met Pr© Val Thr Lys Pro 435 490' 495 Ais Lys Ala Glu Vai Glu Ser Ser Ser Thr Thr Pr© Thr Lys Val vai 500 505 510 Ser Thr Thr Gin Asn Vai Ala Lys Pr© Thr Thr Ala Ser Ser Glu Thr 515 520 525 Thr Lys Asp Vai Vai Gin Thr Ser Ala m Ser Ser Glu Ala Lys Asp 530 535 S40 Ser Ala Pr© Leu Gin Lys Ala Asn 11« Lys Asn Thr Asn Asp Gly His 545 550 555 560 Thr Gin Ser Glu Asn Asn Lys Asn Thr Gin Glu Asn Lys Ala Lys Ser 565 570 575 157
<210> 23 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4Ο0> 23 158
Ma Glu Glu Thr Gly ti Gly Thr Aan Thr Glu Ala H ft Gin Pro Lys Thr 1 st Glu Ala Vai Ala Ser J! Pro Ser Thr Thr Thr iy Glu Lys Ala Pro Glu Ala Lys 20 25 30 Pro Vai Ala ILSn Ala Val Ser val ser Asn Lys Glu Val Glu Ala pro 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Val Lys Glu val, Lys Ala Pro 50 55 60 Lys Glu Thr Lys Glu Val Lys Pro Alá Thr Lys Ala Asp Asn Asn Thr SS 70 75 80 Tyr Pr© Ile Leu Asn Glu Glu Leu Arg Glu Ala Ile Lys Asn Pro Ala $5 00 , 55 11© Lys Asp Lys ASp His Ser Ala Pro Asn Ser Arg Pro Ile Asp Phe 100 105 110 Glu Het Lys Lys Lys Asp Gly Thr Glu Gin Phe Tyr His Tyr Ala Ser 115 120 125 Ser Vai Lys Pro Ala Arg val Ile Phe Thr Asp Ser Lys Pro Glu Ile 130 , 135 140 Glu Leu Gly Leu Glft Ser Gly Gin Phe Trp Arg Lys Phe Glu Val Tyr US ISO 155 150 Glu Gly A SP Lys Lys Leu Pro Ile Lys Leu Val Ser Tyr Asp Thr Val 155 170 175 Lys Mp Tyr Ale Tyr Ile Arg Phe Ser Val Ser Asn Gly Thr Lys Ala ISO 105 ISO vai Lys Ile Val Ser Ser Thr HiS Phe Asn Asn Lys Glu Glu Lys Tyr 1S5 200 2S5 Asp Tyr Thr Leu «et Glu Phe Ala Gin Pro Ile Tyr Asn Ser Ale Gly 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys'Leu Leu Ser Pre 225 230 23 S 240 Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys 245 250 255 Ile Glu Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 265 270 Leu Glu Glu Thr Lys Lys Ala Leu Asp Glu Gin Val Lyâ Ser Ala lie 275 200 235 Thr Glu Phe Gin Aso val Gin Pro Thr Asn Glu Lys hst Thr Asp Leu 250 235 300 Gin Asp Thr Lys Tyr Val Val Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 310 315 320 «et Mefc Asp Thr Phe Val Lys His Pro Ile Lys Thr Gly Mec Leu Asn 325 330 33S GJLy Lys Lys Tyr «et Val Met: GlU Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 ASP Phe Met Val Glu Gly Gin Arg Val Arg Thr Ile Ser Lys Asp Ala 355 300 365 Lys Asn Asm Thr Arg Thr Ile Ile Phe pro Tyr Val Glu Gly Lys Thr 370 375 380 . 159
Leu Tyr Asp .AU Xl« Vai X-ys Vai Mis Vai Lys Thr lie Asp Tyr Asp 335 380 305 400 <siy Gin Tyr Mis Vai Arg ile Vai Asp lys Glu Ala Phe Thr Lys Ala 405 410 415 Α5:η Ale Asp lys Ser As© Lys Lys Glu Gin Gin Asp Ase Ser Ala Lys 42 & 425 430 Lys Glu Thr Thr Pr© Ala Thr Pr© Ser lys Pro Thr Thr Pr© Pr© Vai 43S 440 44S Glu Lys Glu Ser Gin Lys Gin Asp ser Gin Lys Asp Asp Asn Lys Gin 450 455 460 Ser Pro Ser vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 4S5 470 475 480 Asp Lys Thr Pr© Thr Thr Lys Pr© Ala Lys Ala Glu Vai Glu Ser Ser 485 490 495 Ser Thr Thr Pr© Thr Lys Vai Vai Ser Thr Thr Gin Asn Vai Ala Lys 500 505 510 Pr© Thr Thr Ala Ser Ser Ok Thr Thr Ile Asp vai Vai Gin Thr Ser SIS 520 525 Ala Giy Ser Ser Glu Ala Lys, Asp Ser Ala Pr© Leu Gin Lys Ala Asn 530 535 ,54© Xle Lys Asn Thr Asn Asp Gly His Thr Gin Ser Glu As» Asn Lys Asn 545 550 555 550 Thr Gin Glu MB lys Ala Lys Ser SOS
<210> 24 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <22 3> ORFO 657nH <400> 24 160
Ala Glu Glu Thr' Gly Gly Thr As© Thr Glu Ala Glu Pro Lys Thr Glu 1 S 10 15 Ala Vai Ala Ser Pr© Ser Thr Thr Thr Glu Lys Ala Pr© Glu Ala Lys 20 25 30 Pr© Vai Ala Asn Ala Vai Ser Vai Ser Asn Lys Glu Vai Glu Ala Pr© 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Glu Vai Lys Ala ir© 50 55 60 Lys Glu Thr lys Glu Vai Lys Pr© Ala Thr Lys Ala Asp Asn Asn Thr 65 70 75 80 Tyr Pr© lie Leu AS©. Gin Glu Leu Arg Glu Ala £1« Lys Asn Pr© Ala 85 90 95 n« Lys Asp Lys Asp HiS Ser Ala Pr© Asa Ser Arg Pr© lie Asp Phe tm 105 ato Glu Ittt' lys Lys Lys Asp Sly Thr Gin Gin Phe Tyr Mis Tyr Ala ser 115 iao • 125 Ser Vai lys Pr© Ala. Arg Vai ile Phe Thr Asp Ser Lys Pr© Glu Ile 130 13$ 140 Glu Leu Gly Leu Gin Ser Giy Gin Phe Trp Arg Lys Phe Glu Vai Tyr 145 ISO 155 160 161
Glu Gly Asn Lys Lys Leu Fro XI® Lys Leu Vai ser Tyr Asp Thr Val 185 170 175 Lys Asp Tyr Ala Tyr Xle Arg Phe· Ser vai Ser Asn Gly Thr Lys Ala ISO 185 190 Vai Lys XI® Vai Ser Ser Thr His Phe As» Asn Lys Glu Glu Lys Tyr 185 200 20S Asp Tyr Thr Leu Met Glu Phe Ala Gin Fro 11® Tyr Asn Ser Ala Asp 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ser Fro 225 230 235 240 Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Vai Tyr Glu Leu Asn Lys 245 250 255 11.® Gin Asp Lys Leu Fro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 250 A , 265 270 1©U Glu Glu Thr Lys Lys Ala Leu Asp Glu Gin Vai Lys Ser Ala He 275 280 285 Thr Glu Phe Gin Asn. Vai. Fro Thr Asn Glu Lys Met Thr Asp Leu 290 295 3Ò0 Gin Asp Tb*· Lys Tyr Vai vai Tyr Glu Ser Vai Glu Asn Asn Glu Ser 305 310 315 320 ifec Met Ásp Thr Phe Vai Lys His Pro Xle Lys Thr Siy Het Leu Asn 325 330 335 Gly Lys Lys Tyr Met Vai Het Glu Thr Thr As» Asp Asp Tyr Trp Lys 340 345 350 Asp Phe Met Vai Glu Gly Gin Arg vai Arg Thr lie Ser Ly® Asp Ala 355 360 365 Lys ASA Aso Thr Arg Thr XI® ile Phe Pro Tyr Vai Glu Gly Lys Thr 370 375 380 Leu Tyr Asp Ala Xle Vai Lys Vai His Vai Lys Thr XI© Asp Tyr Asp 385 390 395 460 Gly Gin Tyr Bis Vai Ar» lie Vai Asp Lys Glu Ala Phe Thr Lys Ala 40S 410 415 Aso Ala Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Lys Glu Thr Thr pr» Ala Thr Fr© Ser Lys Pr» Thr Thr Pro Pro Val 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp $er Gin Lys Asp Asp Asn Lys Gin 450 455 460 Ser Pr© Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 46S 470 475 480 ASp Lys Thr Fr» Ala Thr Lys Fro Ala Lys Ala Glu Val Glu Ser Ser 485 490 495 Ser Thr Thr Fro Thr Lys Vai Vai Ser Thr Thr Gin Asn Val Ala Lys 500 505 510 Pr© Thr Thr Ala Ser Ser Glu Thr Thr 11® Asp val Vál Gin Thr Ser 515 520 525 Ala Gly ser Ser Glu Ala Lys Asp Ser Aia Pro Leu Gin Lys Ala Asn 530 535 546 11« Lys Asn Thr ASO Asp Gly His Thr Gin Ser Glu Asn Asn Lys Asn 545 550 555 560 Thr Gin Glu Asn Lys 565 Ala Lys Ser 162
<210> 25 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4Ο0> 25 163
Ala Glu Glu Thr Gly Gly Thr ile Thr Glu Thr Gin Pr© Lys Thr Glu 1 5 10 · 15 Ala Vai Ma Ser Fre Thr Thr Thr Thr Glu Lys Ala Pr© Glu Ala Lys 20 25 30 Pr© Val Ala Asm Ala Val Ser Val Ser Asn Lys Glu Val Ala Ala Pr© 35 40 45 Thr •Thr Glu Thr Lys Glu Ala Lys Glu Val Lys Glu Vai Lys' Ala Fr© 50 55' 60 As» Glu Thr Lys Glu Val Lys Pr® Ala Ala Lys Ser Asp AS© ASn Thr 65 70 75 80 Tyr Pr® Ile Leu Asn Glu Glu Leu Arg Glu Ala Ile Lys Asn Pr© Ala 85 90 95 H M m & % Asp Lys Asp HiS $er Ala Fr© Asn Ser Arg Pr© ile ASp Phe 100 - 105 110 Glu Hfit Lys Lys Lys Asp Gly Thr Gin Gin Phe· Tyr His Tyr Ala Ser 115 120 125 Ser Val Lys Pr© Ala .Arg val Ile Phe Thr Asp Ser Lys pr© Glu Ile 130 ' 135 140 Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Fhe Glu Val Tyr 145 150 155 160 Glu Gly Asp Lys Lys Leu Pr® Ile Lys Leu Val Ser Tyr Asp Thr Val 165 170 175 Lys Asp Tyr Ala Tyr Ile Arg Phe Ser Val Ser Asn Gly Thr Lys' Ala ' 180 IBS 190 Vai Lys Ile Val Ser Ser Thr HiS Fhe Asn Asn Lys Glu Glu Lys Tyr 125 200 205 Asp Tyr Thr Leu. , Met Glu Phe Ala Gin Pr© Ile Tyr Asn Ser Ala Asp 210 , 215 220 Lys Fhe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pr© 225 230 235 240 Tyr Lys LyS Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu Asm Lys 245 250 255 lie Gin Asp Lys Leu Pr© Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 250 265 270 Leu Glu Glu Thr Lys Lys Ala Lêú Asp Glu 01« Val Lys Ser Ala lie 275 280 285 Thr Glu Fhe Gin Asn Val Gin Fr© Thr Asn Gitt Lys Met Thr Asp Leu 290 295 300 GinAsp Thr Lys Tyr Val Val. Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 310 315 320 Mfct Met Asp Thr Fhe Val Lys His Pr© Ile Lys Th.r Gly Met Leu Asn 325 330 335 Giy Lys Lys Tyr Met Val Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys • 34Õ 345 350 Asp Fhe Met Val Glu Gly Glu Arg Val Arg Thr Ile Ser Lys Asp Ala 355 360 385 Lys AS|j Asn Thr Arg Thr Ile Ile Fhe Pr© Tyr Val Glu Gly Lys Thr 37 O 375 380 164
Leu Tyr Asp Ais íle Vai Lys Vai Mis Vai Lys Thr Xle Asp Tyr ASp 385 300 395 400 Gly Gin Tyr His Vai Arg Xle Vai. Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asn Alâ Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Alâ Lys 420 * 425 430 Lys Giu. Thr Thr pro Ala Thr Pr© Ser Lys Pr© Thr Thr Ala Pro Val 435 440 445 Glu Lys Giu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin 450 455 460 Ser Pro Ser Vai Giu Lys Glu Xle.Asp Ala ser Ser Glu Ser Gly Lys 46S 47© - 475 480 Asp Lys Thr Pr© Ala Thr Lys Pro Ala Lys Gly Glu val Glu Ser Ser 485 450 495 Ser Thr 'Thr Pr©' Thr Lys Vâl vai Ser Ala Thr Gin Asn val Ala Lys SOO 505 510 Pr© Thr Ser Ala. Ser Ser Glu Thr Thr Lys Gly Vai Vai Gin Tíur Ser 515 520 525 Ais Giy Ser Ser Glu Ala Lys Asp Asn Ala Pr© Leu Gin Lys Ala Asn 530 535 540 XI* LyS Asn Thr Asn Asp Gly Kis Thr Gin Ser Gin Asn Asn Lys Asn 545 550 §55 560 Thr Gin Glu Asn Lys Ala Lys Ser 565
<210> 26 <211> 568 <212> PRT <213> Sequência Artificial <220> <223> ORFO657ηΗ <400> 26 165
Ala f 01¾ Glu Thr oiy κ Gly Thr Ilt Ala Vai Ala Ser wro Thr Thr Thr 20 Pro Vai Ala Asn Ala Vai Ser Val 35 40 Thr Thr Glu Thr Lys Glu Ala Lys 50 55 Asn Glu Thr Lys Glu Vai Lys Pro 65 7» Tyr Pro Ha Leu Asa Glu Glu Leu 85 lie Lys A.sp Lys Asp His Sor Ala 100 Glu Het Lys Lys Lys Asp Gly Thr 115 120 Ser val Lys Pro Ala Arg val lie 13 Ô 135 Glu IsOU Gly Léu Gl« Ser Gly Gin 145 150
Thr Glu 10 Thr Gin Pro Lys Thr 15 Glu. Thr 25 Glu Lys AÍS Pro Glu 30 Ala Lys Ser Asn Lys Giu Val 45 Val Ala Pro Glu Val Lys Glu €0 Val Lys Ala Pro Ala Ala Lys 15 Ser Asp Asn Asn Thr 80 Arg Glu' Qf| Ala n© Lys Asn Pro aq Ala Pro 105 Asn Ser Arg Pró Ue 110 &SP Phe Gin Gin Phe Tyr Mis 125 Tyr Ala Ser Phe Thr Asp Ser 140 Lys Pro Glu 11« Fhe Trp Arg· 155 Lys Phe Glu Val Tyr l m 16 6
Glu Gly Asp Lys Lys Leu Fr» Ile Lys Leu val Ser Tyr Asp Thr Val 155 170 175 Lys Asp Tyr Ala Tyr Ile Arg Phe Ser Vai Ser Asn Gly Thr Lys Ala 180 135 190 Vai Lys Ile Vai Ser Ser Thr His Phe Asn Asn Lys Glu Glu Lys Tyr 195 200 205 Asp Tyr Thr Leu Het Glu Phe Ala Gin Pr» 11* Ty r Asn Ser Ala ASp no 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pr» 225 230 235 240 Tyr Lys Lys Ala Lys Thr Leu, Glu Arg Gin val Tyr Glu Mu Asn Lys 245 250 255 Xle Gin Asp Lys Leu Pr© Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 250 265 270 Leu Glu Glu Thr Lys Lys. Ala Leu Asp Glu Gin Val Lys Ser Ala Ile 275 - 280 285 Thr Glu PM Gin Asn Vai Gin Pr» Thr Asn Glu Lys Kefc Thr Asp Leu 230 295 300 Gin Asp Thr Lys Tyr Vai Vai Tyr Glu Ser Val Glu Asn Asn Glu Ser 3 OS 310 315 320 £ie& Hat Asp Thr PM Vai Lys His Pro Ile Lys Thr Gly Hat Leu Asn 325 330 335 Gly Lys Lys· Tyr Het Vai Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Asp Phe Het Vai Glu Gly Glu Arg Vai Arg Thr Ile Ser Lys Asp Ala 355 360 365 Lys Asn Asa Thr Arg Thr Ile Ile Fhe Pro Tyr val Glu Gly Lys Thr 370 375 300 Leu Tyr Asp Ala Ile Vai Lys Vai Hls Vai Lys Thr Ile Asp Tyr Asp 385 390 335 400 Gly Glrt Tyr Hls Vai Arg Ile vai Asp Lys Glu Ala Phe Thr Lys Ala 403 410 415 Asn Ala Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ale Lys 420 425 430 Lys Glu Ala Thr Fr» Ala Thr Pr» Ser Lys Pro Thr Thr Ala Pr» Val 435 440 445 Glu Lys Glu Ser Glu Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin 450 455 460 Ser Pr» Ser Vai Glu Lys Glu Ile Asp Ala Ser ser Glu Ser Gly Lys 455 470 475 480 Asp Lys Thr Pr» Ala Thr Lys· Pr» Ala Lys Gly Glu Val Glu Ser Ser 435 490 495 Ser Thr Thr Fr© Thr Lys val vai Ser Ala Thr Gin Asn Val Ala Lys 500 S05 510 fro Thr Ser Ala Ser Ser Glu Thr Thr Lys Gly Val Val Gin Thr Ser - 515 520 52$ Ala Gly Ser Ser Glu Ala Lys· Asp Asn Ala Pro Leu Gin Lys Ala Asn 530 535 540 Ile Lys Asa Thr Asn Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn 545 550 555 560 Thr Gin Glu. Asa Lys Ala Lys Ser 555 27 167 <210> <211> <212> <213> <22 0> <223> <4 Ο 0> 570 PRT Sequência Artificial ORFO 657ηΗ 27 168
ffet Gly Ala Glu Glu Thr Gly Gly 1 S
Thr Glu Ala Vai Ala Ser Pr© liar 20
Thr Lys Pr© Vai Ma Asn Ala Vai 35 40
Aia Pr© Thr Ser Glu Thr Lys Glu 50 55
Ala Pr© Lys Glu Thr Lys Glu vai 65 10
Asn Thr Tyr Fr© Ile Leu Asn Gin SS
Pr© Ala He Lyâ Asp Lys Asp His 100
Asp Phe Glu Het Lys Lys Lys Asp 115 “ 120
Ala Ser Ser vai Lys Pr© Ala Arg 130 135 .·
Glu He Glu Leu Gly Leu Gin Ser 145 150
Vai Tyr Glu Gly Asp Lys Lys Leu 165
Thr Vai Lys Asp Tyr Ala Tyr Ile ISO
Lys Ala Vai Lys Ile Vai Ser Ser 195 200
Lys Tyr Asp Tyr Thr Leu Set Glu
210 _ 21S
Ala Asp Lys Phe Lys Thr Glu Glu 225 - 210
Ala Pr© Tyr Lys Lys Ala Lys Thr 245
Asn Lys Ile Gin Asp Lys Leu Fr© 260
Lys Lys Leu Glu Asp Thr Lys Lys 275 280
Ala Ile Thr Glu Phe Gin Asn Vai 290 295
Asp Leu Gin Asp Thr Lys Tyr Vai 305 310 '
Glu Ser Met Met Asp Thr Phe vai 325
Leu Asn Gly Lys Lys Tyr ííee Vai 340
Trp Lys Asp Phe Mer Vai Glu Gly 355 360
Asp Ala Lys Asn Asn Thr Arg Thr 370 375
Thr Asn Thr Glu Ala Gin Fr© Lys 10 15
Thr Thr Ser Glu Lys Ala Pr© Glu 25 30
Ser Vai Ser Asa Lys Glu vai Glu 45
Ala Lys Glu Vai Lys Glu Vai Lys 60
Lys Pr© Ala Ala Lys Ala Thr Asn 75 09
Glu Leu Arg Glu Ala Ile Lys Asn 90 95
Ser Ala Pr© as» Ser Arg Fr© Ile 105 no
Gly Thr Gin Gl» Phe Tyr His Tyr 125
Vai Ile Phe Thr Asp Ser Lys Pr© 140
Gly Gin Phe Trp Arg Lys Phe Glu 155 160
Fr© Ile Lys Leu Vai Ser Tyr Asp 170 175
Arg Phe Ser Vai Ser Asm Gly Thr 185 190 .
Thr. His Phe Asa As A Lys Glu Glu 205
Phe Ala Gin Pr© Ile Tyr Asa Ser 220
Aap Tyr Lys Ala Glu Lys Leu Leu 235 240
Leu Glu Arg Gin Vai Tyr Glu Leu 250 255
Glu Lys Leu Lys Ala Glu Tyr Lys 265 270
Ala Leu Asp Glu Gin ml Lys ser 285
Gin Pr© Thr Asn Glu Lys Mefc Thr 300 vai Tyr Glu Ser vai Glu Asn Asn 315 320
Lys His Fr© He Lys Thr Gly Her 330 335
Met Glu Thr Thr Asn Asp Asp Tyr 345 350
Gin Arg Vai Arg Thr ile Ser Lys 365
Ile ile phe Fr© Tyr Vai Glu Gly 380 169
Lys Thr Leu Tyr Asp Ala lie Vai Lys vai HÍS Vai Lys Thr lie Asp 385 350 395 400 Tyr Asp Gly Gin 'Tyr, His Vai Ar$ lie Val Asp Lys Glu Ala Phe Thr 405 410 415 Lys Ala Asn Thr ASp Lys Ser Asn Lys Lys Glu Gin Glu Asp Asn Ser 420 425 430 Ala Lys Lys Glu Ala Thr Fro Ala Thr Pro Ser Lys Pro Thr Pro Ser 435 440 445 Pro Vai €1« Lys Glu Ser Gin LyS Gin Asp Ser Gin Lys ASp Asp As» 450 ' 455 450 Lys Gin l$u Pro Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser 46$ 470 475 480 Gly Lys Gly Vai Thr Leu Ala Thr Lys Pro Thr Lys Gly Glu Vai Glu 485 450 495 Ser. Ser Ser Thr Thr Pro Thr Lys vai vai Ser Thr Thr Gin ASft Vai SOO 505 510 Ala Lys Pro Thr Thr Gly Ser Ser Lys Thr Thr Lys Asp Vai val Gin 515 520 525 Thr Ser Ala Gly ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys 530 535 540 Ala Asa. ile Lys HiS Thr Aon Asp Gly His Thr Gl» Ser Gin Asa Asn 54$ S50 555 580 Lys Asa Thr Sla Glu Aso Lys Ala Lys Ser - 585 570
<210> 28 <211> 654 <212> PRT <213> Sequência Artificial <22 0> <223> SEQ ID ΝΟ: 2 modificada para conter uma glicina a seguir à metionina do terminal amino e uma cauda de His do terminal carboxilo <400> 28 170 fset Qiy ASW Lys Cila 61a Lys 61» Ph® Lys Ser Pite Tyr Ser lie ATf l 5 10 15 Lys Ser Ser Leu Gly V&l Ala Ser Vai Ala Ile Ser Thr Leu Leu Leu 20 25 30 Leu Met Ser Aso Gly 61» Ala 61» Ala Ala Ala 61» Glu Thr Gly Gly 35 40 45 Thr Asm Thr Glu Ala 61a Pro Lys Thr Glu Ala Vai Ala Ser Pro Thr 50 55 €0 Thr· Thr Ser Glu Lys Ala Pro 61» Thr Lys pro V&l Ala AS» Ala Vai SS 70 75 80 Ser vai ser Ase Lys Glu vai 61» Ala pro Thr Ser Glu Thr Lys Glu 85 90 95 Ala Lys Gl» Vai Lys 61« Vai Lys Ala Pro Lys 61» Thr Lys 61» Vai 100 105 110 Lys Pro Ala Ala Lys Ala Thr AS» Asa Thr Tyr Pro lie Leu As» Glu US 120 lãs Glu Leu Arg 61» Ala Ile Lys Asn Pro Ala Ila Lys ASp Lys Asp HÍS 130 135 140 171 ser Ala Fro Asn Ser Arg Fro lie Asp phe Giu .«et Lys Lys Lys Asp 145 ISO 155 160 Gly Thr Gin Gin Phe Tyr HÍS Tyr Aia Ser Ser val Lys Fro Ala Arg 165 120 175 Vai lie Phe Thr Asp Ser Lys Fro Glu Xle Glu Leu Gly Leu Gin Ser ISO 185 180 Gly Gin Phe Trp Arg Lys Phe Glu Val Tyr Glu Gly Asp Lys Lys Leu 195 200 205 Pxo lie Lys Leu Val Ser Tyr Asp Thr Val Lys Asp tyr Ala Tyr Xle 210 215 220 Are Phe Ser vai Ser Asn Gly Thr Lys Ala Vai Lys Xle Val Ser Ser 225 230 235 240 Thr His Phe Asn Asn Lys Glu Glu Lys Tyr Asp Tyr Thr Leu Met Glu 245 250 255 Fhe Ala Gin Fro lie Tyr AS» ser 'Ala Aap Lys Phe Lys Thr Glu Glu 250 265 ’ 27Ô Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pra Tyr Lys Lys Ala Lys Tfer 225 280 2S5 Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys Xle Gin Asp Lys Leu Fro 2 m 29S 300 Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys Leu Glu Asp Thr Lys Lys 305 310 315 320 Ála Leu Asp Glu Gin Val Lys Ser Ala Xle Thr Sle Phe Gin Asn Val 325 330 335 Gin pro Thr Asn Glu Lys Met Thr Asp Leu Gin Asp Thr Lys Tyr val 340 345 350 Vai Tyr Glu Ser Val Glu Asn Asn Glu Ser Met Met Asp Thr Phe Val His 355 360 365 ' Lys Fro Xle Lys Thr Gly Met Leu Asn Gly Lys Lys Tyr Met Val 320 325 380 Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Met Val Glu Gly 335 398 395 400 Gin Arg Val Arg Thr Xle Ser Lys Asp Ala Lys Asn Asn Thr Arg Thr 405 410 41S Xle Xle Phe Fro tyr val G1U Gly Lys Thr Leu Tyr Asp Ala Xle Val 420 425 430 Lys Vai His Val Lys Thr Xle Asp Tyr Asp Gly Gin Tyr His Val Arg 435 440 445 xle Vai Asp Lys Glu Ala Phe Thr Ly s Al a Asn Thr Asp Lys Ser Asn 450 455 - 460 Lys Lys Glu Gin 61« Asp Asn Ser Alá Lys Lys Glu Ala Thr Fro- Ala 485 420 425 480 Thr Fro Ser Lys Pro Thr Fro Ser Pro Val Giu Lys Glu Ser Gin Lys 485 490 495 Gin Asp Ser Gin Lys ASp Asp Asn Lys Gin Leu Fro Ser Vâl Glu Lys 500 505 510 Glu ASK Asp Ala Ser Ser Glu Ser Gly Lys Asp Lys Thr Fro Ala Thr 515 520 1 525 Lys Fro Thr Lys Gly Glu Val Glu Ser Ser Ser Thr Thr Fro Thr Lys 530 535 540 Vai val Ser Thr Thr Gin Asn Val Ala Lys Fro Thr Thr Ala Ser Ser 545 550 555 560 Lys Thr Thr Lys Asp Val Val Gin Thr Ser Ata Gly ser Ser Glu Ala 565 S70 575 172
Lys Asp Ser Ala Pro Leu 6ΪΑ Lys Ala hsn ile Lys Asn Thr Asn Asp seo 585 500 61y His Thr 61» ser 6lP Asn As» Lys Asa Thr Gin Glu Asn Lys Ala 505 $00 605 Lys Ser Leu Fr© Gin Thr Gly Glu Giu Ser Asn Lys Asp Met Thr Leu 61Ô 615 «20 Fro Leu Mefe Ala Leu Leu Ala Leu Ser ser Ile vai Ala Phe Vai Leu 62 S 610 SIS 640 Pro Arg Lys Ατ0· Lys. Asso Leu Glu His ,HÍS His «is His His $4$ 650
<210> 29 <211> 1962 <212> ADN <213> Sequência Artificial <22 0> <223> ORF0657n de comprimento completo + cauda de His no terminal carboxilo <400> 29 173 s.tgaaeaa&c ageaaaaaga atfctaa&txa ctttatccaa ttagaaagtc atcactaggc 60 gttgcatctg tagcaafctag tacactfcbta ttáfctaatgt eaaatggega agcscaagca 120 gcagctgaag aaacaggtgg tacaaataca gaageaeaae caaaaaetga agcagttgca ISO âgtceaaeaa caacatccga aaaagctcca gaaactaaac cagtagctaa tgctgtctca 240 gtaCctaafca aagsagttga ggcecctact tctgaa&caa aagaagctaa agaagtcaaa 300 gaagttaaag cecctaagga aaçaâaagaa gttaaaccag cagcaaaagc cactaaeaat 360 acatatccta ttttgaatca ggaacttaga gaagcgafcta aaaaecctge aataaaagac 420 aaagateata gcgcaccaaa ctctcgtcca atfcgacttog aaatgaaaaa gaaagatgga 48 Q actcaacagt tttateatta tgcaagttct gttaaacctg ctagagvtat ettcactgat 540 teaaaaecag aaattgaatt aggattacaa fccaggtçaat tttggagaaa attfcgaagtt 600 tatgaaggtg acaaaaagtt gccaattaaa tfcagtateat scgafcacfcgt fcâaagáttat 660 gettagattc gcttctctgt atcaaaçgga acaaaagctg ttaaaattgt tagttcaaea 720 caettc&ata acaaagaaga aaaatacgat tacacattaa tggaattcgc acaaeeaatt. 7SÕ tataaeagcg csgataaatt caaaactgaa gaagattata aagcEgaaaa attafctagcg 640 ccatataaaa aagcgaaaac aetagaaaga çaagtttatg aattaaataa a&ttcaagat 300 aaaettcctg aaaaattaaa ggctgagtac aagaagaaae tagaggatac aaagaaagct 360 ttagatgagc aagçgaaate agctattact gaattceaaa atgfcacaacc aacaaatgãâ 1020 aaaatgactg atttacaaga tacaaaatat gtcgtxtarg aaagtgttga gaaca.acgaa 1060 tccatgatgg ataçttttgt taaacaccct attaaaacag gtatgcttaa cggcaaaaaa 1140 tat&tggbca tggaaactac taatgaegafc tactggaaag atttcatggfc fcgaagrgfccaa 2200 cgtgttagaa ctata-agcaa agatgccaaa aacaatacta gaacaattat ttteccatat 1260 gtcgaaggfca aaacfce&aca tgatgctafcc gttaaagttc scgtaaaaac gafctgafcfcat 2320 gatggacaat aceatgtcag aafccgttgat aaagaagcat ttacâââagc csacaccgât 2380 aaafcctaaea aaaaagaaca acaagacaac teagctaaga aggaagctac tccagccacg 2440 ççcagcaaac caacaccatc acctgttgaa aaagaafcçac aaaaaeaaga cagccaaaaa 2500 gatgacaata aacaattacc aagtgtfcgaa aaagaaaacg acgcatctag tgagtcaggt 2560 aaagacaaaa cgccfcgcsac aasaceaacfc aaaggfcgaag tagaateaag tagcacaaet 1620 ccaactâagg t&gtatceae gactcaaaat gttgcaaaac caacaactgc ttcatcaaaa 2680 acaacaaaag atgttgttca aacttcagea ggtfcctagcg aagcaaaaga tagtgctcca 1740 ttacaaaaag e«âaacat,taa aaaeacaaat gatggacaca ctcaaagcca aaaca&taãa 1800 astaeacaag aaaafcaaagc aaaatcatta ccacaaactg gtgaagaatc aaataaagat 1860 atgacaetae eatcaatggc actattagct ç eaagtagca ccgtcgcatt cgtactaccc 1526 agaaaacgta aaaaccccga geaccacçac caccaccact ga 1362
<210> 30 <211> 1737 <212> ADN <213> Sequência Artificial <22 0> <223> ORF0657nH + cauda de His no terminal carboxilo <400> 30 174 atgaacgctg aagaaacagg tggtacaaat acagaagcac aaccaaaaac tgaagcagtt 60 gcaagtccaa caacaaeatg tgaaaaagct ççagaaactã aaccagtagc caatgctgtc 120 tcagtatcta ataaagaagt tgaggcccct acttctgaaa caaaagaagc fcaaagaagtt ISO aaagaagtta aagccccfcaa ggaaacaaaa gaagtfcaaac cagcagcaaa agccactaac 246 àafcacatácc cfcatttfcgaa tcaggaactc agagaagcga ttaaaaaccc tgcaataaaa 306 gaeaaagatc atagcgeacc aaactctcgt ccaattgafct -ttgaaatgaa aaagaaagat 366 ggaactcaac agttctatca tfiatgcaagt tctgttaaac çtgçtagagt tattttcact 426 gattea.aaac cagaaattga attaggatca caatcaggcc aattttggag aaaatttgaa 486 gtttatgaag gtgacã&ãm gttgceaatt aaattagfeat catacgãtãc tgtcaaagat 540 tatgettacâ ttegcttctc tgtâtcsaac ggaacaaaag ccgctaaaat cgtcagttca 600 acacacttca ataacaaâga agaaaaatac gattacacat taatggaats. cgcacaacca 660 atttataaca gtgcagataa attcaaaact gaagaagatt ataaagctga aaaattatta 720 gegceataca aaaaagcgaa aacactagaa agaeaagttt atgaattaaa caaaatfccaa 780 gataaactçç cfcga&aaatt aaaggçtgag tacaagaaga aattagegga feaeaaagaaa 846 gctttagatg agcaagtgaa atcagctatt actgaâtteç aaastgtaca accaacaaat 000 gaaaaaatga ctgatttaca agatacaaaa fcafcgttgttt afcgaâagtgt tgagaataae 060 gaatctatga tggatacttt tgt taaaeac ccfcattaaaa caggtatgcfc fcaacggcaaa 3020 aaatatatgg tcatggsaac taetaatgac gafctactgga aagattteat ggttgaaggt 1080 caacgtgtta gaactataag eaaagatgct aaaaataata etagaacaafc fcattttccca 1140 tatgtfgaag gtaaaactct atatgatget accgttaaag ttcacgtaaa aacgafcfcgat 1200 fc&fcgafcggac aafcaecatgt e&gaatcgtt gateaagasg eattfcacaaa sgccastace 1260 gafcaaateta acaaaaaaga aeaacaagat aactcagcta agaaggaagç fcactceagct 1320 acgcctagca aaccaacacc atcacctgtt gaaaaagaat caeaaaaaea agaeagccaa 1300 aaagatgaca ataaacaatt accaagtgtt gaaaaagaaa afcgacgeatc tagtgagfcea 1440 ggtaaagaca aaacgcetgc tacaaaacéá actaaaggtg aagtagaatc aagtagfcaca ISO© actccaacta aggtagtatc tatgactcaa aatgttgcaa a&ccaaeaac tgcttcatca 1560 aaaacaaçaa aagaftgttgt ccaaactcca gcaggttcca gcgaagcaaa agatagtgct 1620 çeatçscaaa aagcaaacat tã&aa&câca aatgatggac acactcaaag ccaaaacaat 1600 aaaaatacac aagaaaataa agcaaaatea cfccg&gcscc accaccacca ccaccga 1737
<210> 31 <211> 1941 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 28 sem uma cauda de His do terminal carboxilo e com optimização de codões para expressão em leveduras <400> 31 175 atgggtaaca agcaacaaaa ggaattcaag tetttctact ccatcagaaa gtcttecttg 60 ggtgttgcfct ctgtegçtat ctccacçtçg ttgttgctga tgcccaaçgg tgaagcteaa 120 getgctgççg aagaaactgg tggtaccaaç actgaagctc aaccaaagac cgaagctgtc 180 gcttccccaa ccactacctc tgaaaaggct ccagaaacta «gccagttgc taacgctgtc 240 tccgfcttcta acaaggaagt cgaagctcca acctccgaaa çtaaggaagc taaggaagfcfc 200 aaggaagtca aggctccaaa ggaaacfcaag gaagtcaagç cagctgetaa ggctaccaac 260 aacact tacc caattttgaa ee&agaafctg agagaageta tcaagaaece agctatcaag 420 gacaaggacc actecgctcc asaetctaga ccaatcgact tegaastgaa gaagaaggac 480 ggtacccaac aattcfcaeca ctaegcgtec tctgtcaagc cagcfcagagt tatfcttcaçc 540 gactctaagc cagaaatcga attgggtttg caatccggtc aattcfcggag aaagt tcgaa 600 gsctacgaag çtgacaagaa gctgecaatt aagttggttt ectacgacac cgtcaaggac 660 tacgcttaca tcagattctc cgtttctaac ggtaetáagg ctgtcaagat tgtctcttcc 220 acccacttca scaaeaagga agaaaagtac gactacactt tgatggaatt cgctcaaeca 280 atttacaacfc ctgctgacaa gctcaagacc gaagaagact acaaggctga aaagttgttg 840 gctccataca agaaggctaa gactttggaa agacasgttt acgaafctgaa caagatccaa 800 gacaagfctgc cagaaaagtt gaaggctgaa tacaagaaga agttggaaga caccaagaag 260 getttggacg aacaagtcaa gtcegctatc accgaattcc aaeacgttca aceaactaâC 1020 gaaaagatga ctgactfcgca agacactaag tacgtcgtct acgaatccgt cgaaaacaac 1080 gaatceatga tggaeacctt cgttaagcac ccaattaaga ctggtatgtt gaacggtaag 1140 aagcacatgg tcatggaaac cactaacgac gaççaçttgga aggaçttçat ggttgaaggt 1200 eaaagagtça çaaccatctc caaggacgct áagaacaaea ctagaaccat tatcttccca 1260 tacgttgãag gtaagact.ct gtacgacgct atcgtcaagg ttcacgtcaa gactattgac 1320 tacgacggtc aataccacgt fcagaattgtt gacaaggaag ctttcaccaa ggctaacacc 1380 gaeaagtcea acaagaagga acaacaagae aactctgcta agaaggaagc taccccagct 1440 accccatcta agccaacccc atctecagtt gaaaaggaat cccaaaagca agacteccaa 1500 aaggacgaca acâagcaatt gccatccgtc gaaaaggaaa aegacgcgtc ttcfcgaatcc 1560 ggtaaggaca agactccagc taccaagcca actaagggtg aagfcfegaatc ttcctctact 1620 acteeaacca aggttgtctc cactacccaa aaçgfcçgcta agccaaççac ggcttcttcc 2690 aag&etaeea aggacgttgt ccaaacttct, gctggttcet ctgaagctaa ggaetctgct 2746 ccattgcaaa aggctaacat caagaacace aacgacggtc acacccaatc ccaaaacaac 1800 aagaacactc aagaaaacaa ggccaagtcfc fctgccacaaa ccggtgaaga atccaacaag 2960 gacatgacee tgccattgat ggctccgttg gctttgtctt ccatcgtcgc tttcgtcttg 1920 ccaagaaaga gaaagaacta a 2941
<210> 32 <211> 1710 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 3 e com optimização de codões para expressão em leveduras <400> 32 176 atggctgaag tçcccaacca gttcetaaca gaagtcaagg acttacccaa aaggaccact acccaacaat fccfeaagccag cacgaaggtg gcstacatca cscttcaac® tacaactctg ccataceaga aagttgccag
Etggacgaae aagatgactg fcceacgatgg taçacggtça aaactggtgg ctacetetga aggaagtcga ctccaaagga ttttgaaeca ccgctccaaa tctaççâcta aaatcgaôtt acaagaagtt gattctccgt ecaaggaaga ctgaeaagtt aggctaagac aaaâgttgaa aagtcaagtc acttgcaaga acaecttcgt tggaaaec&c taecaaeaet aaaggcfccoa agctccaacc aacsaaggaa sgaattgaga çtcfcagaçca cgcgtcctct: gggtttgeaa gccaattaag ttctaacggt aaagtácgac caagacegaa tttggaaags ggccgaatac cgccatcacc cacEaagtác taagcaccca taacgacgae gaagctcaac caaagaccga gaaactaagc cagttgctaa tccgaaacta aggaagctaa gccaagccag ctgctaaggc gaagctatta agaacecagc acçgacttcg aaatgaagaa gtcaagccag ctagagttac tccggtcaat tctggagaaa ttggtttcct acgacaccgt actaaggctg tcaagattgt tacactttga tggaattcgc gaagactaca aggccgaaaa caagtttacg aattgaacaa aagaagaagt tggaagacac gaafctecaaa acgt tcaacc gtcgtctacg àatccgtcga attaaçjacEg gta&gttgaa t&ceggaagg actfccatggt agctgtcgct 60 cgctgtetcc 120 ggaagttaag 180 taccaacaac 240 taccaaggac 300 gaaggacggt 360 ttccaccgac 420 getegâagtc 480 caaggactac 540 cfcettccacc 600 tcaaccaatt 660 gttgttgçct 720 gatccaagac 780 caagaaggct .840 aactaacgaa 900 aaacaacgaa 960 çggtaagaag 1020 cgaaggtcaa 1080 agagtcagaa ccatccccaa ggacgctasg aaçaacacta gaaccattat cttcccatac 1140 gttgaaggta agaefcfctgta egacgçfcstç gfccaaggfctc acgtcaagac tattgactac 1200 gacggtcaat accaegttag aattgttgac «aggaagctt cçaccaaggc taaçaeegac 1260 aagtccaaca egaaggaaça acaagaeaac tctgctaaga aggaagetae cccagctacc 1120. ceatetaagc caacccçatç tceagttgaa aaggaafccfcc aaaagcaaga ctcccaaaag 1380 gaegacaaca agcaattgcc atccgtegaa aaggaaaacg acgcgtcttc tgaatccggt 1448 aaggaca&ga etceagetae caagccaact aagggtgaag tçgaatettç ctctactact 1500 ccaaccaagg ttgtctccac taççcaaaac gtcgetsagc caactacçgç tfccttccaag 1560 actaccaagg acgttgtcca aactfcctgct ggttcccctg aagctaagg* cfcctgetcca 1620 fcfcgcaaaagg etaacateaa gaacacca&c gaeggtcacs ççcaâtccca aaacaacaag IS 80 aacaeteaag aaaaeaagge taagtctfcaa 1710
<210> 33 <211> 1341 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 1 e com optimização de codões para expressão em leveduras <400> 33 177 atggcsgaafif aaactggtgg tsccaacact gaagcfceaae eaaagaccga agctgfccgct 60 fcccccaacca etacetctga aaaggctcca gaaactaagc eagttgetaa cgctgfcctcc 120 gtttctaaça aggaagtcga agctccaacc tccgaaacta aggaagctaa ggããgtSaag 180 gaagtcaagg ctceaaagga aaccaaggaa gtcaagçcag çtgctaaggc taccaacaac 248 acfctacccaa fctttgaacca agaattgaga gaagctatta agaacccagc tatcaaggac .300 aaggaccact ecgctecaaa ctctagacca afccgaetteg aaatgasgaa gaaggácggl 360. acccaacaat tctaccacta cgcgçcetct gtcaagccag ceagagttat ecteaecgac 420. tctaagccag aaatcgaatt gggtttgcaa tccggtcaat tctggagaaa gttcgaagfcc 480 tacgaaggtg acaagaagtt gccaattaag ttggtttcet acgacaccgt caaggaefcac 540 gcttacatca g&ttctccgt ttctaacggt actaaggctg tcaagattgt ctcttocacc 600 cacttcaaca acaaggaaga aaagtacgac tacactttga tggaattcgc tcsaccastt 660 tacaactctg ctgacaagtt caagaccgaa gaagactaca aggctgáaaa gttgttggct 720 ccatacaaga aggctaagac tttggaaaga caagcttacg aattga&caa gatccaagac 780 aagttgççag aaaagttgaa ggctgaatac aagaagaagt tggaagacac caagaaggct 840 fctggacgaac aagtcaagtç cyctatcacc gaattccaaa acgttcaacc aaetaâcgaa 800 aagatgacfcg acctgeaaga cactaagfcac gtcgftctacg aatccgtcga aaacaaegaa 960 çccatgatgg acaccstcgfe taagcaeeca attaagactg gtstgttgea cggtaagaag 1020 tacatggtca tggaaaccac taacgacgac tactggaagg acttcacggc egaaggtcaa 1080 agagécagaa ccatctccaa ggacgctaag aacaacaeta gaaecattat ctfcccatac 1140 gttgaaggca agactttgta qgaegefcatc gtcaaggtee acgteaagac fcaetgactac 1200 gacggtcaat accacgttag aattgtfcgac aaggaagctt tcaccaagge taacaccgac 1260 aagtccaaca agaaggaaca acaagacaac tctgetaaga aggaagctae cccagctacc 1320 ccatctaagç caaccccata a 1341
<210> 34 <211> 1710 <212> ADN <213> Sequência Artificial <220> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 34 178 atggctgaag aaaccggfcgg taccaacact gaagcteaae caaagaecga agctftcgct 60 tccccaacca ctacctetga aaaggcfceca gaaactaagc cagttgccaa cgctgtcfccc 120 gtttctaaca aggaagtcga agctccaacc tccgaaacta aggaagctaa ggaagttaag ISO gaagtcaagg ctccaaagga aactaaggaa gtcaageeag ctgctaaggc taccaacaac 240 acttacccaa ttttgaacea agaattgaga gaagctatta agaacccagc tatcaaggac 300 aaggaccact ccgctccaaa ctctagacca atcgactteg aaatgaagaa gaaggacggt 300 aceeaacaafc tctaccacta cgcgtcctct gtcaagceag ctagagtcat tttcaccgac 420 ectaagccag aaategaatt gggtttgcaa fcceggtcaat tctggagaaa gttcgaagtc 400 tacgaaggtg acaagaagfct gccaattaag ctggtttcct açgacaccgt caaggacfcac 540 gcttacatca gattetccgt ttçtaacggt actaaggctg fccaagafcfcgfc ctcctccacc 600 caettcaaca acaaggaaga aaagKaeg&e tacactttga tggaattcgc tcaaccaatt 660 tacaectctg çtgacaagtt caagaccgaa gaagactaca aggctgaaaa gttgttggct 720 ceataçaaga aggctaagac tttggaaaga caagtttacg aattgaacaa gateeaagac 780 aagttgccag aaaagttgaa ggctgaataç aagaagaagt tggaagacac caagaaggct 840 ttggacgaac aagtcaagtc cgccatcacc gaattxcaaa acgttçãâcc aaetââcçaa 900 aagatgaccg acttgcaaga cactaagtac gtcgtctacg aatçcgecga aaagaacgaa 960 tccatgatgg acaccttegt taagcacçca attaagactg gtafcgtfcgaa cggtaagaag 1020 tacâfcggtca tggaaaccac taacgacgac tactggaagg aetfceatggt tgaaggtcaa 1000 agagtcagaa ccatctccaa ggacgctaag aacaacaG&a gaaccattat cttcccatac 1140 gttgaaggta agactttgta cgacgctatc gtcaaggttc aegfccaagac tattgactac 1200 gacggtcaat accacgttag aattgttgac aaggaagctt tcaccaaggc taacaccgac 1260 ãagtccaaca egããggaaca ãcaagacaac tctgctaaga aggaagctac cccagctacc 1320 çcatccaagc caãceccatc tcõagttgae aaggaatctc aaaagcaaga ctcccaaaag 1380 gacgacaaea agcaattgce atccgtcgaa aaggaaaacg aggcgtctCc tgaatccggt, 1440 aagggtgtca ctttggctac caagccaact aagggtgaag ttgaatcttç ctctaçtact 1500 eeaaeeaaeg ttgfcctccag tacccaaaac gtcgctaagc caactaccgg ttettccaag 1560 actaccaagg acgttgtcca aacttctgcfc ggttcctctg aagctaagga ctctgctcca 1620 tcgcaaaagg ctaacatcaa, gcacaccaac g&cggtcaca cccaatccca aaacaácaag 2680 aacactcaag aaaaçaaggc taagtcttaa 1710 <210>
<211> 1710 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 35 179 atggctgaag aaaçtggfcgg fcaceaaçacfc gaagctcaac caaagaccga agefcgtcgcfc 60 fcccccaacca ctacctctga aaaggctcca gaaacta&gc cagttgctaa cgccgtctcc 120 gettct&aca aggaagfcega agctccaacc tccgaaacta aggaagcfcaa ggaâgttaag ISO gaagtcaagg ctcc&aagga aactaaggaa gtcaagecag ctgctaaggc taccaacaac 240 acttaçccaa etttgaacca agaattgâga gaagc&att» agaacecagc tatcaaggac 000 aeggaccact ccgctccaaa ctçtagacea atcgacctcg aaacgaagaa gaaggacggt 360 aceeaacaat tctaccacta cgcgtcctct gtcaagccag ctaga.gt.tafc ttteaecgae 420 Kctaageeag aaatcgaatí: gggtttgoaa tecggtcaat tctggagaaa gttcgaagtc 480 taegaaggtg acaagaagtt gceaactaag ttggfcttetfc acgacaeegfc eaaggacfcae $40 gctcacatca gattcfcccgt tfcctaacggfc actaaggctg tcaagattgc ctcttccacc 600 cacttcaaca. aeaaggaaga aaegtacgac fcatactttga fcggaattçgç ccaaccaatt 660 fcacaactctg ctgacaagtt eaagacegaa gaagactaca aggctgaaaa gctgttgget 720 ccatacaaga aggccaagac fcttggaaaga caagfcfctacg aafcfcgaacaa gafcccaagac 730 aagtfcgccag aaaagfctgaa ggctgaatac aagaagaagt feggaagacac caagaaggct S40 ttggecgaac aagtcaagfce cgcfcatcacc gaattccaaa aegfctcaa.ee aactaaggaa 900 aagatgaetg acttgtaaga eacfcaagtac gtcgtctacg aatccgtega aaaeaacgaa 960 tccatiâtgg acaccttcgt taagcaecca attaagactg gtatgttgaa cggtaagaag 1020 tacatggtca tggaaaccac taacgacgae tactggaagg acttcatggt tgaaggtc&a 1080 agagtcagaa Gcatctetaa ggacgefcaag aacaacacta gaaccattaC cttcccatac 1160 gfctgaaggta agacfcttgta cgacgçfcatc gfceaaggttc acgtcaagac t&ttgâccac 1200 gacggtcaat accacgttag aatfcgttg&c a&ggaagctfc tcaccaaggc taacaccgae 1260 aagtcesaea agaaggaaca acaagacaac tçtgççaaga aggaagctac cccagctacc 1320 ccatctaagc caaccccatc tccagtfcgaa aaggaatctc aaaagcaaga ctcccaaaag 1380 gacgacaaca agcaattgcc atctftcgaa aaggaaaacg acgcgtcttc tgaatecggt 1440 aagggegtçà ctfcfctgctac caagccaâcfc aagggtgaag fcfcgaatefcfcc cteefcaetacfc 1506 ccaaccaagg ttgtctccac fcacccaaaac gtcgctaagc caaetaccgg ttcttccaag 1560 aGtaeeaagg acgttgtccs aácfefcctgct ggttcetctg a&gctaagga ctctgcfcççã, 1620 ttgcaaaagg ctaaeateaa gçaeaccaac gacggtcaca cccaatccca aaacaacaag 1630 sscactcaag aaaaeaagge fc&agtcfctaa 1710
<210> 36 <211> 1710 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 36 180 acggctgaag aaactggtgcr taecaacacfc gaagçfccaac eaaagacega agctgtegct 65 tccccaacca ctacctefcga aaaggçccca gaaactaagc e&gttgctaa çgctgcctcc 125 gtttctaaca aggaagtçga agctceaacc fcecgaaacta aggaagetaa ggaagttaag 180 gaagtcaagg etecaaagga aa«àâgfaa gtcaagccag ctgctaaggç taccaacaac 240 acttacccaa ttttgaacca agaaetgaga gaagctatta agaacccagc catcaaggac 300 aaggaccact ccgctccaaa ctctagacca atcgacfctcg saatgaagaa gaaggacggt 360 acccaacãat tctaccãcta egcgtcctct gtcaagceag cfcagagttafc tttcaccgac 420 tctaagccag aaatcgaatt gggtctgcaa tccggccaaK tctggagaaa gtccgaagtc 480 fcacgaaggtg acaagaagtt gecaattaag ttggtUcet acgacaccgt caaggaçtac 540 getsaeateâ gafctÇECçgfc ttçtaacggt actaaggctg fccaagattgt ctcttccacc 600 cacttcaaca acaaggaaga aaagtacgac tacactctga tggaactegc tcaaecaatt 660 fcacaáctctg ctgaçaagKt caagacegaa gaagacfcaca aggctgaaaa gttgttggct 720 ecafc&e&aga aggctaagac fcttggaaaga caagttCaeg aattgsacaa gatccaagac 780 aagttgccag aaaagttgaa ggctgaaiae aagasgaagt t.ggaagacâc caagaaggct 840 ttggacgaac aagtcaagtc cgctatcacc gaaEEcçaaa acgttcaace aaccaaegaa 900 aagatgactg act tgcaaga cactaagtac, gtcgtctacg aatcegtcga aaacaacgaa 960 tccatgatgg aeaeectcgc ta^gcaccca attaagactg gçatgttgaa cggtaaga&g 1020 tacatggtc* fcgga&accac caacgacgac tactggaagg acttcatggt tgaaggtcaa 1080 agagtcagaa ccatefcccaa ggacgctaag aacaacacta gaaccatcat ccccccatac 1140 gttgaaggca agactttgta cgacgctatc gtcaaggttc acgccaagac tactgactâc 1200 gacggtcaat aecacgttag aattgfetgac aaggaagctt tcaccaaggc taacaccgâc 1260 aagtccaaca agaaggaaca acaagacaac fcccgctaaga aggaagctac cccagctacc 1320 ccatctaagc caaccccate tccagttgaa aaggaatctc aaaageaaga ctcccaaaag 1380 gacgacaaca agcaatfcgcc atccgtcgaa aaggaaaacg acgcgtcttc tgaatccggt 1440 aagggtgtta ccctggctac caagceaacfc aagggtgaag ttgaatcttc ctctactact 1500 ccaaccaagg tfcgtctccac fcacccaaaae gtcgctaagc caacfcaccgg ttettccaag 1560 actaccaagg acgttgtcca aacttetget ggttcctctg aagctaagga ctctgctcca i$20 ttgcaaasgg ctaacetcaa gcacaccaac gacggtcaca eceaateçca aaacaacaag 1680 aacaetçaag aaaacaaggç taagtefctaa - 1710
<210> 37 <211> 1710 <212> ADN <213> Sequência Artificial <220> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 37 181 atçgctgaag aaactggtgg taccaacacc gaagetcaac caaagaçcga agctgtcgct €0 tcceeaacea ctacctctga aaaggctcca gaaactaagc cagttgctaa cgctgtctcc 120 gtttxctaaca aggaagtcga agctccaacc toegaaaeta aggaagctaa ggaagctaag ISO gaagtcaagg ctccaaagga aactaaggaa gtcaagccag ctgctaaggc taccaacaac 240 acttacceaa ttttgaacca agaattgaga gaagctatta agaaeccagc tatcaaggac 300 aaggaccact ccgctccaaa etctagacca atcgactfceg aaatgaagaa gaaggacggt 360 acccaacaat tctaceacta cgcgtcctct gtcaagccag ctagagttat tfcteaecgac 420 tctaagccag aaatcgaatt gggtttgcaa tccggtcaat tcfcggagaaa gttcgaagtc 480 tacgaaggtg acaagaagfct gccaattaag ttggtttcct acgacaccgt caaggactac 540 gettàcatca gaetctccgfc ttctaacggt actaaggctg fccaagafctgt cfccttccaec 600 cacttcaaca ãcaaggaagâ aaagtacgac tacacttcga tggaatccgc tcaaccaatt 660 tacaactctg ctgãcaagtt caagaccgaa gaagactacá aggctgaaaa gttgttggct 720 ccatacaãga aggctaagac tttggaaaga çããgtttãçg aaetgaacáã gatccaagac 760 aagttgccag aaaagttgaa ggctgaatae aagaagaagt tggeagacae caagaaggct 840 tcggacgaac aagtcaagtc cgctatcace gaattccaaa acgtteaacc aactaacgaa 900 aagatgactg aettgcaaga eactaagcac gccgtecacg aacecgçcga aaacaacgaa $60 tccafcgatgg acaccttcgt feaagcaccca attaagactg gtatgttgaa cggtaagaag 1020 tacatggtca tggaaaccaç fcaacgacgac tactggaagg acttcatggt tgaaggtcaa 1080 agagtcagaa ccatctccaa ggaegetaag aacaacacta gaaccat fcat cttcccatac 1140 gtfcgaaggta agactttgta cgacgctatc gtcaaggttc acgtcaagac tattgsctae 1200 gacggteaat acçacgttag aattgttg&c aaggaagct t tçaccaaggc taacaccgac 1260 aagtccaaca agaaggaaca aeaagacaae fcetgctaaga aggaagctae cccagctacc 1320 ccatctaagc caaccccatc tceagttgaa aaggaatctc aaaagçaaga çtcccaaaag 1380 gacgaeaacâ agcaattgcc atccgtcgaa aaggaaaacg acgcgtcttc tgaatceggt 1440 aagggcgtfca ctttggctac eaagccaacfc aagggtgaag ttgaatcttc ctctactact 1500 ecaaecaagg ttgtctccac tacccaaaac gtcgctaagc caaccaccgg cecttccaag 1560 actaccaagg acgttgtcca aaçttctgct ggttcctctg aagctaagga ctctgctcca 1620 ttgcaaaagg ctaacatçaa gçacaccaac gacggteaca cccaatccca aaecaacaag 1600 aacactcaag aaaacaaggc taagtcfctaa 1710
<210> 38 <211> 1710 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 38 182 atggcfcgaag aaactggtgg taccaacact gaagctcasc caaagaccga agctgtcgct 60 tccccaacca cfcacctctga aaaggctcca. gaaactaagc cagctgctaa cgctgtctcc 120 gtttcfcaaca aggaagtcga agctççaacc tcegaaacta aggaagctaa ggaagtfcaag ISO gaagtca&gg ctccaaagga aactaaggaa gtcaagccag ctgctatggc caccaacaac 240 acttacecaa ttttgaacca agaattgaçta gaagctatta agsacccagc tatcaaggac 300 aaggaccact ccgçtccâââ ctctagacça atcgacttcg aaafegaagaa gaaggacggt 360 aeccaaçsat tctaccacta çgcgtxctcfc gtcaagccag ctagagctac tttcaccgac 420 fcctaagçcag aaatcgaatt gggtttgcaa tccggtcaat tctggagaaa gttcgaagtc 400 tacgaaggtg acaagaagtt gccaattaag ttggtttcct acgacacegt caaggacfcac 540 gcttâeatca gattctccgt ttetaacggt actaaggçtg tcaagattgt ctcttecacc 600 eacttcaaca aeaaffaaga aaagtacg&c tacactttga tggaattcgc tcaaccaatt 660 fcacaactctg ctgacaagtt caagacegaa gaagaçfcaca aggctgaaaa gtcgttggct 220 ccatacaaga aggctaagac tttggaaaga caagtttacg aattgaagaa gatccaagac 780 aagttgeeag aaaagfctgaa ggctgaatac aagaagaagt tggaagacac caagaaggct 840 ttggacgaac aagtcaagcc cgctaccacc gaatxccaaa aegtteaaec aactaacgaa 90O aag&tgactg acfcfcgcaaga cacfcaagtae gtegtctacg aatccgtcga aaacaacgaa 960 tccatgatgg acaccttcgt taagcaccca «tfeaagactg gtatgttgaa cggtaagaag 1020 taeatggtea t-ggaaaccac taãcgacgac fcaccggaagg actteatggt tgaaggfceaa 1080 agagteagaa ccatctccsa ggacgctaag aaeaaeacta gaaccattat ctfccceatae 1140 gttgaaggta agactttgta cgacgctatc gccaaggttc acgceaagae fcattgactac 1200 gacggtcaat accacgttag aattgttgac a&ggaagctt ccaccaaggc taacagggae 1260 aagtccaaca agaaggaaca acsagacaac tctgctaaga aggaagctac cccagctacc 1320 ccatctaagc caaccccaCc tccagctgaa aaggaafcctc aaaageaaga ctcccaaaag 1380 gacgacaaca ageaattgcc atccgtcgaa aaggaaaacg acgcgtefcte tgaatecggt 1440 aagggtgtca ctttagctac caagccaact aagggtgaag ttgaatçttc ctctacfcact 1500 ccaaccaagg ttgtctccãc oaeeeaaaac gtcgctaagc caactaccgg ttcttccaag 1560 actaccasgg aegttgtccá aacttctgct ggtfccctxtg aagctaagga ctcegçtcca 1620 ttgeaaaagg ctaacatcaa gcacaccaac gacggteaca cecaatccca aaacaacaag 1680 aacactesag aaaacaaggc taagtcttaa 1710
<210> 39 <211> 1710 <212> ADN <213> Sequência Artificial <220> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 39 183 acggctgaag aaactggtgg taccaacact gaãgetcaac caaagaccga agctgtegct 60 tccccaacca ctacecctga aaaggctcca gaaactaagc cagçtgctaa çgctgtctce 120 gtctctaaca aggaagçcga agctccaacc tccgaaacta aggaagctaa ggaagctáag 180 gaagtcaagg ctccaaagga aactaaggaa gtcaagccag ctgctaaggc taccaacaac 240 scctacccaa ttctgaacca agaatfcgaga gaagçtatta agaacccagc tatcaaggae 300 aaggàccact eegetxcaaa ctctagaeca atcgactteg aaatgaagaa gaaggacggt 360 agçcaacaat tctaccaeta cgcgtcctct gçeaagceag ctagagfcfcat ttceaccgac 420 tctaagccag aaatcgaatt gggtttgcaa tccggtcaat tctggagaaa gttcgaagtc 480 tacg&ãggtg acaagaagtfc gccaafctaag ttggtttcct acgacaccgt caaggactac 548 gcttacatca gattctccgt ttctaacggt actaaggctg tcaagattgt ctcttecacc 600 cacttcaaca acaaggaaga aaagtacgac tacactttga cggaattcgc tcaaccaatt 660 tacaaçtçfcg ctgacaagtt çaagaccgaa gasgactaca aggctgaaaa gttgttggct 720 cca^acaaga aggctaagac tttggaaaga caagttfcacg aattgaacaa gatccaagac 780 aagttgecag aaaagttgaa ggctgaafcac aagaagaagt tggaagacac caagaaggct 840 ttggaceaae aagtcaagtc cgetateacc gsaçtccaaa acgttcaacc aaetascgaa SOO aagatgãcSg acttgcaaga caccaagtac gtcgtetaeg aatcegfccga aaaeaacgaa 960 tccatgâEgg acaccttegt taagcaccca attaagactg gtatgtCgaa cggtaagaag 1020 tacatggtca tggaaaccac taacgacgac tactggaagg acttcacggt tgaaggfccaa 1080 sgagccagaa ceatctecaa ggacgctaag aacaaeacta gasccaCtat cttcccatac 1140 gttgaaggta agacfcttgta cgacgctate gtcaaggttc acgtcaagae tattgactac 1200, gacggtcaat «ccacgttag aattgttgac aaggaagctt tcaccaagge taacacegac 1260 aagtccaaca agasggaaca acaagacaac fcctgctaaga aggaagefcac cccagctacc 1320 ccatctaagc caaceeeatc tcçagfctgaa aaggaatctc aaaagcaaga ctcccaaaag 1380 gaçgaçaaca agcaattgcc atccgtcgaa aaggaaaacg acgcgtcttc tgaatçcggt 1440 aagggtgtca ctttggctac caagccaaçt aagggtgaag ttgaatcttc ctetactact 1500 ccaaccaagg ttgtctccae taeccaaaac gtegctaage caactaccgg cfccttccaag 1560 aetaecaagg acgttgtçca aacttctgct ggtfccctctg aagetasggra ctctgcfccca 1620 ttgmmagg etascatcaa gcacaccaac gacggtcaca cccaatccea aaacaacaag 1680 aacacteaag aaaacaaggc caagtcttaa 1710
<210> 40 <211> 1710 <212> ADN <213> Sequência Artificial <220> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 40 184 atggctgaag aaactggtgg taccaaeact gaagctcaae caaagaccga agctgtcgct $0 eccccaacca ctaeetcega aaaggctcca gaaactaagc cagfctgctaa cgctgtcccc 120 gtttctaaca aggaagfccga agctccaacc tecgaaacta aggaagctaa ggaagttaag ISO gaagtcaagg eteeaaagga aactaaggaa gtcaageeag ctgccaaggc taccaacaac 240 acttacccaa ttttgaacea agaattgaga gaagctatta agaacccagc taccaaggac 300 aaggaccact ccgcteeaaa ctctagacca atcgacttog aaatgaagaa gaaggacggt 300 acecaacaat fcctaccacta egcgtccfcefc gtcaagceag ctagagttat fcfctcaecgac 420 tefcaageeag aaetcgaatt gggtttgcaa tecggtcaat tctggagaaa gfctcgaagtc 480 tacgaaggtg acâagaagtt gçcaatt&ag ttggtttect acgaçaccgt caaggaçtaç 540 gcttacatca gatxctccgt ttctaacggfc actaaggctg tcaagattgfc ctcttccacc 800 cacttcaaea acaaggaaga aaagtacgae tacacfctrfcga tggaattcgc tcaaccaatt 860 tacaaetctg ctgacaagtt caagaccgaa gâagaet&câ aggetgaaaa gttgtcggct 720 ecatacaaga aggctâagac tttggaaaga caagtttacg aattgaacaa gatceaagae 780 aagttgecag aaaagfctgaa ggctgaatac aagaagaagt tggaagacac caagaaggct 840 ttggacgaae aagteaagtc ogctatcacc gaattccaaa acgttcaacc aactaaegaa 800 aagatgactg acttgcaaga cactaagtac gtcgtct&cg aacccgtcga aaacaacgaa 880 tccatgatgg acaccctcgt taagcaccc» attaagactg gtatgttgaa cggtaagaag 1020 çacatggtca tggaaaccac taacgacgac tactggaagg acctcatggt tgaaggtcaa 1080 agagtcagaa ecatctccaa ggacgetaag aacaacacta gaaccattat cttcccatac 1140 gttgaaggta agactttgta egaegetafcc íjfceaaggfcte acgtcaagac tattgactac 1200 gaeggtcaat accacgttag aattgttgac aaggaagctt tcaccaaggc taacaccgac 1260 aagtceaaca agaaggaaca acaagaeaac tcfcgce-aaga aggaagctac cccagctacc 1320 ccaçctaagc caaccccatc tccagtfcgaa aaggaatctc aaaagcaaga ctcccaaaag 1380 gacgacâaca agcaattgce atcegtxgaa aaggaaaaeg acgcgtette tgaatccggt 1440 aagggtgtta ctttagetae caagccaact aagggtgaag ttgaacctte ctctactact 1500 ccaaccaagg ttgtccecac taeccaaaac gtcgccaagc caactaccgg tfccttecaag 1580 actaccaagg acgttgteca aacfctecgct ggttcctctg aagctaagga ctefcgcfccca 1820 tcgcaaaagg ctaacatcaa gcacaçcaac gacggtcaca cccaatceea aaacaacáag 1680 aaeactcaag aaaacaaggc taagtctcaa 1710
<210> 41 <211> 1710 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 41 185 etggctgáag aaacfcggtgg taccaacact gaagcfccaac caaagaccga agctgtcgct €0 fcecccaacca cfcãccfcctga áâaggcfccca gaaactáagc cagttgetaa cgctgtcecc 120’ gtttctaaea aggaagtcga agctccaaec tccgaaacta aggaagctaa ggaagttaag 180 gaagtcaagg ctccaaagga aactaaggaa gtcaagccag ctgctaaggc taCGâacáâc 240 acttaççcaa ttttgaacca agaattgaga gaagctatta agaacccagc tafccaaggac 300 aaggaccact cçgctccaaa ctctagaçça atcgaettcg éaatgaagaa. gaaggacggt 360 acccaacaat tctaccaçta cgcgfccctet gtcaagccag etagagttat fcfcfccaccgac 420 tctaagçcag aaatcgaatt gggtttgçaa tccggtcaat tctggagaaa g&tcgaagtc 480 tacgaaggfcg acaagaagtt gccaattaag ttggtttcct acgacaccgt sâaggactac 540 ggfetacafeca gattcfcecgt ttetaacggt actaaggctg tcaagattgt ctcttccacc 800 cactr.caaca acaaggaaga aaagtacgac tacactttga cggaattcgc tcaaccaace 660 taeaactctg otgacaagte «aasaccgas gaagactaea agggtgaaaa gttgttggct 720 ccâtacaaga âggcGâagac tctggaaaga caagtttacg aattgaacaa gatccaagac 780 aãgtcgccâg-áaâagttgaa gfctgsatac aaga&g*agt fcggaagâsac caagoaggcfc 840 ttggecgaee aagtcaagtc cgetafccacc gaattee&aa. acgttca&cc aacta&cg&a 900 aagatgactg acfctgcaaga cactaagcac gtegfcetaeg aatccgtcga aaacaacgaa 960 tcoatgatgg acáCCttcgt tãâgcaccça attaagactg ftatgttgaa cggtaagaag 1020 tacatggtca tgg&aaecae taacgacgac tactggaagg acttcatggt tgaaggtcaa 1080 agagccagaa ocatctceaa ggaccjetaag âacaacacta ga&ccattat cttcccatac 1140 gètgaággta agaçtttgta cgacgctate gtcaaggfctc acgtcaagac fcattgactac 1200 gacggtcaaC accacgttag aâttgttgac aaggaagctt tcaccaaggc taacaccgac 1280 âagtccaaca agaaggaaca acaagscãac tctgcfc&aga aggaagçtac cccagctacc 1320 ccatctaagc caaccccatc tccagttgaa aaggaatctc aaaageaaga ececcaaaag 1380 gacgacaaca agcaattgcc acccgtcgaa aaggaaaacg acgcgtcttc tgaatccggt 1440 aagggçgtfca ctttggctac caagccaacc áagggtgaag tegaatcfcfcc ccctactact 1500 ccaaccaagg tfegftetccec tacccaaaac gtcgcta&gc caactaccgg ctcttccaag 1550 actacc&agg acgttgtcea aacttctgct ggttcctctg aagctaagga çtctgcteca 1620 ttgcaaaagg ctaacatcaa geacaccaac gacggtcaca cccaatccca aaacaacaag 1680 â&cactcaag aaaâcaaggc taagtcttea 1710
<210> 42 <211> 481 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657nl + <400> 42
Glu Ala Glu Pro Lys Thr 15 «et Ala Glu Glu Thr Gly Gly Thr Asn Thr 1 5 10 186
Glu Ala Val Ala Ser Pro Thr Thr 20 Lys Pro Val Ala A$n Ala Val Ser 35 - 40 Pro Thr Ser Glu Thr Lys Glu Ala 50 55 Pro Lys Glu Thr Lys Glu Val Lys «5 70 Thr Tyr Pro ile Leu Asn Gin Glu 85 Ala Ile Lys Asp Lys Asp His Ser 100 Ffce Glu Met Lys Lys Lys ASp Gly 115 120 Ser Ser Val Lys Pro Ala Ar g Val 130 135 lie Glu Leu Gly Leu Gin Ser Gly 145 ISO Tyr Glu Gly Asp Lys Lys Leu Pro 165 Val Lys Asp Tyr Ala tyr Ile Arg 180 Ala Val Lys Ile Val Ser Ser Thr 195 200 Tyr Asp Tyr Thr Leu Met Glu Phe 210 215 Asp Lys Phe Lys Thr Glu Glu Asp 225 230 Pro Tyr Lys Lys Ala Lys Thr Lau 245 Lys Xis Gin Asp Lys Leu Pro Glu 260 Lys Leu Glu Asp Thr Lys Lys Ala 275 280 Ile Thr Glu Phe Gin Asn Val Gin 290 205 Leu. Gin Asp Thr Lys Tyr Vai val 305 310 Ser «et «et Asp Thr Phe Val Lys 325 Asn Gly Lys Lys Tyr «et vai «et 340 Lys Asp Phe «et Val Glu Gly Gin 355 360 Ala Lys Asn Asn Thr Aro Thr lie 370 375 Thr Leu Tyr Asp Ala Ile Val Lys 305 390 Asp Gly Gin Tyr His val Arg lia 405 Ala Asn Thr Asp Lys Ser Asn Lys 420 Lys Lys Glu Ala Thr Pro Ala Thr 435 440
Thr 25 Ser Glu Lys Ala Pro 30 Glu Thr val Ser Asn Lys Glu 45 Val Glu Ala Lys Glu Val Lys 60 Glu val Lys Ala Pro Ala Ala 75 Lys Ala Thr Asn Asn 80 Leu Arg 90 Glu Ala Ile Lys Asn fS Pro Ala 105 Pro Asn Ser Arg Pro Π0 lie Asp Thr Gin Gin Phe Tyr 125 HÍS Tyr Ala Ile Phe Thr Asp 140 Ser Lys Pro Glu Gin Phe Trp 155 Arg Lys Phe Glu Val 160 ile Lys 170 Leu Val Ser Tyr Asp 175 Thr Phe 1®§ Ser Val Ser Asn Gly 190 Thr Lys HiS phe Asn Asn Lys 205 Glu Glu Lys Ala Gin Pro· Ile 220 Tyr Asn Ser Ala Tyr Lys Ala 235 Glu Lys Leu Leu Ala 240 Glu Arg 250 Gin Val Tyr Glu Leu 255 Asn Lys 265 Leu Lys Ala Glu Tyr 270 Lys Lys Leu Asp Glu Gin Val 285 Lys Ser Ala Pro Thr Asn Glu 300 Lys «et Thr Asp Tyr Glu Ser 315 Val Glu Asn Asn Glu 320 His Pro 330 Ile Lys Thr Gly «et 335 Leu Glu 345 Thr Thr Asn Asp ASp 350 Tyr Trp Arg Val Arg Thr Ile 365 Ser Lys Asp ile Phe Pro Tyr 380 Val Glu Gly Lys Val His Val 395 Lys Thr Ile ASp Tyr 400 Val ASp 410 Lys Glu Ala Phe Thr 415 Lys Lys 425 GlU Gin Gin Asp Asn 430 Ser Ala Pro Ser Lys Pro Thr 445 Pro Ser Pro 187 Vâl Glu iya Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys 450 455 46Ô
Gin Leu Pro Ser Vai Glu trya Glu Asn Asp Ala Ser Ser Glu Ser Gly 46$ 470 475 480
Lys
<210> 43 <211> 1452 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 42 e com optimização de codões para expressão em leveduras <400> 43 atggefcgaag aeactggttgg taeeaacacfc gaagcfceaac caaagaccga agctgfceget 60 tccccaacca ctacctccga aaaggctcçà gaaactaagc cagfctgçtaa cgctgtctcc 120 gtttctaaca aggaagtcga agctccaacc tccgaaacta aggaagctaa ggaagttaag 110 gaa<gteaagg ctecaaegga. aactaaggáâ gtcaagccag ctgctaagge taccaacaac 240 acttacceaa ttttgaacca agaatcgaga gaagccaeta agaaccc&ge catcaaggac 300 aaggaccAct ccgctccaaa cfcctagacca atcgacetcg aaatgaagaa gaaggacggt 360 aeeeaaeaat fcctaçcaçta cgcgtccccc g çc-aagçcag çtagagtfcafc «tçaccgac 420 tctaagccag aaatcgaatt gggtttgcaa tccggccaac tctggagaaa gttcgaagcc 480 tacgaaggtg acaagaagfct gccaattaag tcggtÊtcet acoacaccgfc caaggactâc 540 geccacatca gattetccgt ttctaacggt actaaggctg tcaagattgt ctcttccacc 600 cacfctcaaca acaaggaaga aaagtacgac tacactttga tggaattcgc tcaaccaatt 660 tacaacfcctg ctgacaagtt caagaçcgaa gaagaetaca aggctgaaaa gttgttggct 720 ecatacaaga aggctaagac tttggaaaga caagttcacg aafctgaaçaa gatccaagac 780 aagttgccag aaaagttgaa ggctgaatac aagaagaagt tggaagacac caagaaggcfc 840 ttgp&cgsse aagtçaagtc cgctatcacc gaattccaaa acgttaaacc aactaacgaa 800 aagatgactg acttgcaaga cactaagtac gtcgtctacg aatocgtcga aaacaacgaa 960 tccatgatgg acaccltegt taagcaccca actaagactg gtatgttgaa cggtaagaag 1020 tacatggtca tggaaaccac taacgacgac tactggaagg actfccatggt tgaaggtcaa 1080 agagtcagaa ceatctccaa ggacgctaag aaeaacacta gasecatfcat cttcccatac 1140 gttgaaggta agactttg&a cgacgctatc gtcaaggttc acgtcaagac tattgactac 1200 gacggtcaat accacgtcag aattgttgac aaggaagctt tcaccaaggc taacaccgac 1260 aageecaaca agaaggaaea acaagacaac tctgctaaga ággaagctac cccagccacc 1320 ccatctaagc caaceccatc tccsgttgaa aaggaatctc áââagcaaga ctcccaaaag 1380 gacgacaaca agcaattgcc atccgtcgaa aaggaaaaeg acgcgtctcc tgaacccggt 1440 aagtâaggat ec 1452 <210> 44
<211> 605 <212> PRT <213> ORFO 657nG <400> 44
Met Ala Glu Glu Thr Gly Gly Thr 1 5
Glu Ala Vai Ala Ser Fro Thr. Thr 20
Lys Pr© Vai Ala Aso Ala Vai Ser 35 m
As© Thr Glu Ala Gin. Pr© Lys Thr 10 15
Thr Ser Glu Lys Ala Pro Glu Thr 25 30
Vai Sor Asa Lys Glu. Vai Glu Ala 45 189
Pro Thr Ser Glu Thr Lys Glu Ala 58 55
Pro Lys Glu Thr Lys. Glu Vai Ly$ 65 ?8
Thr Tyr Pro Ile Leu As» Gin Glu 85
Ala lie Lys Asp Lys Asp His Ser 100
Phe Glu Met Lys Lys Lys Asp Gly 115 120
Sex Ser Vai Lys Pro Ala Aro Vai 133 135
lie Glu Leu Gly Leu Gin Sex Gly 145 ISO
Tyr Glu Gly Asp Lys Lys Leu Pro 165
Vai Lys Asp Tyr Ala Tyr Xle Arg 180
Ala vai Lys He vai Ser ser Thr 195 200
Tyr Asp Tyr Thr Leu «efc Glu Phe 210 215'
Asp Lys phe Lys Thr Glu Glu Asp 225 220
Pro tyr Lys Lys Ala Lys Thr Leu 245
Lys lie Gin Asp Lys Leu Pro Glu 260
Lys Leu Glu Asp Thr Lys Lys Ala 275 " 280
Ile Thr Glu Phe Glu Asn Vai Glu 290 295
Leu Gin Asp Thr Lys Tyr Vai Vai 305 310
Ser Met Met Asp Thr Phe Vai Lys 325
Asn .Gly Lys Lys Tyr «et Vai «et 340 Lys Asp phe «et Vai Glu Gly Gl» 355 360 Ala Lys Asn Asp Thr Arg Thr ile 370 375 Thr Leu Tyr Asp Ala Ile Vai Lys 385 398 Asp Gly Gin Tyr His Vai Arg Ile 405 Ala Asn Thr Asp Lys Ser Asn Lys 420 Lys Lys Glu Ala Thr Pro Ala Thr 435 440 Vai Glu Lys Glu Ser Gin Lys Gin 450 455 Glu Leu Pro Ser Vai Glu Lys Glu 465 470
Lys Glu Vai Lys Glu Vai Lys Ala 60
Pro Ala Ala Lys Ala Thr As» Asn 75 80
Leu Arg Glu Ala Xle Lys as» pro 90 95
Ala Pro As» Ser Arg Pro Ile Asp 105 110
Thr Gin Gl» Phe Tyr «is Tyr Ala 135
Ile Phe Thr Asp Ser Lys Pro Glu 140
Gin Phe Trp Arg Lys Phe Glu Vai 155 160 lie Lys Leu vai Ser Tyr Asp Thr 170 175
Phe Ser Vai Ser Asn Gly Thr Lys 185 190
His Phe Asn Asn Lys Glu Glu Lys 205
Ala Gin Pro Ile Tyr Asn Ser Ala 220
Tyr Lys Ala Glu Lys Leu Leu Ala 235 240
Glu Arg Gin Vai Tyr Glu Leu Asn 250 255
Lys Leu Lys Ala Glu Tyr Lys Lys 26S 270
Leu Asp Glu Gl» Vai Lys Ser Ala 28S
Pro Thr Asn Glu Lys «et Thr Asp 300
Tyr Glu Ser Vai Glu Asn As» Glu 315 320
His Pro ile Lys Thr Gly «et Leu 330 335
Glu Thr Thr A$» Asp Asp Tyr Trp 345 350
Arg Vai Arg Thr Xle Ser Lys Asp 365
Ile Phe Pr» Tyr Vai Glu Gly Lys 380
Vai Mis Vai Lys Thr Xle Asp Tyr 395 400
Vai Asp Lys Glu Ala Phe Thr Lys 410 415
Lys Glu Gin Gin Asp Asn Ser Ala 425 430
Pro Ser Lys Pro thr Pro Ser Pro 445
Asp Ser Gl» Lys Asp Asp Asn Lys 460
Asn Asp Ala Ser Ser Glu Ser Gly 475 480 190 &YS A»p Lys Thr Pr© Ala Thr Lys Pr© Thr Lys Gly Glu Vai Glu Ser 485 490 495 Ser Ser Thr Thr Pr© Thr Lys Vai Vai Ser Thr Thr Gin Asn Vai Ala 500 505 51Ô Lyã Pr© Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Vai Vai Gin Thr 515 520 525 ' Ser Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala Pr© Leu Gin Lys Ala 530 535 540 Asn lie Lys as» Thr As» Asp Gly His Thr <Sln Ser Gin Asn Asn Lya 545 550 555 sm As» Thr Gin Glti Asm Lys Ala Lys Ser Leu Pr© Gin Thr Gly Glu Glu $65 5?0 575 Ser As» Lys Asp «et Thr Leu Pr© Leu Hat Ala Leu Leu Ala Leu Ser S85. SSO Ser Ile Vai 'Ala Fhe Vai Leu Pr© Arg Lys Arg Lys Asm 595 $00 605
<210> 45 <211> 1818 <212> ADN <213> Sequência Artificial <220> <223> Codifica a SEQ ID NO: 44 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 45 191 stggctgaag aaactggtgg taceaacacfc gaageccaae casagacega «gctgtcgct 60 tceccaaoca etacctctga. aaaggctccá gaaactaagc cagtcgçtaa cgctgtctcc 120 gcttctaaca aggaagtcga agcteeaacc iceyaaacta aggaagctaa. ggaagtcaag ISO gaagtcaagg ctccaaagga aactaaggaa gtcaagccag eÇgçtaaggç çaccaacaac 240 acttacccaa ttttgâacca agaattgaga gaagctatta agaaçccagc tatcãaggac 300 aaggaccact ccgctccaaa ctctagacea ategactfccg aaatgaagaa gaaggacggt; 360 âCCCáacaat tctaccacta egcgtcetet gtcaagccag ctagagttat tttcaccgac 420 tctaagccag aaatcgaatt gggtttgcaa tceggfccaat tctggagaaa gtccgaagtc 400 tacgaaggtg acaagaagtt gccaattaag titggtttcct; acgacaccgt caaggaetac 540 gcttacatca gatfcctccgt ttctaacggfc accaaggctg tcaagattgt ctcttccaec 600 cacttcaaca acaaggaaga aaagfc&cgac tacacfcttga tggaattegc tcaaccaatt 660 tacaactctg ctgacaagtc caagaecgaa gaagactaca aggctgaaaa gttgtfcggct 220 ccatacaaga aggctsagac tttggaaaga ca&gtttacg aattgaacaa gatccaagae 700 aagttgççag aaaagttgaa ggefcgaatae aagaagaagt tggasgacac caagaaggcc 840 ttggsega&c aagtcaagtc cgctatcacc gaatteeaaa acgttcaacc aáefcaaegaa 900 aagatgactg «ctegcaaga eaetaagtafi gtcgtctacg âãtccgtcga aâacaacgaa 960 tccaEgatgg açacettegt taageaeeea attaagactg gtatgttgaa cggtaagaag 1020 tacacggtca fcggaaaceac taaegacgac tagtggaagg acfcteatggfc tgaaggtcaa 1080 agagccagaa ecatccccaa ggacgctaag aac&acâçta gaaccattat sttcccatac 1140 gççgaagfts agactfctgta cgacgccatc gtcasggttc aegfccaagac tattgactae 1200 gacggtçaat accacgttag aactgtcgac aaggaagcct tcaccaaggc taac&cegae 1260 aagtccaaca agaaggaaea acaagacaac tctgctaaga aggaagctac cceâgctaec 1320 ccatqfcaagc caacccçatc tccagtcgaa aaggaatce c aasageaaga ctccéáaaag 1380 gacgacaaca agcaattgcc atcçgtcgaa aaggaaaacg acgcgtctiie cgaatccggt 1440 aaggacaaga ccccagctac caagccaact aagggtgaag ttgaatcttc cEctactact 1500 ecaaccaagg ttgtctccac tacccaaaac gtcgctaagc caaccaccgc cccctccaag 1560 aetaeeaagg acgttgtcea aacfetctgcc ggttectctg aagctaagga ccccgcecca 1620 tegcaaaagg ctaacatcaa gaacaccaac gacggecaca çccaatccca aaacaaeaag 1680 aacactcaag aaaacaaggc taagtcttug ccacaaacçg gtgaagaatc caacaaggac 1740 atgaccttgc categatgge tttgttggct ttgtcttcca fccgttgcttfc çgcctfcgcea 1800 agaaagagaa agaactaâ 1818
<210> 46 <211> 1710 <212> ADN <213> Sequência Artificial <220> <223> Codifica a SEQ ID NO: 17 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 46 192 atggctgaag aaactggtgg taeeâacaçt gaagctcaac caasgaccga agctttggct £0 txcccaacca ctàccectga aaaggctcea gaaacfcaagc câgttgctaa egctgtcfcce 120 gtttctaaca aggaagtcga agccccaacc tccgaaacta aggaagctaa ggaagttaag ISO gaagteaagg ctecaaagga aactaaggçt gteaagccag ctgcçaagge tgacaacaac 240 acttacccaa ttttgaacca agaattgaga gaagctatta agaaçetagc eatcaaggac 300 aaggacoaefc ecgctcc&aa ccctagacca atcgacttcg aaatgaagaa ggaaaacggt 360 gaacaacaat tctaccacta egcgtcctct gtcaagceag ctagagfctafc fettcaccgac 420 tctaagccag aaatcgaatt gggtttgcaa tccggtcaat tctggag&aa gttegaagfcc 480 cacgaaggtg acaagaagtt gccaattaag etggtttcce acgacaccgt çaaggactac 540 gcttacatca gactctccgt ttgtaacggt actaaggctg tcaaga£tgt ctctfcccacc 600 eacetcaaca acaaggaaga aaagtacgac tacactttga tggaafctcge tcaaccaatt 660 tacaactctg gtgacaagtt caagacegaa gaagactaea aggctgaaaa gttgtcggct 720 ccatacaaga aggetaagac ettggaaaga caagtttacg aatçg&aeaa gafcccaagac 730 asgtfcgecftg ãaaagttgaa ggctgaatac aagaagaagc tggaagacac caagaaggct 840 ttggacgaac aagtcaagtc egctatcacc gaattecaaa acgfctcaacc aactaacçaa 900 sagatgaetg acttgcaaga cactaagfcae gtegtctacg aatccgfecga aaacaacgaa 960 tccatgacgg acaccttcgt taagc&ccca atfcaagactg gtacgttgaacggcmagaag 1020 tacatggtca eggaaaccac taacgacgac feaccggaagg acttcatggfc. tgaaggteaa 1080 agagtcagaa ecatctccaa ggacgctaag aacaacacta gaaccattat cttcccatac 1140 gttgaaggta agactttgtá cgaçggtatc gtcaaggttc acgtcaagac tattgaccae 1200 gacggtcaat accacgttag aatcgttgac aaggaagett tcaccaaggc tascacegac 1260 aagcccaaca agaagçaaca acaagacaae tctgccaaga aggaagctac cccagctacc 1320 ccacetaagc caaccccatc tccagttgaa aaggaatctc aaaagcaaga ctcccaaaag 13S0 gacgacaaca agcaattgcc atccgtcgaa aaggaaaacg acgcgtcttc tgaacccggt 1440 aaggscaaga ctccagctãg caagecagct aagggtgaag ttgaatcctc ccctactaet 1500 ccaaccaagg txgtctccac taeccaaaag gtcgctaagc caactaccgc tfcctfcecaag 1560 sctaccaagg aegttgtcca aaccfcccgct ggttcctctg aagctaagga ctctgctcca 1620 ttgcaaaafi ctaecatca* gaagaccaac gacggtcacã cccaatceca aaacaacaag 1680 aacactcaag asaae&aggc caagtctcaa 1710 <210> 47 <211> 1446 <212> ADN <213> Sequência
Artificial <220> 17 I+, com leveduras e <223> Codifica a região da SEQ ID NO: optimização de codões para expressão em codifica um codão de iniciação da metionina <400> 47 193 atggctgaag aaactgg tgg taceaacset gaagctcaac caaagaccga agctctggct 60 tccccaacca ctaccâctga aaaggctcca gaaactaagc csgttgcfcaa cgctgtefcec 120 gtttxtaaea aggaagt.cga agctccaacc tccgaaâcCã aggaagefcaa ggaagttaag ISO gaagtcaagg ctccaaagga âactaaggct gteaagecag ctgct&mgc tgacaaeaae 240 ãcttacccaa ittcgaacca agaatcgaga gaagctatta agaaccgagc tatcaaggac 300 aaggaecáct eégctccaaa ctctagscca atcgaetteg aaatgaagaa ggaaaacggt 360 gaacaacaat tctaccaeta cgcgcectcfc gtcaagccag ctagagt tat tttcaccgac 420 tctaagccag aaatcgaatt gggtfctgcaa tccggccaat tctggagaaa gttcgaagtc 480 taegaaggtg acasgaagEt gccaattaag tfcggttfcccfc acgacaeegt caaggacfcac 540 gcttaeatca gattctccgt ttctaacggt actaaggctg teaagafctgt ctcttccacc 600 cacttcaaca «caaggáaga aaagtacgac tacactfctga tggaattcgc tcaaccaatt 680 tacaactctg ctgacaagtt caagaccgaa gaagactaca aggctgaaaa gttgtfcggct 720 ççatacaaga aggctaagac ttfcggaaaga eaagt t tacg aattgaacaa gatccaagac 780 aagttgccag saaagtfcgaa ggctgâatáo aagaagaagt tggaagacac caãgaaggçt 840 ttggacgaac aagfccaagte cgctatcacc gaaccccaaa acgtteaacc aactaacgaa 800 aagacgactg acttgeaaga cactaagtac gtcgtctaeg aatecgtçga aaacaacgaa 880 tccatgatgg acacctccgt caageaecea attaagactg gtafcgttgaa cggtaagaag 1020 tãcatggtca fcggaaãccae taacgaegae fcactggaagg acttcatggt tgaaggtcaa 1080 agagteagaa ccaectccas ggacgctaag âSCááçáCfca gáaccattat cttcccatac 1140 gttgaaggta agactttgta cgacgccacc gtcaaggttc acgteaagaç tattgaetaç 1200 gacggtcaat accacgttag aattgtcgac aaggaagctt tcaccaaggc fcaacaecgae 1260 aagtccaaca agaaggaaca aeaagacaaç tçtgctaaga aggaagcfcâc cccagctaec 1320 ccatctaagc caaccccatc tccagttgaa aaggaatccc aaaagcaaga ctcccaaaâg 1380 gaegâcaasa agcaâttgce atccgtcgaa aaggaaaacg acgcgtcttc tgaatccggt 1440 aagtaa 1446
<210> 48 <211> 1341 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a região da SEQ ID NO: 17 I, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina <400> 48 194 afcggccgaag aaaetggtgg taceaacact gaagcteaac caaagaccga agctttggcfe 60 teeccaacca ctaee&ctga aaaggcteca gsaactaagc cagttgctaa cgctgtctcc 120 gfcfctctaacã aggaagtcga agctccaaçc tccgaaacta aggaàgctaa ggaagctaag ISO gaagtcaagg cfcccaaagga aactaaggct gtcaagecag ctgctaaggc tgscaacaac 240 açttâcccaa tfcfctgaacca agaattgaga gaagctatta agaaeeeagc tatcaaggac 300 aaggacsacc ccgctccaaa ctctagacca atçgaçtteg aaacgaagaa ggaaaacggt 360 gaacaacaat tctaceacta çgcgtcctct gtcaagccag ctagagttat tttcaeegac 420 tctaagecag aaatcgaatfc gggtfcfcgcaa fcccggfeea&fc fcctggagaaa gttcgaagtc 4SO tâegaaggtg acaagaagtt gccaattaag fctggcetcct acgacaccgt caaggactac 340 gcttacatca gattctccgt ttcfcaacgge acfcaaggcfeg tcaagattgt ctcttccace 600 cacttcaaca acaaggaaga aaagtacgac tâcaefcfctfa tggaattegc tcasccaaçç 660 fcacsaeeefeg ctgacaagtt caagaccgsa gasgactáca aggctgaaaa gttgttggct 720 óeatacaaga aggccaagac ttfcggaaaga c&sgfctfcacg aattgaaçaa gatccaagsc 780 aagttgccag aaaagttgaa ggctgaatac aagaagaagt tggaagacac caagaaggcc 840 ttggacgaac aagtcaagtc cgct*fce*ce gaaictecaaa acgfctcaace aactaacgaa 800 aagatgaetg acttgcaag* cactaagtac gtcgtctaog aatccgtcga aaacaacgaa 860 tccatgatgg acaccttegt taagcaeeca attaagâctg gtatgttgaa cggtaaga'ag 1020 tacafcggtca tggaáaceac taaçgacgae tactggasgg acttcacggt tgaaggtcaa 1080 agagtcagaa ccatctccaâ ggacgctaag aacaacacta gaaccattat ettcccatac 1140 gttgaaggta agactttgta cgacgctatc gteaaggttc acgt-eaagac tattgactae 1200 gacggtcaat accacgttag aatfcgctgaç aaggaagctC çxaccaaggc taacaccgaç 1260 aagtccaaca agaaggaaca acaagacaac tctgctaaga ággaagetac ccçagctaee 1320 ccatctaagc caaccccata a 1341
<210> 49 <211> 1938 <212> ADN <213> Sequência Artificial <220> <223> Codifica a região ORF0657n de comprimento completo que contém a SEQ ID NO: 17 modificada para conter uma glicina a seguir à metionina do terminal amino e com optimização de codões para expressão em leveduras <400> 49 195 atgggtaaea age&acaaaa ggaattcaag tcttcccact ccatlagaaa gtcttccttg 60 ggcgttgctt etgtcgctac ctccaccttg ttgttgtcga tgtetaaegg cgaagctcaá 120 gctgetgaag aaactggfcgg taccaacsct gaagcceaac eaaagaccga agcttfeggct 180 tscccaacca ctaccactga aaaggctcca gaaactaagc cagttgctaa cgctgtctec 240 gtttcraaea aggaagtcga agctccaacc tccgaaacta aggaagctaa ggaagttaag 300 gaagtcaagg «tccaaagga ááccaaggce gccaagccág etgctaaggc tgacaacaac 360 acfctacccaa fcetfcgaacca agaattgaga gaagctatta agaacecagc tatcaaggac 420 aaggaccact ccgctccaaa ctctagacca atcgacttcg aaatgaagaa ggaaaacggt 480 gaacaacaat tctaccacta cgcgtcctct gtcaagccag ctagagttat tttcaccgac S40 tctaagccag aaatcgaatt gggtttgcaa tccggtcaat tctggagaaa gtfcegaagtc 600 tacgaaggtg acaagaagtt gccaattaag ttggtttccfc acgacaccgt caaggactac 660 gcfctacatca gattctccgt ttctaacggt actaaggctg fccaagattgt ctefctecacc 720 cacttcaaea aeaaggaaga aaagtacgae tacactttga fcggaafctcgc teasccaatt 780 tacaactctg ccgacaagte caagaccgaa gaagaccaca aggctgaaaa gctgttggct 340 ccatacaaga aggctaagac tttggaaaga caagtttacg aattgaacaa gatccaagac 900 aagttgccag aaaagttgaa ggctgaatac aagaagaagt fcggaagacac caagaagget 960 ttggacgaac aagteaagtc cgctatcacc gaattecaaa âcgtfceaace aactaacgas 1020 aagatgactg acttgcaaga cactaagtac gtcgtetacg aatcegtcga aaacaacgaa 1030 tccatgatgg acaccttegt feaagcaccca attaagaçfcg gtatgttgaa cggtaagaag 1140 taeafcggtca tggaaaecac taacgacgac fcactggaagg aefcfccstggt fcgaaggtcaa 1200 agagtcagaa ceatctecaa ggacgctaag aaeaacacta gaaccattac cttcccatac 1260 gtcgaaggta agacectgta cgacgctafcc gtcaaggctc acgtcaagac tactgaceac 1320 gacggtcaat accacgfctag aattgttgac aaggaagctt teaecaaggc fcaacaccgac 1380 aagteeaaea agaaggaacs acaagaeaac tctgctaaga aggaagctac cccagc tacc 1440 ccatctaagc caaccccatc fcccagttgaa aaggaatctc aaaagcaaga ctcccaaaag 1500 gacgacaaca agcaattgec acccgccgaa aaggsaaacg acgcgtcttc tgaatccggt 1560 aaggacaaga ctccagctac caagccagct aagggfcgaag ttgaatctcc ctetactact 1620 ccaaccaagg ttgtctccac tacccaaaac gtcgctaagc caactaccgc ttcttccaag 1660 actaccaagg acgttgfccca aacfctcigct ggttccfcctg aagcfcaagga ctctgctcca 1740 ttgcaaaágg etaaeateaa gaacaccaac gacggtcaca cccaatccca aaacaacaag 1800 aacactcaag aaaaeaagge taagtctttg ccacaaaccg gtgaagastc eaacaaggac 1860 atgacctcgc cattgatggc tttgttggct ttgccctcca tcgttgcttt cgigttçgçga 1920 agaãagagaa agaaccaa 1933
<210> 50 <211> 1710 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 20, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina <400> 50 196 atggctgaag aaacfcggtgg fcaceaacact: gaagctcaac caaagaecga agctgtcgct 60 cccccaacca etacctctga aaaggcçcca gaaactaagç cagttgctaa egcfcgtctcc 120 gtttctaaca aggaagtcga agctccaacc tccgaaacca aggaagctaa ggaagttôag 180 gaagtcaagg ctccaaagga aaccaaggcc gtcaagccag ctactaagge tgacaacaac 240 acxtacccaa ttttgaacca agaatcgaga gaagctatta agaacccagc tatcaaggac 300 aaggaccact ccgctccaaa ctctagacca atcgacttcg aaaugaagaa ggeaaacggt 360 gaacaacaat fcctaccacta cgcgeectct gtcaagccag ctagagttac tctcaccgac 420 tetaagccag aaatcgaatfc gggtttgcaa tccggtcaat tetggegaaa gttcgaagtc 480 cacgaaggtg acaagaagtt gccaatteag ttggtttçct acgacaççgt eaaggact&e 540 gctcacatca gatfcetecgt Keceaaçggt actââggctg tcaa.ga.ttgt ctcteccaec 600 cacttcaaca acaaggaaga aaagtacgac tacactttga tggmttç.gc. fccaaeo&att 660 fcacaactctg ctgacaagtt caagaccgaa gaagactaca aggetgaaaa gttgttggct 720 ccafcacaaga aggctaagac tttggaaaga eaagtttacg aatcgaacaa gatceaagae 780 âsgttgccag aaaacjttgaa ggctgaafcac aagaagaagt tggaagacac caagaaggct 840 ttggacgsac aagteaagtc cgcfcateaec gaafcfcçeaaa acgtecaacc aactaecgaa 300 aagatgactg acttgcaaga cactaagtac gtcgtctacg aatcegtcga aaacaaçgaa 360 fcccatgatgg âcsccttçgt, taagcaccca attaagactg gtafegtfegaa cggtaagaag 1020 t&catggtea tgg<aa.scçat taacgscgac tactggaagg actfecatggt tgaaggteaa 1080 agagfcagaa ccatctecaa ggacgctaag aacaacacta gaaccattat cttcccafcac 1140 gttgaaggta agacfittgfca egacgctatc gtcaaggttc acgtcaagac fcattgacfcac 1200 gacggtcaat accacgtcag aatfcgttgae aaggaagctt tcsccaaggc taacaccgac 1260 aagtscaaca agaaggaaca aeaagacaac tcfcgctaaga aggaagctac cccagctacc 1320 ccstctaagc caaccccatc tccagttgaa aaggaatete aaaagcaaga ctcccaaaag 1380 gacgacaaca agcaattgcc atccgtegaa aaggaaaacg acgcgtcttc tgaatccggt 1440 aaggaeaãga cfcccagctac caagccagct aagggfcgaag tfcgaatcttc ctetactact 1500 eeaseeaagg tegtctccae tacccaaaac gtcgetââgc caacfcaccgc ttcttccaag 1560 actaceaagg acgttgtcca aacttctget ggfctcctctg aagctsagga efcctgctcca 1620 ttgcaaaagg ctaacatcaa g&iàcaccaac gaeggteaca cccaatccca aaaeaacaag 1600 aacactcaag aaaacaaggc taagtcteaa 1710
<210> 51 <211> 1446 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a região da SEQ ID NO: 20 Ι+, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina <400> 51 197 atggetgasg aaactggtgg taccaaeaet gaagctcaac caaagaccga agetgtegct 60 tccccaacca ctacctccga aaaggctcca gããactaagc eagttgctaa cgctgfcctotf 120 gttttctaaea aggaagfcçga agctçcaacc tccgaaacta aggaagctaa ggaagttaas 190 gaagtcaagg ctccaaagga aaccââggct gtcaagccag ctactaaggc r.gacaacaac 240 acttãCCeãã ttctgaacca agaattgaga gaagcfcatta agaacccagc tatcaaggac 360 aaggàçcact ccgctccaaa ctctagaçça atcgacttcg aaatgaagaa ggasaacggt 360 gaacaecãât tetaccaeta cgcgtcetcc gtcaagccag etagagttat tttcaccgag 420 tctâagccag aaatcgaatt gggtttgeaa tccggtcaat tctggagaaa gttcgaagcc 480 tacgaaggtg acaagaagtt gccaattaag ttggtttcct acgacaccgt çããggãctaç 540 gcttacatca gattctccgt ttctaacggt actaaggctg tcaagattgt crcttccace 600 cacttcaaca aeaaggaaga aaagtacgac tacacfcttga tggaattcgc tcaaccaatt 660 tacaactçtg ctgacaagtt caagaccgaa gaagaefcaca aggctgaaaa gttgttgget 720 ccatacaaga aggctaagác tttggrãaaga caagtctacg aattgaacaa gatccaagac 780 aagtfcgeeag aaaagttgaa ggcfcgaatac aagaagaagt tggaagaeac eaagaaggct 840 Cfcggacgaac aagtcaagtc cgctatcacc gaafctccaaa acgfctcaace aactaacgaa 800 aagatgacfcg actfcgcaaga csctaagtac gtcgtctacg aatccgtcga asacaacgaa 960 tecatgatgg acaccttcgt taagcaççca actaagactg gtatgttgaa cggtaagaag 1020 caeafcggtca tggaáaccac tâftcgacgac tactggaagg acttcatggC tgaaggtcaa 1080 agagtcagaâ ecatctee&a ggacgctaag aacaacacta gaaecactat cttcccacac 1140 gttgaaggta agacttfcgta cgacgctatc gtcaaggttc, acgfccaagae tatteactac 1200 gacggfeçaat accacgfctag aattgfctgac aaggaagctt tcaecs&gge fcaacaccgae 1260 aagtccaaca agaaggaaca aeaagacaaç tctgctaaga aggaagctae cccagctacc 1320 ccatctaagc ea&ecccate tccagttgaa aaggaatcfcc aaasgcaaga ctcecaaaaf 1380 gacgacaacà ageaâttgec atccgtcgaa aaggaaaacg acgcgtcttc tgaatccggt 1440 a&gtaa 1446 <210> 52 <211> 1341
<212> ADN <213> Sequência Artificial <22 0> <223> Codifica a região da SEQ ID NO: 20 I, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina <400> 52 198 atggctgaag aaactggfcgg taceaacact gaagctcaac caasgaccga agctgtcgct 6© tccccaacca ctaectctga aaaggctcca g&aactaagc cagctgctaa cgcfcgtetcc 120 gtttctaaca aggaagtcga agctecaacc tccgaaacca aggaagçtaa ggaagttaag ISO gaagtcaags ctecaaagga aactaaggcc gtcaagccag ctactaaggc tgacaacaaç 240 acttacccaa tcttgaacca agaattgaga gaagcfcafcfca agaacccagc tãtcaaggac 300 à&ggaccact ccgefcccaaa etctagacca atçgacttcg aaatgaagaa ggaaaacggt 300 gaacaacaat tctaccacta cgcgtectct gtcaageeiag ctagagttat fcfctcaccgac 420 tctaagecag aaatcgaaxt gggtttgcaa tccggtcaat tctggagaaa gfctegaagte 480 tacgaaggtg acaagaagtt gceaattaag tlggtttcct acgacaccgt caaggaeçaç gctttaeatcã gattctccgt ttctaaeggt acfcaaggefcg tcaagattgt ctcttçeaçc 600 cactteaaca aeaaggaaga aaagcacgac fcacacttfcgs tggaattçgc tcaaecaatt 600 tacaactetg ctgacaagtt eaagaecgaa gaagactaca aggctgaaaa gfcfcgttggct 720 ccatacaaga aggetaagac tttggaaaga caagtfctacg aafcfcgaaeaa gatcc&agac 780 aaffctgccâg aaaagfctgaa ggctgaafcac aagaagaage tggaagacac caagaaggct 840 ttggacgaac aagfccaagtc egctatcacc gaattccaaa acgtccaacc aaccaacgaa 800 aagatgactg acttgcaaga caccaagxac gt-cgccfacg aarçcgtega aaacaacgaa 860 tcçaçgatgg acaccttegt taagcaccça attaagactg gtafcgttgaa cggtaagaag 1020 tacatggtca tggaaaceac taacgacgac tactggaagg acttcatggt tgaaggtcaa 1080 agagxcagaa ceatctccaa ggscgçtaag aacaacacta gaaccattat cttcccatac 1140 gttgaaggta agactttgta cgacgctatc gteasgg&tc acgtcaagac tattgactac 1200 gacggtcaat accaegttag aattgttgac aaggaagctt tcaccaaggc taaeaccgac 1260 aagtccaaca agaaggaacâ acaagacaac tccgctaaga aggaagc rac cccagcfcacc 1320 ccatctaagc çaaccccafca a 1341
<210> 53 <211> 1938 <212> ADN <213> Sequência Artificial <220> <223> Codifica ORF0657n de comprimento completo que contém SEQ ID NO: 20 modificada para conter uma glicina a seguir à metionina do terminal amino e com optimização de codões para expressão em leveduras <400> 53 199 stgggfcááca agcãacaaaa ggaatfceaag tctttccact ccattagaaa gtçttccttg 60 ggtgttgctt ecgtegcfcafc etceaccttg tfcgttgttga tgtctaaçgg tgaagctcaa 120 gctgctgaag aaaccggtgg taccaacact gaagcccaac eaaagaccga agetgtcgct 180 tccccaacça ctacctctga aaaggctccà gaaactaagc eagfcfcgetaa cgccgtctcc 240 gtttetaae* aggaagfccga agçtccaaee tccgaaacfca aggaagctaa ggãagttaag 300 gaagtcaagg ctccaaagga a&etaaggcfc gtcaagccag ctactáággc tgacaacaae 360 . actcacccaa ttttgaaeca agaattgaga gaagetatsa agâacccagc tatcaaggac 420 aaggaceact ccgctceaaa etxtagacca atcgacttcg aaatgaagaa ggaaascggfc 480 gaaeaacaat fectaccacta cgcgtcctct gtcáagecag ctagagttae tttcaccgae 540 cctaagccagr aaatcgaact gggtttgeas tccggtcaat tçfcggagaaa gttcgaagfcc 600 taegaaggtg acaagââgEt gccaattaag ttggtctcct acgaeaccgt çaaggactac 660 gcttacâtca g&tfcetcegt tectaacggt actaaggctg tcaagatfcgfc ctcctccacc 720 cacttcaaca acaaggaaga aaagtacgac tacaccttga tggaattegc fceaaccaafct 780 taeaactctg ctgecaagtt caagaccgas. gaagactaca agfCtgaaaa gttgttggct 840 ccatacaaga aggccaagac cctggaaaga caagcttacg aatcgaaçaa gatccaagac 900 aagttgccag aaasgttgaa ggctgaatac aagaagaagt tggaagacac caagaaggct 960 ttggacgaac aagtcaagcc egetatcaec gaatcçcaaa acgttcaacc aactaacgaa 1020 aagatgactg aettgeaaga çactaagtac gtegfcctacg ããtccgtcga aaacaacgaa 1080 tccatgatgg acaccttcgt taagcaccca attaagactg gtatgttgaa cggtaagaag 1140 Çaç&tggtca tggaaaccac taacgaegac tactggaagg aefctcatggt tgaaggtcaa 1200 agagccagaa ccatctccaa ggaegctaag aacaacacta gaaccattat cttcccatac 1260 gttgaaggta agactttgfca cgacgctatc gfceaaggtfce acgteaagae tattgactac 1320 gacggtcaat seeacgttag aattgttgac aaggaagctt tcaeeaaggc taacaccgac 1380 aaçtccaaca agaaggaaca acaag&caac tctgctaaga aggaagctae eccagctacc 1440 ccatctaagc eaaccceatc tccagttgaa aaggaafccfce aaaagcaaga ctcecaaaag 1500 gacgaeaaca agcaattgcc atccgCcgaa aaggaaâ&eg aegcgfcefctc tgaatccggc 1560 aaggâcaaga ctccagctac caagceagct aagggtgaag ttgaatcetc ccccactact 1620 ecaaccasgg ttgtctccâc tacceaaaac gtcgctaagc caaefcacçgc tEçttccaag 1680 acfcaecaagg acgtfcgteca aacttctgct ggttcctctg aagctaagga çccfegcteea 1740 ttgc&aaagg ctaacaccaa gaacaccaac gacggtcaca cccaatceea aaacaacaag 1800 eacactcasg aaaacasggc taagtctfctg ccacaaaccg gtgaagaatc caacaaggac 1860 catfcgatggc tttgctggct ttgtcttcca tcgttgettt cgtcttgcca 1920 agaaagagaa agaactaa 1938
<210> 54 <211> 565 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657nH <400> 54 200
Ala Glu Glu Thr Gly Gly Thr Asn Thr Glu Ala Gin Pr© Lys Thr Glu 1 5 10 15 Ala Vai Ala Ser Pr© Thr Thr Thr Thr Glu Lys Ala Pr© Glu Ala Lys 20 25 30 Fr© Vai Ala Asa Ala Vai Ser Val'Ser Asn Lys Glu Val Glu Ala Fr© 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Val Lys Ala Pr© Lys Glu Thr 50 55 60 Lys Ala Vai Lys Pr© Ala Ala Lys Ala Asp Asn Asn Thr Tyr Fr© Ile 65 70 75 80 Leu Asa Gin Glu Leu Arg Glu Ala Xle Lys Asn Fr© Alá lie Lys Asp 85 90 95 Lys Asp Bi» Ser Ala Pr© Asn Ser Arg Fr© Ile ASP Phe Glu «et Lys 100 105 110 Lys Glu Asn Gly Glu Glu Gin Phe Tyr His Tyr Ala Ser Ser Val Lys us 120 125 Fr© Ala Arg Vai Ile Phe Thr Asp Ser Lys Fr© Glu Ile Glu Leu Gly 130 135 140 Leu Gin Ser Gly Gin Phe Trp Arg Lys Phe Glu Val Tyr Glu Gly Asp 145 ISO 155 160 Lys Lys Leu Pr© Ile Lys Leu Val Ser Tyr Asp Thr Val Lys ASp Tyr 165 170 175 Ala Tyr lie Arg Phe Ser Val Ser Asn Gly Thr Lys Ala Val Lys ile 180 185 190 Vai Ser Ser Thr Kis Phe Asn Asn Lys Glu Glu Lys Tyr Asp Tyr Thr 195 200 205 • Leu mt Glu Phe Ala Gin Pr© Ile Tyr Asn Ser Ala Asp Lys Phe Lys 210 215 220 Thr GlU Glu ASp Tyr Lys Ala Glu Lys Leu Leu Ala Pr© Tyr Lys Lys 225 230 235 240 Ala Lys Thr Leu Glu Arg Gin val Tyr Glu Leu Asn Lys Ile Gin ASP 245 250 255 Lys Leu Pr© Glu Lys Leu Lya Ala Glu Tyr Lys Lys Lys Leu Glu ASp 260 265 27Ô Thr Lys Lys- Ala Leu Asp Glu Gin Val Lys Ser Ale Ile Thr Glu Phe 275 288 265 Gin As» Vai Gin Pr© Thr Asn 01« Lys Wefc Thr Asp Leu Gin Asp Thr 290 295 300 Lys Tyr Ala Val Tyr Glu Ser Val Glu Asn Asn Glu Ser ttet mt Asp 305 310 315 320 Thr Phe vai Lys Kis Pr© lie Lys Thr eiy Mac Leu Asn Gly Lys Lys 325 330 335 Tyr Mét Vai Met Glu Thr Thr As n Asp ASp Tyr Trp Lys Asp Phe Met 340 345 350 Vai Glu Gly Gl© Arg Val Arg Thr 11© Ser Lys Asp Ala Lys Asn Asn 355 360 365 Thr Arg Thr ile xi© Phe Pr© Tyr Val Glu Gly Lys Thr Leu Tyr Asp 370 375 368 Ala Ile Vai Lys Vai His. Vai Lys Thr lie Asp Tyr Asp Gly Gin Tyx 385 390 395 400 Kis Vai Arg lie Vai Asp Lys Glu Ala Phe Thr Lys Ala Asn Thr Asp 405 410 415 201
Lys Ser Mn Lys Lys Glu Glu Gin Asp Asa Ser Ala Lys Thr Fr© Ala Thr Fr© Ser Lys Fr© Thr Fr© Ser Fr© vai 4 35 440. · 445 Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp ASή Lys Glu 450 455 460 Vai Glu Lys Glu Mn Asp Ala Ser Ser Glu ,Ser Gly Lys 465 470 475 Fre’ Ala Thr Lys Pr© Ala Lys Gly Glu Vai Glu Ser Ser 485 450 Pr© Thr Lys Vai V&l Ser Thr Thr Glu Asn Vai Ala Lys 500 505 Ala Ser Ser Lys Thr Thr Lys Asp Vai Vai Gin Thr Ser 515 520 525 Ser GlU Ala 'Lys Asp Ser Ala Pr© Leu Gin Lys Ala Asn 530 535 540 Thr Asn Asp Gly His Thr Glu Ser Gin As» As» Lys Asn 545 550 555 Asn Lys Ala Lys Ser 565.
Lys Glu Ala 430
Glu Lys Glu
Leu Pr© Ser
Asp Lys Thr
Ser Thr Thr 495
Pr© Thr Thr 510
Ala Ser Ser
He Lys λ«ι
Thr Gin Glu 560
<210> 55 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657nH <400> 55 202
Ala Glu Glu Thr Gly Gly Thr Asn Thr Glu Ala Gin Pr© Lys Thr Glu 1 5 10 IS Ala Vai Ala Ser Fr© Thr Thr Thr Ser Glu Lys Ala Pr© Glu Thr Lys 20 25 30 Pro val Ala Asn Ala Val Ser val Ser Ase Lys Glu Val Glu Ala Pr© 35 40 45 Thr 'Ser Glu Thr Lys Glu Ala Lys Glu Val Lys Glu val Lys Ala Pr© 5Q 55 60 Lys 01« Thr Lys Glu Val Lys Pr© Fkla Ala Lys Ala Thr As© Asn Thr ss 79 75 80 Tyr Fr© Xis Leu Asa Glu Gly Leu Arg Glu Ala Ile Lys Asn Pr© Ala $5 80 95 lie Lys &Sp Lys Asp I-ÍÍ S Ser Ala Pro Asm Ser Arg'Pr© Ile Asp Phe 100 105 110 Glu Met Lys Lys Lys Asp Gly Thr Gin Gin Phe Tyr His Tyr Ala Ser 115 120 125 Ser Val Lys Pro Ala Arg Val Ile Phe Thr ASp Ser Lys Pr© Glu 11® 130 135 140 Glu Leu Gly Leu Sln Ser Gly Glu Ph© Trp Arg Lys Phe Glu Val Tyr 145 150 155 160 Glu Gly Asp Lys Lys Leu Fro ile Lys Leu Vai Ser Tyr ASp Thr Val 165 170 17$ Lys Asp Tyr Ala Tyr ne Arg Phe Ser Val Ser Asa Gly Thr Lys Ala 180 1SS ISO 203
Vai Lys lie Vai Ser Ser Thr Mis Phe Asn Asn Lys Glu Glu Lys Tyr 1« 200 205 Asp ly r Thr Leu «èt Glu Phe Ala Gin Pr© Ila Tyr AS» Ser Ala Asp 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pr© 225 230 235 240 Tyr Lys Lys Ala Lys Thr Leu Glu Arg 01» Val Tyr Glu Leu Asn Lys 245 250 2:55 11a 61» Asp Lys Leu Pr© Glu Lys Leu Lys Ala 61» Tyr Lys Lys Lys 260 265 270 Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin val Lys Pr© Ala lie 275 280 285 Thr 61« Phe 61» AS» Val Gin Pr© Thr Asn Glu Lys Set Thr Asp Leu 250 255 300 61» Asp Thr Lys Tyr val vai tyr Glu Ser Val Glu Asn Aon Glu Ser SOS 310 315 320 mt «et Asp Thr Phe Val Lys Mis Pr© íle Lys Thr Gly Set Leu Asn 325 330 335 Gly Lys Lys Tyr «et val «et Glu Thr Thr As» Asp Asp Tyr Trp Lys 340. 345 350 Asp Phe Hat val Glu Gly Gin Arg Val Arg Thr lie Ser Lys Asp Ala 355 360 365 Lys Asn AS» Thr Arp Thr Ile lie Phe Pr© Tyr Val Glu Gly Lys Thr 370 375 380 Leu Tyr ASp Ala 11® Val Lys Val Mi® val Lys Thr Ile Asp Tyr ASp 3S5 300 395 400 6ly 61» Tyr His Val Arg lie Val Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asa Thr Asp Lys Ser As» Lys Lys Glu Gin 61» Asp Asn Ser Ala Lys 420 425 430 Lys Glu Ale Thr Fr© Ala Thr Pr© Ser Lys Pr© Thr Fr© Ser Fr© val 435 440 445 Glu Lys Glu Ser 61» Lys Gl» Asp Ser 01» Lys Asp Asp AS» Lys Gin 450 455 460 Leu Pro. Ser Val Glu Lys Glu Asn ASp Ala Ser Ser Glu Ser Gly Lys 465 470 475 480 Asp Lys Thr Pro Ala Thr Lys Pr© Thr Lys Gly Glu Val Glu Ser Ser 485 490 495 Ser Thr Thr Pr© Thr Lys Val Val Se r Thr Thr Gin As» Vai Ala Lys SOO 505 510 Pr© 11a Thr Ala Ser Ser Lys Thr Thr Lys ASp val val Gin Thr Ser 515 520 525 Ale Gly ser Ser Glu Ala Lys ASp Ser Ala Pro Leu Gin Lys Ala Asn 530 535 540 He Lys As» Thr Ase Asp Sly His Thr Gin Ser Gin AS» Asn Lys Asn 545 550 555 560 Thf 61» Glu As» Lys Ala Lys Ser 565 204
<210> 56 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <400> 5 6 205
AiS QlU GiU Thr Gly Gly Thr Asn Thr Glu Ala Gin Pro Lys Thr Glu 1 5 10 15 Ala vai Ala Ser Pro Thr Thr Thr Ser Glu Lys Ala Pro Glu Thr Lys 20 25 30 Pro Vai Ala Asn Ala Vai Ser Vai Ser ASn Lys Glu Val Glu Ala Pro 15 40 45. Thr Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Glu Val Lys Ala Pro 5Ô 55 60 Lys Glu Thr Lys Glu Vai Lys Pro Ala Ala Lys Ala Thr Asn Asn Thr «5 i 70 75 80 Tyr Fro ^Ile Leu Asn Gin Glu Leu Arg Glu Ala Ile Lys Asn Pró Glu 85 90 95 Xle Lys Asp Lys ASp His Ser Ala Pro Asn Ser Arg Pro lie ASp Phe 100 105 UO Glu Wet Lys Lys Lys Asp Gly Thr Gin Gin Phe Tyr His Tyr Ala Ser 115 120 125 Ser Vai .Lys Pr» Ala Arg Vai Ile Phe Thr Asp Ser Lys pro Glu ile 130 135 140 Glu leu Gly Leu Gin Ser Gly Gin Fhe Trp Arg Lys Phe Glu Val Tyr 145 ISO 155 160 01u Gly Asp Lys Lys Leu Pro Ile Lys Leu Vai Ser Tyr Asp Thr Vai 155 170 175 lys Asp Tyr Ala Tyx Xle Arg Phe Ser Ile Ser Asn Gly Thr Lys Ala 180 185 190 Vai Lys Ile Vai Ser Ser Thr His Phe Asn Asm Lys Gi« Glu LyS Tyr 195 200 205 Asp Tyr Thr Léu (fet Glu Phe Ala Gin Pro Xle Tyr Asn Ser Ala Asp 21© 215 220 Lys Phe Lys Thr Glu Glu ASp Tyr Lys Ala Glu Lys Leu Leu Ala Pro 225 230 235 240 Tyr Lys Lys Ala Lys Thr Leu Glu Arg GM Val Tyr Glu Leu Asn Lys 245 250 255 lie Gin Asp Lys Leu Pro Glu Lys Léu Lys Ala Glu Tyr Lys Lys Lys 2S0 265 270 Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin val Lys Ser Ala lie 275 280 285 Thr Glu Phe Gin Asn Vai Gin Pro Thr Asn Glu Lys He£ Thr Asp Leu 290 295 300 Gin Asp Thr Lys Tyr Vai Vai Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 310 315 320 Het Hei* Asp Thr fhe Vai Lys MiS Pro lie Lys Thr Gly Met Leu Asn 325 330 335 Gly Lys Lys Tyr Met Vai Mefc Glu Thr Thr Asn Asp ASp Tyr Trp Lys - 340 345 350 Asp Phe Her Vai Glu Gly Gin Arg Vai Arg Thr Xle Ser Lys ASp Ala 355 380 365 Lys Asn As» Thr Axg Thr. tte Ile Phe Pro Tyr Val Glu Gly Lys Thr 370 375 380 Leu Tyr Asp Ala Xle vai Lys Vai His val Lys Thr lie Asp Tyr Asp 385 390 355 400 Gly Gin fyr His Vai Arg lie Vai Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 206
Asa Thr Asp Lys Ser Asa Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Lys Glu Ale Thr Pro Ala Thr Pro Ser Lys Pro Thr Pro Ser Pro Vai 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asm Lys Gin 45 Θ 455 460 Leu Pro Ser vai Glu Lys Glu Mn ASp Ala Ser Ser Glu Ser Gly Lys 465 470 475 430 Asp Lys Thr Pro Ala Thr Lys Pro Ala Lys Gly Glu Vai Glu Ser Ser 485 450 * 495 Ser Thr Thr Pro Thr Lys Vai Vâl Ser Thr Thr Gin Asn Vai Vai Lys 500 505 510 Pro Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Vai Vâl Gin Thr Ser 515 520 525 Ais Gly Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Ly& Ala Asn 530 535 540 lie Lys Asa Thr Aon ASP Gly His Thr Gin Ger Gin Aan Asn Lys ASO 545 550 555 560 Thr Gin Glu Asa Lys Ala Lys Ser 565 <210> 57 <211> 568 <212> PRT <213> Sequência Artificial <220> <223> ORFO 657nH <221> local <222> 247 <223> Desconhecidos <400> 57 207
Ala-Olu Glu Thr Gly Gly Thr Asn Thr Glu Ala Gin Pro Lys Thr Glu 1 5 10 15 Ala Vai Ala Ser Pro Thr Thr Thr Ser Glu Lys Ala Pro Glu Thr Lys 29 25' 30 Pro Vai Ala Asn Ala Vai Pro Vai Ser Asn Lys Glu Vai Glu Ala Pro 35 40 45 Thr Ser Glu Thr Lys Olu Ala Lys Glu Vai Lys Glu Vai Lys Ala Pro SO 55 60 Lys Olu Thr Lys Glu Vai Lys Pr© Ala Ala Lys Ala Thr Asn Asn Thr 65 70 75 30 Tyr Pro fie Leu Asn Gin Glu Leu Ar» Glu Ala Thr Lys Asn Pro Glu 15 50 SS 11® Lys ASp Lys k£p 1ÍS- Ser Ala. Pro Asn Ser Arg Pro Thr ASg Phe 100 105 110 GlU ffet Lys Lys Asn Asp Gly Thr Gin Gin Phe Tyr HiS Tyr Ala Ser 113 120 125 Ser vai Lys Pro Ala Mg Vai 11© Ph© Thr ASp Ser Lys Pro Glu 11© 13 D 133 140 Glu Leu Gly Leu Oln Ser Gly Gin Fhe Trp Ar» Lys Bhe Glu Vai Tyr 145 ISO 155 160 208
Glu Gly ASP Lys Lys Leu pro lie Lys Leu Val Ser Tyr Asp Thr Val 165 170 175 Lys Asp Tyr Ala Tyr He Arg Phe· Ser Ile ser Asn Gly Thr Lys Ala ISO 185 190 Val Lys Ile Vai Ser Ser Thr His phe Asn Asn Lys Glu Glu Lys Tyr 195 200 20S Asp Tyr Thr Leu Ket Glu Phe Ala Gin pro Ile Tyr Asn Ser Ala ASp 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pro 225 230 235 248 Tyr Lys Lys Ala Lys Thr M Glu Arg Glu Val Tyr Glu Leu Asn Lys 245 258 255 11¾ Gin Asp Lys' Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 268 265 270 Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala lie 275 280 285 Thr Glu Phe Gin Asn Vai Qln pro Thr Asn Glu Lys Het Thr Asp Leu 290 295 f 300 Gin ASp Thr Lys Tyr Vai Val Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 m 315 320 Met Wstt Asp Thr Phe Val Lys His Pro Ile Lys Thr Gly Met Leu Asn 325 330 335 eiy Lys Lys Tyr Het Val Het Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Asp Phe Ket Val Glu Gly Gin Arg Val Arg Thr lie Ser Lys Asp Ala 355 360 365 Lys Asn Asn Thr·· Arg Thr Xle Ile Fhe Pro Tyr Val Glu Gly Lys Thr 370 375 380 Leu Tyr Asp Ala Ile Val hys Val His val Lys Thr Ile Asp Tyr Asp 385 350 395 408 Gly Gin Tyr His Val Arg Ile Val Asp Lys Glu Ala Phe Thr Lys Ala 465 410 415 Asn Thr Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 438 425 438 Lys Glu Ala Thr Pro Ala Thr Pro Ser Lys Pro Thr Pro Ser Pro Vai 435 . 440 445 Glu Lys Glu ser Glu Lys Gin Asp Ser Gin Lys Asp ASp Asn Lys Gin * 450 455 460 Leu Fro Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 47S 489 Asp Lys Thr Pro Ala Thr Lys Pro Ala Lys Gly Glu Val Glu Ser Ser 485 490 495 Ser Thr Thr Pro Thr Lys val Val Ser Thr Thr Gin Asn Val Ala Lys 500 505 510 Pro Thr Thr Ala Ser Ser Lys Thr Thr Lys ASp val Val Gin Thr Ser SIS 520 525 Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn 530 535. S40 Leu Leu Lys Thr His Asp Gly- His Thr Gin Ser Gin Asn Ile Lys Asn 545 550 555 560 Thr Lys Lys Asp Lys Ala Lys Ser 565 209
<210> 58 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <400> 58 210
Ma Glu Glu Thr Gly Gly Thr Asm Thr Glu Ala Gin Pr© Lys Thr Glu 1 5 10 15 Ma Vai Ala ser Pro Thr Thr Thr .Ser Glu Lys Ma Pr© Glu Thr Lys 20 25 30 pro Vai Ala ASP Ala Vai Ser Vai Ser Asn Lys Glu Val Glu Ala Pr© 35 40 45 Thr Ser Glu Thr Lys Glu Ma Lys Glu Vai Lys Glu Val Lys Ala Pro 50 55 60 íys Glu Thr Ly» Glu Vai Lys Pr© Ala Ala Lys Ala Thr Asn Asn Thr €5 70 75 80 Tyr Pro Ile ie,u Asn Gin Glu Leu Arg Glu Ala Ile Lys Asn Fr© Ala 35 90 05 Ile Lys ASp Lyâ Asp His Ser Ala' Piro Asn Ser Arg Pr© Ile Asp Phe 100 103 110 01« Met Lys Lys Glu Asa Gly Thr Gin Gin Phe Tyr His Tyr Ala Ser 115 . 120 125 Ser Vai Lys Fr© Ala Arg Vai Ile Phe Thr Asp Ser Lys Pr© Glu Ile 130 135 140 Glu Leu Gly Leu Gin.Ser Gly Glu Phe Trp Arg Lyg Phe Glu Val Tyr 145 150 155 160 Glu m Asp Lys Lys Leu Pr© lie Lys Leu. val ser Tyr ASp Thr Val 165 170 175 Lys Asp Tyr Ala Tyr ile .Arg Phe Ser Vai Ser Asn Gly Thr Lys Ala ISO IBS ISO Vai Lys ile vai Ser.Ser Thr His Phe Asn Asn Ly s Glu Glu Lys Tyr 155 200 205 Asp Tyr Thr Leu Kefe Glu Phe Ala Gin Pro Ile Tyr Asn Ser Ala Asp 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Ly® Ala Glu Lys Leu Leu Ala Pr© 22% 230 233 240 Tyr Lya Lys Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys 245 250 235 He Gin A$P Lys Leu Fr© Glu Lys Léu Lys Ala Glu Tyr Lys Lys Lys 260 26S 270 Leu Glu Âsp Thr Lys Lys Ale Leu Asp Glu Gin Val Lys Ser Ala ile 275 280 285 Thr Glu Phe Gin Asn Vai Gin Pro Thr Asn Glu Lys «et Thr Asp Leu 250 205 300 Glu As p Thr Lys Tyr Vai Vai Tyr Glu Ser Val Glu Asn Asm Glu Ser 305 ' 310 315 320 Her Mer ASp Thr Phe vai Lys His Pro Ile Ly s Thr Gly Met Leu Asn 325 330 333 Gly Lys Lys Tyr Met vai Hat Glu Thr Thr Asn asp Asp Tyr Trp Lys 340 345 350 Asp Phe Met Vai Glu Gly Gin Arg Vai .Arg Thr ile Ser Lys Asp Ala 355 360 r 365 • Lys As® Asa Thr Arg Thr Ile Ile Phe Pr© Tyr Val GlU Gly Lys Thr 370 37S 38© 211
Leu Tyr Asp .Ala Xla Vai Lys Vai Mis Vai Lys Thr Ile ASp Tyr' Asp 3SS 3J0 385 400 Gly Gin Tyr Bis Vai Arg Ile Vai Asp Lys Glu Ala Phe Thr Lys Ala 405 410 41S Asn Thr Asp Lys Ser Mn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Lys Glu Ala Thr Pro Ala Thr Pro Ser Lys Pro Thr Pro Ser Pro Vai 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin 450 455 460 Leu Pro Ser vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 475 480 Asp Lys Thr pro Ala Thr Lys Pro Thr Lys Gly Glu Vai Glu Ser Ser 485 400 4SS Ser Thr Thr Pro Thr Lys vai vai Ser Thr Thr Gin Aãn Vai Ala Lys SOO SOS 510 Pro Th-r· Thr Ala. Ser Ser Lys Thr Thr Lys Asp Vai Vai Gin Thr Ser 515 520 525 Ale Gly Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn 530 535 540 Xle Lys As» Thr· &sn Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn 545 550 555 560 Thr Gin Glu Asn Lys Ala Lys Ser 5 §5
<210> 59 <211> 567 <212> PRT <213> Sequência Artificial <220> <223> ORFO657ηΗ <400> 59 212
Ala Glu Glu Thr' ' Giy Gly Thr Asn Thr Glu Ala Gin Pre Lys Thr Glu 1 s 10 15 Ala val Ala Ser Pro Thr Thr Thr Ser Glu Lys Ala prn Glu Thr Lys 20 25 30 Piro Vai Ala Asn Ala Val Ser Val Ser Asn Lys Glu Vai Glu Ala pro 35 40 45 Thr Sor Glu Thr Lys Glu Ala Lys Glu val Lys Glu val Lys Ala Pro 50 '55 50 Ly& Glu Thr Lys Ala Val Lys Sr© Ala Ala Lys Alã Thr Asn Asn Thr SS 70 75 80 Tyr Pxo Ila Leu Asn Gin Glu Leu Arg Glu Ala lie Lys Asn Pro Ala 85 50 95 lie Lys Asp Lys Asp Kis Ser Ala Pro Asn Ser Arg fro lie Asp Phe 100 105 110 Glu Ktefc Asa Lys Lys Asn GXy Glu Glu Gin Fhe Tyr Kis Tyr Ala Ser 115 120 12$ Ser Ala Ly$ Pr© Ala Arg Val Xle Phe Thr Asp Ser Lys Pr o Glu lie 130 135 140 Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Fhe Glu Val Tyr 145 158 155 ISO 213
Glu Gly Asp Lys Lys Leu Fro Ile Lys Leu val Ser Tyr Asp Thr Val 165 170 175 Lys Asp Tyr Alá Tyr Ile Arg Phe·Ser Vai Ser Asn Gly Thr Lys Ala 189 18$ 190 Vj 1 Lys ile Vai Ser Ser Thr His Phe Asn Asn Lys Glu Glu Lys Aâp 195 29© 295 Tyr Thr Leu Hefc Glu Phe Ala Gin Fro Ile Tyr Asn Ser Ala ASp Lys 219 215 220 Phe Lys Thr Glu Glu ASp Tyr Lys Ala Glu Lys Leu Leu Ala Fro Tyr 22$ 230 235 249 Lys Lys Ala Lys Thr Leu Glu Arg Gin Vai Tyr Glu Leu Asn Lys lie 245 250 255 Gin Asp Lys Leu Pro Glu Lys Leu Lys Àlà Glu Tyr Lys Lys Lys Leu 26© 265 270 Glu Asp Thr Lys Lys Ala Leu Asp Glu Glii Val Lys Ser Ala He Thr 27$ 28© 28$ Glu Phe Gin Asn vai Gin Fro Thr Asn Glu Lys Het Thr Asp Leu Gin 290 29$ 300 Asp Thr Lys Tyr vai Vai Tyr Glu Ser Vai Glu Asn Asn Glu Ser Hat SOS 310 315 32© Met Asp Thr Phe Vai Lys Eis Fro lie Lys Thr Gly Htt Leu Asn Gly 32$ 330 335 Lys Lys Tyr -Jfet vai Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys ASP 340 345 356 Phe Met vai Glu Gly Gin Arg Vai Arg Thr Ile Ser Lys Asp Ala Lys 35$ 36© 365 Asn Asn Thr Arg Thr Ile lie Phe Fro Tyr Val Glu Gly Lys Thr Leu 37© 37$ 389 Tyr Asp Ala. Ile Vai Lys vai His Vai Lys Thr Ile mp Tyr Asp Gly 38$ 390 395 400 Gin Tyr Hís Vai Arg Ile Vai Asp Lys Glu Ala Phe Thr Lys Ala Asn 40$ 410 415 Thr Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser &la Lys Lys 420 425 43© Glu Ala Thr Pro Ala Thr Fro Ser Lys Fro Thr Fro Ser Pro val Glu 435 449 445 Lyâ Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin Leu 450 455 46© Pro Ser val Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser ôiy Lys Asp 485 47© 475 48© Lys Thr Fro Ala Thr Lys Fro Thr Lys m Glu Val Glu Ser Ser Ser 485 499 495 Thr Thr fro Thr Lys Vai Vai Ser Thr Thr Gin Asn Val Ala Lys Fro $00 5 ©5 510 Thr Thr Ala Ser Ser Lys Thr Thr Lys ASp Val Val Gin Thr Ser Ala 515 52Ô $25 Gly Ser Ser Glu Ala Lys Asp Ser Ala Fro Leu Gin Lys Ala Asn lie $30 535 54© Lys A.sn Thr Asm Asp Gly EiS Thr Gin Ser Gin Asn Asn Lys Asn Thr 54$ 550 55$ $60 Gin Glu Asn Lys Ala Lys Ser 56$ 214
<210> 60 <211> 576 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <400> 60 215
Ala Glu Glu Thr Gly Vai Thr Asn Thr Glu Ai a Gin Pro Lys Thr Glu l 5 10 15 Ala vai Ala Ser Fro Thr Thr Thr Thr Thr Glu Lys Ala Pro Glu Ala 20 25 30 Lys Pro Val Ala Lys Fro Vai Ala Asn Ala val Ser Val Ser Asn Lys 15 49 45 Glu. Vai Vai. Ala Pro Thr Thr Glu Thr Lys Glu Ala Lys Glu Val Lys 59 55 60 Ala Vai Lys Glu Vai Lys Ala Pro Lys GlU Ala Lys Glu Glu. Lys Pro €5 70 75 80 Ala Ala Lys Ala ASp Asn Asn Thr Tyr Fro lie Leu Asn Gin Glu Leu 85 90 95 Arg Glu Ala Ile Lys Asn Fro Ala He Lys Asp Lys ASp HiS Ser Ala 100 105 110 Pro Asn Ser Arg Fro He Asp Phe Glu Hat Lys Lys Lys Asp Gly Thr US 120 125 Gin Glu Phe fyr HÍS iyr Ala Ser Ser vai Lys Pro Ala Arg Vai He 130 - 135 140 Phe Thr Asp Ser Lys Fro Glu He Glu Leu Gly Leu Gin Ser Gly Gin 145 150 155 160 Phe Trp Arg Lys Phe Glu vài Tyr Glu Gly Asp Lys Lys Leu Pro Ile 165 170 175 Lys Leu vai Ser Tyr Asp Thr vai Lys Asp Tyr Ala Tyr Ile Arg Phe ISO 185 190 Ser Vai Ser Asn Gly Thr Lys Ala Vai Lys Ile Val Ser Ser Thr His 195 200 205 Phe Asn Asn Lys Glu Glu Lys Tyr Asp Tyr Thr Leu Met Glu Phe*Ala . 219* 215 220 Gin Fro He Tyr Asn Ser Ala Asp Lys Phe Lys Thr GlU Glu Asp Tyr 225 230 235 240 Lys Ala Glu Lys Leu Leu Ala Pro Tyr Lys Lys Ala Lys Thr Leu Glu 245 250 255 Arg Gin Vai Tyr Qlu Leu Asn Lys lie Gin Asp Lys Leu Pro Glu Lys 2m 265 270 Leu Lys Ala Glu Tyr Lys Lys Lys Leu Glu Glu Thr Lys Lys Ala Leu 275 280 285 Asp Glu Gin Vai Lys Ser Ala He Thr Glu Phe Gin Asn Val Gin Pro 290 29$ 300 Thr Asn Glu lys Met Thr Asp Leu Gin Asp Thr Lys Tyr Val Ala Tyr 305 319 , 315 320 Glu Ser Vai Glu Asn Asn Glu Ser Met Met Asp Thr Phe Val Lys His 325 330 335 Fro Ile Lys Thr Gly Met Leu Asn Gly Lys Lys Tyr Met Val Met Glu 349 345 350 Thr Thr Asn Αίφ Asp Tyr Trp Lys Asp Phe Met Val Glu Gly Gin Arg . 355 350 365 Vai Arg Thr ile Ser Lys Asp Ala Lys Asn Asn Thr Arg Thr He Ile 370 375 380 216
Phe Pto Tyr val Giu Gly Lys Thr Leu Tyr Asp Ala Ile Vai Lys Val 385 390 395 400 Bis Vai Lys Thr Ue Asp Tyr Asp Gly Gin Tyr His Vai Arg Ile Val 405 410 415 Asp Lys Giu Ale Fhe Thr Lys Ala Asn Ala Asp Lys Thr Asn Lys Lys 420 425 430 Glu GXn Glo ASP Asn Ser Ala Lys Lys Giu. Thr Thr Pro Ala Mefe Pro 435 440 445 Ser Lys Pro Thr Thr Pro Pro Vai Glu Lys Glu Ser Gin Lys Gin Asp 450 455 460 Ser Gin Lys Asp Asp Asn Lys Gin Ser Pro Ser val Glu Lys Glu Asn 465 470 475 480 Asp Ale Ser Ser Glu Ser Gly Lys Asp Lys Mac Pro Vai Thr Lys Pro 485 490 495 Ala Lyâ Ale G1Ú Vâl Glu Ser Ser Ser Thr Thr Pro Thr Lys val Val ,, 500 505 £10 Ser Thr Thr Gin Asn Vai Ala Lys Pro Thr Thr Ala Ser Ser Glu Thr 515 $24 5.25 Thr Lys Asp vai Vai Gin Thr Ser Ala Gly Ser Ser Glu Ala Lys Asp 530 535 540 ser Ala p.ro Leu Gin Lys Ala. Asn lie Lys Asn Thr Asn Asp Gly His 545 $50 555 560 Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin Glu Asn Lys Ala Lys Ser SIS 570 575
<210> 61 <211> 572 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <400> 61 217
Aiã ·* Glu Glu Thr Gly * vai Thr Asa Ala Vai Ala Ser Fro Thr Thr Thr 28 Lys Pro Vai Ala Asm Ala Vai Ser 3:5 40 Pro Thr Thr Glu Thr Lys Glu Ala 50 5S Vai Lys Ala Pro Lys Glu Ala Lys 65 10 Asp Asn Asn Thr Tyr Pro 11® ..Leu Lys Asn Fro Ala Ile Lys Asp Lys 180 Pro lie Asp Phe Glu Lys Lys 11S 120 84 8 Tyr Ala Ser Ser vai Lys Pro 130 135 Lys Pro Glu lie Glu Leu Gly Leu 145 150
Thr Glu 10 Ala Gin Pro Lys Thr 15 Glu Thr 25 Thr Glu Lys Ala Pro 30 Glu Ala Vai Ser Asn Lys Glu Aí* Vai Vai Ala Lys Glu Vai Lys 80 43 Ala vai Lys Glu Glu Glu Lys 75 Pro Ala Ala Lys Ala SQ Aso Gin 00 Glu Leu Arg Glu Ala 95 Ile Asp 185 Sis Ser Ala Pro Asn 110 Ser Arg Lys Asp Gly Thr Gin 125 Gin Fhe Tyr Ala Arg vai He 140 Phe Thr ASp Ser GlO Ser Gly 155 Gin Fhe Trp Arg Lys 160 218 phe Glu Vai Tyr Glu Giy Asp Lys Lys Leu Pr© Ile Lys :l«u val Ser 165 170 175 Tyr Asp Thr Vai Lys Asp Tyr Ala Tyr Ile Arg phe Ser Val Ser Asn ISO 185 190 Gly Thr Lys Ala Vai Lys Ile Vai Ser Ser Thr His Phe As» Asn Lys 195 200 205 Glu Glu Lys Tyr Asp Tyr Thr Leu Met Glu Phe Ale Gin Fro Ile Tyr 210 215 220 AS» ser Ala Asp Lys Fhe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys 225 230 235 240 Leu Leu Ala Pr© Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gl» Val tyr 245 250 255 Glu Leu As» Lys Ile Gin Mp Lys Leu Fr© Glu Lys Leu Lys Ala Glu 250 255 2?Ô Tyr Lys Lys Lys Leu Glu Glu Thr Lys Lys Ala Leu Asp Glu Gl» Val 275 280 285 Lys Ser Ala Ile Thr Glu Fhe Gl» As» Vai Gl» Fro Thr Ah» Glu Lys 290 295 300 «et Thr Asp Leu Gin Asp Thr Lys Tyr Vai Vai Tyr Glu Ser Val Glu 305 310 Thr Phe 315 320 AS» As». Glu Ser Met Met Asp Vai Lys His Pro Ile Lys Thr 325 330 335 Gly Met Leu As» ©ly Lys Lys Tyr Met Vai Met Glu Thr Thr Asn Asp 340 345 350 Asp Tyr Trp Lys Asp Phe Met Vai Glu oiy Gin Arg val Arg Thr Ilé 355 360 365 Sei· Lys Asp Ala Lys Asn AS» Thr Ar o Thr Ile lie Phe Pr© Cys val 370 375 380 Glu Gly Lys Thr Leu Tyr Asp Ala Ile vai Lys Vai His val Lys Thr 3Ô5 350 395 400 11« Asp Tyr Asp Gly Gin Tyr His val Arg ile Vai Asp Lys Glu 405 410 415 Phe Thr Lys Ala "1420 Asn Ala Asp Lys Thr As» Lys Lyâ Glu Gl» Gin Asp 425 430 Asn Ser Ala Lys Lys Glu Thr Thr Fro Ala Met Fro Ser Lys Fr© Thr 435 440 < 445 Thr Fr© Fr© Vai Glu Lys Glu Ser Gin Lys Gl» Asp Ser Gl» Lys ASp 450 455 450 Asp Asn Lys Gin Ser Pr© Ser' Vai Glu Lys Glu Asn Asp Ala Ser Ser 4S5 470 475 480 Glu Ser Gly Lys Asp Lys «et Fro Val Thr Lys Pr© Ala Lys Ala Glu 485 400 495 Vai Glu Ser Ser Ser Thr Thr Fro Thr Lys Vai Vai Ser Thr Thr Gin 500 505 510 As» val Ala' Lys Fro Thr Thr Ala Ser Ser Glu Thr Thr Lys Asp Val 515 520 52S Vai Gin Thr Ser Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala Pr© Leu 530 535 540 Gin Lys Ala Asn ne Lys As» Thr Asn Asp Gly His Thr Gl» Ser Gin 545 550 555 589 Asn As» Lys Asn Thr Gin Glu Asn Lys Ala Lys Ser 565 570 219 <210> 62 <211> 572 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4 0 0> 62 220
Ala Glu Glu Thr Gly Vai Thr Asn Thr Glu Ala Gin Pro Lys Thr Glu i 5 10 15 Ala Vai Ala Ser Pro Thr Thr Thr Thr Thr Glu Lys Ala Pro Gl« Ale 20 25 30 'Lys Pro vai Ala Asn Ala Vai Ser Vai Ser Asn Lys Glu Vai Vai Ale 35 40 45 Pro Thr Thr Glu Thr Lys Glu Ala Lys Glu Vai Lys Ala Vãl Lys Glu S0 55 60 vai Lys Ala Pm Lys Glu Ala - Lys Giu Glu Lys Pro Ala Ala Lys Ala §5 70 75 80 Asp Asn Asn Thr Tyr Pr© Ile Leu Asn Gin Glu Leu Arg Glu Ale Ile 85 m 95 Lys Asa Pr© Ala Ile Lys Asp Lys Asp HÍS Ser Ala pro Asn Ser Arg 300 105 uo Pro Ile Asp Phe Glu Met Lys Lys Lys Asp Gly Thr Gin Gin phe Tyr 115 120 125 His Tyr Ala Ser Ser vai Lys Pro Ala Arg Vai ile Phe Thr Asp Ser 130 135 - 140 Lys Pro Glu lie Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys 145 150 155 160 Phe Giu Vai Tyr Glu Gly Asp Lys Lys Leu Pro Ile Lys Leu Vai Ser 165 170 175 Tyr Asp Thr Vai Lys Asp Tyr Ala Tyr 11® Arg Phe Ser Vai Ser Asn 180 185 150 Gly Thr Lys Ala Vai Lys lie Vai Ser Ser Thr Mis Phe Asn Asn Lys 155 200 205 Glu Glu Lys Tyr Asp Tyr Thr Leu Met Glu Phe Ala Gin Pro' ile Tyr 210 215 220 Asn Ser Ala Asp Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys 225 230 235 240 Leu Leu Ala Pro Tyr Lys Lys Alã Lys Thr Leu Glu Arg Gin Vai Tyr 245 250 2S5 Glu Leu Aan Lys Ile Gin Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu 250 265 270 Tyr lys Lys Lys Leu Glu Glu Thr Lys Lys Ala Leu Asp Glu Gin Vai 275 280 285 Lys Ser Ala Ile Thr Glu Phe Gin Asn Vai Gin Pró Thr Asn Glu Lys 230 285 300 Met Thr Asp Leu Gin Asp Thr Lys Tyr val Vai Tyr Glu Ser Vai Glu 105 310 * 315 320 Asn Asn Giu Ser Met Met Asp Thr Phe Vai Lys His Pro ne Lys Thr 325 330 335 Gly Mac Leu Asn Gly Lys Lys Tyr Met Vai Met Glu Thr' Thr Asn Asp 340 345 350 Asp Tyr Trp Lys Asp Phe Met Vai Giu Gly Gin Arg Vai Arg Thr 11® 35S 359 365 Ser Lys Asp Ala Lys Asn Asn Thr Axg Thr II e Ile Phe Pro Tyr Vai 370 375 380 221
Glu Gly Lys Thr Leu Tyr Asp Ala Xle Vai Lys Vai His Vai Lys Thr 3®5 390 395 400 11* Asp Tyr Asp Gly mn Tyr His Vai Arg Ile Vai Asp Lys GlU Ala 405 410 415 Phe Thr Lys Ala ASO Ala Asp Lys Thr Asa Lys Lys Glu Gin Gin Asp 420 • 425 436 Aso Ser Ala Lys Lys Glu Thr Thr Fro Ala Het Pro $er Lys to Thr 435 446 445 Thr Pro Pro Vai. Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lya Asp 450 ' 4S5 466 Asp Asn Lys Gin ser pro ser Vai Glu Lys Glu Aso Asp Ala Ser Ser 465 470 47S 460 Glu Ser Oly Lys Asp Lys Met Fr» Vai Thr Lys Pro Ala Lys Ala Glu 4SS 490 495 Vai Glu Ser Ser ser Thr Thr Pro Thr Lys Vai Vai Ser Thr Thr Gin SOO 505 510 ASO Vai Ala Lys Fro Thr Thr Ala Ser Ser Glu Thr Thr Lys Asp Vai 515 520 525 Vâl Çln Thr Ser Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala Pre Leu 53S 535 546 Gin Lys Ala ASO n* Lys As» Thr Aso Asp Gly «ia Thr Gl» Ser Gin 5« 55 0 555 560 Aso Aso Lys Asn Thr Gin Glu Aso Lys Ala Lys Ser 565 570 <210> 63
<211> 566 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <400> 63 222
Ala Glu Glu Thr Gly Gly Thr Asa Thr Gia Ala Gin Pro Lys Thr Glu 1 5 10 15 Ala Vai Ala Ser Pro Thr Thr Thr Thr Thr Glu Lys Ala Pro Glu Ala 20 '25 30 Lys PtfO Vai Ala Asxt Ala Vai Ser Vai Ser Asn Lys Glu Vai Vai Ala 35 40 45 Pro 'Thr Thr Olu Thr Lys <5 la Ala Lys Gin Vai Lys Ala Pro Lys Glu 50 55 60 Thr Lys αία Vai Lys Pro Ala Ala Lys Ala Asp Asn As» Thr Tyr Pro €5 10 75 80 lie Leu Aan Lys βία Leu Arg Glu, Ala lie Lys Asn Pro Alá Ile Lys ÔS 50 55 Asp Lys ASP His Ser Ala Pro asa Ser Arg Pro Ile Asp phe Glu Met 100 10S 110 Lys Lys Glu Asn Gly Glu Gin Gia Phe Tyr His Tyr Ala Ser Ser Vai 115’ 120 125 Lys Pro· Ala Arg vai Ile Phe Thr Asp Ser Lys Pro Glu lie Glu Leu 130 135 140 Gly Leu Gin Ser Gly Gin. Phe Trp Arg Lys Phe Gia Vai Tyr Glu Gly 145 150 155 1€0 223 ASp l»8 Lys Leu Fro ile Lys Leu Val Ser Tyr Asp Thr Val Lys Asp 16S 170 175 Tyr Ala Tyr Ile Arg Phe Ser Val Ser Asn Gly Thr Lys Ala Val Lys i&o 185 190 n« mi Ser Ser Thr Hís Phe Asn Asn Lys Glu Glu Lys Tyr Asp Tyr 195 200 205 Thr lífiu Met 51a Phe Ala Gin Pro Ile Tyr Asn Ser Ala Asp Lys Phe 210 215 228 Lys Thr Glu Glu ASp Tyr Lys Ala Glu Lys Leu Leu Ala Pro Tyr Lys 225 230 235 240 Lys Ala Lys Thr Leu Glu Arg Gin val Tyr Glu Leu Asn Lys Ile Gin 245 250 255 ASp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr lys Lys Lys Leu Gin 260 265- 270 Glu Thr Lys Lys Ala Leu Asp Glu Gin val Lys Ser Ala Ile Thr Glu 275 280 285 Phe Gin ASO Vai Gin Pro Thr Asn Glu Lys Met Thr Asp Leu Gin Asp zm 295 380 Thr Lys Tyr Vai Vai Tyr Glu Ser Val Glu Asn Asn Glu Ser Ket Met 105 310 315 32Θ Asp Thr Phe Vai Lys HiS Pro XI» Lys Thr Gly Met Leu Aân Gly Lys 325 330 335 Lys Tyr «et Vai «et GlU Thr Thr ASn Asp Asp Tyr Trp Lys Asp Phe 340 345 350 Mhfc vai Glu Gly 5ln Arg Vai Arg Thr Ile Ser Lys Asp Ala Lys Asn 355 360 365 Asn Thr Arg Thr Ile Ile Phe Pro Tyr Ile Glu Gly Lys Thr Leu Tyr 370 375 386 Asp Ala Ile Vai Lys Vai His Val Lys Thr Ile Asp Tyr Asp Gly Gin 185 390 395 400 Tyr His Vai Arg na Vai Asp Lys Glu Ala Phe Thr Lys Ala Asn Ala 405 410 41$ Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys Lys Glu 420 425 430 Thr Thr Fro Ala Thr pro Ser Lys Pro Thr Thr Fro Pro Val Glu Lys 435 440 445 Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Thr Gin Ser Pro 450 455 460 Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys Asp Lys 465 470 475 480 Thr Fro Ala Thr Lys Pro Ala Lys Gly Glu Val GlU Ser Ser Ser Thr 485 498 49$ Thr Fro Thr Lys Vai Vai Ser Thr Thr Gin Asn Val Ala Lys Pro Thr 500 585 $10 Thr Ala Ser Ser Glu Thr Thr Lys Asp Val Val Gin Thr Ser Ala Gly 515 520 525 Pro Ser Glu Ma Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn Ile Lys 530 535 540 AS® Thr Asn Asp Gly HÍS Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin 545 550 555 560 Glu Asp Lys Ala Lys Ser 565 224
<210> 64 <211> 8 <212> PRT
<213> Sequência Artificial <22 0> <223> Cauda de His <4 0 0> 64 X,0tt Clw HiS MÍS Mis MÍS HÍS HÍS <210> 65 <211> 16 <212> ADN <213> Sequência Artificial <22 0> <22 3> iniciador <400> 65 ctggccgtcg ttttac 16
<210> 66 <211> 17 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador 225 <4Ο0> 6 6 caggaaacag ctatgac 17 <210> 67 <211> 39 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 67 aaccggtttt ccatggggaa caaacagcaa aaagaattt 39 <210> 68 <211> 38 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 68 accggtttct cgaggttttt acgttttcta ggtaatac 38 <210> 69 <211> 109 <212> ADN <213> Sequência Artificial <220> 226 <223> Oligómero ORF0657n <400> 69
afgggtaaca agcaaeaaaa ggaatfccaag tetctctact ccattagasa gtccccettg 60 fftgtfcgcfet ctgtcgctat ctccaccttg fcfcgfctgfctga tgfcctaacg 1ÔS
<210> 70 <211> 110 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 70
Ottggggaag egacagctfcc ggtcttçggt fcgagcttcag tgctggtacc accagtttct 60 tcagcageag cttgagctfcc accgtfcagac stcaacaaca aeaaggtgga 110
<210> 71 <211> 110 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 71 227
agaeigmagc tgtcgcçtçe ccaaccacfca eccctgaaaa ggctccagaa actaageeag 60 fctgctaacgc tgtctcegtt tctaasáãgg aagtcgaage tccaacctcc HO
<210> 72 <211> 109 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 72 tggtagcctt ageagctggc ttgecttcct tagtttcctc tggagccttg acttccttaa 60 cttcctfcagc tcccttagtc teggaggtfcg gagettcgac ttccecgtt ioo
<210> 73 <211> 108 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 73 aagtcaagcc agctgctaag gctaccaaca aeacttacçc aattttgaae caagaattga 60 gagaagctât taagaaecea gctaccaagg acaaggacca ctccgctc 108 <210> 74 <211> 109 228
<212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 74 tcttcatttc €0 193 tggcttgacs gaffacgcgt agfcggfcagaa tfcgttgggta ecgfcccttct gaagtcgatt ggtctagagrfc ttggagcgga gtggtccttg tccttgaca <210> 75 <211> 102 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF 0 6 5 7 n <400> 75 accactacgc gtcccctgxc aagccagcta gagctatttt caccgaetc t aagcçagaaa 60 tcgaattggg tttgçaatec ggteaattct ggagaaagfct cg 102 <210> 76 <211> 104 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n 229 <4Ο0> 76 ctgatgtaag egtagtcctt gacggcgtcg taggaaacea aettaattgg eaacttcttg 6a tcaccttcgt agaettcgaa ctttctccag aattgaccgg atfcg 104
<210> 77 <211> 109 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 77 caecgtcaag gaetacgctt acatcagatt ctccgtttct a&eggtacfca aggecgfceaa 60 gattgtctcf tccacccaet tcaacaaeaa ggaãgaaaag tacgactac 109
<210> 78 <211> 109 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 78 aactttccag cctfcgfcagte fctctfccggtc ttgaacttgt cagcagagtt gtaaafcfcggfc 60 fcgagcgaact ccatcaaage gtagtegtac ttttctteet tgttgttga 109 230 230 <210> 79 <211> 106 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF 0 6 5 7 n <4 0 0> 79 ccgsagaaga ctacaaggct gaaaagttgfc tggcfcccata caagaaggct aagactttgg €0 aaagaeaagt ttacgaattg aacaagatcc aagacaagtfc gccaga 106 <210> 80 <211> 109 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF 0 6 5 7 n <400> 80 teggtgaiag eggacttgae ttgtfcegfcee aaagccttct ttgtattcag ccttcaactt ttctggcaac tfcgtcttgga
tggtgtcttc caactecttc 6ô tcttgttca 10S <210> 81 <211> 109
<212> ADN <213> Sequência Artificial <22 0> 231 <223> Oligómero ORF0657n <400> 81 cgaacaagtc áagfiecgcta tcaccgaatt ccaaaacgfcfc caáccáâcta aegaaaagat 60 gaetgaettg eaag&cacta agtaegtcgt ctacgaatcc gfccgaaaae 109
<210> 82 <211> 109 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 82 tttecatgac catgtactte ctaccgttca aeafcaççagfc etfcaacrggg tgcttaacga 60 aggtgtccst catggattcg tegfctttcga cggattcgta gaegaegta 109
<210> 83 <211> 109 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 83 232 gaacggtaag aagtacafcgg tcatggaaac cactaacgac gactactgga agg&cfcfccac 00 ggttgaegge caaagagfcca gaaccatctc eaaggacgct aagaaeaac 109
<210> 84 <211> 101 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 84 gtcttgacgt gaaccttgac gatagcgtcg tacaaagtct taccctcaac gtatgggaag 00 ataatggttc cagtgttgtt cttagcgtcc ttgg&gafcgg t 101
<210> 85 <211> 106 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 85
cgctatcgtc aaggtteaeg tcaagactat egaetacgãc ggtcaacaec acgttagaat 00 fcgttgacaag gaagcfcfcfcca ccaaggctaa caccgacaag çccaae 10S
<210> 86 <211> 96 <212> ADN 233 <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 8 6 tggggetggrc ttagafcgggg tagcfcggggt agcttccfte ctagcagagt tgtcttgttg 60 tcccttcttg ttgfgactxgt cggtgttagc c-ttggt 06 <210> 87 <211> 85 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORFO 657n <4 0 0> 87 cagctacccc atctãâgcca accccatctc cagttgaaaa ggaatctcsa aagcaagact 60 eccaaaagga egaeaacaag caafet 85 <210> 88 <211> 100 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORFO 657n <4 0 0> 234 gttggcttgg tagctggagt cttgtcctta ccggattcag aagacgcgtc gctttccttc δ» tegacggatg geaattgctt gttgtcgtee Etttgggagt 190
<210> 89 <211> 101 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 89 ggacaagact ccagetacca agccaactaa gggtgaagtt: gaafccfcfcect ctACtaetCC 60 aaccaaggtt gtctccacta cccaaaacgt cgctaageca a 101
<210> 90 <211> 101 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 90 agcagagtcc teagcttcag aggaaccagc agaagtttgg acaacgfccct tggtagtctt €0 ggaagaagcg gcagttggct fcagcgacgfct ttgggtagtg g 101 <210> 91 <211> 91
<212> ADN 235 <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 91
ggttectetg a&gctaaggâi ctctgctcca ttgcaaaagg c.taacatcaa gaacaccaac SO
gacggtcaea ccca&cceea aaaeaacaag a SI <210> 92 <211> 98 <212> ADN Λ 00 \—1 CNl V Sequência Artificial <22 0> <223> Oligómero ORFO 657n <4 0 0> 92 gtgaagaacc caac&aggac afcgaccttgc cattgãtgge tttgtçggct: ctgtettcca 60 tcgttgcttt cgtcttgcca agaaagagaa agaactaa 98 <210> 93 <211> 98 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n 236 <4Ο0> 93
gfcgaagaatc caacaaggac atgacettgc cafctgatggc tttgttggcC ttgtefctcca 60 tcgttgc&fet cgtcttgcca agaaagagaa agaaet&a SS <210> 94 <211> 31 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 94 cttaaagctt atgtcacttt ctcttgtatc g 31 <210> 95 <211> 30 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 95 tgataagctt gctcaatggt tctcttcctc 30 <210> 96 <211> 53 <212> ADN <213> Sequência Artificial 237 <22 0> <223> Iniciador <4 0 0> 96 aaccggtttg gatcccacaa aacaaaatgg gtaacaagca acaaaaggaa ttc 53
<210> 97 <211> 42 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 97 aaccggtttg gatccttagt tctttctctt tcttggcaag ac 42 <210> 98 <211> 24 <212> ADN <213> Sequência Artificial <220> <223> Iniciador <4 0 0> 98 gctgaagaaa ctggtggtac caac 24 <210> 99 <211> 42 238
<212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 99 gtcacggatc cttaagactt agccttgttt tcttgagtgt tc 42
<210> 100 <211> 41 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 100 ggggggatcc cacaaaacaa aatggctgaa gaaactggtg g 41 <210> 101 <211> 39 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 101 ggggggggat ccttaagact tagccttgtt ttcttgagt 39 239
<210> 102 <211> 41 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 102 ggggggatcc cacaaaacaa aatggctgaa gaaactggtg g 41 <210> 103 <211> 32 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 103 gggggggatc cttagttctt tctctttctt gg 32 <210> 104 <211> 39 <212> ADN <213> Sequência artificial <22 0> <223> Iniciador 240 <4 0 0> 104 ctccggatcc cacaaaacaa aatggctgaa gaaactggt 39 <210> 105 <211> 38 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 105 gctgccggga tccttatggg gttggcttag atggggta 38 <210> 106 <211> 644 <212> PRT <213> S. aureus <4 0 0> 106 241 «et Asn Lys Gin Gin Lys Glu Phe Lys Ser Phe Tyr Ser ile Arg Lys 1 5 10 15 Ser Ser Leu Gly val Ala Ser Val Ala Ile Ser Thr Leu Leu Leu Leu 20 25 30 Met Ser Asn Gly Glu Ala Gin Ala Ala Glu Glu Thr Gly Gly Thr Asn 35 40 45 Thr Glu Ala Gin Pro Lys Thr Glu Ala Leu Ala Ser Pro Thr Thr Thr 50 55 60 Thr Glu Lys Ala Pro Glu Thr Lys Pro Val Ala Asn Ala Val Ser Val 65 70 75 80 Ser ASP Lys Glu val As Glu Ala Pro Thr $er Glu Thr ο ή Lys Glu Ala Lys ας Glu Val Lys 03 Glu Val Lys Ala Pro Lys 3?v Glu Thr Lys Ala Val Lys Pro 100 105 110 Ala Ala Lys Ala Asp Asn Asn Thr Tyr Pro lie Leu Asn Gin Glu Leu 115 120 125 Arg Glu Ala ile Lys Asn Pro Ala ile Lys Asp Lys Asp His Ser Ala 130 135 140 Pr© Asn Ser Arg Pro Ile Asp Phe Glu «et Lys Lys Glu Asn Gly Glu 145 150 155 160 Gin Gin Phe Tyr His Tyr Ala Ser Ser Val Lys Pro Ala Arg Val Ile 165 170 175 Phe Thr Asp Ser Lys Pro Glu Ile Glu Leu Gly Leu Gin Ser Gly Gin 180 185 190 Phe Trp Arg Lys Phe Glu Val Tyr Glu Gly Asp Lys Lys Leu Pro Ile 1SS 200 205 Lys Leu Val Ser Tyr Asp Thr Val Lys Asp Tyr Ala Tyr ile Arg Phe 210 215 220 Ser Val Ser Asn Gly Thr Lys Ala Val Lys Ile Val Ser Ser Thr His 225 230 .235 240 Phe Asn Asa Lys Glu Glu Lys Tyr Asp Tyr Thr Leu Met Glu Phe<Ala 245 250 255 Olfl Pro lie Tyr Asn Ser Ala Asp Lys Phe LyS Thr Glu Glu Asp Tyr 260 265 270 Lys Ala Glu Lys Leu Leu Ala Pro Tyr Lys Lys Ala Lys Thr Leu Glu 275 280 285 Arg Gin Val Tyr Glu Leu Asn Lys Ile Gin Asp Lys Leu Pro Glu Lys 280 295 300 .Leu Lys Ala Glu Tyr Lys Lys Lys Leu Glu Asp Thr Lys Lys Ala Leu 305 310 315 320 Asp Glu Gin Val Lys Ser Ala Ile Thr Glu Phe Gin Asn Val Gin Pro 325 330 335 Thr Asn Glu, Lys Met Thr Asp Leu Gin Asp Thr Lys Tyr Val Val Tyr 340 345 350 Olu Ser val Glu Asm Asn Glu Ser Met Met Asp Thr Phe Val Lys His 355 360 - 365 Pro Ile Lys Thr Gly «et Leu Asn Gly Lys Lys Tyr Met Val Ket Glu 370 375 380 Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Met Val Glu Gly Gin Arg 385 330’ 395 400 val Arg Thr Ile Ser Lys Asp Ala Ile Asn Asn Thr Arg Thr Ile Ile 405 410 415 Phe Pro Tyr Val Glu Gly Lys Thr Leu Tyr Asp Ala Ile Val Lys Val 420 425 430 242
His val Lys Thr Ile Asp Tyr Asp 435 440 Asp Lys Gly Ala Phe Thr Lys Ala 450 455 Glu Gin Gin Asp ASÍl Ser Ala Lys 455 470 Ser Lys Pro Thr Pr© Ser Pro Vai 485 Ser Gin Lys Asp Asp Asn Lys Gin 500 Asp Ala Ser ser Glu Ser Gly Lys 515 520 Ala Lys Gly Glu Vai Glu Ser Ser 530 535 Ser Thr Thr Gin Asn vai Aia Lys 54S 550 Thr Lys Asp Vai Vai Gin Thr Ser 565 ser Ala Pro Leu Gin Lys Ala Asn 500 Thr Gin Ser Gin Asn Asn Lys Asn -555 600 Leu ír» Gin Thr Gly Glu Glu Ser 516 615 Met Ala Leu Leu Ala Leu Ser Ser 525 «30 Lys Arq Ly» Asn <210> 107 <211> 644 <212> PRT <213> S. aureus
Gly Gin Tyr His val 44$ Arg lie Val Asn Thr Asp Lys 460 Ser Asn Lys Lys Lys Glu Ala Thr 475 Pro Ala Thr Pro 480 Glu Lys 490 Glu Ser Gin Lys Gin 495 Asp Leu 505 Pro Ser val Glu Lys 510 GlU Asn Asp Lys Thr Pro Ala 525 Thr Lys Pro Ser Thr Thr Pro 540 Thr Lys Val Val Pr» Thr, Thr 555 Ala Ser Ser Lys Thr 560 Ala Gly 570 Ser Ser Glu Ala Lys 57S Asp Ile 585 Lys Asn Thr Asn Asp 590 Gly HiS Thr Gin Glu Asn Lys 605 Ala Lys Ser Asn Lys Asp Met «20 Thr Leu Pro Leu Ile Vai Ala 635 Phe Val Leu Pro Arg 640 <400> 107 243
Met Asn Lys Glu Glu Lys Glu Fhe Lys Ser Phe Tyr Ser 11« Arg Lys i 5 10 15 Ser Ser Leu Gly vai Ala Ser Vai Ala XI© Ser Thr Leu Leu Leu Leu 20 25 30 Het Ser As» Gly Glu Ala Glu Ala Ala Glu Glu Thr Gly Gly Thr ASO 35 40 45 Thr Glu Ala Glu Pr© Lya Thr Glu Ala Vai Ala Ser Pro Thr Thr Thr 50 55 60 Ser Glu Lys Ala Pr© Glu Thr Lys Pro Val Ala Asn Ala Val Ser Val 65 70 75 60 Ser Asa Lys Glu Vai Glu Ala Pro Thr Ser Glu Thr Lys Glu Ala Lys 85 30 95 Glu Val Lys Glu Vai Lys Ala Pro Lys Glu Thr Lys Ala Val Lys Pro 100 105 110 Ais Thr Lys Ala h$p Asa ASO Thr Tyr Pro xie Leu Asn Gin Glu Leu 115 120 125 Arg Glu Ala Ile Lys ASO. Pro Ala lie Lys Asp Lys Asp Bis Ser Ala 130 13S 140 pro Asu Ser Arg Pro Ile Asp Phe Glu Het Lys Lys Glu Asn Gly Glu 145 150 155 160 244
Gin Gin Phe Tyr His Tyr Ala Ser Ser Vai Lys Pro Ala Arg Vai Ile 165 170 175 Phe thr Asp Ser Lys Pro Glu Ile Glu Leu Gly Leu Gin Ser Gly Gin ISO 185 190 Phe Trp Arg Lys Phe Glu Vai Tyr Glu Gly Asp Lys Lys Leu Pró Ile 195 200 205. Lys Leu Vai Ser tyr Asp Thr Vai Lys A®p Tyr Ala Tyr Ile Arg Phe 210 215 . 220 Ser Vai Ser Asn Gly Thr Lys Alâ Vai Lys Ile Vai Ser Ser Thr His 225 < 330 235 240 Phft ASO Asn Lys Glu Glu Lys Tyr Asp Tyr Thr Leu Het Glu Phe Ala 245 250 255 Gin pro Ile Tyr Asn Ser Ala Asp Lys Phe Lys Thr Glu Glu Asp tyr im 265 270 Lys Ala Glu Lys Leu Leu Ala Pro tyr Lys Lys Ala Lys Thr Leu Glu 27S 280 285 Arg ÕLn Vai Tyr Glu Leu Asn Lys Ile Gin Asp Lys Leu Pro Glu Lys 290 295 300 L«ru Lys Ala Glu Tyr Lys Lys Lys Leu Glu Asp Thr Lys Lys Ala Leu 305 310 315 320 Asp Glu Gin Vai Lys Ser Ala Ile Thr Glu Phe Gin Asn Vai Gin Pro 325 330 335 Thr Aan Glu Lys Met Thr Asp Leu Gin Asp Thr Lys tyr Vai Vai tyr 340 345 350 Glu Ser Vai. Glu Asn Asn Glu Ser mt Het Asp Thr Phe Vai Lys His 355 360 365 Pro Ile Lys Thr Gly Met Leu Asn Gly Lys Lys Tyr Het Vai Met Glu 370 375 380 Thr Thr Asn Asp Asp Tyr trp LyS Asp Phe Hat Vai Glu Gly Gin Arg 385 390 395 400 Vai Arg Thr Ile Ser Lys Asp Ala Lys Asn Asn Thr Arg Thr Ile Ile 405 410 415 Phe Pro tyx Vai Glu Gly Lys Thr Leu Tyr Asp Ala lie Vai Ly® vai 420 '425 430 His Vai Lys Thr Ile Asp Tyr Asp Gly Gin tyr His Vai Arg Ile Vai 435 440 445 A^p Lys Glu Ala Phe thr Lys Ala Asn Thr Asp Lys Ser Aan Lys Lys 4S0 455 460 Glu Gin Gin Asp Asn Ser Ala Lys Lys Glu Ala thr Pro Ala thr Pro 465 470 475 480 Ser Ly® Pm thr Pro Ser Pro Vai Glu Ly® Glu Ser Gin Ly® Gin Asp 485 490 495 Ser Gin Lys Asp Asp Asn Lys Gin Leu Pro Ser Vai Glu Lys Glu Asn 500 605 510 Asp Ala Ser Ser Glu Ser Gly Ly® Asp Lys Thr Pro Ala Thr Ly® Pro 515 520 525 Ala Lys Cly Glu Vai Glu Ser Ser Ser Thr· Thr Pro Thr Lys Vai Vai 530 535 540 Ser Thr thr Gin Asn Vai Ala Lys Pro Thr thr Alâ Ser Ser Lys Thr 54 S 550 555 560 Tfer Lys Asp Vai Vai Gin Thr Ser Ala Gly Ser Ser Glu Ala Ly® Asp 565 570 575 Ser Ala Pro Leu Gin Lys Ala Asyí Ile Lys Asn thr Asn Asp Gly His 500 585 590 245
Tfcr Gin Ser Gin Mn te Lys Mn Thr Gin Glu hm hys Ala sts %m soí
Len Pro Gin Thr Gly. Glvt Glu Ser Mn Lys Mp !fet Thr Leu 610 615 620
Het Ais Lee Leu Ala Leu Ser Ser lie Vai Ala Pha vai Lee 625 630 635
Lys Arg Lys Asm
Lys· Ser Pro Leu
Pro ftrg 640 246
REFERÊNCIAS CITADAS NA DESCRIÇÃO A presente listagem de referências citadas pela requerente é apresentada meramente por razões de conveniência para o leitor. Não faz parte da patente de invenção europeia. Embora se tenha tomado todo o cuidado durante a compilação das referências, não é possível excluir a existência de erros ou omissões, pelos quais o IEP não assume nenhuma responsabilidade.
Patentes de invenção citadas na descrição us 48984003 P [0001] us 52011503 P [0001] EP 0786519 A [0006] WO 0198499 A [0007] WO 02059148 A [0007] [0117] US 5068185 A [0069] WO 02077183 A [0117] WO 02094868 A [0117] WO 02102829 A [0117] WO 03011899 A [0117] EP 0314096 A [0146] us 60489840 B [0219] us 60520115 B [0219]
Literatura citada na descrição, para além das patentes de invenção • The Staphylococci in Human Disease. Churchill Livingstone Inc, 1997 [0003] [0083] [0087] 247 • Shinefield et al. N. Eng. J. Med., 2002, vol. 346, 491- 496 [0005] • Mamo et al. FEMS Immunology and Medicai Microbiology, 1994, vol. 10, 47-54 [0005] • Nilsson et al. J. Clin. Invest., 1998, vol. 101, 2640- 2649 [0005] • Josefsson et al. The Journal of Infectious Diseases, 2001, vol. 184, 1572-1580 [0005] • Kuroda et al. Lancet, 2001, vol. 357, 1225-1240 [0006] • Baba et al. Lancet, 2000, vol. 359, 1819-1827 [0006] • Ausubel. Current Protocols in Molecular Biology. John Wiley, 1987 [0040] [0056] [0063] [0101] • Berzofsky et al. Nature Review, 2001, vol. 1, 209-219 [0043] • Buchan et al. Molecular Immunology, 2000, vol. 37, 545- 552 [0055] • Vincent. Peptide and Protein Drug Delivery. Decker, 1990 [0056] • Sambrook et al. Molecular Cloning, A Laboratory Manual. Cold Spring Harbor Laboratory Press, 1989 [0063] • Huang et al. Biochemistry, 1987, vol. 26, 8242-8246 [0066] • Kukuruzinska et al. Ann. Rev. Biochem., 1987, vol. 56, 915-944 [0066] • Romanos et al. YEAST, 1992, vol. 8, 423-488 [0068] • Lathe. J. Molec. Biol., 1985, vol. 183, 1-12 [0072] • Sharp et al. Yeast, 1991, vol. 7, 657-678 [0072] • Schneedwind et al. EMBO, 1993, vol. 12, 4803-4811 [0075] • Mazmanian et al. Science, 2001, vol. 299, 906-909 [0075] • Vogel. Clinicai Infectious Diseases, 2000, vol. 30(3), 266-270 [0079] 248 • Vogel. Clinicai Infectious Diseases, 2000, vol. 30(3), S266-270 [0080] • Klein et al. Journal of Pharmaceutical Sciences, 2000, vol. 89, 311-321 [0080] [0113] • Rimmelzwaan et al. Vaccine, 2001, vol. 19, 1180-1187 [0080] • Kersten. Vaccine, 2003, vol. 21, 915-920 [0080] • 0'Hagen. Curr. Drug Target Infect. Disord., 2001, vol. 1, 273-286 [0080] • Vaccines. W.B. Sanders Company, 1999 [0095] • Remington's Pharmaceutical Sciences. Mack Publishing, 2000 [0095] • Modern Pharmaceutics. Mareei Dekker, Inc, 1990 [0095] • Harlow et al. Antibodies, A Laboratory Manual. Cold Spring Harbor Laboratory, 1988 [0101] • Kohler et al. Nature, 1975, vol. 256, 495-497 [0101] • Andrade et al. Genome Biology, 2003, vol. 3 (9), 47.1- 47.5 [0116] • Etz et al. PNAS USA, 2002, vol. 99, 6573-6578 [0116] • Baba et al. The Lancet, 2002, vol. 359, 1819-1827 [0116] • Kuroda et al. The Lancet, 2001, vol. 357, 1225-1240 [0116] • Mazmanian et al. Science, 2003, vol. 299, 906-909 [0116] • Mazmanian et al. Molecular Microbiology, 2001, vol. 40, 1049-1057 [0116] • Taylor et al. Mol. Microbiol., 2002, vol. 43, 1603-1614 [0116] • Livingston. Genetics, 1977, vol. 86, 73-84 [0136] • Broach et al. Cell, 1980, vol. 21, 501-508 [0136] • Carty et al. J. Ind. Micro, 1987, vol. 2, 117-121 [0136] • Beggs. Nature, 1978, vol. 275, 104-109 [0137] 249 • Kaiser, C. et al. Methods in Yeast Genetics. Cold Spring Harbor Laboratory Press, 1994, 214-215 [0138] • Schultz et al. Gene, 1987, vol. 61, 123-133 [0140] [0145] • Moehle et al. Genetics, 1987, vol. 115, 255-263 [0141] • Struhl et al. Proc. Natl. Acad. Sei., USA, 1979, vol. 76, 1035 [0141] • Ito et al. J Bacteriol., 1983, vol. 153, 163 [0142] [0147] • Jones, E. W. Tackling the Protease Problem in
Saccharomyces cerevisiae. Methods in Enzymology, 1991, vol. 194, 428-453 [0144] • Struhl et al. Proc. Natl. Acad. Sei. USA, 1979, vol. 76, 1035-1039 [0147] • Hinnen et al. Proc. Natl. Acad. Sei. USA, 1978, vol. 75, 1929-33 [0151] [0178] • Carty et al. Biotechnol. Lett., 1990, vol. 12, 879-884 [0161] • Hinnen et al. Proc. Natl. Acad. Sei. U.S.A., 1978, vol. 75, 1939-33 [0165] • Bayne et al. Gene, 1988, vol. 66 (2), 235-44 [0206]
Lisboa, 15/04/2010
Claims (31)
1 REIVINDICAÇÕES 1. Imunogénio polipeptídico que compreende uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 1, em que o referido polipeptido confere imunidade protectora contra S. aureus e em que caso se encontrem presentes uma ou mais regiões polipeptídicas suplementares, as referidas regiões suplementares não proporcionam um terminal carboxilo que contenha os aminoácidos 609-645 da SEQ ID NO: 2.
2. Polipeptido de acordo com a reivindicação 1, em que o referido polipeptido é constituído por uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 3, ou um seu fragmento que compreende uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 1.
3. Polipeptido de acordo com a reivindicação 2, em que o referido polipeptido é constituído por uma sequência de aminoácidos que é pelo menos 94% idêntica à SEQ ID NO: 3, ou um seu fragmento que compreende uma sequência de aminoácidos que é pelo menos 94% idêntica à SEQ ID NO: 1.
4. Polipeptido de acordo com a reivindicação 3, em que o referido polipeptido é constituído por uma sequência de aminoácidos que é pelo menos 94% idêntica à SEQ ID NO: 1, à SEQ ID NO: 3 ou à SEQ ID NO: 42.
5. Polipeptido de acordo com a reivindicação 1, em que o referido polipeptido é a SEQ ID NO: 1, a SEQ ID NO: 3 ou a SEQ ID NO: 42; ou difere destas sequências por um máximo de 25 alterações de aminoácidos. 2
6. Polipeptido de acordo com a reivindicação 5, em que o referido polipeptido é a SEQ ID NO: 1, SEQ ID NO: 3 ou SEQ ID NO: 42; ou difere destas sequências por um máximo de 10 alterações de aminoácidos.
7. Polipeptido de acordo com a reivindicação 6, em que o referido polipeptido é a SEQ ID NO: 1, SEQ ID NO: 3 ou SEQ ID NO: 42; ou difere destas sequências por um máximo de 5 alterações de aminoácidos.
8. Polipeptido de acordo com a reivindicação 1, em que o referido polipeptido é a SEQ ID NO: 1, SEQ ID NO: 3 ou SEQ ID NO: 42.
9. Polipeptido de acordo com a reivindicação 1, em que o referido polipeptido é constituído pela sequência de aminoácidos seleccionada entre as SEQ ID NOs 1, 3, 7, 17, 20 ou 42 e por um máximo de 20 aminoácidos suplementares.
10. Polipeptido de acordo com a reivindicação 5, em que o referido polipeptido é constituído pela sequência de aminoácidos seleccionada entre as sequências SEQ ID NOs 7, 17 ou 20.
11. Polipeptido de acordo qualquer uma das reivindicações anteriores, ao qual lhe falta a totalidade ou a maior parte de outros polipeptidos com o qual esse polipeptido se encontra naturalmente associado. 3
12. Imunogénio constituído pelos polipeptidos de acordo com qualquer uma das reivindicações anteriores, em que o referido imunogénio é constituído pela referida sequência de aminoácidos e por uma ou várias regiões ou fracções suplementares ligadas de forma covalente à referida sequência no terminal carboxilo ou no terminal amino, em que cada região ou fracção é seleccionada independentemente entre regiões ou fracções que possuam pelo menos uma das propriedades seguintes: reforçar uma resposta imunitária, facilitar a purificação ou facilitar a estabilidade do polipeptido.
13. Composição capaz de induzir uma resposta imunitária protectora num paciente, a qual compreende uma quantidade imunologicamente eficaz do imunogénio de acordo com qualquer uma das reivindicações 1 a 12 e um veículo farmaceuticamente aceitável.
14. Composição de acordo com a reivindicação 13, em que a referida composição contém também um adjuvante.
15. Ácido nucleico que compreende um gene recombinante que compreende uma sequência nucleotídica que codifica o imunogénio polipeptídico de acordo com uma qualquer das reivindicações 1 a 10.
16. Ácido nucleico de acordo com a reivindicação 15, em que o gene recombinante não codifica uma sequência codificadora do péptido de sinal celular e não codifica uma sequência do sinal de endereçamemto para a parede celular. 4
17. Ácido nucleico de acordo com a reivindicação 16, em que o referido gene recombinante contém um ou vários codões optimizados para expressão em leveduras.
18. Ácido nucleico de acordo com a reivindicação 17, em que a referida sequência nucleotidica possui pelo menos 50% dos codões optimizados para expressão em leveduras.
19. Ácido nucleico de acordo com a reivindicação 16, em que a referida sequência nucleotidica é seleccionada entre o conjunto constituído por: SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 32, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 38, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 46, SEQ ID NO: 47, SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51, SEQ ID NO: 52 e SEQ ID NO: 53
• 20. Ácido nucleico de acordo com uma das reivindicações 15 ou 19, em que o referido ácido nucleico é um vector de expressão.
21. Célula recombinante que compreende o ácido nucleico de acordo com uma qualquer das reivindicações 15 a 20.
22. Método para a preparação de um polipeptido de S. aureus que confere imunidade protectora, o qual compreende os passos seguintes: (a) o crescimento da célula recombinante de acordo com a reivindicação 21, em condições em que seja expresso o polipeptido de acordo com qualquer uma das reivindicações 1 a 11; e 5 (b) a purificação do referido polipeptido.
23. Método de acordo com a reivindicação 22, em que a referida célula recombinante é uma célula de S. cerevisiae.
24. Imunogénio de acordo com qualquer uma das reivindicações 1 a 12, para utilização num método de tratamento terapêutico de um ser humano.
25. Imunogénio de acordo com a reivindicação 24, para conferir imunidade protectora contra S. aureus.
26. Imunogénio de acordo com a reivindicação 25, em que o referido paciente é um ser humano.
27. Imunogénio de acordo com a reivindicação 25, em que o referido paciente é tratado profilaticamente contra uma infecção causada por S. aureus.
28. Imunogénio de acordo com a reivindicação 24, para induzir uma resposta anamnéstica.
29. Imunogénio de acordo com a reivindicação 28, em que a referida resposta anamnéstica tem como resultado um aumento em pelo menos 3 vezes do titulo geométrico, comparativamente com o título previamente existente, em 3 dias.
30. Utilização de um imunogénio de acordo com qualquer uma das reivindicações 1 a 12, para a preparação de um 6 medicamento para ser utilizado num método tal como definido em qualquer uma das reivindicações 25 a 29.
31. Imunogénio de acordo com qualquer uma das reivindicações 1 a 12, em combinação com imunogénios suplementares seleccionados entre: um ou vários imunogénios suplementares de S. âureus; um ou vários imunogénios dirigidos contra um ou vários outros organismos Staphylococcus; e um ou vários imunogénios dirigidos contra outros organismos infecciosos. Lisboa 15/04/2010
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US48984003P | 2003-07-24 | 2003-07-24 | |
| US52011503P | 2003-11-14 | 2003-11-14 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| PT1651166E true PT1651166E (pt) | 2010-04-23 |
Family
ID=34107815
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PT04778847T PT1651166E (pt) | 2003-07-24 | 2004-07-22 | Polipeptidos para indução de uma resposta imunitária de protecção contra staphylococcus aureus |
Country Status (23)
| Country | Link |
|---|---|
| US (2) | US20060177462A1 (pt) |
| EP (1) | EP1651166B8 (pt) |
| JP (1) | JP2007502101A (pt) |
| KR (1) | KR20060065643A (pt) |
| AT (1) | ATE457737T1 (pt) |
| AU (1) | AU2004258979B2 (pt) |
| BR (1) | BRPI0412799A (pt) |
| CA (1) | CA2532370A1 (pt) |
| CY (1) | CY1110028T1 (pt) |
| DE (1) | DE602004025579D1 (pt) |
| DK (1) | DK1651166T3 (pt) |
| ES (1) | ES2342778T3 (pt) |
| HR (1) | HRP20100240T1 (pt) |
| IL (1) | IL173253A0 (pt) |
| IS (1) | IS8213A (pt) |
| MX (1) | MXPA06000854A (pt) |
| NO (1) | NO20060898L (pt) |
| NZ (2) | NZ544542A (pt) |
| PL (1) | PL1651166T3 (pt) |
| PT (1) | PT1651166E (pt) |
| RU (1) | RU2337108C2 (pt) |
| SI (1) | SI1651166T1 (pt) |
| WO (1) | WO2005009379A2 (pt) |
Families Citing this family (33)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| AT410798B (de) | 2001-01-26 | 2003-07-25 | Cistem Biotechnologies Gmbh | Verfahren zur identifizierung, isolierung und herstellung von antigenen gegen ein spezifisches pathogen |
| CN1918176A (zh) * | 2004-02-18 | 2007-02-21 | 默克公司 | 用于诱导针对金黄色葡萄球菌的保护性免疫反应的多肽 |
| KR20070085457A (ko) * | 2004-10-25 | 2007-08-27 | 더 유니버시티 오브 웨스턴 온타리오 | 스태필로코쿠스 아우레우스의 철에 의해 조절되는 표면결정인자 IsdA, IsdB, 및 IsdC 기재 백신,조성물 및 방법 |
| GB0526038D0 (en) * | 2005-12-21 | 2006-02-01 | Glaxosmithkline Biolog Sa | Immunogenic composition |
| WO2007089470A2 (en) * | 2006-01-27 | 2007-08-09 | Merck & Co., Inc. | Antigen-binding proteins targeting s. aureus orf0657n |
| AU2008251982A1 (en) | 2007-01-24 | 2008-11-20 | Merck Sharp & Dohme Corp. | Polypeptides for inducing a protective immune response against Staphylococcus epidermidis |
| EP2374467B1 (en) * | 2007-05-04 | 2013-08-28 | Martin Krönke | Protective staphylococcus aureus vaccine based on cell wall-associated proteins |
| US20100166772A1 (en) * | 2007-05-31 | 2010-07-01 | Anderson Annaliesa S | ANTIGEN-BINDING PROTEINS TARGETING S. AUREUS ORF0657n |
| EP2185195A2 (en) | 2007-08-16 | 2010-05-19 | Tripep Ab | Immunogen platform |
| US9181329B2 (en) | 2007-08-31 | 2015-11-10 | The University Of Chicago | Methods and compositions related to immunizing against Staphylococcal lung diseases and conditions |
| EP2666784B1 (en) | 2007-08-31 | 2017-04-05 | University Of Chicago | Methods and compositions related to immunizing against staphylococcal lung diseases and conditions |
| WO2010014304A1 (en) | 2008-07-29 | 2010-02-04 | University Of Chicago | Compositions and methods related to staphylococcal bacterium proteins |
| CA2744054A1 (en) | 2008-11-26 | 2010-06-03 | Merck Sharp & Dohme Corp. | Polypeptides for inducing a protective immune response against staphylococcus aureus |
| PL3281947T3 (pl) | 2009-04-03 | 2020-07-27 | The University Of Chicago | Kompozycje i sposoby związane z wariantami białka A (SpA) |
| SG175092A1 (en) * | 2009-04-14 | 2011-11-28 | Novartis Ag | Compositions for immunising against staphylococcus aerus |
| GB0913681D0 (en) | 2009-08-05 | 2009-09-16 | Glaxosmithkline Biolog Sa | Immunogenic composition |
| GB0913680D0 (en) | 2009-08-05 | 2009-09-16 | Glaxosmithkline Biolog Sa | Immunogenic composition |
| MX373250B (es) | 2009-09-30 | 2020-05-04 | Glaxosmithkline Biologicals S A Star | Conjugación de polisacáridos capsulares de tipo 5 y de tipo 8 de staphylococcus aureus. |
| BR112012010223A2 (pt) | 2009-10-30 | 2016-12-06 | Novartis Ag | purificação de staphylococcus aureus tipo 5 e tipo 8 sacarídeos capsulares |
| GB0919690D0 (en) | 2009-11-10 | 2009-12-23 | Guy S And St Thomas S Nhs Foun | compositions for immunising against staphylococcus aureus |
| EP2544709A4 (en) * | 2010-03-12 | 2014-01-08 | Univ Pennsylvania | METHOD FOR PREVENTING AND TREATING THE COLONIZATION OF STAPHYLOCOCCUS AUREUS AND THEIR INFECTIOUS DISEASES AND DISEASES |
| SG186290A1 (en) | 2010-07-02 | 2013-01-30 | Univ Chicago | Compositions and methods related to protein a (spa) variants |
| WO2012021229A1 (en) | 2010-07-13 | 2012-02-16 | Merck Sharp & Dohme Corp. | Staphylococcus aureus surface protein sa1789 and protective vaccine based thereon |
| WO2012065034A1 (en) | 2010-11-12 | 2012-05-18 | Merck Sharp & Dohme Corp. | Enolase peptide conjugate vaccines against staphylococcus aureus |
| US8945588B2 (en) | 2011-05-06 | 2015-02-03 | The University Of Chicago | Methods and compositions involving protective staphylococcal antigens, such as EBH polypeptides |
| CA2847204A1 (en) | 2011-09-01 | 2013-03-07 | Novartis Ag | Adjuvanted formulations of staphylococcus aureus antigens |
| EP2773370A4 (en) | 2011-10-31 | 2016-09-28 | Merck Sharp & Dohme | PROTECTIVE VACCINE BASED ON THE STAPHYLOCOCCUS AUREUS PROTEIN SA2451 |
| KR20150030744A (ko) | 2012-06-27 | 2015-03-20 | 에프. 호프만-라 로슈 아게 | 표적에 특이적으로 결합하는 하나 이상의 결합 단위를 포함하는 항체 Fc-영역 접합체의 제조 방법 및 그의 용도 |
| RU2639287C2 (ru) | 2012-06-27 | 2017-12-20 | Ф. Хоффманн-Ля Рош Аг | Способ отбора и получения высокоселективных и мультиспецифичных нацеливающих групп с заданными свойствами, включающих по меньшей мере две различные связывающие группировки, и их применения |
| EP2872173A4 (en) | 2012-07-10 | 2016-03-23 | Merck Sharp & Dohme | PROTECTIVE VACCINE BASED ON THE STAPHYLOCOCCUS AUREUS PROTEIN SA2493 |
| US10738338B2 (en) | 2016-10-18 | 2020-08-11 | The Research Foundation for the State University | Method and composition for biocatalytic protein-oligonucleotide conjugation and protein-oligonucleotide conjugate |
| AU2020273471A1 (en) | 2019-05-14 | 2021-12-23 | The University Of Chicago | Methods and compositions comprising Staphylococcus protein A (SpA) variants |
| CN114929750B (zh) | 2019-09-13 | 2024-11-22 | 芝加哥大学 | 用于治疗葡萄球菌感染的方法和组合物 |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6248329B1 (en) * | 1998-06-01 | 2001-06-19 | Ramaswamy Chandrashekar | Parasitic helminth cuticlin nucleic acid molecules and uses thereof |
| WO2000071585A1 (en) * | 1999-05-03 | 2000-11-30 | Medarex, Inc. | Human antibodies to staphylococcus aureus |
| GB0014907D0 (en) * | 2000-06-20 | 2000-08-09 | Univ Sheffield | Antigenic polypeptides |
| AT410798B (de) * | 2001-01-26 | 2003-07-25 | Cistem Biotechnologies Gmbh | Verfahren zur identifizierung, isolierung und herstellung von antigenen gegen ein spezifisches pathogen |
| CA2450939C (en) * | 2001-06-15 | 2012-11-06 | Inhibitex, Inc. | Cross-reactive monoclonal and polyclonal antibodies which recognize surface proteins from coagulase-negative staphylococci and staphylococcus aureus |
| US7456276B2 (en) * | 2001-11-12 | 2008-11-25 | Novo Nordisk A/S | Peptide purification by means of metal ion affinity chromatography |
| US7157443B2 (en) * | 2001-12-11 | 2007-01-02 | Merck & Co., Inc. | Staphylococcus aureus exopolysaccharide and process |
| US20080050361A1 (en) * | 2004-10-25 | 2008-02-28 | Heinrichs David E | Staphylococcus aureas specific anti-infectives |
| AU2007281934B2 (en) * | 2006-01-18 | 2012-11-15 | University Of Chicago | Compositions and methods related to Staphylococcal bacterium proteins |
-
2004
- 2004-07-22 DE DE602004025579T patent/DE602004025579D1/de not_active Expired - Lifetime
- 2004-07-22 AT AT04778847T patent/ATE457737T1/de active
- 2004-07-22 WO PCT/US2004/023523 patent/WO2005009379A2/en not_active Ceased
- 2004-07-22 RU RU2006105498/13A patent/RU2337108C2/ru not_active IP Right Cessation
- 2004-07-22 AU AU2004258979A patent/AU2004258979B2/en not_active Ceased
- 2004-07-22 CA CA002532370A patent/CA2532370A1/en not_active Abandoned
- 2004-07-22 PT PT04778847T patent/PT1651166E/pt unknown
- 2004-07-22 NZ NZ544542A patent/NZ544542A/en not_active IP Right Cessation
- 2004-07-22 JP JP2006521226A patent/JP2007502101A/ja active Pending
- 2004-07-22 ES ES04778847T patent/ES2342778T3/es not_active Expired - Lifetime
- 2004-07-22 EP EP04778847A patent/EP1651166B8/en not_active Expired - Lifetime
- 2004-07-22 HR HR20100240T patent/HRP20100240T1/hr unknown
- 2004-07-22 SI SI200431389T patent/SI1651166T1/sl unknown
- 2004-07-22 MX MXPA06000854A patent/MXPA06000854A/es active IP Right Grant
- 2004-07-22 NZ NZ570750A patent/NZ570750A/en not_active IP Right Cessation
- 2004-07-22 BR BRPI0412799-4A patent/BRPI0412799A/pt not_active Application Discontinuation
- 2004-07-22 KR KR1020067001610A patent/KR20060065643A/ko not_active Ceased
- 2004-07-22 DK DK04778847.6T patent/DK1651166T3/da active
- 2004-07-22 US US10/564,458 patent/US20060177462A1/en not_active Abandoned
- 2004-07-22 PL PL04778847T patent/PL1651166T3/pl unknown
-
2005
- 2005-12-30 IS IS8213A patent/IS8213A/is unknown
-
2006
- 2006-01-19 IL IL173253A patent/IL173253A0/en unknown
- 2006-02-23 NO NO20060898A patent/NO20060898L/no not_active Application Discontinuation
-
2010
- 2010-04-30 US US12/771,345 patent/US20100247561A1/en not_active Abandoned
- 2010-05-14 CY CY20101100419T patent/CY1110028T1/el unknown
Also Published As
| Publication number | Publication date |
|---|---|
| ES2342778T3 (es) | 2010-07-14 |
| CA2532370A1 (en) | 2005-02-03 |
| BRPI0412799A (pt) | 2006-09-26 |
| NZ544542A (en) | 2009-01-31 |
| MXPA06000854A (es) | 2006-03-30 |
| NO20060898L (no) | 2006-04-24 |
| KR20060065643A (ko) | 2006-06-14 |
| AU2004258979A1 (en) | 2005-02-03 |
| NZ570750A (en) | 2009-12-24 |
| WO2005009379A2 (en) | 2005-02-03 |
| IS8213A (is) | 2005-12-30 |
| DK1651166T3 (da) | 2010-05-31 |
| HRP20100240T1 (hr) | 2010-09-30 |
| IL173253A0 (en) | 2006-06-11 |
| SI1651166T1 (sl) | 2010-06-30 |
| RU2337108C2 (ru) | 2008-10-27 |
| EP1651166A2 (en) | 2006-05-03 |
| EP1651166B8 (en) | 2010-05-19 |
| PL1651166T3 (pl) | 2010-08-31 |
| EP1651166B1 (en) | 2010-02-17 |
| RU2006105498A (ru) | 2006-09-10 |
| ATE457737T1 (de) | 2010-03-15 |
| US20060177462A1 (en) | 2006-08-10 |
| EP1651166A4 (en) | 2008-03-05 |
| DE602004025579D1 (de) | 2010-04-01 |
| WO2005009379A3 (en) | 2006-11-30 |
| US20100247561A1 (en) | 2010-09-30 |
| AU2004258979B2 (en) | 2007-12-06 |
| JP2007502101A (ja) | 2007-02-08 |
| CY1110028T1 (el) | 2015-01-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| PT1651166E (pt) | Polipeptidos para indução de uma resposta imunitária de protecção contra staphylococcus aureus | |
| EP1725575B1 (en) | Polypeptides for inducing a protective immune response against staphylococcus aureus | |
| ZA200600247B (en) | Polypeptides for inducing a protective immune response against staphylococcus aureus | |
| JP2009515831A (ja) | ペスト菌(Yersiniapestis)抗原を含む組成物 | |
| US20100203588A1 (en) | Polypeptides for inducing a protective immune response against staphylococcus aureus | |
| US20070243205A1 (en) | Polypeptides for Inducing a Protective Immune Response Against Staphylococcus Aureus | |
| MX2011005578A (es) | Polipeptidos para inducir una respuesta inmune protectora contra staphylococcus aureus. | |
| KR20220124194A (ko) | 에스. 아우레우스 감염을 예방하기 위한 조성물 및 방법 | |
| JPH09187284A (ja) | アデニルシクラーゼ − ヘモリジン(AC−Hly)の防護エピトープ、およびそのボルデテラ菌感染の治療もしくは予防への応用 | |
| WO2012009247A1 (en) | Protective vaccine based on staphylococcus aureus protein sa2412 | |
| EP2915543B1 (en) | Polypeptides derived from Enterococcus and their use for vaccination and the generation of therapeutic antibodies | |
| AU758555B2 (en) | Peptides | |
| US20140294888A1 (en) | Protective vaccine based on staphylococcus aureus sa2451 protein | |
| EA031495B1 (ru) | ПРОТИВОТУБЕРКУЛЕЗНАЯ ВАКЦИНА НА ОСНОВЕ РЕКОМБИНАНТНЫХ БЕЛКОВ Ag85B, TB10.4, FliC | |
| KR101713635B1 (ko) | 비브리오 패혈증균의 시스테인 단백질 분해효소 도메인 유래 재조합 단백질 및 이의 용도 | |
| Mosqueira et al. | Oral administration of recombinant Neisseria meningitidis PorA genetically fused to H. pylori Hpa. A antigen increases antibody levels in mouse serum suggesting that For. A behaves as a putative adjuvant |