PT1651166E

PT1651166E - Polipeptidos para indução de uma resposta imunitária de protecção contra staphylococcus aureus

Info

Publication number: PT1651166E
Application number: PT04778847T
Authority: PT
Inventors: William L Mcclements; Loren D Schultz; Annaliesa S Anderson; Kathrin Ute Jansen; Rosemarie Kelly; Donna L Montgomery
Original assignee: Merck Sharp & Dohme
Priority date: 2003-07-24
Filing date: 2004-07-22
Publication date: 2010-04-23
Also published as: ES2342778T3; CA2532370A1; BRPI0412799A; NZ544542A; MXPA06000854A; NO20060898L; KR20060065643A; AU2004258979A1; NZ570750A; WO2005009379A2; IS8213A; DK1651166T3; HRP20100240T1; IL173253A0; SI1651166T1; RU2337108C2; EP1651166A2; EP1651166B8; PL1651166T3; EP1651166B1

Description

1

DESCRIÇÃO "POLIPEPTIDOS PARA INDUÇÃO DE UMA RESPOSTA IMUNITÁRIA DE PROTECÇÃO CONTRA STAPHYLOCOCCUS AUREUS"

REFERÊNCIA CRUZADA PARA PEDIDOS DE PATENTE RELACIONADOS O presente pedido de patente de invenção reivindica o privilégio do pedido provisório US n° 60/489 840, depositado a 24 de Julho de 2003 e do pedido provisório US n° 60/520 115, depositado a 14 de Novembro de 2003.

ANTECEDENTES DA INVENÇÃO

As referências citadas ao longo do presente pedido de patente de invenção não são consideradas como técnica anterior relativamente à invenção reivindicada. O microrganismo Staphylococcus aureus é um agente patogénico responsável por uma grande variedade de doenças e patologias. Como exemplos de doenças e patologias provocadas por S. aureus refere-se as seleccionadas entre bacteremia, endocardite infecciosa, foliculite, furúnculos, carbúnculo, impetigo, impetigo bulhoso, celulite, botriomiose, síndroma do choque tóxico, síndroma da pele escaldada, infecções do sistema nervoso central, doenças oculares infecciosas e inflamatórias, osteomielite e outras infecções de articulações e ossos e ainda infecções do aparelho respiratório. (The

Staphylococci in Human Disease, Crossley e Archer (eds.), Churchill Livingstone Inc. 1997). 2 É possível recorrer a estratégias de base imunológica para tentar combater infecções de S. aureus e a disseminação de S. aureus. As estratégias de base imunológica compreendem as imunizações passiva e activa. Na imunização passiva são utilizadas imunoglobulinas direccionadas contra S. aureus. A imunização activa induz respostas imunitárias contra S. aureus.

As vacinas potenciais contra S. aureus têm como alvo polissacarídeos e polipeptidos de S. aureus. 0 ataque pode ser efectuado utilizando como componentes da vacina polissacarídeos ou polipeptidos adequados de S. aureus. Como exemplos de componentes polissacarídicos potenciais para vacinas refere-se os polissacarídeos capsulares de tipo 5 e de tipo 8. (Shinefield et al., N. Eng. J. Med. 346:491-496, 2002). Como exemplos de polipeptidos que é possível utilizar como possíveis componentes de vacinas refere-se a adesina do colagénio, as proteínas de ligação do fibrinogénio e o "clumping factor". (Mamo et al., FEMS Immunology and Medicai Microbiology 10:47-54, 1994, Nilsson et al., J. Clin. Invest. 101:2640-2649, 1998, Josefsson et al., The Journal of Infectious Diseases 184:1572-1580, 2001). A informação respeitante às sequências polipeptídicas de S. aureus foi obtida a partir da sequenciação do genoma de S. aureus. (Kuroda et al., Lancet 357:1225-1240, 2001, Baba et al., Lancet 359:1819-1827, 2000, Kunsch et al., publicação da patente de invenção europeia EP 0 786 519, com data de 30 de Julho de 1997) . Recorreu-se a aplicações da bioinformática numa tentativa de caracterizar as sequências polipeptídicas obtidas a partir da sequenciação do genoma. (Kunsch et al., publicação da patente de 3 invenção europeia EP 0 786 519, com data de 30 de Julho de 1997). É possivel utilizar técnicas tais como as que implicam tecnologias de phage display e soros provenientes de pacientes infectados, como parte do esforço de se tentar identificar genes que codifiquem antigénios potenciais. (Foster et al., publicação da patente de invenção internacional com o número WO 01/98499, com data de 27 de Dezembro de 2001, Meinke et al., publicação da patente de invenção internacional número WO 02/059148, com data de 1 de Agosto de 2002).

DESCRIÇÃO ABREVIADA DA INVENÇÃO A presente invenção tem por objecto proporcionar polipeptidos que compreendem uma sequência de aminoácidos estruturalmente conotada com a SEQ ID NO: 1, as utilizações de tais polipeptidos e sistemas de expressão para a produção desses polipeptidos. A SEQ ID NO: 1 é um derivado truncado de um polipeptido de comprimento completo de S. aureus. O polipeptido de comprimento completo recebe aqui a designação de ""ORF0657n" de comprimento completo. Verificou-se que os polipeptidos que contêm a sequência de aminoácidos designada por SEQ ID NO: 1 produzem uma resposta imunitária protectora contra S. aureus. O termo "imunidade protectora" ou "resposta imunitária" indica um nivel detectável de protecção contra uma infecção provocada por S. aureus. O nivel de protecção por ser avaliado recorrendo a modelos com animais, tais como os aqui descritos. 4

Assim, a presente invenção proporciona um imunogénio polipeptidico que compreende uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 1, em que o polipeptido não contém uma terminal carboxilo proporcionado pelos aminoácidos 609-645 de SEQ ID NO: 2 e em que o polipeptido confere imunidade protectora contra S. aureus. A SEQ ID NO: 2 proporciona um polipeptido ORF0657n de comprimento completo, em que os aminoácidos 609-645 proporcionam o domínio do terminal carboxilo que começa no motivo LPXTG (aqui designado por "sinal de selecção da parede celular"). O termo "imunogénio" indica aptidão para conferir imunidade protectora. A frase "que compreende uma sequência de aminoácidos pelo menos 90% idêntica à SEQ ID NO: 1" indica que uma região associada à SEQ ID NO: 1 se encontra presente e que podem estar presentes outras regiões polipeptídicas suplementares. Se estiverem presentes outras regiões polipeptídicas suplementares, então o polipeptido não possui um motivo LPXTG no terminal carboxilo, conforme proporcionado pelos aminoácidos 609-645 da SEQ ID NO: 2.

De acordo com um outro dos seus aspectos, a presente invenção descreve um imunogénio que compreende uma sequência de aminoácidos que confere imunidade protectora contra S. aureus. 0 imunogénio compreende uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 1 e uma ou várias regiões ou radicais suplementares ligados, de forma covalente, ao terminal carboxilo ou ao terminal amino, em que as referidas regiões ou radicais suplementares não providenciam um terminal carboxilo que contenha os aminoácidos 609-645 da SEQ ID NO: 2, em que 5 cada região ou radical é seleccionado independentemente entre regiões ou radicais que possuam pelo menos uma das propriedades seguintes: reforçar a resposta imunitária, facilitar a purificação ou facilitar a estabilidade dos polipeptidos. 0 termo "região ou radical suplementar" designa uma região ou radical diferente de um polipeptido aparentado com ORF0657n, que poderia ser produzido num hospedeiro biológico, tal como um hospedeiro procariótico ou eucariótico. A região ou radical suplementar pode ser, por exemplo, uma região polipeptídica suplementar ou uma região não peptidica suplementar.

De acordo com um outro dos seus aspectos, a presente invenção descreve uma composição capaz de induzir imunidade protectora contra S. aureus num paciente. A composição compreende um veiculo aceitável sob o ponto de vista farmacêutico e uma quantidade imunologicamente eficaz de um imunogénio, conforme descrito antes, que confere imunidade protectora contra S. aureus. Uma quantidade imunologicamente eficaz é uma quantidade suficiente para conferir imunidade protectora contra uma infecção provocada por S. aureus. A quantidade deve ser suficiente para reduzir significativamente a probabilidade ou a gravidade de uma infecção provocada por S. aureus.

De acordo com um outro dos seus aspectos, a presente invenção descreve um ácido nucleico correspondente um gene recombinante que codifica um polipeptido, conforme descrito antes, que confere imunidade protectora contra S. aureus. Um gene recombinante contém ácido nucleico recombinante que codifica um polipeptido conjuntamente com elementos reguladores para a transcrição e para o processamento 6 correctos (o que pode incluir elementos traduccionais e pós-traduccionais). 0 gene recombinante pode existir independentemente de um genoma hospedeiro ou pode ser parte de um genoma hospedeiro.

Um ácido nucleico recombinante é um ácido que, em virtude da sua sequência e/ou da sua forma, não ocorre na natureza. Como exemplos de ácidos nucleicos recombinantes refere-se um ácido nucleico purificado, duas ou mais regiões de ácidos nucleicos combinadas conjuntamente para gerarem um ácido nucleico diferente de qualquer outro existente na natureza, e a ausência de uma ou várias regiões de ácidos nucleicos (v.g., regiões a montante ou a jusante) que estejam naturalmente associadas entre si.

De acordo com outro dos seus aspectos, a presente invenção descreve uma célula recombinante. A célula compreende um gene recombinante que codifica um polipeptido, conforme descrito antes, que confere imunidade protectora contra S. aureus.

De acordo com um outro dos seus aspectos, a presente invenção descreve um processo para a produção de um polipeptido, conforme descrito antes, que confere imunidade protectora contra S. aureus. 0 processo consiste em criar em cultura uma célula recombinante que contenha um ácido nucleico recombinante que codifique o polipeptido, purificando-se depois esse polipeptido.

De acordo com um outro dos seus aspectos, a presente invenção descreve um polipeptido, conforme descrito antes, que confere imunidade protectora contra S. aureus, produzido por um processo que compreende o passo que consiste em criar em cultura uma célula recombinante que contenha um ácido nucleico recombinante que codifique o 7 polipeptido numa célula hospedeira e o passo que consiste em purificar o polipeptido. É possível utilizar diferentes células hospedeiras. De acordo com uma variante da presente invenção, a célula hospedeira é uma célula de uma levedura.

De acordo com um outro dos seus aspectos, a presente invenção descreve um imunogénio, conforme descrito antes, para induzir uma resposta imunitária protectora num paciente, contra S. aureus. 0 imunogénio é administrado ao paciente numa quantidade imunologicamente eficaz que confere imunidade protectora contra S. aureus.

De acordo com um outro dos seus aspectos, a presente invenção descreve um imunogénio, conforme descrito antes, para induzir uma resposta anamnéstica num paciente. 0 processo compreende o passo que consiste em administrar a um paciente uma quantidade eficaz de um imunogénio para produzir uma resposta anamnéstica.

De acordo com um outro dos seus aspectos, a presente invenção descreve um ácido nucleico que codifica um polipeptido aparentado com ORF0657n, que é optimizado para expressão numa levedura. São optimizados um ou mais codões para expressão na levedura.

De acordo com um outro dos seus aspectos, a presente invenção descreve um processo para produzir um polipeptido, conforme descrito antes, que confere imunidade protectora contra S. aureus, numa célula recombinante de levedura. 0 processo compreende os passos seguintes: (a) criar em cultura uma célula recombinante de levedura em condições em que o polipeptido seja expresso, em que a célula recombinante de levedura compreende um gene recombinante que codifica o polipeptido e em que o polipeptido é um polipeptido aparentado com ORF0657n de 8 comprimento completo que confere imunidade protectora contra uma infecção provocada por S. aureus, ou um seu fragmento que compreende uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 1; e (b) purificar o polipeptido. A não ser que termos particulares sejam mutuamente exclusivos, a utilização do termo "ou" indica uma ou ambas as possibilidades. Ocasionalmente, são utilizadas frases tais como "e/ou" para evidenciar uma ou ambas as possibilidades. A utilização de termos não restritivos, tais como "compreende", permite a introdução de elementos ou passos suplementares. Ocasionalmente, são utilizadas frases tais como "um ou mais", conjuntamente ou não com termos não restritivos para evidenciar a possibilidade de haver elementos ou passos suplementares.

Salvo se for explicitamente estipulado, a utilização de termos tais como "um" ou "uma" não significa qualquer limitação a um caso singular. Por exemplo, "uma célula" não exclui o termo "células". Ocasionalmente, são utilizadas frases tais como "um ou mais" para evidenciar a presença de um grande número. Há outras particularidades e vantagens da presente invenção que se tornarão evidentes a partir do texto descrito subsequente aqui apresentado, conjuntamente com os diferentes exemplos. Os exemplos apresentados ilustram diferentes componentes e metodologias úteis na prática da presente invenção. Os exemplos não limitam a invenção reivindicada. Com base no texto presente, um especialista na matéria consegue identificar e utilizar outros componentes e metodologias úteis para a prática da presente invenção. 9

DESCRIÇÃO ABREVIADA DOS DESENHOS

As figuras ΙΑ, 1B, 1C e 1D correspondem a um esquema que ilustra as regiões polipeptidicas associadas a ORFO657n, pesquisadas para protecção em animais, e algumas sequências diferentes de ORF0657n. A figura IA ilustra um esquema de polipeptidos que foram testados e para os quais se concluiu que conferiam protecção (representados por rectângulos a cheio), polipeptidos que foram experimentados e para os quais e concluiu que não conferiam protecção (representados por rectângulos em branco) e um polipeptido não experimentado (rectângulo tracejado). A figura 1B ilustra uma sequência de comprimento completo, utilizada como referência para a figura IA (SEQ ID NO: 2). A figura 1C ilustra a SEQ ID NO: 28. A SEQ ID NO: 28 contém uma "cauda de His" no terminal carboxilo (LEHHHHHH; SEQ ID NO: 64) . A SEQ ID NO: 2 8 que contém uma cauda de His no terminal carboxilo também é aqui designada por "His-identificador ORF0657n". A figura ID ilustra uma sequência de ORF0657nI+.

As figuras 2A-2E permitem fazer uma comparação entre diferentes sequências associadas a ORF0657n ao longo de toda a região ORF0657nH. A terminologia 'SEQ ID NOs:' está indicada na figura simplesmente por "ID".

As figuras 3A, 3B e 3C ilustram a aptidão dos polipeptidos aparentados com ORF0657n, que proporcionam a sequência de comprimento completo, a região OFR0657nH e a região ORF0657nI, para conferir imunidade protectora contra S. aureus Becker. Os polipeptidos foram utilizados com um adjuvante de hidroxifosfato de alumínio (AHP). A figura 3A ilustra os resultados obtidos com a SEQ ID NO: 28. A figura 10 3Β ilustra os resultados obtidos com a SEQ ID NO: 4 que contém uma cauda de His no terminal carboxilo. A figura 3C ilustra os resultados obtidos com a SEQ ID NO: 5 que contém uma cauda de His no terminal carboxilo. A utilização do termo "uma cauda de His no terminal carboxilo" indica que se encontra presente o grupo LEHHHHHH (SEQ ID NO: 64), cauda de His, no terminal carboxilo.

As figuras 4A-4H ilustram a aptidão dos polipeptidos aparentados com ORF0657n para conferirem imunidade protectora contra diferentes infecções provocadas por S. aureus. Utilizou-se como imunogénio o polipeptido de SEQ ID NO: 28. A figura 4A mostra os resultados obtidos quando é utilizada a estirpe infecciosa CL-10 (2,2 X 108 UFC/mL). A figura 4B mostra os resultados obtidos quando é utilizada a estirpe infecciosa CL-10 (2,1 X 108 UFC/mL). A figura 4C mostra os resultados obtidos quando é utilizada a estirpe infecciosa CL-13 (2,9 X 108 UFC/mL). A figura 4D mostra os resultados obtidos quando se utiliza a estirpe infecciosa CL-13 (2,8 X 108 UFC/mL). A figura 4E mostra os resultados obtidos quando se utiliza a estirpe infecciosa CL-30 (3,1 X 108 UFC/mL). A figura 4F mostra os resultados obtidos quando se utiliza a estirpe infecciosa CL-30 (3, 0 X 108 UFC/mL). A figura 4G mostra os resultados alcançados quando se utiliza a estirpe infecciosa CL-18 (1,0 X 108 UFC/mL. A figura 4H mostra os resultados conseguidos quando se utiliza a estire infecciosa CL-21 (1,6 X 108 UFC/mL).

As figuras 5A e 5B ilustram mapas plasmídicos de plasmideos de expressão de S. cerevisiae. A figura 5A representa um mapa plasmidico do vector pGALHO. A figura 5B representa um mapa plasmidico para piUC-I, representando 11 uma sequência optimizada por codões de leveduras, clonada sob o controlo do promotor GALl de pGALHO.

As figuras 6A e 6B representam transferências de 'Western' que traduzem a expressão intracelular de um ORF0657n de comprimento completo que possui os aminoácidos 1-646 da SEQ ID NO: 28 (SEQ ID NO: 28 sem a cauda de His no terminal carboxilo). Pista 1, padrões de pesos moleculares; pista 2, região ORF0657n recombinante de comprimento completo (SEQ ID NO: 28), purificada e produzida E. coli, 100 ng; as pistas 3-6 contêm 20 pg de lisado de células de leveduras; pistas 3 e 4, lisados de células provenientes de fermentações de transformantes, feitas em duplicado, das estirpes 1260 (figuras 6A) e 1309 (figura 6B) contendo apenas o vector pGALHO; pistas 5 e 6, lisados de células provenientes de fermentações de transformantes, feitas em duplicado, das estirpes 1260 (figura 6A) e 1309 (figura 6B) contendo pRUnkC-pGALHO que expressa a região ORF0657n de comprimento completo (SEQ ID NO: 28 sem a cauda de His do terminal carboxilo).

As figuras 7A e 7B correspondem a uma coloração com o corante de Coomassie num gel para o protocolo de SDS-PAGE e uma transferência de 'Western', respectivamente, representando a expressão intracelular em S. cerevisiae a partir de um ácido nucleico que codifica a SEQ ID NO: 3. Pista 1, painel A, BSA, 1,25 pg; painel B, ORF0657n recombinante de comprimento completo, purificado, de E. coli (SEQ ID NO: 28), 100 ng; pista 2, lisado de células proveniente do produtor de ORF0657nH (SEQ ID NO: 4 com uma cauda de His no terminal carboxilo) em E. coli; painel A, 1,25 pg, painel B, 0,5 pg. Pistas 3-7, os painéis A e B contêm, respectivamente, 1,25 e 0,5 pg de lisado de células 12 de leveduras: pista 3, transformante que contém apenas o vector pGALHO; pista 4, transformante que contém ORF0657n de comprimento completo (SEQ ID NO: 28 sem a cauda de His no terminal carboxilo); pistas 5, 6 e 7, transformante 1-1 que contém piUC-S(-) que expressa a região ORF0657nH madura (SEQ ID NO: 3); a pista 7 contém um lisado de células (do transformante 1-1) que foi congelado e subsequentemente descongelado. Pista 8, contém padrões de pesos moleculares.

As figuras 8A-8U correspondem a exemplos de diferentes sequências de ácidos nucleicos que codificam os polipeptidos conotadas com ORF0657n. A figura 8A corresponde a uma sequência de ácidos nucleicos (SEQ ID NO: 29) que codifica a SEQ ID NO: 2, mais uma cauda de His no terminal carboxilo. A figura 8B corresponde a uma sequência de ácidos nucleicos (SEQ ID NO: 30) que codifica a SEQ ID NO: 4 mais uma cauda de His no terminal carboxilo. A figura 8C corresponde a uma sequência optimizada de ácidos nucleicos de leveduras (SEQ ID NO: 31), que codifica a SEQ ID NO: 28 sem uma cauda de His no terminal carboxilo. A figura 8D corresponde a uma sequência optimizada de ácidos nucleicos de leveduras (SEQ ID NO: 32), que codifica a SEQ ID NO: 3. A figura 8E corresponde a uma sequência optimizada de ácidos nucleicos de leveduras (SEQ ID NO: 33), que codifica a SEQ ID NO: 1.

As figuras 8F-8M correspondem a sequências optimizadas de ácidos nucleicos de leveduras (SEQ ID NOs: 34, 35, 36, 37, 38, 39, 40 e 41), que codificam a SEQ ID NO: 7 que contém um resíduo metionina no terminal amino. As figuras 8N-8U correspondem a sequências optimizadas de ácidos nucleicos de leveduras (SEQ ID NOs: 46-53), que codificam 13 diferentes polipeptidos aparentados com ORF0657n, com base na SEQ ID NO: 17 ou na SEQ ID NO: 20. A figura 9 apresenta uma transferência de 'Western' que compara a expressão intracelular de polipeptidos aparentados com ORF0657n em S. cerevisiae. Pistas 1 e 18, padrões de pesos moleculares. Pistas 2 e 3, respectivamente 50 e 100 ng de ORF0657nH purificado produzido em E. coli (SEQ ID NO: 4 mais uma cauda de His no terminal carboxilo). A pista 5 contém 500 ng de proteínas do lisado celular proveniente do transformante de controlo do vector de S. cerevisiae. As pistas 7, 8 e 9 contêm 1,0, 2,0 e 4,0 yg de proteínas do lisado celular proveniente do transformante de S. cerevisiae que produz a SEQ ID NO: 2 8 sem uma cauda de His no terminal carboxilo. As pistas 11 e 12 contêm, respectivamente, 50 e 100 ng de lisado celular proveniente do transformante de S. cerevisiae que produz ORF0657nH (SEQ ID NO: 3). As pistas 14 e 15 contêm, respectivamente, 250 e 500 ng de proteínas do lisado celular proveniente do transformante de S. cerevisiae que produz ORF0657nG (SEQ ID NO: 44) . A pista 17 contém 250 ng de proteína do lisado celular proveniente do produtor E. coli de ORF0657nG (SEQ ID NO: 44 mais uma cauda de His no terminal carboxilo). As pistas 4, 6, 10, 13 e 16 estão vazias. A figura 10 ilustra dados sobre a imunidade protectora para os polipeptidos aparentados com ORF0657n, produzidos em E. coli e em leveduras. O ORF0657nH (E. coli) corresponde à SEQ ID NO: 4 com uma cauda de His no terminal carboxilo. "ORF0657nI (E. coli)11 corresponde à SEQ ID NO: 5 com uma cauda de His no terminal carboxilo. "ORF0657nC (E. coli) 11 corresponde à SEQ ID NO: 28. "ORF0657nH (levedura)" corresponde à SEQ ID NO: 3. 14 A figura 11 traduz uma transferência de 'Western' exemplificativa da expressão intracelular de ORF0657nI em S. cerevisiae. Pistas 1 e 25: padrões de pesos moleculares. Pistas 2, 3 e 24: respectivamente 25, 50 e 100 ng, de região ORF0657nH purificada (SEQ ID NO: 4 com uma cauda de His no terminal carboxilo) produzida em E. coli. As pistas 4-23 contêm lisado celular proteico proveniente de transformantes de leveduras. As pistas 13-21 correspondem a lisados celulares, feitos em duplicado, preparados a partir da mesma amostra de fermentação utilizada para os lisados correspondentes às pistas 4-12. As pistas 4 e 13 contêm 200 ng de proteína proveniente do transformante de controlo do vector que contém pGALHO. As pistas 5 e 14 contêm 100 ng de proteínas provenientes do transformante 1-1 que produz a região ORF0657nH (SEQ ID NO: 3) . As pistas 6 e 15 contêm 200 ng de proteínas provenientes do transformante 1-1. As pistas 7 e 16 contêm 100 ng de proteínas e as pistas 8 e 17 contêm 200 ng de proteínas provenientes do transformante II. As pistas 9 e 18 contêm 100 ng de proteínas e as pistas 10 e 19 contêm 200 ng provenientes do transformante 12. As pistas 11 e 20 contêm 100 ng de proteínas e as pistas 12 e 21 contêm 200 ng de proteínas provenientes do transformante 13. As pistas 22 e 23 contêm 100 e 200 ng de proteínas de lisados celulares previamente preparados a partir de uma fermentação prévia do transformante 1-1. A figura 12 proporciona dados de imunização de macacos Rhesus. Os macacos Rhesus foram imunizados com o polipeptido aparentado com ORF0657n (ORF0657nH, SEQ ID NO: 3) produzido por leveduras, ou com o polipeptido aparentado com ORF0657n (ORF0657nC de comprimento completo, SEQ ID NO: 28) , expresso em E. coli, numa formulação contendo ou não 15 ΑΗΡ. Os macacos do grupo vacinado receberam 50 pg de polipeptidos aparentados com ORF0657n por via intramuscular.

DESCRIÇÃO MINUCIOSA DA INVENÇÃO

Concluiu-se que os polipeptidos aparentados com ORF0657n, incluindo os derivados de comprimento completo e de comprimento mais curto que contêm a região ORF0657nI, conferiam imunidade protectora contra S. aureus, utilizando um modelo com animais. A figura la ilustra a localização de diferentes regiões de polipeptidos aparentados com ORF0657n que conferem imunidade protectora contra uma infecção provocada por S. aureus, e regiões que não conferem imunidade protectora. Na figura la, o termo ORF0657n designa uma sequência de comprimento completo correspondente à SEQ ID NO: 2, o termo ORF0657nI designa uma região correspondente à SEQ ID NO: 1 (sem a metionina do terminal amino) e o termo ORF0657nH designa uma região correspondente à SEQ ID NO: 3 (sem a metionina do terminal amino).

Um polipeptido "aparentado" com ORF0657n contém uma região estruturalmente conotada com ORF0657n de comprimento completo, ou com um seu fragmento. Os polipeptidos aparentados com ORF0657n são polipeptidos que possuem pelo menos cerca de 90% de identidade sequencial com uma região correspondente de um 0RF0657n que ocorra naturalmente. O ORF0657n de referência, ilustrado na figura 1, corresponde ao ORF0657n proveniente de S. aureus COL (SEQ ID NO: 2). A identidade percentual com uma sequência de referência é determinada alinhando a sequência 16 polipeptídica com a sequência de referência e determinando o número de aminoácidos idênticos. Divide-se este número pelo número total de aminoácidos da sequência de referência e depois multiplica-se por 100 e arredonda-se para o número inteiro mais próximo. A figura la ajuda a ilustrar a importância de uma região central que compreende uma sequência de aminoácidos estruturalmente conotada com SEQ ID NO: 1. A SEQ ID NO: 1 compreende os aminoácidos 42-486 de ORF0657n COL. A SEQ ID NO: 1 contém também uma metionina no terminal amino, para facilitar a expressão. Os fragmentos polipeptídicos obtidos a partir dos aminoácidos 461-609, a partir dos aminoácidos 82-486 ou a partir dos aminoácidos 42-196 da SEQ ID NO: 2 não conferiram protecção.

Ao longo desta memória descritiva são referidas diferentes sequências de aminoácidos e de ácidos nucleicos. O quadro 1 agrupa um conjunto de algumas sequências polipeptidicas, indicando a região da figura 1 e modificações suplementares. O quadro 2 apresenta um resumo de algumas sequências de ácidos nucleicos.

Quadro 1

SEQ ID NOs: Região ORF0657n Mais modificações/mais informação 1 ORFO 657nl Metionina no terminal amino 2 Comprimento completo 3 ORFO 657nH Metionina no terminal amino 4 ORFO 657nH Metionina-glicina no terminal amino 5 ORFO 657nl Metionina-glicina no terminal amino 6 ORFO 657nH 7 ORFO 657nH 17 SEQ ID NOs: Região ORF0657n Mais modificações/mais informação 8 ORFO 657nH 9 ORFO 657nH 10 ORFO 657nH 11 ORFO 657nH 12 ORFO 657nH 13 ORFO 657nH 14 ORFO 657nH 15 ORFO 657nH 16 ORFO 657nH 17 ORFO 657nH 18 ORFO 657nH 19 ORFO 657nH 20 ORFO 657nH 21 ORFO 657nH 22 ORFO 657nH 23 ORFO 657nH 24 ORFO 657nH 25 ORFO 657nH 26 ORFO 657nH 27 ORFO 657nH 28 Comprimento completo SEQ ID NO: 2 modificada para conter uma glicina a seguir à metionina do terminal amino e uma cauda de His no terminal carboxilo 42 ORFO 657nl + Aminoácidos 1-481 da SEQ ID NO: 3 44 ORFO 657nG Metionina no terminal amino mais os aminoácidos 42-645 da SEQ ID NO: 2 54-63 ORFO 657nH Proveniente de S. aureus diferentes 106 e 107 Comprimento completo Proveniente de S. aureus diferentes Quadro 2 SEQ ID NO:

Região

Outra informação 18 SEQ ID NO: Região Outra informação 29 Comprimento completo Codifica a SEQ ID NO: 2 (nucleótidos 1-1935) + uma cauda de His no terminal carboxilo 30 ORF0657nH Codifica a SEQ ID NO: 4 (nucleótidos 1-1710) + uma cauda de His no terminal carboxilo 31 Comprimento completo Codifica a SEQ ID NO: 28 sem uma cauda de His no terminal carboxilo e com optimização de codões para expressão em leveduras 32 ORF0657nH Codifica a SEQ ID NO: 3 e com optimização de codões para expressão em leveduras 33 ORF0657nI Codifica a SEQ ID NO: 1 e com optimização de codões para expressão em leveduras 34 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 35 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 36 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 37 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 38 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com 19 SEQ ID NO: Região Outra informação optimização de codões para expressão em leveduras 39 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 40 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 41 ORF0657nH Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 43 ORF0657nI+ Codifica a SEQ ID NO: 42 e com optimização de codões para expressão em leveduras 45 ORF0657nG Codifica a SEQ ID NO: 44 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 46 ORF0657nH Codifica a SEQ ID NO: 17 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 47 ORF0657nI+ Codifica a região da SEQ ID NO: 17 I+, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina 48 ORF0657nI Codifica a região da SEQ ID NO: 17 I, com optimização de codões para 20 SEQ ID NO: Região Outra informação expressão em leveduras e codifica um codão de iniciação da metionina 49 Comprimento completo Codifica o ORF0657n de comprimento completo que contém a SEQ ID NO: 17 (SEQ ID NO: 106) modificada para conter uma glicina a seguir à metionina do terminal amino e com optimização de codões para expressão em leveduras 50 ORF0657nH Codifica a SEQ ID NO: 20 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras 51 ORF0657nI+ Codifica a região da SEQ ID NO: 20 I+, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina 52 ORF0657nI Codifica a região da SEQ ID NO: 20 I, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina 53 Comprimento completo Codifica o ORF0657n de comprimento completo que contém a SEQ ID NO: 17 (SEQ ID NO: 106) modificada para conter uma glicina a seguir à metionina do terminal amino e com optimização de codões para expressão em leveduras

Polipeptidos aparentados com a SEQ ID NO: 1

Uma região polipeptídica estruturalmente conotada com a SEQ ID NO: 1 contém uma identidade de aminoácidos que é pelo menos igual a 90% da SEQ ID NO: 1. Os polipeptidos que contêm uma região estruturalmente conotada com a SEQ ID NO: 21 1 podem ser concebidos com base nas orientações aqui apresentadas para a obtenção de polipeptidos que conferem protecção contra S. aureus.

Utilizando a SEQ ID NO: 1 como estrutura de referência, é possível fazer alterações tomando em consideração a sequência de aminoácidos de diferentes polipeptidos aparentados com os ORF0657n que ocorrem naturalmente e tendo em consideração as propriedades conhecidas dos aminoácidos. As alterações compreendem uma ou várias adições, delecções e/ou substituições de aminoácidos. 0 efeito global das diferentes alterações pode ser avaliado recorrendo a técnicas aqui descritas para confirmar a aptidão de um polipeptido particular para conferir imunidade protectora.

Concluiu-se que o ORF0657n está bem conservado em toda uma colecção de isolados clínicos de S. aureus, patológica e taxonomicamente diversos. (Ver o exemplo 5, infra). A figura 2 ilustra uma comparação entre sequências de aminoácidos, para diferentes sequências que contêm uma SEQ ID NO: 1. A comparação ilustrada de sequências é para a região ORF0657nH. A região ORF0657nH compreende a região ORF0657nI protectora mais pequena. 3-6 e 8-26 correspondem a A figura 2 ilustra uma comparação de sequências, entre as SEQ ID NO: 1 e 3-27. A comparação ilustra as diferenças de aminoácidos entre isolados clínicos de S. aureus, que podem ser utilizados para permitir a manipulação de potenciais alterações para proporcionar polipeptidos aparentados com S. aureus, tais como os de SEQ ID NOs: 1 e 3. Além disso, é possível fazer as alterações tomando em considerações propriedades conhecidas dos aminoácidos. As sequências SEQ ID NOs: 1, 22 sequências que ocorrem naturalmente, começando na posição número 3 e em que os números de posição 1 e 2 ilustram a adição de metionina ou de metionina-glicina ao terminal amino de algumas sequências. As SEQ ID NOs: 11-26 foram obtidas a partir de diferentes isolados clínicos. As SEQ ID NOs: 7 e 27 são variantes da região ORF0657nH de SEQ ID NO: 4, que contém cinco substituições de aminoácidos numa região fora da região central da SEQ ID NO: 1. É possível utilizar outras sequências de ORF0657n na comparação de sequências, para ajudar a fazer as alterações. Como exemplos de outras sequências da região ORF0657nH de S. aureus refere-se as SEQ ID NOs: 54-63 e como exemplos de sequências de comprimento completo, para as SEQ ID NOs: 17 e 20, refere-se as SEQ ID NOs: 106 e 107.

De um modo geral, ao substituir diferentes aminoácidos para conservar a actividade, é preferível substituir aminoácidos que possuam propriedades semelhantes. Os factores que podem ser tomados em consideração para as substituições de aminoácidos são o tamanho dos aminoácidos, a carga eléctrica, a polaridade e a sua hidrofobicidade. Os efeitos de grupos R de diferentes aminoácidos sobre as propriedades dos aminoácidos são bem conhecidos na especialidade. (Ver, por exemplo, Ausubel, Current Protocols in Molecular Biology, John Wiley, 1987-2002, Appendix 1C).

Na substituição de aminoácidos, para manter a actividade, a substituição de um aminoácido deve conservar uma ou várias propriedades semelhantes, tais como, aproximadamente, a mesma carga eléctrica e/ou o mesmo tamanho e/ou a mesma polaridade e/ou a mesma hidrofobicidade. Por exemplo, a substituição de leucina por valina, de lisina por arginina e de glutamina por 23 asparagina são operações adequadas para que não haja uma alteração da função do polipeptido.

As alterações para se conseguir obter um efeito particular compreendem aquelas que são concebidas para facilitar a produção ou a eficácia do polipeptido; ou a clonagem do ácido nucleico codificado. A produção do polipeptido pode ser facilitada mediante a utilização de um codão de iniciação (v.g., que codifique a metionina) conveniente para uma expressão recombinante. A metionina pode ser removida depois durante o processamento celular. A clonagem pode ser facilitada, por exemplo, pela introdução de locais de restrição, o que pode estar associado a adições ou trocas de aminoácidos. A eficácia de um polipeptido para induzir uma resposta imunitária pode ser aumentada mediante uma beneficiação do epitopo. A beneficiação de epítopos pode ser realizada recorrendo a diferentes técnicas, tais como as que implicam a alteração de resíduos de fixação para melhorar a afinidade do péptido para moléculas do MHC e também aquelas que aumentam a afinidade do complexo de péptido-MHC para um receptor de células T. (Berzofsky et al., Nature Review 1:209-219, 2001).

Em variantes diferentes, relativamente à região polipeptídica conotada com a SEQ ID NO: 1, a região é pelo menos 90%, pelo menos 94% ou pelo menos 99% idêntica à SEQ ID NO: 1; difere da SEQ ID NO: 1 por 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 alterações, ou até 50 alterações, ou consiste numa região conotada com OPR0657nI, seleccionada entre o conjunto constituído por: aminoácidos 1-442 das SEQ ID NOs: 11, 15, 16, 18 ou 54; 24 aminoácidos 1-443 da SEQ ID NO: 63; aminoácidos 1-444 das SEQ ID NOs: 57 ou 59; aminoácidos 1-445 das SEQ ID NOs: 7, 8, 9, 10, 12, 13, 14, 17, 19, 20, 55, 56 ou 58; aminoácidos 1-446 das SEQ ID NOs: 23 ou 24, aminoácidos 1-446 ou 2-446 das SEQ ID NOs: 1 ou 3; aminoácidos 1-447 das SEQ ID NOs: 25 ou 26; ou aminoácidos 1-447, 2-447 ou 3-4,47 das SEQ ID NOs: 4, 5 ou 27; aminoácidos 1-449 das SEQ ID NOs: 61 ou 62; aminoácidos 1-453 da SEQ ID NO: 60; e aminoácidos 1-454 das SEQ ID NOs: 6, 21 ou 22.

Podem estar presentes outros aminoácidos suplementares. Os aminoácidos suplementares podem estar no terminal carboxilo ou no terminal amino. Em variantes diferentes estão presentes 1, 2, 3, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 aminoácidos suplementares. Em variantes preferenciais, a metionina está presente no terminal amino; ou o grupo metionina-glicina está presente no terminal amino.

De acordo com uma variante da presente invenção, o polipeptido é constituído por uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 42 ou a um seu fragmento que compreende uma sequência de aminoácidos estruturalmente conotada com a SEQ ID NO: 1. Num variante diferente da SEQ ID NO: 42, o polipeptido é pelo menos 94% ou pelo menos 99% idêntico à SEQ ID NO: 42; difere da SEQ ID NO: 42 por 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 alterações, até 50 alterações ou até 65 alterações; ou é constituído pela SEQ ID NO: 42 ou por uma região conotada 25 com OFR0657nI, seleccionada entre o conjunto constituído por: aminoácidos 1-477 das SEQ ID NOs: 11, 15, 16, 18 ou 54; aminoácidos 1-478 da SEQ ID NO: 63;

Aminoácidos 1-479 das SEQ ID NOs: 57 ou 59; aminoácidos 1-480 das SEQ ID NOs: 7, 8, 9, 10, 12, 13, 14, 17, 19, 20, 55, 56 ou 58; aminoácidos 1-481 das SEQ ID NOs: 23 ou 24; aminoácidos 1-481 ou 2-481 das SEQ ID NOs: 1 ou 3; aminoácidos 1-482 das SEQ ID NOs: 25 ou 26; aminoácidos 1-482, 2-482 ou 3-482 das SEQ ID NOs: 4, 5 ou 27; aminoácidos 1-484 das SEQ ID NOs: 61 ou 62; aminoácidos 1-488 da SEQ ID NO: 60; e aminoácidos 1-489 das SEQ ID NOs: 6, 21 ou 22;

De acordo com uma outra variante da presente invenção, o polipeptido é constituído por uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 3 ou a uma seu fraqmento que compreende uma sequência de aminoácidos estruturalmente conotada com a SEQ ID NO: 1. Em variantes diferentes, relativamente à SEQ ID NO: 3, o polipeptido é pelo menos 94% ou pelo menos 99% idêntico à SEQ ID NO: 3; difere da SEQ ID NO: 3 por 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 1 5, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 alterações, até 50 alterações ou até 65 alterações; ou é constituído por uma sequência de aminoácidos seleccionada entre o conjunto constituído por SEQ ID NOs: 3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, \—1 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 54, 55, 55, 57, 55, 59, 60, 61, 62 e 63. 26

De acordo com uma outra variante, o polipeptido é constituído pela SEQ ID NO: 2, modificada pela inserção de uma glicina a seguir à metionina inicial, ou é um polipeptido com tal sequência, sem a metionina inicial.

De acordo com uma variante suplementar, o polipeptido é um polipeptido purificado. Um "polipeptido purificado" encontra-se presente no ambiente onde estão ausentes um ou vários outros polipeptidos com os quais se encontra naturalmente associado e/ou é representado pelo menos por cerca de 10% da proteína total presente. Em variantes diferentes, o polipeptido purificado representa pelo menos cerca de 50%, pelo menos cerca de 75% ou pelo menos cerca de 95% da proteína total existente numa amostra ou numa preparação.

De acordo com uma outra variante, o polipeptido é "substancialmente purificado". Um polipeptido substancialmente purificado está presente no ambiente em que faltam todos ou a maior parte de outros péptidos com os quais o péptido se encontra naturalmente associado. Por exemplo, um polipeptido de S. aureus, substancialmente purificado, está presente num ambiente onde falta a totalidade ou a maior parte de outros péptidos de S. aureus. Um ambiente pode ser, por exemplo, uma amostra ou uma preparação.

Os termos "purificado" ou "substancialmente purificado" não significam que um polipeptido seja sujeito a qualquer tipo de purificação, e podem abranger, por exemplo, um polipeptido sintetizado por via química, que não tenha sido purificado. É possível aumentar a estabilidade dos polipeptidos, modificando os terminais carboxilo ou amino do polipeptido. Como exemplos de modificações possíveis refere-se a 27 modificação de grupos de protecção do terminal amino, tais como os grupos acetilo, propilo, succinilo, benzilo, benziloxicarbonilo ou t-butiloxicarbonilo; e a modificação dos grupos de protecção do terminal carboxilo, tais como os grupos amida, metilamida e etilamida.

De acordo com uma variante da presente invenção, o polipeptido protector faz parte de um imunogénio constituído pelo polipeptido e por uma ou várias regiões ou radicais suplementares unidos de forma covalente ao polipeptido no terminal carboxilo ou no terminal amino. Cada região ou radical deve ser seleccionado independentemente entre regiões ou radicais que possuam pelo menos as seguintes propriedades: aumentem a resposta imunitária, facilitem a purificação ou facilitem a estabilidade do polipeptido. A estabilidade do polipeptido pode ser reforçada, por exemplo, utilizando grupos tais como um polietileno-glicol que pode estar presente nos terminais amino ou carboxilo. A purificação do polipeptido pode ser reforçada acrescentando um grupo aos terminais carboxilo ou amino, para facilitar a purificação. Como exemplos de grupos que é possível utilizar para facilitar a purificação refere-se os polipeptidos que proporcionam identificadores por afinidade. Como exemplos de identificadores por afinidade refere-se um identificador de hexa-histidina, trpE, glutationa e uma proteína de ligação à maltose. A aptidão de um polipeptido para produzir uma resposta imunitária pode ser reforçada recorrendo a grupos que geralmente reforçam uma resposta imunitária. Como exemplos de grupos que é possível juntar a um polipeptido para reforçar uma resposta imunitária contra o polipeptido 28 refere-se as citoquinas, tais como a IL-2. (Buchan et ai., 2000. Molecular Immunology 37:545-552).

Produção de polipeptidos

Os polipeptidos podem ser produzidos recorrendo a técnicas convencionais, incluindo as que implicam a síntese química e as que implicam a purificação a partir de uma célula que produza os polipeptidos. As técnicas para a síntese química de polipeptidos são perfeitamente conhecidas na especialidade. (Ver, v.g., Vincent, Peptide and Protein Drug Delivery, New York, N.Y., Decker, 1990). As técnicas para a purificação de polipeptidos a partir de uma célula estão ilustradas nos exemplos apresentados adiante. Há outros exemplos de técnicas de purificação, perfeitamente conhecidos na especialidade. (Ver, por exemplo, Ausubel, Current Protocols in Molecular Biology, John Wiley, 1987-2002). A obtenção de polipeptidos a partir de uma célula é facilitada utilizando técnicas recombinantes de ácidos nucleicos para produzir os polipeptidos. As técnicas recombinantes de ácidos nucleicos para a produção de um polipeptido prevêem a introdução ou a produção de um gene recombinante que codifique o polipeptido numa célula e a expressão do polipeptido.

Um gene recombinante contém um ácido nucleico que codifica um polipeptido conjuntamente com elementos reguladores para a expressão do polipeptido. O gene recombinante pode estar presente num genoma celular ou pode fazer parte de um vector de expressão. 29

Os elementos reguladores que podem estar presentes, como parte de um gene recombinante, compreendem os que estão naturalmente associados à sequência que codifica o polipeptido e os elementos reguladores exógenos que não estão naturalmente associados à sequência codificadora do polipeptido. Os elementos reguladores exógenos, tais como um promotor exógeno, podem ser úteis para expressar um gene recombinante num hospedeiro particular ou para aumentar o nivel de expressão. De um modo geral, os elementos reguladores, que estão presentes num gene recombinante, compreendem um promotor transcricional, um local de ligação ribossómica, um terminador e um operador, facultativamente presente. Um elemento preferível para o processamento em células eucarióticas é um sinal de poliadenilação. A expressão de um gene recombinante numa célula é facilitada mediante a utilização de um vector de expressão. De preferência, um vector de expressão, para além de um gene recombinante, contém também uma origem de replicação para replicação autónoma numa célula hospedeira, um marcador seleccionável, um número limitado de locais de enzimas de restrição e um potencial para um elevado número de cópias. Como exemplos de vectores de expressão refere-se os vectores de clonagem, os vectores de clonagem modificados, os plasmídeos especificamente concebidos e os vírus.

Devido à degeneração do código genético, é possível utilizar um grande número de diferentes sequências de ácidos nucleicos codificadoras, para codificar um polipeptido particular. A degeneração do código genético aparece porque quase todos os aminoácidos são codificados por diferentes combinações de tripletos de nucleótidos ou 30 "codões". Os aminoácidos são codificados por codões, do modo seguinte:

A=Ala=alanina: codões GCA, GCC, GCG, GCU C=Cys=cisteína: codões UGC, UGU D=Asp=ácido aspártico: codões GAC, GAU E=Glu=ácido glutâmico: codões GAA, GAG F=Phe=fenilalanina: codões UUC, UUU G—Gly—glicina: codoes GGA, GGC, GGG, GGU H=His=histidina: codões CAC, CAU I=Ile=isoleucina: codões AUA, AUC, AUU K=Lys=lisina: codões AAA, AAG

L=Leu=leucina: codões UUA, UUG, CUA, CUC, CUG, CUU M=Met=metionina: codão AUG N=Asn=asparagina: codões AAC, AAU P=Pro=prolina: codões CCA, CCC, CCG, CCU Q=Gln=glutamina: codões CAA, CAG

R=Arg=arginina: codões AGA, AGG, CGA, CGC, CGG, CGU S=Ser=serina: codões AGC, AGU, UCA, UCC, UCG, UCU T=Thr=treonina: codões ACA, ACC, ACG, ACU V=Val=valina: codões GUA, GUC, GUG, GUU W=Trp=triptofano: codão UGG Y=Tyr=tirosina: codões UAC, UAU

As células convenientes para a expressão de ácidos nucleicos recombinantes de polipeptidos aparentados com ORF0657n são células procarióticas e eucarióticas. Como exemplos de células procarióticas refere-se as de E. coli; os membros do género Staphylococcus, tais como S. aureus; os membros do género Lactobacillus, tais como L. plantarum; os membros do género Lactococcus, tais como L. lactis; e os membros do género Bacillus, tais como B. subtilis. Como exemplos de células eucarióticas refere-se as células de 31 mamíferos; as células de insectos; as células de leveduras, tais como os membros do género Saccharomyces (v.g., S. cerevisiae) , os membros do género Pichia (v.g., P. pastoris), os membros do género Hansenula (v.g., H. polymorpha), os membros do género Kluyveromyces (v.g., K lactis ou K. fragilis) e os membros do género Schizosaccharomyces (v.g., S. pombe) .

As técnicas para a produção recombinante de genes, para a introdução numa célula e para a expressão recombinante de genes, são perfeitamente conhecidas na especialidade. Como exemplos de tais técnicas refere-se as que vêm citadas em obras tais como as de Ausubel, Current Protocols in Molecular Biology, John Wiley, 1987-2002 e Sambrook et al., Molecular Cloning, A Laboratory Manual, 2a edição, Cold Spring Harbor Laboratory Press, 1989.

Se desejado, é possível reforçar a expressão num hospedeiro particular, mediante a optimização dos codões. A optimização dos codões inclui a utilização de codões mais preferenciais. As técnicas para a optimização de codões em diferentes hospedeiros são perfeitamente conhecidas na especialidade.

Os polipeptidos aparentados com ORF0657n podem conter modificações pós-traduccionais, por exemplo, uma glicosilação ligada a N, uma glicosilação ligada a O ou uma acetilação. Os termos "polipeptido" ou uma sequência de "aminoácidos" de um polipeptido designam polipeptidos que contenham um ou vários aminoácidos que possuam uma estrutura de uma modificação pós-traduccional proveniente de uma célula hospedeira, por exemplo, uma célula hospedeira de um mamífero, de um insecto ou de uma levedura. 32

As modificações pós-traduccionais podem ser produzidas quimicamente ou recorrendo a hospedeiros convenientes. Por exemplo, em S. cerevisiae parece que a natureza do penúltimo aminoácido determina se a metionina do terminal N é removida. Mais ainda, a natureza do penúltimo aminoácido também determina se o aminoácido do terminal N é Να-acetilado (Huang et al., Biochemistry 26:8242-8246, 1987). Um outro exemplo compreende um polipeptido destinado a secreção devido à presença de um lider secretor (v.g., um péptido de sinal), se o polipeptido for modificado por glicosilação ligada a N ou ligada a 0. (Kukuruzinska et al., Ann. Rev. Biochem. 56:915-944, 1987).

Expressão em leveduras

Os polipeptidos aparentados com ORF0657n são expressos, preferencialmente, em leveduras utilizando ácidos nucleicos codificadores que contenham codões optimizados para expressão em leveduras. A expressão em leveduras pode ser efectuada utilizando um gene recombinante que codifique um polipeptido aparentado com ORF0657n, e regiões reguladoras para a expressão em leveduras. Consoante o sistema de expressão utilizado, assim a proteína produzida pode permanecer intracelular ou ser excretada para fora da célula.

De preferência, o promotor para a expressão de genes recombinantes é um promotor induzível, tal como um promotor obtido a partir do "cluster" (grupo) de genes da galactose de leveduras (um promotor GAL, tal como GALl, GAL7, GAL10, MELl), ou o promotor da fosfatase ácida PH05, ou o promotor da desidrogenase II do álcool ADH2, ou o promotor da 33 metalotioneína regulado pelo cobre CUP1. Como exemplos de promotores "constitutivos" que é possível utilizar refere-se os promotores GAP (TDH) , PGK ou TPI. (Romanos et al., YEAST 8:423-488, 1992). A célula hospedeira de levedura, utilizada para a expressão recombinante, pode ser seleccionada ou geneticamente manipulada para facilitar a expressão de genes recombinantes. São tipicamente desejáveis mutações tais como as mutações mnn9, prbl e/ou pep4. Para aumentar a expressão a partir de promotores GAL, pode ser efectuada a sobreexpressão do factor de transcrição GAL4 (Hopper et al., patente de invenção norte-americana n° 5 068 185).

Efectua-se a optimização de codões para um hospedeiro particular substituindo os codões, que tenham um nível fraco ou moderado de expressão, por codões que tenham um nível de expressão elevado. A percentagem de codões óptimos presentes numa sequência codificadora pode variar. De acordo com diversas variantes, o número óptimo de codões (incluindo os codões inicialmente presentes e os codões introduzidos) é pelo menos 50%, pelo menos 75%, pelo menos 95% ou 100% do número total de codões. A optimização dos codões pode ser efectuada do modo seguinte: 1. para um codão particular, comparar a frequência característica do codão com a frequência global do codão utilizável pelos genes da levedura; 2. se o codão não for um daqueles que são vulgarmente utilizados pela levedura, substitui-lo por um codão óptimo para expressão elevada em células de leveduras; 3. repetir os passos (1) e (2) com diferentes codões até se obter o nível desejado de optimização dos codões; 34 4. inspeccionar a nova sequência codificadora para pesquisar sequências indesejadas que tenham sido geradas, tais como sequências indesejadas de locais de enzimas de restrição, de locais de junção, de promotores, sequências indesejadas de palindromas ou repetições, sequências terminadoras de transcrição e frequência elevada de bases GC; remover as sequências indesejadas, utilizando um codão alternativo. 0 recurso a um codão alternativo está descrito na obra de Lathe, J. Molec. Biol., 183:1-12, 1985. A maneira de utilizar codões em diferentes leveduras hospedeiras é perfeitamente conhecida na especialidade. Por exemplo, Sharp et al., Yeast 7:657-678, 1991, descrevem a maneira de utilizar codões sinónimos em Saccharomyces cerevisiae.

As figuras 8C-8M ilustram sequências optimizadas de ácidos nucleicos de leveduras. A figura 8C indica uma sequência optimizada de ácidos nucleicos de leveduras (SEQ ID NO: 31) que codifica a SEQ ID NO: 28 sem um identificador d mHis no terminal carboxilo. A figura 8D indica uma sequência optimizada de ácidos nucleicos de leveduras (SEQ ID NO: 32) que codifica a SEQ ID NO: 3. A figura 8E indica uma sequência optimizada de ácidos nucleicos de leveduras (SEQ ID NO: 33) que codifica a SEQ ID NO: 1. As figuras 8F-8M indicam sequências optimizadas de ácidos nucleicos de leveduras (SEQ ID NOs: 34-41) que codificam a SEQ ID NO: 7 que contém uma metionina no terminal amino. As figuras 8N-8U indicam sequências optimizadas de ácidos nucleicos de leveduras (SEQ ID NOs: 46-53) que codificam diferentes polipeptidos aparentados com ORF0657n, com base na SEQ ID NO: 17 ou SEQ ID NO: 20. 35 A expressão em leveduras pode ser conseguida utilizando sequências optimizadas e sequências não optimizadas para a expressão em leveduras (v.g., os nucleótidos 1-1935 ou 124-1458 da SEQ ID NO: 29, ou os nucleótidos 1-1710 da SEQ ID NO: 30) . Nos exemplos infra estão ilustradas técnicas para a expressão em leveduras, utilizando sequências optimizadas e sequências não optimizadas. A ORF0657n é uma proteína da superfície que contém um sinal de endereçamento para a parede celular do terminal C com 36 aminoácidos, com um motivo conservado "LPXTG". (Schneedwind et al. 1993, EMBO, 12: 4803-4811,1993). As proteínas que contêm um sinal de endereçamento para a parede celular estão presas ao invólucro da parede celular por meio de um mecanismo de transpeptidação catalisado pela sortase, que é uma proteína ligada à membrana (Mazmanian et al, Science 299:906-909, 2001). Para ficar presa, a proteína da superfície tem de conter também um péptido de sinal do terminal N exportável para a via secretora. Na via secretora, o péptido de sinal é removido e o sinal de selecção da parede celular facilita a retenção na via secretora. A sortase realiza então a clivagem entre a treonina e a glicina do motivo LPXTG e catalisa a formação de uma ponte amida entre o grupo carboxilo da treonina e o grupo amino das pontes cruzadas do peptidoglicano.

Concluiu-se que a expressão em leveduras aumentava significativamente removendo a sequência de endereçamento para a parede celular. Em diversas variantes, às construções codificadoras de polipeptidos falta-lhes uma sequência que codifique o endereçamento para a parede celular funcional e, mais preferencialmente, faltam-lhes as 36 sequências que codificam o endereçamento para a parede celular funcional e o péptido de sinal. Aos correspondentes péptidos preferenciais aparentados com ORF0657n falta-lhes uma sequência de endereçamento para a parede celular funcional ou faltam-lhes simultaneamente as sequências de endereçamento para a parede celular e do péptido de sinal.

Noutras variantes, não estão presentes, no polipeptido ou no ácido nucleico que codifica o polipeptido, pelo menos quase toda a sequência de endereçamento para a parede celular ou simultaneamente ambas as sequências de endereçamento para a parede celular e do péptido de sinal. Noutras variantes, a expressão da proteína aumenta pelo menos cerca de 10 vezes, pelo menos cerca de 15 vezes ou pelo menos cerca de 20 vezes, removendo pelo menos quase toda a sequência de endereçamento para parede celular ou ambas as sequências de endereçamento para a parede celular e do péptido de sinal. Mais preferencialmente, a construção codificadora contém também um ou vários codões optimizados para expressão em leveduras (v.g., S. cerevisiae).

No que diz respeito à SEQ ID NO: 2, é possível ilustrar exemplos de regiões muito parecidas, com sequências de péptido de sinal e de endereçamento para a parede celular de ORF0657n. Os aminoácidos 1-42 contêm a sequência do péptido de sinal. Os aminoácidos 609-645 contêm a sequência de endereçamento para a parede celular.

Adjuvantes

Os adjuvantes são substâncias que podem ajudar um imunogénio a produzir uma resposta imunitária. Os adjuvantes podem actuar por meio de diferentes mecanismos, 37 tais como um ou vários dos seguintes: aumentar o período de semi-vida imunológica ou biológica do antigénio; melhorar o fornecimento de antigénios às células que apresentam antigénios; melhorar o processamento de antigénios e a sua apresentação por células que apresentam antigénios; e induzir a produção de citoquinas imunomoduladoras. (Vogel, Clinicai Infectious Diseases 30 (suppl. 3):S266-270, 2000). É possível utilizar um conjunto de diferentes tipos de adjuvantes para ajudar a produzir uma resposta imunitária. Como exemplos de adjuvantes particulares refere-se os seleccionados entre hidróxido de alumínio, fosfato de alumínio ou outros sais de alumínio, fosfato de cálcio, motivos CpG de ADN, lípido A monofosforílico, toxina da cólera, toxina de E. coli instável ao calor, toxina da tosse convulsa, dipeptido muramílico, adjuvante incompleto de Freund, MF59, SAF, complexos imunoestimuladores, lipossomas, microesferas biodegradáveis, saponinas, copolímeros de bloco não iónicos, análogos do péptido muramílico, polifosfazeno, polinucleótidos sintéticos, IFN-γ, IL-2, IL-12 e ISCOMS. (Vogel Clinicai Infectious Diseases 30 (suppl 3):S266-270, 2000, Klein et al., Journal of Pharmaceutical Sciences 89:311-321, 2000, Rimmelzwaan et al., Vaccine 19:1180-1187, 2001, Kersten Vaccine 21:915-920, 2003, 0'Hagen Curr. Drug

Target Infect. Disord., 1:273-286, 2001).

Pacientes para lhes induzir imunidade protectora O termo "paciente" designa qualquer mamífero que possa ser infectado com S. aureus. É possível tratar um paciente profilática ou terapeuticamente. O tratamento profilático confere uma imunidade protectora suficiente para reduzir a 38 probabilidade ou a gravidade de uma infecção provocada por S. aureus. 0 tratamento terapêutico pode ser efectuado com a finalidade de se reduzir a gravidade de uma infecção provocada por S. aureus. É possível fazer um tratamento profilático utilizando uma vacina que contenha um imunogénio aqui descrito. Tal tratamento é efectuado, preferencialmente, num ser humano. As vacinas podem ser administradas, generalizadamente, a uma população ou às pessoas sujeitas e um maior risco de infecção provocada por S. aureus.

As pessoas sujeitas a um risco maior de infecção provocada por S. aureus são os trabalhadores que prestam cuidados de saúde, os pacientes hospitalizados, os pacientes com um sistema imunitário deprimido, os pacientes sujeitos a cirurgia, os pacientes que tenham recebido implantes corporais exógenos, tais como um cateter ou um dispositivo vascular, os pacientes sujeitos a uma terapia que reduza a imunidade, as pessoas com queimaduras ou ferimentos e as pessoas que trabalhem em profissões em que haja um risco maior de queimaduras ou lesões. (The Staphylococci in Human Disease, Crossley and Archer (ed.), Churchill Livingstone Inc. 1997).

Os pacientes não humanos que podem ser infectados com S. aureus são seleccionados entre bovinos, suínos, ovinos, caprinos, lagomorfos, equídeos, cães, gatos e murganhos. 0 tratamento de pacientes não humanos é útil para protecção de animais de companhia e animais de abate e também para avaliar a eficácia de um tratamento particular. 39

Resposta anamnéstica

Concluiu-se que os polipeptidos aparentados com ORF0657n produzem uma resposta imunitária rápida e eficaz em macacos Rhesus após uma dose única. (Ver o exemplo 17, infra). A resposta observada foi consistente com uma resposta anamnéstica. A produção de uma resposta anamnéstica proporciona vantagens significativas, tais como a aptidão para conferir uma imunidade eficaz, utilizando uma dose única, e para conferir a imunidade eficaz num curto intervalo de tempo. Em variantes diferentes, a resposta amnéstica tem como resultado um aumento da média geométrica das titulações pelo menos igual a 3 vezes, pelo menos igual a 5 vezes ou pelo menos igual a 6 vezes, comparativamente com as titulações preexistentes, sendo o número de vezes desses aumentos produzido ao fim de 3, 5, 7, 9, 14 ou 21 dias. A aptidão para gerar rapidamente uma resposta imunitária eficaz permite uma redução de custos, comparativamente com as vacinações de doses múltiplas, e pode servir para vacinar um paciente sujeito a um risco maior de infecção provocada por S. aureus. As pessoas sujeitas a um risco maior de infecção provocada por S. aureus são os trabalhadores que prestam cuidados de saúde, os pacientes hospitalizados, os pacientes com um sistema imunitário deprimido, os pacientes sujeitos a cirurgia, os pacientes que tenham recebido implantes corporais exógenos, tais como um cateter ou um dispositivo vascular, os pacientes sujeitos a uma terapia que reduza a imunidade, as pessoas com queimaduras ou ferimentos e as pessoas que trabalhem em profissões em que haja um risco maior de 40 queimaduras ou lesões. (The Staphylococci in Human Disease, Crossley and Archer (ed.), Churchill Livingstone Inc. 1997). Em variantes diferentes, um paciente é vacinado imediatamente ou ao fim de 3, 5, 7, 9, 14 ou 21 dias após um procedimento médico.

Vacinas combinadas

Os polipeptidos aparentados com ORF0657n, que conferem imunidade protectora, podem ser utilizados por si sós ou em combinação com outros imunogénios, para indução de uma resposta imunitária. Os outros imunogénios suplementares que também podem estar presentes são: um ou vários imunogénios suplementares de S. aureus, tais como os referenciados nos 'antecedentes da invenção', supra; um ou vários imunogénios que ataquem um ou vários organismos Staphylococcus diferentes, tais como S. epidermidis, S. haemolyticus, S. warneri ou S. lugunensis; e um ou vários imunogénios que ataquem outros organismos infecciosos.

Sistema de modelo com animais

Utilizou-se um sistema de modelo com animais para avaliar a eficácia de um polipeptido para produzir uma resposta imunitária protectora contra S. aureus. Foram encontrados dois obstáculos na concepção de um modelo de protecção com animais, designadamente: (1) a necessidade de uma dose estimulante muito elevada para superar a imunidade inata e (2) o ritmo a que os animais morrem é demasiadamente rápido para permitir a detecção de uma resposta protectora. Concretamente, os murganhos sucumbiram 41 à infecção em menos de 24 horas após terem sido infectados com as bactérias, o que não proporciona um período suficiente para que as respostas imunitárias concretas resolvam a infecção. Quando se reduziu a dose, tanto os murganhos de controlo como os murganhos imunizados sobreviveram à infecção.

Os obstáculos foram ultrapassados recorrendo a um modelo de letalidade com cinética reduzida, envolvendo o microrganismo S. aureus, a partir de células em fase estacionária, com titulação conveniente e com administração por via intravenosa. Esta cinética lenta, em termos de mortes, proporciona um tempo suficiente para que as defesas imunitárias específicas possam combater a infecção bacteriana (v.g., 10 dias em vez de 24 horas).

As células de S. aureus em fase estacionária podem ser obtidas a partir de células criadas em meio sólido. Também podem ser obtidas a partir de um meio líquido; no entanto, os resultados obtidos com células criadas em meio sólido foram mais reproduzíveis. As células podem ser criadas, convenientemente, de um dia para outro em meio sólido. Por exemplo, é possível criar S. aureus num período compreendido entre cerca de 18 e 24 horas, em condições em que o tempo para sua duplicação é de cerca de 20-30 minutos.

Os microrganismos Staphylococcus podem ser isolados a partir de meios sólidos ou líquidos, recorrendo a técnicas convencionais para manter a potência dos Staphylococcus. Os Staphylococcus isolados podem ser guardados, por exemplo, a -70°C, sob a forma de uma suspensão de alta densidade (> 109 unidades formadoras de colónias (UFC)/mL) em soluto salino tamponado com fosfato, contendo glicerol. 42 0 inoculo de Staphylococcus deve ter uma potência que determine entre cerca de 80 e 90% de mortes no modelo com animais ao longo de um período de cerca de 7 a 10 dias, começando no primeiro ou no segundo dias. As experiências de titulação podem ser realizadas utilizando os modelos com animais para monitorizar a potência do inoculo de Staphylococcus. As experiências de titulação podem ser realizadas cerca de uma a duas semanas antes de uma experiência de inoculação. A potência inicial para as experiências de titulação podem basear-se em experiências prévias. Para a estirpe 'Becker' do modelo animal, concluiu-se que um inoculo adequado de S. aureus está compreendido, geralmente, no intervalo entre 5 x 108 e 8 x 108 UFC/mL.

Administração

Os imunogénios podem ser formulados e administrados a um paciente utilizando os preceitos aqui apresentados, conjuntamente com técnicas bem conhecidas na especialidade. Por exemplo, é possível encontrar linhas de orientação para administração farmacêutica, em geral, nas obras 'Vaccines Eds. Plotkin e Orenstein, W.B. Sanders Company, 1999; Remington's Pharmaceutical Sciences 20a Edição, Ed. Gennaro, Mack Publishing, 2000; e Modern Pharmaceutics 2a Edição, Eds. Banker e Rhodes, Mareei Dekker, Inc., 1990.

Os veículos farmaceuticamente aceitáveis possibilitam a armazenagem e a administração de um imunogénio a um paciente. Os veículos farmaceuticamente aceitáveis podem conter diversos componentes, tais como tampões, água estéril para injecções, soluto salino normal ou soluto 43 salino tamponado com fosfato, sacarose, histidina, sais e polissorbatos.

Os imunogénios podem ser administrados por vias diferentes, tais como as vias subcutânea, intramuscular ou pelas mucosas. A administração subcutânea e intramuscular pode ser feita utilizando, por exemplo, agulhas ou injectores de jacto. os regimes adequados de doseamento são determinados, preferencialmente, tomando em consideração factores perfeitamente conhecidos na especialidade, incluindo a idade, a massa corporal, o sexo e o estado de saúde do paciente; a via de administração; o efeito desejado; e o composto particular utilizado. 0 imunogénio pode ser utilizado em protocolos de vacinação de doses múltiplas. Admite-se que uma dose possa estar contida no intervalo entre 0,1 pg e 1,0 mg de polipeptido total. Noutras variantes da presente invenção, o intervalo está compreendido entre 0,01 mg a 1,0 mg e entre 0,1 mg a 1,0 mg. A posologia irá depender de factores perfeitamente conhecidos na especialidade. Após a primeira administração, se tal for necessário para um determinado indivíduo, é possível administrar-lhe depois uma ou várias doses de reforço para manter as concentrações de anticorpos ou para as reforçar. Um exemplo de um regime de dosagem poderia ser uma administração no Io dia, uma administração ao fim de 1 mês, uma terceira dose ao fim de 4, 6 ou 12 meses e doses suplementares de reforço em datas mais afastadas, se necessário. 44

Geração de anticorpos E possível utilizar um polipeptido aparentado com ORF0657, capaz de induzir imunidade protectora, para gerar anticorpos e fragmentos de anticorpos que se ligam ao polipeptido ou a S. aureus. Tais anticorpos e fragmentos de anticorpos têm aplicações diferentes, incluindo a sua utilização na purificação de polipeptidos, na identificação de S. aureus ou no tratamento terapêutico ou profilático contra uma infecção provocada por S. aureus.

Os anticorpos podem ser policlonais ou monoclonais. As técnicas para a produção e utilização de anticorpos são perfeitamente conhecidas na especialidade. Como exemplo de tais técnicas refere-se as descritas por Ausubel em 'Current Protocols in Molecular Biology', John Wiley, 1987-1998, Harlow et al., Antibodies, A Laboratory Manual, Cold Spring Harbor Laboratory, 1988 e Kohler et al., Nature 256:495-497, 1975.

EXEMPLOS

Os exemplos adiante descritos servem para ilustrar diferentes particularidades da presente invenção. Os exemplos também ilustram uma metodologia útil para a prática da invenção. Estes exemplos não limitam a invenção reivindicada.

Exemplo 1: utilização da região ORFQ657n para conferir imunidade protectora

Este exemplo ilustra a aptidão da região ORF0657n de comprimento completo para conferir imunidade protectora. 45

Clonagem e expressão de ORFO657n

Foram concebidos iniciadores de PCR para amplificar o gene que codifica ORF0657n, começando no primeiro residuo asparagina e terminado antes do codão de terminação no residuo asparagina terminal. Estes iniciadores de PCR continham também os locais suplementares Ncol (iniciador directo) e Xhol (iniciador reverso) para facilitar a clonagem no vector de expressão. A proteína codificada foi concebida para ser expressa a partir do vector pET28 com os resíduos His terminais e com codão de terminação codificado pelo vector. Além disso, acrescentou-se um resíduo glicina à proteína a seguir ao iniciador metionina. A sequência resultante de ADN amplificado codifica ORF0657n com uma cauda de His no terminal carboxilo (SEQ ID NO: 28).

As sequências amplificadas por PCR foram ligadas ao vector pET28 (Novagen), utilizando os locais Ncol/Xhol que haviam sido geneticamente manipulados nos iniciadores de PCR e introduzidos na estirpe DH5a de E. coli (Invitrogen), por choque térmico. A mistura de transformação ficou a desenvolver-se de um dia para o outro em placas de ágar 'Luria-Bertani (LB)' contendo canamicina na concentração de 100 yg/mL, a 37°C. Efectuou-se a selecção das colónias que ficaram depois a desenvolver-se em LB contendo canamicina na concentração de 30 yg/mL, foram feitas minipreparações de ADN (Promega) e determinou-se a integridade da inserção por digestão de restrição e PCR. Efectuou-se a sequenciação de quatro minipreparações com um tamanho de inserção correcto, utilizando os iniciadores M13F (SEQ ID NO: 65), 46 M13R (SEQ ID NO: 66), ORF0657nF (SEQ ID NO: 67) e ORF0657nR (SEQ ID NO: 68) . Seleccionou-se um clone que não continha nenhumas alterações de ADN, a partir da sequência desejada. Efectuou-se a transformação de células HMS174(DE3) de E. coli (Novagen) que ficaram a desenvolver-se em placas de LB contendo canamicina (30 pg/mL); foram seleccionadas 3 colónias (UnkC-1, UnkC-2 e UnkC-3) para testes de expressão. As culturas líquidas de LB (canamicina) ficaram a incubar a 37°C, a 250 r.p.m., até se observar um valor A60o compreendido entre 0,6 e 1,0 e depois foram induzidas pela adição de IPTG até à concentração final de 1 mM, seguindo-se mais três horas de incubação. Efectuou-se uma colheita das culturas por centrifugação a 5000 x g durante 5 minutos a 4°C. Com as células preparou-se nova suspensão em 500 pL de tampão de lise (Bug Buster, com inibidores das proteases, Novagen). Acrescentou-se igual volume de tampão de carga (enriquecido com β-mercaptoetanol a 5% no volume final), antes de se ter aquecido as amostras a 70°C durante 5 minutos. Os extractos foram experimentados sobre géis 'Novex' contendo 4-20% de Tris-glicina, tendo as proteínas sido visualizadas (por coloração com o corante azul de Coomassie) e transferidas para nitrocelulose e hibridadas com uma sonda com anticorpos anti-HIS6 (Zymed).

Purificação de ORF0657n

Realizou-se um aumento directo, à escala, do processo em pequena escala descrito antes, em fermentadores de depósitos agitados (escala correspondente a 75 litros), com um volume de trabalho de 50 litros. Produziu-se uma cultura 47 de inoculo num balão de 250 mL contendo 50 mL de meio de Luria-Bertani (LB) (mais canamicina) e inoculou-se com 1 mL de uma cultura inoculante congelada e subsequente cultura durante 3 horas. Utilizou-se 1 mL deste inoculo para inocular um balão de 2 litros contendo 500 mL de meio LB (mais canamicina) e manteve-se tudo a incubar durante 16 horas. Produziu-se uma cultura num grande fermentador, à escala (escala de 75 litros,) contendo 50 litros de meio LB (mais canamicina). Os parâmetros de fermentação no fermentador foram os seguintes: pressão = 5 psig, velocidade de agitação = 300 r.p.m., caudal de ar = 15 litros/minuto e temperatura = 37°C. As células ficaram a incubar até se obter uma densidade óptica (DO) igual a 0,8 unidades de densidade óptica, para um comprimento de onda de 600 nm, com indução feita com isopropil-p-K-tiogalactosido (IPTG) com uma concentração igual a 1 mM. 0 período de indução, com IPTG, foi de três hortas. Efectuou-se a colheita das células diminuindo a temperatura para 15 °C e depois fez-se uma concentração recorrendo a uma passagem através de um cartucho de fibras ocas de 500KMWCO, com a subsequente centrifugação a 9 000 vezes o valor da gravidade a 4°C durante 20 minutos. Fez-se a decantação dos sobrenadantes e congelou-se a -70°C os agregados celulares húmidos de E. coli.

Com células recombinantes de E. coli (19,2 g de células húmidas) preparou-se uma suspensão em tampão de lise (Tris-HC1 50 mM a pH 8,0, NaCl 0,1 M, MgCl2 2 mM, imidazol 10 mM, 0,1 % de Tween 80™ e guanidina-HCl 6 M), à razão de 8 mL por grama de células húmidas. Acrescentou-se à suspensão uma mistura iniciadora de proteases para utilização com proteínas com identificador de poli-histidina (Sigma, P8849), à razão 48 de 0,05 mL por grama de massa celular. Além disso, acrescentou-se lisozimas até à concentração de 1 mg/mL e acrescentou-se também Benzonase™ (EM Ind.), à razão de 1 pL/mL. A citólise foi efectuada fazendo passar a suspensão através de um microfluidificador a trabalhar a 14 000 psi (modelo 110S da Microfluidics) , quatro vezes a 4°C. Juntou-se os resíduos celulares a 11 000 x g durante 30 minutos a 4°C e conservou-se o sobrenadante.

As proteínas portadoras da cauda de His foram purificadas a partir do sobrenadante. Misturou-se o sobrenadante com 20 mL de agarose Ni+-NTA (Qiagen) a 4°C, com inversões suaves durante 24 horas. Verteu-se a mistura numa coluna aberta (1,5 cm x 20 cm) e recolheu-se uma massa com a fracção não ligada. Lavou-se a coluna com tampão de lavagem (Tris-HCl 20 mM a pH 8,0, NaCl 0,15 M, 0,1% de Tween 80™) . O ORF0657n com o identificador de His foi objecto de eluição com um gradiente escalonado de imidazol 300 mM, Tris-HCl 20 mM a pH 7,5, NaCl 0,15 M, 0,1% Tween 80™.

As fracções que continham o ORF0657n (SEQ ID NO: 28) com a cauda de His foram detectadas pelo protocolo de SDS-PAGE e coloração com o corante de Coomassie, tendo sido todas reunidas. As fracções reunidas foram filtradas através de um filtro de 0,2 pm, para remoção do material constituído por partículas diminutas, e depois foram aplicadas numa coluna de exclusão de tamanhos (coluna de 'Sephacryl S-300 26/60', Amersham Biosciences) e fez-se a eluição com uma caudal de 1 mL/minuto, em que se utilizou MOPS 10 mM a pH 7,1 e NaCl 150 mM. As fracções que continham o ORF0657n com a cauda de His foram detectadas pelo protocolo de SDS-PAGE, com coloração com o corante de 49

Coomassie e pela transferência de 'Western' (anti-tetra His Mab, Qiagen). Removeu-se a endotoxina por filtração através de um biofiltro 'Zeta-Plus™' (CUNO). Determinou-se a concentração das proteínas por BCA (Pierce). Determinou-se a pureza por densitometria dos géis corados com o corante de Coomassie.

Exemplo 2: preparação do inoculo de S. aureus

Produziu-se S. aureus em placas de ágar de soja tríptica (TSA) (Becton Dickinson, Sparks, MD) a 37°C, de um dia para o outro. As bactérias foram removidas das placas de TSA por lavagem, acrescentando 5 mL de PBS a uma placa e recolocando suavemente em suspensão as bactérias com um espalhador estéril. Centrifugou-se a suspensão bacteriana a 6000 r.p.m. durante 20 minutos, utilizando uma centrifugadora 'Sorvall RC-5B' (DuPont Instruments). Com a massa obtida preparou-se nova suspensão em glicerol a 16%, tendo sido guardadas aliquotas congeladas a -70°C.

Antes da sua utilização, os inóculos foram descongelados, convenientemente diluídos e utilizados para provocar a infecção. Cada lote foi titulado pelo menos 3 vezes para se determinar a dose adequada para induzir, em cinética retardada, a morte de murganhos vulgares. A potência do inoculo bacteriano (aptidão para aniquilar 80 a 90% dos murganhos) foi monitorizada constantemente para se garantir a reprodutibilidade do modelo. Dez dias antes de cada experiência com o inoculo infeccioso, preparou-se um grupo de 10 animais de controlo (imunizados apenas com adjuvante) que foram depois monitorizados. 50

Exemplo 3: estudos de protecção utilizando polipeptidos aparentados com ORFQ657n com a cauda de His

Efectuou-se a imunização de 25 murganhos BALB/c com três doses de ORF0657n (SEQ ID NO: 28) com a cauda de His, à razão de 20 pg por dose, em adjuvante de hidroxifosfato de alumínio (450 pg por dose) . 0 adjuvante de hidroxifosfato de alumínio (AHP) foi descrito por Klein et ai., Journal of Pharmaceutical Sciences 89, 311-321, 2000. As doses foram administradas sob a forma de duas injecções intramusculares de 50 pL nos dias 0, 7o e 21°. Retirou-se o sangue dos murganhos ao 28° dia, tendo os seus soros sido pesquisados pelo protocolo de ELISA para se investigar a reactividade ao ORF0657n com a cauda de His.

Ao 35° dia da experiência, os murganhos foram inoculados por injecção intravenosa de S. aureus, segundo uma dose de 7,3 x 108 UFC/mL, determinada em experiências de titulação, para provocar a morte ao longo de um período aproximadamente entre 2 e 7 dias. Avaliou-se a sobrevivência neste modelo letal, com mortes com uma cinética retardada, por comparação com um conjunto de murganhos de controlo que haviam sido apenas pseudo-imunizados com AHP. Os murganhos foram monitorizados ao longo de um período de 14 dias para se verificar a sua sobrevivência (Figura 3A) . No final da experiência sobreviveram 11 murganhos do grupo imunizado com ORF0657n, comparativamente com três que sobreviveram no grupo de controlo em que os animais receberam AHP.

As figuras 3B e 3C ilustram a protecção utilizando os polipeptidos correspondentes às regiões ORF0657nH e ORF0657nI. A figura 3B ilustra a protecção com a SEQ ID NO: 51 4 que contém uma cauda de His no terminal carboxilo. A figura 3C ilustra os resultados obtidos com a SEQ ID NO: 5 que contém uma cauda de His no terminal carboxilo.

Exemplo 4: obtenção de sequências de ORFQ657n

Tem sido atribuído ao ORF0657n uma função na aquisição de ferro em S. aureus. (Andrade et al., Genome Biology 3(9):47.1-47.5, 2003). Têm sido atribuídas às sequências de ORF0657n, algumas delas provenientes de fontes diferentes, designações diferentes em obras diferentes. (Ver, por exemplo, Et z et al., PNAS USA, 99:6573-6578, 2002 (LPXTGVI); Baba et al. , The Lancet 359:1819-1827, 2002 (MW1011); Kuroda, et al . , The Lancet 357, 1225-1240, 2001 (SA0976); Andrade et al., Genome Biology 3(9):47.1-47.5, 2003 (S_aur2); Mazmanian et al., Science 299:906-909, 2003 (isdB); Mazmanian et al., Molecular Microbiology 40:1049-1057, 2001. (sasJ); e Taylor et al., Mol. Microbiol. 43:1603-1614, 2002 (sirH). Há uma sequência polipeptídica, correspondente a uma sequência de uma proteína ORF0 657n que vem sendo apresentada em diversas publicações de patentes de invenção (Meinke et al., patente de invenção internacional número WO 02/059148, publicada a 1 de Agosto de 2002, Wang et al., patente de invenção internacional número WO 02/077183, publicada a 3 de Outubro de 2002, Masignani et al., patente de invenção internacional número WO 02/094868, publicada a 28 de Novembro de 2002, Foster et al. , patente de invenção internacional número WO 02/102829, publicada a 27 de Dezembro de 2002 e Foster et al., patente de invenção 52 internacional com o número WO 03/011899, publicada a 13 de Fevereiro de 2003) . O ADN genómico foi obtido a partir de diversos isolados clínicos de S. aureus. Acrescentou-se os isolados clínicos a 3 mL de caldo de soja tríptico da Difco (Becton Dickinson, Sparks, MD) e manteve-se tudo a incubar de um dia para o outro a 37°C e a 150 r.p.m.. As culturas produzidas de um dia para o outro foram centrifugadas em tubos de Eppendorf de 1,5 mL a 14 000 r.p.m. durante 5 minutos. Decantou-se o caldo de cultura e com as massas obtidas preparou-se nova suspensão em 500 pL de tampão para a nova suspensão (25% de sacarose, Tris 10 mM a pH 7,5) . Acrescentou-se uma aliquota de uma solução de lisostafina (Sigma-Aldrich, St. Louis, MO), com uma concentração de 2 mg/mL, a cada massa recolocada em suspensão. As suspensões ficaram depois a incubar a 37°C durante 1 hora.

No final do período de incubação, acrescentou-se 250 pL de SDS a 2% a cada tubo e remexeu-se vigorosamente até a viscosidade da solução diminuir declaradamente. Acrescentou-se 250 pL de uma solução de fenol-clorofórmio-isoamilo (25:24:1, v/v) (Gibco/Invitrogen Corporation, Grand Island, NY) . Remexeu-se a mistura vigorosamente durante 30 segundos e centrifugou-se durante 5 minutos a 14 000 r.p.m.. Removeu-se a fase aquosa superior e repetiu-se os passos de precipitação até não haver praticamente nenhuma interface. Acrescentou-se 0,1 volume de NaOAc 3M a pH 4,8 a cada tubo e misturou-se. Depois acrescentou-se 1 volume de isopropanol e misturou-se outra vez. Manteve-se os tubos a incubar durante 5 minutos à temperatura ambiente e depois foram centrifugados a 14 000 r.p.m. durante 15 minutos. Decantou-se o sobrenadante e deixou-se os tubos secar, com a parte de 53 cima voltada para baixo, sobre tecido. Com as massas obtidas preparou-se nova suspensão em 50 pL de H20 estéril. O ADN isolado foi utilizado como um molde para a PCR. Amplificou-se o gene utilizando um iniciador directo (ORF0657nF, SEQ ID NO: 67) e um iniciador reverso (ORF0657nR, SEQ ID NO: 68). Os produtos de PCR foram sequenciados recorrendo aos protocolos convencionais ' Big Dye' .

Exemplo 5: comparação de diversos ORFQ657n provenientes de diferentes isolados de S. aureus

Verificou-se que o ORF0657n está bem conservado em todo um conjunto de isolados clínicos de S. aureus patológica e taxonomicamente diversificados. O quadro 3 apresenta um resumo dos valores percentuais de identidade entre diferentes isolados, incluindo os isolados clínicos.

Quadro 3

Estirpe MLST Fonte País CP ORF0657n % ID CL-1 1 Isolado hipervirulento de sangue de pessoas contagiadas Reino Unido MSSA 8 99 MW2 1 Isolado hipervirulento de sangue de pessoas contagiadas E.U.A. MRSA 8 99 54

Estirpe MLST Fonte País CP ORF0657n % ID CL-2 1 Lesão do antebraço esquerdo E.U.A. MSSA 8 99 CL-3 1 Lesão do braço E.U.A. MSSA 8 99 CL-4 5 Pé esquerdo E.U.A. MRSA 5 99 CL-5 5 Lesão E.U.A. MRSA 5 100 Um 5 0 5 Pus, infecção da lesão cirúrgica JAPÃO VISA 5 100 N315 5 Esfregaço da faringe Japão MRSA 5 100 CL-6 5 CDC3 E.U.A. MRSA/VISA 5 97 CL-7 8 Sangue Alemanha MRSA 5 98 NCTC8325 8 Estirpe laboratorial de MSSA E.U.A. MSSA 5 99 CL-8 8 Lesão da perna direita E.U.A. MRSA 5 99 CL-90 9 Narinas Reino Unido MSSA 5 97 CL-10 9 Sangue Reino Unido MSSA 5 97 CL-11 12 Sangue Holanda MSSA 8 97 CL-12 12 Narinas Reino Unido MSSA 8 97 CL-13 15 Pele do dedo esquerdo E.U.A. MSSA 8 99 CL-14 15 Pus, 'anaresle' esquerda E.U.A. MSSA 8 99 CL-15 15 Sangue Reino Unido MSSA 8 99 CL-16 22 Sangue Canadá MSSA 5 99 CL-17 22 'MRSA Barnin' Alemanha MRSA 5 98 55

Estirpe MLST Fonte País CP ORF0657n % ID CL-18 25 Sangue Canadá MRSA 5 97 CL-19 25 Sangue Reino Unido MSSA 5 97 CL-20 25 Narinas Reino Unido MSSA 5 97 CL-21 30 Fonte desconhecida mecIV Suécia MRSA 8 94 CL-22 30 Fonte desconhecida mecIV Alemanha MRSA 8 94 CL-23 36 Sangue epidémico com MRSA Reino Unido MRSA 8 94 CL-24 45 Pus do coto da perna esquerda E.U.A. MRSA 8 95 CL-25 45 Narinas E.U.A. MRSA 8 95 Becker 45 Estirpe protótipo da cápsula 8 E.U.A. MSSA 8 95 COL 88 Estirpe laboratorial MRSA E.U.A. MRSA 5 100 CL-26 97 Sangue Holanda MSSA 5 98 CL-27 97 Sangue Canadá MSSA 5 99 CL-28 97 Narinas Reino Unido MSSA 5 99 CL-29 121 Narinas, doença contagiosa Reino Unido MSSA 8 96 CL-30 121 Sangue Reino Unido MSSA 8 96 56

Estirpe ML ST Fonte País CP ORF0657n % ID CP, tipo de cápsula; MLST, sequência Multilocus característica de agrupamentos taxonómicos; MRSA S. aureus resistente à meticilina; MSSA, 5. aureus sensível à meticilina; "CL" significa isolado clínico. "ID" significa identidade. "VISA" significa S aureus intermediário de vancomicina.

Determinou-se a identidade percentual (% ID) alinhando a sequência polipeptidica com a SEQ ID NO: 2 e determinando o número de aminoácidos idênticos. Dividiu-se este número pelo número total de aminoácidos (da SEQ ID NO: 2) e depois multiplicou-se por 100 e arredondou-se para o número inteiro mais próximo.

Exemplo 6: protecção contra diferentes isolados clínicos de S. aureus

Avaliou-se a eficácia de ORF0657n como imunogénio contra diferentes isolados clínicos de S. aureus utilizando como imunogénio o ORF0657n com cauda de His (SEQ ID NO: 28) . Como inóculos infecciosos utilizou-se um subconjunto de isolados taxonomicamente diversificados, descritos no Quadro 3. As sequências de ORF0657n destes diferentes isolados eram diferentes da sequência da OFR0657n utilizada como vacina.

As estirpes infecciosas obtidas foram preparadas utilizando as técnicas descritas no Exemplo 2. Os murganhos foram imunizados e infectados utilizando as técnicas descritas no Exemplo 3, com monitorização durante 10 dias. Os inóculos infecciosos, vulgarmente utilizados nos 57 modelos, excederam bastante aqueles que são normalmente encontrados em infecções de seres humanos.

Demonstrou-se a protecção contra estirpes sensíveis e contra estirpes resistentes à meticilina. Os resultados estão ilustrados nas figuras 4A-4H.

Exemplo 7; optimização dos codões da SEQ ID NO; 28 para expressão em leveduras. A sequência de ácidos nucleicos que codifica os aminoácidos 1-646 da SEQ ID NO: 28 foi objecto de optimização dos codões para expressão em leveduras. Na figura 8C (SEQ ID NO: 31) está indicada uma sequência, com optimização dos codões, para os aminoácidos 1-646 da SEQ ID NO: 28.

Utilizou-se a SEQ ID NO: 29, sem a região codificadora da cauda de His do terminal carboxilo, como construção inicial para a optimização. A distribuição geral de utilização dos codões da sequência codificadora, antes da optimização, era: 28% de codões (179) eram muito raros ou nunca utilizados por genes de leveduras com expressão elevada e 20% (126) eram moderadamente raros.

Efectuou-se a optimização dos codões dos ácidos nucleicos que codificam os aminoácidos 1-646 da SEQ ID NO: 28, para substituir os codões que têm uma expressão diminuta ou moderada por codões com elevada expressão em leveduras. Além disso, acrescentou-se um codão de glicina à segunda posição. A optimização dos codões foi feita utilizando o programa informático MacDNAsis Pro V3.0. O quadro de parâmetros utilizados para se fazer a tradução inversa de proteínas indica a existência de codões 58 fortemente expressos em S. cerevisiae. No programa informático MacDNAsis Pro, a função utilizada foi "Translate > [Protein -->DNA]". Os resultados são gerados com o titulo "Conversão de Aminoácidos" ("Amino Acid Conversion").

Em alguns casos, há mais do que um codão fortemente expresso para um determinado aminoácido. Por exemplo, a serina é codificada por "TCT" ou "TCC". Nestes casos, utilizou-se aproximadamente números iguais dos dois codões diferentes. 0 Quadro 4 agrupa um conjunto de codões fortemente expressos em S. cerevisiae.

Quadro 4

Aminoácido codão(ões) óptimo(s) Aminoácido codão(ões) óptimo(s) Phe TTC His CAC Leu TTG Gin CAA Ile ATT, ATC Asn AAC Met ATG Lys AAG Vai GTT, GTC Asp GAC Ser TCT, TCC Glu GAA Pro CCA Cys TGT Thr ACT, ACC Trp TGG Ala GCT Arg AGA Tyr TAC Gly GGT

Todos os codões considerados como não óptimos foram trocados por codões existentes em genes fortemente expressos em leveduras, com a excepção de dois codões da alanina que foram trocados por codões existentes em genes moderadamente expressos (GCG começando nos nucleótidos 505 e 1546) de SEQ ID NO: 31. 59

Preparou-se a sequência global que codifica o ORF0657n, fazendo a hibridação e a extensão de 25 oligómeros (SEQ ID NOs: 69-93), concebidos para codificarem a sequência final desejada. Os oligómeros tinham um comprimento de 85-110 pb. Os oligómeros eram a sequência codificadora de ORF0657n. Cada oligómero tinha uma sobreposição complementar de 25-29 pb com o oligómero adjacente e o duplex tinha um valor de Tm de 80-84°C. Calculou-se este valor manualmente, atribuindo a um par de bases GC um valor de 4°C e a um par de bases AT um valor de 2 °C.

Foram realizadas sete reacções de extensão separadas, utilizando três ou quatro oligómeros sobrepostos adjacentes e iniciadores directos e reversos de PCR com um comprimento de (23-26) nt com o duplex com um valor Tm=70-72°C. Utilizou-se polimerase de ADN de Pfu espontânea (STRATAGENE, La Jolla, CA) para as reacções de PCR, tendo sido utilizado um protocolo de amplificação com as características seguintes: 95°C durante 90 segundos, um ciclo; 95°C durante 30 segundos, 55°C durante 30 segundos, 68°C durante 3 minutos para 5 ciclos, seguindo-se imediatamente uma segunda serie de reacções; 95°C durante 30 segundos, 52°C durante 30 segundos, 68°C durante 3 minutos para 20 ciclos. A reacção foi completada por incubação a 68°C durante 7 minutos. Como resultado destas reacções de PCR foram criados sete fragmentos colineares do gene (doravante aqui designados, por razões de conveniência, pelos números 1, 2, 3, 4, 5, 6 e 7).

Os fragmentos foram isolados por electroforese em gel de agarose e os produtos com as dimensões adequadas foram excisados e purificados utilizando o método 'GENE CLEAN® 60 II' (QBIOgene, Carlsbad, CA), em conformidade com as recomendações do fabricante. Os fragmentos colineares 1, 2 e 3, os fragmentos colineares 4 e 5 e os fragmentos colineares 6 e 7 foram combinados, em reacções subsequentes de PCR, com os iniciadores adequados para se obter os fragmentos A, B e C, respectivamente. O gene completo para o ORF0657n foi depois montado por meio de uma reacção suplementar de PCR em que os fragmentos A, B e C foram combinados utilizando os iniciadores distais directo e reverso. Os produto de PCR final foi isolado em gel e clonado em pCR®-BluntII-TOPO® (INVITROGEN, Carlsbad, CA), conforme recomendado pelo fabricante. Obteve-se a sequência de ADN de diversos clones independentes, tendo sido identificados os erros.

Procedeu-se a uma correcção dos erros em diferentes segmentos dos clones independentes, pUC3, pUC4 e pUC6, quer sequencialmente, utilizando o estojo de mutagenese dirigida ao local 'QUIK-CHANGE', quer simultaneamente, com o estojo de multimutagenese dirigida ao local 'QUIK-CHANGE' (STRATAGENE, La Jolla, CA) , em conformidade com as recomendações do fabricante. Obteve-se a sequência corrigida final permutando os fragmentos de restrição reparados, obtidos a partir dos três clones. Com um fragmento de Xmnl de 1,1 kb do clone pUC4 substitui-se o correspondente fragmento Xmnl de pUC3 para se construir o pUnkC 13. Com um fragmento Accl de 456 pares de bases de pUC6 substitui-se o correspondente fragmento de pUnkC 13 para se construir o pUnkCRl, tendo sido verificada a sequência de ADN. 61

Exemplo 8: construção de estirpes de Saccharomyces cerevisiae para expressão de genes recombinantes

Este exemplo ilustra as técnicas que podem ser utilizadas para se obter estirpes de Saccharomyces cerevisiae para a expressão de genes recombinantes. A criação das estirpes designadas por 1260 e 1309 está descrita adiante. Como as condições genéticas naturais de uma estirpe podem influenciar bastante as propriedades de uma estirpe para a expressão de proteínas heterólogas, considerou-se desejável construir estirpes de leveduras com diferentes condições naturais genéticas, que contivessem também diversos marcadores genéticos desejáveis: (1) uma mutação mnn9 para impedir a hiperglicosilação das proteínas segregadas, (2) mutações das proteases prbl e/ou pep4 para redução dos problemas relacionados com a proteólise e (3) sobreexpressão do factor de transcrição GAL4 com a finalidade de se aumentar a expressão a partir dos promotores GAL.

Construção da estirpe S. cerevisiae designada por 1260

Construiu-se uma estirpe inicial de S. cerevisiae da maneira a seguir descrita. Cruzou-se a estirpe Y379-5D de S. cerevisiae (MATCC, cyh2, nibl, rho~, cir°) (Livingston, Genetics 86:73-84, 1977) com a estirpe DC04 (MATCC, adel, adeX, leu2-04r cir°) (Broach et al., Cell 21:501-508, 1980) . Depois de a estirpe diplóide resultante ter sido esporulada, as tetradas foram dissecadas por procedimentos convencionais. Um dos esporos haplóides deu origem à 62 estirpe 2150-2-3 (MATOC, adel, leu2-04, cir°) . A estirpe LB-347-1C de S. cerevisiae, de tipo emparelhamento (X (MATCC, mnn9) , é a estirpe X2180-1B de S. cerevisiae (MATCC, SUC2, mal, mel, gal2, CUPl; ATCC número 204504) que contém uma mutação mnn9. A estirpe LB-347-1C foi emparelhada com a estirpe típica 2150-2-3 (MATCC, leu2-04, adel), misturando as estirpes numa placa de ágar com meios completos YEHD (Carty et al., J. Ind. Micro 2:117-121, 1987). Para a selecção dos diplóides, as estirpes emparelhadas foram replicadas em placas sobre meios mínimos sem leucina e que continham 2% de sacarose, enquanto fonte exclusiva de carbono. Após o isolamento de colónias singulares e subsequente esporulação dos diplóides, dissecou-se um asei por técnicas convencionais. Isolou-se a estirpe KHY-107, enquanto esporo haplóide singular, tendo sido caracterizado como ADEl, leu2 e mnn9 (pela técnica de coloração de Schiff). Preparou-se um lote congelado em glicerol e guardou-se a -70°C. A partir do lote congelado a -70°C preparou-se uma cultura de KHY-107 (cir+) e transformou-se com o vector pCl/1 de levedura, que contém o gene LEU2-d de levedura e que está aparentado como pJDB219 (Beggs, Nature 275:104-109, 1978), com a excepção de o ADN de pMB9 ter sido substituído pelo ADN de pBR322. Produziu-se uma cultura de transformante isolado em meio líquido selectivo (ao qual lhe faltava leucina e que continha sorbitol 1M) , tendo sido depois multiplicado através de diversas passagens por meio enriquecido (contendo sorbitol 1 M) para perder simultaneamente o ADN de pCl/1 e de 2μ. As colónias que tinham perdido pCl/1 (incapazes de se multiplicarem em meio a que faltava leucina) foram verificadas por hibridação de 63 tipo ADN-ADN para se pesquisar a presença de ADN de 2μ. Escolheu-se um clone isolado, KHY-107(cir°)-1, que não revelou a presença de nenhum ADN de 2μ, e guardou-se como lote congelado (-70°C) em glicerol.

Por disrupção de genes fez-se com que a estirpe KHY-107 (cir°)-l ficasse ura3. Construiu-se um plasmídeo contendo o gene URA3 de S. cerevisiae desmembrado por duas cópias do gene Aph3'I de Tn903. Excisou-se a cassete 5'-URA3-Aph3'I-URA3-3' para fora do vector e utilizou-se para transformar KHY-107(cir°)-1. Os transformantes que haviam integrado a cassete ura3 desmembrada foram seleccionados sobre placas de ácido 5-flúor-orótico (Kaiser, C. et al., Methods in Yeast Genetics - edição de 1994, Cold Spring Harbor Laboratory Press, (Cold Spring Harbor, Nova Iorque; 1994) paginas 214-215), e depois verificou-se que eram incapazes de se multiplicarem no meio a que faltava uracilo. Escolheu-se um clone isolado, KHY-107ura3(PN2) , e guardou-se um lote congelado (-70°C) em glicerol.

Deixou-se a estirpe KHY-107ura3(PN2) multiplicar-se em meio complexo (contendo sorbitol 1 M) e depois distribuiu-se por placas em meio sintético contendo canavanina em vez de arginina, tendo sido obtidos mutantes resistentes à canavanina (canR) . Foram produzidas preparações raiadas de mutantes espontâneos canR, para colónias isoladas, em meio sintético sólido contendo canavanina em vez de arginina. Comprovou-se que as colónias isoladas eram canl, por meio de testes convencionais de complementação genética. Escolheu-se uma colónia isolada de canl, designada por DMY10, e conservou-se sob a forma de um lote congelado (-70 °C) em glicerol. 64

Para se realizar a sobreexpressão do factor de transcrição de GAL4 de leveduras, integrou-se o gene de fusão GAL10p-GAL4 no gene HIS3 de DMY10. Excisou-se a cassete 5'-HIS3-GALl0p-GAL4-URA3-HIS3-3' para fora do pKHint-C (Schultz et al., Gene 61:123-133, 1987) e utilizou-se para transformar DMY10. Os transformantes que tinham integrado a cassete foram seleccionados sobre meio sintético sólido ao qual lhe faltava uracilo e depois verificou-se que eram incapazes de se multiplicarem no meio a que faltava histidina. Verificou-se por hibridação 'Southern' a integração da cassete apenas no local HIS3. Escolheu-se um integrante isolado, DMY10int-3, e guardou-se como lote congelado (-70°C) em glicerol. Esta estirpe recebeu a designação de CF52. 0 plasmídeo FP8ÁH portador do gene PRBI de S. cerevisiae (Moehle et al.r Genetics 115:255-263, 1987) foi digerido com HindIII mais Xhol e o fragmento de ADN de 3,2 kpb, portador do gene PRBI, foi purificado em gel e cortado com as extremidades a condizer por tratamento com polimerase de ADN de T4. 0 plasmídeo pUC18 foi digerido com BamRI, purificado em gel e cortado com a extremidades a condizer por tratamento com polimerase de ADN de T4. Ligou-se o fragmento do vector resultante com o fragmento do gene PRBI, referido anteriormente, para se obter o plasmídeo pUC18-PRBl. 0 plasmídeo YEp6 (Struhl et ai., Proc. Natl. Acad. Sei., USA 76:_1035, 1979), que continha o gene HIS3, foi digerido com BamHI. 0 fragmento de BamRI de 1,7 kpb resultante, portador do gene HIS3 funcional, foi purificado em gel e depois foi cortado com as extremidades a condizer por tratamento com polimerase de ADN de T4. 0 vector pUC18-PRBl foi digerido com EcoRV mais Ncol que efectua o corte 65 dentro da sequência codificadora de PRBl e que remove o local activo da protease B e a sequência de flanqueamento. 0 fragmento EcoRV-Ncol de 5,7 kpb, portador das porções residuais 5' e 3' da sequência codificadora de PRBl em pUC18, foi purificado em gel, cortado com as extremidades a condizer por tratamento com polimerase de ADN de T4, desfosforilado com fosfatase alcalina e ligado ao fragmento HIS3 com as extremidades a condizer descrito anteriormente. 0 plasmideo resultante (designado por pUC18-prbl::HIS3, lote #1245) contém o gene HIS3 no lugar da parcela do gene PRBl que havia sido suprimida anteriormente. 0 vector (pUC18-prbl::HIS3) de desmembramento do gene PRBl foi digerido com Saci mais XbaI para gerar uma cassete de desmembramento prbl::HIS3 e foi utilizado para transformação da estirpe CF52 pelo processo do acetato de litio (Ito et al., J Bacteriol. 153:163, 1983). Efectuou-se a selecção dos transformantes His+ sobre meio de ágar sintético ao qual lhe faltava histidina, tendo servido para se fazer uma preparação raiada no mesmo meio utilizado para os isolados clonais. Preparou-se ADN genómico a partir de diversos isolados His+ resultantes, o qual foi digerido com EcoRI e depois submeteu-se a electroforese sobre géis de agarose a 0,8%. As análises de transferência de 'Southern' confirmaram a presença do desejado desmembramento do gene prblA::HIS3.

Um dos isolados que continha o desejado desmembramento do gene prblA::HIS3 foi seleccionado para utilização subsequente e depois atribui-se-lhe a designação de estirpe #1260. Efectuou-se a preparação de lotes congelados em glicerol para a estirpe #1260 para armazenagem a -70°C. O genótipo resultante da estirpe 1260 é o seguinte: MATa, 66 leu2-2,112, mnn9, ura3D, canl, his3A::GALlOp-GAL4-URA3, prblÁ::HIS3, cir°.

Construção da estirpe de S. cerevisiae designada por 1309 A estirpe BJ1995 de S. cerevisiae (MATa, leu2, trpl, ura3-52, prbl-1122, pep4-3, gal2) foi já descrita anteriormente (Jones, E. W., Tackling the Protease Problem in Saccharomyces cerevisiae, Methods in Enzymology 194 (1991), páginas 428-453). Isolou-se um derivado cir° de BJ1995, ao qual lhe faltava o ADN do plasmideo 2μ endógeno, utilizando o procedimento descrito na construção da estirpe 1260. O isolado cir° resultante recebeu a designação de estirpe 91 e foi guardado como lote congelado (-70°C) em glicerol.

Depois construi-se um derivado da estirpe 91 que produz em excesso o factor de transcrição GAL4, com a finalidade de se aumentar a transcrição a partir dos promotores de GAL. Fez-se digerir o plasmideo pKHint-C (Schultz et ai., Gene 61:123-133, 1987) com BamEI e utilizou-se a cassete resultante 5'-HIS3-GAL10p-GAL4-URA3-HIS3-3' para transformar a estirpe 91. Os transformantes que tinham integrado a cassete foram seleccionados sobre meio sintético sólido ao qual lhe faltava uracilo, tendo-se verificado depois que eram incapazes de se multiplicarem no meio a que faltava histidina. A desejada integração da cassete no locus HIS3 foi verificada por hibridação 'Southern', utilizando uma sonda hibridante para o gene HIS3 de levedura. Escolheu-se um integrante isolado, BJ1995cir°int #22, e guardou-se como lote congelado (-70°C) 67 em glicerol. Este isolado recebeu a designação de estirpe 1282.

Depois isolou-se um derivado da estirpe 1282 que continha um desmembramento do gene MNN9, praticando o conjunto de passos a seguir descritos. Para se desmembrar o gene MNN9 foi necessário clonar, em primeiro lugar, o gene MNN9 a partir de ADN genómico de S. cerevisiae com o intuito de se preparar um vector de desmembramento do gene. Isto foi feito recorrendo a uma tecnologia convencional de PCR. Concebeu-se um iniciador directo no sentido 5' e um iniciador reverso no sentido 3' para a PCR da sequência codificadora de MNN9 de comprimento completo, com base na sequência publicada para o gene MNN9 de levedura (MacKay et al., publicação da patente de invenção europeia número EP0314096, publicação da patente de invenção internacional com a data de 3 de Maio de 1989) . Foram utilizados os seguintes iniciadores oligodesoxinucleotidicos que contêm os locais de flanqueamento HindiII (sublinhados): iniciador de sentido directo (SEQ ID NO: 94) : 5'-CTT AAA GCT TAT GTC ACT TTC TCT TGT ATC G-3'; iniciador de sentido reverso (SEQ ID NO: 95): 5'-TGA TAA GCT TGC TCA ATG GTT CTC TTC CTC-3'. 0 codão de metionina iniciador para o gene MNN9 está evidenciado a negrito.

Efectuou-se a PCR utilizando como molde ADN genómico de S. cerevisiae. 0 fragmento de 1,2 kpb resultante da PCR, portador do gene MNN9, foi digerido com HindIII, purificado em gel e ligado com fosfatase alcalina digerida com HindlII, tratada com pUC13. 0 plasmideo resultante recebeu a designação de pll83. Isolou-se o gene TRPl de levedura a partir de YRp7 (Struhl et al., Proc. Natl. Acad. Sei. USA 76:1035-1039, 1979) sob a forma de um fragmento de 0,85 kb 68 de EcóRI-BglII que foi cortado com as extremidades a condizer e inserido depois no local Pinll do plasmideo pll83. 0 local PmlI está no meio da sequência codificadora de MNN9, pelo que a inserção do qene TRPl nesse local tem como resultado o desmembramento do gene. 0 plasmideo resultante pUC13-mnn9::TRPl (pH11885-239-l) foi depois digerido com Hpal mais EcoRI e utilizou-se a cassete 5' -mnn9-TRPl-mnn9-3' para transformação da estirpe 1282 pelo método do acetato de litio. (Ito et al.r J Bacteriol. 153:163, 1983).

Efectuou-se a selecção dos transformantes Trp+ sobre placas de ágar em meio sintético a que faltava triptofano e produziu-se uma preparação raiada sobre as mesmas placas para os isolados de colónias singulares. Preparou-se o ADN genómico a partir de alguns dos isolados Trp+ resultantes, digeriu-se com HindIII e depois submeteu-se a electroforese sobre géis de agarose a 0,8%. As análises pela transferência de 'Southern' confirmaram a presença do desejado desmembramento do gene mnn9::TRP1. Um destes isolados, que continha o desejado desmembramento do gene mnn9::TRPl, foi seleccionado para utilização posterior e recebeu a designação de estirpe 1309. Com a estirpe 1309 procedeu-se à preparação de lotes congelados em glicerol para armazenagem a -70°C. O genótipo da estirpe 1309 é o seguinte: MATa, leu2, mnn9::TRPl, trpl, ura3-52, his3A::GALl0p-GAL4-URA3, prbl-1122, pep4-3, gal2, cir°.

Exemplo 9: expressão da região ORFQ657n de comprimento completo

Após a expressão de ORF0657n de comprimento completo em E. coli (SEQ ID NO: 28; His-Tag ORF0657n) e em S. 69 cerevisiae (aminoácidos 1-646 de SEQ ID NO: 28), efectuou-se a comparação dos produtos de expressão.

Expressão em S. cerevisiae 0 ADN que codifica a proteína ORF0657n com os codões optimizados para a expressão em leveduras foi amplificado a partir do clone final corrigido, pUnkCRl (Exemplo 7), utilizando os seguintes iniciadores directo e reverso, respectivamente, UnkCY-F (SEQ ID NO; 96), 5'AAC CGG TTT GGA TCC CAC AAA ACA AAA TGG GTA ACA AGC AAC AAA AGG AAT TC3' e UnkCY-R (SEQ ID NO: 97), 5'AAC CGG TTT GGA TCC TTA GTT CTT TCT CTT TCT TGG CAA GAC3', contendo locais de flanqueamento e restrição BamHI. 0 iniciador de sentido directo contém uma sequência de 5' não traduzida e o codão ATG e o iniciador de sentido reverso contém TAA enquanto codão de terminação. 0 produto de 1,9 kb resultante foi isolado em gel e clonado no vector pCR2.1 'TOPO TA' (INVITROGEN CORPORATION, Carlsbad, CA) , de acordo com as instruções do fabricante, para se construir o plasmídeo UnkC-Bl. Depois verificou-se a sequência de ADN da inserção. 0 fragmento BamEI foi isolado em gel e subclonado com a orientação correcta dentro de um vector de levedura (pGALHO, Fig. 5A) para construção de pRUnkC-pGALllO. Verificou-se a sequência da inserção por sequenciação do ADN.

Utilizou-se o ADN plasmídico proveniente de pRUnkC-pGALHO para transformar estirpes de S. cerevisiae que contêm uma mutação leu2 para prototrofia da leucina (Leu+) , recorrendo a um protocolo de transformação com esferoplastos (Hinnen et al., Proc. Natl. Acad. Sei. U.S.A, 70 75:1929-33, 1978). A construção das estirpes 1260 e 1309 está indicada no Exemplo 8, supra.

Efectuou-se a selecção de transformantes sobre meio de ágar sintético a que faltava leucina e que continha sorbitol 1M. Os meios de ágar sintéticos, superior e inferior, a que falta leucina e que contêm sorbitol 1M, foram obtidos em REMEL, Lenexa, KS (cat #09459 e 92155, respectivamente). Os isolados Leu+ clonais foram obtidos por multiplicação em série sobre placas SD menos leucina (KD MEDICAL, Columbia MD).

Para a pesquisa de transformantes múltiplos foram produzidas culturas de 5,0 mL que ficaram a desenvolver-se em tubos de cultura sujeitos a rotação lenta a 30°C. Depois confirmou-se a produção para transformantes seleccionados em culturas de 25 mL produzidas num balão de 125 mL. Em ambos os casos, foram produzidas culturas de inóculos de 5 mL desenvolvidas a 30°C em meio '5X menos leucina' contendo 4,0% de glicose e sorbitol 0,1 M, durante 18-24 horas, até se obter um valor DC>6oo entre 1,5-3,0/mL. O meio ' 5X menos leucina' contém os componentes a seguir indicados, por litro: base azotada de levedura sem acréscimo de aminoácidos ou de sulfato de amónio, 8,5 g; adenina, 0,40 g; L-tirosina, 0,25 g; uracilo, 0,20 g, ácido succinico, 10,0 g, sulfato de amónio, 5,0 g e 50 mL de solução número 3 menos leucina. A solução número 3 menos leucina contém, por litro de água destilada, os seguintes componentes: L-arginina, 2 g; L-histidina, 1,0 g; L-isoleucina, 6 g; L-lisina 4,0 g; L-metionina, 1,0 g; L-fenilalanina, 6,0 g; L-triptofano, 4,0 g. Ajustou-se o valor do pH do meio para 5,3 com uma solução de hidróxido de sódio a 50% 71

Para a produção em tubos, transferiu-se uma aliquota de 0,3 mL da cultura de inoculo para 5,0 mL de meio ' 5X menos leucina' contendo 2% de glicose, 4% de galactose ou meio YEHDG, durante 72 horas, até se obter um valor final D060o entre 5-16, 0/mL. O meio YEHDG contém, por litro: L-Hy-peptona de soja-Sheffield, 10 g; extracto de levedura, 20 g; L-dextrose, 16 g; D ( + ) galactose, 40 g. Para a produção em balões, transferiu-se uma aliquota de 1,5 mL da cultura de inoculo para 25 mL de meio e esperou-se que o desenvolvimento ocorresse conforme descrito antes, com rotação a 220 r.p.m..

Após a colheita de 10 unidades de DO por amostra, fez-se o desmembramento das massas celulares com esférulas de vidro em 0,3 mL de tampão de lise (tampão de fosfato de sódio 0,1 M a pH 7,2, NaCl 0,5 M e PMSF 2 mM). Recuperou-se o lisado por centrifugação, efectuou-se a lavagem das esférulas/células não desmembradas com 0,3 mL de tampão de lisado e depois combinou-se os sobrenadantes clarificados. Determinou-se a concentração de proteínas pelo sistema do reagente corante no ensaio proteico 'BIO-RAD' (BIO-RAD, Hercules, CA), em conformidade com as instruções do fabricante. Efectuou-se a análise dos lisados celulares para pesquisa da expressão de ORF0657n por análise de imunoblot após a electrof orese em gradiente de géis de Tris-glicina entre 4-20% (INVITROGEN, Carlsbad, CA) em tampão IX Tris-glicina SDS (BIO-RAD) em condições redutoras e desnaturantes. As amostras continham 20 pg de proteína celular total. Efectuou-se uma electroblot dos géis sobre filtros de membranas de nitrocelulose de 0,45 pm (Optitran de Schleicher e Schuell, Keene, NH) . Para se estimar o tamanho das proteínas, foram executadas, paralelamente com 72 os lisados, experiências com padrões previamente colorados, com massas atómicas entre 6,4 e 203 kDa (padrão previamente colorado de espectro largo para o protocolo de SDS-PAGE, BIO-RAD).

Padrão de E. coli

Como padrões utilizou-se o ORF0657n com cauda de His (SEQ ID NO: 28) purificado a partir da cultura de E. coli produtora (estirpe hospedeira HMS 174 (DE3) de E. coli, NOVAGEN, Madison, WI), induzida para produzir ORF0657n, e um lisado de células. A estirpe E. coli foi transformada com um vector de expressão que expressa o ORF0657n com cauda de His. O crescimento da cultura de E. coli decorreu de um dia para o outro em caldo LB contendo canamicina na concentração de 30 pg/mL a 37°C. No dia seguinte, utilizou-se 60 pL da cultura produzida de um dia para o outro para inocular 6,0 mL de caldo LB mais canamicina na concentração de 30 pg/mL. A cultura desenvolveu-se a 37°C durante um período aproximado de 3 horas até se obter um valor D06oo compreendido entre 0,4-1,0. Induziu-se a expressão com IPTG 1 mM durante 2 horas a 37°C. Efectuou-se a colheita das células e guardou-se a massa de células a -80°C.

Preparou-se o lisado de E. coli utilizando o reagente de extracção de proteínas 'Bugbuster' (NOVAGEN, Madison, WI), em conformidade com o protocolo do fabricante. Efectuou-se a imunodetecção das proteínas por transferência de 'Western', utilizando um anticorpo monoclonal de murinos ("designado por "2H2B8") contra ORF0657n, enquanto anticorpo primário, e utilizou-se como anticorpo secundário o anticorpo inteiro de cabra anti-IgG (H+L) de murganho 73 ligado à peroxidase de rábano (HRP) (ZYMED LABORATORIES, South San Francisco, CA) . 0 mAb 2H2B8 foi gerado por imunização de murganhos com ORF0657n de comprimento completo purificada, produzida por E. coli. Seleccionou-se o mAb 2H2B8 pelo protocolo ELISA e comprovou-se que era especifico para ORF0657n. 0 processamento dos filtros foi feito utilizando o estojo que contém o substrato de conjugado com HRP da BIO-RAD.

Produtos de expressão de E. coli e de S. cerevisiae A partir da pesquisa inicial de transformantes de leveduras seleccionou-se um transformante de cada uma das estirpes de leveduras 1260 e 1309, por serem as estirpes que melhor produzem a região ORF0657n de comprimento completo (SEQ ID NO: 2 8 sem a cauda de His do terminal carboxilo) . Nas figuras 6A e 6B está ilustrado um exemplo da sua produção da região ORF0657n de comprimento completo ao fim de 72 horas de fermentação em meio YEHDG, comparativamente com a produção da região ORF0657n (SEQ ID NO: 28) em E. coli. A proteína principal detectada pela análise de transferência de 'Western' com o mAb 2H2B8 tinha aproximadamente 105-110 kDa, conforme ilustrado na figura 6A (estirpe 1260) e 6B (estirpe 1309): pistas 5 e 6. A proteína que tem aproximadamente 105-110 kDa corresponde, em tamanho, à maior proteína detectada na amostra de ORF0657n recombinante purificada, produzida em E. coli (SEQ ID NO: 28; pista 2) ou num extracto de uma cultura em que se induziu a produção de ORF0657n de E. coli (esta última não está incluída nos géis da figura 6) . As proteínas de 74 105-110 kDa produzidas por E. coli e por S. cerevisiae possuem um peso molecular maior do que o peso molecular previsto no nosso sistema de electroforese em gel. Faz-se observar que as espécies predominantes detectadas nos controlos de E. coli eram mais pequenas, aproximadamente 95 kDa, e migraram conjuntamente com uma quantidade menor de proteína produzida na levedura. Admite-se que a proteína que tem -105-110 kDa corresponda à ORF0657n de comprimento completo que foi expressa com a líder secretora de E. coli, tanto em E. coli como em S. cerevisiae, e admite-se que as proteínas de 95 kDa sejam um produto de degradação. Não foi observada nenhuma detecção com um extracto de um transformante de controlo obtido com o vector pGALHO por si só (pistas 3 e 4).

Uma estimativa da quantidade de região ORF0637n (SEQ ID NO: 28 sem a cauda de His no terminal carboxilo) , produzida pelos transformantes 1260 e 1309, foi -10 pg de ORF0657n/mL de meio YEHDG com a região ORF0657n a conter -2% da proteína total, conforme determinado por análise semi-quantitativa por transferência de 'Western' utilizando como padrão 100 ng de ORF0657n (SEQ ID NO: 28) . Tanto a quantidade expressa como a percentagem (%) de região ORF0657n (SEQ ID NO: 28 sem a cauda de His no terminal carboxilo) da proteína total foram maiores ao fim de 72 horas, comparativamente com os resultados obtidos ao fim de 48 horas, em ambas as estirpes (dados não apresentados). O título da região ORF0657n (SEQ ID NO: 28 sem cauda de His no terminal carboxilo), produzido pelos transformantes da estirpe 1260 em meio '5X leucina' contendo 2% de glicose e 4% de galactose, foi -8,0 pg/mL e a percentagem total de proteína foi de 2,0%. 75

Exemplo 10: Expressão da sequência secretada optimizada ao nível dos codões que codifica uma região ORFQ657nH O vector pKH4-3B (Carty et al., Biotechnol. Lett. 12:879-884, 1990) contém a líder secretora pré-pro do factor oc de levedura (MFal) . A fusão de uma proteína desejada com esta líder tem como resultado um produto de tradução que é clivado primeiro pela peptidase de sinal de S. cerevisiae. Subsequentemente, a protease Kex2 cliva a sequir ao "resíduo Lis Arq" na líder secretora, sendo libertada a proteína madura. Utilizou-se o promotor GAL10 induzível em S. cerevisiae para comandar a expressão da proteína.

Utilizou-se o vector pKH4-3B para expressar um gene optimizado pelo codão, que codifica uma SEQ ID NO: 3 alterada. A SEQ ID NO: 3 foi alterada mediante a remoção de uma metionina do terminal amino e acrescentando uma sequência líder ao terminal amino. A região que codifica a SEQ ID NO: 3 de codões optimizados é constituída pelos nucleótidos 4-1710 da SEQ ID NO: 32, e a sequência que codifica a líder é constituída pelo vector pKH4-3B preparado conforme adiante se descreve.

Fez-se uma fusão concatenada da líder secretora pré-pro do factor cc do vector pKH4-3B para a região ORF0657nH de SEQ ID NO: 3. Isto foi realizado fazendo digerir o vector pKH4-3B com SphI, seguindo-se o tratamento com polimerase de ADN de T4 para remoção da formação saliente SphI, criando uma extremidade a condizer no terminal 5' com o codão adequado da líder. A seguir, fez-se digerir o vector com BamHI para criar o local de clonagem em 3' . A 76 construção exige um produto de PCR com uma extremidade de 5' correspondente a condizer com o segundo codão para reconstrução da região ORF0657nH (SEQ ID NO: 32), e uma extremidade 3' com um codão de terminação num local de restrição BamHI.

0 ADN que codifica a região ORF0657nH com os codões optimizados para a expressão em leveduras foi amplificado a partir de pUnkCR 1 (Exemplo 7), utilizando correspondentemente os iniciadores directo e reverso a seguir indicados: UCKHS2 (SEQ ID NO: 98), 5' GCTGAAGAAACTGGTGGTACCAAC3f e UCKHA2, (SEQ

ID NO: 99) 5'GTCACGGATCCTTAAGACTTAGCCTTGTTTTCTTGAGTGTTC3'. A extremidade 5' do iniciador directo, GCT, codifica alanina, que é o terminal N previsto para a região ORF0657nH. 0 iniciador reverso contém um codão de terminação TAA e um local BamHI (sublinhado) . 0 produto da PCR de 1,7 kb dai resultante foi isolado em gel e clonado em pH4-3B (preparado conforme descrito antes) para construção do pUS38. Verificou-se a sequência de ADN total da inserção e verificou-se a sequência parcial do vector, tendo sido comprovado que estava feita a desejada fusão com a secretora. Uma clivagem adequada, feita por Kex2p, da proteína inicial expressa a partir desta construção teria como resultado uma proteína correspondente à SEQ ID NO: 3 sem metionina no terminal N.

Utilizou-se o plasmídeo pUS38 para transformar as estirpes 1260 e 1309 de S. cerevisiae para prototrofia à leucina (Leu+) , recorrendo a um protocolo de transformação dos esferoplastos (Hinnen et ai., Proc. Natl. Acad. Sei. U.S.A. 75:1939-33, 1978). Efectuou-se a selecção dos transf ormantes em meio de ágar sintético a que faltava leucina e que continha sorbitol 1 M. Os meios de ágar sintéticos, superior e inferior, a que faltava leucina e 77 que continha sorbitol 1M provieram de REMEL, Lenexa, KS (cat #09459 e 92155, respectivamente). Os isolados Leu+ clonais foram obtidos por meio de culturas em serie feitas sobre placas de SD menos leucina (KD MEDICAL, Columbia MD).

Para a pesquisa de transformantes múltiplos foram produzidas culturas de inóculos de 5 mL a 30°C em meio '5X menos leucina' contendo 4,0% de glicose e sorbitol 0,1 M, durante 18-24, horas até se obter um valor D060o entre 1,5-3,0/mL. O meio '5X menos leucina' contém os componentes a seguir indicados, por litro: base azotada de levedura sem acréscimo de aminoácidos ou de sulfato de amónio, 8,5 g; adenina, 0,40 g; L-tirosina, 0,25 g; uracilo, 0,20 g, ácido succinico, 10,0 g, sulfato de amónio, 5,0 g e 50 mL de solução número 3 menos leucina. A solução número 3 menos leucina contém, por litro de água destilada, os seguintes componentes: L-arginina, 2 g; L-histidina, 1,0 g; L-isoleucina, 6 g; L-lisina 4,0 g; L-metionina, 1,0 g; L-fenilalanina, 6,0 g; L-triptofano, 4,0 g. Ajustou-se o valor do pH do meio para 5,3 com uma solução de hidróxido de sódio a 50%. Para a produção em tubos, transferiu-se uma aliquota de 0,3 mL da cultura de inoculo para 5,0 mL de meio ' 5X menos leucina' contendo 2% de glicose, 4% de galactose ou meio YEHDG, durante 72 horas, até se obter um valor final ϋΟεοο entre 10-20,0/mL. O meio YEHDG contém, por litro: L-Hy-peptona de soja-Sheffield, 10 g; extracto de levedura, 20 g; L-dextrose, 16 g; D(+)galactose, 40 g.

Efectuou-se a colheita dos produtos de fermentação, removendo as células das leveduras e analisando os sobrenadantes directamente para se pesquisar a expressão da região ORF0657nH (SEQ ID NO: 3) por análise de transferência de 'Western' ou pelo protocolo de SDS-PAGE e 78 coloração dos géis com o corante de Coomassie. Para a análise de imunoblot, foram utilizadas amostras de 10 a 25 pL que foram submetidas a electroforese em géis contendo Tris-HCl com um gradiente entre 4-15% (BIORAD, Hercules, CA) em tampão IX SDS contendo Tris-glicina (BIORAD, Hercules, CA) em condições redutoras e desnaturantes. Os geís foram objecto de electroblot sobre filtros constituídos por membranas de PVDF de 0,2 pm. As proteínas foram imunodetectadas com o anticorpo monoclonal 2H2B8, enquanto anticorpo primário, e com o anticorpo inteiro de cabra anti-IgG (H+L) de murganho ligado à peroxidase de rábano (ZYMED LABORATORIES, South San Francisco, CA), enquanto anticorpo secundário. O mAb 2H2B8 está descrito no Exemplo 9. O processamento dos filtros foi feito utilizando o estojo 'WESTERN LIGHTNING™ Chemiluminesence Reagent Plus' (PERKIN ELMER, Wellesley, MA).

Para a análise da expressão da região de ORF0657nH recombinante da levedura (SEQ ID NO: 3) por coloração dos géis de SDS-PAGE com o corante de Coomassie, submeteu-se as amostras a electroforese sobres géis com Tris-HCl em gradiente variável em 4-15% (BIO-RAD) em tampão IX SDS contendo Tris-glicina (BIO-RAD), em condições redutoras e desnaturantes. Os géis foram corados com corante de Coomassie 'Βίο-Safe', que é um corante Coomassie G250, em conformidade com o protocolo de fabricante (BIO-RAD).

Como padrão qualitativo utilizou-se um lisado celular obtido a partir da cultura de E. coli produtora de ORF0657nH (SEQ ID NO: com uma cauda de His no terminal carboxilo). A sequência prevista de aminoácidos da região ORF0657nH expressa em E. coli é idêntica à sequência de aminoácidos prevista para a região ORF0657nH expressa 79 internamente em S. cerevisiae (SEQ ID NO: 3), com a excepção da presença de glicina a seguir à metionina do terminal N na construção de E. coli.

Para se obter a região ORF0657nH em E. coli, deixou-se crescer a cultura produtora de um dia para o outro em caldo LB contendo canamicina com a concentração de 50 pg/mL, a 37°C. Utilizou-se a SEQ ID NO: 4 codificadora de pET28, com uma cauda de His no terminal carboxilo, para se conseguir a expressão da proteína. No dia seguinte, utilizou-se 500 pL da cultura produzida de um dia para o outro para inocular 5,0 mL de caldo LB contendo canamicina na concentração de 50 pg/mL. Deixou-se esta cultura crescer a 37°C durante aproximadamente 3 horas até se obter um valor DCpoo igual a 0,6. A expressão foi induzida com IPTG 1 mM durante 3,5 horas a 37°C. Efectuou-se a colheita das células e guardou-se a massa celular a -80°C. Preparou-se o lisado de E. coli utilizando o reagente de extracção de proteínas 'Bugbuster' (NOVAGEN, Madison, WI), em conformidade com o protocolo do fabricante.

Também se incluiu como padrão a proteína proveniente do lisado celular do transformante 1-1 de S. cerevisiae em que tem lugar a expressão interna da região ORF0657nH (SEQ ID NO: 3), conforme descrito e preparado no Exemplo 11, infra. Para se avaliar o tamanho das proteínas, foram feitas experiências paralelamente para comparação de padrões previamente corados, variando entre 10 e 250 kDa (BIO-RAD), com as amostras de géis para o protocolo de SDS-PAGE, corados com o corante de Coomassie, e por avaliação por transferência de 'Western'. A produção das espécies desejadas foi obtida em meio ' 5X menos leucina' contendo 2% de glicose mais 4% de 80 galactose. Os transformantes que continham o pUS38 de ambas as estirpes 1260 e 1309 segregaram uma proteína de ~80 kDa que migrou conjuntamente e em estreita associação com a região ORF0657nH expressa internamente na levedura (a partir da SEQ ID NO: 3 codificadora de ácido nucleico) e com a ORF0657nH expressa em E. coli (a partir da SEQ ID NO: 4 codificadora de ácido nucleico, com uma cauda de His do terminal carboxilo), que foi detectada por transferência de 'Western' e por coloração com o corante de Coomassie. Segundo uma experiência típica, submeteu-se a electroforese 500 ng destes lisados de contraprova e 25 pL de sobrenadante do meio. A detecção foi específica; a proteína de 80 kDa não foi detectada num sobrenadante de um vector que contém um transformante, nem por transferência de 'Western' nem por coloração com o corante de Coomassie. A proteína segregada, com ~80 kDa poderia corresponder à região ORF0657nH não glicosilada madura (SEQ ID NO: 3) ou então, em alternativa, podia conter alguns resíduos glicosilo. Foi detectada pelo anticorpo uma espécie de peso molecular maior nos sobrenadantes, e também duas proteínas com um peso molecular menor, tendo sido todas coloradas com o corante azul de Coomassie. A espécie de peso molecular maior poderia conter a líder não processada e/ou poderia ser gl icosilada. É provável que as duas espécies de peso molecular menor sejam produtos de degradação.

Uma estimativa da quantidade de espécie de 80 kDa segregada pelos transformantes de ambas as estirpes 1260 e 1309 foi de 2 pg/mL de meio de cultura. Fez-se esta determinação comparando o sinal 'Western' a 80 kDa com o da amostra do lisado de células de levedura que contém a região ORF0657nH (SEQ ID NO: 3), sugerindo isso que a 81 região ORF0657nH constitui pelo menos 50% da proteína total. Fez-se uma estimativa sobre a titulação combinada das espécies restantes da região ORF0657n e concluiu-se que era aproximadamente igual a 50 pg/mL de meio de cultura.

Exemplo 11: expressão intracelular das regiões ORFQ657nH (SEQ ID NO: 3) em S. cerevisiae

Obteve-se um nível bastante elevado de produção de proteínas com tamanhos distintos, por expressão intracelular da SEQ ID NO: 3 em S. cerevisiae. A expressão foi conseguida utilizando uma sequência optimizada de ácidos nucleicos, codificadora da levedura. A região ORF0657nH codificadora do ADN, com codões optimizados para a expressão em levedura (SEQ ID NO: 32) foi amplificada a partir de pUnkCRl (Exemplo 7), utilizando correspondentemente os iniciadores directo e reverso a seguir indicados: (SEQ ID NO: 100) 5'GGGG GGATCC CACAAAACAAA ATG GCT GAA GAA ACT GGT GG3' e (SEQ ID NO: 101) 5'GGG GGG GGATCC TTA AGA CTT AGC CTT GTT TTC TTG AGT3', com os locais de restrição BamEI flanqueadores (sublinhados). O iniciador directo contém a sequência líder não traduzida de 5' e o codão ATG e o iniciador reverso contém TAA, enquanto codão de terminação. O produto de 1,7 kb resultante foi isolado em gel e clonado no vector pCR2.1 'TOPO TA' (INVITROGEN CORPORATION, Carlsbad, CA) , em conformidade com as recomendações do fabricante, para se construir o plasmídeo pCR__iUC-S. Determinou-se depois a sequência de ADN da inserção a partir de dois clones independentes, pCR_iUCS2.2 e pCR_iUCS-2.4. Encontrou-se um único erro de PCR em cada uma 82 das inserções, localizado em fragmentos diferentes HindiII de cada plasmídeo. Obteve-se um plasmídeo com a sequência correcta, substituindo com o fragmento HindiII de 1,3 kb de pCR_iUC-S2.2, com a sequência correcta, o correspondente fragmento de pCR__iUC-S2.4 . 0 fragmento de 1,3 kb de pCR_iUC-S2.2 e o fragmento de 4,3 kb de pCR_iUC-S2.4 foram isolados em gel e ligados. Seleccionou-se um clone com os fragmentos desejados, pCR_iUC-S, e verificou-se a orientação adequada e a sequência nucleotidica por sequenciação do ADN. Seguidamente, efectuou-se a subclonagem do fragmento Bamhl de 1,7 kb em pGALHO (figura 5A) para se construir piUCS-S (-) .

Utilizou-se o ADN plasmidico de piUC-S(-) para transformar as estirpes 1260 e 1309 de S. cerevisiae para prototrofia à leucina (Leu+) , recorrendo a um protocolo de transformação e esferoplastos (Hinnen et ai., Proc. Natl. Acad. Sei. U.S.A. 75:1939-33, 1978). Efectuou-se a selecção dos transformantes em meio de ágar sintético a que faltava leucina e que continha sorbitol 1 M. Os meios de ágar sintéticos, superior e inferior, a que faltava leucina e que continha sorbitol 1M provieram de REMEL, Lenexa, KS (cat #09459 e 92155, respectivamente). Os isolados Leu+ clonais foram obtidos por meio de culturas em serie feitas sobre placas de SD menos leucina (KD MEDICAL, Columbia MD).

Foram pesquisados múltiplos transformantes para se investigar a produção da região ORF0657nH, utilizando as condições de fermentação descritas no Exemplo 9. Efectuou-se a análise dos lisados celulares para se pesquisar a produção da região ORF0657nH, recorrendo à análise de transferência de 'Western' e à análise de géis para SDS-PAGE corados com o corante azul de Coomassie. 83

Para a análise de transferência de 'Western' submeteu-se as amostras a electroforese sobre géis 'Criterion' em gradiente de Tris-HCl variando entre 4-15% (BIO-RAD, Hercules, CA) em tampão de IX SDS contendo Tris-glicina (BIORAD) em condições redutoras e desnaturantes. Efectuou-se a electroblot dos géis para transferência para filtros de membrana de PVDF de 0,2 pm. As proteínas foram imunodetectadas por transferência de 'Western', utilizando um anticorpo monoclonal para a ORF0657n de comprimento completo (SEQ ID NO: 28), designado por 2H2B8, enquanto anticorpo primário, e um anticorpo inteiro de cabra anti-IgG (H+L) de murganho ligado à peroxidase de rábano (ZYMED LABORATORIES, South San Francisco, CA) , enquanto anticorpo secundário. O mAb 2H2B8 foi descrito no Exemplo 9. Efectuou-se o processamento dos filtros utilizando o estojo 'WESTERN LIGHTNINGTm Chemiluminesence Reagent Plus' (PERKIN ELMER, Wellesley, MA).

Para a análise de expressão da ORF0657nH recombinante de levedura (codificada pela SEQ ID NO: 32), corando com o corante de Coomassie os géis para o protocolo de SDS-PAGE, submeteu-se as amostras a electroforese sobre géis 'Criterion' em gradiente de Tris-HCl variando entre 4-15% (BIORAD) em tampão de IX SDS contendo Tris-glicina (BIORAD), em condições redutoras e desnaturantes. Os géis foram corados com o corante Coomassie 'Bio-Safe', um corante Coomassie G250 (BIO-RAD), em conformidade com o protocolo do fabricante.

As amostras do lisado de células de leveduras, sujeitas a electroforese, continham 0,5 e 1,25 pg de proteínas celulares totais das leveduras, respectivamente para a transferência de 'Western' e para a coloração com o 84 corante de Coomassie. Como padrão quantitativo para a coloração com o corante de Coomassie utilizou-se BSA purificada (100X, NEW ENGLAND BIOLABS, Beverly, MA) . Para as absorções 'Western' utilizou-se como padrão quantitativo a região ORF0657n recombinante e purificada de comprimento completo de E. coli (SEQ ID NO: 28). Para ambas as avaliações utilizou-se como padrão qualitativo um lisado celular proveniente da cultura de E. coli que produz a região ORF0657nH (SEQ ID NO: 4 com uma cauda de His do terminal carboxilo), induzida a produzir ORF0657nH.

Para a produção da região ORF0657nH (SEQ ID NO: 4 mais uma cauda de His no terminal carboxilo) em E. coli, deixou-se a cultura produtora desenvolver-se de um dia para o outro em caldo LB contendo canamicina com uma concentração de 50 pg/mL, a 37°C. No dia seguinte, utilizou-se 500 pL da cultura obtida de um dia para o outro para inocular 5,0 mL de caldo LB contendo canamicina na concentração de 50 pg/L. Deixou-se a cultura desenvolver-se a 37 °C durante aproximadamente 3 horas até se obter um valor D060o igual a 0,6. A expressão foi induzida com IPTG 1 mM durante 3,5 horas a 37°C. Efectuou-se a colheita de células e guardou-se a massa de células a -80°C. Preparou-se o lisado de E. coli utilizando para tal o reagente de extracção de proteínas 'Bugbuster' (NOVAGEN, Madison, WI), executando o protocolo do fabricante. Para se estimar o tamanho das proteínas foram efectuadas experiências com padrões previamente colorados, variando entre 10 e 250 kDa, paralelamente com os lisados (BIO-RAD). A partir da pesquisa inicial, escolheu-se um transformante da estirpe 1260 de levedura, designado por 1-1, como sendo o melhor produtor da região QRF0657nH (SEQ ID NO: 85 3). Nas figuras 7A e 7B está ilustrado um exemplo da produção da região ORF0657nH ao fim de 72 horas de fermentação em meio complexo YEHDG em balões agitados. A proteina principal detectada quer pela coloração com o corante de Coomassie (A) quer pelo anticorpo (B) tinha ~85 kDa (ver as pistas 5, 6 e 7) e migrou conjuntamente com a ORF0657nH de E. coli (SEQ ID NO: 4 com uma cauda de His do terminal carboxilo; pista 2). 0 peso molecular da ORF0657n expressa em E. coli e da ORF0657n expressa na levedura foi maior do que o valor previsto no nosso sistema de electroforese em gel. A detecção da proteina com ~85 kDa foi especifica; não foi observada nenhuma detecção num lisado de células obtido a partir de um transformante que contém apenas o vector pGALHO (pista 3). Foi produzida significativamente mais região ORF0657nH (SEQ ID NO: 3), comparativamente com a região ORF0657n de comprimento completo (SEQ ID NO: 28 sem uma cauda de His no terminal carboxilo); comparar as pistas 5, 6 e 7 com a pista 4. 0 transf ormante que contém a ORF0657n de comprimento completo ficou a fermentar simultaneamente com o transformante que contém a região ORF0657nH (SEQ ID NO: 3) e em condições idênticas. Foram observadas provas insignificantes de degradação da região ORF0657nH expressa na levedura madura.

Para se avaliar a estabilidade da proteína, incluiu-se no gel uma amostra do lisado celular do transformante 1-1 que havia estado congelado durante vários dias e que depois foi descongelado (figura 7, pista 7). Pode concluir-se que a integridade e a quantidade desta amostra são semelhantes às amostras recém-preparadas (pistas 5 e 6). Confirmou-se a inexistência de degradação e a estabilidade da região ORF0657nH (SEQ ID NO: 3) por transferência de 'Western', 86 utilizando um anticorpo policlonal de cabra e desenvolvido contra a ORF0657n de comprimento completo de E. coli (SEQ ID NO: 28) (dados não apresentados).

Uma estimativa da quantidade de região ORF0657nH (SEQ ID NO: 3), a partir da transferência de 'Western' e pela coloração do gel com o corante de Coomassie foi de -360 pg por mL de meio YEHD e a percentagem (%) de proteínas totais foi estimada em 50%. A quantidade produzida no meio definido foi de 225 pg/mL de meio de cultura e a percentagem (%) da proteína total foi também 50%. A quantidade de região ORF0657nH (SEQ ID NO: 3) comparada com a quantidade de região ORF0657n de comprimento completo (SEQ ID NO: 28 sem uma cauda de His do terminal carboxilo) foi superior (350 vs 10 pg/mL, respectivamente) e a percentagem (%) de proteínas totais também foi superior (50 vs 2,0).

Exemplo 12: expressão intracelular da região ORFQ657nG (SEQ ID NO: 44) em S. cerevisiae

Avaliou-se a expressão intracelular dos polipeptidos aparentados com ORF0657n no exemplo a seguir descrito, utilizando uma construção de ADN que codifica a região ORFO 657nG (SEQ ID NO: 44) . A ORF0657nG (SEQ ID NO: 44) é uma versão truncada da SEQ ID NO: 2, à qual lhe falta a sequência de sinal do terminal amino. A SEQ ID NO: 44 conserva a metionina do terminal N e os aminoácidos 42-645 da SEQ ID NO: 2. O ADN optimizado que codifica a região ORF0657nG da levedura (SEQ ID NO: 44) foi amplificado a partir de pUnkCRl (Exemplo 7), utilizando os seguintes iniciadores directo e 87 reverso, respectivamente 5'GGGGGGATCCCACAAAACAAAATGGCTGAAGAAACTG GTGG3' (SEQ ID NO: 102) e 5'GGGGGGGATCCTTAGTTCTTTCTCTTTCTTGG3' (SEQ ID NO: 103) com os locais de restrição BamEI de flanqueamento. O iniciador directo contém a sequência líder não traduzida em 5' e o codão ATG e o iniciador reverso contém TAA, enquanto codão de terminação. O produto resultante de 1,8 kb foi isolado em gel e clonado no vector pCR2.1 TOPO TA, em conformidade com as orientações do fabricante (INVTTROGEN CORPORATION, Carlsbad, CA), para se construir o plasmídeo pCR_iUC-L4. A análise da sequência de ADN confirmou que ocorreu uma única delecção na extremidade 5'.

Obteve-se um clone com a sequência correcta substituindo com o fragmento HindiII-HindiII de 1,3 kb de pCR_iUCS2.2, que contém a sequência correcta (ver o Exemplo 11), o correspondente fragmento de pCR_iUC-L4. O fragmento de 1,3 kb de pCR_iUCS2.2 e o fragmento de 4,4 kb de pCR_iUC-LA foram isolados em gel e ligados. Seleccionou-se um clone com os fragmentos desejados, pCR_iUC-L, e verificou-se a orientação adequada e a sequência nucleotídica por sequenciação do ADN. Depois, efectuou-se a subclonagem de um fragmento BamEI de 1,8 kb em pGALHO para a construção de piUC-L(-) e verificou-se a sequência de ADN. Utilizou-se o ADN plasmídico de piUC-L(-) para transformar a estirpe 12 60 de S. cerevisiae para prototrofia à leucina (Leu+) , conforme descrito no Exemplo 9. Foram pesquisados diversos transformantes de levedura para produção intracelular da região ORF0657nG (SEQ ID NO: 44) , utilizando as condições de fermentação e de desmembramento de células descritas no Exemplo 11. Analisou-se 0,25-0,5 pg de proteínas do lisado celular para a produção da região ORF0657nG, pelo protocolo de transferência de 'Western', conforme descrito no Exemplo 11. Utilizou-se a região ORF0657nH purificada de E. coli (SEQ ID NO: 4 sem uma cauda de His no terminal carboxilo) como padrão quantitativo e utilizou-se como padrão qualitativo um lisado celular proveniente da cultura de E. coli produtora da região ORF0657nG (SEQ ID NO: 44 com uma cauda de His no terminal carboxilo), induzida para produzir a região ORF0657nG. Submeteu-se as amostras a electroforese em géis 'Criterion' em gradiente de Tris-HCl variando entre 4-15% (BIO-RAD, Hercules, CA) em tampão IX SDS contendo Tris-glicina (BIO-RAD) em condições redutoras e desnaturantes. Efectuou-se a electroblot dos géis com transferência para filtros de membrana de PVDF com 0,2 pm (BIO-RAD).

Efectuou-se a imunodetecção das proteínas pela transferência de 'Western' utilizando um anticorpo policlonal contra a ORF0657n de comprimento completo purificada produzida por E. coli (SEQ ID NO: 28 sem uma cauda de His no terminal carboxilo), enquanto anticorpo primário, e o anticorpo inteiro de cabra anti-IgG (H+L) de murganho ligado à peroxidase de rábano (ZYMED LABORATORIES; South San Francisco, CA), enquanto anticorpo secundário. 0 anticorpo policlonal foi gerado por imunização com a região ORF0657n de comprimento completo purificada, produzida por E. coli (SEQ ID NO: 28) . Efectuou-se o processamento dos filtros utilizando o estojo 'WESTERN LIGHTNINGTm Chemiluminesence Reagent Plus' (PERKIN ELMER, Wellesley, MA) .

Para efeitos de comparação, efectuou-se a clonagem de uma região ORF0657nG (SEQ ID NO: 44 com uma cauda de His no 89 terminal carboxilo) num vector de expressão de E. coli, conforme descrito no Exemplo 1, tendo lugar a expressão. Para a produção da região ORF0657nG em E. coli, a cultura produtora ficou a desenvolver-se de um dia para o outro em caldo LB contendo canamicina na concentração de 50 pg/mL, a 37°C. No dia seguinte, utilizou-se 500 pL da cultura obtida de um dia para o outro para inocular 5,0 mL de caldo LB contendo canamicina na concentração de 50 pg/mL. Deixou-se esta cultura crescer a 37°C durante aproximadamente 3 horas até se obter um valor D06oo igual a 0,6. A expressão foi induzida com IPTG lmM durante 3,5 horas a 37°C. Efectuou-se a colheita das células e guardou-se a massa celular a -80°C. Preparou-se o lisado de E. coli utilizando o reagente de extracção de proteínas 'Bugbuster' (NOVAGEN, Madison, WI), em conformidade com o protocolo do fabricante. Para se estimar o tamanho das proteínas foram efectuadas experiências com padrões previamente colorados, variando entre 10 e 250 kDa, paralelamente com os lisados (BIO-RAD). A partir da pesquisa inicial, escolheu-se um transformante da estirpe 1260 de levedura, designado por ÍUC-L3, como sendo um bom produtor da região ORF0657nG ao fim de 72 horas de fermentação em meio complexo YEHDG em tubos de cultura, conforme descrito no Exemplo 11. A proteína principal detectada por coloração com o corante de Coomassie ou pelo anticorpo tinha 85 kDa e migrou conjuntamente com a região ORF0657nG de E. coli (SEQ ID NO: 44 com uma cauda de His no terminal carboxilo) . Os pesos moleculares da região ORF0657nG expressa em E. coli e da região ORF0657nG expressa em levedura tinham um valor maior do que o previsto pelo nosso sistema de electroforese em gel. A detecção da proteína de 85 kDa foi específica; não 90 foi verificada nenhuma detecção no lisado de células provenientes de um transformante que continha apenas o vector pGALHO. A concentração média de ORF0657nG, determinada nas experiências de transferência de 'Western', foi de 30 pg por mL de meio YEHDG e a percentagem (%) de proteína total foi estimada em 10,0% (ver o Exemplo 13, infra) .

Exemplo 13: a remoção do sinal de selecção da parede celular aumenta a expressão intracelular

Estudou-se o efeito de se remover apenas a região ORF0657n codificadora do terminal C da sortase celular e também a combinação com a remoção da região do sinal do terminal N, utilizando os genes de ORF0657n, com codões optimizados, de SEQ ID NOs: 31, 32 e 45. A SEQ ID NO: 31 codifica a região ORF0657n de comprimento completo. A SEQ ID NO: 32 codifica a região ORF0657nH, à qual lhe falta simultaneamente uma sequência de sinal no terminal N e uma região de selecção do terminal C da parede celular. A SEQ ID NO: 45 codifica a região ORF0657nG a que falta apenas a sequência do péptido de sinal.

Deixou-se fermentar cada um dos transformantes que expressam a região ORF0657n de comprimento completo (SEQ ID NO: 28 sem a cauda de His do terminal carboxilo; transformante rUnkCl), a região ORF0657nH (SEQ ID NO: 3; transf ormante 1-1) e a região ORF0657nG (SEQ ID NO: 44, transformante ÍUC-L3), tendo sido preparados lisados celulares que foram analisados conforme descrito no Exemplo 11. Na figura 9 está ilustrada uma transferência de 'Western' representativa. A quantidade de lisado celular proteico, 91 carregada no gel, a partir dos diferentes transformantes, não foi igual para se poder compensar os níveis diferentes de expressão das regiões ORF0657n das que codificam as três construções. Em cada caso, foram carregadas pelo menos duas quantidades diferentes de lisado celular proteico proveniente de cada transformante contendo a região ORF0657n.

Na figura 9 estão indicados resultados típicos que demonstram a região ORF0657nH (SEQ ID NO: 3) foi expressa significativamente melhor do que a região ORF0657n de comprimento completo (SEQ ID NO: 2 8 sem a cauda de His do terminal carboxilo) ou a região ORF0657nG (SEQ ID NO: 44) . Foi detectado um sinal substancial apenas com 50 e 100 ng de proteínas do lisado celular proveniente do produtor de região ORF0657nH, conforme se observa nas pistas 11 e 12. Em contraposição, utilizou-se 1,0 e 2,0 pg de proteínas de lisado celular do produtor de região ORF0657nC de comprimento completo, como se observa respectivamente nas pistas 7 e 8. Foi detectado um sinal bom para a região ORF0657nG com menos proteína, com 250 e 500 ng de proteína carregados conforme se observa nas pistas 14 e 15. O quadro 4 apresenta uma comparação das concentrações médias de cada uma das três regiões ORF e a percentagem (%) de proteínas totais, obtidas a partir de três absorções 'Western' independentes. Foram preparados lisados celulares de propósito para cada transferência de 'Western'. As médias foram obtidas a partir de duas fermentações independentes. Determinou-se a quantidade de ORF0657n específica, relativamente ao padrão de ORF0657nH purificada de E. coli (SEQ ID NO: 4 mais uma cauda de His do terminal carboxilo). 92

Quadro 4 ORF 0 6 5 7 n concentração, pg/mL % de proteínas produzida de meio YEHDG totais C 10,0 4,0 G 30,0 10,0 H 425, 0 80,0 A remoção da sequência do péptido de sinal aumentou a percentagem de proteínas totais e a concentração entre 2,5-3 vezes, conforme determinado comparando a expressão da região ORF0 657n de comprimento completo (SEQ ID NO: 2 8 sem uma cauda de His no terminal carboxilo) e da região ORF0657nG (SEQ ID NO: 44). A remoção do péptido de sinal e da sequência de selecção da parede celular aumentou a expressão entre 8-14 vezes, comparativamente com a remoção apenas da sequência do péptido de sinal (comparar as regiões G e H) e aumentou a expressão entre 20-42,5 vezes, comparativamente com a proteína de comprimento completo (comparar as regiões C até H). A amplitude do aumento da expressão após a remoção da sequência de selecção da parede celular não era previsível.

Exemplo 14: expressão intracelular da região ORFQ657nI em S. cerevisiae

Amplificou-se o ADN que codifica a região ORF0657nI com os codões optimizados para expressão em leveduras (SEQ ID NO: 33) a partir de pUnkCRl (Exemplo 7), utilizando correspondentemente os iniciadores directo e reverso a seguir indicados: 5'CTCCGGATCCCACAAAACAAAATGGCTGAAGAAACTGGT 3' (SEQ ID NO: 104) e 5' GCTGCCGGGATCCTTATGGGGTTGGCT- 93 TAGATGGGGTAG 3' (SEQ ID NO: 105) com os locais de restrição BamHI de flanqueamento (sublinhados). O iniciador directo contém a sequência líder não traduzida de 5' e o codão ATG e o iniciador reverso contém TAA, enquanto codão de terminação. O produto resultante de 1,3 kb foi isolado em qel e clonado no pGALHO (Fiq. 5A) para se construir o piUC-I (Fig. 5B) e verificou-se a sequência de ADN.

Utilizou-se o ADN plasmídico proveniente de piUC-I para transformar a estirpe 1260 de S. cerevisiae para prototrofia à leucina (Leu+) , conforme descrito no Exemplo 9. Efectuou-se uma pesquisa dos transformantes Leu+ para tirar conclusões sobre a produção intracelular da região ORF0657nI (SEQ ID NO: 1), utilizando as condições para uma fermentação em pequena escala (culturas de 5,0 mL) , conforme descrito no Exemplo 9.

Comparou-se a produção com a da região ORF0657nH (SEQ ID NO: 3) produzida pelo transformante 1-1 de S. cerevisiae (ver o Exemplo 11) . Os lisados celulares foram preparados conforme descrito no Exemplo 9 e efectuou-se a análise de 100 e 200 ng de proteínas de lisados de células de leveduras para se pesquisar a produção de ORF0657nI e de ORF0657nH, pelo protocolo de transferência de 'Western' semi-quantitativo, conforme descrito no Exemplo 11. Utilizou-se a ORF0657nH purificada de E. coli (SEQ ID NO: 4 com uma cauda de His do terminal carboxilo) como padrão quantitativo. As amostras foram submetidas a electroforese em géis 'Criterion' em gradiente de Tris-HCl variando entre 10-20% (BIO-RAD, Hercules, CA) em tampão de IX SDS contendo Tris-glicina (BIORAD) em condições redutoras e desnaturantes. Efectuou-se uma electroblot dos géis para transferência para filtros de membrana de PVDF de 0,2 pm 94 (BIO-RAD). Efectuou-se a imunodetecção das proteínas por transferência de 'Western', utilizando um anticorpo policlonal para a ORF0657n de comprimento completo purificada de E. coli (SEQ ID NO: 28), enquanto anticorpo primário, e o anticorpo de cabra anti-IgG (H+L) de murganho inteiro ligado à peroxidase de rábano (ZYMED LABORATORIES; South San Francisco, CA), enquanto anticorpo secundário. 0 anticorpo policlonal foi gerado por imunização com a ORF0657n de comprimento completo purificada, produzida por E. coli (SEQ ID NO: 28) . Efectuou-se o processamento dos filtros utilizando o estojo 'WESTERN LIGHTNINGTm Chemiluminesence Reagent Plus' (PERKIN ELMER, Wellesley, MA). Para se estimar o tamanho das proteínas foram efectuadas experiências em paralelo com padrões previamente colorados, com dimensões entre 10 e 250 kDa (BIO-RAD), conjuntamente com os lisados. A figura 11 ilustra os resultados obtidos ao fim de uma fermentação de 72 horas em meio YEHDG complexo, em tubos de cultura. Obteve-se uma forte detecção da região ORF0657nH (SEQ ID NO: 3) expressa nas leveduras, conforme se observa nas pistas 5, 6, 14, 15, 21 e 22. Também foi facilmente detectada uma proteína de 60 kDa nos transformantes construídos para a expressão de ORF0657nI (SEQ ID NO: 1), conforme se observa nas pistas 7-12 e 16-21. A ORF0657nI (SEQ ID NO: 1) expressa nas leveduras migrou conjuntamente com a ORF0657nI (SEQ ID NO: 5 com uma cauda de His do terminal carboxilo), expressa e purificada a partir de E. coli (dados não apresentados) . Os pesos moleculares da região ORF0657nI expressa em E. coli e da região ORF0657nI expressa em leveduras foram maiores do que os valores previstos pelo nosso sistema de electroforese em 95 gel. A proteína de 60 kDa detectada nos transf ormantes construídos para expressão da região ORF0657nI (SEQ ID NO: 1) foi específica; não foi detectada nenhuma proteína no lisado celular proveniente de um transformante de controlo do vector (pistas 4 e 13).

Estimou-se a quantidade de região ORF0657nH (SEQ ID NO: 3) e de região ORF0657nI (SEQ ID NO: 1) no gel a partir da transferência de 'Western' semi-quantitativa, por comparação com uma quantidade conhecida de ORF0657nH purificada (SEQ ID NO: 4 com uma cauda de His no terminal carboxilo) . As concentrações e a percentagem total de proteínas foram calculadas em termos de média determinada a partir de lisados em duplicado que continham duas quantidades diferentes de proteína no gel. As concentrações volumétricas de região ORF0657nH (SEQ ID NO: 3), determinadas a partir de uma amostra recém-fermentada e de um lisado de células congeladas, foram comparáveis, sendo -500 e -550 yg/mL de meio de cultura, para uma produção de 320 yg de região ORF0657nI (SEQ ID NO: 1) por mL de meio de cultura (a concentração para a região ORF0657nI é para o transformante 1-1) . O valor percentual de região ORF0657nH (SEQ ID NO: 3) da proteína total foi estimado respectivamente em 78% e 80%, ao passo que a ORF0657nI (SEQ ID NO: 1) correspondeu a 45% da proteína total.

Assim, a região ORF0657nI teve uma boa expressão em S. cerevisiae, com uma concentração cerca de 1,5 vezes inferior à da ORF0657nH (SEQ ID NO: 3) e a percentagem (%) de proteína total foi cerca de 1,3 vezes inferior. A boa expressão da região ORF0657nI na levedura foi confirmada por coloração com o corante de Coomassie num protocolo de SDS-PAGE sobre gel contendo os lisados celulares. A 96 expressão da região ORF0657nI no meio YEDHG foi multiplicada à escala: a produção em balões agitados de 125 mL ou de 2 litros foi comparável à expressão em pequena escala em tubos de cultura. A região ORF0657nI (SEQ ID NO: 1) também teve boa expressão em meio definido '5X menos leucina' (o meio descrito no Exemplo 9). A concentração foi apenas ~1,5 vezes inferior à concentração no meio complexo YEHDG, ao passo que a percentagem (%) de proteínas totais foi comparável nos dois meios. A integridade da ORF0657nI foi boa nos dois meios, sem ter sido detectada nenhuma degradação significativa. A produção de ORF0657nI foi mais elevada ao fim de 72 horas do que ao fim de 96 horas, tanto no meio complexo como no meio ' 5X menos leucina', quando testada nas fermentações em balões agitados.

Exemplo 15: fermentações em grande escala da estirpe de levedura produtora de ORFQ657nH (SEQ ID NO: 3)

Utilizou-se o lote inoculante congelado da estirpe 1-1 de levedura (estirpe 1260 transformada com o plasmídeo piUC-S(-); conforme descrito no Exemplo 11) para fermentação e purificação em grande escala. O balão que continha o lote inoculante foi descongelado e depois utilizou-se 1,0 mL para inocular um balão de Erlenmeyer de 250 mL contendo 50 mL de um meio selectivo isento de leucina (meio 5XLeu-, Bayne et al., Gene 66(2):235-44, 1988), contendo 4% de glicose. Manteve-se o balão a incubar a 28°C num aparelho de agitação rotativa a 250 r.p.m..

Decorridas 24 horas (com glicose residual igual a 23,5 g/L) , acrescentou-se um volume de cultura igual a 13 mL a 97 um balão de 2 L que continha 877 mL do mesmo meio. Mais uma vez, manteve-se o balão a incubar a 28°C com agitação a 250 r.p.m.. Decorridas 24 horas, (com glicose residual igual a 4,04 g/L) , utilizou-se o conteúdo do balão de 2 L para inocular um reactor de 20 L que continha um meio quimicamente definido (Oura, Biotechnol. Bioengineer. 16:1197, 1974) que foi optimizado para as estirpes utilizadas. Este meio continha glicose com a concentração de 20 g/L, seguindo-se uma adição de galactose na concentração de 25 g/L para indução. O reactor trabalhou a 28°C, com uma caudal de 4,7 L/min, à pressão de 15 psig e a 300 r.p.m.. Nestas condições, os níveis de oxigénio dissolvido foram mantidos em valores superiores a 30% da saturação. O desenvolvimento celular foi monitorizado pelo consumo de glicose, pela densidade óptica (A6oo nm, cadinhos de 1 cm), pelo peso das células anidras, pela utilização da galactose e pela produção de etanol. A cultura prosseguiu durante 90 horas até alcançar um valor A6oo igual a 33,9 e uma proporção de células anidras igual a 17,5 g/L.

Efectuou-se uma colheita da cultura por filtração do fluxo tangencial a fibras ocas (cartucho Hump01-43 da AMICON), utilizando um estojo de colheita DC-10 da AMICON (NELLEPORE, Billerica, MA) . Deitou-se fora o produto da impregnação e fez-se uma concentração das células, com diafiltração com PBS e subsequente colheita por centrifugação a 8000 r.p.m. a 4°C durante 20 minutos, utilizando um equipamento 'Sorvall Evolution RC' (rotor SLA 3000). As células foram guardadas a -70°C.

Para se avaliar a produção de ORF0657nH pela estirpe 1-1 numa fermentação em grande escala, fez-se uma preparação de lisados de células a partir de 10 unidades de 98 D06oo da cultura colhida, tendo a avaliação sido feita conforme descrito minuciosamente no Exemplo 11 (resultados não apresentados). Avaliou-se também a produção de ORF0657nH proveniente da fermentação em balão agitado (72 horas, meio YEHDG complexo). Os resultados da análise de transferência de 'Western' (efectuada conforme descrito no Exemplo 11) demonstraram que a proteína produzida a partir de uma fermentação em grande escala migraram conjuntamente com a ORF0657nH produzida numa fermentação em balão agitado (resultados não apresentados). Estimou-se em 739 pg por mL a concentração da ORF0657nH obtida a partir da fermentação em grande escala (20 L) e a percentagem (%) de proteínas totais foi estimada em 55%, comparativamente com os valores de 732 pg/mL e 58% de proteínas totais obtidos na fermentação em balão agitado (utilizando o processo da transferência de 'Western' semi-quantitativa, descrito no Exemplo 11). Os resultados permitem concluir que a produção de ORF0657n pode ser multiplicada à escala em leveduras.

Exemplo 16: imunidade protectora dos polipeptidos aparentados com ORFQ657n produzidos em leveduras

Avaliou-se a aptidão dos polipeptidos congéneres de ORF0657n produzidos em leveduras para conferirem imunidade protectora, realizando a expressão do polipeptido de SEQ ID NO: 3 em leveduras. Utilizou-se como controlos a ORF0657nC de comprimento completo (SEQ ID NO: 28), a ORF0657nH (SEQ ID NO: 4 com uma cauda de His no terminal carboxilo) e a ORF0657nI (SEQ ID NO: 5 com uma cauda de His do terminal carboxilo), expressas em E. coli, e também adjuvante por si so. 99

Obteve-se um polipeptido aparentado com ORF0657n de SEQ ID NO: 3a partir de leveduras e utilizou-se num modelo com animais para conferir imunidade protectora. 0 polipeptido de SEQ ID NO: 3 foi expresso conforme descrito no Exemplo 11.

Com células recombinantes congeladas de S. cerevisiae, que expressam a ORF657nH (SEQ ID NO: 3), preparou-se nova suspensão, à razão de 5 mL por grama de células húmidas, em meio MOPS 0,2 M a pH 7,0 com inibidores de proteases (sem EDTA). Preparou-se um lisado fazendo quatro passagens através de um microfluidificador a trabalhar a 14 000 psi (Microfluidics Model 110S) . Clarificou-se o lisado por centrifugação (10 000 X g, 20 minutos, 2-8°C), seguindo-se uma filtração grosseira (pré-filtro de fibras de vidro, Millipore) e uma filtração refinada (sobre acetato de celulose de 0,2 pm, Whatman).

Fraccionou-se o lisado clarificado numa coluna de cromatografia de exclusão dimensional (SEC) (Pharmacia HiPrep 26/60 Sephacryl S-300 HR, fase móvel: MOPS 0,2 M a pH 7,0) . Efectuou-se a análise das fracções pelo protocolo de SDS-PAGE com detecção pelo corante de Coomassie e por transferência de 'Western', utilizando um anti-soro especifico para a proteína ORF0657n (produzido contra a ORF0657n de comprimento completo, SEQ ID NO: 28). Juntou-se as fracções que continham o produto.

Filtrou-se esterilmente o produto resultante da SEC, através de acetato de celulose de 0,2 pm, em condições assépticas. A pureza do produto filtrado estéril foi h 94% nas análises por SDS-PAGE e por transferência de 'Western'. Com o produto filtrado e estéril preparou-se uma formulação com AHP e Timerosal na concentração de 0,2 mg/mL. 100 A aptidão dos polipeptidos aparentados com ORF0657n, produzidos nas leveduras, para conferirem imunidade protectora, está ilustrada na figura 10. A ORF0657nH (SEQ ID NO: 3) expressa nas leveduras conferiu uma imunidade protectora equivalente à dos polipeptidos expressos em E. coli.

Exemplo 17: resposta anamnéstica em primatas não humanos

Efectuou-se a imunização de três grupos de macacos Rhesus com o polipeptido aparentado com ORF0657n produzido em leveduras (ORF0657nH, SEQ ID NO: 3) ou com o polipeptido aparentado com ORF0657 expresso em E. coli (ORF0657n de comprimento completo, SEQ ID NO: 28), em formulações com ou sem AHP. Os macacos do grupo vacinado receberam 50 pg de polipeptidos congéneres de ORF0657n, por via intramuscular.

Conforme se observa na figura 12, o grupo de animais vacinados respondeu, ao fim de uma única dose, com um aumento de 3 a 6 vezes os valores das concentrações médias geométricas, comparativamente com as concentrações modestas existentes previamente, sugerindo isso a existência de uma resposta amnéstica. Pelo contrário, as concentrações médias geométricas nos animais do grupo de contraprova continuaram a ser as mesmas (no intervalo de variabilidade do ensaio com anticorpos). Após uma segunda dose de vacina, as médias geométricas das concentrações após a primeira dose, nos grupos vacinados e de contraprova, variaram muito pouco comparativamente com as concentrações após a segunda dose.

Para se observar o desenvolvimento de respostas de anticorpos após a administração de uma única dose, acompanhou-se o grupo que recebeu a região ORF0657H (SEQ ID 101 NO: 3) expressa em leveduras, durante 3 meses (último momento testado). As concentrações de anticorpos continuaram a aumentar após 9 dias, atingindo niveis que não foram ultrapassados mesmo após 2 ou 3 doses de vacina.

Estas observações sugerem que uma dose de vacina pode induzir respostas de anticorpos substanciais e duradouras após a estimulação natural do sistema imunitário, provavelmente devido à exposição ambiental a S. aureus. Um estudo sobre concentrações de anticorpos previamente existentes em seres humanos demonstrou a presença de concentrações modestas de anticorpos contra ORF0657n em todas as amostras analisadas (dados não apresentados). 102 LISTAGEM DAS SEQUÊNCIAS <110> Merck & Co, Inc,

<12 0> POLIPEPTIDOS PARA INDUÇÃO DE UMA RESPOSTA IMUNITÁRIA DE PROTECÇÃO CONTRA STAPHYLOCOCCUS AUREUS <130> 21669Y PCT <150> 60/489, 840 <151> 2003-07 -24 <150> 60/520, 115 <151> 2003-11 -14 <160> 107 <170> FastSEQ para Windows versão 4.0

<210> 1 <211> 446 <212> PRT <213> Sequência Artificial <22 0> <223> ORF0657nI com metionina no terminal amino <4 0 0> 1 103

Má Alá v: > :X Via stsr Qly Sly T&r ?iMi TM 1« Ala r* i *x Prs by% Thr 1 Si. H Ú AM. Ml Klv $*S% Tâp: T::r fhr S*r «M f..ys Ai* Prí> UM Thr ή as 10 Ly& ?;: Vai XX*. míi Alá. Ysl S-i- ml Mr A®a Vai ala. Am 1$. 40 ÂS ί'Χ'ν TM Mr ulu T).x Lys Sltt Má, Ly:« SM mi Ma am mi iy- Ala Se 55 50 Lys OÍ;í TM m Sis ml Frh Ala Ala Ala T;tr Asm Mn §5 Tá 15 «Q TM- Tf* M» 11¾ LM .Mn CM fílu tass A*S? SH Α1® n« l,yt5 .Asa ?XVS §3 ts ss λ 1 -¾ n« Lys A.;p Lyã Μρ m» Mr álã Pro Mm ler Ari Prv I,lA 1.30 Kiá MS UÔ phí*. VM. mt tva Lys lyjp M>! Thr sa.õ GU Pí». Tyr MM ”yr Ai A ÍUS Uá 115 Mr as* mi lys iro Alâ- Arg Vai íis FM Tfer Ã-SP á#r '-·:/s SM 110 11S 14a li& l« siy iaj «M Mr My Slft PSe frp Mi Lya Fhè Cila Vai us ΪΜ Í5S ise Tyr SIíí èly ÂMp. ξ*# Lsu V.i:<3 Ile Lyv L&V mi Mr Tyr &SP" Tl;r ,US lie 17:3 Vai Lfã Asp 1!ví A'U Tyr tis Mi ?&r ml S»r Asa Gíy Thr LyS· Í3S tas 1Μ Ala VIL -VS I Í8 YAl S«r s«r t&r HM PiA 1.3T Aáá ira Vi 1 si Ίΐτ K0S 1.¾¾ *00 MS 104

Tyr Asp Tyr Thr L#U «es Glu Phe Ala Gin- Fro n« Tyr ASO Ser Ala 210 21$ 220 Asp Lys Fhe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala 225 230 23S 240 Pro Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu Asm 24$ 350 25$ Lys 11© Gin Asp Lys Léu Fm Glu Lys Leu Lys Ala Glu Tyr Lys Lys 210 365 270 Lys Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala 275 280 285 lie Thr Glu Fhe Gin Asn Vai Glu Pro Thr ASO GlU Lys Mtefc Thr Asp 290 295 300 Leu Gin ASp Thr Lys Tyr val Vai Tyr Glu Ser Val Glu Asm Asm Glu 38$ 310 315 320 Ser Mât Hejfc Asp Thr Phe vai Lys lis Pr© 11# Lys Thr Gly Mefc Leu 325 330 335 A®n Gly Lys Lys Tyr Wer Val Met Gi« Thr Thr A$FS Asp ASp Tyr Trp 348 345 350 Lys Asp Fhé Het v&l Glu Gly Gin Arg Val ATf Thr Ile Ser Lys Asp 355 360 365 Ale Lys Asa Asm Thr Arg Thr Xle lie Phe Fro Tyr Vãl Glu Gly Lys 370 375 380 Thr Leu Tyr Asp Ala lie Val Lys Val Hls val Lys Thr Tle Asp Tyr 385 330 335 400 Asp Gly Glo Tyr Hls VAI Arg lie val Asp Lys Glu Ala Phe Thr Lys 405 410 415 Ala ASA Thr Asp Lys Ser Asn. Lys Lys Glu Gin Gin Asp Asm Ser Ala 420 425 430 Lys Lys Glu Ala Thr Pm Ala Thr Pro Ser Lys Fm Thr Pm 435 440 445 <210> 2 <211> 645 <212> PRT <213> S. aureus <400> 2 105

Heh 1 Asn Lys Gin Gla Lys Glu Phe Lys Ser fhe Tyr Ser na Arg Lys 5 10 15 Ser Ser Leu Gly Vai Ala Ser Vai Ala Ile Ser Thr Leu Leu Leu Leu 20 25 30 Ser Asn Gly Glu Ala Gin Ala Ala Ala Glu Glu Thr Gly Gly Thr 35 40 45 hm Thr Glu Ala Gin Pr© Lys Thr Glu Ala Vai Ala Ser Pr© Thr Thr so 55 m Thr Ser Glu Lys Ala Pr© Glu Thr Lys Pr© Vai Ala Asn Ala Vai Ser 65 70 75 80 Vai Ser Asn Lys Glu Vai Glu Ala Fro Thr Ser Glu Thr Lys Glu Ala 85 50 95 Lys €lu Vai Lys Glu vai Lys Ala Pr© Lys Glu Thr Lys' Glu vai Lys 1QG 105 110 Pro Ala Ala Lys Ala Thr Asn Asn Thr Tyr Pr© Ile Leu Asn Gin Glu 115 120 125 Leu Arg eiu Ala n© Lys Asn Pr© Ala xle Lys Asp Lys Asp Mis Ser 130 13 S 140 106

Alâ Fr© Mn Ser Arg Pr© Ha Asp Phe Glu Met Lys Lys Lys Asp Gly 145 150 155 160 Thr Gin Gin Ph» Tyr Mis Tyr Ala Ser Ser Vai Lys Pr© Ala Arg vai 165 170 175 ϊΐδ Phe Thr Asp Ser Lys Pr© Glu XI* Glu Leu Gly Leu Gin Ser Gly 180 .185 190 Gin Phe Trp Arg Lys Phe Glu Vai Tyr Glu Gly Asp Lys Lys Leu Pr© 185 ' 200 205 Ile Lys Leu Vai Ser Tyr Asp Thr Vai Lys Asp Tyr Ala TVr He Arg 210 215 220 Pis® Ser Vai Ser Asn Gly Thr Lys Ala Vai Lys He Vai Ser Se r Thr 225 230 235 240 His Phe Asn Asn Lys Glu Glu Lys. Tyr Asp Tyr Thr Leu Met Glu Phe 245 250 255 Alâ Sln Fr© Ile Tyr Asá Ser Ala Asp Lys Phe Lys Thr Glu Glu Asp 260 265 270 Tyr hys jklâ ôlu Lys Leu Leu Ala Fr© Tyr Lys Lys Ala Lys Thr Leu 275 280 285 Glu Arg Gin Vai Tyr Glu Leu Asn Lys He Gin Asp Lys Leu Fr© Glu 290 29S 300 Lys Leu Lys Ala Glu Tyr Lys Lys Lys Leu Glu Asp Thr lys Lys Ala 305 no 315 320 Leu Asp Glu Gin Vai Lys Ser Ala Ile Thr Glu Phe Gin Asn Vai Gin i 325 330 335 Fr© Thr Mn Gin Lys Met Thr Asp Leu Gin Asp Thr Lys Tyr val vàl 340 345 350 Tyr Glu Ser Vai Glu Asn Asn Glu Ser Met Met Asp Thr Phe Vai Lys 355 360 36S Hls Pr© lie Lys Thr Giy Met Leu Asn Gly Lys Lys Tyr Met Val Met 370 375 380 Gl» Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Met Vai Glu Gly Gin 385 350 395 400 Arg Vai Arg Thr Ile Ser Lys Asp Ala Lys Asn As» Thr Arg Thr He 405 410 415 He phs Fr© Tyr Vai Glu Gly Lys Thr Leu Tyr Asp Ala He val Lys 420 425 430 Vai His Vai Lys Thr Ile Asp Tyr Asp Gly Gin Tyr Hl» Vai Arg Ile 435 440 445 Vai Asp Lys Glu Ala Phe Thr Lys Ala Asn Thr Asp Lys Ser Asn Lys 450 455 460 Lys Glu Gin Gin A$p Asa Ser Ala Lys Lys Glu .Ala Thr Fr© Alá Thr 465 470 47 S 480 Fro ser Lys Fr© Thr pr© ser Pr© Val Glu Lys Glu Ser Gllli Lys Gin 485 490 495 Asp Ser Gin Lys Asp Asp Asn Lys· Gin Leu Fr© Ser val Glu Ly» Glu 500 SOS 510 Asn Asp Ala Ser Ser Glu Ser Gly Ly» Asp Lys Thr Fr© Ala Thr Lys 515 520 525 Pr© Thr Lys Gly Glu Vai Glu Ser Ser Ser Thr Thr Fr© Thr Lys Val 530 4 535 540 Vai Ser Thr Thr Gin Asn Vai Ala Lys Pr© Thr Thr Á.l â Ser Ser Lys 545 550 555 560 Thr Thr Lys Asp Vai Vai Gin Thr Ser Ala Gly Ser Ser Glu Ala Lys 565 578 575 107 107 Asn Thr Asn Asp Gly 590 Glu Asn Lys Ala Lys 605 Asp Met Thr Leu Pro 620 Ala Phe vai Leu Pro 640

Asp ser Ala His Thr Gin 595 Ser Leu Pr© 610 Leu Met Ala 62:5 Arg Lys Arg

Pro Léu ©In Lys Ala Asn He Lys 580 S8$

Ee-r ©In Asn Asn Lys Aon Thr Gin 6ÓÓ

Gin Thr Gly Glu Glu. Ser Asn Lys «15

Leu Leu Ala Leu ser Ser lie vai 830 63$

Lys Asn 645

<210> 3 <211> 569 <212> PRT <213> Sequência Artificial <220> <223> ORF0657nH com metionina no terminal amino <400> 3 108

Mac Mm Glu Glu Thr Gly Gly Thr Asa Thr Glu Ala Glu Pro Lys Thr 1 S 10 15 Glu .Ala Vai Ala Ser Pro Thr Thr Thr Ser Glu Lys Ala Pro Glu Thr 20 25 30 Lys Pro Vai Ala Aso. Ala Vai Ser Vai Ser Asn Lys Glu Vai Glu Ala Pro Thr 35 40 45 .Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Glu Vai Lys Ala 50 SS 60 , Pro Lys Glu Thr Lys Glu vai Lys Pro Ala Ala Lys Ala Thr Asn Asn. €5 20 75 80 Thr Tyr Pro 11© Leu As» Glu Glu Leu Arg Glu Ala fie Lys Asn Pro 85 80 05 Ma Xis Lys Asp Lys Asp His Ser Ala Pro Asft Ser Arg Pro lie ASp 100 105 110 Fhe Glu mt Lys Lys Lys Agp Gly Thr Gin Glu Phe Tyr His Tyr Ala lis 120 125 Ser Ser vai Lys Pro Ala Aro Vai Xle Fhe Thr Asp ser Lys Pro Glu 130 135 140 XI© Glu Leu Gly Leu Gin Sor Gly Gin Fhe Trp Arg Lys Phe Glu Vai 145 150 155 160 Tyr Glu Gly Asp Lys Lys Leu Pro X le Lys Leu Vai Ser Tyr Asp Thr 165 170 175 Vai Lys Asp Tyr Ala tyr Xle Arg Phe Ser' Vai Ser Asn Gly Thr Lys ISO 185 ISO ' Ma Vai Lys Xle Vai Ser Ser Thr HiS Phe Asn Asa Lys Glu Glu Lys 1&5 200 205 ' Tyr Asp Tyr Thr Leu Met Glu Ph© Ala Gin Pro Xle Tyr Asa Ser Ala 210 215 220 Ãsp Lys Pbe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala '225 230 235 240 Pro Tyr Lys Lys Ala Lys Thr Leu Glu Arg Glu Vai Tyr Glu Leu Asn 245 250 25S Lys 11« Gin ASp Lys Leu Pro GlU Lys Leu Lys Ala Glu Tyr Lys Lys 2Ê0 265 270 109

Lys Leu Glu 275 Asp Thr Lys Lys Ala 280 Ile Thr Glu 290 Phe Gin Asn vai 295 Gin Leu Gin Asp 305 Thr Lys Tyr 310 Vai Vai Ser Met Met Asp Thr 325 Phe Vai Lys Asn Gly Lys Lys 340 Tyr Ket Vai Hat Lys Asp Fhs 355 Met Vai Glu Gly Gin 360 Ala Lys As» 370 ASP Thr Arp Thr 375 lie Thr Leu Tyr 385 ASp Ala’ Ile 390 Vai Lys Asp Gly Gin Tyr HiS 405 val Arg Ile Ala Asm Thr Asp 420 Lys Ser Asa Lys Lys Lys Glu 435 Ala Thr Pro Ala Thr 440 Vai Glu Lys 450 G!u Ser ain Lys 455 Gin Gin Leu Tro 455 Ser Vai Glu 470 Lys Glu Lys Asp Lys Thr Pro 483 Ala Thr Lys Ser Ser Thr Thr 500 Pro Thr' Lys Vai Lys Pro Thr 515 Thr Ala Ser Ser Lya 520 Ser Ala Gly 330 Ser Ser Glu Ala 535 Lys Asn ile Lys S4S ASU Thr Asa 550 Asp Gly Asn Thr Gin Glu Asn 565 Lys Ala Lys

<210> 4 <211> 570 <212> PRT <213> Sequência Artificial

Leu Asp Glu Glu Val 285 Lys Ser Ala Pro Thr Asft Glu 300 Lys Met Thr Asp Tyr Glu Ser 315 Val Glu As» Asn Glu 320 His pro 330 He Lys Thr Gly Met 335 Leu Glu 345 Thr Thr Am Asp Asp 350 Tyr Trp Arg val Arg Thr Ile 365 Ser Lys Asp Ilô Phe Pro Tyr 380 Val Glu Gly Lys val HiS Val 395 Lys Thr Ile Asp Tyr 400 Vai ASp 410 Lys Glu Ala Phe Thr «15 Lys Lys 425 Glu Gin Gin Asp As» 430 Ser Ala Pro Ser Lys Pro Thr 445 Pro Ser pro Asp Ser Gin Lys 460 Asp Asp Asn Lys Am Asp Ala 475 Ser Ser Glu Ser Gly 480 Pro Thr 400 Lys Gly Glu Val Glu .495 Ser Val SOS Ser Thr Thr Gin Asn 510 Vai Ala Thr Thr Lys Asp Val Khfi Val Gin Thr Asp Ser Ala Pro 540 ,%5 £. a3 Leu Gin Lys Ala His Ser Thr Gin 555 Ser Gin Asn Asn Lys soo <22 0> 110 <223> ORF0657nH com metionina-glicina no terminal amino <400> 4

Gl« Pro I*ys 15 Ala Pro Glu 30 Glu Vai Glu

Hat Gly Ala Glu Ola Thr Giy Gly Thr Asn Thr Glu Ala 1 5 10

Thr Sl« Ala vai Ala Ser Pro Thr Thr Thr Ser Glu kya 20 25

Thr hys Pro Vai Ala Asn Ala Vai Ser Vai Ser Asn tya 35 40 45 111

Ala Pro Thr Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Glu val Lys SÔ 55 60 Ala Pro Lys GlU Thr. Lys Glu Vai Lys Pro Ala Ala Lys Ala Thr Asn 65 70 75 80 Asn Thr Tyr. Pro Ile Leu Asa Gin Glu Leu Arg Glu Ala Ile Lys Asn 8S 90 95 Pro Alá Ile Lys Asp Lys Asp Kis Ser Ala Pr© AS» Ser Arg Pro Ile 100 105 110 ASp Ph« Glu Met Lys Lys Lye Asp Gly Thr Gin Gin Fhe Tyr His Tyr 115 120 125 Ala Sor Ser Vai Lys Pro· Ala .Arg Vai ile Phe Thr Asp Ser Lys Pro 130 135 140 Glu Ile Glu Leu Gly Leu Gin Ser Gly Gin Fhe Trp Arg Lys Phe Glu 145 150 155 150 Vai. Tyr Glu Gly Asp Lys Lys Leu Pro Ile Lys Leu Val Ser Tyr Asp 165 170 175 Thr Vai Lys Asp Tyr Ala Tyr Ile Arg Fhe Ser Val Ser Asn Gly Thr 180 185 190 Lys Ala val Lys Ile Vai Ser Ser Thr HiS Fhe ASP Asn Lys Glu Glu 195 200 205 Lys Tyr Asp Tyr Thr Leu Met Glu Fhe Ala Gin Pro Ile Tyr Asn Ser aio 215 220 Ala Asp Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala GlU Lys Leu Leu 225 230 235 240 Ala Pro Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Val tyr Glu Leu 245 250 255 Aon Lys lie Gin Asp Lys Leu Pro Siu Lys Leu Lye Ala Glu Tyr Lys 260 2:65 270 lys Lys Leu Glu Asp Thr Lys Lys Ala Leu ASp Glu Gin Val Lys Ser 275 280 285 Ala 11« Thr Glu The Gin Asa Vai Gin Pro Thr Asn Glu Lys Met Thr 230 295 300 Asp Leu Glu Asp Thr Lys Tyr Vai Vai Tyr Glu Ser Val Glu Asn Asn 305 310 31S 320 Glu Ser Met Met Asp Thr Fhe Vai Lys His Pro ile Lys Thr Gly Hat 325 330 335 Leu Aso Gly Lys Lye Tyr Met Vai Met Glu Thr Thr Asn Asp Asp Tyr 340 345 350 Trp Lys Asp Fhe Met Vai Glu Gly Gin Arg Vai Arg Thr lie Ser Lys 355 380 365 Asp Ala Lys Asa Asn Thr Arg Thr Ile Ue Fhe Pro Tyr Val Glu Gly 370 375 380 Lys Thr Leu Tyr Asp Ala Ile Vai Lys Vai Mís Val Lys Thr Ile Asp 385 300 395 400 Tyr Asp Gly Gin Tyr Síis Vai 'Arg Ile val Asp Lys Glu Ala Fhe Thr 405 410 415 Lys Ala Asa Thr Asp Lys Ser Asn Lys Lys Glu Gin Glu Asp Asn Ser 420 425 43Q Ala Lys Lys Glu Ala Thr Pro Ala Thr Pro Ser Lys Pro Thr Pro Ser 435 440 445 Pro vai Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn 450 455 460 Lys Glu Leu Pro Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser 465 47G 475 460 112 112 Gly Lys Ser Ser Ala Lys Thr Ser S30 Ala Asn 545 L.ys Aán

Aep.Lys Thr Fr© 485

Ser Thr Thr Pr© 500

Pr© Thr Thr Ala 515

Ala Gly Ser Ser lie Lys Asn Thr 550

Thr Gin 01« Asn 5S5

Ala Thr Lys Pr© 450

Thr Lys Vai vai 505

Ser Ser Lys Thr 520

Glu Ala !*ys Asp 535

Asn Ae|» Gly His tya Ala W9 Ser 5?0

Thr Lys Gly Glu. Vai Glu 435 Ser Thr Thr Gin Asn Vai 510 Thr Lys Asp Vai Vai Gla 525 Ser Ala Pr© Leu Gin Ly$ 540 Thr Gin Ser Gin Asn Asm 555 550

<210> 5 <211> 447 <212> PRT <213> Sequência Artificial <220> <223> ORF0657nH com metionina-glicina no terminal amino <400> 5 113

Hefc Gly Ala Glu Glu Thr Gly eiy Thr Aso Thr Glu Ala Gin Pr© Lys ι 5 10 IS Thr Val Ala Ser Pr© Thr Thr Thr Ser Glu Lys Ala Fr© Glu 20 25 30 Thr Lys Pr© Val Ala Asa Ala Val Ser Val Ser Asn Lys Glu val Glu 35 40 45 Ala Pr© Thr Ser Glu Thr Lys Glu Ala Lys Glu Val Lys Glu Val Lys 50 55 60 Ala Pr© Ly« Glu Thr Lys Gly Val Lys Pr© Ala Ala Lys Ala Thr Asn 65 70 75 80 ASE Thr Tyr Pr© Ile Leu Asp Gin Glu Leu Arg Glu Ala ile Lys Asn as m 95 Pr© Ala xis' Lys Asp Lys Asp His Ser Ala Fro Asa Ser Arg Pr© Ile im 105 110 ÃSP Fhe Glu «et Lys Lys Lys ASp Gly Thr Glu Gin Phe Tyr His Tyr 115 120 125 Ala Ser Ser Val Lys Pr© Ala Arg Val ile Fhe Thr ASp Ser Lys Pr© 130 135 140 Glu Ile Glu Leu Çly Leu Sln Ser Gly Gin Fhe Trp Arg Lys Phe Glu 145 150 155 160 val Tyr Glu Gly Asp Lys Lys Leu Pr© ile Lys Leu Val Ser Tyr Asp 165' 170 175 Thr Val Lys Asp Tyr Ala Tyr lie Arg Phe Ser Val Ser ASn Gly Thr ISO 185 ISO Lys Ala val Lys ile val ser Ser Thr M.S Phe Âsn AS» Lys Glu Glu 195 200 205 hy® Tyr Asp Tyr Thr Leu wet Glu The Ala Gin Pr© lie Tyr Asn Ser 210 215 220 Ala Asp Lys Fhe Lys Thr Glu Glu ASp Tyr Lys Ala Glu lys Leu Leu 225 230 235 240 Ala Pr© Tyr Ly® Lys Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu 245 250 255 114

Asa Lys Ile Gin Asp Lys Leu Fr© Glu Lys Leu Lys Ala. Glu Tyr Lys 260 265 270 hy& Lys Leu. Glu Asp Thr Lys Lys Ala Leu Asp GlU Gin Vai Lys Ser 275 200 205 Ala lis Thr Glu Fhe Gin Asa Vai Gin Fr© Thr Asa Glu Lys Met Thr 290 295 300 Asp Leu Gin Asp Thr Lys Tyr Vai Vai Tyr'Glu Ser Vai Glu Asn Asn 305 310 315 320 Glu Ser hefc ííet ASp Thr Phe Vai Lys His Fr© Ile Lys Thr Gly JCet 3:25 330 335 Leu Asa Gly Lys Lys Tyr Met Vai Httt Glu Thr Thr Asn ASp ASP Tyr 340 345 350 Trp Lys Asp Fhe Met ¥«í Glu Gly Gin Arg Vai Arg Thr Ile Ser Lys 355 350 305 Asp Ala Lys Asn Asn Thr Arg Thr Ile ile The Fro Tyr vai Glu Gly 370 375 300 Lys mr Leu Tyr Asp Ala lie Vai Lys Vai His Vai Lys Thr lie Asp 3S5 390 395 400 'Tyr Asp Gly Gin Tyr Eis Vai am Ile Va i Asp Lys Glu Ala Fhe Thr 40S 410 415 Lys Ala Asa Thr Asp Lys Ser As*» Lys Lys Glu Gin Gin Asp Asn Ser 420 425 436 Ala Lys Lys Glu Ala Thr Pr© Ala Thr Fr© Ser Lys Fr© Thr Fr© 43-5 440 445

<210> 6 <211> 576 <212> PRT Λ 00 \—1 CM V Sequência Artificial <22 0> <223> ORFO 657nH < 4 Ο Ο > 6 115

Ale Glu Glu Thr Giy Val Thr Aon Thr Glu Ala Gin Pro Lys Thr Glu 1 5 10 15 Ala val Ala ..Ser Pro Thr Thr Thr Thr Thr Glu Lys Ala Pro Glu Ala 20 25 10 Lys Pro Vâl Ala Lys Pro val Ala ASO Ala Val Ser Val Ser Asn Lys 35 40 45 Glu Val Val Ala Pr© Thr Thr Glu Thr Lys Glu Ala Lys Glu Val Lys 50 55 60 Ala val Lys Glu Vai Lys Ala Pr© Lys Glu Ala Lys Glu Glu Lys Pro 65 70 75 80 Ala Ma Lys Ala Asp Asn Asn Thr Tyr Pro lie Leu Asn Gin Glu Leu 85 90 95 Arg Glu Ala Ile Lys Asn Pro Ala Xle Lys Asp Lys ASp «is Ser Ala > 100 y 105 110 Pro Asm Ser Mg Pro ile Asp Fhe GlU mt Lys Lys Lys ASp Gly Thr 115 128 125 Gin Gin Pita Tyr His Tyr Ma Ser Ser Val Lys Pro Ala Argr Val Ile 130 =* 135 148 Phe Thr Asp Ser Lys Pro Glu lie Glu Leu Gly Leu Gin Ser Gly Gin 145 ISO 155 160 116

Phe Trp Arg Lys Phe Glu Val Tyr Glu Gly Asp Lys Lys Leu Pro Ile 165 170 175 Lys Leu Vai Ser Tyr Asp Thr Val Lys Asp tyr Ala Tyr Ile Arg' Phe 180 185 190 ser Vai Ser Asn Gly Thr Lys Ala val Lys 11e vai Ser Ser Thr His 155 200 205 Phe Asn Asn Lys Gin Glu Lys Tyr Asp Tyr Thr Leu Met Glu Phe Ala 210 21S 220 Gin Pr» lie Tyr Asn Ser Ala Asp Lys Phe Lys Thr Glu Glu Asp Tyr 225 230 235 240 Lys Ala Glu Lys Leu Leu Ala Pre Tyr Lys Lys Ala Lys Thr Leu Glu 245 250 255 Arg Gin Vai Tyr Gin Leu Asn Lys Ue Gin Asp Lys Leu Pro GiU Lys 280 265 270 Leu Lys Ala Gin Tyr Lys Lys Lys Leu Glu Glu Thr Lys Lys Ala Leu 275 280 285 Asp Glu Gin Vai Lys Ser Ala 11a Thr Glu Phe Gin Asn val Gin Pro 290 295 300 Thr Asn Gin Lys Met Thr Asp Leu Gin Asp Thr Lys Tyr val Val Tyr 305 310. 315 320 Glu Ser Vai Gin Asn Asn Glu Ser Met Met Asp Ala Phe Val Lys His 325 330 335 Pro Ile Lys Thr Gly Met Leu Asn Gly Lys Lys Tyr Met Val Met Glu 340 345 350 Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Met Val Glu Gly Gin Arg 355 360 365 Vai Arg Thr Ue Ser Lys Asp Ala Lys Asn Asn Thr Arg Thr lie Ile 370 375 380 Phe Pr» Tyr Vai Glu Gly Lys Thr Leu Tyr Asp Ala Ile val Lys Val 385 390 395 400 His Vai Lys Thr Xle Asp Tyr Asp Gly Gin Tyr Mis Val Arg Ile val 405 410 415 Asp Lys Gin Ala Phe Thr Lys Ala Asn Ala Asp Lys Thr Asn Lys Lys 420 425 430 Glu Gin Gin Asp Asn Ser Ala Lys Lys Glu Thr Thr Pro Ala Met Pro 435 440 445 Ser Lys Pr» Thr Thr Pro Pr» val Glu Lys Glu Ser Gin Lys Gin Asp 450 455 460 Ser Gin Lys Asp Asp Asn Lys Gin Ser pro Ser Val Glu Lys Glu Asn 485 470 475 480 Asp Ala Ser Ser Glu Ser Gly Lys Asp Lys Met Pro Val Thr Lys Pro 485 490 495 Ala Lys Ala Gin val Glu Ser Ser Ser Thr Thr Pro Thr Lys Val Val 500 SOS 510 Ser Thr Thr Gin Asn Val Ala Lys Pro Thr Thr Ala Ser Ser Glu Thr 515 520 525 Thr Lys ASp Vai val Gin Thr Ser Ala Gly Ser Ser Glu Ala Lys Asp 530 535 540 Ser Ala Pro Leu Gin Lys Ala Asn lie Lys Asn Thr Asn Asp Gly His 545 550 555 560 Thr Gin ser Gin Asn Asn Lys Asn Thr Gin Glu Asn Lys Ala Lys Ser 565 570 573 117

<210> 7 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <4Ο0> 7 118

Ala Glu Glu Thr Gly siy Thr AS» 1 5 Ala Vai Ala Ser Pro Thr Thr Thr v 29 Pro Vai Ala Asn Ala vai Ser Vai 35 40 Thr Ser Glu Thr Lys Glu Ala Lys 50 55 Lys Glu Thr Lys Glu Vai Lys Pr» £5 78 Tyr Pro Ile Leu AS» Gin Glu Leu 85 n« Lys Asp Lys 1tfkfS Ââp Hifl Ser Ala Glu Ket Lys 115 AVW Lys Lys ASP Gly Thr 128 Ser Vai Lys Pro Ala Arg Vai Ile 130 135 Glu Leu Gly Leu Gin Ser Gly Gin 14 S 150 Glu Gly Asp Lys Lys Leu Pr» Ile .165 Lys Asp Tyr Ala Tyr lie Arg Phe 180 Vai Lys Ile Vai Ser Ser Thr His 195 208 Asp Tyr Thr Leu mt Glu Phe Ala 210 215 Lys Phe Lys Thr Glu Glu Asp Tyr 225 230 Tyr Lys Lys Ala Lys Thr Leu Glu 245 Ile Gin Asp Lys Leu Pro Glu Lys 260 Leu Glu mp Thr Lys Lys Ala Leu 275 288 Thr Glu Phe Gin Asn Vai Gin Pr» 290 295 Gin Asp Thr Lys Tyr vai Vai Tyr 305 310 Hat Met ASp Thr Phe Vai Lys Mi® 325 Gly Lys Lys Tyr '«et vai pet Glu 340 Asp Phe Hat vai Glu Gly Gin Arg 355 368 Lys Asn As» Thr Arg Thr Ile Ile 370 575

Thr Glu 10 Ala Gin pro Lys Thr 15 Glu Ser 25 Glu Lys Ala Pro Glu 30 Thr Lys Ser Asn Lys Glu Vai 45 GlU Ala Pro Glu Vai Lys Glu 60 Vai Lys Ala Pro Ala Ala Lys 75 Ala Thr Asn Asn Thr 80 Arg Glu 90 Ala Ile Lys Asn Pr» 95 Ala Pr» 105 'Asn Ser Arg Pr» Ile 110 Asp Phe Gin Gin Phe Tyr Mis 125 Tyr Ala Ser Phe Thr Asp Ser 140 Lys Pro Glu Ile Phe Trp Arg 155 Lys Phe Glu Vai Tyr ISO Lys Leu 170 Vai Ser Tyr Asp Thr 175 Vai Ser 185 Vai Ser Asn Gly Thr 198 Lys Ala Phe Asn Asn Lys Glu 285 Glu Lys Tyr Gin Pro Ile Tyr 320 Asn Ser Ala Asp Lys Ala Glu 235 Lys Leu Leu Ala Pro 248 Arg Gin 250 Vai Tyr Glu Léu Asn 255 Lys Leu 265 Lys Ala Glu Tyr Lys 278 Lys Lys ASp Glu Gin vai Lys 285 Ser Ala ile Thr Asn Glu Lys 300 »eL Thr Asp Leu Glu Ser Vai 315 Glu Asn Asn Glu Ser 320 Pro Ile 330 Lys Thr Gly Mut Leu 335 Asn Thr 345 Thr Asn Asp Asp Tyr 350 Trp Lys Vai Arg Thr Ile Ser 365 Lys Asp Ala Phe Pro Tyr Vai 3ã0 Glu Gly Lys Thr 119

Leu Tyr Asp Ale Ile Vai Lys Vai His Vai Lys Thr ile ASp Tyr ASp 385 390 395 400 Gly Gin Tyr His Vai Arg 11« Vai Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asn Thr Asp Lys ser Asn Ly® Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Lys; Glu Ala Thr Pr© Ala Thr Pr© Ser Lys Pr© Thx Fr© Ser Pro Val 43S 440 445 Glu Lys Glu Ser Gin Lys Gin Agp Ser Gin Lys Asp ASP Asn Lys Gin 450 455 460 Leu Pre Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 475 480 Gly Vai Thr Leu Ala Thr Lys Pr© Thr Lys Gly Glu Val Glu Ser Ser 485 490 495 Ser 1¾¾1 Thr pm Thr Ly® Vai Vai Ser Thr Thr Gin Asn Val Ala Lys soo 505 S10 Pr© Thr Thr Gly Ser Ser Lys Thr Thr Lys Asp Vai val Gin Thr Ser 515 520 525 Ais Gly Ser Ser Clu Ala Lys Asp Ser Ala Pr© Leu Gin Lys Ala Asn 530 S35. 540 Ile Lys His Thr Asn Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn 145 550 555 560 Thr Gin Glu Asn Lys Ma Lys Ser $65-

<210> 8 <211> 568 <212> PRT <213> Sequência Artificial <220> <223> ORFO 657nH <400> 120

Ala -Glu 01« Thr Gly Gly Thr Asn Thr Glu Ala 01© Pro Lys Thr Glu i 5 10 15 Ala Val Ala Ser Pr© Thr Thr Thr Ser 01« Lys Ala Pro 01« Thr Lys 20 25 30 Pro V&l Ala As© Ala Val Ser Val Ser A$n Lys 01« Val Glu Ala Pr© 35 40 45 Thr Ser 01« Thr Lys 01« Ala Lys 01« Val Lys 01« val Lys Ala Pro m 55 60 tys 01 u Thr Lys 01« Val Lys Pro Ala Ala. Lys Ala Thr As© As© Thr 65 70 75 80 Tyr Pro lie Leu AS© 01© 01« Leu Arg Glu Ala tle Lys .As© Pro Ala 85 90 05 Ile Lys Asp Lys Asp His Ser Ala Pro Asn Ser .An Pro Si© Asp Phe ISO 105 110 01« Met Lys Lys Lys Asp Gly Thr 01© Gl© Phe Tyr Mis Tyr Ala Ser 115 120 125 Ser Val Lys Pro Ala Arg Vai n« Phe Thr Asp Ser Lys Pr© 01« Ile 130 135 140 01« Leu Oly Leu 01© Ser Gly 01© phe Trp Arg Lys Phe Glu Val Tyr 145 150 155 ISO 121

Glu Gly Asp Lys Lys Leu Pr© Xle Lys Leu Val Ser Tyr Asp Thr val 165 170 175 lys Asp Tyr Ale Tyr 11« Arg Phe Ser Val Ser Asn Gly Thr Lys Ala 180 185 ISO vai Lys 11« Vai Ser Ser Thr His Phe Asn AS© Lys Glu Glu Lys Tyr 195 200 205 Asp Tyr Thr Leu het Glu Phe Ala Gin Pr© 11« Tyr Asn ler Ala Asp 210 215 220 Lys 'Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pr© 225 230 235 240 Tyr Lys Lys Ala Ly» Thr Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys 245 250 255 11« Gin asp Lys Leu pr© Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 265 270 Leu Gin Asp Thr Lys Lys Ala Leu ASp Glu Gin Val Lys Ser Ala U« 275 280 285 Thr Gin Fhe Gin Asn Val Gin Pr© Thr Asn Glu Lys Mefc Thr Asp Leu 290 295 300 Gin Asp Thr Lys Tyr Val Val Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 310 315 320 Het Met Asp Thr Phe Val Lys His Pr© lie Lys Thr Gly Hat Leu Asn 325 330 335 Gly Lys Lys Tyr Met Val Het Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Asp Phe Het Vai Glu Gly Gin Arg Val Arg Thr lie Ser Lys Asp Ala 355 360 365 Lys Asn Asrt Thr Arg Thr 11« 11« Phe Pr© Tyr val Glu Qiy Lys Thr 370 3?S 380 Leu Tyr ASp Ala lie Val Lys Val His Val Lys Thr lie Asp Tyr Asp 385 390 395 400 Gly Gin Tyr His Val Arg lie Val Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Agn Thr ASp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Ay» Glu Ala Thr Pr© Alã Thr Pr© Ser Lys Pr© Thr Pr© Ser Pr© vai 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp ASp Asn Lys Gin 450 455 460 Leu Pr© Ser Val Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 455 470 475 480 Asp Lya Thr Fr© Ala Thr Lys Pr© Thr Lys Gly Glu val Glu Ser ser 48S 490 495 Ser Thr Thr Pr© Thr Lys Val. Val Ser Thr Thr Gin Asn Val Ala Lys 500 SOS 510 Pro Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser. SIS 520 §25 AÍ» Gly ser Ser Glu Aia Lys Asp Ser Ala Pr© Leu Gin Lys Ala Asn 530 535 540 lie Lys Asn Thr Asii Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn 545 550 555 560 Thr Gin Glu Asn Lys Ala Lys Ser 565' 122

<210> 9 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <4Ο0> 9 123 123 Vai Lys Leu Glu Glu Thr Gly Gly Thr Asn Thr Glu Ma Gin Fr© Lys Thr Glu 5 10 15 Ala Ser Pro Thr Thr Thr Ser Glu Lya Ala Pr© Glu Thr Lys 20 25 30 Ala Am Ala Vai Ser Vai Ser Asn Lys Glu Val Glu Ala Fr© 35 40 45 Glu Thr Lys Glu Ala Lys Glu Val Lys Glu Val Lys Ala Fr© 55 60 Thr Lys Ala Vai Lys Pr© Ala Ala Lya Ala Thr As n Asn Thr 70 75 @0 lie Leu Asn Gin Glu Leu Arg Glu Ala lie Lys Asn Fr© Ala 85 90 95 Asp Lys Asp His Ser Ala Fr© Asn Ser Arg Pr© Ile Asp Fhe 100 105 110 Lys Lys Glu Am Gly Glu Gin Gin Phe Tyr His Tyr Ala Ser :U5 120 125 Lys Fr© Ala Arg Vai lie Fhe Thr Asp Ser Lys Pr© Glu lie 135 140 Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Phe Glu Val Tyr 150 155 160 Asp Lys Lys Leu Fr© Ile Lys Leu Val Ser Tyr Asp Thr Val 165. 170 * 175 Tyr Ala Tyr ila Arg. Phe Ser Val Ser Asn Gly Thr Lys Ala ISO 185 190 11« Vai Ser Ser Thr His Phe Asn Asn Lys Glu Glu Lys Tyr 195 200 205 Thr Leu Mte& Glu Ph© Ãla Gin Pr© 11* Tyr Asn Ser Ala Asp 215 220 Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pr© 230 235 240 Lys Ala Lya Thr Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys 245 250 255 Asp Lys Leu Pr© Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 265 270 Asp Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala lie 275 210 285 Phe Gin Asn vai Gin Pr© Thr Asn Glu Lys Met Thr Asp Leu 295 300 Thr Lys Tyr vsi vai Tyr Glu Ser val Glu Asn Asn Glu Ser 310 315 320 Asp Thr Fhe Vai Lys Mis Fr© Ile Lys Thr %%ú Gly Met Leu Asn Lys Tyr Met Vai Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Met Vai Glu Gly Gin Arg Vai Arg Thr Ile Ser Lys Asp Ala 355 360 v 365 Asn Thr Arg Thr 11® Ile Phe Fr© Tyr val Glu Gly Lys Thr 375 . 380

Ala Glu 1

Ala vai

Fr© Vai

Thr Ser 50

Lys Glu 65

Tyr Pro

Ile Lys

Glu Met

Ser Vai 130 Glu Leu 145

Glu Gly

Asp Tyr 210 Lys Phe 225

Tyr Lys lie Gin

Thr Glu 290 Gin Asp 305

Met Met

Gly Lys

Asp Phe

Lys Asn 370 124 hm. Tyr Ásp Ala 11* vai Lys Vai His Val Lys Thr íle Asp Tyr Asp 3®§ 390 305 40© Gly Gin Tyr Si a vai Àrg lie val Asp Lys Glu Ala phe Thr Lys Ala 405 410 41S hsn Thr Asp Lys Ser Asn Lys Lys Glu Glrs Gin Asp Asn Ser Ala Lys 430 425 430 Lys Glu Ale Thr Pr* Ala Thr Fro Ser Lys Pm Thr Pro Ser Pro val 435 440 445 Glu Lys Cia Ser Gin Lys Gin ÂSp Ser Gin Lys Asp ASp Asn Lys Gin 450 455 460 Leu Pro Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 475 460 Asp Lys Thr Pm Ala Thr Lys Pm Thr Lys Gly Glu Val Glu Ser Ser 48S 490 405 Ser Thr Thr Fro Thr Lys Vai vai Ser Thr Thr Gin Asn Val Ala Lys SCO SOS 510 Pm Thr· Thr Ala Ser Ser Lys Thr Thr Lys Asp val Val Gin Thr Ser 515 520 525 Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala fm Leu Gin Lys Ala Asn 530 535 540 Zle Lys Aso Thr Asn Ásp Gly fíis Thr Gin Ser Gin Asn Asn Lys Asn 545 550 555 560 •Thr Gin aiu Ase Lys Ma Lys Ser 565

<210> 10 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <4 0 0> 10 125 Mâ Glu 61« Thr Giy Gly Thr Asn Thr Glu Ala Gin Pro Lys Thr Glu ι 5 10 15 ; Al-a Val Ala'Ser Pm Thr Thr Thr Ser Glu Lys Ale Pro Glu Thr Lys 20 25 30 pro Vai Ala Asm Ala Vai Ser Vai Ser Asn Lys Glu Vai Glu Ala Pm 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Glu val Lys Ala Pm 50 SS 50 Lys Glu Thr Lys Glu Vai Lys Pro Ala Ala Lys Ala Thr Asn Asn Thr €5 70 75 30 Tyr Pro Ile Leu Asn Gin Glu Leu Arg Glu Ala Ile Lys Asn Pro Ala , 35 90 95 Ile Lys Asp Lys Asp Hls ser Ala Pro Asn Ser Arg pro ile Asp Phe 100 10$ 110 Glu Met Lys LyS' Lys Asp Gly Thr Gin Gin Phe Tyr His Tyr Ala Ser 115 120 m Ser Vai Lys Pro Ala Arg Vai Ile Phe Thr Asp Ser Lys Pro Glu lie 130 135 140 Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Phe Glu Val Tyr 145 A i 50 155 100 126

Pro Ile Lys Leu val Arg Phe Ser 185 líM Val Ser Thr Hís Phe Asn Asn *UU Phe Ala 215 Gin Pro Ile Asp Tyr Lys Ala Glu 235 Leu Glu Arg Gin 250 vai Glu Lys Leu 265 Lys Ala Ala Leu 280 Asp Glu Gin Gin Pro 295 Thr Asn Glu val Tyr Glu Ser Val *1 <5 Lys Hís pro Ile Lys Met Glu Thr 345 jjy Thr Asn Gin Arg 360 Val Arg Thr lie lie 375 Phe Pro Tyr Lys Val HÍS Val Lys 305 11® val ASp Lys 410 Glu Lys Lys Glu 42$ Gin Gin Thr Pro 440 Ser Lys Pro Gin Asp 455 Ser Gin Lys Glu Asn Asp Ala Ser 475 Lys Pro Thr Lys 490 Gly Val Val Ser 505 Thr Thr Lys Thr 520 Thr Lys Asp Lys Asp $35 Ser Ala Pro Gly His Lys Ser Thr Gin Ser 555

Glu Gly Asp Lys Lys Leu 1δ5 Lys Asp Tyx Ala Tyr Ile 180 Vai Lys II® Vai Ser Ser 195 Asp Tyr Thr Leu HeC Glu 210 Lys Pb® Lys Thr Glu Glu 225 230 Tyr Lys Lys Ala Lys Thr 245. Ile Gin Asp Lys Leu Pr® 2S0 Leu Glu Asp Thr Lys Lys 215 Thr Glu Ph© Gin Lys vai 290 Gin Asp Thr Lys Tyr vai 305 310 K»t Mefc Asp Thr Ph» Vai 325 Gly Lys Lys Tyr «et Vai 340 Asp Phe mt Vai Glu Gly 355 - Lys Asn Asn Thr Arg Thr 310 Léu Tyr Asp Ala 11® Vai 385 3m Gly Gin Tyr Hts Vai Arg 405 Asn.Thr Asp Lys Ser Asn . 420 Lys Glu Ala Thr Pro Ala 435 Glu Lys Glu Ser Gin Lys 450 Leu Pro Ser Vai Glu Lys 465 470 Asp Lys Thr Pro Ala Thr 4SS Ser Thr Thr Pro Thr Lys 500 Pro Thr Thr Ala Ser Ser 515 Ala Gly Ser Ser Glu Ala S3Ô Ile Lys Asn Thr Asn Asp 545 550 Thr Gin Glu Asn Lys Ala 565

Ser Tyr Asp Thr Vai 175

Asn Gly Thr Lys Ala 150

Lys Glu Glu Lys Tyr 205

Tyr Asn Ser Ala Asp 220

Lys Leu Leu Ala Pro 240

Tyr Glu Leu Asn Lys 255

Glu Tyr Lys Lys Lys 270

Vai Lys Ser Ala Ile 285

Lys mt Thr Asp Leu 300

Glu Asn Asn Glu Ser 320

Thr Gly Met Leu Asn 335

Asp Asp Tyr Trp Lys 350

Ile ser Lys Asp Ala 365

Vai Glu Gly Lys Thr 380

Thr Ile Asp Tyr Asp 400

Ala Phe Thr Lys Ala 415

Asp Asn Ser Ala Lys 430

Thr Pro Ser Pro Vai 44S

Asp Asp Asn Lys Gin 460

Ser Glu Ser Gly Lys 480

Glu Vai Glu Ser Ser 485

Gin Asn val Ala Lys 510

Val Val Gin Thr Ser 525

Leu Gin Lys Ala Asn 540

Gin Asn Asn Lys Asn 560 127

<210> 11 <211> 565 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <4 Ο 0> 11 128

Ma Glu Glu fhr Gly Gly Thr &SO fhr Glu Ma Gin Pro Lys Thr G i u I 5 10 15 Ma Vai Ma Ser Pro Thr fhr Thr Thr Glu Lys Ala Pro Glu Ala Lys 20 25 30 Pro val Ma Asn Ala val Ser vaX Ser Aso Lys Glu val Glu Ala Pro 35 40 45 fhr Ser Gi» Thr Lys Glu Ala Lys Glu Val Lys Ala Pro Lys Glu fhr 50 55 c· 60 Lys Ma Vai Lys Pro Ala Ala Lys Ala Asp Asn Asn Thr Tyr .Pro Xle 65 70 ?S 80 teu te Glà Glu Leu Arg Glu Ma Xle Lys Asn Pro Ala Xle Lys Asp m 90 95 . Lys Asp His Ser Ma Pro Asn Ser Arg Pro xle Asp phe Glu Met Lys 100 105 110 Lys Glu Asn Gly Glu Gls Gin Phe Tyr HiS Tyr Ala Ser Ser Val Lys 115 120 125 Pro Ma Arg Vai Ile Phe Thr Asp ser Lys Pro Glu Xle Glu Leu Gly 130 135 140 teu. Gin Ser Gly Gin Phe Trp Arg Lys Phe Glu val Tyr Glu Gly Asp 14 5 150 155 160 Lys Lys Leu Pro Ile Lys Leu val Ser Tyr Asp fhr vai Lys Asp Tyr 165 170 175 Ala Tyr Xle Arg Phe Ser Val Ser Aso Gly Thr Lys A,ls Val Lys ile 180 185 190 val Ser Ser fhr His Phe ASO ASO Lys GlU Glu Lys Tyr Asp Tyr fhr 195 200 205 teu Het Glu Phe Ala Gin Pro Ile Tyr Asn Ser Ala Asp LyS Phe Lys 210 215 220 Thr Glu Gin Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pro Tyr Lys Lys 325 230 235 240 Ma Lys Thr Leu 01» Arg Gin Val Tyr Glu Leu Asn Lys Ile Gin Asp 245 250 255 Lys Lè» Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys Lgu Glu Asp 260 265 270 fhsr Lys Lys Ala. La» ASp Glu Gin val Lys Ser Ala Xle Thr Glu Phe 375 280 285 Gin Asn Vai 01a Pro Thr ASO. Gl» Lys Het Thr Asp Leu Gin Asp Thr a m * 295 300 Lys tyr Vai Vai Tyr Glu Ser Val Glu A$n Asn Glu Ser «et Het Asp 305 310 315 520 Thr Phe vai Lys His Pro Xle Lys Thr Gly Hat Leu Asn Gly Lys Lys 325 330 335 Tyr Met Vai Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe het 340 345 350 Vai Glu Gly Gin Arg Vai Arg fhr Xle Ser Lys Asp Ala Lys Asn Asn 355 3S0 365 fhr Arg fhr Ile Ile Phe Pro Tyr Val Õlu Gly Lys Thr Leu Tyr Asp 370 37S 380 ’ 129

Ala Ile Vai Lys Vai His Val Lys Thr Ile Asp Tyr Asp Gly Gin Tyr MS 390 395 400 Mis mi Arg lie val ASp Lys GÍU Ala Phe Thr Lys Ala Asn Thr Asp 405 410 415 Lys Ser .Asn Lys Lys Glu Gin Gin Asp Aso Ser Ala Lys Lys Glu Ala 410 425 430 Thr Pro Ale Thr p.r© Ser Lys Pro Thr Pro Ser Pro val GlU Lys Glu- 435 440 445 Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin Leu Pro Ser 450 455 400 Val Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys Asp Lys Thr 45$ 470 47$ 480 Pro .ÃjLifâ Thr Lys Pr® Ala Lys Gly Glu Val Glu Ser Ser Ser Thr Thr 48$ 490 495 Pro Thr Lys Vai; Val Ser Thr Thr Gin Asn Val Ala Lys Pro Thr Thr 500 505 510 Ma Ser Ser Lys Thr Thr Lys Asp Vâl Val Gin Thr Ser Ala Ser Ser 515 520 525 Ser Glu AX& Lys Asp Ser Ala Pro Leu Gin Lya Ala Asn He Ly® Asm 530 535 540 Thr Asn Asp Gly Hia Thr Gin Ser Olá Asn Asn Lys Asn Thr Gin Glu 545 550 5$5 540 Asn Lys Alá Lys Ser 5«$

<210> 12 <211> 566 <212> PRT <213> Sequência Artificial <220> <223> ORFO657ηΗ <400> 12 130

Ms Glu 6lu Thr Giy Giy Thr Asn Thr Glu Ala Gin Pro Lys Thr Glu 1 5 10 15 Ma Vai Ma Ser Pro Thr Thr Thr Ser Glu Lys Ala Pro Glu Thr Lys 20 25 30 Pro val Aàíi Ala vai Ser Vâl Ser Asn Lys Glu vai Glu Ala Pró 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Val Lys Glu Vai Lys Ala Pro 50 55 60 Lys Glu thr Lys Ala Vai Lys pro Ala Ala Lys Ala Thr Asn As» Thr 63 70 75 BG Tyy Pro lie Leu Aso Glu Glu Leu Arg Glu Ala lie Lys Asn Pro Ala as 90 95 Ile Lys Asp Lys Asp Kis Ser Ala Pro As» Ser Arg Pro Ile Aãp Phe 100 105 110 Glu Hat Lys Lys Glu ASA Gly Glu Gin Gin Phe Tyr Sis Tyr Ala Ser 115 120 125 Ser Val Lys Pro AiA Arg vai Ile Phe Thr Asp Ser Lys Pro Glu Ile 130 135 140 Glu Leu Gly Leu Glu Ser Gly Gin Phe Trp Arg Lys Pbe Glu Val Tyr 145 ISO 155 ΐέο 131

Glu Gly Asp Lys Lys Léu Fr© Ile Lys Leu Val Ser Tyr Asp Thr val 165 170 175 Lys Asp Tyr Ale Tyr Ha Arg Phe Ser Vai -Ser Asn Gly Thr Lys Ala - ISO 185 190 Vai Lys ile Vai Ser Ser Thr His phe Asn Asn Lys Glu Glu Lys Tyr 195 200 205 Asp Tyr Thr Leu Met Glu Fhe Ala Gin Pr© Ile Tyr Asn Ser Ala ASp 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pro 225 230 235 240 Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys 245 250 255 Ile Gin Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 265 270 Leu Glu Asp Thr Lys Lys Ala Leu· Asp Glu Gin Val Lys ser Ala Ile 275 280 28S Thr Gin Phe Gin Asn Vai Gin Fr© Thr Asn Glu Lys Héfc Thr ASp: Leu 290 295 300 Gin Asp Thr Lys Tyr Vai vai Tyr Glu Ser Vai Glu Àsn Asn Glu Ser 305 310 315 320 Mac Hat Asp Thr Phe Val Lys His Pro Ile Lys Thr Gly «se Leu Asn 325 330 335 Gly Lys Lys Tyr Mee Val Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Asp Phe Met Vai Glu Gly Gin Arg Val Arg Thr Ile Ser Lys Asp Ala 355 360 365 Lys Asn Asa Thr Arg Thr Ile Ile Phe Fr© Val Glu Gly Lys Thr 370 375 380 Leu Tyr Asp Ala Ile val Lys Val His Val Lys Thr lie Asp Tyr Asp 385 390 395 400 Gly Gin Tyr Mis Val Arg Ile Val Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asn Thr Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Lys Glu Ala Thr Pr© Ala Thr Pr© Ser Lys Pr© Thr Pro Ser Pr© Val. 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin 450 455 460 Leu Pr© Ser Vai Glu LyS Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 455 470 475 480 Asp Lys Thr Pr© Ala Thr Lys Fr© Thr Lys Gly Glu Val Glu Ser Ser 485 490 495 Thr Thr Pro Thr Lys Val Vai Ser Thr Thr Gin Asn Val Ala Lys Pro 500 50$ 510 Thr Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser Ala Gly 515 520 525 Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn Ile Lys 530 535 540 Asn Thr Asn Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin 545 550 555 56Ô Glu Asm Lys Ala Lys Ser 5,65 13 132 <210> <211> <212> <213> <22 0> <223> <4 Ο 0> 568 PRT Sequência Artificial ORFO 657ηΗ 13 133

Ala Glu Glu Thr Gly Gly Thr A$t% Thr Glu Ala Gin Fro Lys Thr Glu 1 S 18 1$ Ala Vai Ala Ser Fr© Thr Thr Thr Ser Glú Lys Ala fr© GlU Thr Lys 20 25 30 Fro Vai Ala Asn Ala vai Ser Vai Ser Asn Lys Glu Val Glu Ala Fro 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Glu Val Lys Ala Fr© 50 55 60 Lya Glu Thr Lys Glu Vai Lys Fr© Ala Ala Lys Ala Thr Asn Asn Thr m 70 75 80 Tyr Fro Ile Leu Asa Gin Glu Leu Arg Glu Ala Ile Lys Asn Fr© Ala 85 90 95 lie Lys Asp Lys Asp· Hl S Ser Ala pr© Asa Ser Arg Fro Ile Asp Phe 100 105 110 Glu Met Lys Lys Lys Asp Gly Thr Gin Gin Phe Tyr BiS Tyr Ala Ser 115 120 125 Ser Vai Lya Fr© Ala Arg Vai Ile Phe Thr Asp Ser Lys pr© Glu XI© 130 135 140 Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Ffee Glu Vai Tyr 145 150 155 160 Glu. Gly Asp Lys Lys Leu Fr© 11© Lys Leu Vai Ser Tyr Asp Thr Val 165 170 175 Lys Asp Tyr Ala Tyr Ile Arg Phe Ser Vai Ser Asa Gly Thr Lys Ala ISO 185 190 Vai Lys Ile Vai Ser Ser Thr 81* Phe Asn Asn Lys Glu Glu Lys Tyr 105 200 r 205 Asp Tyr Tbr Leu. Met Glu Phe Ala Gin Pr© Ile Tyr Asn Ser Ala Asp 210 215 220 Lys Fhe 'Lya Thr Glu Glu ASP Tyr Lys Ala Glu Lys Leu Leu Ala Fro 225 230 235 240 Tyr Lys Lya Ala Lys Thr Leu Glu Arg Gin Vai Tyr Glu Leu Asn Lys 245 250 255 Ile Gin Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 ' 265 270 Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala lie 275 280 285 Thr Glu Fhe Gin Asa vai Gin Fr© Thr Asn Glu Lys «et Thr Asp Leu 200 295 300 Gin Aôp Thr Lys Tyr vai Vai fyr Glu Ser Vai Glu Asn Asn Glu Ser 305 310 315 320 Met «et Asp Thr Phe Vai Lys Bis Pr© Ile Lys Thr Gly Met Leu Asn 325 330 335 Gly Lys Lya Tyr fíet Vai «et Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Asp Fhe «et Vai Glu Gly Gin Arg Vai Arg Thr lie Ser Lys Asp Ala 355 360 365 Lys Asa Asn Thr Arg Thr lie Ue Phe Pr© Tyr Vai Glu Gly Lys Thr 370 375 380 134

Leu Tyr Asp Ale ile Vai Lys Val His vai Lys Thr Ile Asp Tyr Asp 385 350 395 400 Gly Gin Tyr Hie Vai &rg Ile Vai Asp Lys Glu Ala Phe Thr Lys Ala 405 410 4X5 hsn Thr Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asa Ser Ala Lys 420 425 410 Lys Glu Ala Thr Fro Ala Thr Fro Ser Lys ?ro Thr Pro Ser Fro Val 435 440 445 Glu Lys Glu Ser GXn LyS Gin Asp Ser Gin Lys Asp Asp Asa Lys Gin 4S8 455 460 Leu Fro Ser Vai Glu Lys Glu ASO Asp Ala ser Ser Glu Ser Gly Lys 465 470 475 480 Asp Lys Thr Pr® Ala. Thr Lys Fro Thr Lys Gly Lys val Glu Ser Ser 485 400 495 Ser Thr Thr Pro Thr Lys Vai val Ser Thr Thr Gin Asn Vai Ala Lys 500 SOS 510 Fro Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser 515 520 525 Ma Gly Ser Ser Glu Ala Lys ASp Ser Ala Pr© Leu Gin Lys Ala Asa ,530 535 540 Ile Lys ASTi Thr Asn Asp Gly Hls Thr Gin Ser Gin Asn Asa Lys Asa 545 550 555 560 Thr Gin Glu Asa Lys Ala Lys Ser 565

<210> 14 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657nH <4 Ο 0> 14 135

Ala GXu GXu Thr eiy Gly Thr Asn Thr Glu Ala Gin pro Lys Thr Glu 1 5 10 15 Ala Vál Ala Ser Pro Thr Thr Thr Ser Glu Lys Ala pro Glu Thr Lys 20 25 30 Pro Vai Ala Asn Ala Vai Ser Vai Ser Asn Lys Glu Val Glu Ala Pro 3$ 40 45 Thr Ser GXu Thr Lys Glu Ala Lys Glu Vai Lys Glu val Lys Ala Pro 50 55 60 Lys Glu Thr Lys Glu Vai Lys Pro Ala Ala •Lys Ala Thr Mn Asn Thr 65 70 75 80 Tyr Pro 11· Leu Ma Gin Glu Leu Argr Glu Ala lie Lys Mn Pró Glu 85 80 95 Ile Lys tep Lys Mp Ris Ser Ala Pro Asn Ser Arg Pro Ile Asp Phe 10Ô 105 no Glu Hat Lys Lys Lys Asp Gly Thr Gin Gin Phe Tyr His Tyr Ala Ser 115 12Ô 125 Ser Vai Lys Pro Ala Arg Vai lie Fhe Thr Asp Ser Lys Pro Glu Ile 130 13 S 140 Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Phe Glu val Tyr 145 150 15$ ISO 136

Glu Gly Asp Lys Lys Leu Pro Ue Lys Leu Ala Ser Tyr Asp Thr Val 165 170 175 Lys Asp Tyr Ala Tyr Ile Arg Phe Ser Ile Ser Asn Cly Thr Lys Ala ISO 185 ISO Vai Lys Ilt Vai Ser Ser Thr His Phe Asn Asn Lys Glu Glu Lys Tyr 19S 200 205 Asp Tyr Thr Leu Met Glu Phe Ala Gin Pro Ile Tyr Asn. Ser Ala Asp 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pro 225 230 , 235 240 Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Val fyr Glu Leu Asn. Lys 245 250 255 Ile Gin Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 268 265 270 Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala lie 275 280 285 Thr Glu Phe Gin Asn Vai Gin Pro Thr Asn Glu Lys Met Thr Asp Leu 290 295 300 Gin Aspt Thr Lys Tyr Vai val Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 310 315 320 Hat Met Asp Thr Phe Val Lys His Pro Ile Lys Thr Gly Met Leu Asn 325 330 335 Gly t.ys Lys Tyr Me* vai Met Glu Thr Thr As n Asp Asp Tyr Trp Lys 340 345 350 Asp Phe Met Vai Glu Gly Gin Arg val Arg Thr Ile Ser Lys Asp Ala ,· 355 360 365 Lys Asn Asn Thr Arg Thr Ile Ile Phe Pro Tyr Val Glu Gly Lys Thr 370 375 3SÕ Leu Tyr Asp Ala Ile Val Lys val His Val Lys Thr Ile Asp Tyr Asp 385 390 395 400 Gly Gin Tyr His Val Arg Ile Val Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asn Thr Asp Lys Ser Asn Lys Lys GlU Gin Gin Asp Asn Ser Ala Lys 429 425 430 Lys Glu Ala Thr Pro Ala Thr Pro Ser Lys Pro Thr Pro Ser Pro Val 43S 440 44S Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys ASp Asp Asn Lys Gin 450 455 460 Leu Pro Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 47$ 480 Asp Lys Thr Pro Ala Thr Lys Pro Ala Lys Gly Glu Val Glu Ser Ser 485 490 495 Ser Thr Thr Pro Thr Lys Val Val S«r Thr Thr Gin Asn Vai val Lys 500 505 510 Pró Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser 515 520 525 Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala pró Leu Gin Lys Ala Asn 539 535 540 lie Lys Asn Thr Asn Asp Gly HiS Thr Gin Ser Gin Asn Asn Lys Asn 545 550 555 569

Thr Sln Glu hm Lys Ala Lys Ser 563 137

<210> 15 <211> 564 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4 Ο 0> 15 138

Ala 61tt Glu Thr Gly Gly Thr ASO Thr Glu AXft Gi» Pro Lys Thr Glu 1 5 10 15 Ala Vai Ala Ser Pro Thr Thr Thr Thr Glu Lys Ala Pro Glu Ala Lya 20 25 30 ?το Vai Ala As» Ala Val Ser val Ser As» Lys Glu Val Glu Ala Pro 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Val Lys Al a Pro Lys Glu Thr 50 55 60 Lys ala Vai Lys Pro Ala Ala Lys Ala Asp As» As» Thr Tyr Pro Ue 65 70 75 30 Leu As» Gin Glu Leu Arg Glu Ala Ile Lys As» Pro Ala Ile Lys Asp 85 00 55 Ly& Asp KiS Ser Ala Pro Asn Ser Arg Pro lie Asp Phe Glu Met Lys 100 105 no Lys Glu Asn Gly Glu Glu Glu Phe Tyr His Tyr Ala Ser Ser Val Lys us 120 125 Pro Ala Arg val Ile Phe Thr Asp Ser Lys Pro Glu lie Glu Leu Gly IM 135 140 Leu Gin Ser Gly Gin Phe Trp .Arg Lys. Phe Glu Val -Tyr Glu Gly Asp 145 ISO 155 150 Lys Lys Leu Pro Ile Lys Leu val Ser Tyr Asp Thr Val Lys Asp Tyr 165 170 175 ala Tyr He Arg Phe Ser Val ser ASn Gly Thr Lys Ala Val Lys Ile 180 IBS ISO vai ser ser Thr His Phe as» as» Lys Glu Glu Lys Tyr Asp Tyr Thr l§5 200 205 Leu Mefc Glu· phe Ala Gin Pro Ile Tyr As» Ser Ala ASp Lys Phe Lys 210 225 320 - Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pro Tyr Lys Lys 22S 230 235 240 Ala Lys Thr Leu Glu Arg Glu Val Tyr Glu Leu AS& Lys Ile 61a ASp 245 250 255 Lys Leu Pro Glu Lys Leu Lys Alá Glu Tyr Lys Lys Lys Leu Glu Asp 260 285 270 Thr Lys Lys Ala Leu Asp Glu Glu Val Lya Ser Ala Ile Thr Glu phe 275 290 2S5 61a Asa Vai Glu Pro Thr As» Glu Lys Met Thr Asp Leu Gl» Asp Thr 2S0 205 380 Lys Tyr Vãl Val TVr Glu Ser Val Glu As» As» Glu Ser Met Mêt Asp 305 310 315 320 Thr Phe Val Lys His Pro Ile Lys Thr Gly Het Leu Asn ©ly Lys Lys 325 330 335 Tyr «et val Het Glu Thr Thr hsn Asp Asp Tyr Trp Lys Asp Phe Hefc 340 345 350 Vai Glu fíly 61fl Arg Val Arg Thr Ile Ser Lys Asp Ala Lys As» As» 355 360 365 *m*r Arg Thr ile Ile Phe Pro Tyr Val Glu Gly Lys Thr Leu Tyr ASp 310 37S 380 139

Ala xla Val Lys Val Kls Val Lys Thr lie Asp Tyr **P Gly Gin Tyr 38S 390 395 400 His Val Arg íle Va l Asp Lys Glu Ala Pt» Thr Lys Ala Asn Thr Asp 405 410 415 Lys ser Asíi Lys Lys Glu Gin Gin, Asp Asn Ser Ala Lys Lys Glu Ala 420 425 430 Thr Fr© Ala Thr Fro Ser Lys Pro Thr Fro Ser Pro Val Glu Lys Glu 435 440 445 Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin Leu Fro Ser 450 455 460 Vai Glu Lys Glu Asn Asp Ala Ser' Ser Glu Ser Gly Lys A®p Lys Thr 465 470 475 480 Fro Ala Thr Lys Fro Ala Lys Gly Glu Val Glu Ser Ser Ser Thr Thr 485 450 495 Pro fhr Lys Val Val Ser Thr Thr Gin Asn Val Ala Lys Fro Thr Ala 500 505 510 Ser Ser Lys Thr Thr Ly s Aep Val Val Gin- Thr Ser Ala Ser Ser Ser 515 520 525 Glu Ala Lys Asp Ser Ala Fro- Leu Gin LyS Ala aso. Ile Lys Asn Thr 530 535 540 Ase Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin Glu Asn 545 55Θ 555 560 Lys Ala Lys Ser

<210> 16 <211> 565 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <400> 16 140

Ala Glu.Glu Thr Gly Gly Thr Asn Thr Glu Ala Gin Pr© Lys Thr Glu 1 5 10 15 Ala" vai Ala sèr Pr© Thr Thr Thr Thr Glu Lys Ala Pr© Glu Ala Lys 20 25 30 Fr© mi Ala Asn Ala Vai Ser Vai Ser Asn Lys Glu Vai Glu Ala Fr© 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Ala Pr© Lys Glu Thr 50 55 60 Lys Ala Vai Lys Fr© Ala Ala Lys Ala Asp Asn Asn Thr Tyr Pr© Ile 65 70 75 @0 Leu Asn Gin Glu Leu Aro GlU Ala ile Lys Asn Pr© Ala lie Lys Asp SS PO SS Lys Asp Hís Ser Ala Fr© Asn Ser Arg Fr© lie Asp Phe Glu :Wefc Lys 100 105 110 Lys Glu Asn Gly Glu Gin Gin Phe Tyr Hls Tyr Ala Ser Ser Vai Lys 115 120 125 Pro Ala Arg Vsl Ile Fh* Thr Asp Ser Lys Pr© Glu Ile Glu Leu Gly 1.30 135 140 Leu Gin Ser Gly Gin Fhe Trp Arg Lys Fhe Glu Vai Tyr Glu Gly ASp US 150 155 ISO 141

Lys Lys Leu Pr© 11© Lys Leu Val Ser Tyr Asp Thr Vai Lys Asp Tyr 165 179 175 Ala Tyr He Arg Fhe Ser Val Ser Asn Gly Thr Lys Ala val Lys 11« 160 135 190 Vai Ser Ser Thr Kis Phe Aãn Asn Lys Glu Glu Lys Tyr Asp Tyr Thr 195 290 205 Leu Met Glu Fhe Ala Gin Pr© 11« Tyr Asn Ser Ala Asp Lys Phe Lys 219 215 - 220 Thr Glu Gltt Asp Tyr LyS Ala Glu Lys Leu Leu Ala Fr© Tyr Lys Lys 225 230 235 240 Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys He Gin Asp '245 250 255 Lys Leu Pr© Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys Leu Glu Asp 260 265 270 Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala 11© Thr 01« Phe 2? 5 280 285 Gin Asa vai Gin Pr© Thr' Asn Glu Lys M«t Thr Asp Leu Gin Asp Thr 299 295 300 . Lys Tyr Vai Vai Tyr Glu Ser Val Glu Asn Asn Glu Ser Het Met Asp 3 OS 310 315 320 Thr Fhe vai Lys His Fr© lie Lys Thr Gly Met Leu Asn Gly Lys Lys 325 330 335 Tyr Met Vai Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Het 340 345 350 Vai Glu Gly Gin Arg val Arg Thr lie Ser Lys Asp Ala Lys Asn Asn 355 360 365 Thr Arg Thr 11e XI© Phe Pr© Tyr Val Glu Gly Lys Thr Leu Tyr Asp 370 375 380 Ala n* val Arg val Kis Val Lys Thr He ASp Tyr Asp Gly Gin Tyr 385 390 395 400 His Vai Arg lie Val Asp Lys Glu Ala Phe Thr Lys Ala Asn Thr Asp 405 410 415 LyS Ser Asn Lys Lys Glu Gin Glu Asp Asn Ser Ala Lys Lys Glu Ala 420 425 430 Thr Pro Ala Thr Fr© Ser Lys Pr©' Thr Pr© Ser Pr© Val Glu Lys Glu 435 440 445 Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin Leu Pr© Ser 459 455 460 Vai Glu Lys Glu Asn ASp Ala Ser $er Glu Ser Gly Lys Asp Lys Thr 465 470 475 480 Fr© Ala Thr Lys Pr© Ala Lys Gly Glu Val Glu Ser Ser Ser Thr Thr 485 490 495 Pr© Thr Lys val val Ser Thr Thr Gin Asn val Ala Lys Pr© Thr Thr 500 505 510 Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser Ala Gly Ser 515 520 525 Ser Glu Ala Lys Asp Ser Ala Pr© Leu Gin Lys Ala Asn lie Lys Asn 530 535 540 Thr Asn A$p Gly His Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin Glu 545 550 555 560

Asn Lys Ala Lys Ser ‘ 565 142

<210> 17 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4 Ο 0> 17 143

Ma Glu Glu Thr Gly Gly Thr Asn Thr Glu Ala Gin Fro Lys Thr Glu i 5 10 15 Ala Leu Ala Ser p*e Thr Thr Thr Thr Glu Lys Ala Fro Glu Thr Lys 20 25 30 Fro Vai Aia Asp Ala Vai Ser ¥al Ser Asa Lys Glu Vai Glu Ala Fro 35 40 45 Th* Ser Glu Thr Lys. ,GlU Aia Lys Glu Vai Lys Glu Vai Lys Ala Fro se - 55 60 Lys 0.lu Thr Lys Ala val. Lys Fro Ala Ala Lys Ala Asp Asn Asn Thr 6S 70 75 80 Tyr Fro 11# Leu Asa Gla Glu Leu Arg Glu Ala Ile Lys Asn Fro .Ala 85 90 95 11# Lys Asp Lys Asp His Ser Ala Fro Asa Ser Arg Fro Ile Asp Fhe 100, 105 110 GXu Mefc Lys Lys Glu Asn Gly Glu Gin Glu Fhe Tyr HÍS Tyr Ala ser 115 128 125 Ser vai Lys Fro Ala Arg Vai XI# Phe Thr Asp .Ser Lys Fro Glu Ile 130 135 140 Glu Leu Gly Leu Gin Ser Gly Glu Phe Trp Arg Lys Fhe Glu Vai Tyr 145 ‘ 150 155 160 Glu Gly Asp Lys Lyá Leu. Fro ile Lys Leu Vai Ser Tyr Asp Thr Vai IÊ5 170 175 Lys Asp Tyr Ala Tyr 11© Arg Fhe Ser Vai Ser Asa Gly Thr Lys Ala ISO ISS 190 vai Lys lie vai Ser Ser Thr Bis Fhe Asa Asn Lys Glu Glu Lys Tyr 185 200 205 Asp Tyr Thr Leu Mefc Glu Phe Ala Gin Fro Ile Tyr' Asn Ser Ala Asp 210 215 220 Ly$ Fhe Lys Thr Glu, Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Fro 225 230 235 240 Tyr Lys Lys Ala Lys Thr Leu Glu Mg Gla Vai Tyr Glu Leu Asn Lys 245 *· 250 255 lie Gin Asp Lys Leu Fro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 205 270 Leu Glu As;p Thr Lys Lys Ala Leu ASP Glu Gin Vai Lys Ser Ala Ile 275 280 285 Thr Glu Fhe Gin Asa Vai Gin Fro Thr Asn Glu Lys «et Thr Asp Leu 290 295 300 Gin Asp Thr Lys Tyr Vai Vai Tyr €lu Ser Vai Glu Asn Asn Glu Ser 305 310 315 320 Mèt Met Asp Thr Phe Vai Lys His pro 11# Lys Thr Gly mt Leu As» 325 330 335 Gly Lys Lys Tyr Met Vai H$r Glu Thr Thr Asn Asp Asp Tyr Tzp Lys 340 345 350 Asp Phe Met Vai Glu Gly Gin Arg Vai Arg Thr Ile Ser Lys Asp Ala „ 355 300 - MS He Asn Asp Thr Arg Thr Ile Ile Fh© Fro Tyr Vai Glu Gly Lys Thr 37Q 375 380 144

Leu Tyr Asp Ai a Ile vai Lys Vai HÍS Vai Lys Thr ile Asp Tyr Asp 385 390 395 400 Gly Gin Tyr His vai Ile Vai Asp Lys Glu Ala Ftee Thr Lys Ala 405 410 415 hm Thr Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Lys Glu Ala Thr Pro Ala Thr Pro Ser Lys Pro Thr Pro Ser Pro Val 435 - 440 445 Gitt Lys Glu Ser Gin Lys Gin ASp Ser Gin Lys ASp ASP Asn Lys Gin 450 455 450 Leu Pro"Ser Vai Giu Lys Glu Asa Asp Ala Ser Ser Glu Ser Gly Lys 455 470 475 480 Asp Lys Thr PrO Ala Thr Lyâ Pró Ala Lys Gly Giu val Glu Ser Ser. 48$ 490 495 Set Thr Thr Pro Thr Lys Vai Vai Ser Thr Thr Gin Asn val Ala Lys 500 505 510 pro Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Vai Vai Gin Thr Ser 515 520 525 Ale. Gly Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn 530 535 540 Ile Lys Asn Thr Asa Asp Gly Mis Thr Gin Ser Grltt Asn Asn Lys Asn S4S 550 555 550 Thr Gin Glu Asa Lys Ala Lys Ser S65

<210> 18 <211> 565 <212> PRT <213> Sequência Artificial <220> <223> ORFO657ηΗ <400> 18 145

Ala Glu Glu Thr Gly Gly Thr Asm Thr Glu Ala Gin Pro Lys Thr Glu 1 5 10 15 Ala Vai Ala Ser Pro Thr Thr Thr Thr Glu Lys Ala Pro Glu Ala Lys 20 25 30 Pro Vai Ala Aso Ala Vai Ser Vai Ser Asn Lys Glu Vai Glu Ala Pro 35 40 45 Thr Ser Glu Thr Lys GlU Ala Lys Glu vai Lys Ala Pro Lys Glu Thr $0 55 60 Lys Ala Vai Lys Pro Ala Ala Lys Ala Asp Asn Asn Thr Tyr Pro Ile $5 70 75 00 Lèu Asn Glu Glu Leu Arg Glu Ala Ile Lys Asa Pro Ala Ile Ly s Asp §5 90 0$ Lys Asp His Ser Ala Pro Asm Ser Arg Pro ile Asp Phe Glu Stefc Lys 100 105 no Lys Glu Asn Giy Glu Gin Glu Phe Tyr His Tyr Ala Ser Ser vai Lys 115 120 125 Pro Ala Arg vel Ile phe Thr Asp Ser Lys Pro Glu Ile Glu Leu Gly 130 135- 140 Leu Gin Ser Gly Gin Phe Trp Arg Lys Phe Glu Vai Tyr Glu Gly Asp 145 150 155 160 146

Lys Lys Leu Fro 11* Lys Leu Val Ser Tyr Asp Thr Val Lys Asp Tyr 165 170 175 Ma fyr Ile Arg Phe S«r Val Ser Asn Gly Thr Lys Ala Val Lys lie ISO 185 190 Vai Ser Ser Thr Eis Fhe Asn Asn Lys Glu Glu Lys tyr Asp Tyr Thr 155 200 205 Lee «et Glu Phe Ala Glu Fro ile tyr Asn Ser Aia Asp Lys Fhe Lys 210 215 220 - Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Fro Tyr Lys Lys 235 * 230 235 240 Ala Lys Thr Leu Glu Arg Gin Vai Tyr Glu Leu Asn Lys Xle Gin Asp 245 250 255 lys Leu Pro Glu Lys Leu Lys Ala Glu tyr Lys Lys Lys Leu Glu Asp 200 265 270 Thr Lyss Lys Ala Leu Asp Glu Gin val Lys Ser Ala xle Thr Glu Fhe 275 280 28$ Gin Asa Vai Gin Fro Thr Asn Glu Lys Met Thr Asp Leu Gin Asp Thr 250 295 300 Lys Tyr vai Vai Tyr Glu Ser Vai Glu Asn Asn Glu Ser Met Met Asp 305 310 315 320 Thr Fhe Val Lys Eis Fro 11 e Lys Thr Gly Met Leu Asn Gly Lys Lys 325 330 335 Tyr «et vai Met Glu Thr Thr Asn Asp Asp tyr Trp Lys Asp Fhe Met 340 345 350 Vai Glu Gly Gin A r g Va l Arg Thr lie Ser Lys Asp Ala Lys Asn Asn 355 360 365 Thr Arg Thr 11« He Fhe Fro Tyr Val Glu Gly Lys Thr Leu tyr Asp 370 375 380 Ala iie Vai Lys Val His vai Lys Thr lie Asp Tyr Asp Gly Gin Tyr 385 390 395 400 Mía Vai ATS 11« val Asp Lys Glu Ala Fhe Thr Lys Ala Asn Thr ASp 405 410 415 Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys Lys Glu Ala 420 425 430 Thr Pro Aia Thr Fro Ser Lys Pro Thr Fro Ser Fro val Glu Lys Glu 435 440 445 Ser GÍn Lys Glft Asp Ser Gin Lys Asp Asp Asn Lys Fro Leu Fro Ser 450 455 460 Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys Asp Lys Thr 465 470 475 480 Fro Âla Thr Lys Fro Ale Lys Gly Glu Val Glu Ser Ser Ser Thr Thr 485 490 495 Pro Thr Lys Val Val Ser Thr Thr Gin Asn Val Ala Lys Pro Thr Thr 500 505 510 Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser Ala Ser Ser 515 520 525 Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn He Lys S30 535 540 Thr Asn Asp Gly Eis Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin Glu 545 550 555 560 Asn Lys Ala Lys Ser

56S 147

<210> 19 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4 Ο 0> 19 148

Ala Glu Glu Thr Gly Gly Thr Asn Thr Glu Ala Gin Pro Lys Thr Glu 1 S 10 15' Ala Vai Ala Ser Pro Thr Thr Thr Ser Glu Lys Ala Pro Glu Thr Lys 20 25 30 Pro Vai Ala Asn. Ala Vai Ser Vai Ser ASR Lys Glu Vai Glu Ala Pro 35 40 4S Thr Ser Glu Thr Lys Gl» Ala Lys Glu Vai Lys Glu Vai Lys Ala Pro 50 55 60 Lys Glu Thr' lys .Ala Vai Lys Pro Ala Thr Lys Ala Asp Asn Asn Thr 65 70 75 80 Tyr Pro lie leu Asn Gin Glu Leu Arg Glu Ala lie Lys Asn Pro Ala 85 90 95 lie Lys Asp Lys ASp HiS Ser Ala Pro Asn Ser Arg Pro ile Asp phe 3.00 105 110 Glu «et Lys Lys 61» Asn Gly Glu Gin Gin Phe Tyr His Tyr Ala. Ser 115: 130 125 Ster Vai Lys Pr© Ala Arg Vai lie Phe Thr Asp Ser Lys Pro Glu Xis 130 135 MO Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Phe G l u Vai Tyr 145 150 155 160 Glu Gly Asp Lys Lys Leu Pro lie Lys Leu Vai Ser Tyr Asp Thr Vai 165 170 115 Lys Asp Tyr Ala Tyr iie Arg Phe Ser vai Ser Asn Gly Thr Lys Ala 180 185 190 Vai Lys Ile Vai Ser Ser Thr H is Phe Asn Asn Lys Glu Glu Lys Tyr 135 200 205 Asp Tyr Thr Leu «et Glu Phe Ala Gin Pro lia Tyr Asn Ser Ala Asp 210 215 320 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pro 225 230 235 340 Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Vai Tyr Glu Leu Asn Lys 243 250 255 Ile Gin Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 265 270 Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin Vai Lys Ser Ala Xle 275 230 - 285 Thr Glu Phe Gin Asn Vai Gin Pro Thr Asn Glu Lys Met Thr Asp Leu 230 295 300 Gin Asp Thr Lys Tyr vai vai Tyr Glu ser vai GiU Asn Asn Glu ser 305 310 315 320 Met Met Asp Thr Phe Vai Lys Hís Pro lie Lys Thr Gly Met Leu Asn 325 330 335 Gly Lys Lys Tyr Met Vai «et Glu Thr Thr Asn ASp Asp Tyr Trp Lys 340 345 350 Asp Phe Met Vai Glu Gly Gin Ãrg Vai Arg Thr lie Ser Lys Asp Ale 355 360 365 Lys As« Asn Thr Ar§ Thr lie Ilô Phe Pro Tyr val Glu Gly Lys Thr 370 375 380 149

Leu Tyr Asp Ala lia Vai Lys Vai His Vai Lys Thr lie ASp tyr ASp 385 380 305 400 Gly Gin Tyr Eis vai Arg Ile Vai Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asa Thr Asp Lys Ser Aan Lys Lys Olu Gin Gin Asp ASn Ser Ala Lys 420 425 430 Arg Giu Ala Thr Pm Ala Thr Pro Ser Lys Pro Thr Pm Ser Pm Vai 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asa Lys' Gin 450 455 460 Leu Pr© Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 475 480 Asp Lys Thr Pro Ala Thr Lys Pro Ala Lys Gly Glu Vai Glu Ser Ser 485 400 405 Ser Thr Thr Pro Thr Lys Vai Vai Ser Thr Thr Gin Asn Vai Ala Lys 500 SOS 510 Pro Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Vai Vai Gin Thr Sêr 515 520 525 Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asa 530 535 540 lie Lys Aen Thr As» Aãp Giy His Thr Gin Ser Gin Asa A$» Lys Asa 545 550 555 560 Thr Gin Glti Asn Lys Ala Lys Ser

5SS

<210> 20 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <400> 20 150

Ma Glu Glu Thr Gly Gly Thr As© Thr Glu Ala Gin Pr© Lys Thr Glu 1 5 10 15 Ala val Ale Ser Pr© Thr Thr Thr Ser Glu Lys Ala Pro Glu Thr Lys 20 25 10 Fr © Val Ais Asn Ala Vai Ser val Ser Asn Lys Glu Val Glu Ala Pr© 35 40 45 Thr Ser Glu fhr Lys Glu Ala Lys Glu Val Lys Glu Val Lys Ala Pro 50 55 60 Lys Glu Thr Lys Ala vai Lys Pr© Ala Thr Lys Ala Asp Asn Asn Thr 65 70 7S 80 Tyr Pr© Ile Leu Asa Gin Glu Leu Arg Glu Ala ile Lys ASft Pr© Ala SS 50 $5 , lis Lys Asp Lys Asp HiS Ser Ala Pr© Asn Ser Arg Pro ile Asp Phe 100 105 no Glu Met Lys Lys Glu Asn Gly Glu Gin Gin Phe Tyr Hls Tyr Ala Ser 115 13 D 125 Ser Val Lys Pr© Ala Arg vai Ile Phe Thr Asp Ser Lys Pro Glu Ile no ns 140 Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp •Arg Lys Phe Glu val Tyr 145 ISO 155 160 151

Glu Gly Asp Lys Lys Leu Pro Ile Lys Leu Val Ser Tyr Asp Thr val 165 170 175 Lys ASp Tyr Alá Tyr Ile Arg Phe Ser Val Ser Asn Gly Thr Lys Ala 180 185 190 Vai Lys 11« Vai Ser Ser Thr His Phe Asn Asn Lys Glu Glu Lys Tyr 195 200 205 Asp Tyr Thr Leu Hefc Glu Phe Ala Gin Pro Ile Tyr Asn Ser Ala Asp 210 215 220 Lys The Lys Thr Glu Glu ASP Tyr Lys Ala Glu Lys Leu Leu Ala Pro 225 230 235 240 7¾¾ Lys Lys Ala Lys Thr Leu Glu Arg Gl» Val Tyr Glu Leu Asn Lys 245 250 255 'Π® Gin Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 280 265 270 L«« Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala Ile 275 280 285 Thr Glu Phe Gin Asn Vai Gin Pro Thr Asn Glu Lys H«t Thr Asp Leu 298 295 300 Gin Asp Thr Lys Tyr Val Val Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 310 315 320 mt Met Asp Thr Phe Val Lys Hís Pro Ile Lys Thr Gly «et Leu Asn 325 330 335 Gly Lys Lys Tyr Met Val Met- Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Asp sh» M»t Vai Glu Gly Gin Arg Val Arg Thr Ile Ser Lys Asp Ala 355 360 365 Lys Asa Asft Thr Ar§ Thr Ile lie Phe Pro Tyr Val Glu Gly Lys Thr 370 375 380 Leu Tyr ASp Ala 11« val Lys val His val Lys Thr Ile Asp Tyr Asp 385 396 395 400 Gly Glu Tyr Hís Vai Arg Ue Val Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asn Thr Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn ser Ala Lys 420 425 430 Lys Glu, Alá Thr Pr© Ala Thr Pro Ser Lys Pro Thr Pro Ser Pro Val 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin 450 - 455 460 Leu Pro Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 47 S 480 Mp Lys· Thr pro Ala Thr Lys pro Ala Lys Gly Glu Val Glu Ser Ser 485 4§Ó 4 §5 Ser Thr Thr Pr© Thr Lys Val Val Ser Thr Thr Gin Asn Val Ala Lys 500 505 510 Pro Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Val Val Gin Thr Ser 515 520 S.25 Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn 510 535 540 ile Lys Asn Thr Aán Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn 54 S 550 555 560 Thr Glu Glu Asn Lys Ala Lys Ser 565 152

<210> 21 <211> 576 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4Ο0> 21 153

Ala Glu Glu Thr Gly Val Thr Asn Thr Glu Ala Gin pro Lys Thr Glu 1 ' 5 IO 15 Ala val Ala Ser Pr© Thr Thr Thr Thr Thr Glu Lys Ala Pro Glu Ala 20 25 30 Lys Pr© val Ala Lys Pro val Ala Asn Ala val $er Val Ser Asn Lys 35 40 45 Glu Vai Val Ala Pr© Thr Thr Glu Thr Lys Glu Ala Lys Glu Vàl Lys 50 S5 68 Ala Vai Lys Glu Val Lys Ala Pr© lys Glu Ala Lys Glu Glu Lys Pro 6$ 70 75 80 Ala Ala Lys Ala Asp Asn Asn Thr Tyr Pr© Ile Leu Asn Gin Glu Leu 85 98 95 Arg Glu Ala lie lys Asn Pro Ala Ile Lys Asp Lys Asp His Ser Ala 100 105 - 110 Pro Asa Ser Arg Pro Ile Asp Phe Glu Met Lys Lys Lys Asp Gly Thr 115 120 125 Gin Gin Phe Tyr His Tyr Ala Gly Ser Val Lys Pro Ala Arg val ile 130 135 140 Phe Thr Asp Ser Lys Pro Glu Ile Glu Leu Gly Leu Gin Ser Gly Gin 14 S ISO 155 16Θ Fhe Trp Arg Lys Phe Glu vai Tyr Glu Gly Asp Lys Lys Leu Pro Ile 165 17Ô 175 Lys Leu Val Ser Tyr Asp Thr val Lys Asp Tyr Ala Tyr ile Arg Phe 180 185 - 190 Ser vai Ser Asn Gly Thr Lys Ala Val Lys He Val Ser Ser Thr His 195 200 205 PA® Asa Asa Lys Glu Glu Lys Tyr Asp' Tyr Thr Leu Het Glu Phe Ala 210 215 220 Gin :Pr© lia Tyr Asn Ser Ala Asp Lys Phe Lys Thr Glu Glu Asp Tyr 225 230 235 240 Lys Ala Glu Lys Leu Leu Ala Pro Tyr Lys Lys Ala Lys Thr Léu Glu 245 250 255 Arg Gin Val Tyr Glu Leu Asn Lys Ile Gin Asp Lys Leu Pro Glu Lys 260 265 270 Leu Lys Alá Glu Tyr Lys Lys Lys Leu Glu Glu Thr Lys Lys Ala Leu 275 280 285 Asp Glu Gin Val Lys Ser Ala Ile Thr Glu Phe Gin Asn Val Gin Pro 290 295 300 Thr Asn Glu Lys Het Thr Asp Leu Gin Asp Thr Lys Tyr Val Val Tyr 305 310 315 320 Glu Ser Val Glu Asn Asn Glu Ser Wet Met Asp Thr Phe Val Lys His 325 330 335 Pro Ile Lys Thr Gly Met Leu Asn Gly Lys Lys Tyr het Vâl Mefc Glu 340 345 350 Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Met Val Glu Gly Gin Arg 355 360 365 Vai Arg Thr Ile Ser Lys Asp Ala Lys Asn Asn Thr Arg Thr Ile Ile 320 375 380 154

Phe Pr© Tyr Vai Glu Gly Lys Thr Leu Tyr Asp Ala Xle Val Lys Val 385 390 395 400 His Vai Lys Thr Ile Asp Tyr Asp Gly Gin Tyr His Val Arg n« Val 405 410 415 ASp Lys Glu Ala Phe Thr Lys Ala Asn Ala Asp Lys Thr Asn Lys Lys 42 0 425 430 Glu Gin Gin Asp Asn Ser Ala Lys Lys Glu Thr Thr Pro Ala Mefc Pro 435 440 445 Ser Lys Pro Thr Thr Pro Pm Val Glu Lys Glu Ser Gin Lys Gin Asp 450 455 460 Ser Gin Lys Asp ASp Asn Lys Gin- Ser Pro Gly val Glu Lys Glu Asn 465 470 * 475 · 480 ASP Ala ser Ser Glu Ser Gly Lys Asp Lys Met Pro Val Thr Lys Pro 485 490 495 Ala Lys Ala Glu Val Glu Ser Ser Ser Thr Thr Pro Thr Lys val val 500 505 510 Ser Thr Thr Gin Asn Val Ala Lys Pro Thr Thr Ala Ser Ser Glu Thr 515 520 525 Thr Lys Asp vai Val Gin Thr Ser Ala Gly Ser Ser Glu Ala Lys Asp 530 535 540 Ser Ala Pro Leu Gin Lys Ala Asn Xle Lys Asn Thr Aon Asp Gly His 543 550 555 560 Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin Glu Asn Lys Ala Lys Ser 565 570 575

<210> 22 <211> 576 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <4Ο0> 22 155

AI» Glu Glu Thr Gly Vai Thr M Thr Glu Ala Gin Pro Lys Thr Glu :ι 5 10 15 Ma vai Ala Ser pro Thr fkr Thr Thr Thr Glu Lys Ala Pro Glu Ala 20 25 30 Lys Pro Vai Ala Lys Pro Vai Ala Asa Ala Vai Ser Vai Ser Asn Lya 35 40 45 Glu Vâl Vai Ala Pro Thr Thr Glu Thr Lys Glu. Ala Lys Glu Vâl Lys 50 55 m Alô Vai Lys Glu Vai Lys Ala Pro Lys Glu Ala. Lys Glu Glu Lys Pro ss 70 75’ @0 Ala Ala Lys Ala Asp Aèr Asa Thr Tyr Pro 11© Leu Asn Gin Glu Leu 85 90 95 ΑΓ0 Glii Alâ 11© Lys Asa Pro Ala 11© Lys Asp Lys ASp His Ser Ala 100 105 110 fr© Asn Ser Arg Pro Ile Asp Phe Glu Met Lys Lys Lys Asp Gly Thr 115 120 125 61 n Gin Ph© Tyr Bis Tyr Ala Ser Ser Vai Lys Pro Ala Arg Vai Ile Í30 135 140 Fixe Thr Asp Ser Lys Pro Glu Ile Glu Lm Gly Leu Gin Sor Gly Glu «5 ISO 155 ISO 156

Phe Trp Arg Lys Phe Glu vai Tyr Glu Gly Asp Lys Lys Leu Pr© Xle 165 170 175 Lys Leu Vai Ser Tyr Asp Thr val Lys ASp Tyr Ala Tyr lie Arg Phe ISO 185 190 Ser Vai Ser Asn Gly Thr Lys Ala Val Lys lie Val Ser Ser Thr His 195 200 205 Phe hm As» Lys Glu Glu Lys Tyr Asp Tyr Thr Leu Met Glu Phe Ala 210 215 220 Gin Pr© xle Tyr Asa Ser Ala Asp Lys Phe Lys Thr ©lu Glu Asp Tyr 22$ 230 235 240 Lys Ala Glu Lys Leu Leu Ala Pr© tyr Lys Lys Ala Lys Thr Leu Glu 245 250 255 Arg Gin Vai Tyr Glu Leu Asn Lys lie Gin Asp Lys Leu Pro.Glu Lys , 260 265 270 Leu Lys Ma Glu Tyr Lys Lys Lys Leu Glu Glu Thr Lys Lys Ala Leu 275 280 285 Asp Glu Gin Vai Lys Ser Ala lie Thr Glu Phe Gin Asn Val Gin Pr© 290 205 300 Thr Asn Glu Lys Het Thr Asp Leu Gin Asp Thr Lys Tyr Val Val Tyr 305 310 315 320 Glu Ser Vai Glu Asn Asn Glu Ser Met Met Asp Thr Phe Val Lys His 325 330 335 Pr© Ile Lys Thr Gly Met Leu Asn Gly Lys Lys tyr Met val Met Glu 340 345 350 Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Met Val Glu Gly Gin Arg 355 360 365 Val Arg Thr 1.1a Ser Lys Asp Aia Lys Asn Asn Thr Arg Thr lie Xle 3?0 375 380 Phe Pr© Tyr Vai Glu Gly Lys Thr Leu Tyr Asp Ala lie Val Lys Val 385 300- 395 400 His Vai Lys Thr lie Asp Tyr Asp ©ly Gin Tyr HÍS Val Arg Xle Val 405 410 415 Asp Lys Glu Ala Phe Thr Lys Ala Asn Ala Asp Lys Thr Asn Lys Lys 420 425 430 Glu Gin Gin .ASp Asn Ser Ala Lys Lys Glu Thr Thr Pr© Ala Met Pr© 435 440 445 Ser Lys Pr© Thr Thr Pr© Pr© Val Glu Lys Glu Ser Gin Lys Gin Asp 450 455 460 Ser Gin Lys Asp Asp Asa Lys Gin Ser Pr© Ser Val Glu Lys Glu ASh 465 470 475 480 Asp Ala Ser Ser Glu Ser Gly Lys ASP Lys Met Pr© Val Thr Lys Pro 435 490' 495 Ais Lys Ala Glu Vai Glu Ser Ser Ser Thr Thr Pr© Thr Lys Val vai 500 505 510 Ser Thr Thr Gin Asn Vai Ala Lys Pr© Thr Thr Ala Ser Ser Glu Thr 515 520 525 Thr Lys Asp Vai Vai Gin Thr Ser Ala m Ser Ser Glu Ala Lys Asp 530 535 S40 Ser Ala Pr© Leu Gin Lys Ala Asn 11« Lys Asn Thr Asn Asp Gly His 545 550 555 560 Thr Gin Ser Glu Asn Asn Lys Asn Thr Gin Glu Asn Lys Ala Lys Ser 565 570 575 157

<210> 23 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4Ο0> 23 158

Ma Glu Glu Thr Gly ti Gly Thr Aan Thr Glu Ala H ft Gin Pro Lys Thr 1 st Glu Ala Vai Ala Ser J! Pro Ser Thr Thr Thr iy Glu Lys Ala Pro Glu Ala Lys 20 25 30 Pro Vai Ala ILSn Ala Val Ser val ser Asn Lys Glu Val Glu Ala pro 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Val Lys Glu val, Lys Ala Pro 50 55 60 Lys Glu Thr Lys Glu Val Lys Pro Alá Thr Lys Ala Asp Asn Asn Thr SS 70 75 80 Tyr Pr© Ile Leu Asn Glu Glu Leu Arg Glu Ala Ile Lys Asn Pro Ala $5 00 , 55 11© Lys Asp Lys ASp His Ser Ala Pro Asn Ser Arg Pro Ile Asp Phe 100 105 110 Glu Het Lys Lys Lys Asp Gly Thr Glu Gin Phe Tyr His Tyr Ala Ser 115 120 125 Ser Vai Lys Pro Ala Arg val Ile Phe Thr Asp Ser Lys Pro Glu Ile 130 , 135 140 Glu Leu Gly Leu Glft Ser Gly Gin Phe Trp Arg Lys Phe Glu Val Tyr US ISO 155 150 Glu Gly A SP Lys Lys Leu Pro Ile Lys Leu Val Ser Tyr Asp Thr Val 155 170 175 Lys Mp Tyr Ale Tyr Ile Arg Phe Ser Val Ser Asn Gly Thr Lys Ala ISO 105 ISO vai Lys Ile Val Ser Ser Thr HiS Phe Asn Asn Lys Glu Glu Lys Tyr 1S5 200 2S5 Asp Tyr Thr Leu «et Glu Phe Ala Gin Pro Ile Tyr Asn Ser Ale Gly 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys'Leu Leu Ser Pre 225 230 23 S 240 Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys 245 250 255 Ile Glu Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 260 265 270 Leu Glu Glu Thr Lys Lys Ala Leu Asp Glu Gin Val Lyâ Ser Ala lie 275 200 235 Thr Glu Phe Gin Aso val Gin Pro Thr Asn Glu Lys hst Thr Asp Leu 250 235 300 Gin Asp Thr Lys Tyr Val Val Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 310 315 320 «et Mefc Asp Thr Phe Val Lys His Pro Ile Lys Thr Gly Mec Leu Asn 325 330 33S GJLy Lys Lys Tyr «et Val Met: GlU Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 ASP Phe Met Val Glu Gly Gin Arg Val Arg Thr Ile Ser Lys Asp Ala 355 300 365 Lys Asn Asm Thr Arg Thr Ile Ile Phe pro Tyr Val Glu Gly Lys Thr 370 375 380 . 159

Leu Tyr Asp .AU Xl« Vai X-ys Vai Mis Vai Lys Thr lie Asp Tyr Asp 335 380 305 400 <siy Gin Tyr Mis Vai Arg ile Vai Asp lys Glu Ala Phe Thr Lys Ala 405 410 415 Α5:η Ale Asp lys Ser As© Lys Lys Glu Gin Gin Asp Ase Ser Ala Lys 42 & 425 430 Lys Glu Thr Thr Pr© Ala Thr Pr© Ser lys Pro Thr Thr Pr© Pr© Vai 43S 440 44S Glu Lys Glu Ser Gin Lys Gin Asp ser Gin Lys Asp Asp Asn Lys Gin 450 455 460 Ser Pro Ser vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 4S5 470 475 480 Asp Lys Thr Pr© Thr Thr Lys Pr© Ala Lys Ala Glu Vai Glu Ser Ser 485 490 495 Ser Thr Thr Pr© Thr Lys Vai Vai Ser Thr Thr Gin Asn Vai Ala Lys 500 505 510 Pr© Thr Thr Ala Ser Ser Ok Thr Thr Ile Asp vai Vai Gin Thr Ser SIS 520 525 Ala Giy Ser Ser Glu Ala Lys, Asp Ser Ala Pr© Leu Gin Lys Ala Asn 530 535 ,54© Xle Lys Asn Thr Asn Asp Gly His Thr Gin Ser Glu As» Asn Lys Asn 545 550 555 550 Thr Gin Glu MB lys Ala Lys Ser SOS

<210> 24 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <22 3> ORFO 657nH <400> 24 160

Ala Glu Glu Thr' Gly Gly Thr As© Thr Glu Ala Glu Pro Lys Thr Glu 1 S 10 15 Ala Vai Ala Ser Pr© Ser Thr Thr Thr Glu Lys Ala Pr© Glu Ala Lys 20 25 30 Pr© Vai Ala Asn Ala Vai Ser Vai Ser Asn Lys Glu Vai Glu Ala Pr© 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Glu Vai Lys Ala ir© 50 55 60 Lys Glu Thr lys Glu Vai Lys Pr© Ala Thr Lys Ala Asp Asn Asn Thr 65 70 75 80 Tyr Pr© lie Leu AS©. Gin Glu Leu Arg Glu Ala £1« Lys Asn Pr© Ala 85 90 95 n« Lys Asp Lys Asp HiS Ser Ala Pr© Asa Ser Arg Pr© lie Asp Phe tm 105 ato Glu Ittt' lys Lys Lys Asp Sly Thr Gin Gin Phe Tyr Mis Tyr Ala ser 115 iao • 125 Ser Vai lys Pr© Ala. Arg Vai ile Phe Thr Asp Ser Lys Pr© Glu Ile 130 13$ 140 Glu Leu Gly Leu Gin Ser Giy Gin Phe Trp Arg Lys Phe Glu Vai Tyr 145 ISO 155 160 161

Glu Gly Asn Lys Lys Leu Fro XI® Lys Leu Vai ser Tyr Asp Thr Val 185 170 175 Lys Asp Tyr Ala Tyr Xle Arg Phe· Ser vai Ser Asn Gly Thr Lys Ala ISO 185 190 Vai Lys XI® Vai Ser Ser Thr His Phe As» Asn Lys Glu Glu Lys Tyr 185 200 20S Asp Tyr Thr Leu Met Glu Phe Ala Gin Fro 11® Tyr Asn Ser Ala Asp 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ser Fro 225 230 235 240 Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gin Vai Tyr Glu Leu Asn Lys 245 250 255 11.® Gin Asp Lys Leu Fro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 250 A , 265 270 1©U Glu Glu Thr Lys Lys Ala Leu Asp Glu Gin Vai Lys Ser Ala He 275 280 285 Thr Glu Phe Gin Asn. Vai. Fro Thr Asn Glu Lys Met Thr Asp Leu 290 295 3Ò0 Gin Asp Tb*· Lys Tyr Vai vai Tyr Glu Ser Vai Glu Asn Asn Glu Ser 305 310 315 320 ifec Met Ásp Thr Phe Vai Lys His Pro Xle Lys Thr Siy Het Leu Asn 325 330 335 Gly Lys Lys Tyr Met Vai Het Glu Thr Thr As» Asp Asp Tyr Trp Lys 340 345 350 Asp Phe Met Vai Glu Gly Gin Arg vai Arg Thr lie Ser Ly® Asp Ala 355 360 365 Lys ASA Aso Thr Arg Thr XI® ile Phe Pro Tyr Vai Glu Gly Lys Thr 370 375 380 Leu Tyr Asp Ala Xle Vai Lys Vai His Vai Lys Thr XI© Asp Tyr Asp 385 390 395 460 Gly Gin Tyr Bis Vai Ar» lie Vai Asp Lys Glu Ala Phe Thr Lys Ala 40S 410 415 Aso Ala Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Lys Glu Thr Thr pr» Ala Thr Fr© Ser Lys Pr» Thr Thr Pro Pro Val 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp $er Gin Lys Asp Asp Asn Lys Gin 450 455 460 Ser Pr© Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 46S 470 475 480 ASp Lys Thr Fr» Ala Thr Lys Fro Ala Lys Ala Glu Val Glu Ser Ser 485 490 495 Ser Thr Thr Fro Thr Lys Vai Vai Ser Thr Thr Gin Asn Val Ala Lys 500 505 510 Pr© Thr Thr Ala Ser Ser Glu Thr Thr 11® Asp val Vál Gin Thr Ser 515 520 525 Ala Gly ser Ser Glu Ala Lys Asp Ser Aia Pro Leu Gin Lys Ala Asn 530 535 546 11« Lys Asn Thr ASO Asp Gly His Thr Gin Ser Glu Asn Asn Lys Asn 545 550 555 560 Thr Gin Glu Asn Lys 565 Ala Lys Ser 162

<210> 25 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4Ο0> 25 163

Ala Glu Glu Thr Gly Gly Thr ile Thr Glu Thr Gin Pr© Lys Thr Glu 1 5 10 · 15 Ala Vai Ma Ser Fre Thr Thr Thr Thr Glu Lys Ala Pr© Glu Ala Lys 20 25 30 Pr© Val Ala Asm Ala Val Ser Val Ser Asn Lys Glu Val Ala Ala Pr© 35 40 45 Thr •Thr Glu Thr Lys Glu Ala Lys Glu Val Lys Glu Vai Lys' Ala Fr© 50 55' 60 As» Glu Thr Lys Glu Val Lys Pr® Ala Ala Lys Ser Asp AS© ASn Thr 65 70 75 80 Tyr Pr® Ile Leu Asn Glu Glu Leu Arg Glu Ala Ile Lys Asn Pr© Ala 85 90 95 H M m & % Asp Lys Asp HiS $er Ala Fr© Asn Ser Arg Pr© ile ASp Phe 100 - 105 110 Glu Hfit Lys Lys Lys Asp Gly Thr Gin Gin Phe· Tyr His Tyr Ala Ser 115 120 125 Ser Val Lys Pr© Ala .Arg val Ile Phe Thr Asp Ser Lys pr© Glu Ile 130 ' 135 140 Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Fhe Glu Val Tyr 145 150 155 160 Glu Gly Asp Lys Lys Leu Pr® Ile Lys Leu Val Ser Tyr Asp Thr Val 165 170 175 Lys Asp Tyr Ala Tyr Ile Arg Phe Ser Val Ser Asn Gly Thr Lys' Ala ' 180 IBS 190 Vai Lys Ile Val Ser Ser Thr HiS Fhe Asn Asn Lys Glu Glu Lys Tyr 125 200 205 Asp Tyr Thr Leu. , Met Glu Phe Ala Gin Pr© Ile Tyr Asn Ser Ala Asp 210 , 215 220 Lys Fhe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pr© 225 230 235 240 Tyr Lys LyS Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu Asm Lys 245 250 255 lie Gin Asp Lys Leu Pr© Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 250 265 270 Leu Glu Glu Thr Lys Lys Ala Lêú Asp Glu 01« Val Lys Ser Ala lie 275 280 285 Thr Glu Fhe Gin Asn Val Gin Fr© Thr Asn Gitt Lys Met Thr Asp Leu 290 295 300 GinAsp Thr Lys Tyr Val Val. Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 310 315 320 Mfct Met Asp Thr Fhe Val Lys His Pr© Ile Lys Th.r Gly Met Leu Asn 325 330 335 Giy Lys Lys Tyr Met Val Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys • 34Õ 345 350 Asp Fhe Met Val Glu Gly Glu Arg Val Arg Thr Ile Ser Lys Asp Ala 355 360 385 Lys AS|j Asn Thr Arg Thr Ile Ile Fhe Pr© Tyr Val Glu Gly Lys Thr 37 O 375 380 164

Leu Tyr Asp Ais íle Vai Lys Vai Mis Vai Lys Thr Xle Asp Tyr ASp 385 300 395 400 Gly Gin Tyr His Vai Arg Xle Vai. Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asn Alâ Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Alâ Lys 420 * 425 430 Lys Giu. Thr Thr pro Ala Thr Pr© Ser Lys Pr© Thr Thr Ala Pro Val 435 440 445 Glu Lys Giu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin 450 455 460 Ser Pro Ser Vai Giu Lys Glu Xle.Asp Ala ser Ser Glu Ser Gly Lys 46S 47© - 475 480 Asp Lys Thr Pr© Ala Thr Lys Pro Ala Lys Gly Glu val Glu Ser Ser 485 450 495 Ser Thr 'Thr Pr©' Thr Lys Vâl vai Ser Ala Thr Gin Asn val Ala Lys SOO 505 510 Pr© Thr Ser Ala. Ser Ser Glu Thr Thr Lys Gly Vai Vai Gin Tíur Ser 515 520 525 Ais Giy Ser Ser Glu Ala Lys Asp Asn Ala Pr© Leu Gin Lys Ala Asn 530 535 540 XI* LyS Asn Thr Asn Asp Gly Kis Thr Gin Ser Gin Asn Asn Lys Asn 545 550 §55 560 Thr Gin Glu Asn Lys Ala Lys Ser 565

<210> 26 <211> 568 <212> PRT <213> Sequência Artificial <220> <223> ORFO657ηΗ <400> 26 165

Ala f 01¾ Glu Thr oiy κ Gly Thr Ilt Ala Vai Ala Ser wro Thr Thr Thr 20 Pro Vai Ala Asn Ala Vai Ser Val 35 40 Thr Thr Glu Thr Lys Glu Ala Lys 50 55 Asn Glu Thr Lys Glu Vai Lys Pro 65 7» Tyr Pro Ha Leu Asa Glu Glu Leu 85 lie Lys A.sp Lys Asp His Sor Ala 100 Glu Het Lys Lys Lys Asp Gly Thr 115 120 Ser val Lys Pro Ala Arg val lie 13 Ô 135 Glu IsOU Gly Léu Gl« Ser Gly Gin 145 150

Thr Glu 10 Thr Gin Pro Lys Thr 15 Glu. Thr 25 Glu Lys AÍS Pro Glu 30 Ala Lys Ser Asn Lys Giu Val 45 Val Ala Pro Glu Val Lys Glu €0 Val Lys Ala Pro Ala Ala Lys 15 Ser Asp Asn Asn Thr 80 Arg Glu' Qf| Ala n© Lys Asn Pro aq Ala Pro 105 Asn Ser Arg Pró Ue 110 &SP Phe Gin Gin Phe Tyr Mis 125 Tyr Ala Ser Phe Thr Asp Ser 140 Lys Pro Glu 11« Fhe Trp Arg· 155 Lys Phe Glu Val Tyr l m 16 6

Glu Gly Asp Lys Lys Leu Fr» Ile Lys Leu val Ser Tyr Asp Thr Val 155 170 175 Lys Asp Tyr Ala Tyr Ile Arg Phe Ser Vai Ser Asn Gly Thr Lys Ala 180 135 190 Vai Lys Ile Vai Ser Ser Thr His Phe Asn Asn Lys Glu Glu Lys Tyr 195 200 205 Asp Tyr Thr Leu Het Glu Phe Ala Gin Pr» 11* Ty r Asn Ser Ala ASp no 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pr» 225 230 235 240 Tyr Lys Lys Ala Lys Thr Leu, Glu Arg Gin val Tyr Glu Mu Asn Lys 245 250 255 Xle Gin Asp Lys Leu Pr© Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 250 265 270 Leu Glu Glu Thr Lys Lys. Ala Leu Asp Glu Gin Val Lys Ser Ala Ile 275 - 280 285 Thr Glu PM Gin Asn Vai Gin Pr» Thr Asn Glu Lys Kefc Thr Asp Leu 230 295 300 Gin Asp Thr Lys Tyr Vai Vai Tyr Glu Ser Val Glu Asn Asn Glu Ser 3 OS 310 315 320 £ie& Hat Asp Thr PM Vai Lys His Pro Ile Lys Thr Gly Hat Leu Asn 325 330 335 Gly Lys Lys· Tyr Het Vai Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Asp Phe Het Vai Glu Gly Glu Arg Vai Arg Thr Ile Ser Lys Asp Ala 355 360 365 Lys Asn Asa Thr Arg Thr Ile Ile Fhe Pro Tyr val Glu Gly Lys Thr 370 375 300 Leu Tyr Asp Ala Ile Vai Lys Vai Hls Vai Lys Thr Ile Asp Tyr Asp 385 390 335 400 Gly Glrt Tyr Hls Vai Arg Ile vai Asp Lys Glu Ala Phe Thr Lys Ala 403 410 415 Asn Ala Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ale Lys 420 425 430 Lys Glu Ala Thr Fr» Ala Thr Pr» Ser Lys Pro Thr Thr Ala Pr» Val 435 440 445 Glu Lys Glu Ser Glu Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin 450 455 460 Ser Pr» Ser Vai Glu Lys Glu Ile Asp Ala Ser ser Glu Ser Gly Lys 455 470 475 480 Asp Lys Thr Pr» Ala Thr Lys· Pr» Ala Lys Gly Glu Val Glu Ser Ser 435 490 495 Ser Thr Thr Fr© Thr Lys val vai Ser Ala Thr Gin Asn Val Ala Lys 500 S05 510 fro Thr Ser Ala Ser Ser Glu Thr Thr Lys Gly Val Val Gin Thr Ser - 515 520 52$ Ala Gly Ser Ser Glu Ala Lys· Asp Asn Ala Pro Leu Gin Lys Ala Asn 530 535 540 Ile Lys Asa Thr Asn Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn 545 550 555 560 Thr Gin Glu. Asa Lys Ala Lys Ser 555 27 167 <210> <211> <212> <213> <22 0> <223> <4 Ο 0> 570 PRT Sequência Artificial ORFO 657ηΗ 27 168

ffet Gly Ala Glu Glu Thr Gly Gly 1 S

Thr Glu Ala Vai Ala Ser Pr© liar 20

Thr Lys Pr© Vai Ma Asn Ala Vai 35 40

Aia Pr© Thr Ser Glu Thr Lys Glu 50 55

Ala Pr© Lys Glu Thr Lys Glu vai 65 10

Asn Thr Tyr Fr© Ile Leu Asn Gin SS

Pr© Ala He Lyâ Asp Lys Asp His 100

Asp Phe Glu Het Lys Lys Lys Asp 115 “ 120

Ala Ser Ser vai Lys Pr© Ala Arg 130 135 .·

Glu He Glu Leu Gly Leu Gin Ser 145 150

Vai Tyr Glu Gly Asp Lys Lys Leu 165

Thr Vai Lys Asp Tyr Ala Tyr Ile ISO

Lys Ala Vai Lys Ile Vai Ser Ser 195 200

Lys Tyr Asp Tyr Thr Leu Set Glu

210 _ 21S

Ala Asp Lys Phe Lys Thr Glu Glu 225 - 210

Ala Pr© Tyr Lys Lys Ala Lys Thr 245

Asn Lys Ile Gin Asp Lys Leu Fr© 260

Lys Lys Leu Glu Asp Thr Lys Lys 275 280

Ala Ile Thr Glu Phe Gin Asn Vai 290 295

Asp Leu Gin Asp Thr Lys Tyr Vai 305 310 '

Glu Ser Met Met Asp Thr Phe vai 325

Leu Asn Gly Lys Lys Tyr ííee Vai 340

Trp Lys Asp Phe Mer Vai Glu Gly 355 360

Asp Ala Lys Asn Asn Thr Arg Thr 370 375

Thr Asn Thr Glu Ala Gin Fr© Lys 10 15

Thr Thr Ser Glu Lys Ala Pr© Glu 25 30

Ser Vai Ser Asa Lys Glu vai Glu 45

Ala Lys Glu Vai Lys Glu Vai Lys 60

Lys Pr© Ala Ala Lys Ala Thr Asn 75 09

Glu Leu Arg Glu Ala Ile Lys Asn 90 95

Ser Ala Pr© as» Ser Arg Fr© Ile 105 no

Gly Thr Gin Gl» Phe Tyr His Tyr 125

Vai Ile Phe Thr Asp Ser Lys Pr© 140

Gly Gin Phe Trp Arg Lys Phe Glu 155 160

Fr© Ile Lys Leu Vai Ser Tyr Asp 170 175

Arg Phe Ser Vai Ser Asm Gly Thr 185 190 .

Thr. His Phe Asa As A Lys Glu Glu 205

Phe Ala Gin Pr© Ile Tyr Asa Ser 220

Aap Tyr Lys Ala Glu Lys Leu Leu 235 240

Leu Glu Arg Gin Vai Tyr Glu Leu 250 255

Glu Lys Leu Lys Ala Glu Tyr Lys 265 270

Ala Leu Asp Glu Gin ml Lys ser 285

Gin Pr© Thr Asn Glu Lys Mefc Thr 300 vai Tyr Glu Ser vai Glu Asn Asn 315 320

Lys His Fr© He Lys Thr Gly Her 330 335

Met Glu Thr Thr Asn Asp Asp Tyr 345 350

Gin Arg Vai Arg Thr ile Ser Lys 365

Ile ile phe Fr© Tyr Vai Glu Gly 380 169

Lys Thr Leu Tyr Asp Ala lie Vai Lys vai HÍS Vai Lys Thr lie Asp 385 350 395 400 Tyr Asp Gly Gin 'Tyr, His Vai Ar$ lie Val Asp Lys Glu Ala Phe Thr 405 410 415 Lys Ala Asn Thr ASp Lys Ser Asn Lys Lys Glu Gin Glu Asp Asn Ser 420 425 430 Ala Lys Lys Glu Ala Thr Fro Ala Thr Pro Ser Lys Pro Thr Pro Ser 435 440 445 Pro Vai €1« Lys Glu Ser Gin LyS Gin Asp Ser Gin Lys ASp Asp As» 450 ' 455 450 Lys Gin l$u Pro Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser 46$ 470 475 480 Gly Lys Gly Vai Thr Leu Ala Thr Lys Pro Thr Lys Gly Glu Vai Glu 485 450 495 Ser. Ser Ser Thr Thr Pro Thr Lys vai vai Ser Thr Thr Gin ASft Vai SOO 505 510 Ala Lys Pro Thr Thr Gly Ser Ser Lys Thr Thr Lys Asp Vai val Gin 515 520 525 Thr Ser Ala Gly ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys 530 535 540 Ala Asa. ile Lys HiS Thr Aon Asp Gly His Thr Gl» Ser Gin Asa Asn 54$ S50 555 580 Lys Asa Thr Sla Glu Aso Lys Ala Lys Ser - 585 570

<210> 28 <211> 654 <212> PRT <213> Sequência Artificial <22 0> <223> SEQ ID ΝΟ: 2 modificada para conter uma glicina a seguir à metionina do terminal amino e uma cauda de His do terminal carboxilo <400> 28 170 fset Qiy ASW Lys Cila 61a Lys 61» Ph® Lys Ser Pite Tyr Ser lie ATf l 5 10 15 Lys Ser Ser Leu Gly V&l Ala Ser Vai Ala Ile Ser Thr Leu Leu Leu 20 25 30 Leu Met Ser Aso Gly 61» Ala 61» Ala Ala Ala 61» Glu Thr Gly Gly 35 40 45 Thr Asm Thr Glu Ala 61a Pro Lys Thr Glu Ala Vai Ala Ser Pro Thr 50 55 €0 Thr· Thr Ser Glu Lys Ala Pro 61» Thr Lys pro V&l Ala AS» Ala Vai SS 70 75 80 Ser vai ser Ase Lys Glu vai 61» Ala pro Thr Ser Glu Thr Lys Glu 85 90 95 Ala Lys Gl» Vai Lys 61« Vai Lys Ala Pro Lys 61» Thr Lys 61» Vai 100 105 110 Lys Pro Ala Ala Lys Ala Thr AS» Asa Thr Tyr Pro lie Leu As» Glu US 120 lãs Glu Leu Arg 61» Ala Ile Lys Asn Pro Ala Ila Lys ASp Lys Asp HÍS 130 135 140 171 ser Ala Fro Asn Ser Arg Fro lie Asp phe Giu .«et Lys Lys Lys Asp 145 ISO 155 160 Gly Thr Gin Gin Phe Tyr HÍS Tyr Aia Ser Ser val Lys Fro Ala Arg 165 120 175 Vai lie Phe Thr Asp Ser Lys Fro Glu Xle Glu Leu Gly Leu Gin Ser ISO 185 180 Gly Gin Phe Trp Arg Lys Phe Glu Val Tyr Glu Gly Asp Lys Lys Leu 195 200 205 Pxo lie Lys Leu Val Ser Tyr Asp Thr Val Lys Asp tyr Ala Tyr Xle 210 215 220 Are Phe Ser vai Ser Asn Gly Thr Lys Ala Vai Lys Xle Val Ser Ser 225 230 235 240 Thr His Phe Asn Asn Lys Glu Glu Lys Tyr Asp Tyr Thr Leu Met Glu 245 250 255 Fhe Ala Gin Fro lie Tyr AS» ser 'Ala Aap Lys Phe Lys Thr Glu Glu 250 265 ’ 27Ô Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pra Tyr Lys Lys Ala Lys Tfer 225 280 2S5 Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys Xle Gin Asp Lys Leu Fro 2 m 29S 300 Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys Leu Glu Asp Thr Lys Lys 305 310 315 320 Ála Leu Asp Glu Gin Val Lys Ser Ala Xle Thr Sle Phe Gin Asn Val 325 330 335 Gin pro Thr Asn Glu Lys Met Thr Asp Leu Gin Asp Thr Lys Tyr val 340 345 350 Vai Tyr Glu Ser Val Glu Asn Asn Glu Ser Met Met Asp Thr Phe Val His 355 360 365 ' Lys Fro Xle Lys Thr Gly Met Leu Asn Gly Lys Lys Tyr Met Val 320 325 380 Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Met Val Glu Gly 335 398 395 400 Gin Arg Val Arg Thr Xle Ser Lys Asp Ala Lys Asn Asn Thr Arg Thr 405 410 41S Xle Xle Phe Fro tyr val G1U Gly Lys Thr Leu Tyr Asp Ala Xle Val 420 425 430 Lys Vai His Val Lys Thr Xle Asp Tyr Asp Gly Gin Tyr His Val Arg 435 440 445 xle Vai Asp Lys Glu Ala Phe Thr Ly s Al a Asn Thr Asp Lys Ser Asn 450 455 - 460 Lys Lys Glu Gin 61« Asp Asn Ser Alá Lys Lys Glu Ala Thr Fro- Ala 485 420 425 480 Thr Fro Ser Lys Pro Thr Fro Ser Pro Val Giu Lys Glu Ser Gin Lys 485 490 495 Gin Asp Ser Gin Lys ASp Asp Asn Lys Gin Leu Fro Ser Vâl Glu Lys 500 505 510 Glu ASK Asp Ala Ser Ser Glu Ser Gly Lys Asp Lys Thr Fro Ala Thr 515 520 1 525 Lys Fro Thr Lys Gly Glu Val Glu Ser Ser Ser Thr Thr Fro Thr Lys 530 535 540 Vai val Ser Thr Thr Gin Asn Val Ala Lys Fro Thr Thr Ala Ser Ser 545 550 555 560 Lys Thr Thr Lys Asp Val Val Gin Thr Ser Ata Gly ser Ser Glu Ala 565 S70 575 172

Lys Asp Ser Ala Pro Leu 6ΪΑ Lys Ala hsn ile Lys Asn Thr Asn Asp seo 585 500 61y His Thr 61» ser 6lP Asn As» Lys Asa Thr Gin Glu Asn Lys Ala 505 $00 605 Lys Ser Leu Fr© Gin Thr Gly Glu Giu Ser Asn Lys Asp Met Thr Leu 61Ô 615 «20 Fro Leu Mefe Ala Leu Leu Ala Leu Ser ser Ile vai Ala Phe Vai Leu 62 S 610 SIS 640 Pro Arg Lys Ατ0· Lys. Asso Leu Glu His ,HÍS His «is His His $4$ 650

<210> 29 <211> 1962 <212> ADN <213> Sequência Artificial <22 0> <223> ORF0657n de comprimento completo + cauda de His no terminal carboxilo <400> 29 173 s.tgaaeaa&c ageaaaaaga atfctaa&txa ctttatccaa ttagaaagtc atcactaggc 60 gttgcatctg tagcaafctag tacactfcbta ttáfctaatgt eaaatggega agcscaagca 120 gcagctgaag aaacaggtgg tacaaataca gaageaeaae caaaaaetga agcagttgca ISO âgtceaaeaa caacatccga aaaagctcca gaaactaaac cagtagctaa tgctgtctca 240 gtaCctaafca aagsagttga ggcecctact tctgaa&caa aagaagctaa agaagtcaaa 300 gaagttaaag cecctaagga aaçaâaagaa gttaaaccag cagcaaaagc cactaaeaat 360 acatatccta ttttgaatca ggaacttaga gaagcgafcta aaaaecctge aataaaagac 420 aaagateata gcgcaccaaa ctctcgtcca atfcgacttog aaatgaaaaa gaaagatgga 48 Q actcaacagt tttateatta tgcaagttct gttaaacctg ctagagvtat ettcactgat 540 teaaaaecag aaattgaatt aggattacaa fccaggtçaat tttggagaaa attfcgaagtt 600 tatgaaggtg acaaaaagtt gccaattaaa tfcagtateat scgafcacfcgt fcâaagáttat 660 gettagattc gcttctctgt atcaaaçgga acaaaagctg ttaaaattgt tagttcaaea 720 caettc&ata acaaagaaga aaaatacgat tacacattaa tggaattcgc acaaeeaatt. 7SÕ tataaeagcg csgataaatt caaaactgaa gaagattata aagcEgaaaa attafctagcg 640 ccatataaaa aagcgaaaac aetagaaaga çaagtttatg aattaaataa a&ttcaagat 300 aaaettcctg aaaaattaaa ggctgagtac aagaagaaae tagaggatac aaagaaagct 360 ttagatgagc aagçgaaate agctattact gaattceaaa atgfcacaacc aacaaatgãâ 1020 aaaatgactg atttacaaga tacaaaatat gtcgtxtarg aaagtgttga gaaca.acgaa 1060 tccatgatgg ataçttttgt taaacaccct attaaaacag gtatgcttaa cggcaaaaaa 1140 tat&tggbca tggaaactac taatgaegafc tactggaaag atttcatggfc fcgaagrgfccaa 2200 cgtgttagaa ctata-agcaa agatgccaaa aacaatacta gaacaattat ttteccatat 1260 gtcgaaggfca aaacfce&aca tgatgctafcc gttaaagttc scgtaaaaac gafctgafcfcat 2320 gatggacaat aceatgtcag aafccgttgat aaagaagcat ttacâââagc csacaccgât 2380 aaafcctaaea aaaaagaaca acaagacaac teagctaaga aggaagctac tccagccacg 2440 ççcagcaaac caacaccatc acctgttgaa aaagaafcçac aaaaaeaaga cagccaaaaa 2500 gatgacaata aacaattacc aagtgtfcgaa aaagaaaacg acgcatctag tgagtcaggt 2560 aaagacaaaa cgccfcgcsac aasaceaacfc aaaggfcgaag tagaateaag tagcacaaet 1620 ccaactâagg t&gtatceae gactcaaaat gttgcaaaac caacaactgc ttcatcaaaa 2680 acaacaaaag atgttgttca aacttcagea ggtfcctagcg aagcaaaaga tagtgctcca 1740 ttacaaaaag e«âaacat,taa aaaeacaaat gatggacaca ctcaaagcca aaaca&taãa 1800 astaeacaag aaaafcaaagc aaaatcatta ccacaaactg gtgaagaatc aaataaagat 1860 atgacaetae eatcaatggc actattagct ç eaagtagca ccgtcgcatt cgtactaccc 1526 agaaaacgta aaaaccccga geaccacçac caccaccact ga 1362

<210> 30 <211> 1737 <212> ADN <213> Sequência Artificial <22 0> <223> ORF0657nH + cauda de His no terminal carboxilo <400> 30 174 atgaacgctg aagaaacagg tggtacaaat acagaagcac aaccaaaaac tgaagcagtt 60 gcaagtccaa caacaaeatg tgaaaaagct ççagaaactã aaccagtagc caatgctgtc 120 tcagtatcta ataaagaagt tgaggcccct acttctgaaa caaaagaagc fcaaagaagtt ISO aaagaagtta aagccccfcaa ggaaacaaaa gaagtfcaaac cagcagcaaa agccactaac 246 àafcacatácc cfcatttfcgaa tcaggaactc agagaagcga ttaaaaaccc tgcaataaaa 306 gaeaaagatc atagcgeacc aaactctcgt ccaattgafct -ttgaaatgaa aaagaaagat 366 ggaactcaac agttctatca tfiatgcaagt tctgttaaac çtgçtagagt tattttcact 426 gattea.aaac cagaaattga attaggatca caatcaggcc aattttggag aaaatttgaa 486 gtttatgaag gtgacã&ãm gttgceaatt aaattagfeat catacgãtãc tgtcaaagat 540 tatgettacâ ttegcttctc tgtâtcsaac ggaacaaaag ccgctaaaat cgtcagttca 600 acacacttca ataacaaâga agaaaaatac gattacacat taatggaats. cgcacaacca 660 atttataaca gtgcagataa attcaaaact gaagaagatt ataaagctga aaaattatta 720 gegceataca aaaaagcgaa aacactagaa agaeaagttt atgaattaaa caaaatfccaa 780 gataaactçç cfcga&aaatt aaaggçtgag tacaagaaga aattagegga feaeaaagaaa 846 gctttagatg agcaagtgaa atcagctatt actgaâtteç aaastgtaca accaacaaat 000 gaaaaaatga ctgatttaca agatacaaaa fcafcgttgttt afcgaâagtgt tgagaataae 060 gaatctatga tggatacttt tgt taaaeac ccfcattaaaa caggtatgcfc fcaacggcaaa 3020 aaatatatgg tcatggsaac taetaatgac gafctactgga aagattteat ggttgaaggt 1080 caacgtgtta gaactataag eaaagatgct aaaaataata etagaacaafc fcattttccca 1140 tatgtfgaag gtaaaactct atatgatget accgttaaag ttcacgtaaa aacgafcfcgat 1200 fc&fcgafcggac aafcaecatgt e&gaatcgtt gateaagasg eattfcacaaa sgccastace 1260 gafcaaateta acaaaaaaga aeaacaagat aactcagcta agaaggaagç fcactceagct 1320 acgcctagca aaccaacacc atcacctgtt gaaaaagaat caeaaaaaea agaeagccaa 1300 aaagatgaca ataaacaatt accaagtgtt gaaaaagaaa afcgacgeatc tagtgagfcea 1440 ggtaaagaca aaacgcetgc tacaaaacéá actaaaggtg aagtagaatc aagtagfcaca ISO© actccaacta aggtagtatc tatgactcaa aatgttgcaa a&ccaaeaac tgcttcatca 1560 aaaacaaçaa aagaftgttgt ccaaactcca gcaggttcca gcgaagcaaa agatagtgct 1620 çeatçscaaa aagcaaacat tã&aa&câca aatgatggac acactcaaag ccaaaacaat 1600 aaaaatacac aagaaaataa agcaaaatea cfccg&gcscc accaccacca ccaccga 1737

<210> 31 <211> 1941 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 28 sem uma cauda de His do terminal carboxilo e com optimização de codões para expressão em leveduras <400> 31 175 atgggtaaca agcaacaaaa ggaattcaag tetttctact ccatcagaaa gtcttecttg 60 ggtgttgcfct ctgtegçtat ctccacçtçg ttgttgctga tgcccaaçgg tgaagcteaa 120 getgctgççg aagaaactgg tggtaccaaç actgaagctc aaccaaagac cgaagctgtc 180 gcttccccaa ccactacctc tgaaaaggct ccagaaacta «gccagttgc taacgctgtc 240 tccgfcttcta acaaggaagt cgaagctcca acctccgaaa çtaaggaagc taaggaagfcfc 200 aaggaagtca aggctccaaa ggaaacfcaag gaagtcaagç cagctgetaa ggctaccaac 260 aacact tacc caattttgaa ee&agaafctg agagaageta tcaagaaece agctatcaag 420 gacaaggacc actecgctcc asaetctaga ccaatcgact tegaastgaa gaagaaggac 480 ggtacccaac aattcfcaeca ctaegcgtec tctgtcaagc cagcfcagagt tatfcttcaçc 540 gactctaagc cagaaatcga attgggtttg caatccggtc aattcfcggag aaagt tcgaa 600 gsctacgaag çtgacaagaa gctgecaatt aagttggttt ectacgacac cgtcaaggac 660 tacgcttaca tcagattctc cgtttctaac ggtaetáagg ctgtcaagat tgtctcttcc 220 acccacttca scaaeaagga agaaaagtac gactacactt tgatggaatt cgctcaaeca 280 atttacaacfc ctgctgacaa gctcaagacc gaagaagact acaaggctga aaagttgttg 840 gctccataca agaaggctaa gactttggaa agacasgttt acgaafctgaa caagatccaa 800 gacaagfctgc cagaaaagtt gaaggctgaa tacaagaaga agttggaaga caccaagaag 260 getttggacg aacaagtcaa gtcegctatc accgaattcc aaeacgttca aceaactaâC 1020 gaaaagatga ctgactfcgca agacactaag tacgtcgtct acgaatccgt cgaaaacaac 1080 gaatceatga tggaeacctt cgttaagcac ccaattaaga ctggtatgtt gaacggtaag 1140 aagcacatgg tcatggaaac cactaacgac gaççaçttgga aggaçttçat ggttgaaggt 1200 eaaagagtça çaaccatctc caaggacgct áagaacaaea ctagaaccat tatcttccca 1260 tacgttgãag gtaagact.ct gtacgacgct atcgtcaagg ttcacgtcaa gactattgac 1320 tacgacggtc aataccacgt fcagaattgtt gacaaggaag ctttcaccaa ggctaacacc 1380 gaeaagtcea acaagaagga acaacaagae aactctgcta agaaggaagc taccccagct 1440 accccatcta agccaacccc atctecagtt gaaaaggaat cccaaaagca agacteccaa 1500 aaggacgaca acâagcaatt gccatccgtc gaaaaggaaa aegacgcgtc ttcfcgaatcc 1560 ggtaaggaca agactccagc taccaagcca actaagggtg aagfcfegaatc ttcctctact 1620 acteeaacca aggttgtctc cactacccaa aaçgfcçgcta agccaaççac ggcttcttcc 2690 aag&etaeea aggacgttgt ccaaacttct, gctggttcet ctgaagctaa ggaetctgct 2746 ccattgcaaa aggctaacat caagaacace aacgacggtc acacccaatc ccaaaacaac 1800 aagaacactc aagaaaacaa ggccaagtcfc fctgccacaaa ccggtgaaga atccaacaag 2960 gacatgacee tgccattgat ggctccgttg gctttgtctt ccatcgtcgc tttcgtcttg 1920 ccaagaaaga gaaagaacta a 2941

<210> 32 <211> 1710 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 3 e com optimização de codões para expressão em leveduras <400> 32 176 atggctgaag tçcccaacca gttcetaaca gaagtcaagg acttacccaa aaggaccact acccaacaat fccfeaagccag cacgaaggtg gcstacatca cscttcaac® tacaactctg ccataceaga aagttgccag

Etggacgaae aagatgactg fcceacgatgg taçacggtça aaactggtgg ctacetetga aggaagtcga ctccaaagga ttttgaaeca ccgctccaaa tctaççâcta aaatcgaôtt acaagaagtt gattctccgt ecaaggaaga ctgaeaagtt aggctaagac aaaâgttgaa aagtcaagtc acttgcaaga acaecttcgt tggaaaec&c taecaaeaet aaaggcfccoa agctccaacc aacsaaggaa sgaattgaga çtcfcagaçca cgcgtcctct: gggtttgeaa gccaattaag ttctaacggt aaagtácgac caagacegaa tttggaaags ggccgaatac cgccatcacc cacEaagtác taagcaccca taacgacgae gaagctcaac caaagaccga gaaactaagc cagttgctaa tccgaaacta aggaagctaa gccaagccag ctgctaaggc gaagctatta agaacecagc acçgacttcg aaatgaagaa gtcaagccag ctagagttac tccggtcaat tctggagaaa ttggtttcct acgacaccgt actaaggctg tcaagattgt tacactttga tggaattcgc gaagactaca aggccgaaaa caagtttacg aattgaacaa aagaagaagt tggaagacac gaafctecaaa acgt tcaacc gtcgtctacg àatccgtcga attaaçjacEg gta&gttgaa t&ceggaagg actfccatggt agctgtcgct 60 cgctgtetcc 120 ggaagttaag 180 taccaacaac 240 taccaaggac 300 gaaggacggt 360 ttccaccgac 420 getegâagtc 480 caaggactac 540 cfcettccacc 600 tcaaccaatt 660 gttgttgçct 720 gatccaagac 780 caagaaggct .840 aactaacgaa 900 aaacaacgaa 960 çggtaagaag 1020 cgaaggtcaa 1080 agagtcagaa ccatccccaa ggacgctasg aaçaacacta gaaccattat cttcccatac 1140 gttgaaggta agaefcfctgta egacgçfcstç gfccaaggfctc acgtcaagac tattgactac 1200 gacggtcaat accaegttag aattgttgac «aggaagctt cçaccaaggc taaçaeegac 1260 aagtccaaca egaaggaaça acaagaeaac tctgctaaga aggaagetae cccagctacc 1120. ceatetaagc caacccçatç tceagttgaa aaggaafccfcc aaaagcaaga ctcccaaaag 1380 gaegacaaca agcaattgcc atccgtegaa aaggaaaacg acgcgtcttc tgaatccggt 1448 aaggaca&ga etceagetae caagccaact aagggtgaag tçgaatettç ctctactact 1500 ccaaccaagg ttgtctccac taççcaaaac gtcgetsagc caactacçgç tfccttccaag 1560 actaccaagg acgttgtcca aactfcctgct ggttcccctg aagctaagg* cfcctgetcca 1620 fcfcgcaaaagg etaacateaa gaacacca&c gaeggtcacs ççcaâtccca aaacaacaag IS 80 aacaeteaag aaaaeaagge taagtctfcaa 1710

<210> 33 <211> 1341 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 1 e com optimização de codões para expressão em leveduras <400> 33 177 atggcsgaafif aaactggtgg tsccaacact gaagcfceaae eaaagaccga agctgfccgct 60 fcccccaacca etacetctga aaaggctcca gaaactaagc eagttgetaa cgctgfcctcc 120 gtttctaaça aggaagtcga agctccaacc tccgaaacta aggaagctaa ggããgtSaag 180 gaagtcaagg ctceaaagga aaccaaggaa gtcaagçcag çtgctaaggc taccaacaac 248 acfctacccaa fctttgaacca agaattgaga gaagctatta agaacccagc tatcaaggac .300 aaggaccact ecgctecaaa ctctagacca afccgaetteg aaatgasgaa gaaggácggl 360. acccaacaat tctaccacta cgcgçcetct gtcaagccag ceagagttat ecteaecgac 420. tctaagccag aaatcgaatt gggtttgcaa tccggtcaat tctggagaaa gttcgaagfcc 480 tacgaaggtg acaagaagtt gccaattaag ttggtttcet acgacaccgt caaggaefcac 540 gcttacatca g&ttctccgt ttctaacggt actaaggctg tcaagattgt ctcttocacc 600 cacttcaaca acaaggaaga aaagtacgac tacactttga tggaattcgc tcsaccastt 660 tacaactctg ctgacaagtt caagaccgaa gaagactaca aggctgáaaa gttgttggct 720 ccatacaaga aggctaagac tttggaaaga caagcttacg aattga&caa gatccaagac 780 aagttgççag aaaagttgaa ggctgaatac aagaagaagt tggaagacac caagaaggct 840 fctggacgaac aagtcaagtç cyctatcacc gaattccaaa acgttcaacc aaetaâcgaa 800 aagatgacfcg acctgeaaga cactaagfcac gtcgftctacg aatccgtcga aaacaaegaa 960 çccatgatgg acaccstcgfe taagcaeeca attaagactg gtstgttgea cggtaagaag 1020 tacatggtca tggaaaccac taacgacgac tactggaagg acttcacggc egaaggtcaa 1080 agagécagaa ccatctccaa ggacgctaag aacaacaeta gaaecattat ctfcccatac 1140 gttgaaggca agactttgta qgaegefcatc gtcaaggtee acgteaagac fcaetgactac 1200 gacggtcaat accacgttag aattgtfcgac aaggaagctt tcaccaagge taacaccgac 1260 aagtccaaca agaaggaaca acaagacaac tctgetaaga aggaagctae cccagctacc 1320 ccatctaagç caaccccata a 1341

<210> 34 <211> 1710 <212> ADN <213> Sequência Artificial <220> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 34 178 atggctgaag aaaccggfcgg taccaacact gaagcteaae caaagaecga agctftcgct 60 tccccaacca ctacctetga aaaggcfceca gaaactaagc cagttgccaa cgctgtcfccc 120 gtttctaaca aggaagtcga agctccaacc tccgaaacta aggaagctaa ggaagttaag ISO gaagtcaagg ctccaaagga aactaaggaa gtcaageeag ctgctaaggc taccaacaac 240 acttacccaa ttttgaacea agaattgaga gaagctatta agaacccagc tatcaaggac 300 aaggaccact ccgctccaaa ctctagacca atcgactteg aaatgaagaa gaaggacggt 300 aceeaacaafc tctaccacta cgcgtcctct gtcaagceag ctagagtcat tttcaccgac 420 ectaagccag aaategaatt gggtttgcaa fcceggtcaat tctggagaaa gttcgaagtc 400 tacgaaggtg acaagaagfct gccaattaag ctggtttcct açgacaccgt caaggacfcac 540 gcttacatca gattetccgt ttçtaacggt actaaggctg fccaagafcfcgfc ctcctccacc 600 caettcaaca acaaggaaga aaagKaeg&e tacactttga tggaattcgc tcaaccaatt 660 tacaectctg çtgacaagtt caagaccgaa gaagactaca aggctgaaaa gttgttggct 720 ceataçaaga aggctaagac tttggaaaga caagtttacg aattgaacaa gateeaagac 780 aagttgccag aaaagttgaa ggctgaataç aagaagaagt tggaagacac caagaaggct 840 ttggacgaac aagtcaagtc cgccatcacc gaattxcaaa acgttçãâcc aaetââcçaa 900 aagatgaccg acttgcaaga cactaagtac gtcgtctacg aatçcgecga aaagaacgaa 960 tccatgatgg acaccttegt taagcacçca attaagactg gtafcgtfcgaa cggtaagaag 1020 tacâfcggtca tggaaaccac taacgacgac tactggaagg aetfceatggt tgaaggtcaa 1000 agagtcagaa ccatctccaa ggacgctaag aacaacaG&a gaaccattat cttcccatac 1140 gttgaaggta agactttgta cgacgctatc gtcaaggttc aegfccaagac tattgactac 1200 gacggtcaat accacgttag aattgttgac aaggaagctt tcaccaaggc taacaccgac 1260 ãagtccaaca egããggaaca ãcaagacaac tctgctaaga aggaagctac cccagctacc 1320 çcatccaagc caãceccatc tcõagttgae aaggaatctc aaaagcaaga ctcccaaaag 1380 gacgacaaea agcaattgce atccgtcgaa aaggaaaacg aggcgtctCc tgaatccggt, 1440 aagggtgtca ctttggctac caagccaact aagggtgaag ttgaatcttç ctctaçtact 1500 eeaaeeaaeg ttgfcctccag tacccaaaac gtcgctaagc caactaccgg ttettccaag 1560 actaccaagg acgttgtcca aacttctgcfc ggttcctctg aagctaagga ctctgctcca 1620 tcgcaaaagg ctaacatcaa, gcacaccaac g&cggtcaca cccaatccca aaacaácaag 2680 aacactcaag aaaaçaaggc taagtcttaa 1710 <210>

<211> 1710 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 35 179 atggctgaag aaaçtggfcgg fcaceaaçacfc gaagctcaac caaagaccga agefcgtcgcfc 60 fcccccaacca ctacctctga aaaggctcca gaaacta&gc cagttgctaa cgccgtctcc 120 gettct&aca aggaagfcega agctccaacc tccgaaacta aggaagcfcaa ggaâgttaag ISO gaagtcaagg ctcc&aagga aactaaggaa gtcaagecag ctgctaaggc taccaacaac 240 acttaçccaa etttgaacca agaattgâga gaagc&att» agaacecagc tatcaaggac 000 aeggaccact ccgctccaaa ctçtagacea atcgacctcg aaacgaagaa gaaggacggt 360 aceeaacaat tctaccacta cgcgtcctct gtcaagccag ctaga.gt.tafc ttteaecgae 420 Kctaageeag aaatcgaatí: gggtttgoaa tecggtcaat tctggagaaa gttcgaagtc 480 taegaaggtg acaagaagtt gceaactaag ttggfcttetfc acgacaeegfc eaaggacfcae $40 gctcacatca gattcfcccgt tfcctaacggfc actaaggctg tcaagattgc ctcttccacc 600 cacttcaaca. aeaaggaaga aaegtacgac fcatactttga fcggaattçgç ccaaccaatt 660 fcacaactctg ctgacaagtt eaagacegaa gaagactaca aggctgaaaa gctgttgget 720 ccatacaaga aggccaagac fcttggaaaga caagfcfctacg aafcfcgaacaa gafcccaagac 730 aagtfcgccag aaaagfctgaa ggctgaatac aagaagaagt feggaagacac caagaaggct S40 ttggecgaac aagtcaagfce cgcfcatcacc gaattccaaa aegfctcaa.ee aactaaggaa 900 aagatgaetg acttgtaaga eacfcaagtac gtcgtctacg aatccgtega aaaeaacgaa 960 tccatiâtgg acaccttcgt taagcaecca attaagactg gtatgttgaa cggtaagaag 1020 tacatggtca tggaaaccac taacgacgae tactggaagg acttcatggt tgaaggtc&a 1080 agagtcagaa Gcatctetaa ggacgefcaag aacaacacta gaaccattaC cttcccatac 1160 gfctgaaggta agacfcttgta cgacgçfcatc gfceaaggttc acgtcaagac t&ttgâccac 1200 gacggtcaat accacgttag aatfcgttg&c a&ggaagctfc tcaccaaggc taacaccgae 1260 aagtcesaea agaaggaaca acaagacaac tçtgççaaga aggaagctac cccagctacc 1320 ccatctaagc caaccccatc tccagtfcgaa aaggaatctc aaaagcaaga ctcccaaaag 1380 gacgacaaca agcaattgcc atctftcgaa aaggaaaacg acgcgtcttc tgaatecggt 1440 aagggegtçà ctfcfctgctac caagccaâcfc aagggtgaag fcfcgaatefcfcc cteefcaetacfc 1506 ccaaccaagg ttgtctccac fcacccaaaac gtcgctaagc caaetaccgg ttcttccaag 1560 aGtaeeaagg acgttgtccs aácfefcctgct ggttcetctg a&gctaagga ctctgcfcççã, 1620 ttgcaaaagg ctaaeateaa gçaeaccaac gacggtcaca cccaatccca aaacaacaag 1630 sscactcaag aaaaeaagge fc&agtcfctaa 1710

<210> 36 <211> 1710 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 36 180 acggctgaag aaactggtgcr taecaacacfc gaagçfccaac eaaagacega agctgtegct 65 tccccaacca ctacctefcga aaaggçccca gaaactaagc e&gttgctaa çgctgcctcc 125 gtttctaaca aggaagtçga agctceaacc fcecgaaacta aggaagetaa ggaagttaag 180 gaagtcaagg etecaaagga aa«àâgfaa gtcaagccag ctgctaaggç taccaacaac 240 acttacccaa ttttgaacca agaaetgaga gaagctatta agaacccagc catcaaggac 300 aaggaccact ccgctccaaa ctctagacca atcgacfctcg saatgaagaa gaaggacggt 360 acccaacãat tctaccãcta egcgtcctct gtcaagceag cfcagagttafc tttcaccgac 420 tctaagccag aaatcgaatt gggtctgcaa tccggccaaK tctggagaaa gtccgaagtc 480 fcacgaaggtg acaagaagtt gecaattaag ttggtUcet acgacaccgt caaggaçtac 540 getsaeateâ gafctÇECçgfc ttçtaacggt actaaggctg fccaagattgt ctcttccacc 600 cacttcaaca acaaggaaga aaagtacgac tacactctga tggaactegc tcaaecaatt 660 fcacaáctctg ctgaçaagKt caagacegaa gaagacfcaca aggctgaaaa gttgttggct 720 ecafc&e&aga aggctaagac fcttggaaaga caagttCaeg aattgsacaa gatccaagac 780 aagttgccag aaaagttgaa ggctgaaiae aagasgaagt t.ggaagacâc caagaaggct 840 ttggacgaac aagtcaagtc cgctatcacc gaaEEcçaaa acgttcaace aaccaaegaa 900 aagatgactg act tgcaaga cactaagtac, gtcgtctacg aatcegtcga aaacaacgaa 960 tccatgatgg aeaeectcgc ta^gcaccca attaagactg gçatgttgaa cggtaaga&g 1020 tacatggtc* fcgga&accac caacgacgac tactggaagg acttcatggt tgaaggtcaa 1080 agagtcagaa ccatefcccaa ggacgctaag aacaacacta gaaccatcat ccccccatac 1140 gttgaaggca agactttgta cgacgctatc gtcaaggttc acgccaagac tactgactâc 1200 gacggtcaat aecacgttag aattgfetgac aaggaagctt tcaccaaggc taacaccgâc 1260 aagtccaaca agaaggaaca acaagacaac fcccgctaaga aggaagctac cccagctacc 1320 ccatctaagc caaccccate tccagttgaa aaggaatctc aaaageaaga ctcccaaaag 1380 gacgacaaca agcaatfcgcc atccgtcgaa aaggaaaacg acgcgtcttc tgaatccggt 1440 aagggtgtta ccctggctac caagceaacfc aagggtgaag ttgaatcttc ctctactact 1500 ccaaccaagg tfcgtctccac fcacccaaaae gtcgctaagc caacfcaccgg ttettccaag 1560 actaccaagg acgttgtcca aacttetget ggttcctctg aagctaagga ctctgctcca i$20 ttgcaaasgg ctaacetcaa gcacaccaac gacggtcaca eceaateçca aaacaacaag 1680 aacaetçaag aaaacaaggç taagtefctaa - 1710

<210> 37 <211> 1710 <212> ADN <213> Sequência Artificial <220> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 37 181 atçgctgaag aaactggtgg taccaacacc gaagetcaac caaagaçcga agctgtcgct €0 tcceeaacea ctacctctga aaaggctcca gaaactaagc cagttgctaa cgctgtctcc 120 gtttxctaaca aggaagtcga agctccaacc toegaaaeta aggaagctaa ggaagctaag ISO gaagtcaagg ctccaaagga aactaaggaa gtcaagccag ctgctaaggc taccaacaac 240 acttacceaa ttttgaacca agaattgaga gaagctatta agaaeccagc tatcaaggac 300 aaggaccact ccgctccaaa etctagacca atcgactfceg aaatgaagaa gaaggacggt 360 acccaacaat tctaceacta cgcgtcctct gtcaagccag ctagagttat tfcteaecgac 420 tctaagccag aaatcgaatt gggtttgcaa tccggtcaat tcfcggagaaa gttcgaagtc 480 tacgaaggtg acaagaagfct gccaattaag ttggtttcct acgacaccgt caaggactac 540 gettàcatca gaetctccgfc ttctaacggt actaaggctg fccaagafctgt cfccttccaec 600 cacttcaaca ãcaaggaagâ aaagtacgac tacacttcga tggaatccgc tcaaccaatt 660 tacaactctg ctgãcaagtt caagaccgaa gaagactacá aggctgaaaa gttgttggct 720 ccatacaãga aggctaagac tttggaaaga çããgtttãçg aaetgaacáã gatccaagac 760 aagttgccag aaaagttgaa ggctgaatae aagaagaagt tggeagacae caagaaggct 840 tcggacgaac aagtcaagtc cgctatcace gaattccaaa acgtteaacc aactaacgaa 900 aagatgactg aettgcaaga eactaagcac gccgtecacg aacecgçcga aaacaacgaa $60 tccafcgatgg acaccttcgt feaagcaccca attaagactg gtatgttgaa cggtaagaag 1020 tacatggtca tggaaaccaç fcaacgacgac tactggaagg acttcatggt tgaaggtcaa 1080 agagtcagaa ccatctccaa ggaegetaag aacaacacta gaaccat fcat cttcccatac 1140 gtfcgaaggta agactttgta cgacgctatc gtcaaggttc acgtcaagac tattgsctae 1200 gacggteaat acçacgttag aattgttg&c aaggaagct t tçaccaaggc taacaccgac 1260 aagtccaaca agaaggaaca aeaagacaae fcetgctaaga aggaagctae cccagctacc 1320 ccatctaagc caaccccatc tceagttgaa aaggaatctc aaaagçaaga çtcccaaaag 1380 gacgaeaacâ agcaattgcc atccgtcgaa aaggaaaacg acgcgtcttc tgaatceggt 1440 aagggcgtfca ctttggctac eaagccaacfc aagggtgaag ttgaatcttc ctctactact 1500 ecaaecaagg ttgtctccac tacccaaaac gtcgctaagc caaccaccgg cecttccaag 1560 actaccaagg acgttgtcca aaçttctgct ggttcctctg aagctaagga ctctgctcca 1620 ttgcaaaagg ctaacatçaa gçacaccaac gacggteaca cccaatccca aaecaacaag 1600 aacactcaag aaaacaaggc taagtcfctaa 1710

<210> 38 <211> 1710 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 38 182 atggcfcgaag aaactggtgg taccaacact gaagctcasc caaagaccga agctgtcgct 60 tccccaacca cfcacctctga aaaggctcca. gaaactaagc cagctgctaa cgctgtctcc 120 gtttcfcaaca aggaagtcga agctççaacc tcegaaacta aggaagctaa ggaagtfcaag ISO gaagtca&gg ctccaaagga aactaaggaa gtcaagccag ctgctatggc caccaacaac 240 acttacecaa ttttgaacca agaattgaçta gaagctatta agsacccagc tatcaaggac 300 aaggaccact ccgçtccâââ ctctagacça atcgacttcg aaafegaagaa gaaggacggt 360 aeccaaçsat tctaccacta çgcgtxctcfc gtcaagccag ctagagctac tttcaccgac 420 fcctaagçcag aaatcgaatt gggtttgcaa tccggtcaat tctggagaaa gttcgaagtc 400 tacgaaggtg acaagaagtt gccaattaag ttggtttcct acgacacegt caaggacfcac 540 gcttâeatca gattctccgt ttetaacggt actaaggçtg tcaagattgt ctcttecacc 600 eacttcaaca aeaaffaaga aaagtacg&c tacactttga tggaattcgc tcaaccaatt 660 fcacaactctg ctgacaagtt caagacegaa gaagaçfcaca aggctgaaaa gtcgttggct 220 ccatacaaga aggctaagac tttggaaaga caagtttacg aattgaagaa gatccaagac 780 aagttgeeag aaaagfctgaa ggctgaatac aagaagaagt tggaagacac caagaaggct 840 ttggacgaac aagtcaagcc cgctaccacc gaatxccaaa aegtteaaec aactaacgaa 90O aag&tgactg acfcfcgcaaga cacfcaagtae gtegtctacg aatccgtcga aaacaacgaa 960 tccatgatgg acaccttcgt taagcaccca «tfeaagactg gtatgttgaa cggtaagaag 1020 taeatggtea t-ggaaaccac taãcgacgac fcaccggaagg actteatggt tgaaggfceaa 1080 agagteagaa ccatctccsa ggacgctaag aaeaaeacta gaaccattat ctfccceatae 1140 gttgaaggta agactttgta cgacgctatc gccaaggttc acgceaagae fcattgactac 1200 gacggtcaat accacgttag aattgttgac a&ggaagctt ccaccaaggc taacagggae 1260 aagtccaaca agaaggaaca acsagacaac tctgctaaga aggaagctac cccagctacc 1320 ccatctaagc caaccccaCc tccagctgaa aaggaafcctc aaaageaaga ctcccaaaag 1380 gacgacaaca ageaattgcc atccgtcgaa aaggaaaacg acgcgtefcte tgaatecggt 1440 aagggtgtca ctttagctac caagccaact aagggtgaag ttgaatçttc ctctacfcact 1500 ccaaccaagg ttgtctccãc oaeeeaaaac gtcgctaagc caactaccgg ttcttccaag 1560 actaccasgg aegttgtccá aacttctgct ggtfccctxtg aagctaagga ctcegçtcca 1620 ttgeaaaagg ctaacatcaa gcacaccaac gacggteaca cecaatccca aaacaacaag 1680 aacactesag aaaacaaggc taagtcttaa 1710

<210> 39 <211> 1710 <212> ADN <213> Sequência Artificial <220> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 39 183 acggctgaag aaactggtgg taccaacact gaãgetcaac caaagaccga agctgtegct 60 tccccaacca ctacecctga aaaggctcca gaaactaagc cagçtgctaa çgctgtctce 120 gtctctaaca aggaagçcga agctccaacc tccgaaacta aggaagctaa ggaagctáag 180 gaagtcaagg ctccaaagga aactaaggaa gtcaagccag ctgctaaggc taccaacaac 240 scctacccaa ttctgaacca agaatfcgaga gaagçtatta agaacccagc tatcaaggae 300 aaggàccact eegetxcaaa ctctagaeca atcgactteg aaatgaagaa gaaggacggt 360 agçcaacaat tctaccaeta cgcgtcctct gçeaagceag ctagagfcfcat ttceaccgac 420 tctaagccag aaatcgaatt gggtttgcaa tccggtcaat tctggagaaa gttcgaagtc 480 tacg&ãggtg acaagaagtfc gccaafctaag ttggtttcct acgacaccgt caaggactac 548 gcttacatca gattctccgt ttctaacggt actaaggctg tcaagattgt ctcttecacc 600 cacttcaaca acaaggaaga aaagtacgac tacactttga cggaattcgc tcaaccaatt 660 tacaaçtçfcg ctgacaagtt çaagaccgaa gasgactaca aggctgaaaa gttgttggct 720 cca^acaaga aggctaagac tttggaaaga caagttfcacg aattgaacaa gatccaagac 780 aagttgecag aaaagttgaa ggctgaafcac aagaagaagt tggaagacac caagaaggct 840 ttggaceaae aagtcaagtc cgetateacc gsaçtccaaa acgttcaacc aaetascgaa SOO aagatgãcSg acttgcaaga caccaagtac gtcgtetaeg aatcegfccga aaaeaacgaa 960 tccatgâEgg acaccttegt taagcaccca attaagactg gtatgtCgaa cggtaagaag 1020 tacatggtca tggaaaccac taacgacgac tactggaagg acttcacggt tgaaggfccaa 1080 sgagccagaa ceatctecaa ggacgctaag aacaaeacta gasccaCtat cttcccatac 1140 gttgaaggta agacfcttgta cgacgctate gtcaaggttc acgtcaagae tattgactac 1200, gacggtcaat «ccacgttag aattgttgac aaggaagctt tcaccaagge taacacegac 1260 aagtccaaca agasggaaca acaagacaac fcctgctaaga aggaagefcac cccagctacc 1320 ccatctaagc caaceeeatc tcçagfctgaa aaggaatctc aaaagcaaga ctcccaaaag 1380 gaçgaçaaca agcaattgcc atccgtcgaa aaggaaaacg acgcgtcttc tgaatçcggt 1440 aagggtgtca ctttggctac caagccaaçt aagggtgaag ttgaatcttc ctetactact 1500 ccaaccaagg ttgtctccae taeccaaaac gtegctaage caactaccgg cfccttccaag 1560 aetaecaagg acgttgtçca aacttctgct ggtfccctctg aagetasggra ctctgcfccca 1620 ttgmmagg etascatcaa gcacaccaac gacggtcaca cccaatccea aaacaacaag 1680 aacacteaag aaaacaaggc caagtcttaa 1710

<210> 40 <211> 1710 <212> ADN <213> Sequência Artificial <220> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 40 184 atggctgaag aaactggtgg taccaaeact gaagctcaae caaagaccga agctgtcgct $0 eccccaacca ctaeetcega aaaggctcca gaaactaagc cagfctgctaa cgctgtcccc 120 gtttctaaca aggaagfccga agctccaacc tecgaaacta aggaagctaa ggaagttaag ISO gaagtcaagg eteeaaagga aactaaggaa gtcaageeag ctgccaaggc taccaacaac 240 acttacccaa ttttgaacea agaattgaga gaagctatta agaacccagc taccaaggac 300 aaggaccact ccgcteeaaa ctctagacca atcgacttog aaatgaagaa gaaggacggt 300 acecaacaat fcctaccacta egcgtccfcefc gtcaagceag ctagagttat fcfctcaecgac 420 tefcaageeag aaetcgaatt gggtttgcaa tecggtcaat tctggagaaa gfctcgaagtc 480 tacgaaggtg acâagaagtt gçcaatt&ag ttggtttect acgaçaccgt caaggaçtaç 540 gcttacatca gatxctccgt ttctaacggfc actaaggctg tcaagattgfc ctcttccacc 800 cacttcaaea acaaggaaga aaagtacgae tacacfctrfcga tggaattcgc tcaaccaatt 860 tacaaetctg ctgacaagtt caagaccgaa gâagaet&câ aggetgaaaa gttgtcggct 720 ecatacaaga aggctâagac tttggaaaga caagtttacg aattgaacaa gatceaagae 780 aagttgecag aaaagfctgaa ggctgaatac aagaagaagt tggaagacac caagaaggct 840 ttggacgaae aagteaagtc ogctatcacc gaattccaaa acgttcaacc aactaaegaa 800 aagatgactg acttgcaaga cactaagtac gtcgtct&cg aacccgtcga aaacaacgaa 880 tccatgatgg acaccctcgt taagcaccc» attaagactg gtatgttgaa cggtaagaag 1020 çacatggtca tggaaaccac taacgacgac tactggaagg acctcatggt tgaaggtcaa 1080 agagtcagaa ecatctccaa ggacgetaag aacaacacta gaaccattat cttcccatac 1140 gttgaaggta agactttgta egaegetafcc íjfceaaggfcte acgtcaagac tattgactac 1200 gaeggtcaat accacgttag aattgttgac aaggaagctt tcaccaaggc taacaccgac 1260 aagtceaaca agaaggaaca acaagaeaac tcfcgce-aaga aggaagctac cccagctacc 1320 ccaçctaagc caaccccatc tccagtfcgaa aaggaatctc aaaagcaaga ctcccaaaag 1380 gacgacâaca agcaattgce atcegtxgaa aaggaaaaeg acgcgtette tgaatccggt 1440 aagggtgtta ctttagetae caagccaact aagggtgaag ttgaacctte ctctactact 1500 ccaaccaagg ttgtccecac taeccaaaac gtcgccaagc caactaccgg tfccttecaag 1580 actaccaagg acgttgteca aacfctecgct ggttcctctg aagctaagga ctefcgcfccca 1820 tcgcaaaagg ctaacatcaa gcacaçcaac gacggtcaca cccaatceea aaacaacáag 1680 aaeactcaag aaaacaaggc taagtctcaa 1710

<210> 41 <211> 1710 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 7 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 41 185 etggctgáag aaacfcggtgg taccaacact gaagcfccaac caaagaccga agctgtcgct €0 fcecccaacca cfcãccfcctga áâaggcfccca gaaactáagc cagttgetaa cgctgtcecc 120’ gtttctaaea aggaagtcga agctccaaec tccgaaacta aggaagctaa ggaagttaag 180 gaagtcaagg ctccaaagga aactaaggaa gtcaagccag ctgctaaggc taCGâacáâc 240 acttaççcaa ttttgaacca agaattgaga gaagctatta agaacccagc tafccaaggac 300 aaggaccact cçgctccaaa ctctagaçça atcgaettcg éaatgaagaa. gaaggacggt 360 acccaacaat tctaccaçta cgcgfccctet gtcaagccag etagagttat fcfcfccaccgac 420 tctaagçcag aaatcgaatt gggtttgçaa tccggtcaat tctggagaaa g&tcgaagtc 480 tacgaaggfcg acaagaagtt gccaattaag ttggtttcct acgacaccgt sâaggactac 540 ggfetacafeca gattcfcecgt ttetaacggt actaaggctg tcaagattgt ctcttccacc 800 cactr.caaca acaaggaaga aaagtacgac tacactttga cggaattcgc tcaaccaace 660 taeaactctg otgacaagte «aasaccgas gaagactaea agggtgaaaa gttgttggct 720 ccâtacaaga âggcGâagac tctggaaaga caagtttacg aattgaacaa gatccaagac 780 aãgtcgccâg-áaâagttgaa gfctgsatac aaga&g*agt fcggaagâsac caagoaggcfc 840 ttggecgaee aagtcaagtc cgetafccacc gaattee&aa. acgttca&cc aacta&cg&a 900 aagatgactg acfctgcaaga cactaagcac gtegfcetaeg aatccgtcga aaacaacgaa 960 tcoatgatgg acáCCttcgt tãâgcaccça attaagactg ftatgttgaa cggtaagaag 1020 tacatggtca tgg&aaecae taacgacgac tactggaagg acttcatggt tgaaggtcaa 1080 agagccagaa ocatctceaa ggaccjetaag âacaacacta ga&ccattat cttcccatac 1140 gètgaággta agaçtttgta cgacgctate gtcaaggfctc acgtcaagac fcattgactac 1200 gacggtcaaC accacgttag aâttgttgac aaggaagctt tcaccaaggc taacaccgac 1280 âagtccaaca agaaggaaca acaagscãac tctgcfc&aga aggaagçtac cccagctacc 1320 ccatctaagc caaccccatc tccagttgaa aaggaatctc aaaageaaga ececcaaaag 1380 gacgacaaca agcaattgcc acccgtcgaa aaggaaaacg acgcgtcttc tgaatccggt 1440 aagggçgtfca ctttggctac caagccaacc áagggtgaag tegaatcfcfcc ccctactact 1500 ccaaccaagg tfegftetccec tacccaaaac gtcgcta&gc caactaccgg ctcttccaag 1550 actacc&agg acgttgtcea aacttctgct ggttcctctg aagctaagga çtctgcteca 1620 ttgcaaaagg ctaacatcaa geacaccaac gacggtcaca cccaatccca aaacaacaag 1680 â&cactcaag aaaâcaaggc taagtcttea 1710

<210> 42 <211> 481 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657nl + <400> 42

Glu Ala Glu Pro Lys Thr 15 «et Ala Glu Glu Thr Gly Gly Thr Asn Thr 1 5 10 186

Glu Ala Val Ala Ser Pro Thr Thr 20 Lys Pro Val Ala A$n Ala Val Ser 35 - 40 Pro Thr Ser Glu Thr Lys Glu Ala 50 55 Pro Lys Glu Thr Lys Glu Val Lys «5 70 Thr Tyr Pro ile Leu Asn Gin Glu 85 Ala Ile Lys Asp Lys Asp His Ser 100 Ffce Glu Met Lys Lys Lys ASp Gly 115 120 Ser Ser Val Lys Pro Ala Ar g Val 130 135 lie Glu Leu Gly Leu Gin Ser Gly 145 ISO Tyr Glu Gly Asp Lys Lys Leu Pro 165 Val Lys Asp Tyr Ala tyr Ile Arg 180 Ala Val Lys Ile Val Ser Ser Thr 195 200 Tyr Asp Tyr Thr Leu Met Glu Phe 210 215 Asp Lys Phe Lys Thr Glu Glu Asp 225 230 Pro Tyr Lys Lys Ala Lys Thr Lau 245 Lys Xis Gin Asp Lys Leu Pro Glu 260 Lys Leu Glu Asp Thr Lys Lys Ala 275 280 Ile Thr Glu Phe Gin Asn Val Gin 290 205 Leu. Gin Asp Thr Lys Tyr Vai val 305 310 Ser «et «et Asp Thr Phe Val Lys 325 Asn Gly Lys Lys Tyr «et vai «et 340 Lys Asp Phe «et Val Glu Gly Gin 355 360 Ala Lys Asn Asn Thr Aro Thr lie 370 375 Thr Leu Tyr Asp Ala Ile Val Lys 305 390 Asp Gly Gin Tyr His val Arg lia 405 Ala Asn Thr Asp Lys Ser Asn Lys 420 Lys Lys Glu Ala Thr Pro Ala Thr 435 440

Thr 25 Ser Glu Lys Ala Pro 30 Glu Thr val Ser Asn Lys Glu 45 Val Glu Ala Lys Glu Val Lys 60 Glu val Lys Ala Pro Ala Ala 75 Lys Ala Thr Asn Asn 80 Leu Arg 90 Glu Ala Ile Lys Asn fS Pro Ala 105 Pro Asn Ser Arg Pro Π0 lie Asp Thr Gin Gin Phe Tyr 125 HÍS Tyr Ala Ile Phe Thr Asp 140 Ser Lys Pro Glu Gin Phe Trp 155 Arg Lys Phe Glu Val 160 ile Lys 170 Leu Val Ser Tyr Asp 175 Thr Phe 1®§ Ser Val Ser Asn Gly 190 Thr Lys HiS phe Asn Asn Lys 205 Glu Glu Lys Ala Gin Pro· Ile 220 Tyr Asn Ser Ala Tyr Lys Ala 235 Glu Lys Leu Leu Ala 240 Glu Arg 250 Gin Val Tyr Glu Leu 255 Asn Lys 265 Leu Lys Ala Glu Tyr 270 Lys Lys Leu Asp Glu Gin Val 285 Lys Ser Ala Pro Thr Asn Glu 300 Lys «et Thr Asp Tyr Glu Ser 315 Val Glu Asn Asn Glu 320 His Pro 330 Ile Lys Thr Gly «et 335 Leu Glu 345 Thr Thr Asn Asp ASp 350 Tyr Trp Arg Val Arg Thr Ile 365 Ser Lys Asp ile Phe Pro Tyr 380 Val Glu Gly Lys Val His Val 395 Lys Thr Ile ASp Tyr 400 Val ASp 410 Lys Glu Ala Phe Thr 415 Lys Lys 425 GlU Gin Gin Asp Asn 430 Ser Ala Pro Ser Lys Pro Thr 445 Pro Ser Pro 187 Vâl Glu iya Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys 450 455 46Ô

Gin Leu Pro Ser Vai Glu trya Glu Asn Asp Ala Ser Ser Glu Ser Gly 46$ 470 475 480

Lys

<210> 43 <211> 1452 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 42 e com optimização de codões para expressão em leveduras <400> 43 atggefcgaag aeactggttgg taeeaacacfc gaagcfceaac caaagaccga agctgfceget 60 tccccaacca ctacctccga aaaggctcçà gaaactaagc cagfctgçtaa cgctgtctcc 120 gtttctaaca aggaagtcga agctccaacc tccgaaacta aggaagctaa ggaagttaag 110 gaa<gteaagg ctecaaegga. aactaaggáâ gtcaagccag ctgctaagge taccaacaac 240 acttacceaa ttttgaacca agaatcgaga gaagccaeta agaaccc&ge catcaaggac 300 aaggaccAct ccgctccaaa cfcctagacca atcgacetcg aaatgaagaa gaaggacggt 360 aeeeaaeaat fcctaçcaçta cgcgtccccc g çc-aagçcag çtagagtfcafc «tçaccgac 420 tctaagccag aaatcgaatt gggtttgcaa tccggccaac tctggagaaa gttcgaagcc 480 tacgaaggtg acaagaagfct gccaattaag tcggtÊtcet acoacaccgfc caaggactâc 540 geccacatca gattetccgt ttctaacggt actaaggctg tcaagattgt ctcttccacc 600 cacfctcaaca acaaggaaga aaagtacgac tacactttga tggaattcgc tcaaccaatt 660 tacaacfcctg ctgacaagtt caagaçcgaa gaagaetaca aggctgaaaa gttgttggct 720 ecatacaaga aggctaagac tttggaaaga caagttcacg aafctgaaçaa gatccaagac 780 aagttgccag aaaagttgaa ggctgaatac aagaagaagt tggaagacac caagaaggcfc 840 ttgp&cgsse aagtçaagtc cgctatcacc gaattccaaa acgttaaacc aactaacgaa 800 aagatgactg acttgcaaga cactaagtac gtcgtctacg aatocgtcga aaacaacgaa 960 tccatgatgg acaccltegt taagcaccca actaagactg gtatgttgaa cggtaagaag 1020 tacatggtca tggaaaccac taacgacgac tactggaagg actfccatggt tgaaggtcaa 1080 agagtcagaa ceatctccaa ggacgctaag aaeaacacta gasecatfcat cttcccatac 1140 gttgaaggta agactttg&a cgacgctatc gtcaaggttc acgtcaagac tattgactac 1200 gacggtcaat accacgtcag aattgttgac aaggaagctt tcaccaaggc taacaccgac 1260 aageecaaca agaaggaaea acaagacaac tctgctaaga ággaagctac cccagccacc 1320 ccatctaagc caaceccatc tccsgttgaa aaggaatctc áââagcaaga ctcccaaaag 1380 gacgacaaca agcaattgcc atccgtcgaa aaggaaaaeg acgcgtctcc tgaacccggt 1440 aagtâaggat ec 1452 <210> 44

<211> 605 <212> PRT <213> ORFO 657nG <400> 44

Met Ala Glu Glu Thr Gly Gly Thr 1 5

Glu Ala Vai Ala Ser Fro Thr. Thr 20

Thr Ser Glu Lys Ala Pro Glu Thr 25 30

Vai Sor Asa Lys Glu. Vai Glu Ala 45 189

Pro Thr Ser Glu Thr Lys Glu Ala 58 55

Pro Lys Glu Thr Lys. Glu Vai Ly$ 65 ?8

Thr Tyr Pro Ile Leu As» Gin Glu 85

Ala lie Lys Asp Lys Asp His Ser 100

Phe Glu Met Lys Lys Lys Asp Gly 115 120

Sex Ser Vai Lys Pro Ala Aro Vai 133 135

lie Glu Leu Gly Leu Gin Sex Gly 145 ISO

Tyr Glu Gly Asp Lys Lys Leu Pro 165

Vai Lys Asp Tyr Ala Tyr Xle Arg 180

Ala vai Lys He vai Ser ser Thr 195 200

Tyr Asp Tyr Thr Leu «efc Glu Phe 210 215'

Asp Lys phe Lys Thr Glu Glu Asp 225 220

Pro tyr Lys Lys Ala Lys Thr Leu 245

Lys lie Gin Asp Lys Leu Pro Glu 260

Lys Leu Glu Asp Thr Lys Lys Ala 275 " 280

Ile Thr Glu Phe Glu Asn Vai Glu 290 295

Leu Gin Asp Thr Lys Tyr Vai Vai 305 310

Ser Met Met Asp Thr Phe Vai Lys 325

Asn .Gly Lys Lys Tyr «et Vai «et 340 Lys Asp phe «et Vai Glu Gly Gl» 355 360 Ala Lys Asn Asp Thr Arg Thr ile 370 375 Thr Leu Tyr Asp Ala Ile Vai Lys 385 398 Asp Gly Gin Tyr His Vai Arg Ile 405 Ala Asn Thr Asp Lys Ser Asn Lys 420 Lys Lys Glu Ala Thr Pro Ala Thr 435 440 Vai Glu Lys Glu Ser Gin Lys Gin 450 455 Glu Leu Pro Ser Vai Glu Lys Glu 465 470

Lys Glu Vai Lys Glu Vai Lys Ala 60

Pro Ala Ala Lys Ala Thr As» Asn 75 80

Leu Arg Glu Ala Xle Lys as» pro 90 95

Ala Pro As» Ser Arg Pro Ile Asp 105 110

Thr Gin Gl» Phe Tyr «is Tyr Ala 135

Ile Phe Thr Asp Ser Lys Pro Glu 140

Gin Phe Trp Arg Lys Phe Glu Vai 155 160 lie Lys Leu vai Ser Tyr Asp Thr 170 175

Phe Ser Vai Ser Asn Gly Thr Lys 185 190

His Phe Asn Asn Lys Glu Glu Lys 205

Ala Gin Pro Ile Tyr Asn Ser Ala 220

Tyr Lys Ala Glu Lys Leu Leu Ala 235 240

Glu Arg Gin Vai Tyr Glu Leu Asn 250 255

Lys Leu Lys Ala Glu Tyr Lys Lys 26S 270

Leu Asp Glu Gl» Vai Lys Ser Ala 28S

Pro Thr Asn Glu Lys «et Thr Asp 300

Tyr Glu Ser Vai Glu Asn As» Glu 315 320

His Pro ile Lys Thr Gly «et Leu 330 335

Glu Thr Thr A$» Asp Asp Tyr Trp 345 350

Arg Vai Arg Thr Xle Ser Lys Asp 365

Ile Phe Pr» Tyr Vai Glu Gly Lys 380

Vai Mis Vai Lys Thr Xle Asp Tyr 395 400

Vai Asp Lys Glu Ala Phe Thr Lys 410 415

Lys Glu Gin Gin Asp Asn Ser Ala 425 430

Pro Ser Lys Pro thr Pro Ser Pro 445

Asp Ser Gl» Lys Asp Asp Asn Lys 460

Asn Asp Ala Ser Ser Glu Ser Gly 475 480 190 &YS A»p Lys Thr Pr© Ala Thr Lys Pr© Thr Lys Gly Glu Vai Glu Ser 485 490 495 Ser Ser Thr Thr Pr© Thr Lys Vai Vai Ser Thr Thr Gin Asn Vai Ala 500 505 51Ô Lyã Pr© Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Vai Vai Gin Thr 515 520 525 ' Ser Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala Pr© Leu Gin Lys Ala 530 535 540 Asn lie Lys as» Thr As» Asp Gly His Thr <Sln Ser Gin Asn Asn Lya 545 550 555 sm As» Thr Gin Glti Asm Lys Ala Lys Ser Leu Pr© Gin Thr Gly Glu Glu $65 5?0 575 Ser As» Lys Asp «et Thr Leu Pr© Leu Hat Ala Leu Leu Ala Leu Ser S85. SSO Ser Ile Vai 'Ala Fhe Vai Leu Pr© Arg Lys Arg Lys Asm 595 $00 605

<210> 45 <211> 1818 <212> ADN <213> Sequência Artificial <220> <223> Codifica a SEQ ID NO: 44 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 45 191 stggctgaag aaactggtgg taceaacacfc gaageccaae casagacega «gctgtcgct 60 tceccaaoca etacctctga. aaaggctccá gaaactaagc cagtcgçtaa cgctgtctcc 120 gcttctaaca aggaagtcga agcteeaacc iceyaaacta aggaagctaa. ggaagtcaag ISO gaagtcaagg ctccaaagga aactaaggaa gtcaagccag eÇgçtaaggç çaccaacaac 240 acttacccaa ttttgâacca agaattgaga gaagctatta agaaçccagc tatcãaggac 300 aaggaccact ccgctccaaa ctctagacea ategactfccg aaatgaagaa gaaggacggt; 360 âCCCáacaat tctaccacta egcgtcetet gtcaagccag ctagagttat tttcaccgac 420 tctaagccag aaatcgaatt gggtttgcaa tceggfccaat tctggagaaa gtccgaagtc 400 tacgaaggtg acaagaagtt gccaattaag titggtttcct; acgacaccgt caaggaetac 540 gcttacatca gatfcctccgt ttctaacggfc accaaggctg tcaagattgt ctcttccaec 600 cacttcaaca acaaggaaga aaagfc&cgac tacacfcttga tggaattegc tcaaccaatt 660 tacaactctg ctgacaagtc caagaecgaa gaagactaca aggctgaaaa gttgtfcggct 220 ccatacaaga aggctsagac tttggaaaga ca&gtttacg aattgaacaa gatccaagae 700 aagttgççag aaaagttgaa ggefcgaatae aagaagaagt tggasgacac caagaaggcc 840 ttggsega&c aagtcaagtc cgctatcacc gaatteeaaa acgttcaacc aáefcaaegaa 900 aagatgactg «ctegcaaga eaetaagtafi gtcgtctacg âãtccgtcga aâacaacgaa 960 tccaEgatgg açacettegt taageaeeea attaagactg gtatgttgaa cggtaagaag 1020 tacacggtca fcggaaaceac taaegacgac tagtggaagg acfcteatggfc tgaaggtcaa 1080 agagccagaa ecatccccaa ggacgctaag aac&acâçta gaaccattat sttcccatac 1140 gççgaagfts agactfctgta cgacgccatc gtcasggttc aegfccaagac tattgactae 1200 gacggtçaat accacgttag aactgtcgac aaggaagcct tcaccaaggc taac&cegae 1260 aagtccaaca agaaggaaea acaagacaac tctgctaaga aggaagctac cceâgctaec 1320 ccatqfcaagc caacccçatc tccagtcgaa aaggaatce c aasageaaga ctccéáaaag 1380 gacgacaaca agcaattgcc atcçgtcgaa aaggaaaacg acgcgtctiie cgaatccggt 1440 aaggacaaga ccccagctac caagccaact aagggtgaag ttgaatcttc cEctactact 1500 ecaaccaagg ttgtctccac tacccaaaac gtcgctaagc caaccaccgc cccctccaag 1560 aetaeeaagg acgttgtcea aacfetctgcc ggttectctg aagctaagga ccccgcecca 1620 tegcaaaagg ctaacatcaa gaacaccaac gacggecaca çccaatccca aaacaaeaag 1680 aacactcaag aaaacaaggc taagtcttug ccacaaacçg gtgaagaatc caacaaggac 1740 atgaccttgc categatgge tttgttggct ttgtcttcca fccgttgcttfc çgcctfcgcea 1800 agaaagagaa agaactaâ 1818

<210> 46 <211> 1710 <212> ADN <213> Sequência Artificial <220> <223> Codifica a SEQ ID NO: 17 que contém uma metionina no terminal amino e com optimização de codões para expressão em leveduras <400> 46 192 atggctgaag aaactggtgg taeeâacaçt gaagctcaac caasgaccga agctttggct £0 txcccaacca ctàccectga aaaggctcea gaaacfcaagc câgttgctaa egctgtcfcce 120 gtttctaaca aggaagtcga agccccaacc tccgaaacta aggaagctaa ggaagttaag ISO gaagteaagg ctecaaagga aactaaggçt gteaagccag ctgcçaagge tgacaacaac 240 acttacccaa ttttgaacca agaattgaga gaagctatta agaaçetagc eatcaaggac 300 aaggacoaefc ecgctcc&aa ccctagacca atcgacttcg aaatgaagaa ggaaaacggt 360 gaacaacaat tctaccacta egcgtcctct gtcaagceag ctagagfctafc fettcaccgac 420 tctaagccag aaatcgaatt gggtttgcaa tccggtcaat tctggag&aa gttegaagfcc 480 cacgaaggtg acaagaagtt gccaattaag etggtttcce acgacaccgt çaaggactac 540 gcttacatca gactctccgt ttgtaacggt actaaggctg tcaaga£tgt ctctfcccacc 600 eacetcaaca acaaggaaga aaagtacgac tacactttga tggaafctcge tcaaccaatt 660 tacaactctg gtgacaagtt caagacegaa gaagactaea aggctgaaaa gttgtcggct 720 ccatacaaga aggetaagac ettggaaaga caagtttacg aatçg&aeaa gafcccaagac 730 asgtfcgecftg ãaaagttgaa ggctgaatac aagaagaagc tggaagacac caagaaggct 840 ttggacgaac aagtcaagtc egctatcacc gaattecaaa acgfctcaacc aactaacçaa 900 sagatgaetg acttgcaaga cactaagfcae gtegtctacg aatccgfecga aaacaacgaa 960 tccatgacgg acaccttcgt taagc&ccca atfcaagactg gtacgttgaacggcmagaag 1020 tacatggtca eggaaaccac taacgacgac feaccggaagg acttcatggfc. tgaaggteaa 1080 agagtcagaa ecatctccaa ggacgctaag aacaacacta gaaccattat cttcccatac 1140 gttgaaggta agactttgtá cgaçggtatc gtcaaggttc acgtcaagac tattgaccae 1200 gacggtcaat accacgttag aatcgttgac aaggaagett tcaccaaggc tascacegac 1260 aagcccaaca agaagçaaca acaagacaae tctgccaaga aggaagctac cccagctacc 1320 ccacetaagc caaccccatc tccagttgaa aaggaatctc aaaagcaaga ctcccaaaag 13S0 gacgacaaca agcaattgcc atccgtcgaa aaggaaaacg acgcgtcttc tgaacccggt 1440 aaggscaaga ctccagctãg caagecagct aagggtgaag ttgaatcctc ccctactaet 1500 ccaaccaagg txgtctccac taeccaaaag gtcgctaagc caactaccgc tfcctfcecaag 1560 sctaccaagg aegttgtcca aaccfcccgct ggttcctctg aagctaagga ctctgctcca 1620 ttgcaaaafi ctaecatca* gaagaccaac gacggtcacã cccaatceca aaacaacaag 1680 aacactcaag asaae&aggc caagtctcaa 1710 <210> 47 <211> 1446 <212> ADN <213> Sequência

Artificial <220> 17 I+, com leveduras e <223> Codifica a região da SEQ ID NO: optimização de codões para expressão em codifica um codão de iniciação da metionina <400> 47 193 atggctgaag aaactgg tgg taceaacset gaagctcaac caaagaccga agctctggct 60 tccccaacca ctaccâctga aaaggctcca gaaactaagc csgttgcfcaa cgctgtefcec 120 gtttxtaaea aggaagt.cga agctccaacc tccgaaâcCã aggaagefcaa ggaagttaag ISO gaagtcaagg ctccaaagga âactaaggct gteaagecag ctgct&mgc tgacaaeaae 240 ãcttacccaa ittcgaacca agaatcgaga gaagctatta agaaccgagc tatcaaggac 300 aaggaecáct eégctccaaa ctctagscca atcgaetteg aaatgaagaa ggaaaacggt 360 gaacaacaat tctaccaeta cgcgcectcfc gtcaagccag ctagagt tat tttcaccgac 420 tctaagccag aaatcgaatt gggtfctgcaa tccggccaat tctggagaaa gttcgaagtc 480 taegaaggtg acasgaagEt gccaattaag tfcggttfcccfc acgacaeegt caaggacfcac 540 gcttaeatca gattctccgt ttctaacggt actaaggctg teaagafctgt ctcttccacc 600 cacttcaaca «caaggáaga aaagtacgac tacactfctga tggaattcgc tcaaccaatt 680 tacaactctg ctgacaagtt caagaccgaa gaagactaca aggctgaaaa gttgtfcggct 720 ççatacaaga aggctaagac ttfcggaaaga eaagt t tacg aattgaacaa gatccaagac 780 aagttgccag saaagtfcgaa ggctgâatáo aagaagaagt tggaagacac caãgaaggçt 840 ttggacgaac aagfccaagte cgctatcacc gaaccccaaa acgtteaacc aactaacgaa 800 aagacgactg acttgeaaga cactaagtac gtcgtctaeg aatecgtçga aaacaacgaa 880 tccatgatgg acacctccgt caageaecea attaagactg gtafcgttgaa cggtaagaag 1020 tãcatggtca fcggaaãccae taacgaegae fcactggaagg acttcatggt tgaaggtcaa 1080 agagteagaa ccaectccas ggacgctaag âSCááçáCfca gáaccattat cttcccatac 1140 gttgaaggta agactttgta cgacgccacc gtcaaggttc acgteaagaç tattgaetaç 1200 gacggtcaat accacgttag aattgtcgac aaggaagctt tcaccaaggc fcaacaecgae 1260 aagtccaaca agaaggaaca aeaagacaaç tçtgctaaga aggaagcfcâc cccagctaec 1320 ccatctaagc caaccccatc tccagttgaa aaggaatccc aaaagcaaga ctcccaaaâg 1380 gaegâcaasa agcaâttgce atccgtcgaa aaggaaaacg acgcgtcttc tgaatccggt 1440 aagtaa 1446

<210> 48 <211> 1341 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a região da SEQ ID NO: 17 I, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina <400> 48 194 afcggccgaag aaaetggtgg taceaacact gaagcteaac caaagaccga agctttggcfe 60 teeccaacca ctaee&ctga aaaggcteca gsaactaagc cagttgctaa cgctgtctcc 120 gfcfctctaacã aggaagtcga agctccaaçc tccgaaacta aggaàgctaa ggaagctaag ISO gaagtcaagg cfcccaaagga aactaaggct gtcaagecag ctgctaaggc tgscaacaac 240 açttâcccaa tfcfctgaacca agaattgaga gaagctatta agaaeeeagc tatcaaggac 300 aaggacsacc ccgctccaaa ctctagacca atçgaçtteg aaacgaagaa ggaaaacggt 360 gaacaacaat tctaceacta çgcgtcctct gtcaagccag ctagagttat tttcaeegac 420 tctaagecag aaatcgaatfc gggtfcfcgcaa fcccggfeea&fc fcctggagaaa gttcgaagtc 4SO tâegaaggtg acaagaagtt gccaattaag fctggcetcct acgacaccgt caaggactac 340 gcttacatca gattctccgt ttcfcaacgge acfcaaggcfeg tcaagattgt ctcttccace 600 cacttcaaca acaaggaaga aaagtacgac tâcaefcfctfa tggaattegc tcasccaaçç 660 fcacsaeeefeg ctgacaagtt caagaccgsa gasgactáca aggctgaaaa gttgttggct 720 óeatacaaga aggccaagac ttfcggaaaga c&sgfctfcacg aattgaaçaa gatccaagsc 780 aagttgccag aaaagttgaa ggctgaatac aagaagaagt tggaagacac caagaaggcc 840 ttggacgaac aagtcaagtc cgct*fce*ce gaaictecaaa acgfctcaace aactaacgaa 800 aagatgaetg acttgcaag* cactaagtac gtcgtctaog aatccgtcga aaacaacgaa 860 tccatgatgg acaccttegt taagcaeeca attaagâctg gtatgttgaa cggtaaga'ag 1020 tacafcggtca tggaáaceac taaçgacgae tactggasgg acttcacggt tgaaggtcaa 1080 agagtcagaa ccatctccaâ ggacgctaag aacaacacta gaaccattat ettcccatac 1140 gttgaaggta agactttgta cgacgctatc gteaaggttc acgt-eaagac tattgactae 1200 gacggtcaat accacgttag aatfcgctgaç aaggaagctC çxaccaaggc taacaccgaç 1260 aagtccaaca agaaggaaca acaagacaac tctgctaaga ággaagetac ccçagctaee 1320 ccatctaagc caaccccata a 1341

<210> 49 <211> 1938 <212> ADN <213> Sequência Artificial <220> <223> Codifica a região ORF0657n de comprimento completo que contém a SEQ ID NO: 17 modificada para conter uma glicina a seguir à metionina do terminal amino e com optimização de codões para expressão em leveduras <400> 49 195 atgggtaaea age&acaaaa ggaattcaag tcttcccact ccatlagaaa gtcttccttg 60 ggcgttgctt etgtcgctac ctccaccttg ttgttgtcga tgtetaaegg cgaagctcaá 120 gctgetgaag aaactggfcgg taccaacsct gaagcceaac eaaagaccga agcttfeggct 180 tscccaacca ctaccactga aaaggctcca gaaactaagc cagttgctaa cgctgtctec 240 gtttcraaea aggaagtcga agctccaacc tccgaaacta aggaagctaa ggaagttaag 300 gaagtcaagg «tccaaagga ááccaaggce gccaagccág etgctaaggc tgacaacaac 360 acfctacccaa fcetfcgaacca agaattgaga gaagctatta agaacecagc tatcaaggac 420 aaggaccact ccgctccaaa ctctagacca atcgacttcg aaatgaagaa ggaaaacggt 480 gaacaacaat tctaccacta cgcgtcctct gtcaagccag ctagagttat tttcaccgac S40 tctaagccag aaatcgaatt gggtttgcaa tccggtcaat tctggagaaa gtfcegaagtc 600 tacgaaggtg acaagaagtt gccaattaag ttggtttccfc acgacaccgt caaggactac 660 gcfctacatca gattctccgt ttctaacggt actaaggctg fccaagattgt ctefctecacc 720 cacttcaaea aeaaggaaga aaagtacgae tacactttga fcggaafctcgc teasccaatt 780 tacaactctg ccgacaagte caagaccgaa gaagaccaca aggctgaaaa gctgttggct 340 ccatacaaga aggctaagac tttggaaaga caagtttacg aattgaacaa gatccaagac 900 aagttgccag aaaagttgaa ggctgaatac aagaagaagt fcggaagacac caagaagget 960 ttggacgaac aagteaagtc cgctatcacc gaattecaaa âcgtfceaace aactaacgas 1020 aagatgactg acttgcaaga cactaagtac gtcgtetacg aatcegtcga aaacaacgaa 1030 tccatgatgg acaccttegt feaagcaccca attaagaçfcg gtatgttgaa cggtaagaag 1140 taeafcggtca tggaaaecac taacgacgac fcactggaagg aefcfccstggt fcgaaggtcaa 1200 agagtcagaa ceatctecaa ggacgctaag aaeaacacta gaaccattac cttcccatac 1260 gtcgaaggta agacectgta cgacgctafcc gtcaaggctc acgtcaagac tactgaceac 1320 gacggtcaat accacgfctag aattgttgac aaggaagctt teaecaaggc fcaacaccgac 1380 aagteeaaea agaaggaacs acaagaeaac tctgctaaga aggaagctac cccagc tacc 1440 ccatctaagc caaccccatc fcccagttgaa aaggaatctc aaaagcaaga ctcccaaaag 1500 gacgacaaca agcaattgec acccgccgaa aaggsaaacg acgcgtcttc tgaatccggt 1560 aaggacaaga ctccagctac caagccagct aagggfcgaag ttgaatctcc ctetactact 1620 ccaaccaagg ttgtctccac tacccaaaac gtcgctaagc caactaccgc ttcttccaag 1660 actaccaagg acgttgfccca aacfctcigct ggttccfcctg aagcfcaagga ctctgctcca 1740 ttgcaaaágg etaaeateaa gaacaccaac gacggtcaca cccaatccca aaacaacaag 1800 aacactcaag aaaaeaagge taagtctttg ccacaaaccg gtgaagastc eaacaaggac 1860 atgacctcgc cattgatggc tttgttggct ttgccctcca tcgttgcttt cgigttçgçga 1920 agaãagagaa agaaccaa 1933

<210> 50 <211> 1710 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a SEQ ID NO: 20, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina <400> 50 196 atggctgaag aaacfcggtgg fcaceaacact: gaagctcaac caaagaecga agctgtcgct 60 cccccaacca etacctctga aaaggcçcca gaaactaagç cagttgctaa egcfcgtctcc 120 gtttctaaca aggaagtcga agctccaacc tccgaaacca aggaagctaa ggaagttôag 180 gaagtcaagg ctccaaagga aaccaaggcc gtcaagccag ctactaagge tgacaacaac 240 acxtacccaa ttttgaacca agaatcgaga gaagctatta agaacccagc tatcaaggac 300 aaggaccact ccgctccaaa ctctagacca atcgacttcg aaaugaagaa ggeaaacggt 360 gaacaacaat fcctaccacta cgcgeectct gtcaagccag ctagagttac tctcaccgac 420 tetaagccag aaatcgaatfc gggtttgcaa tccggtcaat tetggegaaa gttcgaagtc 480 cacgaaggtg acaagaagtt gccaatteag ttggtttçct acgacaççgt eaaggact&e 540 gctcacatca gatfcetecgt Keceaaçggt actââggctg tcaa.ga.ttgt ctcteccaec 600 cacttcaaca acaaggaaga aaagtacgac tacactttga tggmttç.gc. fccaaeo&att 660 fcacaactctg ctgacaagtt caagaccgaa gaagactaca aggetgaaaa gttgttggct 720 ccafcacaaga aggctaagac tttggaaaga eaagtttacg aatcgaacaa gatceaagae 780 âsgttgccag aaaacjttgaa ggctgaafcac aagaagaagt tggaagacac caagaaggct 840 ttggacgsac aagteaagtc cgcfcateaec gaafcfcçeaaa acgtecaacc aactaecgaa 300 aagatgactg acttgcaaga cactaagtac gtcgtctacg aatcegtcga aaacaaçgaa 360 fcccatgatgg âcsccttçgt, taagcaccca attaagactg gtafegtfegaa cggtaagaag 1020 t&catggtea tgg<aa.scçat taacgscgac tactggaagg actfecatggt tgaaggteaa 1080 agagfcagaa ccatctecaa ggacgctaag aacaacacta gaaccattat cttcccafcac 1140 gttgaaggta agacfittgfca egacgctatc gtcaaggttc acgtcaagac fcattgacfcac 1200 gacggtcaat accacgtcag aatfcgttgae aaggaagctt tcsccaaggc taacaccgac 1260 aagtscaaca agaaggaaca aeaagacaac tcfcgctaaga aggaagctac cccagctacc 1320 ccstctaagc caaccccatc tccagttgaa aaggaatete aaaagcaaga ctcccaaaag 1380 gacgacaaca agcaattgcc atccgtegaa aaggaaaacg acgcgtcttc tgaatccggt 1440 aaggaeaãga cfcccagctac caagccagct aagggfcgaag tfcgaatcttc ctetactact 1500 eeaseeaagg tegtctccae tacccaaaac gtcgetââgc caacfcaccgc ttcttccaag 1560 actaceaagg acgttgtcca aacttctget ggfctcctctg aagctsagga efcctgctcca 1620 ttgcaaaagg ctaacatcaa g&iàcaccaac gaeggteaca cccaatccca aaaeaacaag 1600 aacactcaag aaaacaaggc taagtcteaa 1710

<210> 51 <211> 1446 <212> ADN <213> Sequência Artificial <22 0> <223> Codifica a região da SEQ ID NO: 20 Ι+, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina <400> 51 197 atggetgasg aaactggtgg taccaaeaet gaagctcaac caaagaccga agetgtegct 60 tccccaacca ctacctccga aaaggctcca gããactaagc eagttgctaa cgctgfcctotf 120 gttttctaaea aggaagfcçga agctçcaacc tccgaaacta aggaagctaa ggaagttaas 190 gaagtcaagg ctccaaagga aaccââggct gtcaagccag ctactaaggc r.gacaacaac 240 acttãCCeãã ttctgaacca agaattgaga gaagcfcatta agaacccagc tatcaaggac 360 aaggàçcact ccgctccaaa ctctagaçça atcgacttcg aaatgaagaa ggasaacggt 360 gaacaecãât tetaccaeta cgcgtcetcc gtcaagccag etagagttat tttcaccgag 420 tctâagccag aaatcgaatt gggtttgeaa tccggtcaat tctggagaaa gttcgaagcc 480 tacgaaggtg acaagaagtt gccaattaag ttggtttcct acgacaccgt çããggãctaç 540 gcttacatca gattctccgt ttctaacggt actaaggctg tcaagattgt crcttccace 600 cacttcaaca aeaaggaaga aaagtacgac tacacfcttga tggaattcgc tcaaccaatt 660 tacaactçtg ctgacaagtt caagaccgaa gaagaefcaca aggctgaaaa gttgttgget 720 ccatacaaga aggctaagác tttggrãaaga caagtctacg aattgaacaa gatccaagac 780 aagtfcgeeag aaaagttgaa ggcfcgaatac aagaagaagt tggaagaeac eaagaaggct 840 Cfcggacgaac aagtcaagtc cgctatcacc gaafctccaaa acgfctcaace aactaacgaa 800 aagatgacfcg actfcgcaaga csctaagtac gtcgtctacg aatccgtcga asacaacgaa 960 tecatgatgg acaccttcgt taagcaççca actaagactg gtatgttgaa cggtaagaag 1020 caeafcggtca tggaáaccac tâftcgacgac tactggaagg acttcatggC tgaaggtcaa 1080 agagtcagaâ ecatctee&a ggacgctaag aacaacacta gaaecactat cttcccacac 1140 gttgaaggta agacttfcgta cgacgctatc gtcaaggttc, acgfccaagae tatteactac 1200 gacggfeçaat accacgfctag aattgfctgac aaggaagctt tcaecs&gge fcaacaccgae 1260 aagtccaaca agaaggaaca aeaagacaaç tctgctaaga aggaagctae cccagctacc 1320 ccatctaagc ea&ecccate tccagttgaa aaggaatcfcc aaasgcaaga ctcecaaaaf 1380 gacgacaacÃ ageaâttgec atccgtcgaa aaggaaaacg acgcgtcttc tgaatccggt 1440 a&gtaa 1446 <210> 52 <211> 1341

<212> ADN <213> Sequência Artificial <22 0> <223> Codifica a região da SEQ ID NO: 20 I, com optimização de codões para expressão em leveduras e codifica um codão de iniciação da metionina <400> 52 198 atggctgaag aaactggfcgg taceaacact gaagctcaac caasgaccga agctgtcgct 6© tccccaacca ctaectctga aaaggctcca g&aactaagc cagctgctaa cgcfcgtetcc 120 gtttctaaca aggaagtcga agctecaacc tccgaaacca aggaagçtaa ggaagttaag ISO gaagtcaags ctecaaagga aactaaggcc gtcaagccag ctactaaggc tgacaacaaç 240 acttacccaa tcttgaacca agaattgaga gaagcfcafcfca agaacccagc tãtcaaggac 300 à&ggaccact ccgefcccaaa etctagacca atçgacttcg aaatgaagaa ggaaaacggt 300 gaacaacaat tctaccacta cgcgtectct gtcaageeiag ctagagttat fcfctcaccgac 420 tctaagecag aaatcgaaxt gggtttgcaa tccggtcaat tctggagaaa gfctegaagte 480 tacgaaggtg acaagaagtt gceaattaag tlggtttcct acgacaccgt caaggaeçaç gctttaeatcã gattctccgt ttctaaeggt acfcaaggefcg tcaagattgt ctcttçeaçc 600 cactteaaca aeaaggaaga aaagcacgac fcacacttfcgs tggaattçgc tcaaecaatt 600 tacaactetg ctgacaagtt eaagaecgaa gaagactaca aggctgaaaa gfcfcgttggct 720 ccatacaaga aggetaagac tttggaaaga caagtfctacg aafcfcgaaeaa gatcc&agac 780 aaffctgccâg aaaagfctgaa ggctgaafcac aagaagaage tggaagacac caagaaggct 840 ttggacgaac aagfccaagtc egctatcacc gaattccaaa acgtccaacc aaccaacgaa 800 aagatgactg acttgcaaga caccaagxac gt-cgccfacg aarçcgtega aaacaacgaa 860 tcçaçgatgg acaccttegt taagcaccça attaagactg gtafcgttgaa cggtaagaag 1020 tacatggtca tggaaaceac taacgacgac tactggaagg acttcatggt tgaaggtcaa 1080 agagxcagaa ceatctccaa ggscgçtaag aacaacacta gaaccattat cttcccatac 1140 gttgaaggta agactttgta cgacgctatc gteasgg&tc acgtcaagac tattgactac 1200 gacggtcaat accaegttag aattgttgac aaggaagctt tcaccaaggc taaeaccgac 1260 aagtccaaca agaaggaacâ acaagacaac tccgctaaga aggaagc rac cccagcfcacc 1320 ccatctaagc çaaccccafca a 1341

<210> 53 <211> 1938 <212> ADN <213> Sequência Artificial <220> <223> Codifica ORF0657n de comprimento completo que contém SEQ ID NO: 20 modificada para conter uma glicina a seguir à metionina do terminal amino e com optimização de codões para expressão em leveduras <400> 53 199 stgggfcááca agcãacaaaa ggaatfceaag tctttccact ccattagaaa gtçttccttg 60 ggtgttgctt ecgtegcfcafc etceaccttg tfcgttgttga tgtctaaçgg tgaagctcaa 120 gctgctgaag aaaccggtgg taccaacact gaagcccaac eaaagaccga agetgtcgct 180 tccccaacça ctacctctga aaaggctccà gaaactaagc eagfcfcgetaa cgccgtctcc 240 gtttetaae* aggaagfccga agçtccaaee tccgaaacfca aggaagctaa ggãagttaag 300 gaagtcaagg ctccaaagga a&etaaggcfc gtcaagccag ctactáággc tgacaacaae 360 . actcacccaa ttttgaaeca agaattgaga gaagetatsa agâacccagc tatcaaggac 420 aaggaceact ccgctceaaa etxtagacca atcgacttcg aaatgaagaa ggaaascggfc 480 gaaeaacaat fectaccacta cgcgtcctct gtcáagecag ctagagttae tttcaccgae 540 cctaagccagr aaatcgaact gggtttgeas tccggtcaat tçfcggagaaa gttcgaagfcc 600 taegaaggtg acaagââgEt gccaattaag ttggtctcct acgaeaccgt çaaggactac 660 gcttacâtca g&tfcetcegt tectaacggt actaaggctg tcaagatfcgfc ctcctccacc 720 cacttcaaca acaaggaaga aaagtacgac tacaccttga tggaattegc fceaaccaafct 780 taeaactctg ctgecaagtt caagaccgas. gaagactaca agfCtgaaaa gttgttggct 840 ccatacaaga aggccaagac cctggaaaga caagcttacg aatcgaaçaa gatccaagac 900 aagttgccag aaasgttgaa ggctgaatac aagaagaagt tggaagacac caagaaggct 960 ttggacgaac aagtcaagcc egetatcaec gaatcçcaaa acgttcaacc aactaacgaa 1020 aagatgactg aettgeaaga çactaagtac gtegfcctacg ããtccgtcga aaacaacgaa 1080 tccatgatgg acaccttcgt taagcaccca attaagactg gtatgttgaa cggtaagaag 1140 Çaç&tggtca tggaaaccac taacgaegac tactggaagg aefctcatggt tgaaggtcaa 1200 agagccagaa ccatctccaa ggaegctaag aacaacacta gaaccattat cttcccatac 1260 gttgaaggta agactttgfca cgacgctatc gfceaaggtfce acgteaagae tattgactac 1320 gacggtcaat seeacgttag aattgttgac aaggaagctt tcaeeaaggc taacaccgac 1380 aaçtccaaca agaaggaaca acaag&caac tctgctaaga aggaagctae eccagctacc 1440 ccatctaagc eaaccceatc tccagttgaa aaggaafccfce aaaagcaaga ctcecaaaag 1500 gacgaeaaca agcaattgcc atccgCcgaa aaggaaâ&eg aegcgfcefctc tgaatccggc 1560 aaggâcaaga ctccagctac caagceagct aagggtgaag ttgaatcetc ccccactact 1620 ecaaccasgg ttgtctccâc tacceaaaac gtcgctaagc caaefcacçgc tEçttccaag 1680 acfcaecaagg acgtfcgteca aacttctgct ggttcctctg aagctaagga çccfegcteea 1740 ttgc&aaagg ctaacaccaa gaacaccaac gacggtcaca cccaatceea aaacaacaag 1800 eacactcasg aaaacasggc taagtctfctg ccacaaaccg gtgaagaatc caacaaggac 1860 catfcgatggc tttgctggct ttgtcttcca tcgttgettt cgtcttgcca 1920 agaaagagaa agaactaa 1938

<210> 54 <211> 565 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657nH <400> 54 200

Ala Glu Glu Thr Gly Gly Thr Asn Thr Glu Ala Gin Pr© Lys Thr Glu 1 5 10 15 Ala Vai Ala Ser Pr© Thr Thr Thr Thr Glu Lys Ala Pr© Glu Ala Lys 20 25 30 Fr© Vai Ala Asa Ala Vai Ser Val'Ser Asn Lys Glu Val Glu Ala Fr© 35 40 45 Thr Ser Glu Thr Lys Glu Ala Lys Glu Val Lys Ala Pr© Lys Glu Thr 50 55 60 Lys Ala Vai Lys Pr© Ala Ala Lys Ala Asp Asn Asn Thr Tyr Fr© Ile 65 70 75 80 Leu Asa Gin Glu Leu Arg Glu Ala Xle Lys Asn Fr© Alá lie Lys Asp 85 90 95 Lys Asp Bi» Ser Ala Pr© Asn Ser Arg Fr© Ile ASP Phe Glu «et Lys 100 105 110 Lys Glu Asn Gly Glu Glu Gin Phe Tyr His Tyr Ala Ser Ser Val Lys us 120 125 Fr© Ala Arg Vai Ile Phe Thr Asp Ser Lys Fr© Glu Ile Glu Leu Gly 130 135 140 Leu Gin Ser Gly Gin Phe Trp Arg Lys Phe Glu Val Tyr Glu Gly Asp 145 ISO 155 160 Lys Lys Leu Pr© Ile Lys Leu Val Ser Tyr Asp Thr Val Lys ASp Tyr 165 170 175 Ala Tyr lie Arg Phe Ser Val Ser Asn Gly Thr Lys Ala Val Lys ile 180 185 190 Vai Ser Ser Thr Kis Phe Asn Asn Lys Glu Glu Lys Tyr Asp Tyr Thr 195 200 205 • Leu mt Glu Phe Ala Gin Pr© Ile Tyr Asn Ser Ala Asp Lys Phe Lys 210 215 220 Thr GlU Glu ASp Tyr Lys Ala Glu Lys Leu Leu Ala Pr© Tyr Lys Lys 225 230 235 240 Ala Lys Thr Leu Glu Arg Gin val Tyr Glu Leu Asn Lys Ile Gin ASP 245 250 255 Lys Leu Pr© Glu Lys Leu Lya Ala Glu Tyr Lys Lys Lys Leu Glu ASp 260 265 27Ô Thr Lys Lys- Ala Leu Asp Glu Gin Val Lys Ser Ale Ile Thr Glu Phe 275 288 265 Gin As» Vai Gin Pr© Thr Asn 01« Lys Wefc Thr Asp Leu Gin Asp Thr 290 295 300 Lys Tyr Ala Val Tyr Glu Ser Val Glu Asn Asn Glu Ser ttet mt Asp 305 310 315 320 Thr Phe vai Lys Kis Pr© lie Lys Thr eiy Mac Leu Asn Gly Lys Lys 325 330 335 Tyr Mét Vai Met Glu Thr Thr As n Asp ASp Tyr Trp Lys Asp Phe Met 340 345 350 Vai Glu Gly Gl© Arg Val Arg Thr 11© Ser Lys Asp Ala Lys Asn Asn 355 360 365 Thr Arg Thr ile xi© Phe Pr© Tyr Val Glu Gly Lys Thr Leu Tyr Asp 370 375 368 Ala Ile Vai Lys Vai His. Vai Lys Thr lie Asp Tyr Asp Gly Gin Tyx 385 390 395 400 Kis Vai Arg lie Vai Asp Lys Glu Ala Phe Thr Lys Ala Asn Thr Asp 405 410 415 201

Lys Ser Mn Lys Lys Glu Glu Gin Asp Asa Ser Ala Lys Thr Fr© Ala Thr Fr© Ser Lys Fr© Thr Fr© Ser Fr© vai 4 35 440. · 445 Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp ASή Lys Glu 450 455 460 Vai Glu Lys Glu Mn Asp Ala Ser Ser Glu ,Ser Gly Lys 465 470 475 Fre’ Ala Thr Lys Pr© Ala Lys Gly Glu Vai Glu Ser Ser 485 450 Pr© Thr Lys Vai V&l Ser Thr Thr Glu Asn Vai Ala Lys 500 505 Ala Ser Ser Lys Thr Thr Lys Asp Vai Vai Gin Thr Ser 515 520 525 Ser GlU Ala 'Lys Asp Ser Ala Pr© Leu Gin Lys Ala Asn 530 535 540 Thr Asn Asp Gly His Thr Glu Ser Gin As» As» Lys Asn 545 550 555 Asn Lys Ala Lys Ser 565.

Lys Glu Ala 430

Glu Lys Glu

Leu Pr© Ser

Asp Lys Thr

Ser Thr Thr 495

Ala Ser Ser

He Lys λ«ι

Thr Gin Glu 560

<210> 55 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657nH <400> 55 202

Ala Glu Glu Thr Gly Gly Thr Asn Thr Glu Ala Gin Pr© Lys Thr Glu 1 5 10 IS Ala Vai Ala Ser Fr© Thr Thr Thr Ser Glu Lys Ala Pr© Glu Thr Lys 20 25 30 Pro val Ala Asn Ala Val Ser val Ser Ase Lys Glu Val Glu Ala Pr© 35 40 45 Thr 'Ser Glu Thr Lys Glu Ala Lys Glu Val Lys Glu val Lys Ala Pr© 5Q 55 60 Lys 01« Thr Lys Glu Val Lys Pr© Fkla Ala Lys Ala Thr As© Asn Thr ss 79 75 80 Tyr Fr© Xis Leu Asa Glu Gly Leu Arg Glu Ala Ile Lys Asn Pr© Ala $5 80 95 lie Lys &Sp Lys Asp I-ÍÍ S Ser Ala Pro Asm Ser Arg'Pr© Ile Asp Phe 100 105 110 Glu Met Lys Lys Lys Asp Gly Thr Gin Gin Phe Tyr His Tyr Ala Ser 115 120 125 Ser Val Lys Pro Ala Arg Val Ile Phe Thr ASp Ser Lys Pr© Glu 11® 130 135 140 Glu Leu Gly Leu Sln Ser Gly Glu Ph© Trp Arg Lys Phe Glu Val Tyr 145 150 155 160 Glu Gly Asp Lys Lys Leu Fro ile Lys Leu Vai Ser Tyr ASp Thr Val 165 170 17$ Lys Asp Tyr Ala Tyr ne Arg Phe Ser Val Ser Asa Gly Thr Lys Ala 180 1SS ISO 203

Vai Lys lie Vai Ser Ser Thr Mis Phe Asn Asn Lys Glu Glu Lys Tyr 1« 200 205 Asp ly r Thr Leu «èt Glu Phe Ala Gin Pr© Ila Tyr AS» Ser Ala Asp 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pr© 225 230 235 240 Tyr Lys Lys Ala Lys Thr Leu Glu Arg 01» Val Tyr Glu Leu Asn Lys 245 250 2:55 11a 61» Asp Lys Leu Pr© Glu Lys Leu Lys Ala 61» Tyr Lys Lys Lys 260 265 270 Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin val Lys Pr© Ala lie 275 280 285 Thr 61« Phe 61» AS» Val Gin Pr© Thr Asn Glu Lys Set Thr Asp Leu 250 255 300 61» Asp Thr Lys Tyr val vai tyr Glu Ser Val Glu Asn Aon Glu Ser SOS 310 315 320 mt «et Asp Thr Phe Val Lys Mis Pr© íle Lys Thr Gly Set Leu Asn 325 330 335 Gly Lys Lys Tyr «et val «et Glu Thr Thr As» Asp Asp Tyr Trp Lys 340. 345 350 Asp Phe Hat val Glu Gly Gin Arg Val Arg Thr lie Ser Lys Asp Ala 355 360 365 Lys Asn AS» Thr Arp Thr Ile lie Phe Pr© Tyr Val Glu Gly Lys Thr 370 375 380 Leu Tyr ASp Ala 11® Val Lys Val Mi® val Lys Thr Ile Asp Tyr ASp 3S5 300 395 400 6ly 61» Tyr His Val Arg lie Val Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 Asa Thr Asp Lys Ser As» Lys Lys Glu Gin 61» Asp Asn Ser Ala Lys 420 425 430 Lys Glu Ale Thr Fr© Ala Thr Pr© Ser Lys Pr© Thr Fr© Ser Fr© val 435 440 445 Glu Lys Glu Ser 61» Lys Gl» Asp Ser 01» Lys Asp Asp AS» Lys Gin 450 455 460 Leu Pro. Ser Val Glu Lys Glu Asn ASp Ala Ser Ser Glu Ser Gly Lys 465 470 475 480 Asp Lys Thr Pro Ala Thr Lys Pr© Thr Lys Gly Glu Val Glu Ser Ser 485 490 495 Ser Thr Thr Pr© Thr Lys Val Val Se r Thr Thr Gin As» Vai Ala Lys SOO 505 510 Pr© 11a Thr Ala Ser Ser Lys Thr Thr Lys ASp val val Gin Thr Ser 515 520 525 Ale Gly ser Ser Glu Ala Lys ASp Ser Ala Pro Leu Gin Lys Ala Asn 530 535 540 He Lys As» Thr Ase Asp Sly His Thr Gin Ser Gin AS» Asn Lys Asn 545 550 555 560 Thf 61» Glu As» Lys Ala Lys Ser 565 204

<210> 56 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <400> 5 6 205

AiS QlU GiU Thr Gly Gly Thr Asn Thr Glu Ala Gin Pro Lys Thr Glu 1 5 10 15 Ala vai Ala Ser Pro Thr Thr Thr Ser Glu Lys Ala Pro Glu Thr Lys 20 25 30 Pro Vai Ala Asn Ala Vai Ser Vai Ser ASn Lys Glu Val Glu Ala Pro 15 40 45. Thr Ser Glu Thr Lys Glu Ala Lys Glu Vai Lys Glu Val Lys Ala Pro 5Ô 55 60 Lys Glu Thr Lys Glu Vai Lys Pro Ala Ala Lys Ala Thr Asn Asn Thr «5 i 70 75 80 Tyr Fro ^Ile Leu Asn Gin Glu Leu Arg Glu Ala Ile Lys Asn Pró Glu 85 90 95 Xle Lys Asp Lys ASp His Ser Ala Pro Asn Ser Arg Pro lie ASp Phe 100 105 UO Glu Wet Lys Lys Lys Asp Gly Thr Gin Gin Phe Tyr His Tyr Ala Ser 115 120 125 Ser Vai .Lys Pr» Ala Arg Vai Ile Phe Thr Asp Ser Lys pro Glu ile 130 135 140 Glu leu Gly Leu Gin Ser Gly Gin Fhe Trp Arg Lys Phe Glu Val Tyr 145 ISO 155 160 01u Gly Asp Lys Lys Leu Pro Ile Lys Leu Vai Ser Tyr Asp Thr Vai 155 170 175 lys Asp Tyr Ala Tyx Xle Arg Phe Ser Ile Ser Asn Gly Thr Lys Ala 180 185 190 Vai Lys Ile Vai Ser Ser Thr His Phe Asn Asm Lys Gi« Glu LyS Tyr 195 200 205 Asp Tyr Thr Léu (fet Glu Phe Ala Gin Pro Xle Tyr Asn Ser Ala Asp 21© 215 220 Lys Phe Lys Thr Glu Glu ASp Tyr Lys Ala Glu Lys Leu Leu Ala Pro 225 230 235 240 Tyr Lys Lys Ala Lys Thr Leu Glu Arg GM Val Tyr Glu Leu Asn Lys 245 250 255 lie Gin Asp Lys Leu Pro Glu Lys Léu Lys Ala Glu Tyr Lys Lys Lys 2S0 265 270 Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin val Lys Ser Ala lie 275 280 285 Thr Glu Phe Gin Asn Vai Gin Pro Thr Asn Glu Lys He£ Thr Asp Leu 290 295 300 Gin Asp Thr Lys Tyr Vai Vai Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 310 315 320 Het Hei* Asp Thr fhe Vai Lys MiS Pro lie Lys Thr Gly Met Leu Asn 325 330 335 Gly Lys Lys Tyr Met Vai Mefc Glu Thr Thr Asn Asp ASp Tyr Trp Lys - 340 345 350 Asp Phe Her Vai Glu Gly Gin Arg Vai Arg Thr Xle Ser Lys ASp Ala 355 380 365 Lys Asn As» Thr Axg Thr. tte Ile Phe Pro Tyr Val Glu Gly Lys Thr 370 375 380 Leu Tyr Asp Ala Xle vai Lys Vai His val Lys Thr lie Asp Tyr Asp 385 390 355 400 Gly Gin fyr His Vai Arg lie Vai Asp Lys Glu Ala Phe Thr Lys Ala 405 410 415 206

Asa Thr Asp Lys Ser Asa Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Lys Glu Ale Thr Pro Ala Thr Pro Ser Lys Pro Thr Pro Ser Pro Vai 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asm Lys Gin 45 Θ 455 460 Leu Pro Ser vai Glu Lys Glu Mn ASp Ala Ser Ser Glu Ser Gly Lys 465 470 475 430 Asp Lys Thr Pro Ala Thr Lys Pro Ala Lys Gly Glu Vai Glu Ser Ser 485 450 * 495 Ser Thr Thr Pro Thr Lys Vai Vâl Ser Thr Thr Gin Asn Vai Vai Lys 500 505 510 Pro Thr Thr Ala Ser Ser Lys Thr Thr Lys Asp Vai Vâl Gin Thr Ser 515 520 525 Ais Gly Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Ly& Ala Asn 530 535 540 lie Lys Asa Thr Aon ASP Gly His Thr Gin Ger Gin Aan Asn Lys ASO 545 550 555 560 Thr Gin Glu Asa Lys Ala Lys Ser 565 <210> 57 <211> 568 <212> PRT <213> Sequência Artificial <220> <223> ORFO 657nH <221> local <222> 247 <223> Desconhecidos <400> 57 207

Ala-Olu Glu Thr Gly Gly Thr Asn Thr Glu Ala Gin Pro Lys Thr Glu 1 5 10 15 Ala Vai Ala Ser Pro Thr Thr Thr Ser Glu Lys Ala Pro Glu Thr Lys 29 25' 30 Pro Vai Ala Asn Ala Vai Pro Vai Ser Asn Lys Glu Vai Glu Ala Pro 35 40 45 Thr Ser Glu Thr Lys Olu Ala Lys Glu Vai Lys Glu Vai Lys Ala Pro SO 55 60 Lys Olu Thr Lys Glu Vai Lys Pr© Ala Ala Lys Ala Thr Asn Asn Thr 65 70 75 30 Tyr Pro fie Leu Asn Gin Glu Leu Ar» Glu Ala Thr Lys Asn Pro Glu 15 50 SS 11® Lys ASp Lys k£p 1ÍS- Ser Ala. Pro Asn Ser Arg Pro Thr ASg Phe 100 105 110 GlU ffet Lys Lys Asn Asp Gly Thr Gin Gin Phe Tyr HiS Tyr Ala Ser 113 120 125 Ser vai Lys Pro Ala Mg Vai 11© Ph© Thr ASp Ser Lys Pro Glu 11© 13 D 133 140 Glu Leu Gly Leu Oln Ser Gly Gin Fhe Trp Ar» Lys Bhe Glu Vai Tyr 145 ISO 155 160 208

Glu Gly ASP Lys Lys Leu pro lie Lys Leu Val Ser Tyr Asp Thr Val 165 170 175 Lys Asp Tyr Ala Tyr He Arg Phe· Ser Ile ser Asn Gly Thr Lys Ala ISO 185 190 Val Lys Ile Vai Ser Ser Thr His phe Asn Asn Lys Glu Glu Lys Tyr 195 200 20S Asp Tyr Thr Leu Ket Glu Phe Ala Gin pro Ile Tyr Asn Ser Ala ASp 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys Leu Leu Ala Pro 225 230 235 248 Tyr Lys Lys Ala Lys Thr M Glu Arg Glu Val Tyr Glu Leu Asn Lys 245 258 255 11¾ Gin Asp Lys' Leu Pro Glu Lys Leu Lys Ala Glu Tyr Lys Lys Lys 268 265 270 Leu Glu Asp Thr Lys Lys Ala Leu Asp Glu Gin Val Lys Ser Ala lie 275 280 285 Thr Glu Phe Gin Asn Vai Qln pro Thr Asn Glu Lys Het Thr Asp Leu 290 295 f 300 Gin ASp Thr Lys Tyr Vai Val Tyr Glu Ser Val Glu Asn Asn Glu Ser 305 m 315 320 Met Wstt Asp Thr Phe Val Lys His Pro Ile Lys Thr Gly Met Leu Asn 325 330 335 eiy Lys Lys Tyr Het Val Het Glu Thr Thr Asn Asp Asp Tyr Trp Lys 340 345 350 Asp Phe Ket Val Glu Gly Gin Arg Val Arg Thr lie Ser Lys Asp Ala 355 360 365 Lys Asn Asn Thr·· Arg Thr Xle Ile Fhe Pro Tyr Val Glu Gly Lys Thr 370 375 380 Leu Tyr Asp Ala Ile Val hys Val His val Lys Thr Ile Asp Tyr Asp 385 350 395 408 Gly Gin Tyr His Val Arg Ile Val Asp Lys Glu Ala Phe Thr Lys Ala 465 410 415 Asn Thr Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 438 425 438 Lys Glu Ala Thr Pro Ala Thr Pro Ser Lys Pro Thr Pro Ser Pro Vai 435 . 440 445 Glu Lys Glu ser Glu Lys Gin Asp Ser Gin Lys Asp ASp Asn Lys Gin * 450 455 460 Leu Fro Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 47S 489 Asp Lys Thr Pro Ala Thr Lys Pro Ala Lys Gly Glu Val Glu Ser Ser 485 490 495 Ser Thr Thr Pro Thr Lys val Val Ser Thr Thr Gin Asn Val Ala Lys 500 505 510 Pro Thr Thr Ala Ser Ser Lys Thr Thr Lys ASp val Val Gin Thr Ser SIS 520 525 Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn 530 535. S40 Leu Leu Lys Thr His Asp Gly- His Thr Gin Ser Gin Asn Ile Lys Asn 545 550 555 560 Thr Lys Lys Asp Lys Ala Lys Ser 565 209

<210> 58 <211> 568 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <400> 58 210

Ma Glu Glu Thr Gly Gly Thr Asm Thr Glu Ala Gin Pr© Lys Thr Glu 1 5 10 15 Ma Vai Ala ser Pro Thr Thr Thr .Ser Glu Lys Ma Pr© Glu Thr Lys 20 25 30 pro Vai Ala ASP Ala Vai Ser Vai Ser Asn Lys Glu Val Glu Ala Pr© 35 40 45 Thr Ser Glu Thr Lys Glu Ma Lys Glu Vai Lys Glu Val Lys Ala Pro 50 55 60 íys Glu Thr Ly» Glu Vai Lys Pr© Ala Ala Lys Ala Thr Asn Asn Thr €5 70 75 80 Tyr Pro Ile ie,u Asn Gin Glu Leu Arg Glu Ala Ile Lys Asn Fr© Ala 35 90 05 Ile Lys ASp Lyâ Asp His Ser Ala' Piro Asn Ser Arg Pr© Ile Asp Phe 100 103 110 01« Met Lys Lys Glu Asa Gly Thr Gin Gin Phe Tyr His Tyr Ala Ser 115 . 120 125 Ser Vai Lys Fr© Ala Arg Vai Ile Phe Thr Asp Ser Lys Pr© Glu Ile 130 135 140 Glu Leu Gly Leu Gin.Ser Gly Glu Phe Trp Arg Lyg Phe Glu Val Tyr 145 150 155 160 Glu m Asp Lys Lys Leu Pr© lie Lys Leu. val ser Tyr ASp Thr Val 165 170 175 Lys Asp Tyr Ala Tyr ile .Arg Phe Ser Vai Ser Asn Gly Thr Lys Ala ISO IBS ISO Vai Lys ile vai Ser.Ser Thr His Phe Asn Asn Ly s Glu Glu Lys Tyr 155 200 205 Asp Tyr Thr Leu Kefe Glu Phe Ala Gin Pro Ile Tyr Asn Ser Ala Asp 210 215 220 Lys Phe Lys Thr Glu Glu Asp Tyr Ly® Ala Glu Lys Leu Leu Ala Pr© 22% 230 233 240 Tyr Lya Lys Ala Lys Thr Leu Glu Arg Gin Val Tyr Glu Leu Asn Lys 245 250 235 He Gin A$P Lys Leu Fr© Glu Lys Léu Lys Ala Glu Tyr Lys Lys Lys 260 26S 270 Leu Glu Âsp Thr Lys Lys Ale Leu Asp Glu Gin Val Lys Ser Ala ile 275 280 285 Thr Glu Phe Gin Asn Vai Gin Pro Thr Asn Glu Lys «et Thr Asp Leu 250 205 300 Glu As p Thr Lys Tyr Vai Vai Tyr Glu Ser Val Glu Asn Asm Glu Ser 305 ' 310 315 320 Her Mer ASp Thr Phe vai Lys His Pro Ile Ly s Thr Gly Met Leu Asn 325 330 333 Gly Lys Lys Tyr Met vai Hat Glu Thr Thr Asn asp Asp Tyr Trp Lys 340 345 350 Asp Phe Met Vai Glu Gly Gin Arg Vai .Arg Thr ile Ser Lys Asp Ala 355 360 r 365 • Lys As® Asa Thr Arg Thr Ile Ile Phe Pr© Tyr Val GlU Gly Lys Thr 370 37S 38© 211

Leu Tyr Asp .Ala Xla Vai Lys Vai Mis Vai Lys Thr Ile ASp Tyr' Asp 3SS 3J0 385 400 Gly Gin Tyr Bis Vai Arg Ile Vai Asp Lys Glu Ala Phe Thr Lys Ala 405 410 41S Asn Thr Asp Lys Ser Mn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys 420 425 430 Lys Glu Ala Thr Pro Ala Thr Pro Ser Lys Pro Thr Pro Ser Pro Vai 435 440 445 Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin 450 455 460 Leu Pro Ser vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys 465 470 475 480 Asp Lys Thr pro Ala Thr Lys Pro Thr Lys Gly Glu Vai Glu Ser Ser 485 400 4SS Ser Thr Thr Pro Thr Lys vai vai Ser Thr Thr Gin Aãn Vai Ala Lys SOO SOS 510 Pro Th-r· Thr Ala. Ser Ser Lys Thr Thr Lys Asp Vai Vai Gin Thr Ser 515 520 525 Ale Gly Ser Ser Glu Ala Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn 530 535 540 Xle Lys As» Thr· &sn Asp Gly His Thr Gin Ser Gin Asn Asn Lys Asn 545 550 555 560 Thr Gin Glu Asn Lys Ala Lys Ser 5 §5

<210> 59 <211> 567 <212> PRT <213> Sequência Artificial <220> <223> ORFO657ηΗ <400> 59 212

Ala Glu Glu Thr' ' Giy Gly Thr Asn Thr Glu Ala Gin Pre Lys Thr Glu 1 s 10 15 Ala val Ala Ser Pro Thr Thr Thr Ser Glu Lys Ala prn Glu Thr Lys 20 25 30 Piro Vai Ala Asn Ala Val Ser Val Ser Asn Lys Glu Vai Glu Ala pro 35 40 45 Thr Sor Glu Thr Lys Glu Ala Lys Glu val Lys Glu val Lys Ala Pro 50 '55 50 Ly& Glu Thr Lys Ala Val Lys Sr© Ala Ala Lys Alã Thr Asn Asn Thr SS 70 75 80 Tyr Pxo Ila Leu Asn Gin Glu Leu Arg Glu Ala lie Lys Asn Pro Ala 85 50 95 lie Lys Asp Lys Asp Kis Ser Ala Pro Asn Ser Arg fro lie Asp Phe 100 105 110 Glu Ktefc Asa Lys Lys Asn GXy Glu Glu Gin Fhe Tyr Kis Tyr Ala Ser 115 120 12$ Ser Ala Ly$ Pr© Ala Arg Val Xle Phe Thr Asp Ser Lys Pr o Glu lie 130 135 140 Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys Fhe Glu Val Tyr 145 158 155 ISO 213

Glu Gly Asp Lys Lys Leu Fro Ile Lys Leu val Ser Tyr Asp Thr Val 165 170 175 Lys Asp Tyr Alá Tyr Ile Arg Phe·Ser Vai Ser Asn Gly Thr Lys Ala 189 18$ 190 Vj 1 Lys ile Vai Ser Ser Thr His Phe Asn Asn Lys Glu Glu Lys Aâp 195 29© 295 Tyr Thr Leu Hefc Glu Phe Ala Gin Fro Ile Tyr Asn Ser Ala ASp Lys 219 215 220 Phe Lys Thr Glu Glu ASp Tyr Lys Ala Glu Lys Leu Leu Ala Fro Tyr 22$ 230 235 249 Lys Lys Ala Lys Thr Leu Glu Arg Gin Vai Tyr Glu Leu Asn Lys lie 245 250 255 Gin Asp Lys Leu Pro Glu Lys Leu Lys Àlà Glu Tyr Lys Lys Lys Leu 26© 265 270 Glu Asp Thr Lys Lys Ala Leu Asp Glu Glii Val Lys Ser Ala He Thr 27$ 28© 28$ Glu Phe Gin Asn vai Gin Fro Thr Asn Glu Lys Het Thr Asp Leu Gin 290 29$ 300 Asp Thr Lys Tyr vai Vai Tyr Glu Ser Vai Glu Asn Asn Glu Ser Hat SOS 310 315 32© Met Asp Thr Phe Vai Lys Eis Fro lie Lys Thr Gly Htt Leu Asn Gly 32$ 330 335 Lys Lys Tyr -Jfet vai Met Glu Thr Thr Asn Asp Asp Tyr Trp Lys ASP 340 345 356 Phe Met vai Glu Gly Gin Arg Vai Arg Thr Ile Ser Lys Asp Ala Lys 35$ 36© 365 Asn Asn Thr Arg Thr Ile lie Phe Fro Tyr Val Glu Gly Lys Thr Leu 37© 37$ 389 Tyr Asp Ala. Ile Vai Lys vai His Vai Lys Thr Ile mp Tyr Asp Gly 38$ 390 395 400 Gin Tyr Hís Vai Arg Ile Vai Asp Lys Glu Ala Phe Thr Lys Ala Asn 40$ 410 415 Thr Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser &la Lys Lys 420 425 43© Glu Ala Thr Pro Ala Thr Fro Ser Lys Fro Thr Fro Ser Pro val Glu 435 449 445 Lyâ Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Lys Gin Leu 450 455 46© Pro Ser val Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser ôiy Lys Asp 485 47© 475 48© Lys Thr Fro Ala Thr Lys Fro Thr Lys m Glu Val Glu Ser Ser Ser 485 499 495 Thr Thr fro Thr Lys Vai Vai Ser Thr Thr Gin Asn Val Ala Lys Fro $00 5 ©5 510 Thr Thr Ala Ser Ser Lys Thr Thr Lys ASp Val Val Gin Thr Ser Ala 515 52Ô $25 Gly Ser Ser Glu Ala Lys Asp Ser Ala Fro Leu Gin Lys Ala Asn lie $30 535 54© Lys A.sn Thr Asm Asp Gly EiS Thr Gin Ser Gin Asn Asn Lys Asn Thr 54$ 550 55$ $60 Gin Glu Asn Lys Ala Lys Ser 56$ 214

<210> 60 <211> 576 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <400> 60 215

Ala Glu Glu Thr Gly Vai Thr Asn Thr Glu Ai a Gin Pro Lys Thr Glu l 5 10 15 Ala vai Ala Ser Fro Thr Thr Thr Thr Thr Glu Lys Ala Pro Glu Ala 20 25 30 Lys Pro Val Ala Lys Fro Vai Ala Asn Ala val Ser Val Ser Asn Lys 15 49 45 Glu. Vai Vai. Ala Pro Thr Thr Glu Thr Lys Glu Ala Lys Glu Val Lys 59 55 60 Ala Vai Lys Glu Vai Lys Ala Pro Lys GlU Ala Lys Glu Glu. Lys Pro €5 70 75 80 Ala Ala Lys Ala ASp Asn Asn Thr Tyr Fro lie Leu Asn Gin Glu Leu 85 90 95 Arg Glu Ala Ile Lys Asn Fro Ala He Lys Asp Lys ASp HiS Ser Ala 100 105 110 Pro Asn Ser Arg Fro He Asp Phe Glu Hat Lys Lys Lys Asp Gly Thr US 120 125 Gin Glu Phe fyr HÍS iyr Ala Ser Ser vai Lys Pro Ala Arg Vai He 130 - 135 140 Phe Thr Asp Ser Lys Fro Glu He Glu Leu Gly Leu Gin Ser Gly Gin 145 150 155 160 Phe Trp Arg Lys Phe Glu vài Tyr Glu Gly Asp Lys Lys Leu Pro Ile 165 170 175 Lys Leu vai Ser Tyr Asp Thr vai Lys Asp Tyr Ala Tyr Ile Arg Phe ISO 185 190 Ser Vai Ser Asn Gly Thr Lys Ala Vai Lys Ile Val Ser Ser Thr His 195 200 205 Phe Asn Asn Lys Glu Glu Lys Tyr Asp Tyr Thr Leu Met Glu Phe*Ala . 219* 215 220 Gin Fro He Tyr Asn Ser Ala Asp Lys Phe Lys Thr GlU Glu Asp Tyr 225 230 235 240 Lys Ala Glu Lys Leu Leu Ala Pro Tyr Lys Lys Ala Lys Thr Leu Glu 245 250 255 Arg Gin Vai Tyr Qlu Leu Asn Lys lie Gin Asp Lys Leu Pro Glu Lys 2m 265 270 Leu Lys Ala Glu Tyr Lys Lys Lys Leu Glu Glu Thr Lys Lys Ala Leu 275 280 285 Asp Glu Gin Vai Lys Ser Ala He Thr Glu Phe Gin Asn Val Gin Pro 290 29$ 300 Thr Asn Glu lys Met Thr Asp Leu Gin Asp Thr Lys Tyr Val Ala Tyr 305 319 , 315 320 Glu Ser Vai Glu Asn Asn Glu Ser Met Met Asp Thr Phe Val Lys His 325 330 335 Fro Ile Lys Thr Gly Met Leu Asn Gly Lys Lys Tyr Met Val Met Glu 349 345 350 Thr Thr Asn Αίφ Asp Tyr Trp Lys Asp Phe Met Val Glu Gly Gin Arg . 355 350 365 Vai Arg Thr ile Ser Lys Asp Ala Lys Asn Asn Thr Arg Thr He Ile 370 375 380 216

Phe Pto Tyr val Giu Gly Lys Thr Leu Tyr Asp Ala Ile Vai Lys Val 385 390 395 400 Bis Vai Lys Thr Ue Asp Tyr Asp Gly Gin Tyr His Vai Arg Ile Val 405 410 415 Asp Lys Giu Ale Fhe Thr Lys Ala Asn Ala Asp Lys Thr Asn Lys Lys 420 425 430 Glu GXn Glo ASP Asn Ser Ala Lys Lys Giu. Thr Thr Pro Ala Mefe Pro 435 440 445 Ser Lys Pro Thr Thr Pro Pro Vai Glu Lys Glu Ser Gin Lys Gin Asp 450 455 460 Ser Gin Lys Asp Asp Asn Lys Gin Ser Pro Ser val Glu Lys Glu Asn 465 470 475 480 Asp Ale Ser Ser Glu Ser Gly Lys Asp Lys Mac Pro Vai Thr Lys Pro 485 490 495 Ala Lyâ Ale G1Ú Vâl Glu Ser Ser Ser Thr Thr Pro Thr Lys val Val ,, 500 505 £10 Ser Thr Thr Gin Asn Vai Ala Lys Pro Thr Thr Ala Ser Ser Glu Thr 515 $24 5.25 Thr Lys Asp vai Vai Gin Thr Ser Ala Gly Ser Ser Glu Ala Lys Asp 530 535 540 ser Ala p.ro Leu Gin Lys Ala. Asn lie Lys Asn Thr Asn Asp Gly His 545 $50 555 560 Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin Glu Asn Lys Ala Lys Ser SIS 570 575

<210> 61 <211> 572 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO657ηΗ <400> 61 217

Aiã ·* Glu Glu Thr Gly * vai Thr Asa Ala Vai Ala Ser Fro Thr Thr Thr 28 Lys Pro Vai Ala Asm Ala Vai Ser 3:5 40 Pro Thr Thr Glu Thr Lys Glu Ala 50 5S Vai Lys Ala Pro Lys Glu Ala Lys 65 10 Asp Asn Asn Thr Tyr Pro 11® ..Leu Lys Asn Fro Ala Ile Lys Asp Lys 180 Pro lie Asp Phe Glu Lys Lys 11S 120 84 8 Tyr Ala Ser Ser vai Lys Pro 130 135 Lys Pro Glu lie Glu Leu Gly Leu 145 150

Thr Glu 10 Ala Gin Pro Lys Thr 15 Glu Thr 25 Thr Glu Lys Ala Pro 30 Glu Ala Vai Ser Asn Lys Glu Aí* Vai Vai Ala Lys Glu Vai Lys 80 43 Ala vai Lys Glu Glu Glu Lys 75 Pro Ala Ala Lys Ala SQ Aso Gin 00 Glu Leu Arg Glu Ala 95 Ile Asp 185 Sis Ser Ala Pro Asn 110 Ser Arg Lys Asp Gly Thr Gin 125 Gin Fhe Tyr Ala Arg vai He 140 Phe Thr ASp Ser GlO Ser Gly 155 Gin Fhe Trp Arg Lys 160 218 phe Glu Vai Tyr Glu Giy Asp Lys Lys Leu Pr© Ile Lys :l«u val Ser 165 170 175 Tyr Asp Thr Vai Lys Asp Tyr Ala Tyr Ile Arg phe Ser Val Ser Asn ISO 185 190 Gly Thr Lys Ala Vai Lys Ile Vai Ser Ser Thr His Phe As» Asn Lys 195 200 205 Glu Glu Lys Tyr Asp Tyr Thr Leu Met Glu Phe Ale Gin Fro Ile Tyr 210 215 220 AS» ser Ala Asp Lys Fhe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys 225 230 235 240 Leu Leu Ala Pr© Tyr Lys Lys Ala Lys Thr Leu Glu Arg Gl» Val tyr 245 250 255 Glu Leu As» Lys Ile Gin Mp Lys Leu Fr© Glu Lys Leu Lys Ala Glu 250 255 2?Ô Tyr Lys Lys Lys Leu Glu Glu Thr Lys Lys Ala Leu Asp Glu Gl» Val 275 280 285 Lys Ser Ala Ile Thr Glu Fhe Gl» As» Vai Gl» Fro Thr Ah» Glu Lys 290 295 300 «et Thr Asp Leu Gin Asp Thr Lys Tyr Vai Vai Tyr Glu Ser Val Glu 305 310 Thr Phe 315 320 AS» As». Glu Ser Met Met Asp Vai Lys His Pro Ile Lys Thr 325 330 335 Gly Met Leu As» ©ly Lys Lys Tyr Met Vai Met Glu Thr Thr Asn Asp 340 345 350 Asp Tyr Trp Lys Asp Phe Met Vai Glu oiy Gin Arg val Arg Thr Ilé 355 360 365 Sei· Lys Asp Ala Lys Asn AS» Thr Ar o Thr Ile lie Phe Pr© Cys val 370 375 380 Glu Gly Lys Thr Leu Tyr Asp Ala Ile vai Lys Vai His val Lys Thr 3Ô5 350 395 400 11« Asp Tyr Asp Gly Gin Tyr His val Arg ile Vai Asp Lys Glu 405 410 415 Phe Thr Lys Ala "1420 Asn Ala Asp Lys Thr As» Lys Lyâ Glu Gl» Gin Asp 425 430 Asn Ser Ala Lys Lys Glu Thr Thr Fro Ala Met Fro Ser Lys Fr© Thr 435 440 < 445 Thr Fr© Fr© Vai Glu Lys Glu Ser Gin Lys Gl» Asp Ser Gl» Lys ASp 450 455 450 Asp Asn Lys Gin Ser Pr© Ser' Vai Glu Lys Glu Asn Asp Ala Ser Ser 4S5 470 475 480 Glu Ser Gly Lys Asp Lys «et Fro Val Thr Lys Pr© Ala Lys Ala Glu 485 400 495 Vai Glu Ser Ser Ser Thr Thr Fro Thr Lys Vai Vai Ser Thr Thr Gin 500 505 510 As» val Ala' Lys Fro Thr Thr Ala Ser Ser Glu Thr Thr Lys Asp Val 515 520 52S Vai Gin Thr Ser Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala Pr© Leu 530 535 540 Gin Lys Ala Asn ne Lys As» Thr Asn Asp Gly His Thr Gl» Ser Gin 545 550 555 589 Asn As» Lys Asn Thr Gin Glu Asn Lys Ala Lys Ser 565 570 219 <210> 62 <211> 572 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <4 0 0> 62 220

Ala Glu Glu Thr Gly Vai Thr Asn Thr Glu Ala Gin Pro Lys Thr Glu i 5 10 15 Ala Vai Ala Ser Pro Thr Thr Thr Thr Thr Glu Lys Ala Pro Gl« Ale 20 25 30 'Lys Pro vai Ala Asn Ala Vai Ser Vai Ser Asn Lys Glu Vai Vai Ale 35 40 45 Pro Thr Thr Glu Thr Lys Glu Ala Lys Glu Vai Lys Ala Vãl Lys Glu S0 55 60 vai Lys Ala Pm Lys Glu Ala - Lys Giu Glu Lys Pro Ala Ala Lys Ala §5 70 75 80 Asp Asn Asn Thr Tyr Pr© Ile Leu Asn Gin Glu Leu Arg Glu Ale Ile 85 m 95 Lys Asa Pr© Ala Ile Lys Asp Lys Asp HÍS Ser Ala pro Asn Ser Arg 300 105 uo Pro Ile Asp Phe Glu Met Lys Lys Lys Asp Gly Thr Gin Gin phe Tyr 115 120 125 His Tyr Ala Ser Ser vai Lys Pro Ala Arg Vai ile Phe Thr Asp Ser 130 135 - 140 Lys Pro Glu lie Glu Leu Gly Leu Gin Ser Gly Gin Phe Trp Arg Lys 145 150 155 160 Phe Giu Vai Tyr Glu Gly Asp Lys Lys Leu Pro Ile Lys Leu Vai Ser 165 170 175 Tyr Asp Thr Vai Lys Asp Tyr Ala Tyr 11® Arg Phe Ser Vai Ser Asn 180 185 150 Gly Thr Lys Ala Vai Lys lie Vai Ser Ser Thr Mis Phe Asn Asn Lys 155 200 205 Glu Glu Lys Tyr Asp Tyr Thr Leu Met Glu Phe Ala Gin Pro' ile Tyr 210 215 220 Asn Ser Ala Asp Lys Phe Lys Thr Glu Glu Asp Tyr Lys Ala Glu Lys 225 230 235 240 Leu Leu Ala Pro Tyr Lys Lys Alã Lys Thr Leu Glu Arg Gin Vai Tyr 245 250 2S5 Glu Leu Aan Lys Ile Gin Asp Lys Leu Pro Glu Lys Leu Lys Ala Glu 250 265 270 Tyr lys Lys Lys Leu Glu Glu Thr Lys Lys Ala Leu Asp Glu Gin Vai 275 280 285 Lys Ser Ala Ile Thr Glu Phe Gin Asn Vai Gin Pró Thr Asn Glu Lys 230 285 300 Met Thr Asp Leu Gin Asp Thr Lys Tyr val Vai Tyr Glu Ser Vai Glu 105 310 * 315 320 Asn Asn Giu Ser Met Met Asp Thr Phe Vai Lys His Pro ne Lys Thr 325 330 335 Gly Mac Leu Asn Gly Lys Lys Tyr Met Vai Met Glu Thr' Thr Asn Asp 340 345 350 Asp Tyr Trp Lys Asp Phe Met Vai Giu Gly Gin Arg Vai Arg Thr 11® 35S 359 365 Ser Lys Asp Ala Lys Asn Asn Thr Axg Thr II e Ile Phe Pro Tyr Vai 370 375 380 221

Glu Gly Lys Thr Leu Tyr Asp Ala Xle Vai Lys Vai His Vai Lys Thr 3®5 390 395 400 11* Asp Tyr Asp Gly mn Tyr His Vai Arg Ile Vai Asp Lys GlU Ala 405 410 415 Phe Thr Lys Ala ASO Ala Asp Lys Thr Asa Lys Lys Glu Gin Gin Asp 420 • 425 436 Aso Ser Ala Lys Lys Glu Thr Thr Fro Ala Het Pro $er Lys to Thr 435 446 445 Thr Pro Pro Vai. Glu Lys Glu Ser Gin Lys Gin Asp Ser Gin Lya Asp 450 ' 4S5 466 Asp Asn Lys Gin ser pro ser Vai Glu Lys Glu Aso Asp Ala Ser Ser 465 470 47S 460 Glu Ser Oly Lys Asp Lys Met Fr» Vai Thr Lys Pro Ala Lys Ala Glu 4SS 490 495 Vai Glu Ser Ser ser Thr Thr Pro Thr Lys Vai Vai Ser Thr Thr Gin SOO 505 510 ASO Vai Ala Lys Fro Thr Thr Ala Ser Ser Glu Thr Thr Lys Asp Vai 515 520 525 Vâl Çln Thr Ser Ala Gly Ser Ser Glu Ala Lys Asp Ser Ala Pre Leu 53S 535 546 Gin Lys Ala ASO n* Lys As» Thr Aso Asp Gly «ia Thr Gl» Ser Gin 5« 55 0 555 560 Aso Aso Lys Asn Thr Gin Glu Aso Lys Ala Lys Ser 565 570 <210> 63

<211> 566 <212> PRT <213> Sequência Artificial <22 0> <223> ORFO 657ηΗ <400> 63 222

Ala Glu Glu Thr Gly Gly Thr Asa Thr Gia Ala Gin Pro Lys Thr Glu 1 5 10 15 Ala Vai Ala Ser Pro Thr Thr Thr Thr Thr Glu Lys Ala Pro Glu Ala 20 '25 30 Lys PtfO Vai Ala Asxt Ala Vai Ser Vai Ser Asn Lys Glu Vai Vai Ala 35 40 45 Pro 'Thr Thr Olu Thr Lys <5 la Ala Lys Gin Vai Lys Ala Pro Lys Glu 50 55 60 Thr Lys αία Vai Lys Pro Ala Ala Lys Ala Asp Asn As» Thr Tyr Pro €5 10 75 80 lie Leu Aan Lys βία Leu Arg Glu, Ala lie Lys Asn Pro Alá Ile Lys ÔS 50 55 Asp Lys ASP His Ser Ala Pro asa Ser Arg Pro Ile Asp phe Glu Met 100 10S 110 Lys Lys Glu Asn Gly Glu Gin Gia Phe Tyr His Tyr Ala Ser Ser Vai 115’ 120 125 Lys Pro· Ala Arg vai Ile Phe Thr Asp Ser Lys Pro Glu lie Glu Leu 130 135 140 Gly Leu Gin Ser Gly Gin. Phe Trp Arg Lys Phe Gia Vai Tyr Glu Gly 145 150 155 1€0 223 ASp l»8 Lys Leu Fro ile Lys Leu Val Ser Tyr Asp Thr Val Lys Asp 16S 170 175 Tyr Ala Tyr Ile Arg Phe Ser Val Ser Asn Gly Thr Lys Ala Val Lys i&o 185 190 n« mi Ser Ser Thr Hís Phe Asn Asn Lys Glu Glu Lys Tyr Asp Tyr 195 200 205 Thr lífiu Met 51a Phe Ala Gin Pro Ile Tyr Asn Ser Ala Asp Lys Phe 210 215 228 Lys Thr Glu Glu ASp Tyr Lys Ala Glu Lys Leu Leu Ala Pro Tyr Lys 225 230 235 240 Lys Ala Lys Thr Leu Glu Arg Gin val Tyr Glu Leu Asn Lys Ile Gin 245 250 255 ASp Lys Leu Pro Glu Lys Leu Lys Ala Glu Tyr lys Lys Lys Leu Gin 260 265- 270 Glu Thr Lys Lys Ala Leu Asp Glu Gin val Lys Ser Ala Ile Thr Glu 275 280 285 Phe Gin ASO Vai Gin Pro Thr Asn Glu Lys Met Thr Asp Leu Gin Asp zm 295 380 Thr Lys Tyr Vai Vai Tyr Glu Ser Val Glu Asn Asn Glu Ser Ket Met 105 310 315 32Θ Asp Thr Phe Vai Lys HiS Pro XI» Lys Thr Gly Met Leu Aân Gly Lys 325 330 335 Lys Tyr «et Vai «et GlU Thr Thr ASn Asp Asp Tyr Trp Lys Asp Phe 340 345 350 Mhfc vai Glu Gly 5ln Arg Vai Arg Thr Ile Ser Lys Asp Ala Lys Asn 355 360 365 Asn Thr Arg Thr Ile Ile Phe Pro Tyr Ile Glu Gly Lys Thr Leu Tyr 370 375 386 Asp Ala Ile Vai Lys Vai His Val Lys Thr Ile Asp Tyr Asp Gly Gin 185 390 395 400 Tyr His Vai Arg na Vai Asp Lys Glu Ala Phe Thr Lys Ala Asn Ala 405 410 41$ Asp Lys Ser Asn Lys Lys Glu Gin Gin Asp Asn Ser Ala Lys Lys Glu 420 425 430 Thr Thr Fro Ala Thr pro Ser Lys Pro Thr Thr Fro Pro Val Glu Lys 435 440 445 Glu Ser Gin Lys Gin Asp Ser Gin Lys Asp Asp Asn Thr Gin Ser Pro 450 455 460 Ser Vai Glu Lys Glu Asn Asp Ala Ser Ser Glu Ser Gly Lys Asp Lys 465 470 475 480 Thr Fro Ala Thr Lys Pro Ala Lys Gly Glu Val GlU Ser Ser Ser Thr 485 498 49$ Thr Fro Thr Lys Vai Vai Ser Thr Thr Gin Asn Val Ala Lys Pro Thr 500 585 $10 Thr Ala Ser Ser Glu Thr Thr Lys Asp Val Val Gin Thr Ser Ala Gly 515 520 525 Pro Ser Glu Ma Lys Asp Ser Ala Pro Leu Gin Lys Ala Asn Ile Lys 530 535 540 AS® Thr Asn Asp Gly HÍS Thr Gin Ser Gin Asn Asn Lys Asn Thr Gin 545 550 555 560 Glu Asp Lys Ala Lys Ser 565 224

<210> 64 <211> 8 <212> PRT

<213> Sequência Artificial <22 0> <223> Cauda de His <4 0 0> 64 X,0tt Clw HiS MÍS Mis MÍS HÍS HÍS <210> 65 <211> 16 <212> ADN <213> Sequência Artificial <22 0> <22 3> iniciador <400> 65 ctggccgtcg ttttac 16

<210> 66 <211> 17 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador 225 <4Ο0> 6 6 caggaaacag ctatgac 17 <210> 67 <211> 39 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 67 aaccggtttt ccatggggaa caaacagcaa aaagaattt 39 <210> 68 <211> 38 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 68 accggtttct cgaggttttt acgttttcta ggtaatac 38 <210> 69 <211> 109 <212> ADN <213> Sequência Artificial <220> 226 <223> Oligómero ORF0657n <400> 69

afgggtaaca agcaaeaaaa ggaatfccaag tetctctact ccattagasa gtccccettg 60 fftgtfcgcfet ctgtcgctat ctccaccttg fcfcgfctgfctga tgfcctaacg 1ÔS

<210> 70 <211> 110 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 70

Ottggggaag egacagctfcc ggtcttçggt fcgagcttcag tgctggtacc accagtttct 60 tcagcageag cttgagctfcc accgtfcagac stcaacaaca aeaaggtgga 110

<210> 71 <211> 110 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 71 227

agaeigmagc tgtcgcçtçe ccaaccacfca eccctgaaaa ggctccagaa actaageeag 60 fctgctaacgc tgtctcegtt tctaasáãgg aagtcgaage tccaacctcc HO

<210> 72 <211> 109 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 72 tggtagcctt ageagctggc ttgecttcct tagtttcctc tggagccttg acttccttaa 60 cttcctfcagc tcccttagtc teggaggtfcg gagettcgac ttccecgtt ioo

<210> 73 <211> 108 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 73 aagtcaagcc agctgctaag gctaccaaca aeacttacçc aattttgaae caagaattga 60 gagaagctât taagaaecea gctaccaagg acaaggacca ctccgctc 108 <210> 74 <211> 109 228

<212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 74 tcttcatttc €0 193 tggcttgacs gaffacgcgt agfcggfcagaa tfcgttgggta ecgfcccttct gaagtcgatt ggtctagagrfc ttggagcgga gtggtccttg tccttgaca <210> 75 <211> 102 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF 0 6 5 7 n <400> 75 accactacgc gtcccctgxc aagccagcta gagctatttt caccgaetc t aagcçagaaa 60 tcgaattggg tttgçaatec ggteaattct ggagaaagfct cg 102 <210> 76 <211> 104 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n 229 <4Ο0> 76 ctgatgtaag egtagtcctt gacggcgtcg taggaaacea aettaattgg eaacttcttg 6a tcaccttcgt agaettcgaa ctttctccag aattgaccgg atfcg 104

<210> 77 <211> 109 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 77 caecgtcaag gaetacgctt acatcagatt ctccgtttct a&eggtacfca aggecgfceaa 60 gattgtctcf tccacccaet tcaacaaeaa ggaãgaaaag tacgactac 109

<210> 78 <211> 109 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 78 aactttccag cctfcgfcagte fctctfccggtc ttgaacttgt cagcagagtt gtaaafcfcggfc 60 fcgagcgaact ccatcaaage gtagtegtac ttttctteet tgttgttga 109 230 230 <210> 79 <211> 106 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF 0 6 5 7 n <4 0 0> 79 ccgsagaaga ctacaaggct gaaaagttgfc tggcfcccata caagaaggct aagactttgg €0 aaagaeaagt ttacgaattg aacaagatcc aagacaagtfc gccaga 106 <210> 80 <211> 109 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF 0 6 5 7 n <400> 80 teggtgaiag eggacttgae ttgtfcegfcee aaagccttct ttgtattcag ccttcaactt ttctggcaac tfcgtcttgga

tggtgtcttc caactecttc 6ô tcttgttca 10S <210> 81 <211> 109

<212> ADN <213> Sequência Artificial <22 0> 231 <223> Oligómero ORF0657n <400> 81 cgaacaagtc áagfiecgcta tcaccgaatt ccaaaacgfcfc caáccáâcta aegaaaagat 60 gaetgaettg eaag&cacta agtaegtcgt ctacgaatcc gfccgaaaae 109

<210> 82 <211> 109 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 82 tttecatgac catgtactte ctaccgttca aeafcaççagfc etfcaacrggg tgcttaacga 60 aggtgtccst catggattcg tegfctttcga cggattcgta gaegaegta 109

<210> 83 <211> 109 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 83 232 gaacggtaag aagtacafcgg tcatggaaac cactaacgac gactactgga agg&cfcfccac 00 ggttgaegge caaagagfcca gaaccatctc eaaggacgct aagaaeaac 109

<210> 84 <211> 101 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 84 gtcttgacgt gaaccttgac gatagcgtcg tacaaagtct taccctcaac gtatgggaag 00 ataatggttc cagtgttgtt cttagcgtcc ttgg&gafcgg t 101

<210> 85 <211> 106 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 85

cgctatcgtc aaggtteaeg tcaagactat egaetacgãc ggtcaacaec acgttagaat 00 fcgttgacaag gaagcfcfcfcca ccaaggctaa caccgacaag çccaae 10S

<210> 86 <211> 96 <212> ADN 233 <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 8 6 tggggetggrc ttagafcgggg tagcfcggggt agcttccfte ctagcagagt tgtcttgttg 60 tcccttcttg ttgfgactxgt cggtgttagc c-ttggt 06 <210> 87 <211> 85 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORFO 657n <4 0 0> 87 cagctacccc atctãâgcca accccatctc cagttgaaaa ggaatctcsa aagcaagact 60 eccaaaagga egaeaacaag caafet 85 <210> 88 <211> 100 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORFO 657n <4 0 0> 234 gttggcttgg tagctggagt cttgtcctta ccggattcag aagacgcgtc gctttccttc δ» tegacggatg geaattgctt gttgtcgtee Etttgggagt 190

<210> 89 <211> 101 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 89 ggacaagact ccagetacca agccaactaa gggtgaagtt: gaafccfcfcect ctACtaetCC 60 aaccaaggtt gtctccacta cccaaaacgt cgctaageca a 101

<210> 90 <211> 101 <212> ADN <213> Sequência Artificial <220> <223> Oligómero ORF0657n <400> 90 agcagagtcc teagcttcag aggaaccagc agaagtttgg acaacgfccct tggtagtctt €0 ggaagaagcg gcagttggct fcagcgacgfct ttgggtagtg g 101 <210> 91 <211> 91

<212> ADN 235 <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n <400> 91

ggttectetg a&gctaaggâi ctctgctcca ttgcaaaagg c.taacatcaa gaacaccaac SO

gacggtcaea ccca&cceea aaaeaacaag a SI <210> 92 <211> 98 <212> ADN Λ 00 \—1 CNl V Sequência Artificial <22 0> <223> Oligómero ORFO 657n <4 0 0> 92 gtgaagaacc caac&aggac afcgaccttgc cattgãtgge tttgtçggct: ctgtettcca 60 tcgttgcttt cgtcttgcca agaaagagaa agaactaa 98 <210> 93 <211> 98 <212> ADN <213> Sequência Artificial <22 0> <223> Oligómero ORF0657n 236 <4Ο0> 93

gfcgaagaatc caacaaggac atgacettgc cafctgatggc tttgttggcC ttgtefctcca 60 tcgttgc&fet cgtcttgcca agaaagagaa agaaet&a SS <210> 94 <211> 31 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 94 cttaaagctt atgtcacttt ctcttgtatc g 31 <210> 95 <211> 30 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 95 tgataagctt gctcaatggt tctcttcctc 30 <210> 96 <211> 53 <212> ADN <213> Sequência Artificial 237 <22 0> <223> Iniciador <4 0 0> 96 aaccggtttg gatcccacaa aacaaaatgg gtaacaagca acaaaaggaa ttc 53

<210> 97 <211> 42 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 97 aaccggtttg gatccttagt tctttctctt tcttggcaag ac 42 <210> 98 <211> 24 <212> ADN <213> Sequência Artificial <220> <223> Iniciador <4 0 0> 98 gctgaagaaa ctggtggtac caac 24 <210> 99 <211> 42 238

<212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 99 gtcacggatc cttaagactt agccttgttt tcttgagtgt tc 42

<210> 100 <211> 41 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 100 ggggggatcc cacaaaacaa aatggctgaa gaaactggtg g 41 <210> 101 <211> 39 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 101 ggggggggat ccttaagact tagccttgtt ttcttgagt 39 239

<210> 102 <211> 41 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 102 ggggggatcc cacaaaacaa aatggctgaa gaaactggtg g 41 <210> 103 <211> 32 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 103 gggggggatc cttagttctt tctctttctt gg 32 <210> 104 <211> 39 <212> ADN <213> Sequência artificial <22 0> <223> Iniciador 240 <4 0 0> 104 ctccggatcc cacaaaacaa aatggctgaa gaaactggt 39 <210> 105 <211> 38 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <4 0 0> 105 gctgccggga tccttatggg gttggcttag atggggta 38 <210> 106 <211> 644 <212> PRT <213> S. aureus <4 0 0> 106 241 «et Asn Lys Gin Gin Lys Glu Phe Lys Ser Phe Tyr Ser ile Arg Lys 1 5 10 15 Ser Ser Leu Gly val Ala Ser Val Ala Ile Ser Thr Leu Leu Leu Leu 20 25 30 Met Ser Asn Gly Glu Ala Gin Ala Ala Glu Glu Thr Gly Gly Thr Asn 35 40 45 Thr Glu Ala Gin Pro Lys Thr Glu Ala Leu Ala Ser Pro Thr Thr Thr 50 55 60 Thr Glu Lys Ala Pro Glu Thr Lys Pro Val Ala Asn Ala Val Ser Val 65 70 75 80 Ser ASP Lys Glu val As Glu Ala Pro Thr $er Glu Thr ο ή Lys Glu Ala Lys ας Glu Val Lys 03 Glu Val Lys Ala Pro Lys 3?v Glu Thr Lys Ala Val Lys Pro 100 105 110 Ala Ala Lys Ala Asp Asn Asn Thr Tyr Pro lie Leu Asn Gin Glu Leu 115 120 125 Arg Glu Ala ile Lys Asn Pro Ala ile Lys Asp Lys Asp His Ser Ala 130 135 140 Pr© Asn Ser Arg Pro Ile Asp Phe Glu «et Lys Lys Glu Asn Gly Glu 145 150 155 160 Gin Gin Phe Tyr His Tyr Ala Ser Ser Val Lys Pro Ala Arg Val Ile 165 170 175 Phe Thr Asp Ser Lys Pro Glu Ile Glu Leu Gly Leu Gin Ser Gly Gin 180 185 190 Phe Trp Arg Lys Phe Glu Val Tyr Glu Gly Asp Lys Lys Leu Pro Ile 1SS 200 205 Lys Leu Val Ser Tyr Asp Thr Val Lys Asp Tyr Ala Tyr ile Arg Phe 210 215 220 Ser Val Ser Asn Gly Thr Lys Ala Val Lys Ile Val Ser Ser Thr His 225 230 .235 240 Phe Asn Asa Lys Glu Glu Lys Tyr Asp Tyr Thr Leu Met Glu Phe<Ala 245 250 255 Olfl Pro lie Tyr Asn Ser Ala Asp Lys Phe LyS Thr Glu Glu Asp Tyr 260 265 270 Lys Ala Glu Lys Leu Leu Ala Pro Tyr Lys Lys Ala Lys Thr Leu Glu 275 280 285 Arg Gin Val Tyr Glu Leu Asn Lys Ile Gin Asp Lys Leu Pro Glu Lys 280 295 300 .Leu Lys Ala Glu Tyr Lys Lys Lys Leu Glu Asp Thr Lys Lys Ala Leu 305 310 315 320 Asp Glu Gin Val Lys Ser Ala Ile Thr Glu Phe Gin Asn Val Gin Pro 325 330 335 Thr Asn Glu, Lys Met Thr Asp Leu Gin Asp Thr Lys Tyr Val Val Tyr 340 345 350 Olu Ser val Glu Asm Asn Glu Ser Met Met Asp Thr Phe Val Lys His 355 360 - 365 Pro Ile Lys Thr Gly «et Leu Asn Gly Lys Lys Tyr Met Val Ket Glu 370 375 380 Thr Thr Asn Asp Asp Tyr Trp Lys Asp Phe Met Val Glu Gly Gin Arg 385 330’ 395 400 val Arg Thr Ile Ser Lys Asp Ala Ile Asn Asn Thr Arg Thr Ile Ile 405 410 415 Phe Pro Tyr Val Glu Gly Lys Thr Leu Tyr Asp Ala Ile Val Lys Val 420 425 430 242

His val Lys Thr Ile Asp Tyr Asp 435 440 Asp Lys Gly Ala Phe Thr Lys Ala 450 455 Glu Gin Gin Asp ASÍl Ser Ala Lys 455 470 Ser Lys Pro Thr Pr© Ser Pro Vai 485 Ser Gin Lys Asp Asp Asn Lys Gin 500 Asp Ala Ser ser Glu Ser Gly Lys 515 520 Ala Lys Gly Glu Vai Glu Ser Ser 530 535 Ser Thr Thr Gin Asn vai Aia Lys 54S 550 Thr Lys Asp Vai Vai Gin Thr Ser 565 ser Ala Pro Leu Gin Lys Ala Asn 500 Thr Gin Ser Gin Asn Asn Lys Asn -555 600 Leu ír» Gin Thr Gly Glu Glu Ser 516 615 Met Ala Leu Leu Ala Leu Ser Ser 525 «30 Lys Arq Ly» Asn <210> 107 <211> 644 <212> PRT <213> S. aureus

Gly Gin Tyr His val 44$ Arg lie Val Asn Thr Asp Lys 460 Ser Asn Lys Lys Lys Glu Ala Thr 475 Pro Ala Thr Pro 480 Glu Lys 490 Glu Ser Gin Lys Gin 495 Asp Leu 505 Pro Ser val Glu Lys 510 GlU Asn Asp Lys Thr Pro Ala 525 Thr Lys Pro Ser Thr Thr Pro 540 Thr Lys Val Val Pr» Thr, Thr 555 Ala Ser Ser Lys Thr 560 Ala Gly 570 Ser Ser Glu Ala Lys 57S Asp Ile 585 Lys Asn Thr Asn Asp 590 Gly HiS Thr Gin Glu Asn Lys 605 Ala Lys Ser Asn Lys Asp Met «20 Thr Leu Pro Leu Ile Vai Ala 635 Phe Val Leu Pro Arg 640 <400> 107 243

Met Asn Lys Glu Glu Lys Glu Fhe Lys Ser Phe Tyr Ser 11« Arg Lys i 5 10 15 Ser Ser Leu Gly vai Ala Ser Vai Ala XI© Ser Thr Leu Leu Leu Leu 20 25 30 Het Ser As» Gly Glu Ala Glu Ala Ala Glu Glu Thr Gly Gly Thr ASO 35 40 45 Thr Glu Ala Glu Pr© Lya Thr Glu Ala Vai Ala Ser Pro Thr Thr Thr 50 55 60 Ser Glu Lys Ala Pr© Glu Thr Lys Pro Val Ala Asn Ala Val Ser Val 65 70 75 60 Ser Asa Lys Glu Vai Glu Ala Pro Thr Ser Glu Thr Lys Glu Ala Lys 85 30 95 Glu Val Lys Glu Vai Lys Ala Pro Lys Glu Thr Lys Ala Val Lys Pro 100 105 110 Ais Thr Lys Ala h$p Asa ASO Thr Tyr Pro xie Leu Asn Gin Glu Leu 115 120 125 Arg Glu Ala Ile Lys ASO. Pro Ala lie Lys Asp Lys Asp Bis Ser Ala 130 13S 140 pro Asu Ser Arg Pro Ile Asp Phe Glu Het Lys Lys Glu Asn Gly Glu 145 150 155 160 244

Gin Gin Phe Tyr His Tyr Ala Ser Ser Vai Lys Pro Ala Arg Vai Ile 165 170 175 Phe thr Asp Ser Lys Pro Glu Ile Glu Leu Gly Leu Gin Ser Gly Gin ISO 185 190 Phe Trp Arg Lys Phe Glu Vai Tyr Glu Gly Asp Lys Lys Leu Pró Ile 195 200 205. Lys Leu Vai Ser tyr Asp Thr Vai Lys A®p Tyr Ala Tyr Ile Arg Phe 210 215 . 220 Ser Vai Ser Asn Gly Thr Lys Alâ Vai Lys Ile Vai Ser Ser Thr His 225 < 330 235 240 Phft ASO Asn Lys Glu Glu Lys Tyr Asp Tyr Thr Leu Het Glu Phe Ala 245 250 255 Gin pro Ile Tyr Asn Ser Ala Asp Lys Phe Lys Thr Glu Glu Asp tyr im 265 270 Lys Ala Glu Lys Leu Leu Ala Pro tyr Lys Lys Ala Lys Thr Leu Glu 27S 280 285 Arg ÕLn Vai Tyr Glu Leu Asn Lys Ile Gin Asp Lys Leu Pro Glu Lys 290 295 300 L«ru Lys Ala Glu Tyr Lys Lys Lys Leu Glu Asp Thr Lys Lys Ala Leu 305 310 315 320 Asp Glu Gin Vai Lys Ser Ala Ile Thr Glu Phe Gin Asn Vai Gin Pro 325 330 335 Thr Aan Glu Lys Met Thr Asp Leu Gin Asp Thr Lys tyr Vai Vai tyr 340 345 350 Glu Ser Vai. Glu Asn Asn Glu Ser mt Het Asp Thr Phe Vai Lys His 355 360 365 Pro Ile Lys Thr Gly Met Leu Asn Gly Lys Lys Tyr Het Vai Met Glu 370 375 380 Thr Thr Asn Asp Asp Tyr trp LyS Asp Phe Hat Vai Glu Gly Gin Arg 385 390 395 400 Vai Arg Thr Ile Ser Lys Asp Ala Lys Asn Asn Thr Arg Thr Ile Ile 405 410 415 Phe Pro tyx Vai Glu Gly Lys Thr Leu Tyr Asp Ala lie Vai Ly® vai 420 '425 430 His Vai Lys Thr Ile Asp Tyr Asp Gly Gin tyr His Vai Arg Ile Vai 435 440 445 A^p Lys Glu Ala Phe thr Lys Ala Asn Thr Asp Lys Ser Aan Lys Lys 4S0 455 460 Glu Gin Gin Asp Asn Ser Ala Lys Lys Glu Ala thr Pro Ala thr Pro 465 470 475 480 Ser Ly® Pm thr Pro Ser Pro Vai Glu Ly® Glu Ser Gin Ly® Gin Asp 485 490 495 Ser Gin Lys Asp Asp Asn Lys Gin Leu Pro Ser Vai Glu Lys Glu Asn 500 605 510 Asp Ala Ser Ser Glu Ser Gly Ly® Asp Lys Thr Pro Ala Thr Ly® Pro 515 520 525 Ala Lys Cly Glu Vai Glu Ser Ser Ser Thr· Thr Pro Thr Lys Vai Vai 530 535 540 Ser Thr thr Gin Asn Vai Ala Lys Pro Thr thr Alâ Ser Ser Lys Thr 54 S 550 555 560 Tfer Lys Asp Vai Vai Gin Thr Ser Ala Gly Ser Ser Glu Ala Ly® Asp 565 570 575 Ser Ala Pro Leu Gin Lys Ala Asyí Ile Lys Asn thr Asn Asp Gly His 500 585 590 245

Tfcr Gin Ser Gin Mn te Lys Mn Thr Gin Glu hm hys Ala sts %m soí

Len Pro Gin Thr Gly. Glvt Glu Ser Mn Lys Mp !fet Thr Leu 610 615 620

Het Ais Lee Leu Ala Leu Ser Ser lie Vai Ala Pha vai Lee 625 630 635

Lys Arg Lys Asm

Lys· Ser Pro Leu

Pro ftrg 640 246

REFERÊNCIAS CITADAS NA DESCRIÇÃO A presente listagem de referências citadas pela requerente é apresentada meramente por razões de conveniência para o leitor. Não faz parte da patente de invenção europeia. Embora se tenha tomado todo o cuidado durante a compilação das referências, não é possível excluir a existência de erros ou omissões, pelos quais o IEP não assume nenhuma responsabilidade.

Patentes de invenção citadas na descrição us 48984003 P [0001] us 52011503 P [0001] EP 0786519 A [0006] WO 0198499 A [0007] WO 02059148 A [0007] [0117] US 5068185 A [0069] WO 02077183 A [0117] WO 02094868 A [0117] WO 02102829 A [0117] WO 03011899 A [0117] EP 0314096 A [0146] us 60489840 B [0219] us 60520115 B [0219]

Literatura citada na descrição, para além das patentes de invenção • The Staphylococci in Human Disease. Churchill Livingstone Inc, 1997 [0003] [0083] [0087] 247 • Shinefield et al. N. Eng. J. Med., 2002, vol. 346, 491- 496 [0005] • Mamo et al. FEMS Immunology and Medicai Microbiology, 1994, vol. 10, 47-54 [0005] • Nilsson et al. J. Clin. Invest., 1998, vol. 101, 2640- 2649 [0005] • Josefsson et al. The Journal of Infectious Diseases, 2001, vol. 184, 1572-1580 [0005] • Kuroda et al. Lancet, 2001, vol. 357, 1225-1240 [0006] • Baba et al. Lancet, 2000, vol. 359, 1819-1827 [0006] • Ausubel. Current Protocols in Molecular Biology. John Wiley, 1987 [0040] [0056] [0063] [0101] • Berzofsky et al. Nature Review, 2001, vol. 1, 209-219 [0043] • Buchan et al. Molecular Immunology, 2000, vol. 37, 545- 552 [0055] • Vincent. Peptide and Protein Drug Delivery. Decker, 1990 [0056] • Sambrook et al. Molecular Cloning, A Laboratory Manual. Cold Spring Harbor Laboratory Press, 1989 [0063] • Huang et al. Biochemistry, 1987, vol. 26, 8242-8246 [0066] • Kukuruzinska et al. Ann. Rev. Biochem., 1987, vol. 56, 915-944 [0066] • Romanos et al. YEAST, 1992, vol. 8, 423-488 [0068] • Lathe. J. Molec. Biol., 1985, vol. 183, 1-12 [0072] • Sharp et al. Yeast, 1991, vol. 7, 657-678 [0072] • Schneedwind et al. EMBO, 1993, vol. 12, 4803-4811 [0075] • Mazmanian et al. Science, 2001, vol. 299, 906-909 [0075] • Vogel. Clinicai Infectious Diseases, 2000, vol. 30(3), 266-270 [0079] 248 • Vogel. Clinicai Infectious Diseases, 2000, vol. 30(3), S266-270 [0080] • Klein et al. Journal of Pharmaceutical Sciences, 2000, vol. 89, 311-321 [0080] [0113] • Rimmelzwaan et al. Vaccine, 2001, vol. 19, 1180-1187 [0080] • Kersten. Vaccine, 2003, vol. 21, 915-920 [0080] • 0'Hagen. Curr. Drug Target Infect. Disord., 2001, vol. 1, 273-286 [0080] • Vaccines. W.B. Sanders Company, 1999 [0095] • Remington's Pharmaceutical Sciences. Mack Publishing, 2000 [0095] • Modern Pharmaceutics. Mareei Dekker, Inc, 1990 [0095] • Harlow et al. Antibodies, A Laboratory Manual. Cold Spring Harbor Laboratory, 1988 [0101] • Kohler et al. Nature, 1975, vol. 256, 495-497 [0101] • Andrade et al. Genome Biology, 2003, vol. 3 (9), 47.1- 47.5 [0116] • Etz et al. PNAS USA, 2002, vol. 99, 6573-6578 [0116] • Baba et al. The Lancet, 2002, vol. 359, 1819-1827 [0116] • Kuroda et al. The Lancet, 2001, vol. 357, 1225-1240 [0116] • Mazmanian et al. Science, 2003, vol. 299, 906-909 [0116] • Mazmanian et al. Molecular Microbiology, 2001, vol. 40, 1049-1057 [0116] • Taylor et al. Mol. Microbiol., 2002, vol. 43, 1603-1614 [0116] • Livingston. Genetics, 1977, vol. 86, 73-84 [0136] • Broach et al. Cell, 1980, vol. 21, 501-508 [0136] • Carty et al. J. Ind. Micro, 1987, vol. 2, 117-121 [0136] • Beggs. Nature, 1978, vol. 275, 104-109 [0137] 249 • Kaiser, C. et al. Methods in Yeast Genetics. Cold Spring Harbor Laboratory Press, 1994, 214-215 [0138] • Schultz et al. Gene, 1987, vol. 61, 123-133 [0140] [0145] • Moehle et al. Genetics, 1987, vol. 115, 255-263 [0141] • Struhl et al. Proc. Natl. Acad. Sei., USA, 1979, vol. 76, 1035 [0141] • Ito et al. J Bacteriol., 1983, vol. 153, 163 [0142] [0147] • Jones, E. W. Tackling the Protease Problem in

Saccharomyces cerevisiae. Methods in Enzymology, 1991, vol. 194, 428-453 [0144] • Struhl et al. Proc. Natl. Acad. Sei. USA, 1979, vol. 76, 1035-1039 [0147] • Hinnen et al. Proc. Natl. Acad. Sei. USA, 1978, vol. 75, 1929-33 [0151] [0178] • Carty et al. Biotechnol. Lett., 1990, vol. 12, 879-884 [0161] • Hinnen et al. Proc. Natl. Acad. Sei. U.S.A., 1978, vol. 75, 1939-33 [0165] • Bayne et al. Gene, 1988, vol. 66 (2), 235-44 [0206]

Lisboa, 15/04/2010

Claims

1 REIVINDICAÇÕES 1. Imunogénio polipeptídico que compreende uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 1, em que o referido polipeptido confere imunidade protectora contra S. aureus e em que caso se encontrem presentes uma ou mais regiões polipeptídicas suplementares, as referidas regiões suplementares não proporcionam um terminal carboxilo que contenha os aminoácidos 609-645 da SEQ ID NO: 2.

2. Polipeptido de acordo com a reivindicação 1, em que o referido polipeptido é constituído por uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 3, ou um seu fragmento que compreende uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 1.

3. Polipeptido de acordo com a reivindicação 2, em que o referido polipeptido é constituído por uma sequência de aminoácidos que é pelo menos 94% idêntica à SEQ ID NO: 3, ou um seu fragmento que compreende uma sequência de aminoácidos que é pelo menos 94% idêntica à SEQ ID NO: 1.

4. Polipeptido de acordo com a reivindicação 3, em que o referido polipeptido é constituído por uma sequência de aminoácidos que é pelo menos 94% idêntica à SEQ ID NO: 1, à SEQ ID NO: 3 ou à SEQ ID NO: 42.

5. Polipeptido de acordo com a reivindicação 1, em que o referido polipeptido é a SEQ ID NO: 1, a SEQ ID NO: 3 ou a SEQ ID NO: 42; ou difere destas sequências por um máximo de 25 alterações de aminoácidos. 2

6. Polipeptido de acordo com a reivindicação 5, em que o referido polipeptido é a SEQ ID NO: 1, SEQ ID NO: 3 ou SEQ ID NO: 42; ou difere destas sequências por um máximo de 10 alterações de aminoácidos.

7. Polipeptido de acordo com a reivindicação 6, em que o referido polipeptido é a SEQ ID NO: 1, SEQ ID NO: 3 ou SEQ ID NO: 42; ou difere destas sequências por um máximo de 5 alterações de aminoácidos.

8. Polipeptido de acordo com a reivindicação 1, em que o referido polipeptido é a SEQ ID NO: 1, SEQ ID NO: 3 ou SEQ ID NO: 42.

9. Polipeptido de acordo com a reivindicação 1, em que o referido polipeptido é constituído pela sequência de aminoácidos seleccionada entre as SEQ ID NOs 1, 3, 7, 17, 20 ou 42 e por um máximo de 20 aminoácidos suplementares.

10. Polipeptido de acordo com a reivindicação 5, em que o referido polipeptido é constituído pela sequência de aminoácidos seleccionada entre as sequências SEQ ID NOs 7, 17 ou 20.

11. Polipeptido de acordo qualquer uma das reivindicações anteriores, ao qual lhe falta a totalidade ou a maior parte de outros polipeptidos com o qual esse polipeptido se encontra naturalmente associado. 3

12. Imunogénio constituído pelos polipeptidos de acordo com qualquer uma das reivindicações anteriores, em que o referido imunogénio é constituído pela referida sequência de aminoácidos e por uma ou várias regiões ou fracções suplementares ligadas de forma covalente à referida sequência no terminal carboxilo ou no terminal amino, em que cada região ou fracção é seleccionada independentemente entre regiões ou fracções que possuam pelo menos uma das propriedades seguintes: reforçar uma resposta imunitária, facilitar a purificação ou facilitar a estabilidade do polipeptido.

13. Composição capaz de induzir uma resposta imunitária protectora num paciente, a qual compreende uma quantidade imunologicamente eficaz do imunogénio de acordo com qualquer uma das reivindicações 1 a 12 e um veículo farmaceuticamente aceitável.

14. Composição de acordo com a reivindicação 13, em que a referida composição contém também um adjuvante.

15. Ácido nucleico que compreende um gene recombinante que compreende uma sequência nucleotídica que codifica o imunogénio polipeptídico de acordo com uma qualquer das reivindicações 1 a 10.

16. Ácido nucleico de acordo com a reivindicação 15, em que o gene recombinante não codifica uma sequência codificadora do péptido de sinal celular e não codifica uma sequência do sinal de endereçamemto para a parede celular. 4

17. Ácido nucleico de acordo com a reivindicação 16, em que o referido gene recombinante contém um ou vários codões optimizados para expressão em leveduras.

18. Ácido nucleico de acordo com a reivindicação 17, em que a referida sequência nucleotidica possui pelo menos 50% dos codões optimizados para expressão em leveduras.

19. Ácido nucleico de acordo com a reivindicação 16, em que a referida sequência nucleotidica é seleccionada entre o conjunto constituído por: SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 32, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 38, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 46, SEQ ID NO: 47, SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51, SEQ ID NO: 52 e SEQ ID NO: 53

• 20. Ácido nucleico de acordo com uma das reivindicações 15 ou 19, em que o referido ácido nucleico é um vector de expressão.

21. Célula recombinante que compreende o ácido nucleico de acordo com uma qualquer das reivindicações 15 a 20.

22. Método para a preparação de um polipeptido de S. aureus que confere imunidade protectora, o qual compreende os passos seguintes: (a) o crescimento da célula recombinante de acordo com a reivindicação 21, em condições em que seja expresso o polipeptido de acordo com qualquer uma das reivindicações 1 a 11; e 5 (b) a purificação do referido polipeptido.

23. Método de acordo com a reivindicação 22, em que a referida célula recombinante é uma célula de S. cerevisiae.

24. Imunogénio de acordo com qualquer uma das reivindicações 1 a 12, para utilização num método de tratamento terapêutico de um ser humano.

25. Imunogénio de acordo com a reivindicação 24, para conferir imunidade protectora contra S. aureus.

26. Imunogénio de acordo com a reivindicação 25, em que o referido paciente é um ser humano.

27. Imunogénio de acordo com a reivindicação 25, em que o referido paciente é tratado profilaticamente contra uma infecção causada por S. aureus.

28. Imunogénio de acordo com a reivindicação 24, para induzir uma resposta anamnéstica.

29. Imunogénio de acordo com a reivindicação 28, em que a referida resposta anamnéstica tem como resultado um aumento em pelo menos 3 vezes do titulo geométrico, comparativamente com o título previamente existente, em 3 dias.

30. Utilização de um imunogénio de acordo com qualquer uma das reivindicações 1 a 12, para a preparação de um 6 medicamento para ser utilizado num método tal como definido em qualquer uma das reivindicações 25 a 29.

31. Imunogénio de acordo com qualquer uma das reivindicações 1 a 12, em combinação com imunogénios suplementares seleccionados entre: um ou vários imunogénios suplementares de S. âureus; um ou vários imunogénios dirigidos contra um ou vários outros organismos Staphylococcus; e um ou vários imunogénios dirigidos contra outros organismos infecciosos. Lisboa 15/04/2010