BRPI0906468B1

BRPI0906468B1 - METHOD TO PRODUCE SCLAREOL

Info

Publication number: BRPI0906468B1
Application number: BRPI0906468-0A
Authority: BR
Inventors: Michel Schalk
Original assignee: Firmenich Sa
Priority date: 2008-02-15
Filing date: 2009-02-12
Publication date: 2023-06-06

Abstract

MÉTODO PARA PRODUZIR ESCLAREOL. A presente invenção fornece um método de produção de esclareol, método esse compreendendo de contatar um polipeptídeo particular tendo uma atividade de síntese de esclareol com difosfato de labdenediol (LPP). Em particular, o referido método pode ser realizado in vitro ou in vivo para produzir esclareol, um composto muito útil nos campos de perfumaria e aromatizante. A presente invenção também fornece a sequência de aminoácido do polipeptídeo usado no método. Um ácido nucléico derivado da Salvia sclarea e que codifica o polipeptídeo da invenção, um vetor de expressão, contendo o referido ácido nucléico, bem como um organismo ou uma célula hospedeira não-humana transformada para hospedar o mesmo ácido nucléico, também são partes da presente invenção.METHOD FOR PRODUCING SCLAREOL. The present invention provides a method of producing sclareol, which method comprises contacting a particular polypeptide having a sclareol synthesizing activity with labdenediol diphosphate (LPP). In particular, said method can be carried out in vitro or in vivo to produce sclareol, a very useful compound in the fields of perfumery and flavoring. The present invention also provides the amino acid sequence of the polypeptide used in the method. A nucleic acid derived from Salvia sclarea and encoding the polypeptide of the invention, an expression vector containing said nucleic acid, as well as an organism or a non-human host cell transformed to host the same nucleic acid, are also parts of this invention.

Description

technical field

(01) A presente invenção fornece um método de produção de esclareol, método esse compreendendo de contatar, no mínimo, um polipeptídio com geranil geranil pirofosfato (GGPP). Em particular, o referido método pode ser realizado in vitro ou in vivo para produzir esclareol, um composto muito útil nos campos de perfumaria e aromatizante. A presente invenção também fornece as sequências de aminoácido de um polipeptídio usado no método da invenção. Um ácido nucléico que codifica o polipeptídio da invenção e um vetor de expressão que contém o referido ácido nucléico são parte da presente invenção. Um organismo hospedeiro não-humano ou uma célula transformada a ser usada no método de produção de esclareol também é um objeto da presente invenção.(01) The present invention provides a method of producing sclareol, which method comprises contacting at least one polypeptide with geranyl geranyl pyrophosphate (GGPP). In particular, said method can be carried out in vitro or in vivo to produce sclareol, a very useful compound in the fields of perfumery and flavoring. The present invention also provides the amino acid sequences of a polypeptide used in the method of the invention. A nucleic acid encoding the polypeptide of the invention and an expression vector containing said nucleic acid are part of the present invention. A non-human host organism or a transformed cell to be used in the sclareol production method is also an object of the present invention.

state of the art

(02) Os terpenos são encontrados em muitos organismos (microorganismos, animais e plantas). Esses compostos são constituídos de cinco unidades de carbono, chamadas unidades de isopreno e são classificados pela quantidade dessas unidades presentes em sua estrutura. Dessa forma, monoterpenos, sesquiterpenos e diterpenos são terpenos contendo 10, 15 e 20 átomos de carbono, respectivamente. Diterpenos, por exemplo, são amplamente encontrados no reino das plantas e mais de 2500 estruturas de diterpeno foram descritas (Connolly e Hill, Dicionário de terpenóides, 1991, Chapman & Hall, Londres). As moléculas de terpeno foram importantes durante centenas de anos devido a suas propriedades aromatizantes e de fragrância e seus efeitos cosméticos, medicinais e antimicrobianos. Extratos de planta obtidos por diferentes meios, como destilação a vapor ou extração de solvente são usados como fonte de terpenos. As moléculas de terpeno são, muitas vezes, usadas como tal, mas em alguns casos, reações químicas são usadas para transformar os terpenos em outras moléculas de alto valor.(02) Terpenes are found in many organisms (microorganisms, animals and plants). These compounds are made up of five carbon units, called isoprene units, and are classified by the amount of these units present in their structure. Thus, monoterpenes, sesquiterpenes and diterpenes are terpenes containing 10, 15 and 20 carbon atoms, respectively. Diterpenes, for example, are widely found in the plant kingdom and over 2500 diterpene structures have been described (Connolly and Hill, Dictionary of Terpenoids, 1991, Chapman & Hall, London). Terpene molecules have been important for hundreds of years for their flavoring and fragrance properties and their cosmetic, medicinal and antimicrobial effects. Plant extracts obtained by different means such as steam distillation or solvent extraction are used as a source of terpenes. Terpene molecules are often used as such, but in some cases chemical reactions are used to transform terpenes into other high-value molecules.

(03) A produção biossintética de terpenos envolve enzimas chamadas terpeno- sintases. A síntese de um diterpeno pode ser realizada por uma enzima única ou por duas ou mais enzimas. Quando duas enzimas estão envolvidas, a primeira catalisa a síntese de um diterpeno de difosfato éster, que, por sua vez, é convertido ao produto final pela segunda enzima.(03) The biosynthetic production of terpenes involves enzymes called terpene synthases. The synthesis of a diterpene can be carried out by a single enzyme or by two or more enzymes. When two enzymes are involved, the first catalyzes the synthesis of a diterpene diphosphate ester, which, in turn, is converted to the final product by the second enzyme.

(04) Dois tipos de mecanismos de ciclização ocorrem na natureza e são relacionados com dois tipos de diterpeno-sintases, que podem ser classificados em diterpeno-sintases de classe I e classe II (Wendt e Schulz, 1998, Estrutura. 6(2):127- 33). Para alguns diterpenos, o mecanismo de ciclização é iniciado pela ionização da função de disfostato éster de GGPP, seguida pela reação de carbocation resultante com uma ligação dupla interna. As diterpeno-sintases que catalisam esse tipo de ciclização são diterpeno-sintases de classe I. O segundo modo de ciclização na biossíntese de diterpenos, catalisados por diterpeno-sintases de classe II, é iniciado pela protonação da ligação dupla terminal de GGPP e leva, após rearranjo interno e eliminação de próton, a um intermediário de diterpeno difosfato cíclico.(04) Two types of cyclization mechanisms occur in nature and are related to two types of diterpene synthases, which can be classified into class I and class II diterpene synthases (Wendt and Schulz, 1998, Structure. 6(2) :127-33). For some diterpenes, the cyclization mechanism is initiated by the ionization of the disphosphate ester function of GGPP, followed by the resulting carbocation reaction with an internal double bond. The diterpene synthases that catalyze this type of cyclization are class I diterpene synthases. The second mode of cyclization in diterpene biosynthesis, catalyzed by class II diterpene synthases, is initiated by protonation of the terminal double bond of GGPP and leads, after internal rearrangement and proton elimination, to a cyclic diterpene diphosphate intermediate.

(05) Genes e cDNAs que codificam diterpeno-sintases de cada uma das duas classes foram clonados e as enzimas recombinantes caracterizadas. A disponibilidade de genes que codificam diferentes tipos de diterpeno-sintases fornece informações sobre as estruturas primárias das enzimas. Alguns motivos de aminoácido são conservados em diterpeno-sintases e são relacionados com a protonação ou a ionização dependente da ciclização. Um motivo DDxxD (onde x representa qualquer aminoácido) é encontrado em diversas diterpeno-sintases de classe I. O referido motivo provavelmente está envolvido na ligação e na ionização da metade do difosfato. Nas sintases de classe II, um motivo DxDD conservado (onde x representa qualquer aminoácido) é encontrado, no qual o segundo resíduo de aspartato está envolvido como doador de próton.(05) Genes and cDNAs encoding diterpene synthases of each of the two classes were cloned and the recombinant enzymes characterized. The availability of genes encoding different types of diterpene synthases provides information about the primary structures of the enzymes. Some amino acid motifs are conserved in diterpene synthases and are related to cyclization-dependent protonation or ionization. A DDxxD motif (where x represents any amino acid) is found in several class I diterpene synthases. Said motif is probably involved in the binding and ionization of the diphosphate moiety. In class II synthases, a conserved DxDD motif (where x represents any amino acid) is found, in which the second aspartate residue is involved as a proton donor.

(06) O esclareol é uma molécula de diterpeno que ocorre naturalmente, extensivamente usada como material primário para a síntese de moléculas de fragrância com notas de âmbar-gris. Essas sínteses foram desenvolvidas para fornecer uma alternativa para o âmbar-gris, uma substância cerácea, secretada pelos intestinos da cachalote. O âmbar-gris é altamente apreciado por seu odor prazeroso e foi historicamente usado como um componente de perfume. Devido a seu alto preço e a elevada demanda de âmbar-gris, e particularmente devido à proteção das espécies de baleia, a síntese química de constituintes e moléculas de âmbar-gris com caráter de âmbar-gris foram desenvolvidas. Entre essas moléculas, Ambrox® (marca registrada da Firmenich SA, Suíça) é o substituto mais amplamente apreciado para o Âmbar-gris. O material primário mais amplamente usado para a síntese de Ambrox® é o diterpeno-diol esclareol.(06) Sclareol is a naturally occurring diterpene molecule, extensively used as a raw material for the synthesis of fragrance molecules with ambergris notes. These syntheses were developed to provide an alternative to ambergris, a waxy substance secreted by the intestines of the sperm whale. Ambergris is highly prized for its pleasant odor and was historically used as a perfume component. Due to its high price and high demand for ambergris, and particularly due to the protection of whale species, the chemical synthesis of ambergris constituents and molecules with an ambergris character has been developed. Among these molecules, Ambrox® (trademark of Firmenich SA, Switzerland) is the most widely appreciated substitute for Ambergris. The most widely used starting material for the synthesis of Ambrox® is the diterpene diol sclareol.

(07) Geralmente, o preço e a disponibilidade de extratos naturais de planta são dependentes da abundância, do rendimento de óleo e da origem geográfica das plantas. Além disso, a disponibilidade e a qualidade de extratos naturais são muito mais dependentes do clima e de outras condições locais, que levam à variabilidade de ano a ano, tornando o uso desses componentes na perfumaria de alta qualidade muito difícil ou mesmo impossível alguns anos. Portanto, seria uma vantagem fornecer uma fonte de esclareol, que seja menos sujeito a flutuações na disponibilidade e na qualidade. A síntese química pareceria ser uma opção evidente para a preparação do esclareol. Entretanto, dada a sua estrutura altamente complexa, um processo sintético econômico para a preparação de esclareol ainda é difícil. Uma via bioquímica que leva à síntese de esclareol seria, portanto, de grande interesse.(07) Generally, the price and availability of natural plant extracts are dependent on the abundance, oil yield and geographic origin of the plants. Furthermore, the availability and quality of natural extracts are much more dependent on climate and other local conditions, which lead to year-to-year variability, making the use of these components in high-quality perfumery very difficult or even impossible some years ago. Therefore, it would be an advantage to provide a source of sclareol that is less subject to fluctuations in availability and quality. Chemical synthesis would seem to be an obvious option for preparing sclareol. However, given its highly complex structure, an economical synthetic process for the preparation of sclareol is still difficult. A biochemical pathway leading to sclareol synthesis would therefore be of great interest.

(08) A biossíntese de terpenos nas plantas e em outros organismos foi extensivamente estudada e não é muito detalhada no presente, mas referência é feita para Dewick, Nat. Prod. Rep., 2002, 19, 181-222, que revisa o estado da técnica das vias biossintéticas de terpeno.(08) The biosynthesis of terpenes in plants and other organisms has been extensively studied and is not very detailed at present, but reference is made to Dewick, Nat. Product Rep., 2002, 19, 181-222, which reviews the prior art of terpene biosynthetic pathways.

(09) Diversas diterpeno-sintases já foram identificadas. Em particular, terpeno- sintases, que possuem uma certa porcentagem de identificação de sequência com as sequências da presente invenção, também foram encontradas nos bancos de dados de sequências. Todavia, a porcentagem de identificação entre as diterpeno- sintases conhecidas e os polipeptídios da invenção é muito baixa.(09) Several diterpene synthases have already been identified. In particular, terpene synthases, which have a certain percentage of sequence identification with the sequences of the present invention, were also found in sequence databases. However, the percentage of identification between the known diterpene synthases and the polypeptides of the invention is very low.

(010) As sintases mais próximas às LPP (Labdenediol difosfato) -sintases da invenção são duas copalil difosfato-sintases (uma da Solanum lycopersicum (BAA84918) e uma da Cucurbita maxima (AAD04293 e AAD04292)), uma copalil difosfato-sintase putativa da Scoparia dulcis (BAD91286) e uma proteína hipotética da Vitis vinifera. As sequências dessas proteínas compartilham apenas 41% de identificação com as LPP-sintases da invenção e nenhuma dessas sequências é descrita como sendo útil na produção de esclareol, e como tendo atividade de LPP- sintase.(010) The closest synthases to the LPP (Labdenediol diphosphate) synthases of the invention are two copalyl diphosphate synthases (one from Solanum lycopersicum (BAA84918) and one from Cucurbita maxima (AAD04293 and AAD04292)), a putative copalyl diphosphate synthase from Scoparia dulcis (BAD91286) and a hypothetical protein from Vitis vinifera. The sequences of these proteins share only 41% identification with the LPP synthases of the invention and none of these sequences are described as being useful in the production of sclareol, and as having LPP synthase activity.

(011) As sintases mais próximas à esclareol-sintase da invenção são uma terpenóide ciclase de função não definida (Número de acesso NCBI AAS98912) tendo 36% de identificação com o polipeptídio da invenção, uma ent-caureno-sintase de Cucumis sativus (número de acesso BAB19275) tendo 32% de identificação com o polipeptídio da invenção, uma ent-cassadieno-sintase de Oryza sativa (número de acesso ABH10734 e publicada em Xu, Wilderman, Morrone Xu, Roy, Margis- Pinheiro, Upadhyaya, Coates e Peters, Caracterização funcional da família genética semelhante à caureno-sintase do arroz, Fitoquímica 68(3), 2007, 312-326) tendo 32% de identificação com o polipeptídio da invenção e uma ent-caureno-sintase de Oryza sativa (número de acesso AAQ72559 e publicada em Margis-Pinheiro, Zhou, Zhu, Dennis e Upadhyaya, Isolamento e caracterização de arroz marcado com DS (Oryza sativa L.) Mutante anão responsivo a GA, defeituoso em uma etapa inicial da via de biossíntese de giberelinas, Plant Cell Rep., 23(12), 2005, 819-833) tendo 32% de identificação com a esclareol-sintase fornecida na presente invenção. Além disso, nenhuma dessas sequências é descrita como sendo útil na produção de esclareol e, em particular, como sendo capaz de catalisar a transformação de LPP em esclareol.(011) The synthases closest to the sclareol synthase of the invention are a terpenoid cyclase of undefined function (NCBI accession number AAS98912) having 36% identification with the polypeptide of the invention, an ent-kaurene synthase from Cucumis sativus (number accession BAB19275) having 32% identification with the polypeptide of the invention, an ent-casadiene synthase from Oryza sativa (accession number ABH10734 and published in Xu, Wilderman, Morrone Xu, Roy, Margis-Pinheiro, Upadhyaya, Coates and Peters , Functional characterization of the rice caurene synthase-like genetic family, Fitoquímica 68(3), 2007, 312-326) having 32% identification with the polypeptide of the invention and an ent-kaurene synthase from Oryza sativa (accession number AAQ72559 and published in Margis-Pinheiro, Zhou, Zhu, Dennis and Upadhyaya, Isolation and characterization of DS-tagged rice (Oryza sativa L.) GA-responsive dwarf mutant defective in an early step of the gibberellin biosynthesis pathway, Plant Cell Rep., 23(12), 2005, 819-833) having 32% identification with the sclareol synthase provided in the present invention. Furthermore, none of these sequences are described as being useful in the production of sclareol and, in particular, as being able to catalyze the transformation of LPP into sclareol.

(012) Além da diferença entre as próprias sequências, também tem de ser salientado que a estrutura e as propriedades dos produtos sintetizados pelas enzimas acima mencionadas são muito diferentes daquelas do esclareol e LPP. As propriedades do copalil difosfato são muito diferentes daquelas do labdenediol difosfato (LPP). Em particular, diferente de LPP, o copalil difosfato não é usado como um produto intermediário da biossíntese de esclareol. Ent-caureno e ent- cassadieno também são muito diferentes do esclareol. Ent-caureno é um diterpeno tricíclio, que não contém nenhum grupo funcional de álcool, diferente do esclareol, que é um diol bicíclico. Além disso, ent-caureno, que é um precursor de um hormônio de planta regulador de crescimento, está fora de uso no campo da perfumaria e aromatização, considerando-se que o esclareol é de alto interesse nesses campos técnicos, conforme explicado acima.(012) In addition to the difference between the sequences themselves, it also has to be pointed out that the structure and properties of the products synthesized by the above-mentioned enzymes are very different from those of sclareol and LPP. The properties of copalyl diphosphate are very different from those of labdenediol diphosphate (LPP). In particular, unlike LPP, copalyl diphosphate is not used as an intermediate product of sclareol biosynthesis. Ent-kaurene and ent-cassadiene are also very different from sclareol. Ent-kaurene is a tricyclic diterpene, which does not contain any alcohol functional groups, unlike sclareol, which is a bicyclic diol. Furthermore, ent-kaurene, which is a precursor of a plant growth-regulating hormone, is out of use in the field of perfumery and flavoring, considering that sclareol is of high interest in these technical fields, as explained above.

(013) Um documento do estado da técnica relaciona-se especificamente com uma esclareol-sintase (Banthorpe, Brown e Morris, Purificação parcial de farnesil pirofosfato: Drimenol ciclase e geranil geranil pirofosfato: Esclareol ciclase, usando cultura celular como uma fonte de material, Fitoquímica 31, 1992, 3391-3395). Nessa referência, uma proteína parcialmente purificada de Nicotiana glutinosa é identificada como uma esclareol-sintase, mas nenhuma indicação é fornecida, com relação à sequência de aminoácido dessa proteína, a sequência de nucleotídeo do ácido nucléico que a codifica ou o uso dessa proteína em um método para a biossíntes de esclareol in vitro ou in vivo. Além disso, esse documento não ensina ou mesmo sugere que duas proteínas (uma diterpeno-sintase de classe I e uma de classe II) estejam envolvidas na catálise da transformação de GGPP em esclareol. Ao contrário, este ensina que uma proteína única parcialmente purificada é responsável pela síntese de esclareol.(013) A prior art document specifically relates to a sclareol synthase (Banthorpe, Brown and Morris, Partial purification of farnesyl pyrophosphate: Drimenol cyclase and geranyl geranyl pyrophosphate: Sclareol cyclase, using cell culture as a material source, Phytochemistry 31, 1992, 3391-3395). In this reference, a partially purified protein from Nicotiana glutinosa is identified as a sclareol synthase, but no indication is given, regarding the amino acid sequence of this protein, the nucleotide sequence of the nucleic acid that encodes it, or the use of this protein in a method for in vitro or in vivo sclareol biosynthesis. Furthermore, this document does not teach or even suggest that two proteins (a class I and a class II diterpene synthase) are involved in catalyzing the transformation of GGPP into sclareol. Rather, it teaches that a single, partially purified protein is responsible for sclareol synthesis.

(014) A WO 2008/007031 divulga uma proteína que tem uma atividade de síntese de syn-copalil-8-ol difosfato, a sequência de nucleotídeo que codifica a referida proteína, bem como um vetor e um organismo não-humano transgênico que compreende o referido ácido nucléico. Essa syn-copalil-8-ol difosfato-sintase, entretanto, é muito diferente do polipeptídio da invenção, porque a proteína lá divulgada tem uma sequência de aminoácido apenas 44% idêntica à presente LPP- sintase, usada nos métodos da presente invenção no polipeptídio de fusão da invenção.(014) WO 2008/007031 discloses a protein having a syn-copalyl-8-ol diphosphate synthesis activity, the nucleotide sequence encoding said protein, as well as a vector and a transgenic non-human organism comprising said nucleic acid. This syn-copalyl-8-ol diphosphate synthase, however, is very different from the polypeptide of the invention, because the protein disclosed there has an amino acid sequence only 44% identical to the present LPP-synthase, used in the methods of the present invention in the polypeptide melting point of the invention.

(015) É um objetivo da presente invenção fornecer métodos para criar o esclareol em uma maneira econômica, conforme indicado acima. Conformemente, a presente invenção tem o objetivo de produzir esclareol ao mesmo tempo em que tem pouco resíduo, um processo eficiente de mais energia e recurso e ao mesmo tempo em que reduz a dependência de combustíveis fósseis. É um objetivo adicional fornecer enzimas capazes de sintetizar o esclareol, que é útil como componentes de perfumaria e/ou aroma.(015) It is an object of the present invention to provide methods for creating sclareol in an economical manner as indicated above. Accordingly, the present invention aims to produce sclareol while having little residue, a more energy and resource efficient process and at the same time reducing dependence on fossil fuels. It is an additional objective to provide enzymes capable of synthesizing sclareol, which is useful as perfumery and/or aroma components.

(016) Nenhum documento do estado da técnica divulga um processo da produção biossintética de esclareol a partir do precursor diterpeno acíclico GGPP. Abreviações Usadas bp par de base kb quilo base BSA albumina sérica bovina DMAPP dimetilalil difosfato DNA ácido desoxirribonucléico cDNA DNA complementar dT deoxi timina dNTP deoxi nucleotídeo trifosfato DTT ditiotreitol FPP farnesil pirofosfato GC cromatografia gasosa GGPP Geranil geranil pirofosfato: idi isopentenil difosfato isomerase IPP isopentenil difosfato IPTG isopropil-D-tiogalactopiranosídeo LB caldo de lisogenia LPP labdenediol difosfato MOPSO ácido sulfônico 3-(N-morfolino)-2-hidroxipropano MS espectrômetro de massa mvaK1 mevalonato quinase mvaK2 mevalonato difosfato quinase PCR reação em cadeia da polimerase 3’-/5’-RACE amplificação rápida de 3’ e 5’ de extremidades de cDNA RMCE troca de cassete mediada por recombinase RT-PCR reação em cadeia da polimerase via transcrição reversa RNA ácido ribonucléico mRNA ácido ribonucléico mensageiro RuBisCO ribulose-1,5-bifosfato carboxilase SDS-PAGE eletroforese em gel de poliacrilamida - SDS SsLPPs Salvia sclarea labdenediol difosfato-sintase(016) No prior art document discloses a process for the biosynthetic production of sclareol from the acyclic diterpene precursor GGPP. Abbreviations Used bp base pair kb kilo base BSA bovine serum albumin DMAPP dimethylallyl diphosphate DNA deoxyribonucleic acid cDNA complementary DNA dT deoxy thymine dNTP deoxy nucleotide triphosphate DTT dithiothreitol FPP farnesyl pyrophosphate GC gas chromatography GGPP Geranyl geranyl pyrophosphate: idi isopentenyl diphosphate isomerase IPP isopentenyl diphosphate IPTG isopropyl-D-thiogalactopyranoside LB lysogen broth LPP labdenediol diphosphate MOPSO sulfonic acid 3-(N-morpholino)-2-hydroxypropane MS mass spectrometer mvaK1 mevalonate kinase mvaK2 mevalonate diphosphate kinase PCR polymerase chain reaction 3'-/5'- RACE rapid amplification of 3' and 5' ends of cDNA RMCE recombinase-mediated cassette exchange RT-PCR polymerase chain reaction via reverse transcription ribonucleic acid RNA messenger ribonucleic acid mRNA RuBisCO ribulose-1,5-bisphosphate carboxylase SDS-PAGE polyacrylamide gel electrophoresis - SDS SsLPPs Salvia sclarea labdenediol diphosphate synthase

Description of the invention

(017) A presente invenção fornece um método para produzir biossinteticamente esclareol em uma maneira econômica, confiável e reprodutível.(017) The present invention provides a method to biosynthetically produce sclareol in an economical, reliable and reproducible manner.

(018) Conforme proposto no presente pedido, esclareol, GGPP, LPP e todos os outros compostos citados no presente pedido são definidos pela maneira de suas fórmulas, conforme representado na figura 1.(018) As proposed in this application, sclareol, GGPP, LPP and all other compounds mentioned in this application are defined by the manner of their formulas, as shown in figure 1.

(019) Uma “diterpeno-sintase” ou “um polipeptídio tendo uma atividade de síntese de diterpeno” é proposto para o propósito do presente pedido como um polipeptídio capaz de catalisar a síntese de uma molécula de terpeno do precursor de terpeno acíclico GGPP ou de um diterpeno de difosfato éster, como LPP, ou capaz de catalisar a síntese de um diterpeno de difosfato éster do precursor de diterpeno acíclico GGPP.(019) A "diterpene synthase" or "a polypeptide having a diterpene synthesis activity" is proposed for the purpose of the present application as a polypeptide capable of catalyzing the synthesis of a terpene molecule from the acyclic terpene precursor GGPP or from a diterpene diphosphate ester, such as LPP, or capable of catalyzing the synthesis of a diterpene diphosphate ester from the acyclic diterpene precursor GGPP.

(020) Como uma "LPP-sintase" ou como um “polipeptídio tendo uma atividade de síntese de LPP”, referimo-nos aqui a um polipeptídio capaz de catalisar a síntese de LPP começando do GGPP.(020) As an "LPP synthase" or as a "polypeptide having an LPP synthesis activity", we refer here to a polypeptide capable of catalyzing the synthesis of LPP starting from GGPP.

(021) Como uma "esclareol-sintase" ou como um “polipeptídio tendo uma atividade de síntese de esclareol”, referimo-nos aqui a um polipeptídio capaz de catalisar a síntese de esclareol começando do LPP.(021) As a "sclareol synthase" or as a "polypeptide having a sclareol synthesis activity", we refer here to a polypeptide capable of catalyzing the synthesis of sclareol starting from LPP.

(022) Como um “polipeptídio capaz de catalisar a transformação de GGPP em esclareol”, referimo-nos aqui a qualquer polipeptídio que seja capaz de catalisar a referida transformação e, em particular, polipeptídios que catalisam um mecanismo de duas etapas, durante o qual o LPP é sintetizado como produto intermediário.(022) As a “polypeptide capable of catalyzing the transformation of GGPP into sclareol”, we refer here to any polypeptide that is capable of catalyzing said transformation and, in particular, polypeptides that catalyze a two-step mechanism, during which LPP is synthesized as an intermediate product.

(023) A capacidade de um polipeptídio catalisar a síntese de um diterpeno particular (por exemplo, esclareol) e/ou de um diterpeno de difosfato éster particular (por exemplo, LPP) pode ser simplesmente confirmada pela realização do ensaio enzimático, conforme detalhado no Exemplo 3.(023) The ability of a polypeptide to catalyze the synthesis of a particular diterpene (e.g. sclareol) and/or a particular diterpene diphosphate ester (e.g. LPP) can simply be confirmed by performing the enzymatic assay as detailed in Example 3.

(024) De acordo com a presente invenção, os polipeptídios também devem incluir polipeptídios truncados, considerando-se que eles mantenham sua atividade de síntese de diterpeno, conforme definido em qualquer uma das configurações acima e que eles compartilhem, no mínimo, a porcentagem definida de identificação com o fragmento correspondente de SEQ ID NO:1 ou 2 ou de SEQ ID NO:3. Particularmente, polipeptídios truncados úteis são aqueles com uma deleção no terminal N do sinal de direcionamento de plastídeo.(024) According to the present invention, polypeptides must also include truncated polypeptides, considering that they maintain their diterpene synthesis activity, as defined in any of the above configurations and that they share, at least, the defined percentage identification with the corresponding fragment of SEQ ID NO:1 or 2 or of SEQ ID NO:3. Particularly useful truncated polypeptides are those with a deletion at the N-terminus of the plastid targeting signal.

(025) A porcentagem de identificação entre duas sequências peptídicas ou nucleotídicas é uma função da quantidade de resíduos de aminoácidos ou ácidos nucléicos que são idênticos nas duas sequências, quando um alinhamento dessas duas sequências foi gerado. Resíduos idênticos são definidos como resíduos que são os mesmos nas duas sequências em uma dada posição do alinhamento. A porcentagem de identificação de sequência, conforme usada no presente, é calculada a partir do alinhamento favorável, pegando a quantidade de resíduos idênticos entre as duas sequências, dividindo-a pela quantidade total de resíduos na sequência mais curta e multiplicando por 100. O alinhamento favorável é o alinhamento no qual a porcentagem de identificação é a maior possível. Lacunas podem ser introduzidas em uma ou ambas as sequências em uma ou mais posições do alinhamento para obter o alinhamento favorável. Essas lacunas são, então, levadas em consideração como resíduos não-idênticos para o cálculo da porcentagem de identificação de sequência.(025) The percentage of identification between two peptide or nucleotide sequences is a function of the amount of amino acid or nucleic acid residues that are identical in the two sequences, when an alignment of these two sequences was generated. Identical residues are defined as residues that are the same in the two sequences at a given position in the alignment. The sequence identification percentage, as used herein, is calculated from the favorable alignment by taking the amount of identical residues between the two sequences, dividing it by the total amount of residues in the shorter sequence and multiplying by 100. The alignment favorable is the alignment in which the identification percentage is the highest possible. Gaps can be introduced into one or both sequences at one or more positions in the alignment to obtain favorable alignment. These gaps are then taken into account as non-identical residuals for the calculation of the sequence identification percentage.

(026) O alinhamento para fins de determinação da porcentagem de identificação da sequência de aminoácido ou ácido nucléico pode ser atingido de várias maneiras, usando programas de computador e, por exemplo, programas de computador publicamente disponíveis na rede mundial. Preferivelmente, o programa BLAST (Tatiana et al, FEMS Microbiol Lett., 1999, 174:247-250, 1999) estabelecido para parâmetros padrão, disponível a partir do Centro Nacional de Informações de Biotecnologia (NCBI) em http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi, pode ser usado para obter um alinhamento favorável de sequências peptídicas ou nucleotídicas e calcular a porcentagem de identificação de sequência.(026) Alignment for purposes of determining percentage identification of the amino acid or nucleic acid sequence can be achieved in a number of ways, using computer programs and, for example, publicly available computer programs on the world wide web. Preferably, the BLAST program (Tatiana et al, FEMS Microbiol Lett., 1999, 174:247-250, 1999) set for default parameters, available from the National Center for Biotechnology Information (NCBI) at http://www. ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi, can be used to obtain a favorable alignment of peptide or nucleotide sequences and calculate the percentage of sequence identification.

(027) Um objetivo da presente invenção é, portanto, um método de produção do esclareol compreendendo contato de GGPP com, no mínimo, um polipeptídio tendo uma atividade de síntese de LPP e compreendendo uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:1 ou 2; contato do produto intermediário produzido na etapa a) com, no mínimo, um polipeptídio tendo uma atividade de síntese de esclareol e compreendendo uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:3; e opcionalmente, isolamento do esclareol produzido na etapa b).(027) An object of the present invention is therefore a method of producing sclareol comprising contacting GGPP with at least one polypeptide having an LPP synthesis activity and comprising an amino acid sequence at least 50% identical to that of SEQ ID NO: 1 or 2; contacting the intermediate product produced in step a) with at least one polypeptide having a sclareol synthesizing activity and comprising an amino acid sequence at least 50% identical to SEQ ID NO:3; and optionally, isolating the sclareol produced in step b).

(028) De acordo com uma configuração preferida, as etapas a) e b) do método de produção de esclareol são realizadas simultaneamente pelo contato do GGPP com o referido, no mínimo um, polipeptídio tendo uma atividade de síntese de LPP e com o referido, no mínimo um, polipeptídio tendo uma atividade de síntese de esclareol em conjunto.(028) According to a preferred configuration, steps a) and b) of the sclareol production method are carried out simultaneously by contacting the GGPP with said at least one polypeptide having an LPP synthesis activity and with said, at least one, polypeptide having a conjoint sclareol synthesizing activity.

(029) Para o propósito do presente pedido, dizendo que as etapas a) e b) são realizadas simultaneamente, referimo-nos que apenas uma ação é necessária para a pessoa, que quer realizar a invenção, atingir o resultado de ambas as etapas, isto é, contato do GGPP com, no mínimo, dois polipeptídios ou com, no mínimo, um polipeptídio de fusão, conforme descrito abaixo. Todavia, a produção de esclareol ainda será realizada em um mecanismo de duas etapas, conforme ilustrado pela figura 2. LPP é primeiramente sintetizado in situ a partir do GGPP pela LPP-sintase ou pela parte do polipeptídio de fusão, tendo a sequência da LPP-sintase na presença da esclareol-sintase. O LPP assim produzido é, dessa forma, contatado diretamente com a esclareol-sintase ou com a parte do polipeptídio de fusão, tendo a sequência da esclareol-sintase, enzima essa que catalisa a transformação desse precursor em esclareol tão logo este for produzido.(029) For the purpose of the present application, saying that steps a) and b) are carried out simultaneously, we mean that only one action is necessary for the person, who wants to carry out the invention, to achieve the result of both steps, i.e. that is, contacting the GGPP with at least two polypeptides or with at least one fusion polypeptide, as described below. However, sclareol production will still be carried out in a two-step mechanism, as illustrated by figure 2. LPP is first synthesized in situ from GGPP by the LPP synthase or the fusion polypeptide part, having the sequence of LPP- synthase in the presence of sclareol synthase. The LPP thus produced is, therefore, contacted directly with the sclareol synthase or with the part of the fusion polypeptide, having the sequence of the sclareol synthase, the enzyme that catalyzes the transformation of this precursor into sclareol as soon as it is produced.

(030) De acordo com uma configuração preferida, as etapas a) e b) do método de produção de esclareol são realizadas simultaneamente através do contato do GGPP com, no mínimo, um polipeptídio de fusão, capaz de catalisar a transformação de GGPP em esclareol e que compreende uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:1 ou 2 e uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:3.(030) According to a preferred configuration, steps a) and b) of the sclareol production method are carried out simultaneously by contacting the GGPP with at least one fusion polypeptide capable of catalyzing the transformation of GGPP into sclareol and comprising an amino acid sequence at least 50% identical to SEQ ID NO:1 or 2 and an amino acid sequence at least 50% identical to SEQ ID NO:3.

(031) De acordo com uma configuração preferida, o polipeptídio de fusão capaz de catalisar a transformação de GGPP em esclareol compreende a sequência de um polipeptídio tendo uma atividade de síntese de LPP e uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:1 ou 2 e a sequência de um polipeptídio, tendo uma atividade de síntese de esclareol e uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:3.(031) According to a preferred embodiment, the fusion polypeptide capable of catalyzing the transformation of GGPP into sclareol comprises the sequence of a polypeptide having an LPP synthesis activity and an amino acid sequence at least 50% identical to SEQ ID NO:1 or 2 and the sequence of a polypeptide, having sclareol synthesizing activity and an amino acid sequence at least 50% identical to SEQ ID NO:3.

(032) O método pode ser realizado in vitro, bem como in vivo, já que será explicado em detalhes posteriormente.(032) The method can be performed in vitro as well as in vivo, as it will be explained in detail later.

(033) O polipeptídio que entrará em contato com LPP in vitro pode ser obtido por extração de qualquer organismo que o expresse, usando tecnologias de extração de proteína ou enzima padrão. Se o organismo hospedeiro for um organismo unicelular ou célula que libera o polipeptídio da invenção no meio de cultura, o polipeptídio pode simplesmente ser coletado do meio de cultura, por exemplo, por centrifugação, opcionalmente seguida por etapas de lavagem e ressuspensão em soluções tampão adequadas. Se o organismo ou a célula acumular o polipeptídio em suas células, o polipeptídio pode ser obtido por ruptura ou lise das células e, ainda, extração do polipeptídio do lisado celular.(033) The polypeptide that will come into contact with LPP in vitro can be obtained by extraction from any organism that expresses it, using standard enzyme or protein extraction technologies. If the host organism is a unicellular organism or cell that releases the polypeptide of the invention into the culture medium, the polypeptide can simply be collected from the culture medium, for example, by centrifugation, optionally followed by washing steps and resuspension in suitable buffer solutions. . If the organism or cell accumulates the polypeptide in its cells, the polypeptide can be obtained by disrupting or lysing the cells and further extracting the polypeptide from the cell lysate.

(034) O polipeptídio, que tem uma atividade de síntese de esclareol e/ou o polipeptídio, que tem uma atividade de síntese de LPP, ou em uma forma isolada ou juntamente com outras proteínas, por exemplo, em um extrato de proteína crua, obtido de células ou microorganismos cultivados, podem, então, ser suspensos em uma solução tampão em pH favorável. Se adequado, sais, BSA, DTT e outros tipos de cofatores enzimáticos podem ser adicionados a fim de otimizar a atividade enzimática. Condições adequadas são descritas em mais detalhes nos Exemplos posteriormente.(034) The polypeptide, which has a sclareol-synthesizing activity and/or the polypeptide, which has an LPP-synthesizing activity, either in an isolated form or together with other proteins, e.g. in a crude protein extract, obtained from cultured cells or microorganisms, can then be suspended in a buffer solution at a favorable pH. If appropriate, salts, BSA, DTT and other types of enzyme cofactors can be added in order to optimize enzyme activity. Suitable conditions are described in more detail in the Examples later.

(035) O precursor GGPP ou LPP pode, então, ser adicionado à suspensão ou solução, que é, então, incubada em temperatura favorável, por exemplo, entre 15 e 40°C, preferivelmente entre 25 e 35°C, mais preferivelmente em 30°C. Após a incubação, o LPP ou o esclareol produzido pode ser isolado da solução incubada por procedimentos de isolamento padrão, como extração de solvente e destilação, opcionalmente após remoção dos polipeptídios da solução.(035) The GGPP or LPP precursor can then be added to the suspension or solution, which is then incubated at a favorable temperature, for example between 15 and 40°C, preferably between 25 and 35°C, more preferably at 30°C. After incubation, the LPP or sclareol produced can be isolated from the incubated solution by standard isolation procedures such as solvent extraction and distillation, optionally after removing the polypeptides from the solution.

(036) De acordo com outra configuração preferida, o método de produção de esclareol é realizado in vivo. Nesse caso, as etapas a) e b) do método acima descrito são realizadas simultaneamente e compreendem o cultivo de um organismo ou célula hospedeira não-humana, capaz de produzir GGPP e transformada para expressar, no mínimo, um polipeptídio que compreende uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:1 ou 2 e tendo uma atividade de síntese de LPP e, no mínimo, um polipeptídio que compreende uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:3 e tendo uma atividade de síntese de esclareol sob conduções que levam à produção de esclareol.(036) According to another preferred embodiment, the sclareol production method is carried out in vivo. In such a case, steps a) and b) of the method described above are carried out simultaneously and comprise the culturing of a non-human host cell or organism capable of producing GGPP and transformed to express at least one polypeptide comprising an amino acid sequence at least 50% identical to SEQ ID NO:1 or 2 and having an LPP synthesis activity, and at least a polypeptide comprising an amino acid sequence at least 50% identical to SEQ ID NO:3, and having a sclareol synthesizing activity under conditions that lead to the production of sclareol.

(037) De acordo com uma configuração mais preferida, o método ainda compreende, antes da etapa a) e b), a transformação de um organismo ou célula não-humana, capaz de produzir GGPP com, no mínimo, um ácido nucléico, que codifica um polipeptídio, que compreende uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:1 ou 2 e tendo uma atividade de síntese de LPP e com, no mínimo, um ácido nucléico, codificando um polipeptídio, que compreende uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:3 e tendo uma atividade de síntese de esclareol, de maneira que o referido organismo expresse os referidos polipeptídios.(037) According to a more preferred configuration, the method further comprises, before step a) and b), the transformation of a non-human organism or cell, capable of producing GGPP with at least one nucleic acid, which encodes a polypeptide, comprising an amino acid sequence at least 50% identical to SEQ ID NO:1 or 2 and having an LPP synthesizing activity, and having at least one nucleic acid, encoding a polypeptide, comprising a sequence of amino acid at least 50% identical to SEQ ID NO:3 and having a sclareol synthesis activity, such that said organism expresses said polypeptides.

(038) Essas configurações da invenção são particularmente vantajosas já que é possível realizar o método in vivo sem previamente isolar o polipeptídio. A reação ocorre diretamente dentro do organismo ou da célula transformada para expressar o referido polipeptídio.(038) These configurations of the invention are particularly advantageous since it is possible to carry out the method in vivo without previously isolating the polypeptide. The reaction takes place directly within the organism or cell transformed to express said polypeptide.

(039) O organismo ou célula hospedeira não-humana pode ser transformada com ambos os ácidos nucléicos ao mesmo tempo ou separadamente. Quando o organismo ou célula hospedeira não-humana é transformada com ambos os ácidos nucléicos ao mesmo tempo, esses ácidos nucléicos podem ser incorporados em um vetor único ou em diferentes vetores.(039) The non-human host cell or organism can be transformed with both nucleic acids at the same time or separately. When the non-human host cell or organism is transformed with both nucleic acids at the same time, these nucleic acids can be incorporated into a single vector or into different vectors.

(040) De acordo com uma configuração particular da invenção, no mínimo, o ácido nucléico que codifica a LPP-sintase compreende uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:4, 5 ou ao complemento da mesma. De acordo com uma configuração mais preferida, o referido ácido nucléico compreende a sequência de nucleotídeo SEQ ID NO:4, 5 ou o complemento da mesma. De acordo com uma configuração ainda mais preferida, o referido ácido nucléico consiste de SEQ ID NO:4, 5 ou o complemento da mesma.(040) According to a particular embodiment of the invention, at least the nucleic acid encoding the LPP synthase comprises a nucleotide sequence of at least 50%, preferably at least 55%, preferably at least 60 %, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:4, 5 or the complement thereof. According to a more preferred embodiment, said nucleic acid comprises the nucleotide sequence SEQ ID NO:4, 5 or the complement thereof. According to an even more preferred embodiment, said nucleic acid consists of SEQ ID NO:4, 5 or the complement thereof.

(041) De acordo com uma configuração particular da invenção, no mínimo, o ácido nucléico que codifica a esclareol-sintase compreende uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:6 ou ao complemento da mesma. De acordo com uma configuração mais preferida, o referido ácido nucléico compreende a sequência de nucleotídeo SEQ ID NO:6 ou o complemento da mesma. Em uma configuração ainda mais preferida, o referido ácido nucléico consiste de SEQ ID NO:6 ou o complemento da mesma.(041) According to a particular embodiment of the invention, at least the nucleic acid encoding sclareol synthase comprises a nucleotide sequence, at least 50%, preferably at least 55%, preferably at least 60 %, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:6 or the complement thereof. According to a more preferred embodiment, said nucleic acid comprises the nucleotide sequence SEQ ID NO:6 or the complement thereof. In an even more preferred embodiment, said nucleic acid consists of SEQ ID NO:6 or the complement thereof.

(042) Em outra configuração particular da invenção, o organismo ou célula hospedeira não-humana pode também ser transformada com, no mínimo, um ácido nucléico, que codifica um polipeptídio de fusão, capaz de catalisar a transformação de GGPP em esclareol e compreendendo uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:1 ou 2 e uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:3.(042) In another particular embodiment of the invention, the organism or non-human host cell can also be transformed with at least one nucleic acid, which encodes a fusion polypeptide, capable of catalyzing the transformation of GGPP into sclareol and comprising a amino acid sequence at least 50% identical to SEQ ID NO:1 or 2 and an amino acid sequence at least 50% identical to SEQ ID NO:3.

(043) De acordo com uma configuração preferida, o ácido nucléico que codifica um polipeptídio de fusão compreende uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:4, 5 ou ao complemento da mesma. De acordo com uma configuração mais preferida, o referido ácido nucléico compreende a sequência de nucleotídeo SEQ ID NO:4, 5 ou o complemento da mesma.(043) According to a preferred embodiment, the nucleic acid encoding a fusion polypeptide comprises a nucleotide sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 65% at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably, at least 98% identical to SEQ ID NO:4, 5 or the complement thereof. According to a more preferred embodiment, said nucleic acid comprises the nucleotide sequence SEQ ID NO:4, 5 or the complement thereof.

(044) De acordo com outra configuração preferida, o ácido nucléico que codifica um polipeptídio de fusão compreende uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:6 ou ao complemento da mesma. De acordo com uma configuração mais preferida, o referido ácido nucléico compreende a sequência de nucleotídeo SEQ ID NO:6 ou o complemento da mesma.(044) According to another preferred embodiment, the nucleic acid encoding a fusion polypeptide comprises a nucleotide sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 65% at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably, at least 98% identical to SEQ ID NO:6 or the complement thereof. According to a more preferred embodiment, said nucleic acid comprises the nucleotide sequence SEQ ID NO:6 or the complement thereof.

(045) De acordo com uma configuração ainda mais preferida, o ácido nucléico que codifica um polipeptídio de fusão consiste de SEQ ID NO:4, 5 ou o complemento da mesma e uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:6 ou ao complemento da mesma. Alternativamente, o ácido nucléico que codifica o polipeptídio de fusão consiste de SEQ ID NO:6 ou o complemento da mesma e de uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, preferivelmente, no mínimo, 95%, mais preferivelmente, no mínimo, 98% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:4, 5 ou ao complemento da mesma. Alternativamente, o ácido nucléico que codifica o polipeptídio de fusão consiste de uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, ainda mais preferivelmente, no mínimo, 95% e mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:4, 5 ou ao complemento da mesma e de uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, preferivelmente, no mínimo, 95%, mais preferivelmente, no mínimo, 98% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:6 ou ao complemento da mesma. Em uma configuração mais preferida, o ácido nucléico que codifica o polipeptídio de fusão consiste de SEQ ID NO:4, 5 ou o complemento da mesma e de SEQ ID NO:6 ou o complemento da mesma.(045) According to an even more preferred embodiment, the nucleic acid encoding a fusion polypeptide consists of SEQ ID NO: 4, 5 or the complement thereof and a nucleotide sequence at least 50%, preferably in the at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 75% 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:6 or the complement thereof. Alternatively, the nucleic acid encoding the fusion polypeptide consists of SEQ ID NO:6 or the complement thereof and a nucleotide sequence of at least 50%, preferably at least 55%, preferably at least 60 %, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, preferably at least 95%, more preferably at least 98% and even more preferably at least 98% identical to SEQ ID NO:4, 5 or the complement thereof. Alternatively, the nucleic acid encoding the fusion polypeptide consists of a nucleotide sequence of at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, even more preferably at least 95% and most preferably at least 98% identical to SEQ ID NO:4, 5 or the complement thereof and a nucleotide sequence, at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, preferably at at least 95%, more preferably at least 98%, and even more preferably at least 98% identical to SEQ ID NO:6 or the complement thereof. In a more preferred embodiment, the nucleic acid encoding the fusion polypeptide consists of SEQ ID NO:4, 5 or the complement thereof and SEQ ID NO:6 or the complement thereof.

(046) De acordo com outra configuração preferida, o ácido nucléico que codifica o polipeptídio de fusão compreende uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% idêntica e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:87. De acordo com uma configuração ainda mais preferida, o ácido nucléico que codifica o polipeptídio de fusão compreende a sequência de nucleotídeo SEQ ID NO:87. De acordo com uma configuração mais preferida, o ácido nucléico que codifica o polipeptídio de fusão consiste de SEQ ID NO:87.(046) According to another preferred embodiment, the nucleic acid encoding the fusion polypeptide comprises a nucleotide sequence at least 50%, preferably at least 55%, preferably at least 60%, preferably at at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, most preferably at least 95% identical and even more preferably at least 98% identical to SEQ ID NO:87. In an even more preferred embodiment, the nucleic acid encoding the fusion polypeptide comprises the nucleotide sequence SEQ ID NO:87. In a more preferred embodiment, the nucleic acid encoding the fusion polypeptide consists of SEQ ID NO:87.

(047) O organismo ou célula não-humana pode vantajosamente ser ainda transformada com, no mínimo, um gene que codifica um polipeptídio envolvido no metabolismo da produção de GGPP, como, por exemplo, enzimas da via do MEP, da via do MVA e/ou prenil transferases. A transformação de um organismo ou célula não-humana, capaz de produzir GGPP com uma LPP-sintase e uma esclareol- sintase, ou com um polipeptídio de fusão, conforme descrito em qualquer uma das configurações da invenção, é suficiente para a produção de esclareol. Todavia, a transformação adicional com, no mínimo, uma enzima envolvida na produção de GGPP e/ou de um precursor de GGPP, isto é, isopentenil difosfato (IPP) e dimetilalil difosfato (DMAPP), tem a vantagem de aumentar a quantidade de precursor disponível para a conversão em esclareol.(047) The non-human organism or cell can advantageously be further transformed with at least one gene encoding a polypeptide involved in the metabolism of GGPP production, such as, for example, enzymes of the MEP pathway, the MVA pathway and /or prenyl transferases. Transformation of a non-human organism or cell, capable of producing GGPP with an LPP synthase and a sclareol synthase, or with a fusion polypeptide, as described in any of the embodiments of the invention, is sufficient for the production of sclareol . However, further transformation with at least one enzyme involved in the production of GGPP and/or a GGPP precursor, i.e., isopentenyl diphosphate (IPP) and dimethylallyl diphosphate (DMAPP), has the advantage of increasing the amount of precursor available for conversion to sclareol.

(048) O organismo ou a célula deve “expressar” um polipeptídio, considerando-se que o organismo ou a célula seja transformada para hospedar um ácido nucléico que codifica o referido polipeptídio, esse ácido nucléico é transcrito para mRNA e o polipeptídio é encontrado no organismo ou célula hospedeira. O termo “expressar” abrange “expressar heterologamente” e “super-expressar”, o último referindo-se aos níveis de mRNA, polipeptídio e/ou atividade de enzima sobre e acima do que é medido em um organismo ou uma célula não-transformados. Uma descrição mais detalhada dos métodos adequados para transformar um organismo ou uma célula não-humana será descrita posteriormente na parte da especificação, que é dedicada a esses organismos ou células hospedeiros não-humanos, transformados como objetos específicos da presente invenção e nos Exemplos.(048) The organism or cell must “express” a polypeptide, considering that the organism or cell is transformed to host a nucleic acid that encodes said polypeptide, this nucleic acid is transcribed into mRNA and the polypeptide is found in the organism or host cell. The term "express" encompasses "heterologously express" and "overexpress", the latter referring to levels of mRNA, polypeptide and/or enzyme activity over and above what is measured in a non-transformed organism or cell . A more detailed description of suitable methods for transforming a non-human organism or cell will be described later in the part of the specification, which is devoted to such transformed non-human host organisms or cells as specific objects of the present invention and in the Examples.

(049) Um organismo ou célula particular deve ser “capaz de produzir GGPP”, quando este produz GGPP naturalmente ou quando não produzir GGPP naturalmente, mas é transformado para produzir GGPP, ou antes da transformação com um ácido nucléico, conforme descrito na presente ou juntamente com o referido ácido nucléico. Organismos ou células transformados para produzir uma quantidade maior de GGPP do que o organismo ou célula que ocorre naturalmente também são abrangidos pelos “organismos ou células capazes de produzir GGPP”. Métodos para transformação de organismos, por exemplo, microorganismos, de maneira que eles produzam GGPP já são conhecidos na técnica. Esses métodos podem, por exemplo, ser encontrados em Huang, Roessner, Croteau e Scott, Engenharia de Escherichia coli para a síntese de taxadieno, um intermediário importante na biossíntese de taxol, Bioorg Med Chem., 9(9), 2001,2237-2242.(049) A particular organism or cell must be “capable of producing GGPP” when it produces GGPP naturally or when it does not naturally produce GGPP but is transformed to produce GGPP, or prior to transformation with a nucleic acid as described in this or together with said nucleic acid. Organisms or cells transformed to produce a greater amount of GGPP than the naturally occurring organism or cell are also encompassed by "organisms or cells capable of producing GGPP". Methods for transforming organisms, for example microorganisms, so that they produce GGPP are known in the art. Such methods can, for example, be found in Huang, Roessner, Croteau and Scott, Engineering Escherichia coli for the synthesis of taxadiene, an important intermediate in the biosynthesis of taxol, Bioorg Med Chem., 9(9), 2001,2237- 2242.

(050) De acordo com uma configuração preferida, o organismo acumula GGPP naturalmente ou é transformado para acumular esse precursor.(050) According to a preferred embodiment, the organism accumulates GGPP naturally or is transformed to accumulate such a precursor.

(051) Para realizar a invenção in vivo, o organismo ou a célula hospedeira é cultivada sob condições que levam à produção de esclareol. Conformemente, se o hospedeiro for uma planta transgênica, condições de crescimento favorável são fornecidas, como condições de luz, água e nutriente favoráveis, por exemplo. Se o hospedeiro for um organismo unicelular, condições que levam à produção de esclareol podem incluir a adição de cofatores adequados ao meio de cultura do hospedeiro. Além disso, um meio de cultura pode ser selecionado, de maneira a maximizar a síntese de esclareol. Condições de cultura favoráveis são descritas em uma maneira mais detalhada nos seguintes Exemplos.(051) To carry out the invention in vivo, the organism or the host cell is cultivated under conditions that lead to the production of sclareol. Accordingly, if the host is a transgenic plant, favorable growth conditions are provided, such as favorable light, water and nutrient conditions, for example. If the host is a unicellular organism, conditions leading to sclareol production may include the addition of appropriate cofactors to the host's culture medium. In addition, a culture medium can be selected in order to maximize sclareol synthesis. Favorable culture conditions are described in more detail in the following Examples.

(052) Organismos hospedeiros não-humanos adequados para realizar o método da invenção in vivo podem ser quaisquer organismos multicelulares ou unicelulares não-humanos. Em uma configuração preferida, o organismo hospedeiro não- humano, usado para realizar a invenção in vivo é uma planta, um procarionte ou um fungo. Qualquer planta, procarionte ou fungo pode ser usado. Particularmente, plantas úteis são aquelas que naturalmente produzem altas quantidades de terpenos. Em uma configuração mais preferida, a planta é selecionada da família das Solanaceae, Poaceae, Brassicaceae, Fabaceae, Malvaceae, Asteraceae ou Lamiaceae. Por exemplo, a planta é selecionada dos gêneros Nicotiana, Solanum, Sorghum, Arabidopsis, Brassica (rapé), Medicago (alfalfa), Gossypium (algodão), Artemisia, Salvia e Mentha. Preferivelmente, a planta pertence às espécies de Nicotiana tabacum.(052) Non-human host organisms suitable for carrying out the method of the invention in vivo can be any non-human multicellular or unicellular organisms. In a preferred embodiment, the non-human host organism used to carry out the invention in vivo is a plant, prokaryote or fungus. Any plant, prokaryote or fungus can be used. Particularly useful plants are those that naturally produce high amounts of terpenes. In a more preferred embodiment, the plant is selected from the family of Solanaceae, Poaceae, Brassicaceae, Fabaceae, Malvaceae, Asteraceae or Lamiaceae. For example, the plant is selected from the genera Nicotiana, Solanum, Sorghum, Arabidopsis, Brassica (snuff), Medicago (alfalfa), Gossypium (cotton), Artemisia, Salvia and Mentha. Preferably, the plant belongs to the species of Nicotiana tabacum.

(053) Em uma configuração mais preferida, o organismo hospedeiro não-humano, usado para realizar a invenção in vivo é um microorganismo. Qualquer microorganismo pode ser usado, mas de acordo com uma configuração ainda mais preferida, o referido microorganismo é uma bactéria ou um fungo. Preferivelmente, o referido fungo é uma levedura. Mais preferivelmente, a referida bactéria é E. coli e a referida levedura é Saccharomyces cerevisiae.(053) In a more preferred embodiment, the non-human host organism used to carry out the invention in vivo is a microorganism. Any microorganism can be used, but according to an even more preferred embodiment, said microorganism is a bacterium or a fungus. Preferably, said fungus is a yeast. More preferably, said bacteria is E. coli and said yeast is Saccharomyces cerevisiae.

(054) Diversos desses organismos não produzem GGPP naturalmente. Para serem adequados para realizar o método da invenção, esses organismos tem de ser transformados para produzir o referido precursor. Eles podem ser transformados antes da modificação com o ácido nucléico descrito, de acordo com qualquer uma das configurações acima ou simultaneamente, conforme explicado acima.(054) Several of these organisms do not produce GGPP naturally. To be suitable for carrying out the method of the invention, these organisms have to be transformed to produce said precursor. They can be transformed prior to modification with the described nucleic acid according to any of the above configurations or simultaneously as explained above.

(055) Células eucarióticas maiores isoladas podem também ser usadas, em vez de organismos completos, como hospedeiros para realizar o método da invenção in vivo. Células eucarióticas adequadas podem ser qualquer célula não-humana, mas são preferivelmente células de planta.(055) Isolated larger eukaryotic cells can also be used, instead of whole organisms, as hosts to carry out the method of the invention in vivo. Suitable eukaryotic cells can be any non-human cell, but are preferably plant cells.

(056) De acordo com uma configuração preferida, no mínimo, um polipeptídio tendo uma atividade de síntese de LPP, usado em qualquer uma das configurações acima descritas ou codificado pelo ácido nucléico, usado em qualquer uma das configurações acima descritas compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:1 ou 2. De acordo com uma configuração mais preferida, o referido polipeptídio compreende a sequência de aminoácido SEQ ID NO:1 ou 2. Em uma configuração ainda mais preferida, o referido polipeptídio consiste de SEQ ID NO:1 ou 2.(056) According to a preferred embodiment, at least one polypeptide having an LPP synthesis activity, used in any of the above-described configurations or encoded by nucleic acid, used in any of the above-described configurations comprises an amino acid sequence at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to SEQ ID NO:1 or 2. According to a more preferred embodiment, the said polypeptide comprises amino acid sequence SEQ ID NO:1 or 2. In an even more preferred embodiment, said polypeptide comprises SEQ ID NO:1 or 2.

(057) De acordo com outra configuração preferida, no mínimo, um polipeptídio tendo uma atividade de síntese de esclareol, usado em qualquer uma das configurações acima descritas ou codificado pelo ácido nucléico, usado em qualquer uma das configurações acima descritas compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:3. De acordo com uma configuração mais preferida, o referido polipeptídio compreende a sequência de aminoácido SEQ ID NO:3. Em uma configuração ainda mais preferida, o referido polipeptídio consiste de SEQ ID NO:3.(057) According to another preferred embodiment, at least one polypeptide having a sclareol synthesizing activity, used in any of the above-described configurations or encoded by nucleic acid, used in any of the above-described configurations comprises an amino acid sequence at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to SEQ ID NO:3. According to a more preferred embodiment, said polypeptide comprises the amino acid sequence SEQ ID NO:3. In an even more preferred embodiment, said polypeptide consists of SEQ ID NO:3.

(058) De acordo com uma configuração preferida adicional, o polipeptídio de fusão, usado em qualquer uma das configurações acima descritas ou codificado pelo ácido nucléico de qualquer uma das configurações acima descritas compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:1 ou 2. De acordo com uma configuração mais preferida, o referido polipeptídio de fusão compreende a sequência de aminoácido SEQ ID NO:1 ou 2.(058) According to a further preferred embodiment, the fusion polypeptide, used in any of the above-described configurations or encoded by the nucleic acid of any of the above-described configurations, comprises an amino acid sequence of at least 55%, preferably, at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:1 or 2. According to a more preferred embodiment, said fusion polypeptide comprises the amino acid sequence SEQ ID NO:1 or 2.

(059) De acordo com outra configuração preferida, o polipeptídio de fusão, usado em qualquer uma das configurações acima descritas ou codificado pelo ácido nucléico de qualquer uma das configurações acima descritas compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:3. De acordo com uma configuração mais preferida, o referido polipeptídio de fusão compreende a sequência de aminoácido SEQ ID NO:3.(059) According to another preferred embodiment, the fusion polypeptide, used in any of the above-described configurations or encoded by the nucleic acid of any of the above-described configurations, comprises an amino acid sequence at least 55%, preferably, in the at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 85% 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:3. According to a more preferred embodiment, said fusion polypeptide comprises the amino acid sequence SEQ ID NO:3.

(060) De acordo com uma configuração ainda mais preferida, o polipeptídio de fusão, usado em qualquer uma das configurações acima descritas ou codificado pelo ácido nucléico de qualquer uma das configurações acima descritas consiste de SEQ ID NO:1 ou 2 e de uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:3. Alternativamente, este consiste de SEQ ID NO:3 e de uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:1 ou 2. Alternativamente, o polipeptídio de fusão consiste de uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:1 ou 2 e de uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:3. Em uma configuração mais preferida, o polipeptídio de fusão consiste de SEQ ID NO:1 ou 2 e de SEQ ID NO:3.(060) According to a still more preferred embodiment, the fusion polypeptide, used in any of the above-described configurations or encoded by the nucleic acid of any of the above-described configurations, consists of SEQ ID NO: 1 or 2 and a sequence amino acid at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:3. Alternatively, it consists of SEQ ID NO:3 and an amino acid sequence at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably, at least 98% identical to SEQ ID NO:1 or 2. Alternatively, the fusion polypeptide consists of an amino acid sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and further more preferably at least 98% identical to SEQ ID NO:1 or 2 and of an amino acid sequence at least 55%, preferably at least 60%, preferably at least 65%, most preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at at least 98% identical to SEQ ID NO:3. In a more preferred embodiment, the fusion polypeptide consists of SEQ ID NO:1 or 2 and SEQ ID NO:3.

(061) De acordo com outra configuração particularmente preferida, o polipeptídio de fusão, usado em qualquer uma das configurações acima descritas ou codificado pelo ácido nucléico de qualquer uma das configurações acima descritas compreende uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:88. De acordo com uma configuração mais preferida, o polipeptídio de fusão compreende a sequência de aminoácido SEQ ID NO:88. De acordo com uma configuração ainda mais preferida, o polipeptídio de fusão consiste de SEQ ID NO:88.(061) According to another particularly preferred embodiment, the fusion polypeptide, used in any of the above-described configurations or encoded by the nucleic acid of any of the above-described configurations comprises an amino acid sequence at least 50%, preferably, at least 55% preferably at least 60% preferably at least 65% preferably at least 70% preferably at least 75% preferably at least 80% preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to SEQ ID NO:88. In a more preferred embodiment, the fusion polypeptide comprises the amino acid sequence SEQ ID NO:88. According to an even more preferred embodiment, the fusion polypeptide consists of SEQ ID NO:88.

(062) De acordo com uma configuração específica adicional da invenção, o polipeptídio tendo uma atividade de síntese de LPP, conforme proposto em qualquer configuração do método da invenção, é um polipeptídio que compreende uma sequência de aminoácido, no mínimo, 50% idêntica a qualquer uma das SEQ ID NO:36 ou 39, que são formas truncadas da SEQ ID NO:1. Preferivelmente, o referido polipeptídio compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:36 a 39. De acordo com uma configuração mais preferida, o referido polipeptídio compreende de qualquer uma das SEQ ID NO:36 a 39. De acordo com uma configuração ainda mais preferida, o referido polipeptídio consiste de qualquer uma das SEQ ID NO:36 a 39.(062) According to a further specific embodiment of the invention, the polypeptide having an LPP synthesis activity, as proposed in any embodiment of the method of the invention, is a polypeptide comprising an amino acid sequence at least 50% identical to any of SEQ ID NO:36 or 39, which are truncated forms of SEQ ID NO:1. Preferably, said polypeptide comprises an amino acid sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to any one of SEQ ID NO: 36 to 39. According to a more preferred embodiment, said polypeptide comprises any one of SEQ ID NO:36 to 39. According to an even more preferred embodiment, said polypeptide comprises any one of SEQ ID NO:36 to 39.

(063) De acordo com outra configuração específica da invenção, o polipeptídio tendo uma atividade de síntese de esclareol, conforme proposto em qualquer configuração do método da invenção, é um polipeptídio que compreende uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:74, que é uma forma truncada da SEQ ID NO:3. Preferivelmente, o referido polipeptídio compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:74. De acordo com uma configuração mais preferida, o referido polipeptídio compreende a SEQ ID NO:74. De acordo com uma configuração ainda mais preferida, o referido polipeptídio consiste da SEQ ID NO:74.(063) According to another specific embodiment of the invention, the polypeptide having a sclareol synthesis activity, as proposed in any embodiment of the method of the invention, is a polypeptide comprising an amino acid sequence at least 50% identical to SEQ ID NO:74, which is a truncated form of SEQ ID NO:3. Preferably, said polypeptide comprises an amino acid sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:74. According to a more preferred embodiment, said polypeptide comprises SEQ ID NO:74. According to an even more preferred embodiment, said polypeptide consists of SEQ ID NO:74.

(064) De acordo com outra configuração particularmente preferida, o polipeptídio de fusão, usado em qualquer uma das configurações acima descritas ou codificado pelo ácido nucléico de qualquer uma das configurações acima descritas compreende uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:36 a 39. Em uma configuração ainda mais preferida, este compreende qualquer uma das SEQ ID NO:36 a 39.(064) According to another particularly preferred embodiment, the fusion polypeptide, used in any of the above-described configurations or encoded by the nucleic acid of any of the above-described configurations, comprises an amino acid sequence at least 50%, preferably, at least 55% preferably at least 60% preferably at least 65% preferably at least 70% preferably at least 75% preferably at least 80% preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to any one of SEQ ID NOs:36 to 39. In an even more preferred embodiment, this comprises any one of SEQ ID NOs: 36 to 39.

(065) De acordo com outra configuração particularmente preferida, o polipeptídio de fusão, usado em qualquer uma das configurações acima descritas ou codificado pelo ácido nucléico de qualquer uma das configurações acima descritas compreende uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:74. Em uma configuração ainda mais preferida, este compreende a SEQ ID NO:74.(065) According to another particularly preferred embodiment, the fusion polypeptide, used in any of the above-described configurations or encoded by the nucleic acid of any of the above-described configurations comprises an amino acid sequence at least 50%, preferably, at least 55% preferably at least 60% preferably at least 65% preferably at least 70% preferably at least 75% preferably at least 80% preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to SEQ ID NO:74. In an even more preferred embodiment, this comprises SEQ ID NO:74.

(066) Em uma configuração ainda mais preferida, o polipeptídio de fusão, usado em qualquer uma das configurações acima descritas ou codificado pelo ácido nucléico de qualquer uma das configurações acima descritas consiste de qualquer uma das SEQ ID NO:36 a 39 e de uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:74. Alternativamente, o polipeptídio de fusão, usado em qualquer uma das configurações acima descritas ou codificado pelo ácido nucléico de qualquer uma das configurações acima descritas consiste da SEQ ID NO:74 e de uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:36 a 39. Alternativamente, o polipeptídio de fusão consiste de uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:36 a 39 e de uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:77. Em uma configuração mais preferida, o polipeptídio de fusão, usado em qualquer uma das configurações acima descritas ou codificado pelo ácido nucléico de qualquer uma das configurações acima descritas consiste de qualquer uma das SEQ ID NO:36 a 39 e da SEQ ID NO:74.(066) In an even more preferred embodiment, the fusion polypeptide, used in any of the above-described configurations or encoded by the nucleic acid of any of the above-described configurations, consists of any one of SEQ ID NO:36 to 39 and a amino acid sequence, at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:74. Alternatively, the fusion polypeptide, used in any of the above-described configurations or encoded by the nucleic acid of any of the above-described configurations, consists of SEQ ID NO:74 and an amino acid sequence, at least 50%, preferably, in the at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 75% 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to any one of SEQ ID NOs: 36 to 39. Alternatively, the fusion polypeptide consists of an amino acid sequence at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75% , preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to any one of SEQ IDs NO:36 to 39 and of an amino acid sequence, at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:77. In a more preferred embodiment, the fusion polypeptide used in any of the above-described configurations or encoded by the nucleic acid of any of the above-described configurations consists of any one of SEQ ID NO:36 to 39 and SEQ ID NO:74 .

(067) De acordo com uma configuração adicional, o ácido nucléico que codifica uma LPP-sintase, usado em qualquer uma das configurações acima descritas compreende uma sequência de nucleotídeo, no mínimo, 50% idêntica a qualquer uma das SEQ ID NO:28 a 31, que são formas truncadas da SEQ ID NO:4 ou ao complemento da mesma. Preferivelmente, o referido ácido nucléico compreende uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:28 a 31 ou ao complemento das mesmas. De acordo com uma configuração mais preferida, o referido ácido nucléico compreende qualquer uma das SEQ ID NO:28 a 31 ou o complemento das mesmas. De acordo com uma configuração ainda mais preferida, o ácido nucléico consiste de qualquer uma das SEQ ID NO:28 a 31 ou do complemento das mesmas.(067) According to an additional embodiment, the nucleic acid encoding an LPP synthase, used in any of the configurations described above, comprises a nucleotide sequence at least 50% identical to any one of SEQ ID NO:28 to 31, which are truncated forms of SEQ ID NO:4 or the complement thereof. Preferably, said nucleic acid comprises a nucleotide sequence at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and most preferably at least 98% identical to any one of SEQ ID NO: 28 to 31 or their complement. According to a more preferred embodiment, said nucleic acid comprises any one of SEQ ID NOs: 28 to 31 or the complement thereof. In an even more preferred embodiment, the nucleic acid consists of any one of SEQ ID NOs: 28 to 31 or the complement thereof.

(068) De acordo com outra configuração específica da invenção, o ácido nucléico que codifica uma esclareol-sintase, usado em qualquer uma das configurações acima descritas compreende uma sequência de nucleotídeo, no mínimo, 50% idêntica à SEQ ID NO:73, que é uma forma truncada da SEQ ID NO:6 ou ao complemento da mesma. Preferivelmente, o referido ácido nucléico compreende uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:73 ou ao complemento da mesma. De acordo com uma configuração mais preferida, o referido ácido nucléico compreende a SEQ ID NO:73 ou o complemento da mesma. De acordo com uma configuração ainda mais preferida, o ácido nucléico consiste da SEQ ID NO:73 ou do complemento da mesma.(068) According to another specific embodiment of the invention, the nucleic acid encoding a sclareol synthase, used in any of the configurations described above, comprises a nucleotide sequence at least 50% identical to SEQ ID NO:73, which is a truncated form of SEQ ID NO:6 or the complement thereof. Preferably, said nucleic acid comprises a nucleotide sequence at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and most preferably at least 98% identical to SEQ ID NO:73 or complement of it. According to a more preferred embodiment, said nucleic acid comprises SEQ ID NO:73 or the complement thereof. In an even more preferred embodiment, the nucleic acid consists of SEQ ID NO:73 or the complement thereof.

(069) De acordo com outra configuração específica, o ácido nucléico, que codifica um polipeptídio de fusão, conforme usado em qualquer uma das configurações acima descritas compreende uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:28 a 31 ou ao complemento das mesmas. Em uma configuração ainda mais preferida, este compreende a sequência de nucleotídeo de qualquer uma das SEQ ID NO:28 a 31 ou ao complemento das mesmas.(069) According to another specific embodiment, the nucleic acid encoding a fusion polypeptide as used in any of the above-described embodiments comprises a nucleotide sequence of at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably, at least 90%, more preferably at least 95% and even more preferably at least 98% identical to any one of SEQ ID NOs: 28 to 31 or the complement thereof. In an even more preferred embodiment, this comprises the nucleotide sequence of any one of SEQ ID NOs: 28 to 31 or the complement thereof.

(070) De acordo com outra configuração específica, o ácido nucléico, que codifica um polipeptídio de fusão, conforme usado em qualquer uma das configurações acima descritas compreende uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:73 ou o complemento da mesma. Em uma configuração ainda mais preferida, este compreende a sequência de nucleotídeo de SEQ ID NO:73 ou ao complemento da mesma.(070) According to another specific embodiment, the nucleic acid encoding a fusion polypeptide as used in any of the above-described embodiments comprises a nucleotide sequence of at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably, at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:73 or the complement thereof. In an even more preferred embodiment, this comprises the nucleotide sequence of SEQ ID NO:73 or the complement thereof.

(071) Em uma configuração ainda mais preferida, o ácido nucléico que codifica um polipeptídio de fusão, conforme usado em qualquer uma das configurações acima descritas consiste de qualquer uma das SEQ ID NO:28 a 31 ou do complemento das mesmas e de uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:73 ou ao complemento da mesma. Alternativamente, o ácido nucléico que codifica um polipeptídio de fusão, conforme usado em qualquer uma das configurações acima descritas consiste de qualquer uma das SEQ ID NO:73 a 50% ou do complemento das mesmas e de uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:28 a 31 ou ao complemento das mesmas. Alternativamente, o ácido nucléico que codifica o polipeptídio de fusão consiste de uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, ainda mais preferivelmente, no mínimo, 95%, e mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:28 a 31 ou ao complemento das mesmas e de uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:73 ou ao complemento da mesma. Em uma configuração mais preferida, o ácido nucléico que codifica o polipeptídio de fusão, conforme usado em qualquer uma das configurações acima descritas, consiste de qualquer uma das SEQ ID NO:28 a 31 ou do complemento das mesmas e da SEQ ID NO:73 ou do complemento da mesma.(071) In an even more preferred embodiment, the nucleic acid encoding a fusion polypeptide as used in any of the above-described embodiments consists of any one of SEQ ID NOs: 28 to 31 or the complement thereof and a sequence of nucleotide at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to SEQ ID NO:73 or complement of it. Alternatively, the nucleic acid encoding a fusion polypeptide, as used in any of the above-described configurations, consists of any one of SEQ ID NO:73 at 50% or the complement thereof and a nucleotide sequence of at least 55 %, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, preferably at least 95% and even more preferably at least 98% identical to any one of SEQ ID NOs: 28 to 31 or the complement thereof. Alternatively, the nucleic acid encoding the fusion polypeptide consists of a nucleotide sequence of at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, even more preferably at least 95%, and more preferably at least 98% identical to any one of SEQ ID NOs: 28 to 31 or the complement thereof and a nucleotide sequence, at least 50%, preferably at least 55%, preferably at least 55% 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90% more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:73 or the complement thereof. In a more preferred embodiment, the nucleic acid encoding the fusion polypeptide, as used in any of the above-described embodiments, consists of any one of SEQ ID NO:28 to 31 or the complement thereof and SEQ ID NO:73 or its complement.

(072) De acordo com outra configuração preferida, o polipeptídio ou o ácido nucléico usado no método de qualquer uma das configurações acima é derivado da Salvia sclarea.(072) According to another preferred embodiment, the polypeptide or nucleic acid used in the method of any of the above embodiments is derived from Salvia sclarea.

(073) Uma ferramenta importante para realizar o método da invenção é o próprio polipeptídio de fusão. Um polipeptídio de fusão, capaz de catalisar a transformação de GGPP em esclareol e compreendendo uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:1 ou 2 e uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:3 é, portanto, outro objeto da presente invenção.(073) An important tool for carrying out the method of the invention is the fusion polypeptide itself. A fusion polypeptide, capable of catalyzing the transformation of GGPP to sclareol and comprising an amino acid sequence at least 50% identical to SEQ ID NO:1 or 2 and an amino acid sequence at least 50% identical to SEQ ID NO:3 is therefore another object of the present invention.

(074) De acordo com uma configuração preferida, o polipeptídio de fusão compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:1 ou 2. De acordo com uma configuração mais preferida, o polipeptídio de fusão compreende a sequência de aminoácido SEQ ID NO:1 ou 2.(074) According to a preferred embodiment, the fusion polypeptide comprises an amino acid sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:1 or 2. In a more preferred embodiment, the fusion polypeptide comprises the amino acid sequence SEQ ID NO:1 or 2.

(075) De acordo com outra configuração preferida, o polipeptídio de fusão compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:3. De acordo com uma configuração mais preferida, o referido polipeptídio de fusão compreende a sequência de aminoácido SEQ ID NO:3.(075) According to another preferred embodiment, the fusion polypeptide comprises an amino acid sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:3. According to a more preferred embodiment, said fusion polypeptide comprises the amino acid sequence SEQ ID NO:3.

(076) Em uma configuração ainda mais preferida, o polipeptídio de fusão consiste da SEQ ID NO:1 ou 2 e de uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:3. Alternativamente, o polipeptídio de fusão consiste da SEQ ID NO:3 e de uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:1 ou 2. Em uma configuração mais preferida, o polipeptídio de fusão consiste da SEQ ID NO:1 ou 2 e da SEQ ID NO:3.(076) In an even more preferred embodiment, the fusion polypeptide consists of SEQ ID NO:1 or 2 and an amino acid sequence at least 50%, preferably at least 55%, preferably at least 60 %, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:3. Alternatively, the fusion polypeptide consists of SEQ ID NO:3 and an amino acid sequence, at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and further more preferably at least 98% identical to SEQ ID NO:1 or 2. In a more preferred embodiment, the fusion polypeptide consists of SEQ ID NO:1 or 2 and SEQ ID NO:3.

(077) De acordo com uma configuração particular da invenção, o polipeptídio de fusão compreende a sequência de uma forma truncada da SEQ ID NO:1, como SEQ ID NO:36 a 39 e/ou a sequência de uma forma truncada da SEQ ID NO:3, como SEQ ID NO:74.(077) According to a particular embodiment of the invention, the fusion polypeptide comprises the sequence of a truncated form of SEQ ID NO:1, such as SEQ ID NO:36 to 39 and/or the sequence of a truncated form of SEQ ID NO:3, as SEQ ID NO:74.

(078) Portanto, de acordo com uma configuração particular da invenção, o polipeptídio de fusão compreende uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:36 a 39. Em uma configuração ainda mais preferida, este compreende qualquer uma das SEQ ID NO:36 a 39.(078) Therefore, according to a particular embodiment of the invention, the fusion polypeptide comprises an amino acid sequence of at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 60% 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 90% 95% and even more preferably at least 98% identical to any one of SEQ ID NOs:36 to 39. In an even more preferred embodiment, it comprises any one of SEQ ID NOs:36 to 39.

(079) De acordo com outra configuração específica, o polipeptídio de fusão compreende uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:74. Em uma configuração ainda mais preferida, este compreende a SEQ ID NO:74.(079) According to another specific embodiment, the fusion polypeptide comprises an amino acid sequence at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and further more preferably at least 98% identical to SEQ ID NO:74. In an even more preferred embodiment, this comprises SEQ ID NO:74.

(080) Em uma configuração ainda mais preferida, o polipeptídio de fusão consiste de qualquer uma das SEQ ID NO:36 a 39 e de uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:74. Alternativamente, o polipeptídio de fusão consiste da SEQ ID NO:74 e de uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:36 a 39. Em uma configuração mais preferida, o polipeptídio de fusão consiste de qualquer uma das SEQ ID NO:36 a 39 e da SEQ ID NO:74.(080) In an even more preferred embodiment, the fusion polypeptide consists of any one of SEQ ID NO: 36 to 39 and an amino acid sequence of at least 50%, preferably at least 55%, preferably at least 50% at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 85% 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:74. Alternatively, the fusion polypeptide consists of SEQ ID NO:74 and an amino acid sequence, at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and further more preferably at least 98% identical to any one of SEQ ID NOs:36 to 39. In a more preferred embodiment, the fusion polypeptide consists of any one of SEQ ID NOs:36 to 39 and SEQ ID NO:74 .

(081) De acordo com outra configuração particularmente preferida, o polipeptídio de fusão da invenção compreende uma sequência de aminoácido, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, ainda mais preferivelmente, no mínimo, 95% e mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:88. De acordo com uma configuração mais preferida, o polipeptídio de fusão compreende a sequência de aminoácido SEQ ID NO:88. De acordo com uma configuração ainda mais preferida, o polipeptídio de fusão consiste da SEQ ID NO:88.(081) According to another particularly preferred embodiment, the fusion polypeptide of the invention comprises an amino acid sequence of at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 60% 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, even more preferably at least 90% 95% and more preferably at least 98% identical to SEQ ID NO:88. In a more preferred embodiment, the fusion polypeptide comprises the amino acid sequence SEQ ID NO:88. In an even more preferred embodiment, the fusion polypeptide consists of SEQ ID NO:88.

(082) Conforme usado no presente, o polipeptídio é proposto como um polipeptídio ou fragmento de peptídeo que inclui as sequências de aminoácidos aqui identificadas, bem como polipeptídios truncados ou variantes, considerando-se que eles mantenham sua atividade, conforme definido acima e que compartilhem, no mínimo, a porcentagem definida de identificação com o fragmento correspondente da SEQ ID NO:1, 2 ou 3.(082) As used herein, the polypeptide is proposed as a polypeptide or peptide fragment that includes the amino acid sequences identified herein, as well as truncated polypeptides or variants, provided that they retain their activity as defined above and that they share , at a minimum, the defined percentage of identification with the corresponding fragment of SEQ ID NO:1, 2 or 3.

(083) Exemplos de polipeptídios variantes são proteínas que ocorrem naturalmente, que resultam de eventos de combinação de mRNA alternativos ou formam a divisão proteolítica dos polipeptídios aqui descritos. Variações atribuíveis à proteólise incluem, por exemplo, diferenças nos terminais N ou C mediante a expressão em tipos diferentes de células hospedeiras, devido à remoção proteolítica de um ou mais aminoácidos terminais dos polipeptídios da invenção. Polipeptídios codificados por um ácido nucléico, obtido por mutação natural ou artificial de um ácido nucléico da invenção, conforme descrito posteriormente, também são abrangidos pela invenção.(083) Examples of variant polypeptides are naturally occurring proteins that result from alternative mRNA combination events or form proteolytic cleavage of the polypeptides described herein. Variations attributable to proteolysis include, for example, differences at the N- or C-terminus upon expression in different types of host cells, due to proteolytic removal of one or more terminal amino acids from polypeptides of the invention. Polypeptides encoded by a nucleic acid, obtained by natural or artificial mutation of a nucleic acid of the invention, as described later, are also covered by the invention.

(084) Conforme mencionado acima, o ácido nucléico que codifica o polipeptídio de fusão da invenção é uma ferramenta útil para modificar os organismos ou células hospedeiros não-humanos, propostos para serem usados quando o método for realizado in vivo.(084) As mentioned above, the nucleic acid encoding the fusion polypeptide of the invention is a useful tool for modifying non-human host organisms or cells, proposed to be used when the method is carried out in vivo.

(085) Um ácido nucléico que codifica um polipeptídio de fusão, de acordo com qualquer uma das configurações acima descritas, portanto, também é um objeto da presente invenção.(085) A nucleic acid encoding a fusion polypeptide, according to any of the configurations described above, therefore, is also an object of the present invention.

(086) De acordo com uma configuração preferida, o ácido nucléico compreende uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:4, 5 ou ao complemento da mesma. De acordo com uma configuração mais preferida, o ácido nucléico compreende a sequência de nucleotídeo SEQ ID NO:4, 5 ou o complemento da mesma.(086) According to a preferred embodiment, the nucleic acid comprises a nucleotide sequence at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:4, 5 or the complement thereof. In a more preferred embodiment, the nucleic acid comprises the nucleotide sequence SEQ ID NO:4, 5 or the complement thereof.

(087) De acordo com outra configuração preferida, o ácido nucléico compreende uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:6 ou ao complemento da mesma. De acordo com uma configuração mais preferida, o referido polipeptídio de fusão compreende a sequência de aminoácido SEQ ID NO:6 ou o complemento da mesma.(087) According to another preferred embodiment, the nucleic acid comprises a nucleotide sequence at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:6 or the complement thereof. According to a more preferred embodiment, said fusion polypeptide comprises the amino acid sequence SEQ ID NO:6 or the complement thereof.

(088) Em uma configuração ainda mais preferida, o ácido nucléico consiste da SEQ ID NO:4, 5 ou o complemento da mesma e de uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:6 ou ao complemento da mesma. Alternativamente, o ácido nucléico consiste da SEQ ID NO:6 ou do complemento da mesma e de uma sequência de nucleotídeo, no mínimo, 55%, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, preferivelmente, no mínimo, 95%, mais preferivelmente, no mínimo, e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:4, 5 ou ao complemento da mesma. Alternativamente, o ácido nucléico consiste de uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95%, e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:4, 5 ou ao complemento da mesma e de uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:6 ou ao complemento da mesma. Em uma configuração mais preferida, o ácido nucléico consiste da SEQ ID NO:4, 5 ou do complemento da mesma e da SEQ ID NO:6 ou do complemento da mesma.(088) In an even more preferred embodiment, the nucleic acid consists of SEQ ID NO:4, 5 or the complement thereof and a nucleotide sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at at least 95% and even more preferably at least 98% identical to SEQ ID NO:6 or the complement thereof. Alternatively, the nucleic acid consists of SEQ ID NO:6 or the complement thereof and a nucleotide sequence of at least 55%, at least 60%, preferably at least 65%, preferably at least 70 %, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, preferably at least 95%, more preferably at least, and further more preferably at least 98% identical to SEQ ID NO:4, 5 or the complement thereof. Alternatively, the nucleic acid consists of a nucleotide sequence at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to SEQ ID NO:4 , 5 or the complement thereof and a nucleotide sequence, at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75 %, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO: 6 or its complement. In a more preferred embodiment, the nucleic acid consists of SEQ ID NO:4, 5 or the complement thereof and SEQ ID NO:6 or the complement thereof.

(089) Particularmente, ácidos nucléicos úteis são aqueles que codificam polipeptídios de fusão, compreendendo formas truncadas da SEQ ID NO:1 e/ou 3. Portanto, ácido nucléico que compreende uma forma truncada da SEQ ID NO:4, como SEQ ID NO:28 a 31 ou o complemento das mesmas e/ou que compreende uma forma truncada da SEQ ID NO:6, como SEQ ID NO:73, ou o complemento da mesma são configurações particularmente úteis da invenção.(089) Particularly useful nucleic acids are those encoding fusion polypeptides, comprising truncated forms of SEQ ID NO:1 and/or 3. Therefore, nucleic acid comprising a truncated form of SEQ ID NO:4, such as SEQ ID NO :28 to 31 or the complement thereof and/or comprising a truncated form of SEQ ID NO:6, such as SEQ ID NO:73, or the complement thereof are particularly useful embodiments of the invention.

(090) Portanto, de acordo com outra configuração específica, o ácido nucléico compreende uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:28 a 31 ou do complemento das mesmas. Em uma configuração ainda mais preferida, este compreende a sequência de nucleotídeo de qualquer uma das SEQ ID NO:28 a 31 ou o complemento das mesmas.(090) Therefore, according to another specific configuration, the nucleic acid comprises a nucleotide sequence at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65% preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to any one of SEQ ID NOs: 28 to 31 or the complement thereof. In an even more preferred embodiment, this comprises the nucleotide sequence of any one of SEQ ID NOs: 28 to 31 or the complement thereof.

(091) De acordo com outra configuração específica, o ácido nucléico compreende uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:73 ou ao complemento da mesma. Em uma configuração ainda mais preferida, este compreende a sequência de nucleotídeo da SEQ ID NO:73 ou o complemento da mesma.(091) According to another specific embodiment, the nucleic acid comprises a nucleotide sequence at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:73 or the complement thereof. In an even more preferred embodiment, this comprises the nucleotide sequence of SEQ ID NO:73 or the complement thereof.

(092) Em uma configuração ainda mais preferida, o ácido nucléico consiste de qualquer uma das SEQ ID NO:28 a 31 ou do complemento das mesmas e de uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95%, e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:73 ou ao complemento da mesma. Alternativamente, o ácido nucléico consiste da SEQ ID NO:73 ou do complemento da mesma e de uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95%, e ainda mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:28 a 31 ou ao complemento das mesmas. Em uma configuração mais preferida, o ácido nucléico consiste de qualquer uma das SEQ ID NO:28 a 31 ou do complemento das mesmas e da SEQ ID NO:73 ou do complemento da mesma.(092) In an even more preferred embodiment, the nucleic acid consists of any one of SEQ ID NO: 28 to 31 or the complement thereof and a nucleotide sequence of at least 50%, preferably at least 55% preferably at least 60% preferably at least 65% preferably at least 70% preferably at least 75% preferably at least 80% preferably at least 85% preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to SEQ ID NO:73 or the complement thereof. Alternatively, the nucleic acid consists of SEQ ID NO:73 or the complement thereof and a nucleotide sequence at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 60% 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 90% 95%, and even more preferably at least 98%, identical to any one of SEQ ID NOs: 28 to 31 or the complement thereof. In a more preferred embodiment, the nucleic acid consists of any one of SEQ ID NO:28 to 31 or the complement thereof and SEQ ID NO:73 or the complement thereof.

(093) De acordo com outra configuração particularmente preferida, o ácido nucléico compreende uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:87. De acordo com uma configuração mais preferida, o ácido nucléico compreende a sequência de nucleotídeo SEQ ID NO:87. De acordo com uma configuração ainda mais preferida, o ácido nucléico consiste da SEQ ID NO:87.(093) According to another particularly preferred embodiment, the nucleic acid comprises a nucleotide sequence at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and further more preferably at least 98% identical to SEQ ID NO:87. In a more preferred embodiment, the nucleic acid comprises the nucleotide sequence SEQ ID NO:87. According to an even more preferred embodiment, the nucleic acid consists of SEQ ID NO:87.

(094) O ácido nucléico da invenção pode ser definido como incluindo polímeros de desoxirribonucleotídeo ou ribonucleotídeo na forma com filamento simples ou duplo (DNA e/ou RNA). O termo “sequência de nucleotídeo” deve também ser compreendido como incluindo uma molécula de polinucleotídeo ou uma molécula de oligonucleotídeo na forma de um fragmento separado ou como um componente de um ácido nucléico maior. Ácidos nucléicos da invenção também incluem certas sequências de nucleotídeo isoladas, incluindo aquelas que estão substancialmente livres de conter material endógeno. O ácido nucléico da invenção pode ser truncado, considerando-se que este codifique um polipeptídio abrangido pela presente invenção, conforme descrito acima.(094) The nucleic acid of the invention can be defined as including deoxyribonucleotide or ribonucleotide polymers in single or double stranded form (DNA and/or RNA). The term "nucleotide sequence" is also to be understood to include a polynucleotide molecule or an oligonucleotide molecule in the form of a separate fragment or as a component of a larger nucleic acid. Nucleic acids of the invention also include certain isolated nucleotide sequences, including those that are substantially free of containing endogenous material. The nucleic acid of the invention may be truncated, provided it encodes a polypeptide encompassed by the present invention, as described above.

(095) Os ácidos nucléicos, que compreendem uma sequência obtida pela mutação da SEQ ID NO:4, 5 ou do complemento da mesma e/ou uma sequência obtida pela mutação da SEQ ID NO:6 ou do complemento da mesma, também são abrangidos pela invenção, considerando-se que as sequências que eles compreendem compartilhem, no mínimo, a porcentagem definida da identificação com os fragmentos correspondentes da SEQ ID NO: 4, 5 ou 6 ou com o complemento das mesmas e considerando-se que eles codifiquem um polipeptídio de fusão, capaz de catalisar a transformação do GGPP em esclareol conforme definido acima. Mutações podem ser qualquer tipo de mutações desses ácidos nucléicos, como mutações de ponto, mutações de deleção, mutações de inserção e/ou mutações de troca de estrutura. Um ácido nucléico variante pode ser preparado a fim de adaptar sua sequência de nucleotídeo a um sistema de expressão específico. Por exemplo, os sistemas de expressão bacteriana são conhecidos por expressar mais eficazmente os polipeptídios se os aminoácidos forem codificados por um códon preferido. Devido à degeneração do código genético, onde mais de um códon pode codificar o mesmo aminoácido, múltiplas sequências de DNA podem codificar o mesmo polipeptídio, todas essas sequênicas de DNA sendo abrangidas na invenção.(095) Nucleic acids, which comprise a sequence obtained by mutating SEQ ID NO:4, 5 or the complement thereof and/or a sequence obtained by mutating SEQ ID NO:6 or the complement thereof, are also covered by the invention, provided that the sequences they comprise share at least the defined percentage of identification with the corresponding fragments of SEQ ID NO: 4, 5 or 6 or their complement, and provided that they encode a fusion polypeptide, capable of catalyzing the transformation of GGPP to sclareol as defined above. Mutations can be any type of mutations of these nucleic acids, such as point mutations, deletion mutations, insertion mutations and/or frameshift mutations. A variant nucleic acid can be prepared in order to adapt its nucleotide sequence to a specific expression system. For example, bacterial expression systems are known to more efficiently express polypeptides if the amino acids are encoded by a preferred codon. Due to the degeneracy of the genetic code, where more than one codon can encode the same amino acid, multiple DNA sequences can encode the same polypeptide, all of these DNA sequences being covered by the invention.

(096) Outra ferramenta importante para a transformação de organismos ou células hospedeiros adequados para realizar o método da invenção in vivo é um vetor de expressão, compreendendo um ácido nucléico, de acordo com qualquer configuração da invenção. Esse vetor é, portanto, também um objeto da presente invenção.(096) Another important tool for transforming organisms or host cells suitable for carrying out the method of the invention in vivo is an expression vector, comprising a nucleic acid, according to any embodiment of the invention. This vector is therefore also an object of the present invention.

(097) Um ”vetor da expressão”, conforme usado no presente, inclui qualquer vetor recombinante linear ou circular, incluindo, entre outros, vetores virais, bacteriófagos e plasmídeos. O perito é capaz de selecionar um vetor adequado, de acordo com o sistema de expressão. Em uma configuração, o vetor de expressão inclue o ácido nucléico da invenção, operavelmente ligado a, no mínimo, uma sequência regulatória, que controla a transcrição, a tradução, a iniciação e o término, como um promotor, operador ou uma sequência reforçadora transcricional ou um local de ligação ribossomal de mRNA e, opcionalmente, incluindo, no mínimo, um marcador de seleção. Sequências de nucleotídeo são “operavelmente ligadas” quando a sequência regulatória funcionalmente relaciona-se com o ácido nucléico da invenção.(097) An "expression vector" as used herein includes any linear or circular recombinant vector, including but not limited to viral, bacteriophage, and plasmid vectors. The expert is able to select a suitable vector according to the expression system. In one embodiment, the expression vector includes the nucleic acid of the invention, operably linked to at least one regulatory sequence, which controls transcription, translation, initiation and termination, such as a promoter, operator, or transcriptional enhancer sequence. or a ribosomal mRNA binding site, and optionally including, at a minimum, a selectable marker. Nucleotide sequences are "operably linked" when the regulatory sequence functionally relates to the nucleic acid of the invention.

(098) Os vetores de expressão da presente invenção podem ser usados no método para preparação de um organismo e/ou célula hospedeira geneticamente transformada, em organismos e/ou células hospedeiras que abrigam os ácidos nucléicos da invenção e nos métodos de produção ou criação de polipeptídios tendo uma atividade de síntese de esclareol, conforme divulgado mais abaixo.(098) The expression vectors of the present invention can be used in the method for preparing a genetically transformed organism and/or host cell, in organisms and/or host cells that harbor the nucleic acids of the invention and in the methods of producing or creating polypeptides having a sclareol synthesizing activity, as disclosed further below.

(099) Organismos e células hospedeiros não-humanos recombinantes, transformados para hospedar, no mínimo, um ácido nucléico que codifica um polipeptídio tendo uma atividade de síntese de LPP e compreendendo uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:1 ou 2 e, no mínimo, um ácido nucléico que codifica um polipeptídio tendo uma atividade de síntese de esclareol e compreendendo uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:3, de maneira que expresse heterologamente ou super- expresse os referidos polipeptídios também são ferramentas muito úteis para realizar o método da invenção. Esses organismos e células hospedeiras não- humanas são, portanto, outro objeto da presente invenção.(099) Recombinant non-human host cells and organisms, transformed to host at least a nucleic acid encoding a polypeptide having an LPP synthesizing activity and comprising an amino acid sequence at least 50% identical to SEQ ID NO :1 or 2 and at least one nucleic acid encoding a polypeptide having a sclareol synthesizing activity and comprising an amino acid sequence at least 50% identical to SEQ ID NO:3 such that it expresses heterologously or super - express said polypeptides are also very useful tools to carry out the method of the invention. These non-human host organisms and cells are therefore another object of the present invention.

(0100) De acordo com uma configuração preferida, o referido polipeptídio tendo uma atividade de síntese de LPP compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:1 ou 2. De acordo com uma configuração mais preferida, o referido polipeptídio compreende a SEQ ID NO:1 ou 2. De acordo com uma configuração ainda mais preferida, o referido polipeptídio consiste da SEQ ID NO:1 ou 2.(0100) According to a preferred embodiment, said polypeptide having an LPP synthesis activity comprises an amino acid sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:1 or 2. According to a more preferred embodiment, said polypeptide comprises SEQ ID NO:1 or 2. According to an even more preferred embodiment, said polypeptide consists of SEQ ID NO:1 or 2.

(0101) De acordo com outra configuração preferida, o referido polipeptídio tendo uma atividade de síntese de esclareol compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:3. De acordo com uma configuração mais preferida, o referido polipeptídio compreende a SEQ ID NO:3. De acordo com uma configuração ainda mais preferida, o referido polipeptídio consiste da SEQ ID NO:3.(0101) According to another preferred embodiment, said polypeptide having a sclareol synthesis activity comprises an amino acid sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably, at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:3. According to a more preferred embodiment, said polypeptide comprises SEQ ID NO:3. According to an even more preferred embodiment, said polypeptide consists of SEQ ID NO:3.

(0102) De acordo com uma configuração preferida adicional, o ácido nucléico que codifica um polipeptídio tendo uma atividade de síntese de LPP compreende uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:4, 5 ou ao complemento da mesma. De acordo com uma configuração mais preferida, o referido ácido nucléico compreende a SEQ ID NO:4, 5 ou o complemento da mesma. De acordo com uma configuração ainda mais preferida, o referido ácido nucléico consiste da SEQ ID NO:4, 5 ou do complemento da mesma.(0102) According to a further preferred embodiment, the nucleic acid encoding a polypeptide having an LPP synthesis activity comprises a nucleotide sequence of at least 55%, preferably at least 60%, preferably at least 60% 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95 % and even more preferably at least 98% identical to SEQ ID NO:4, 5 or the complement thereof. According to a more preferred embodiment, said nucleic acid comprises SEQ ID NO:4, 5 or the complement thereof. According to an even more preferred embodiment, said nucleic acid consists of SEQ ID NO:4, 5 or the complement thereof.

(0103) De acordo com uma configuração preferida adicional, o ácido nucléico que codifica um polipeptídio tendo uma atividade de síntese de esclareol compreende uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:6 ou ao complemento da mesma. De acordo com uma configuração mais preferida, o referido ácido nucléico compreende a SEQ ID NO:6 ou o complemento da mesma. De acordo com uma configuração ainda mais preferida, o referido ácido nucléico consiste da SEQ ID NO:6 ou do complemento da mesma.(0103) According to a further preferred embodiment, the nucleic acid encoding a polypeptide having a sclareol synthesizing activity comprises a nucleotide sequence of at least 55%, preferably at least 60%, preferably at least 60% 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95 % and even more preferably at least 98% identical to SEQ ID NO:6 or the complement thereof. According to a more preferred embodiment, said nucleic acid comprises SEQ ID NO:6 or the complement thereof. According to an even more preferred embodiment, said nucleic acid consists of SEQ ID NO:6 or the complement thereof.

(0104) De acordo com outra configuração preferida, o referido polipeptídio tendo uma atividade de síntese de LPP compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:36 a 39. De acordo com uma configuração mais preferida, o referido polipeptídio compreende qualquer uma das SEQ ID NO:36 a 39. De acordo com uma configuração ainda mais preferida, o referido polipeptídio consiste de qualquer uma das SEQ ID NO:36 a 39.(0104) According to another preferred embodiment, said polypeptide having an LPP synthesis activity comprises an amino acid sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably, at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to any one of SEQ ID NOs:36 to 39. According to a more preferred embodiment, said polypeptide comprises any one of SEQ ID NOs:36 to 39. According to an even more preferred embodiment , said polypeptide consisting of any one of SEQ ID NO:36 to 39.

(0105) De acordo com outra configuração preferida, o referido polipeptídio tendo uma atividade de síntese de esclareol compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:73. De acordo com uma configuração mais preferida, o referido polipeptídio compreende a SEQ ID NO:73. De acordo com uma configuração ainda mais preferida, o referido polipeptídio consiste da SEQ ID NO:73.(0105) According to another preferred embodiment, said polypeptide having a sclareol synthesis activity comprises an amino acid sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably, at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:73. According to a more preferred embodiment, said polypeptide comprises SEQ ID NO:73. According to an even more preferred embodiment, said polypeptide consists of SEQ ID NO:73.

(0106) De acordo com uma configuração preferida adicional, o referido ácido nucléico que codifica um polipeptídio tendo uma atividade de síntese de LPP compreende uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica a qualquer uma das SEQ ID NO:28 a 31 ou ao complemento das mesmas. De acordo com uma configuração mais preferida, o referido ácido nucléico compreende qualquer uma das SEQ ID NO:28 a 31 ou o complemento das mesmas. De acordo com uma configuração ainda mais preferida, o referido ácido nucléico consiste de qualquer uma das SEQ ID NO:28 a 31 ou do complemento das mesmas.(0106) According to a further preferred embodiment, said nucleic acid encoding a polypeptide having an LPP synthesis activity comprises a nucleotide sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 90% 95% and even more preferably at least 98% identical to any one of SEQ ID NOs: 28 to 31 or the complement thereof. According to a more preferred embodiment, said nucleic acid comprises any one of SEQ ID NOs: 28 to 31 or the complement thereof. According to an even more preferred embodiment, said nucleic acid consists of any one of SEQ ID NOs: 28 to 31 or the complement thereof.

(0107) De acordo com uma configuração preferida adicional, o ácido nucléico que codifica um polipeptídio tendo uma atividade de síntese de esclareol compreende uma sequência de nucleotídeo, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:73 ou ao complemento da mesma. De acordo com uma configuração mais preferida, o referido ácido nucléico compreende a SEQ ID NO:73 ou o complemento da mesma. De acordo com uma configuração ainda mais preferida, o referido ácido nucléico consiste da SEQ ID NO:73 ou do complemento da mesma.(0107) According to a further preferred embodiment, the nucleic acid encoding a polypeptide having a sclareol synthesizing activity comprises a nucleotide sequence of at least 55%, preferably at least 60%, preferably at least 60% 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95 % and even more preferably at least 98% identical to SEQ ID NO:73 or the complement thereof. According to a more preferred embodiment, said nucleic acid comprises SEQ ID NO:73 or the complement thereof. According to an even more preferred embodiment, said nucleic acid consists of SEQ ID NO:73 or the complement thereof.

(0108) De acordo com outra configuração preferida, os organismos e células hospedeiros não-humanos são transformados para hospedar, no mínimo, um ácido nucléico, que codifica um polipeptídio de fusão, conforme descrito em qualquer uma das configurações acima da invenção, de maneira que este expresse heterologamente ou super-expresse o referido polipeptídio de fusão.(0108) According to another preferred embodiment, non-human host organisms and cells are transformed to host at least one nucleic acid encoding a fusion polypeptide, as described in any of the above embodiments of the invention, in a manner that it heterologously expresses or overexpresses said fusion polypeptide.

(0109) O organismo ou célula não-humana pode vantajosamente ser ainda transformada com, no mínimo, um gene que codifica um polipeptídio envolvido no metabolismo da produção de GGPP, como, por exemplo, enzimas da via do MEP, da via do MVA e/ou prenil transferases. A transformação de um organismo ou célula não-humana, capaz de produzir GGPP com uma LPP-sintase e uma esclareol- sintase, ou com um polipeptídio de fusão, conforme descrito em qualquer uma das configurações da invenção, é suficiente para a produção de esclareol. Todavia, a transformação adicional com, no mínimo, uma enzima envolvida na produção de GGPP e/ou de um precursor de GGPP, isto é, isopentenil difosfato (IPP) e dimetilalil difosfato (DMAPP), tem a vantagem de aumentar a quantidade de precursor disponível para a conversão em esclareol.(0109) The non-human organism or cell can advantageously be further transformed with at least one gene encoding a polypeptide involved in the metabolism of GGPP production, such as, for example, enzymes of the MEP pathway, the MVA pathway and /or prenyl transferases. Transformation of a non-human organism or cell, capable of producing GGPP with an LPP synthase and a sclareol synthase, or with a fusion polypeptide, as described in any of the embodiments of the invention, is sufficient for the production of sclareol . However, further transformation with at least one enzyme involved in the production of GGPP and/or a GGPP precursor, i.e., isopentenyl diphosphate (IPP) and dimethylallyl diphosphate (DMAPP), has the advantage of increasing the amount of precursor available for conversion to sclareol.

(0110) Organismos hospedeiros não-humanos da invenção podem ser quaisquer organismos multicelulares ou unicelulares não-humanos. Em uma configuração preferida, o organismo hospedeiro não-humano da invenção é uma planta, um procarionte ou um fungo. Qualquer planta, procarionte ou fungo é adequado para ser transformado, de acordo com a presente invenção. Particularmente, plantas úteis são aquelas que naturalmente produzem altas quantidades de terpenos. Em uma configuração mais preferida, a planta é selecionada da família das Solanaceae, Poaceae, Brassicaceae, Fabaceae, Malvaceae, Asteraceae ou Lamiaceae. Por exemplo, a planta é selecionada dos gêneros Nicotiana, Solanum, Sorghum, Arabidopsis, Brassica (rapé), Medicago (alfalfa), Gossypium (algodão), Artemisia, Salvia e Mentha. Preferivelmente, a planta pertence às espécies de Nicotiana tabacum.(0110) Non-human host organisms of the invention can be any non-human multicellular or unicellular organisms. In a preferred embodiment, the non-human host organism of the invention is a plant, prokaryote or fungus. Any plant, prokaryote or fungus is suitable to be transformed according to the present invention. Particularly useful plants are those that naturally produce high amounts of terpenes. In a more preferred embodiment, the plant is selected from the family of Solanaceae, Poaceae, Brassicaceae, Fabaceae, Malvaceae, Asteraceae or Lamiaceae. For example, the plant is selected from the genera Nicotiana, Solanum, Sorghum, Arabidopsis, Brassica (snuff), Medicago (alfalfa), Gossypium (cotton), Artemisia, Salvia and Mentha. Preferably, the plant belongs to the species of Nicotiana tabacum.

(0111) Em uma configuração mais preferida, o organismo hospedeiro não-humano é um microorganismo. Qualquer microorganismo é adequado para a presente invenção, mas de acordo com uma configuração ainda mais preferida, o referido microorganismo é uma bactéria ou um fungo. Preferivelmente, o referido fungo é levedura. Mais preferivelmente, a referida bactéria é E. coli e a referida levedura é Saccharomyces cerevisiae.(0111) In a more preferred embodiment, the non-human host organism is a microorganism. Any microorganism is suitable for the present invention, but according to an even more preferred embodiment, said microorganism is a bacterium or a fungus. Preferably, said fungus is yeast. More preferably, said bacteria is E. coli and said yeast is Saccharomyces cerevisiae.

(0112) Células eurarióticas maiores isoladas podem também ser transformadas, em vez de organismos completos. Com as células eurarióticas maiores, queremos dizer aqui qualquer célula eucariótica não-humana, exceto as células de levedura. As células eucarióticas maiores preferida são células de planta. a. O termo “transformado” refere-se ao fato de que o hospedeiro estava sujeito à engenharia genética para abranger uma, duas ou mais cópias de cada um dos ácidos nucléicos exigidos em qualquer uma das configurações acima descritas. Preferivelmente, o termo “transformado” relaciona-se aos hospedeiros que expressam heterologamente os polipeptídios codificados pelo ácido nucléico com o qual eles são transformados, bem como supere-expressem os referidos polipeptídios. Conformemente, em uma configuração, a presente invenção fornece um organismo transformado, no qual os polipeptídios são expressados em quantidade maior do que no mesmo organismo não transformado. b. Há diversos métodos conhecidos na técnica para a criação de organismos ou células hospedeiros transgênicos, como plantas, fungos, procariontes ou culturas de células de organismos eucarióticos maiores. Clonagem adequada e vetores de expressão para uso com hospedeiros celulares bacterianos, fúngicos, de levedura, de planta e mamíferos são descritos, por exemplo, em Pouwels et al., Vetores de Clonagem: Um Manual Laboratorial, 1985, Elsevier, New York e Sambrook et al., Clonagem Molecular: Um Manual Laboratorial, 2a edição, 1989, Cold Spring Harbor Laboratory Press. Vetores de clonagem e de expressão para plantas e/ou células de plantas maiores, em particular, são disponíveis à pessoa qualificada. Vide, por exemplo, Schardl et al. Gene 61: 1-11, 1987. c. Métodos de transformação de organismos ou células hospedeiros para hospedar ácidos nucléicos transgênicos são familiares ao perito. Para a criação de plantas transgênicas, por exemplo, métodos atuais incluem: eletroporação de protoplastos de planta, transformação mediada por lipossomo, transformação mediada por agrobactéria, transformação mediada por polietileno glicol, bombardeamento de partícula, microinjeção de células de planta e transformação usando vírus. d. Em uma configuração, DNA transformado é integrado em um cromossomo de um organismo e/ou célula hospedeira não-humana, tal que resulte em um sistema recombinante estável. Qualquer método de integração cromossômica conhecido na técnica pode ser usado na prática da invenção, incluindo, entre outros, troca de cassete mediada por recombinase (RMCE), inserção cromossômica viral de local específico, adenovírus e injeção pronuclear.(0112) Isolated larger euraryotic cells can also be transformed, rather than whole organisms. By larger eukaryotic cells, we mean here any non-human eukaryotic cell except yeast cells. The preferred larger eukaryotic cells are plant cells. The. The term "transformed" refers to the fact that the host has been genetically engineered to comprise one, two or more copies of each of the required nucleic acids in any of the configurations described above. Preferably, the term "transformed" relates to hosts that heterologously express the polypeptides encoded by the nucleic acid with which they are transformed, as well as over-express said polypeptides. Accordingly, in one embodiment, the present invention provides a transformed organism in which the polypeptides are expressed in greater amounts than in the same non-transformed organism. B. There are several methods known in the art for creating transgenic host organisms or cells, such as plants, fungi, prokaryotes, or cell cultures of larger eukaryotic organisms. Suitable cloning and expression vectors for use with bacterial, fungal, yeast, plant and mammalian cellular hosts are described, for example, in Pouwels et al., Cloning Vectors: A Laboratory Manual, 1985, Elsevier, New York and Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd edition, 1989, Cold Spring Harbor Laboratory Press. Cloning and expression vectors for plants and/or larger plant cells, in particular, are available to the skilled person. See, for example, Schardl et al. Gene 61: 1-11, 1987. c. Methods of transforming host organisms or cells to host transgenic nucleic acids are familiar to the skilled person. For the creation of transgenic plants, for example, current methods include: electroporation of plant protoplasts, liposome-mediated transformation, agrobacteria-mediated transformation, polyethylene glycol-mediated transformation, particle bombardment, microinjection of plant cells, and transformation using viruses. d. In one embodiment, transformed DNA is integrated into a chromosome of a non-human host cell and/or organism such that a stable recombinant system results. Any method of chromosomal integration known in the art may be used in the practice of the invention, including but not limited to recombinase-mediated cassette exchange (RMCE), site-specific viral chromosome insertion, adenovirus, and pronuclear injection.

(0113)A fim de realizar o método de produção de esclareol in vitro, conforme exposto acima, é muito vantajoso fornecer um método de criação de, no mínimo, um polipeptídio tendo uma atividade de síntese de diterpeno, conforme descrito em qualquer uma das configurações da invenção. Portanto, a invenção fornece um método para produção de, no mínimo, um polipeptídio de fusão, capaz de catalisar a transformação de GGPP em esclareol compreendendo(0113) In order to carry out the method of producing sclareol in vitro, as set out above, it is very advantageous to provide a method of creating at least one polypeptide having a diterpene synthesis activity, as described in any of the configurations of the invention. Therefore, the invention provides a method for producing at least one fusion polypeptide capable of catalyzing the transformation of GGPP into sclareol comprising

(0114) o cultivo de organismo ou célula hospedeiros, não-humanos, transformados com o vetor de expressão da invenção, de maneira que hospede um ácido nucléico, de acordo com a invenção e expresse ou super-expresse um polipeptídio, codificado pelo referido ácido nucléico e capaz de catalisar a transformação do GGPP em esclareol;(0114) the cultivation of a non-human host organism or cell transformed with the expression vector of the invention, so that it hosts a nucleic acid, according to the invention and expresses or overexpresses a polypeptide encoded by said acid Nucleic and able to catalyze the transformation of GGPP into sclareol;

(0115) isolamento do polipeptídio capaz de catalisar a transformação de GGPP em esclareol a partir do organismo ou célula hospedeiros, não-humanos, cultivados na etapa a).(0115) isolation of the polypeptide capable of catalyzing the transformation of GGPP into sclareol from the host organism or cell, non-human, cultured in step a).

(0116) De acordo com uma configuração preferida, o referido método ainda compreende, antes da etapa a), a transformação de um organismo ou célula hospedeiros, não-humanos com, no mínimo, um vetor de expressão da invenção, de maneira que hospede, no mínimo, um ácido nucléico, de acordo com a invenção e expresse ou super-expresse o polipeptídio codificado pelo referido ácido nucléico.(0116) According to a preferred configuration, said method further comprises, before step a), the transformation of a non-human host organism or cell with at least one expression vector of the invention, so that it hosts at least one nucleic acid according to the invention and express or overexpress the polypeptide encoded by said nucleic acid.

(0117)A transformação e o cultivo do organismo ou célula hospedeiros, não- humanos podem ser realizados conforme descrito acima para o método de produção de esclareol in vivo. A etapa b) pode ser realizada usando qualquer técnica bem conhecida na técnica para isolar um polipeptídio particular de um organismo ou uma célula.(0117)Transformation and cultivation of the non-human host organism or cell can be performed as described above for the in vivo sclareol production method. Step b) can be carried out using any technique well known in the art for isolating a particular polypeptide from an organism or a cell.

(0118) Uma “variante de polipeptídio”, conforme referido ao presente, significa um polipeptídio de fusão, capaz de catalisar a transformação de GGPP em esclareol e sendo substancialmente homólogo ao polipeptídio, de acordo com qualquer uma das configurações acima, mas tendo uma sequência de aminoácido diferente daquela codificada por qualquer uma das sequências de ácido nucléico da invenção devido a uma ou mais deleções, inserções ou substituições.(0118) A "polypeptide variant", as referred to herein, means a fusion polypeptide, capable of catalyzing the transformation of GGPP to sclareol and being substantially homologous to the polypeptide, according to any of the above embodiments, but having a sequence of amino acid different from that encoded by any of the nucleic acid sequences of the invention due to one or more deletions, insertions or substitutions.

(0119) Variantes podem abranger sequências conservativamente substituídas, significando que um dado resíduo de aminoácido é substituído por um resíduo tendo características físico- químicas semelhantes. Exemplos de substituições conservativas incluem substituição de um resíduo alifático por outro, como Ile, Val, Leu ou Ala por um outro, ou substituições de um resíduo polar por outro, como entre Lys e Arg; Glu e Asp; ou Gln e Asn. Vide Zubay, Bioquímica, Addison-Wesley Pub. Co., (1983). Os efeitos dessas substituiçoes podem ser calculados usando matrizes de escore de substituição como uma PAM-120, PAM-200 e PAM-250, conforme discutido em Altschul, (J. Mol. Biol. 219:555-65, 1991). Outras substituições conservadoras, por exemplo, substituições de regiões inteiras tendo características de hidrofobicidade semelhantes, são bem conhecidas.(0119) Variants may encompass conservatively substituted sequences, meaning that a given amino acid residue is replaced with a residue having similar physicochemical characteristics. Examples of conservative substitutions include substitution of one aliphatic residue for another, such as Ile, Val, Leu, or Ala for one another, or substitutions of one polar residue for another, such as between Lys and Arg; Glu and Asp; or Gln and Asn. See Zubay, Biochemistry, Addison-Wesley Pub. Co., (1983). The effects of these substitutions can be calculated using substitution score matrices such as PAM-120, PAM-200 and PAM-250, as discussed in Altschul, (J. Mol. Biol. 219:555-65, 1991). Other conservative substitutions, for example, substitutions of entire regions having similar hydrophobicity characteristics, are well known.

(0120)Variantes de peptídeo que ocorrem naturalmente também são abrangidos pela invenção. Exemplos dessas variantes são proteínas que resultam de eventos de combinação de mRNA alternativos ou da divisão proteolítica dos polipeptídios aqui descritos. Variações atribuíveis à proteólise incluem, por exemplo, diferenças nos terminais N ou C mediante a expressão em tipos diferentes de células hospedeiras, devido à remoção proteolítica de um ou mais aminoácidos terminais dos polipeptídios codificados pelas sequências da invenção.Variantes dos polipeptídios da invenção podem ser usadas para obter, por exemplo, atividade enzimática elevada ou reduzida desejada, regioquímica ou estereoquímica modificada ou utilização de substrato ou distribuição de produto alteradas, uma afinidade elevada para o substrato, uma especificidade melhorada para a produção de um ou mais compostos desejados, uma atividade enzimática diferente, um aumento da velocidade da reação enzimática, uma maior atividade ou estabilidade em um meio-ambiente específico (pH, temperatura, solvente, etc.) ou um nível de expressão melhorado em um sistema de expressão desejado. Um mutante direcionado por variante ou local pode ser criado por qualquer método conhecido na técnica. Variantes e derivados de polipeptídios nativos podem ser obtidos por isolamento das variantes que ocorrem naturalmente ou da sequência de nucleotídeo de variantes, de outras linhagens ou espécies de planta ou as mesmas, ou artificialmente programando mutações de sequências de nucleotídeo que codificam os polipeptídios de fusão da invenção. Alterações da sequência de aminoácido nativo podem ser realizadas por qualquer um de diversos métodos convencionais.(0120) Naturally occurring peptide variants are also encompassed by the invention. Examples of such variants are proteins that result from alternative mRNA splicing events or proteolytic cleavage of the polypeptides described herein. Variations attributable to proteolysis include, for example, differences at the N- or C-terminus upon expression in different types of host cells, due to proteolytic removal of one or more terminal amino acids from the polypeptides encoded by the sequences of the invention. Variants of the polypeptides of the invention may be used to obtain, for example, a desired elevated or reduced enzymatic activity, modified regiochemistry or stereochemistry or altered substrate utilization or product distribution, a high affinity for the substrate, an improved specificity for the production of one or more desired compounds, an increased activity different enzymatic enzyme, an increase in enzyme reaction rate, increased activity or stability in a specific environment (pH, temperature, solvent, etc.), or an improved expression level in a desired expression system. A variant or site targeted mutant can be created by any method known in the art. Variants and derivatives of native polypeptides can be obtained by isolating naturally occurring variants or nucleotide sequence variants, from other plant strains or species or the same, or by artificially programming mutations of nucleotide sequences encoding the fusion polypeptides of the invention. Alterations to the native amino acid sequence can be performed by any of a number of conventional methods.

(0121)Variantes de polipeptídios, resultantes de uma fusão de sequências de peptídeo adicionais nas extremidades de terminal amino e carboxila dos polipeptídios da invenção, podem ser usadas para aumentar a expressão dos polipeptídios, ser úteis na purificação da proteína ou melhorar a atividade enzimática do polipeptídio em um ambiente ou sistema de expressão desejado. Essas sequências adicionais de peptídeo podem ser peptídeos de sinal, por exemplo. Conformemente, a presente invenção abrange variantes dos polipeptídios da invenção, como aqueles obtidos por fusão com outros oligo ou polipeptídios e/ou aqueles que são ligados a peptídeos de sinal.(0121)Polypeptide variants, resulting from a fusion of additional peptide sequences at the amino and carboxyl terminal ends of the polypeptides of the invention, can be used to increase the expression of the polypeptides, be useful in purifying the protein or improve the enzymatic activity of the polypeptide in a desired environment or expression system. Such additional peptide sequences can be signal peptides, for example. Accordingly, the present invention encompasses variants of the polypeptides of the invention, such as those obtained by fusion with other oligo or polypeptides and/or those which are linked to signal peptides.

(0122) Portanto, em uma configuração, a presente invenção fornece um método para preparação de um polipeptídio de fusão variante, capaz de catalisar a transformação de GGPP em esclareol e abrangendo as etapas de: (a) seleção de um ácido nucléico de acordo com qualquer uma das configurações expostas acima; (b) modificação do ácido nucléico selecionado para obter, no mínimo, um ácido nucléico mutante; (c) transformação de células ou organismos unicelulares hospedeiros com a sequência de ácido nucléico mutante para expressar um polipeptídio codificado pela sequência de ácido nucléico mutante; (d) avaliação do polipeptídio com relação a, no mínimo, uma propriedade modificada; e, (e) opcionalmente, se o polipeptídio não tiver atividade de síntese de esclareol variante desejada, repetir as etapas (a) a (d) do processo até um polipeptídio com uma atividade de síntese de esclareol variante desejada ser obtido; (f) opcionalmente, se um polipeptídio tendo uma atividade de síntese de esclareol variante desejada tiver sido identificado na etapa d), isolamento do ácido nucléico mutante correspondente obtido na etapa (c).(0122) Therefore, in one embodiment, the present invention provides a method for preparing a variant fusion polypeptide capable of catalyzing the transformation of GGPP into sclareol and comprising the steps of: (a) selecting a nucleic acid according to any of the settings set out above; (b) modifying the selected nucleic acid to obtain at least one mutant nucleic acid; (c) transforming host cells or unicellular organisms with the mutant nucleic acid sequence to express a polypeptide encoded by the mutant nucleic acid sequence; (d) evaluating the polypeptide for at least one modified property; and, (e) optionally, if the polypeptide does not have the desired variant sclareol synthesis activity, repeating steps (a) to (d) of the process until a polypeptide having a desired variant sclareol synthesis activity is obtained; (f) optionally, if a polypeptide having a desired variant sclareol synthesis activity has been identified in step d), isolating the corresponding mutant nucleic acid obtained in step (c).

(0123) Na etapa (b), uma grande quantidade de sequências de ácido nucléico mutante pode ser criada, por exemplo, por mutagênese randômica, mutagênese específica de local ou reorganização de DNA. Os procedimentos detalhados de reorganização genéticos são encontrados em Stemmer, Reorganização de DNA por fragmentação randômica e remontagem: recombinação in vitro para evolução molecular. Proc Natl Acad Sci USA., 1994, 91 (22): 107471075. Resumindo, Reorganização de DNA refere-se a um processo de recombinação randômica de sequências conhecidas in vitro, envolvendo, no mínimo, dois ácidos nucléicos selecionados para recombinação. Por exemplo, mutações podem ser introduzidas em locais particulares por síntese de oligonucleotídeos contendo uma sequência mutante, flanqueado por locais de restrição que permitem a ligação com fragmentos da sequência nativa. Após a ligação, a sequência reconstruída resultante codifica um análogo que possui a inserção de aminoácido desejada, substituição ou deleção. Alternativamente, procedimentos de mutagênese específicos de local, direcionados por oligonucleotídeo podem ser empregados para fornecer um gene alterado onde códons pré-determinados podem ser alterados por substituição, deleção ou inserção.(0123) In step (b), a large amount of mutant nucleic acid sequences can be created, for example, by random mutagenesis, site-specific mutagenesis or DNA shuffling. Detailed genetic reassortment procedures are found in Stemmer, Reassembly of DNA by Random Fragmentation and Reassembly: In Vitro Recombination for Molecular Evolution. Proc Natl Acad Sci USA., 1994, 91(22): 107471075. In summary, DNA shuffling refers to a process of random recombination of known sequences in vitro, involving at least two nucleic acids selected for recombination. For example, mutations can be introduced at particular sites by synthesizing oligonucleotides containing a mutant sequence, flanked by restriction sites that allow ligation with fragments of the native sequence. After ligation, the resulting reconstructed sequence encodes an analog having the desired amino acid insertion, substitution or deletion. Alternatively, site-specific, oligonucleotide-directed mutagenesis procedures can be employed to provide an altered gene where predetermined codons can be altered by substitution, deletion or insertion.

(0124) Conformemente, o polipeptídio de fusão que compreende a SEQ ID NO:4 ou 5 e a SEQ ID NO:6 pode ser recombinado com qualquer outra diterpeno- sintase que codifica ácidos nucléicos, por exemplo, isolados de um organismo diferente da Salvia sclarea. Dessa forma, ácidos nucléicos mutantes podem ser obtidos e separados, os quais podem ser usados para transformar uma célula hospedeira, de acordo com procedimentos padrão, por exemplo, conforme divulgado nos presentes Exemplos.(0124) Accordingly, the fusion polypeptide comprising SEQ ID NO:4 or 5 and SEQ ID NO:6 may be recombined with any other diterpene synthase encoding nucleic acids, for example isolated from an organism other than Salvia clarify. In this way, mutant nucleic acids can be obtained and separated, which can be used to transform a host cell, according to standard procedures, for example, as disclosed in the present Examples.

(0125) Na etapa (d), o polipeptídio obtido na etapa (c) é avaliado com relação a, no mínimo, uma propriedade modificada, por exemplo, uma atividade enzimática modificada desejada. Exemplos de atividades enzimáticas desejadas, para as quais um polipeptídio expressado pode ser avaliado, incluem atividade enzimática elevada ou reduzida, conforme medido pelo valor KM ou Vmax, regioquímica ou estereoquímica modificada e utilização de substrato alterado ou distribuição de produto. A avaliação da atividade enzimática pode ser realizada de acordo com os procedimentos familiares ao perito e aqueles divulgados nos presentes Exemplos.(0125) In step (d), the polypeptide obtained in step (c) is evaluated with respect to at least one modified property, for example, a desired modified enzymatic activity. Examples of desired enzyme activities for which an expressed polypeptide can be evaluated include increased or reduced enzyme activity as measured by the KM or Vmax value, modified regiochemistry or stereochemistry, and altered substrate utilization or product delivery. The evaluation of enzymatic activity can be carried out according to procedures familiar to the person skilled in the art and those disclosed in the present Examples.

(0126) A etapa (e) prepara-se para repetição das etapas (a)-(d) do processo, que pode preferivelmente ser realizada em paralelo. Conformemente, através da criação de uma quantidade significativa de ácidos nucléicos mutantes, muitas células hospedeiras podem ser transformadas com diferentes ácidos nucléicos mutantes ao mesmo tempo, permitindo a avaliação subsequente de uma quantidade elevada de polipeptídios. As chances de obtenção de um polipeptídio variante desejado podem, dessa forma, ser elevadas a critério do perito.(0126) Step (e) prepares for repeating steps (a)-(d) of the process, which can preferably be carried out in parallel. Accordingly, by creating a significant amount of mutant nucleic acids, many host cells can be transformed with different mutant nucleic acids at the same time, allowing the subsequent evaluation of a high amount of polypeptides. The chances of obtaining a desired variant polypeptide can therefore be high at the discretion of the skilled person.

(0127)Todas as publicações mencionadas neste pedido são incorporadas por referência à divulgação e descrevem os métodos e/ou materiais em conexão com o que as publicações são citadas.(0127) All publications referenced in this application are incorporated by reference into the disclosure and describe methods and/or materials in connection with which publications are cited.

Description of drawings

(0128) Figura 1: Estruturas dos diversos compostos citados na descrição.(0128) Figure 1: Structures of the various compounds mentioned in the description.

(0129) Figura 2: Mecanismo da biossíntese de esclareol a partir de GGPP. As etapas 1 e 2 enzimáticas podem ser catalisadas por duas proteínas distintas (uma LPP- sintase e uma esclareol-sintase) ou por uma enzima bi-funcional única (polipeptídio de fusão).(0129) Figure 2: Mechanism of sclareol biosynthesis from GGPP. Enzymatic steps 1 and 2 can be catalyzed by two distinct proteins (an LPP synthase and a sclareol synthase) or by a single bifunctional enzyme (fusion polypeptide).

(0130) Figura 3: Alinhamento deduzido de SsLPPs3 (SEQ ID NO:4) e SsLPPs9 (SEQ ID NO:5) das sequências de amino ácido SEQ ID NO:1 e 2, duas diterpeno-sintases estritamente relacionadas, que codificam cDNAs, isoladas para o propósito da presente invenção. Resíduos idênticos estão em letras brancas e resíduos diferentes entre as duas sequências estão em letras pretas.(0130) Figure 3: Deduced alignment of SsLPPs3 (SEQ ID NO:4) and SsLPPs9 (SEQ ID NO:5) from the amino acid sequences SEQ ID NO:1 and 2, two closely related diterpene synthases, which encode cDNAs, isolated for the purpose of the present invention. Identical residues are in white letters and different residues between the two sequences are in black letters.

(0131) Figura 4: Análise de SDS-PAGE dos extratos de proteína solúvel crua de células de E. coli, que expressam as proteínas SsLPPs3 e SsLPPs9 (SEQ ID NO: 1 e 2). Linhas 1 e 8: padrões de peso molecular; linhas 2 e 7: proteínas de controle, obtidas de células transformadas com o plasmídeo sem inserção; linhas 3 e 4: proteínas das células transformadas com pETDue-SsLPPs3; linhas 5 e 6: proteínas das células transformadas com pETDuet-SsLPPs9. O gel foi colorido para proteína total, usando Azul de Coomassie.(0131) Figure 4: SDS-PAGE analysis of crude soluble protein extracts from E. coli cells expressing SsLPPs3 and SsLPPs9 proteins (SEQ ID NO: 1 and 2). Lines 1 and 8: molecular weight standards; lines 2 and 7: control proteins, obtained from cells transformed with the plasmid without insert; lanes 3 and 4: proteins from cells transformed with pETDue-SsLPPs3; lanes 5 and 6: proteins from cells transformed with pETDuet-SsLPPs9. The gel was stained for total protein using Coomassie Blue.

(0132) Figura 5: Análise de SDS-PAGE da afinidade de SsLPPs3 (SEQ ID NO:1) de diterpeno-sintase de salvia recombinante, purificada, expressada em E. coli. Linha M, padrão de peso molecular; linha 1, extrato de proteína solúvel crua de células de controle; linha 2, extrato de proteína solúvel crua de células transformadas com pET28-SsLPPs3; linha 3, frações de fluxo passante; linhas 4 a 7, frações de lavagem; linhas 8 a 10, frações de eluição com 250mM de L-histidina. O gel foi colorido para proteína total usando o Azul de Coomassie.(0132) Figure 5: SDS-PAGE analysis of the affinity of SsLPPs3 (SEQ ID NO:1) of purified recombinant sage diterpene synthase expressed in E. coli. Line M, molecular weight standard; lane 1, crude soluble protein extract from control cells; lane 2, crude soluble protein extract from cells transformed with pET28-SsLPPs3; line 3, through-flow fractions; lines 4 to 7, wash fractions; lanes 8 to 10, elution fractions with 250mM L-histidine. The gel was stained for total protein using Coomassie Blue.

(0133) Figura 6: Análise de CG dos produtos obtidos após incubação da SsLPPs3 (SEQ ID NO:1) de afinidade purificada com GGPP. (A) extrato de solvente direto, (B) Extrato de solvente da mesma amostra após tratamento com fosfatase alcalina.(0133) Figure 6: GC analysis of products obtained after incubation of affinity purified SsLPPs3 (SEQ ID NO:1) with GGPP. (A) Direct solvent extract, (B) Solvent extract of the same sample after treatment with alkaline phosphatase.

(0134) Figura 7: (A) Sequências de N terminal das diterpeno-sintases recombinantes de extensão total e de SsLPPs3 truncada (SEQ ID NO:1 e SEQ ID NO:36 a 39). (B) Análise de SDS-PAGE das versões de extensão total e truncada das diterpeno- sintases de SsLPPs3, expressadas em E. coli. Linha M, padrão de peso molecular; linha 1, extrato de proteína solúvel crua das células de controle; linha 2, extrato de proteína solúvel crua de células transformadas com pET28-SsLPPs3; linha 3, SsLPPs3 marcada com histidina purificada; linha 4 e 5: respectivamente 1 e 0,5μL de extrato de proteína solúvel crua de células transformadas com pETDuet- SsLPPs3; linhas 5 a 9, 0,5μL de extrato de proteína solúvel crua de células transformadas com pETDuet contendo as quatro deleções sequenciais. O gel foi colorido para proteína total usando o Azul de Coomassie.(0134) Figure 7: (A) N-terminal sequences of full-length recombinant diterpene synthases and truncated SsLPPs3 (SEQ ID NO:1 and SEQ ID NO:36 to 39). (B) SDS-PAGE analysis of full length and truncated versions of SsLPPs3 diterpene synthases expressed in E. coli. Line M, molecular weight standard; lane 1, crude soluble protein extract from control cells; lane 2, crude soluble protein extract from cells transformed with pET28-SsLPPs3; lane 3, purified histidine-tagged SsLPPs3; row 4 and 5: respectively 1 and 0.5μL of crude soluble protein extract from cells transformed with pETDuet-SsLPPs3; lines 5 to 9, 0.5μL of crude soluble protein extract from cells transformed with pETDuet containing the four sequential deletions. The gel was stained for total protein using Coomassie Blue.

(0135) Figura 8: Alinhamento das sequências de aminoácidos dos fragmentos tipo diterpeno-sintase de classe II com a sequência da estemodeno-sintase de Oriza sativa (No de Acesso AAZ76733).(0135) Figure 8: Alignment of amino acid sequences of class II diterpene synthase-like fragments with the sequence of Oriza sativa stemodeno synthase (Accession No. AAZ76733).

(0136) Figura 9: Alinhamento das sequências de aminoácidos das 1132 construções (SEQ ID NO:3 e 74) para expressão heteróloga em E coli.(0136) Figure 9: Alignment of the amino acid sequences of the 1132 constructs (SEQ ID NO:3 and 74) for heterologous expression in E coli.

(0137) Figura 10: Análise de CG dos produtos obtidos após incubação das diferentes 1132 proteínas recombinantes com LPP. Extratos de proteína crua de E. coli expressando as proteínas SsTps1132 (1132-1-3; SEQ ID NO:3) e 1132-2-5 (SEQ ID NO:74) recombinantes foram incubados com LPP em um volume final de 1mL de 50mM de MOPSO, pH 7, suplementado com 15mM de MgCl2.(0137) Figure 10: GC analysis of the products obtained after incubation of the different 1132 recombinant proteins with LPP. Crude protein extracts from E. coli expressing recombinant SsTps1132 (1132-1-3; SEQ ID NO:3) and 1132-2-5 (SEQ ID NO:74) proteins were incubated with LPP in a final volume of 1mL of 50mM MOPSO, pH 7, supplemented with 15mM MgCl2.

(0138) Figura 11: Análise de CG-MS dos produtos gerados a partir de LPP pela proteína 1132-2-5 (SEQ ID NO:74) recombinante. (A) Cromatograma de íon total dos produtos obtidos da incubação de LPP com um extrato de proteína crua de E. coli, transformado com pET101-1132-2-5. (B) Espectro de massa do pico no tempo de retenção de 14,3. (C) Espectro de massa de um padrão de esclareol autêntico.(0138) Figure 11: CG-MS analysis of products generated from LPP by recombinant 1132-2-5 protein (SEQ ID NO:74). (A) Total ion chromatogram of the products obtained from the incubation of LPP with a crude protein extract of E. coli, transformed with pET101-1132-2-5. (B) Mass spectrum of the peak at retention time of 14.3. (C) Mass spectrum of an authentic sclareol standard.

(0139) Figura 12: Análise de CG dos produtos obtidos após coincubação de proteínas recombinantes 1132 (SEQ ID NO:3 e 74) com a proteína recombinante SsLPPs3 (SEQ ID NO:1) na presença de GGPP.(0139) Figure 12: GC analysis of the products obtained after co-incubation of recombinant proteins 1132 (SEQ ID NO:3 and 74) with the recombinant protein SsLPPs3 (SEQ ID NO:1) in the presence of GGPP.

(0140) Figura 13: Estrutura dos plasmídeos usados para a transformação de células de E. coli nos Exemplos 10 e 11.(0140) Figure 13: Structure of the plasmids used for the transformation of E. coli cells in Examples 10 and 11.

(0141) Configurações específicas da invenção ou Exemplos(0141) Embodiments Specific to the Invention or Examples

(0142)A invenção agora será descrita em detalhes adicionais através dos seguintes Exemplos.(0142) The invention will now be described in further detail by way of the following Examples.

Example 1

(0143) Isolamento de LPP-sintase, que codifica DNAs de Salvia clarea por uma abordagem de PCR(0143) Isolation of LPP synthase, which encodes Salvia clarea DNAs by a PCR approach

A. Extraction of plant matter and RNA.

(0144) Botões florais em desenvolvimento da Salvia sclarea (1,5 a 2cm de extensão, 1-2 dias de idade) foram coletados nos campos de Bassins (Suíça) e diretamente congelados em nitrogênio líquido. O RNA total foi extraído usando o Reagente de RNA de Planta Concert™ da Invitrogen (Carlsbad, CA) e o mRNA foi purificado por cromatografia de afinidade de oligodT-celulose, usando o Kit de isolamento de mRNA FasTrack® 2.0 (Invitrogen, Carlsbad, CA), de acordo com as instruções do fabricante. Uma biblioteca de cDNA foi construída usando o Kit de Amplificação de cDNA Marathon™ (Clontech, Mountain View, CA).(0144) Developing flower buds of Salvia sclarea (1.5 to 2cm long, 1-2 days old) were collected from the fields of Bassins (Switzerland) and directly frozen in liquid nitrogen. Total RNA was extracted using Invitrogen Concert™ Plant RNA Reagent (Carlsbad, CA) and mRNA was purified by oligodT-cellulose affinity chromatography using the FasTrack® 2.0 mRNA Isolation Kit (Invitrogen, Carlsbad, CA) CA), according to the manufacturer's instructions. A cDNA library was constructed using the Marathon™ cDNA Amplification Kit (Clontech, Mountain View, CA).

B. Polymerase Chain Reactions for amplification of diterpene synthase cDNAs

(0145) Sequências de aminoácido de diterpeno-sintases de classe I e II de diferentes plantes foram alinhadas e motivos conservados foram selecionados. Sequências de oligonucleotídeos degenerativos foram deduzidas desses motivos de aminoácido conservados. O Motivo DxDDTAM (x sendo qualquer aminoácido), encontrado na parte central das sequências de aminoácido das diterpeno-sintases e postulado para estar envolvido na internação com a metade de difosfato de GGPP nas diterpeno- sintases de classe II, foi usado para criar o primer inverso DT3F (5'-(SEQ ID NO:7)). Outro motivo, DVW(I/L)GK(T/S), encontrado em algunas diterpeno-sintases, foi usado para criar o primer reverso D/T4R (SEQ ID NO:8)).(0145) Amino acid sequences of class I and II diterpene synthases from different plants were aligned and conserved motifs were selected. Sequences of degenerative oligonucleotides were deduced from these conserved amino acid motifs. The DxDDTAM Motif (x being any amino acid), found in the central part of the amino acid sequences of diterpene synthases and postulated to be involved in internalization with the diphosphate moiety of GGPP in class II diterpene synthases, was used to create the primer inverse DT3F (5'-(SEQ ID NO:7)). Another motif, DVW(I/L)GK(T/S), found in some diterpene synthases, was used to create the reverse primer D/T4R (SEQ ID NO:8)).

(0146) PCR foram realizadas usando esses primers em todas as possíveis combinações de primers inverso e reverso. A mistura da PCR continha 0,4μM de cada primer, 300μM de cada dNTPs, 5μL de tampão de polimerase de DNA 10X HotStartTaq® (Qiagen), 2μL de cDNA dissolvido em 100 vezes, 0,5μL de polimerase de DNA HotStartTaq® em um volume final de 50μL. As condições cíclicas foram: 35 ciclos de 45 seg a 94°C, 45 seg a 50°C e 2 min a 72°C; e 10 min a 72°C. Os tamanhos dos produtos de PCR foram avaliados em um gel de agarose a 1%. As fitas correspondentes ao tamanho esperado foram removidas do gel, purificadas usando o Kit de Extração de Gel QIAquick® (Qiagen) e clonadas no vetor pCR®2.1- TOPO, usando o Kit de clonagem TOPO TA (Invitrogen, Carlsbad, CA). Fragmentos de cDNA inseridos estavam, então, sujeitos à sequenciamento de DNA e a sequência foi comparada contra o banco de dados de proteína não-redundante GenBlank (NCBI), usando o algoritmo BLASTX (Altschul et al, J. Mol. Biol. 215, 403410, 1990). A partir de diferentes PCR realizadas, apenas a combinação dos primers DT3F (SEQ ID NO:7) e DT4R (SEQ ID NO:8) forneceu um fragmento de DNA com o tamanho esperado e com a homologia de sequência a diterpeno-sintases. Todos os fragmentos emitidos dessa amplificação tiveram a mesma sequência exata. Essa sequência de 354 bp foi denominada FN23 (SEQ ID NO:9).(0146) PCR were performed using these primers on all possible combinations of reverse and reverse primers. The PCR mix contained 0.4μM of each primer, 300μM of each dNTPs, 5μL of 10X HotStartTaq® DNA polymerase buffer (Qiagen), 2μL of cDNA dissolved in 100 fold, 0.5μL of HotStartTaq® DNA polymerase in a final volume of 50μL. The cycling conditions were: 35 cycles of 45 sec at 94°C, 45 sec at 50°C and 2 min at 72°C; and 10 min at 72°C. Sizes of PCR products were evaluated on a 1% agarose gel. Strands corresponding to the expected size were excised from the gel, purified using the QIAquick® Gel Extraction Kit (Qiagen), and cloned into the pCR®2.1-TOPO vector using the TOPO TA Cloning Kit (Invitrogen, Carlsbad, CA). Inserted cDNA fragments were then subjected to DNA sequencing and the sequence was compared against the GenBlank non-redundant protein database (NCBI) using the BLASTX algorithm (Altschul et al, J. Mol. Biol. 215, 403410, 1990). From different PCRs performed, only the combination of primers DT3F (SEQ ID NO:7) and DT4R (SEQ ID NO:8) provided a DNA fragment with the expected size and sequence homology to diterpene synthases. All fragments emitted from this amplification had the exact same sequence. This 354 bp sequence was named FN23 (SEQ ID NO:9).

C. Isolation of full-length cDNA by rapid cDNA end-to-end amplification (RACE).

(0147) Oligonucleotídeos específicos para a sequência FN23 (SEQ ID NO:9) foram criados. FN23-F1’ (SEQ ID NO:10)), FN23-F2 (SEQ ID NO:11)) e FN23-F3 (SEQ ID NO:12)). Esses primers foram usados em RT-PCR em combinação com primers oligodT, estendidos com uma sequência adaptadora (SEQ ID NO:13). A composição da mistura de reação de RT-PCR foi a seguinte: 10μl de tampão de RT-PCR 5X Qiagen OneStep, 400μM cada de dNTP, 400nM de cada primer, 2μl de Mistura Enzimática de RT-PCR Qiagn OneStep, 1μl de Inibidor de Ribonuclease RNasin® (Promega Co., Madisson, WI) e 1250ng de RNA total em um volume final de 50ml. As condições do termociclador foram: 30 min a 50°C (transcrição reversa); 15 min a 95°C (ativação de polimerase de DNA); 35 ciclos de 45 seg a 94°C, 45 seg a 50°C e 90 seg a 72°C; e 10 min a 72°C. Um segundo ciclo de PCR foi realizado usando os produtos de RT-PCR como template com o primer adapterP (SEQ ID NO:14) em combinação com o mesmo ou primers específicos de FN23 abrigados. Essa abordagem de PCR forneceu um fragmento de cDNA 1271 bp (FN30 (SEQ ID NO:15)) tendo uma sobreposição perfeita de 192 bp com o fragmento FN23 (SEQ ID NO:9) e contendo a extremidade 3', incluindo o códon de interrupção e a sequência sem codificação 3' do cDNA correspondente.(0147) Oligonucleotides specific for the FN23 sequence (SEQ ID NO:9) were created. FN23-F1' (SEQ ID NO:10)), FN23-F2 (SEQ ID NO:11)) and FN23-F3 (SEQ ID NO:12)). These primers were used in RT-PCR in combination with oligodT primers, extended with an adapter sequence (SEQ ID NO:13). The composition of the RT-PCR reaction mixture was as follows: 10μl Qiagen OneStep 5X RT-PCR Buffer, 400μM each dNTP, 400nM each primer, 2μl Qiagen OneStep RT-PCR Enzyme Mixture, 1μl RNasin® Ribonuclease (Promega Co., Madison, WI) and 1250ng of total RNA in a final volume of 50ml. The thermocycler conditions were: 30 min at 50°C (reverse transcription); 15 min at 95°C (DNA polymerase activation); 35 cycles of 45 sec at 94°C, 45 sec at 50°C and 90 sec at 72°C; and 10 min at 72°C. A second round of PCR was performed using the RT-PCR products as a template with the adapterP primer (SEQ ID NO:14) in combination with the same or harbored FN23-specific primers. This PCR approach yielded a 1271 bp cDNA fragment (FN30 (SEQ ID NO:15)) having a perfect 192 bp overlap with the FN23 fragment (SEQ ID NO:9) and containing the 3' end, including the codon of interruption and the 3' uncoding sequence of the corresponding cDNA.

(0148) Para amplificação da extremidade 5’ do cDNA, oligonucleotídeos anti-sense, específicos para FN23 (SEQ ID NO:9) foram criados: FN23-R1 (SEQ ID NO:16)), FN23-R2 (SEQ ID NO:17)), FN23-R3 (SEQ ID NO:18)). Esses primers foram usados para RACE de 5’, usando a biblioteca de cDNA de S. sclarea, após o protocolo de Kit de Amplificação de cDNA Marathon™ (Clontech, Mountain View, CA). As condições cíclicas térmicas foram as seguintes: 1 min a 94°C, 5 ciclos de 30 seg a 94°C e 4 min a 72°C, 5 ciclos de 30 seg a 94°C e 4 min a 70°C, 20 ciclos de 30 seg a 94°C e 4 min a 68°C. Essa RACE de 5’ forneceu um fragmento de cDNA 1449 bp (FN40 (SEQ ID NO:19) tendo uma sobreposição perfeita de 227 bp com FN23 (SEQ ID NO:9). Comparação com sequências de diterpeno-sintases conhecidas revelou que o fragmento FN40 (SEQ ID NO:19) continha o códon de iniciação de tradução e uma região sem codificação de 87 bp. A montagem dos três fragmentos de cDNA (FN23, FN30 e FN40 (SEQ ID NO:9, 15 e 19) forneceu uma sequência de cDNA de extensão total (SaTpsl) de 2655 bp com uma estrutura de leitura aberta (SEQ ID NO:20) de codificação 2355 bp para uma proteína de resíduos 785 (SEQ ID NO:21), tendo forte homologia com diterpeno-sintases e, isto é, com copalil difosfato- sintases. O motivo DxDD, envolvido na ciclização iniciada por protonação, estava presente na sequência de aminoácido (posição 372) e o motivo DDxD, envolvido na ciclização iniciada por ionização, não foi encontrado. Dessa forma, essa sequência de proteína tem as características típicas de uma diterpeno-sintase de classe II, que catalisa exclusivamente as ciclizações dependentes de protonação de GGPP. A expressão heteróloga e a caracterização enzimática dessa proteína estão detalhadas nos Exemplos 2-4 a seguir.(0148) For amplification of the 5' end of the cDNA, antisense oligonucleotides, specific for FN23 (SEQ ID NO:9) were created: FN23-R1 (SEQ ID NO:16)), FN23-R2 (SEQ ID NO: 17)), FN23-R3 (SEQ ID NO:18)). These primers were used for 5' RACE using the S. sclarea cDNA library following the Marathon™ cDNA Amplification Kit protocol (Clontech, Mountain View, CA). The thermal cycling conditions were as follows: 1 min at 94°C, 5 cycles of 30 sec at 94°C and 4 min at 72°C, 5 cycles of 30 sec at 94°C and 4 min at 70°C, 20 cycles of 30 sec at 94°C and 4 min at 68°C. This 5' RACE yielded a 1449 bp cDNA fragment (FN40 (SEQ ID NO:19) having a perfect 227 bp overlap with FN23 (SEQ ID NO:9). Comparison with known diterpene synthase sequences revealed that the fragment FN40 (SEQ ID NO:19) contained the translation initiation codon and an 87 bp clear region. Assembly of the three cDNA fragments (FN23, FN30 and FN40 (SEQ ID NO:9, 15 and 19) provided a full length cDNA sequence (SaTpsl) of 2655 bp with an open reading frame (SEQ ID NO:20) encoding 2355 bp for a protein of residues 785 (SEQ ID NO:21), having strong homology to diterpene synthases and, that is, with copalyl diphosphate synthases. The DxDD motif, involved in protonation-initiated cyclization, was present in the amino acid sequence (position 372) and the DDxD motif, involved in ionization-initiated cyclization, was not found. , this protein sequence has the typical characteristics of a class II diterpene synthase, which exclusively catalyzes the protonation-dependent cyclizations of GGPP. The heterologous expression and enzymatic characterization of this protein is detailed in Examples 2-4 below.

Example 2

(0149) Expressão heteróloga da LLP-sintase de S. sclarea na E. coli(0149) Heterologous expression of S. sclarea LLP synthase in E. coli

(0150) O pETDuet-1 (Novagen, Madison, WI), criado para expressão sob o controle de um promoter T7, foi usado para expressão em células de E. coli. Para construir o plasmídeo de expressão, a estrutura de leitura aberta de SaTps 1 (SEQ ID NO:20) foi amplificada por PCR da biblioteca de cDNA com os primers inverso e reverso SaTps-Nde (SEQ ID NO:22)) e SaTps-Kpn (SEQ ID NO:23)), criados para introduzir um local de NdeI imediatamente antes do códon de início e um local de KpnI após o códon de interrupção. Já que a estrutura de leitura aberta com um local NdeI na posição de 1614 da estrutura de leitura aberta, essa amplificação foi realizada em duas etapas por PCR de extensão de sobreposição (Horton et al, Gene 78, 68, 1989), usando os primers SaTps-Nde (SEQ ID NO:22) e SaTps-Kpn (SEQ ID NO:23) em combinação com os primers Satps-mut1f (SEQ ID NO:24)) e Satps-mut1r (SEQ ID NO:25)), criados para remover o local NdeI sem alterar a sequência de aminoácido. O cDNA resultante foi primeiramente ligado no plasmídeo PCR2.1-Topo usando o Kit de Clonagem TOPO TA (Invitrogen, Carlsbad, CA) e as sequências das inserções foram verificadas antes da subclonagem como fragmento NdeI-KpnI no vetor pETDuet-1.(0150) pETDuet-1 (Novagen, Madison, WI), engineered for expression under the control of a T7 promoter, was used for expression in E. coli cells. To construct the expression plasmid, the open reading frame of SaTps 1 (SEQ ID NO:20) was PCR amplified from the cDNA library with the reverse and reverse primers SaTps-Nde (SEQ ID NO:22) and SaTps- Kpn (SEQ ID NO:23)), designed to introduce an NdeI site immediately before the start codon and a KpnI site after the stop codon. Since the open reading frame has an NdeI site at position 1614 of the open reading frame, this amplification was performed in two steps by overlap extension PCR (Horton et al, Gene 78, 68, 1989), using the primers SaTps-Nde (SEQ ID NO:22) and SaTps-Kpn (SEQ ID NO:23) in combination with primers Satps-mut1f (SEQ ID NO:24)) and Satps-mut1r (SEQ ID NO:25)), designed to remove the NdeI site without changing the amino acid sequence. The resulting cDNA was first ligated into the PCR2.1-Topo plasmid using the TOPO TA Cloning Kit (Invitrogen, Carlsbad, CA) and the sequences of the inserts were verified prior to subcloning as an NdeI-KpnI fragment into the pETDuet-1 vector.

(0151) Análise da sequência de diversos clones obtidos por amplificação da biblioteca de cDNA com os primers específicos SaTps1 mostrou alguma variabilidade em diversas posições da sequência de cDNA. Sete posições foram identificadas, nas quais dois aminoácidos diferentes podem ser encontrados. Uma posição foi encontrada, onde inserção de um resíduo de serina ocorreu em alguns dos clones. Essas posições são listadas na tabela abaixo. (0151) Sequence analysis of several clones obtained by amplification of the cDNA library with SaTps1 specific primers showed some variability at several positions of the cDNA sequence. Seven positions have been identified where two different amino acids can be found. A position was found where insertion of a serine residue occurred in some of the clones. These positions are listed in the table below.

(0152) Essas variações pareceram ocorrer em uma maneira randômica em onze clones diferentes seqüenciados, sugerindo que, no mínimo, duas isoformas relacionadas bem de perto de uma diterpeno-sintase estão presentes no genoma da S. sclarea e que a abordagem de amplificação de PCR levou à mistura das sequências. Dois clones, SsLPPs3 (SEQ ID NO:4) e SsLPPs9 (SEQ ID NO:5), representantes da variabilidade das sequências (Figura 3), foram selecionados para os experimentos de expressão heteróloga e caracterização enzimática.(0152) These variations appeared to occur in a random fashion in eleven different sequenced clones, suggesting that at least two closely related isoforms of a diterpene synthase are present in the S. sclarea genome and that the PCR amplification approach led to the mixing of the sequences. Two clones, SsLPPs3 (SEQ ID NO:4) and SsLPPs9 (SEQ ID NO:5), representing sequence variability (Figure 3), were selected for heterologous expression and enzyme characterization experiments.

(0153) Os plasmídeos pETDuet-SsLPPs3 e pETDuet-SsLPPs9 foram transferidos para células de E. Coli Bl21 (DE3) (Novagen, Madison, WI). Colônias simples de células transformadas foram usadas para inocular 5ml de meio LB. Após 5 a 6 horas de incubação a 37°C, as culturas foram transferidas para uma incubadora a 20°C e deixadas 1 hora para equilíbrio. A expressão da proteína foi, então, induzida pela adição de 1mM de IPTG e a cultura foi incubada durante a noite a 20°C. O dia seguinte, as células foram coletadas por centrifugação, suspensas novamente em volume a 0,1 de 50mM de MOPSO, pH 7, 10% de glicerol e lisados por sonicação. Os extratos foram limpos por centrifugação (30 min a 20.000g) e os sobrenadantes contendo as proteínas solúveis foram usados para experimentos adicionais.(0153) Plasmids pETDuet-SsLPPs3 and pETDuet-SsLPPs9 were transferred into E. coli Bl21 (DE3) cells (Novagen, Madison, WI). Single colonies of transformed cells were used to inoculate 5ml of LB medium. After 5 to 6 hours of incubation at 37°C, the cultures were transferred to a 20°C incubator and allowed to equilibrate for 1 hour. Protein expression was then induced by the addition of 1mM IPTG and the culture was incubated overnight at 20°C. The following day, cells were collected by centrifugation, resuspended in 0.1 volume of 50mM MOPSO, pH 7, 10% glycerol and lysed by sonication. Extracts were cleared by centrifugation (30 min at 20,000g) and supernatants containing soluble proteins were used for further experiments.

(0154) Os extratos de proteína crua de células transformadas de pETDuet-SsLPPs3 e pETDuet-SsLPPs9 foram analisados por SDS-PAGE e comparados com extratos de proteína, obtidos das células transformadas com o plasmídeo pETDuet vazio. As proteínas SsLPPs3 e SsLPPs9 recombinantes (SEQ ID NO:1 e 2) foram claramente detectadas e o peso molecular aparente estimado a 90 Kda, um valor em conformidade com o peso molecular calculado de 83 KDa (Figura 4).(0154) Crude protein extracts from pETDuet-SsLPPs3 and pETDuet-SsLPPs9 transformed cells were analyzed by SDS-PAGE and compared with protein extracts obtained from cells transformed with the empty pETDuet plasmid. Recombinant SsLPPs3 and SsLPPs9 proteins (SEQ ID NO:1 and 2) were clearly detected and the apparent molecular weight estimated at 90 KDa, a value in agreement with the calculated molecular weight of 83 KDa (Figure 4).

Example 3

(0155) Purificação da LPP-sintase da S. sclarea e atividades enzimáticas(0155) Purification of S. sclarea LPP synthase and enzymatic activities

(0156) Para caracterizar adicionalmente as diterpeno-sintases recombinantes, asseguramos purificar as enzimas SsLPPs3 e SsLPPs9 (SEQ ID NO:1 e 2).(0156) To further characterize the recombinant diterpene synthases, we ensured to purify the enzymes SsLPPs3 and SsLPPs9 (SEQ ID NO:1 and 2).

(0157) Os plasmídeos PCR2.1-Topo contendo o cDNA de SsLPPs3 e SsLPPs9 (SEQ ID NO:4 e 5) (Exemplo 2) foram digeridos com NdeI e SacI e as inserções foram ligadas no plasmídeo pET28a(+) (Novagen). Os plasmídeos de expressão resultantes (pET28-SsLPPs3 e pET28-SsLPPs9) contem os cDNAs com uma modificação da extremidade 5’ (SEQ ID NO:26 e 27), criados para expressar as proteínas com uma cauda de hexa-histidina de terminal N. A purificação foi realizada sob condições nativas usando o Sistema de Purificação ProBondTM (Invitrogen), seguindo o protocolo do fabricante, com exceção de que, para a eluição, imidazol foi substituído pela L-histidina para minimizar a inibição da enzima. Usando essa abordagem, as enzimas recombinantes SsLPPs3 e SsLPPs9 poderiam ser purificadas para homogeneidade aparente (Figura 5). a. As enzimas purificadas de afinidade foram incubadas 12 horas a 30°C com 200μM de GGPP e 1mM de DTT em MOPSO, pH 7, 10% de glicerol. Nenhum produto de diterpeno foi observado ao extrair a incubação com pentano e análise do extrato por CG ou CG-MS. O tratamento do mesmo extrato por fosfatase alcalina (Sigma, 6 unidades/ml), seguido por extração com pentano e análise de CG, mostrou a formação de labdenediol (Figura 6) e demonstrou a formação enzimática de labdenediol-difosfato (LPP) como produto único do GGPP pela diterpeno-sintase recombinante.(0157) Plasmids PCR2.1-Topo containing the cDNA of SsLPPs3 and SsLPPs9 (SEQ ID NO:4 and 5) (Example 2) were digested with NdeI and SacI and the inserts were ligated into plasmid pET28a(+) (Novagen) . The resulting expression plasmids (pET28-SsLPPs3 and pET28-SsLPPs9) contain the cDNAs with a 5'-end modification (SEQ ID NO:26 and 27), created to express the proteins with an N-terminal hexahistidine tag. Purification was performed under native conditions using the ProBondTM Purification System (Invitrogen), following the manufacturer's protocol, except that for the elution, imidazole was substituted for L-histidine to minimize enzyme inhibition. Using this approach, recombinant enzymes SsLPPs3 and SsLPPs9 could be purified to apparent homogeneity (Figure 5). The. Affinity purified enzymes were incubated 12 hours at 30°C with 200μM GGPP and 1mM DTT in MOPSO, pH 7, 10% glycerol. No diterpene products were observed when extracting the pentane incubation and analyzing the extract by GC or GC-MS. Treatment of the same extract by alkaline phosphatase (Sigma, 6 units/ml), followed by pentane extraction and GC analysis, showed the formation of labdenediol (Figure 6) and demonstrated the enzymatic formation of labdenediol-diphosphate (LPP) as a product of GGPP by recombinant diterpene synthase.

(0158)A análise de CG foi realizada em um sistema de CG Agilent Série 6890 (Agilent Technologies), equipado com um detector de ionização de chama, usando um diâmetro interno de 0,25mm por coluna capilar SPB-1 de 30mm (Supelco, Bellefonte, PA). O gás carregador foi He em um fluxo constante de 1mL/minuto. A temperatura inicial da estufa foi de 100°C (1 minuto de suspensão), seguida por um gradiente de 10°C/minuto a 300°C.(0158) GC analysis was performed on an Agilent 6890 Series GC system (Agilent Technologies), equipped with a flame ionization detector, using a 0.25mm ID per 30mm SPB-1 capillary column (Supelco, Bellefonte, PA). The carrier gas was He at a constant flow rate of 1mL/minute. The initial oven temperature was 100°C (1 minute of suspension), followed by a gradient of 10°C/minute to 300°C.

(0159)A análise de CG-MS foi realizada em um sistema de CG Séria 6890 (Agilent), acoplado a um detector de massa 5975 (Agilent Technologies). A coluna foi equipada com um diâmetro interno de 0,25mm por coluna DB-1MS de 30m de extensão (Agilent Technologies). O gás carregador foi He em um fluxo constante de 1mL/minuto. A temperatura inicial da estufa foi de 80°C, seguida por um gradiente de 10°C/minuto a 280°C. Os espectros foram registrados a 70eV com uma voltagem de multiplicador de elétron de 2200V. A identificação do produto foi confirmada pela concordância dos tempos de retenção e a equivalência do espectro de massa com o espectro de padrões autênticos.(0159) GC-MS analysis was performed on a Serial 6890 GC system (Agilent), coupled to a 5975 mass detector (Agilent Technologies). The column was equipped with an internal diameter of 0.25mm per 30m long DB-1MS column (Agilent Technologies). The carrier gas was He at a constant flow rate of 1mL/minute. The initial oven temperature was 80°C, followed by a gradient of 10°C/minute to 280°C. Spectra were recorded at 70eV with an electron multiplier voltage of 2200V. Product identification was confirmed by concordance of retention times and equivalence of the mass spectrum with the spectrum of authentic standards.

Example 4

(0160) Deleções do terminal N da LPP-sintase de Salvia sclarea a. Nas plantas, as diterpeno-sintases estão localizadas nos plastídeos. Essa compartimentalização é controlada por um mecanismo de tratamento que reconhece um sinal de peptídeo de trânsito do terminal N. Dessa forma, as diterpeno-sintases são geralmente expressadas como pré-proteínas e são processadas nos plastídeos pela divisão do sinal de peptídeo resultando em uma proteína madura. Análise da sequência do terminal N de SsLPPs3 e SsLPPs9 (SEQ ID NO:1 e 2), usando o método de CloroP (Emanuelsson et al, Protein Science 8, 978-984, 1999; http://www.cbs.dtu.dk/services/ChloroP/) não revelou nenhuma evidência clara da presença de um peptídeo de trânsito. Experimentos foram, dessa forma, realizados para avaliar o efeito das deleções no terminal N sobre a atividade enzimática. Quatro cDNAs truncados foram criados para SsLPPs3 resultando em deleção de 17, 37, 53 e 63 aminoácidos, respectivamente, (SEQ ID NO:28 a 31). Cada construção foi criada por PCR usando quatro primers inversos diferentes cada, criados para enrijecer na posição da forma truncada desejada e introduzindo um local de restrição de NdeI, seguido por um códon de iniciação de tradução de ATG (SsLPPs3_del1, (SEQ ID NO:32); SsLPPs3_del2, (SEQ ID NO:33); SsLPPs3_del3, (SEQ ID NO:34), SsLPPs3_del4, (SEQ ID NO:35)). Esses primers foram usados em combinação com o primer SaTps-Kpn (SEQ ID NO:23) (Exemplo 2) e os quatro cDNAs obtidos (SEQ ID NO:28 a 31) foram ligados no plasmídeo pETDuet-1. Expressão heteróloga das proteínas (SEQ ID NO:36 39) foi realizada em E. coli, conforme descrito no Exemplo 2. A Figura 7 mostra uma análise de SDS-PAGE comparando o nível de produção das proteínas heterólogas obtidas com as diferentes construções de extensão total e truncadas. Um nível de expressão melhorada foi claramente observado especialmente para as duas deleções maiores. Esses resultados são típicos para terpeno-sintases localizadas em plastídeo e refletem uma solubilidade e/ou estabilidade melhorada da proteína madura em comparação com a pré-proteína.(0160) N-terminal deletions of LPP synthase from Salvia sclarea a. In plants, diterpene synthases are located in plastids. This compartmentalization is controlled by a processing mechanism that recognizes an N-terminal transit peptide signal. Thus, diterpene synthases are generally expressed as preproteins and are processed in plastids by cleavage of the signal peptide resulting in a protein mature. N-terminal sequence analysis of SsLPPs3 and SsLPPs9 (SEQ ID NO:1 and 2) using the ChloroP method (Emanuelsson et al, Protein Science 8, 978-984, 1999; http://www.cbs.dtu. dk/services/ChloroP/) did not reveal any clear evidence of the presence of a transit peptide. Experiments were therefore performed to assess the effect of N-terminal deletions on enzyme activity. Four truncated cDNAs were created for SsLPPs3 resulting in deletion of 17, 37, 53 and 63 amino acids, respectively, (SEQ ID NO: 28 to 31). Each construct was created by PCR using four different reverse primers each, engineered to stiffen at the position of the desired truncated shape and introducing an NdeI restriction site, followed by an ATG translation initiation codon (SsLPPs3_del1, (SEQ ID NO:32 ); SsLPPs3_del2, (SEQ ID NO:33); SsLPPs3_del3, (SEQ ID NO:34), SsLPPs3_del4, (SEQ ID NO:35)). These primers were used in combination with the SaTps-Kpn primer (SEQ ID NO:23) (Example 2) and the four cDNAs obtained (SEQ ID NO:28 to 31) were ligated into plasmid pETDuet-1. Heterologous expression of the proteins (SEQ ID NO:36 39) was performed in E. coli, as described in Example 2. Figure 7 shows an SDS-PAGE analysis comparing the production level of the heterologous proteins obtained with the different extension constructs full and truncated. An improved expression level was clearly seen especially for the two major deletions. These results are typical for plastid-located terpene synthases and reflect an improved solubility and/or stability of the mature protein compared to the preprotein.

Example 5

(0161) Sequenciamento massivamente paralelo de uma biblioteca de cDNA da flor S. sclarea(0161) Massively parallel sequencing of a cDNA library from the S. sclarea flower

(0162) Usamos a tecnologia de seqüenciamento paralelo massivo de pequenos fragmentos de DNA, desenvolvida pela Illumina (San Diego, Califórnia) para obter informações de sequência de todas as transcrições (transcriptoma) presentes nas flores Salvia sclarea. Essa técnica de sequenciamento usa uma química de seqüenciamento com base no terminador reversível e os aparatos de Estação de Aglomerado e Seqüenciador de Genoma, desenvolvidos pela Solexa e Illumina (www.illumina.com).(0162) We used the massively parallel sequencing technology of small DNA fragments, developed by Illumina (San Diego, California) to obtain sequence information of all transcripts (transcriptome) present in Salvia sclarea flowers. This sequencing technique uses reversible terminator-based sequencing chemistry and the Cluster Station and Genome Sequencer apparatus developed by Solexa and Illumina (www.illumina.com).

(0163) A tecnologia e os equipamentos foram preparados na Fasteris SA (Genebra, Suíça) e a preparação das amostras de DNA e o sequenciamento foram realizados pela Fasteris SA. Uma alíquota (1μg) da biblioteca de cDNA, gerada das flores S. sclarea em desenvolvimento e usando o Kit de Amplificação de cDNA Marathon™ (Clontech, Mountain View, CA) (Exemplo 1), foi tratada usando o Kit de Preparação de Amostra Genômica (Illumina). Brevemente, o DNA é fragmentado por nebulização, as extremidades são reparadas para gerar extremidades firmes, adaptadores são ligados às extremidades dos fragmentos de DNA e os fragmentos de DNA modificados por adaptator são amplificados por PCR. Após controlar a qualidade da biblioteca por eletroforese por gel, a geração dos aglomerados de DNA sobre a célula de fluxo e a reação de sequenciamento é realizada nos equipamentos de Estação de Aglomerado e Sequenciador de Genoma. Usando essa tecnologia, 1,9 milhão de curtas sequências (leituras) de 35 bases foram obtidas.(0163) Technology and equipment were prepared at Fasteris SA (Geneva, Switzerland) and DNA sample preparation and sequencing were performed by Fasteris SA. An aliquot (1μg) of the cDNA library, generated from developing S. sclarea flowers and using the Marathon™ cDNA Amplification Kit (Clontech, Mountain View, CA) (Example 1), was treated using the Sample Preparation Kit Genomics (Illumina). Briefly, the DNA is fragmented by spraying, the ends are repaired to generate tight ends, adapters are ligated to the ends of the DNA fragments, and the adaptor-modified DNA fragments are amplified by PCR. After controlling the quality of the library by gel electrophoresis, the generation of DNA clusters on the flow cell and the sequencing reaction is carried out in the Cluster Station and Genome Sequencer equipment. Using this technology, 1.9 million short sequences (reads) of 35 bases were obtained.

(0164) O software Edena (Hernandez et al, Genome res. 15(5), 802-809, 2008) foi usado para remontar sequências contíguas. As cinco últimas bases foram primeiramente removidas de cada leitura devido às possíveis incorporações erradas, devido à baixa fidelidade nos últimos ciclos do procedimento de sequenciamento. Os parâmetros do software foram estabelecidos para permitir a extensão mínima de 15 bases para as sobreposições com identificação estrita (100%). Os contigs (sequências contíguas) com uma extensão de, no mínimo, 50 bases foram retidos. Nessas condições, 2054 contigs de 50 a 1330 bases em extensão poderiam ser reconstituídos.(0164) Edena software (Hernandez et al, Genome res. 15(5), 802-809, 2008) was used to reassemble contiguous sequences. The last five bases were first removed from each read due to possible wrong incorporations due to low fidelity in the last cycles of the sequencing procedure. The software parameters were set to allow a minimum length of 15 bases for overlays with strict identification (100%). Contigs (contiguous sequences) with a length of at least 50 bases were retained. Under these conditions, 2054 contigs from 50 to 1330 bases in length could be reconstituted.

(0165) Para avaliar a qualidade da montagem, os contigs foram pesquisados com relação à identificação de sequência com a sequência de DNA de SsLPPs3, as diterpeno-sintases de classe II, primeiramente isoladas da biblioteca de cDNA de S. sclarea (SEQ ID NO:4, Exemplo 2). Essa pesquisa foi realizada usando o método de BLASTn (Altschul et al, J. Mol Biol. 215, 403-410, 1990). De forma surpreendente, apenas 3 contigs de extensões de 81, 73 e 52 bases (contigs 1 a 3, SEQ ID NO:40 a 42) foram encontrados e apenas quarenta leituras foram usadas pelo software Eland para gerar esses contigs. O alinhamento com a sequência de referência SsLPPs3 mostrou que os 3 contigs cobriram apenas 8,7% da sequência de extensão total, embora com uma identificação de 99%.(0165) To assess assembly quality, contigs were screened for sequence identification with the DNA sequence of SsLPPs3, the class II diterpene synthases, first isolated from the S. sclarea cDNA library (SEQ ID NO :4, Example 2). This search was performed using the BLASTn method (Altschul et al, J. Mol Biol. 215, 403-410, 1990). Surprisingly, only 3 contigs of lengths of 81, 73 and 52 bases (contigs 1 to 3, SEQ ID NO:40 to 42) were found and only forty reads were used by the Eland software to generate these contigs. Alignment with the SsLPPs3 reference sequence showed that the 3 contigs covered only 8.7% of the full-length sequence, albeit with a 99% identification.

(0166) Informações de sequência muito limitadas foram relatadas nos bancos de dados públicos para Salvia sclarea. A única sequência genética disponível do banco de dados NCBI (http://www.ncbi.nlm.nih.gov) foi a sequência da grande subunidade da ribulose-1,5-bifosfato carboxilase (RuBisCO) da salvia sclarea (No de acesso NCBI Z37450). A pesquisa dos contigs com relação à identificação de DNA com essa sequência de DNA de RuBisCO de S. sclarea (Pesquisa de BLASTn) forneceu dois contigs de 870 e 547 bases, respectivamente (contigs 4 e 5, SEQ ID NO:43 e 44). O alinhamento dos dois contigs com a sequência de RuBisCO mostrou cobertura de 98%: apenas 27 bases (entre a posição 858 e 884) das 1420 bases não estavam presentes nos contigs. Além dessa cobertura quase completa, a identificação entre a sequência de referência e os contigs foi de 99,5%, representando uma diferença de apenas 7 nucleotídeos.(0166) Very limited sequence information has been reported in public databases for Salvia sclarea. The only genetic sequence available from the NCBI database (http://www.ncbi.nlm.nih.gov) was the large subunit sequence of ribulose-1,5-bisphosphate carboxylase (RuBisCO) from salvia sclarea (accession no. NCBI Z37450). Searching the contigs for DNA identification with this S. sclarea RuBisCO DNA sequence (BLASTn Search) yielded two contigs of 870 and 547 bases, respectively (contigs 4 and 5, SEQ ID NO:43 and 44) . Alignment of the two contigs with the RuBisCO sequence showed 98% coverage: only 27 bases (between position 858 and 884) out of the 1420 bases were not present in the contigs. In addition to this almost complete coverage, the identification between the reference sequence and the contigs was 99.5%, representing a difference of only 7 nucleotides.

(0167) Todas as leituras (dados não-montados) foram, então, pesquisadas com relação à identificação de sequência com a sequência de SsLPPs3 (SEQ ID NO:4). O software Eland (Illumina) foi usado para realizar essa pesquisa, permitindo um máximo de 2 divergências com a sequência de referência. Um total de 616 leituras foram recuperadas. O alinhamento dos fragmentos selecionados com a sequência de referência revelou que a sequência de SsLPPs3 foi coberta na extensão total com uma cobertura levemente maior (mais leituras) em direção da extremidade 3’. A mesma manipulação com a sequência de RuBisCO mostrou que 1650 leituras foram obtidas para essa sequência. A cobertura da sequência de referência com as leituras foi muito maior para a RuBisCO do que para a SsLPPs3. Para SsLPPs3 (SEQ ID NO:4), diversas regiões pequenas sem cobertura e regiões com ambiguidade de sequência entre leituras foram encontradas. Essa cobertura incompleta impede a remontagem completa e é certamente a razão para a geração de apenas alguns contigs muito pequenos.(0167) All reads (unassembled data) were then searched for sequence identification with the sequence of SsLPPs3 (SEQ ID NO:4). Eland software (Illumina) was used to perform this search, allowing a maximum of 2 divergences from the reference sequence. A total of 616 readings were retrieved. Alignment of selected fragments with the reference sequence revealed that the SsLPPs3 sequence was covered to the fullest extent with slightly greater coverage (more reads) towards the 3' end. The same manipulation with the RuBisCO sequence showed that 1650 reads were obtained for this sequence. Coverage of the reference sequence with the reads was much higher for RuBisCO than for SsLPPs3. For SsLPPs3 (SEQ ID NO:4), several small gap regions and regions with sequence ambiguity between reads were found. This incomplete coverage prevents complete reassembly and is certainly the reason for generating only a few very small contigs.

Example 6

(0168) Extração de sequências semelhantes a diterpeno-sintases de classe I a partir dos dados de sequenciamento(0168) Extraction of class I diterpene synthase-like sequences from sequencing data

(0169) O algoritmo de Blast (Altschul et al, J. Mol. Biol. 215, 403-410, 1990) foi usado para pesquisar a homologia das sequências de aminoácido deduzidas com sequências de diterpeno-sintases de classe I.(0169) The Blast algorithm (Altschul et al, J. Mol. Biol. 215, 403-410, 1990) was used to search for homology of the deduced amino acid sequences with sequences of class I diterpene synthases.

(0170) Uma pesquisa de Blastx contra um banco de dados de proteína foi primeiramente realizada com os 2054 contigs. Essa pesquisa forneceu apenas um contig (contig 1610, SEQ ID NO:45), apresentando homologia de sequência com diterpeno-sintases de classe I. A sequência de aminoácido deduzida desse contig continha o motivo DDxxD, característico da ciclização iniciada por ionização de prenil-difosfatos.(0170) A Blastx search against a protein database was first performed on the 2054 contigs. This search yielded only one contig (contig 1610, SEQ ID NO:45), showing sequence homology with class I diterpene synthases. The deduced amino acid sequence of this contig contained the DDxxD motif, characteristic of cyclization initiated by prenyl-ionization. diphosphates.

(0171) Uma fração dos dados brutos, representando aproximadamente 3x105 leituras foi, então, pesquisada com relação à homologia com diterpeno-sintases de classe I. As leituras foram pesquisadas usando o algoritmo de tBlastn com cinco sequências de aminoácido de diterpeno-sintase de classe I selecionados (números de acesso NCBI AAC39443, BAB19275, BAB12441, AAD34295, AAS98912). Essa pesquisa selecionou 462 leituras, que foram, então, processadas usando o programa CAP (Huang, Genomics 14(1), 18-25, 1992) para identificar sequências de sobreposição. Uma pequena porção das leituras poderia ser montada em curtos contigs de extensão máxima de 111 bases. Esses contigs, bem como as leituras isoladas remanescentes, foram usados para pesquisa de Blastx contra um banco de dados de proteína para confirmar sua identificação com diterpeno-sintases de classe I. Finalmente, 5 fragmentos de DNA foram retidos (SEQ ID NO:46 a 50).(0171) A fraction of the raw data, representing approximately 3x105 reads, was then searched for homology to class I diterpene synthases. The reads were searched using the tBlastn algorithm with five class I diterpene synthase amino acid sequences. I selected (NCBI accession numbers AAC39443, BAB19275, BAB12441, AAD34295, AAS98912). This search selected 462 reads, which were then processed using the CAP program (Huang, Genomics 14(1), 18-25, 1992) to identify overlapping sequences. A small portion of the reads could be assembled into short contigs of a maximum length of 111 bases. These contigs, as well as the remaining isolated reads, were used to screen Blastx against a protein database to confirm its identification with class I diterpene synthases. Finally, 5 DNA fragments were retained (SEQ ID NO:46 to 50).

(0172) As sequências de aminoácido (SEQ ID NO:51 a 55) foram deduzidas dos fragmentos selecionados e foram alinhadas com sequências de diterpeno-sintases de referência, permitindo seu posicionamento relativo. A figura 8 mostra um alinhamento dessas sequências com a sequência de diterpeno-sintase de extensão completa da estemodeno-sintase da Oriza sativa (Morrone et al, 2006; No de acesso NCBI AAZ76733) coletado como referência.(0172) Amino acid sequences (SEQ ID NO:51 to 55) were deduced from the selected fragments and were aligned with reference diterpene synthase sequences, allowing their relative positioning. Figure 8 shows an alignment of these sequences with the full-length diterpene synthase sequence of Oriza sativa estemodeno synthase (Morrone et al, 2006; NCBI Accession No. AAZ76733) collected as a reference.

Example 7

(0173) Amplificação por PCR de cDNAs de diterpeno-sintases de classe I de extensão completa(0173) PCR amplification of full-length class I diterpene synthase cDNAs

(0174) Um conjunto de oligonucleotídeos inverso e reverso foi deduzido das sequências de DNA relacionadas com diterpeno-sintases, selecionadas do sequenciamento da biblioteca de cDNA de S. sclarea (Exemplo 6). Esses primers foram usados em combinação com primers adaptadores de cDNA em amplificações por PCR do tipo 3’/5’ RACE. As amplificações foram realizadas usando a biblioteca de cDNA de S. sclarea, preparada conforme descrito acima no Exemplo 1, seguindo o protocolo do Kit de Amplificação de cDNA MarathonTM (Clontech, Mountain View, CA). As condições cíclicas térmicas foram as seguintes: 1 min a 94°C, 5 ciclos de 30 seg a 94°C e 4 min a 72°C, 5 ciclos de 30 seg a 94°C e 4 min a 70°C, 20 ciclos de 30 seg a 94°C e 4 min a 68°C.(0174) A set of reverse and reverse oligonucleotides was deduced from DNA sequences related to diterpene synthases selected from the sequencing of the S. sclarea cDNA library (Example 6). These primers were used in combination with cDNA adapter primers in 3'/5' RACE PCR amplifications. Amplifications were performed using the S. sclarea cDNA library, prepared as described above in Example 1, following the Marathon™ cDNA Amplification Kit protocol (Clontech, Mountain View, CA). The thermal cycling conditions were as follows: 1 min at 94°C, 5 cycles of 30 sec at 94°C and 4 min at 72°C, 5 cycles of 30 sec at 94°C and 4 min at 70°C, 20 cycles of 30 sec at 94°C and 4 min at 68°C.

(0175) Usando o primer Cont250-Fwd (SEQ ID NO:56), uma sequência de DNA de 547 bp (1130Cont250, SEQ ID NO:66) foi obtida. Análise da sequência revelou que esta correspondeu à extremidade 5’ de um cDNA de diterpeno-sintase e conteve 348 bp da região de codificação. Com o primer Cont147_fw1 (SEQ ID NO:57) e Cont147_fw2 (SEQ ID NO:58), obtivemos uma sequência de 1473 bp (1132Cont147, SEQ ID NO:67), contendo a extremidade 3’ e 1293 bp da região de codificação de um cDNA de diterpeno-sintase. Os primers Cont147_rev1 (SEQ ID NO:59) e Cont147_rev2 (SEQ ID NO:60) permitiram a amplificação de um fragmento de DNA de 464 bp (1134Cont147, SEQ ID NO:68). O aminoácido deduzido mostrou homologia com diterpeno-sintases, mas alinhamento com outras sequências de diterpeno-sintases sugeriu que 200 a 300 códons ainda estavam faltando para atingir a extremidade 5’. Todas as sequências obtidas por essa séria de amplificação diferiram significativamente das sequências de SsLPPs previamente isoladas (SsLPPs3 e SsLPPs9, SEQ ID NO:4 e 5).(0175) Using the primer Cont250-Fwd (SEQ ID NO:56), a 547 bp DNA sequence (1130Cont250, SEQ ID NO:66) was obtained. Sequence analysis revealed that it corresponded to the 5' end of a diterpene synthase cDNA and contained 348 bp of coding region. With the primer Cont147_fw1 (SEQ ID NO:57) and Cont147_fw2 (SEQ ID NO:58), we obtained a 1473 bp sequence (1132Cont147, SEQ ID NO:67), containing the 3' end and 1293 bp of the coding region of a diterpene synthase cDNA. The primers Cont147_rev1 (SEQ ID NO:59) and Cont147_rev2 (SEQ ID NO:60) allowed the amplification of a 464 bp DNA fragment (1134Cont147, SEQ ID NO:68). The deduced amino acid showed homology with diterpene synthases, but alignment with other diterpene synthase sequences suggested that 200 to 300 codons were still missing to reach the 5' end. All sequences obtained by this round of amplification differed significantly from sequences from previously isolated SsLPPs (SsLPPs3 and SsLPPs9, SEQ ID NO:4 and 5).

(0176) Uma abordagem de 5’RACE foi usada para identificar a extremidade 5' da ORF, correspondente à sequência 1132Cont147 (SEQ ID NO:67). Usando os primers 1132_race1 (SEQ ID NO:62) e 1132_race2 (SEQ ID NO:63), uma sequência de 536 bp (1132RACE, SEQ ID NO:69) foi obtida, a qual tinha sobreposição de 41 bases com o fragmento 1132Cont147 (SEQ ID NO:67). O N-term desse produto de RACE foi idêntico à sequência 1134Cont147 previamente obtida (SEQ ID NO:68) e, dessa forma, nenhuma extensão na extremidade 5’ foi observada. Conforme observado previamente, essa sequência teve homologia com diterpeno-sintases, mas pareceu mais curta em, no mínimo, 200 códons do que todas as outras sequências de diterpeno-sintases publicadas. Experimentos de 5’RACE foram realizados, a fim de tentar estender a sequência em direção da extremidade 5’ da sequência 1132Cont147 (SEQ ID NO:67) e identificar a verdadeira códon de iniciação de tradução. Diversos conjuntos de oligonucleotídeos foram criados, mas nenhuma informação de sequência adicional foi obtida. Isso nos levou a supor que um dos códons ATG na sequência 1134Cont147 (SEQ ID NO:68) foi realmente o códon de iniciação do gene de diterpeno-sintase correspondente. A sequência nucleotídica dessa diterpeno-sintase putativa (denominada SsTps1132, SEQ ID NO:6) foi reconstituída das sequências 1132Cont147 (SEQ ID NO:67) e 1132RACE (SEQ ID NO:69). Pegando o primeiro ATG, a ORF de 1728 bp da SsTps1132 (SEQ ID NO:6) codificou para uma proteína de 575 aminoácidos (SEQ ID NO:3). Essa proteína conteve o motivo dependente de ionização (DDFFD) e homologia compartilhada, mas relativamente, baixo, com as diterpeno-sintases publicadas; a sequência mais próxima sendo uma terpeno-sintase de Nicotiana tabacum (No de acesso NCBI AAS98912), identificação de 37%. Essa proteína também compartilhou apenas 23% de identificação com SsLPPs isoladas de S. Sclarea nos Exemplos 1 a 4. SsTps1132 foi alinhada com sequências de diterpeno-sintase selecionadas. Esses alinhamentos mostraram que a SsTps1132 (SEQ ID NO: 3) é truncada na extremidade do terminal N por 150 a 240 aminoácidos, em comparação com outras diterpeno-sintases.(0176) A 5'RACE approach was used to identify the 5' end of the ORF, corresponding to sequence 1132Cont147 (SEQ ID NO:67). Using primers 1132_race1 (SEQ ID NO:62) and 1132_race2 (SEQ ID NO:63), a 536 bp sequence (1132RACE, SEQ ID NO:69) was obtained, which overlapped by 41 bases with the fragment 1132Cont147 ( SEQ ID NO:67). The N-term of this RACE product was identical to the previously obtained 1134Cont147 sequence (SEQ ID NO:68) and therefore no extension to the 5' end was observed. As previously noted, this sequence had homology to diterpene synthases, but appeared shorter by at least 200 codons than all other published diterpene synthase sequences. 5'RACE experiments were performed in order to try to extend the sequence towards the 5' end of the 1132Cont147 sequence (SEQ ID NO:67) and to identify the true translation initiation codon. Several sets of oligonucleotides were created, but no further sequence information was obtained. This led us to assume that one of the ATG codons in sequence 1134Cont147 (SEQ ID NO:68) was actually the start codon of the corresponding diterpene synthase gene. The nucleotide sequence of this putative diterpene synthase (named SsTps1132, SEQ ID NO:6) was reconstructed from sequences 1132Cont147 (SEQ ID NO:67) and 1132RACE (SEQ ID NO:69). Taking the first ATG, the 1728 bp ORF of SsTps1132 (SEQ ID NO:6) encoded a protein of 575 amino acids (SEQ ID NO:3). This protein contained the ionization-dependent motif (DDFFD) and shared, but relatively low, homology with the published diterpene synthases; the closest sequence being a terpene synthase from Nicotiana tabacum (NCBI Accession No. AAS98912), identification 37%. This protein also shared only 23% identification with SsLPPs isolated from S. sclarea in Examples 1 to 4. SsTps1132 was aligned with selected diterpene synthase sequences. These alignments showed that SsTps1132 (SEQ ID NO: 3) is truncated at the N-terminal end by 150 to 240 amino acids compared to other diterpene synthases.

(0177) O método de CloroP (Emanuelsson et al, Protein Science 8, 978-984, 1999; http://www.cbs.dtu.dk/services/ChloroP/) foi usado para prever a presença de um peptídeo de trânsito de cloroplasto em SsTps1132 (SEQ ID NO:3). Um peptídeo de trânsito de cloroplasto de 51 aminoácidos foi previsto, sustentando uma localização de cloroplasto dessa proteína.(0177) The ChloroP method (Emanuelsson et al, Protein Science 8, 978-984, 1999; http://www.cbs.dtu.dk/services/ChloroP/) was used to predict the presence of a transit peptide of chloroplast in SsTps1132 (SEQ ID NO:3). A 51 amino acid chloroplast transit peptide was predicted, supporting a chloroplast localization of this protein.

(0178) A pesquisa de todas as leituras com relação a sequências idênticas à sequência de DNA SsTps1132 (SEQ ID NO:6) forneceu 425 leituras. O nível de expressão de SsTps1132 (220 leituras/Kb) foi semelhante ao nível de expressão de SsLPPs (SEQ ID NO:4 e 5) (260 leituras/Kb). Com a hipótese de que etapas catalisadoras de enzimas na mesma via metabólica são geralmente expressadas em um nível semelhante, pode-se especular que a SsTps1132 está envolvida na mesma via metabólica que as SsLPPs.(0178) Searching all reads for sequences identical to the SsTps1132 DNA sequence (SEQ ID NO:6) yielded 425 reads. The expression level of SsTps1132 (220 reads/Kb) was similar to the expression level of SsLPPs (SEQ ID NO:4 and 5) (260 reads/Kb). With the hypothesis that enzyme catalytic steps in the same metabolic pathway are generally expressed at a similar level, it can be speculated that SsTps1132 is involved in the same metabolic pathway as SsLPPs.

(0179) Os contigs gerados com o software Edena (Exemplo 5) foram pesquisados para sequências de DNA, idênticas às sequências das novas diterpeno-sintases de classe I putativas SsTps1132 (SEQ ID NO:3) Quatro contigs foram encontrados. O contig previamente identificado 1610 (SEQ ID NO:45) e três contigs adicionais (de extensão de 53 a 96 bp, SEQ ID NO:70 a 72), não previamente identificados como fragmento de uma diterpeno-sintase. A pesquisa de Blastx com essas três sequências não mostrou homologia com sequências de proteína conhecidas. A falha em descobrir homologia para esses contigs é devido às extensões curtas desses fragmentos e à baixa homologia de SsTps1132 com as diterpeno-sintases presentes nos bancos de dados.(0179) Contigs generated with the Edena software (Example 5) were searched for DNA sequences, identical to the sequences of the new putative class I diterpene synthases SsTps1132 (SEQ ID NO:3) Four contigs were found. The previously identified contig 1610 (SEQ ID NO:45) and three additional contigs (53 to 96 bp in length, SEQ ID NO:70 to 72), not previously identified as a fragment of a diterpene synthase. Blastx search of these three sequences showed no homology to known protein sequences. The failure to discover homology for these contigs is due to the short lengths of these fragments and the low homology of SsTps1132 with the diterpene synthases present in the databases.

Example 8

(0180) Expressão heteróloga das diterpeno-sintases de classe I de S. sclarea na E. coli(0180) Heterologous expression of S. sclarea class I diterpene synthases in E. coli

(0181) Para determinar uma atividade enzimática para SsTps1132 (SEQ ID NO:3), as proteínas recombinantes foram expressadas na E. coli. Os cDNAs de extensão total foram inseridos no vetor pet101/D-TOPO, usando o Kit de Expressão TOPO Direcional Champion pET101.(0181) To determine an enzymatic activity for SsTps1132 (SEQ ID NO:3), recombinant proteins were expressed in E. coli. The full-length cDNAs were inserted into the pet101/D-TOPO vector using the pET101 Champion Directional TOPO Expression Kit.

(0182) Duas construções foram preparadas: uma para expressar a proteína de extensão total e uma para expressar uma proteína truncada, com base na predição do peptídeo de trânsito de cloroplasto. A estrutura de leitura aberta de SsTps1132 de extensão total (SEQ ID NO:6) foi amplificada da biblioteca de cDNA, usando o par de primer 1132_início_1 (SEQ ID NO:64) e 1132-interrupção (SEQ ID NO:61). Os primers 1132_início2 (SEQ ID NO:65) e 1132_interrupção (SEQ ID NO:61) foram usados para preparar a construção para a expressão de SsTps1132 (SEQ ID NO:3) com uma deleção no terminal N de 50 aminoácidos. Todas as amplificações de cDNA para expressão das construções de expressão foram realizadas usando a polimerase de DNA Pfu (Promega), em um volume final de 50μl, contendo 5μg de tampão 10X de polimerase de DNA Pfu, 200μM cada de dNTP, 0,4μM cada de primer inverso e reverso, 2,9 unidades de polimerase de DNA Pfu e 5μl de cDNA 100 vezes diluído (preparado conforme descrito no presente no Exemplo 1 usando o Kit de Amplificação de cDNA Marathon™ (Clontech)). As condições cíclicas térmicas foram as seguintes: 1,5 min a 95°C; 30 ciclos de 45 seg a 95°C, 30 seg a 58°C e 5 min a 72°C; e 10 min a 72°C.(0182) Two constructs were prepared: one to express the full-length protein and one to express a truncated protein, based on the prediction of the chloroplast transit peptide. The full-length SsTps1132 open reading frame (SEQ ID NO:6) was amplified from the cDNA library using primer pair 1132_start_1 (SEQ ID NO:64) and 1132-stop (SEQ ID NO:61). Primers 1132_start2 (SEQ ID NO:65) and 1132_stop (SEQ ID NO:61) were used to prepare the construct for expression of SsTps1132 (SEQ ID NO:3) with an N-terminal deletion of 50 amino acids. All cDNA amplifications for expression of the expression constructs were performed using Pfu DNA polymerase (Promega), in a final volume of 50μl, containing 5μg of Pfu DNA polymerase 10X buffer, 200μM each of dNTP, 0.4μM each of reverse and reverse primer, 2.9 units of Pfu DNA polymerase and 5µl of 100-fold diluted cDNA (prepared as described herein in Example 1 using the Marathon™ cDNA Amplification Kit (Clontech)). Thermal cycling conditions were as follows: 1.5 min at 95°C; 30 cycles of 45 sec at 95°C, 30 sec at 58°C and 5 min at 72°C; and 10 min at 72°C.

(0183) Após a ligação no vetor pET101, diversos clones foram selecionados para cada construção e foram sequenciados para assegurar que nenhuma mutação tenha sido introduzida durante a amplificação de PCR. Duas construções foram selecionadas: SsTps1132 (SEQ ID NO:6) e 1132-2-5 (SEQ ID NO:73). O alinhamento das duas sequências de aminoácido deduzidas dessas construções é mostrado na Figura 9.(0183) After ligation into the pET101 vector, several clones were selected for each construct and were sequenced to ensure that no mutations were introduced during PCR amplification. Two constructs were selected: SsTps1132 (SEQ ID NO:6) and 1132-2-5 (SEQ ID NO:73). The alignment of the two amino acid sequences deduced from these constructs is shown in Figure 9.

(0184) Os plasmídeos pET101-SsTps1132 e pET101-1132-2-5 foram transferidos para células de E. Coli Bl21 (DE3) (Novagene, Madison, WI). Colônias simples de células transformadas foram usadas para inocular 5ml de meio LB. Após 5 a 6 horas de incubação a 37°C, as culturas foram transferidas para uma incubadora a 20°C e deixadas 1 hora para equilíbrio. A expressão da proteína foi, então, induzida pela adição de 1mM de IPTG e a cultura foi incubada durante a noite a 20°C. O dia seguinte, as células foram coletadas por centrifugação, suspensas novamente em volume a 0,1 de 50mM de MOPSO, pH 7, 10% de glicerol e lisados por sonicação. Os extratos foram limpos por centrifugação (30 min a 20.000g) e os sobrenadantes contendo as proteínas solúveis foram usados para experimentos adicionais. Os extratos de proteína crua foram analisados por SDS-PAGE e comparados com extratos de proteína, obtidos das células transformadas com o plasmídeo pET101 vazio. Pareceu que a deleção do sinal de peptídeo melhorou a expressão heteróloga na E. coli.(0184) Plasmids pET101-SsTps1132 and pET101-1132-2-5 were transferred into E. coli Bl21 (DE3) cells (Novagene, Madison, WI). Single colonies of transformed cells were used to inoculate 5ml of LB medium. After 5 to 6 hours of incubation at 37°C, the cultures were transferred to a 20°C incubator and allowed to equilibrate for 1 hour. Protein expression was then induced by the addition of 1mM IPTG and the culture was incubated overnight at 20°C. The following day, cells were collected by centrifugation, resuspended in 0.1 volume of 50mM MOPSO, pH 7, 10% glycerol and lysed by sonication. Extracts were cleared by centrifugation (30 min at 20,000g) and supernatants containing soluble proteins were used for further experiments. Crude protein extracts were analyzed by SDS-PAGE and compared with protein extracts obtained from cells transformed with empty plasmid pET101. It appeared that deletion of the signal peptide improved heterologous expression in E. coli.

Example 9

(0185) Atividade enzimática das diterpeno-sintases de classe I recombinantes de S. Sclarea na E. coli'(0185) Enzyme activity of recombinant class I diterpene synthases from S. sclarea in E. coli'

(0186) Os extratos de proteína crua de E. coli, contendo as proteínas recombinantes e preparados conforme descrito no Exemplo 8 foram usados para a caracterização das atividades enzimáticas. Os ensaios enzimáticos foram realizados conforme descrito no Exemplo 3. Todos os ensaios foram realizados em 50mM de MOPSO, pH 7, 10% de glicerol, 1mM de DTT.(0186) E. coli crude protein extracts, containing the recombinant proteins and prepared as described in Example 8 were used for the characterization of enzymatic activities. Enzymatic assays were performed as described in Example 3. All assays were performed in 50mM MOPSO, pH 7, 10% glycerol, 1mM DTT.

(0187)As atividades enzimáticas foram primeiramente avaliadas usando um substrato de GGPP ou LPP, o produto de SsLPPs e o intermediário presumido na biossíntese de esclareol (Exemplos 1 a 4). GGPP foi sintetizado conforme descrito por Keller e Thompson (J. Chromatogr 645(1), 1993, 161-167) e LPP foi preparado enzimaticamente conforme descrito no Exemplo 3. Os ensaios foram realizados na presença de 10 a 100μM de substrato, 15mM de MgCl2 e 0,1 a 0,5mg de proteína crua em um volume total de 1mL. Os tubos foram incubados 4 a 12 horas a 30°C e extraídos duas vezes com um volume de pentano. Após concentração sob um fluxo de nitrogênio, os extratos foram analisados por CG e CG/MS (usando as condições descritas no Exemplo 3) e comparados com extratos do ensaio com proteínas de controle (obtidas de células transformadas com o plasmídeo vazio). Com GGPP como substrato, nenhuma atividade foi observada com qualquer uma das proteínas recombinantes (dados não mostrados). Com o LPP como substrato, atividade foi observada com SsTps1132 (SEQ ID NO:3) e 1132-2-5 (SEQ ID NO:74) (Figura 10). As enzimas foram também ativas na ausência de MgCl2 e os mesmos perfis de produto foram observados com quase a mesma atividade geral. A identificação de produto foi confirmada pela concordância dos tempos de retenção (Figura 10) e comparação do espectro de massa com o espectro de um padrão autêntico (Figura 11). Em todos os ensaios,um pico único de esclareol foi observado sem traço de produto adicional.(0187) Enzyme activities were first evaluated using a GGPP or LPP substrate, the product of SsLPPs and the presumed intermediate in sclareol biosynthesis (Examples 1 to 4). GGPP was synthesized as described by Keller and Thompson (J. Chromatogr 645(1), 1993, 161-167) and LPP was prepared enzymatically as described in Example 3. Assays were performed in the presence of 10 to 100μM substrate, 15mM MgCl2 and 0.1 to 0.5mg of crude protein in a total volume of 1mL. Tubes were incubated 4 to 12 hours at 30°C and extracted twice with one volume of pentane. After concentration under nitrogen flow, the extracts were analyzed by GC and GC/MS (using the conditions described in Example 3) and compared with extracts from the control protein assay (obtained from cells transformed with the empty plasmid). With GGPP as substrate, no activity was observed with any of the recombinant proteins (data not shown). With LPP as substrate, activity was observed with SsTps1132 (SEQ ID NO:3) and 1132-2-5 (SEQ ID NO:74) (Figure 10). The enzymes were also active in the absence of MgCl2 and the same product profiles were observed with almost the same overall activity. Product identification was confirmed by matching retention times (Figure 10) and comparing the mass spectrum with the spectrum of an authentic standard (Figure 11). In all assays, a single sclareol peak was observed with no trace of additional product.

(0188) Ensaios foram, então, realizados com coincubação das diterpeno-sintases de classe II (SsLPPs3, SEQ ID NO:1; Exemplos 1-4) e as diterpeno-sintases de classe I (série 1132, SEQ ID NO:3 e 74). Ensaios foram realizados em 50mM de MOPSO, pH 7, 10% de glicerol, 1mM de DTT, 50μM de GGPP, com 1mM de MgCl2 e na presença de 50μL dos extratos de proteína crua da E. coli, expressando as diferentes construções. Dessa forma, ensaios na presença de 50μL de extratos de proteína crua contendo a enzima recombinante SsLPPs3 (SEQ ID NO:1) e 50μL de extratos contendo SsTps1132 (SEQ ID NO:3) ou 1132-2-5 (SEQ ID NO:74) foram avaliados com relação à produção de produtos de diterpeno. A Figura 12 mostra os perfis de CG de extratos dessas incubações na presença de MgCl2. O esclareol foi produzido com ambas as construções de 1132 (SEQ ID NO:3 e 74), um resultado resistente com o ensaio descrito acima com LPP como substrato. Nenhuma diferença significativa foi observada ao omitir MgCl2 das incubações (dados não mostrados).(0188) Assays were then performed with coincubation of class II diterpene synthases (SsLPPs3, SEQ ID NO:1; Examples 1-4) and class I diterpene synthases (series 1132, SEQ ID NO:3 and 74). Assays were performed in 50mM MOPSO, pH 7, 10% glycerol, 1mM DTT, 50μM GGPP, with 1mM MgCl2 and in the presence of 50μL of E. coli crude protein extracts, expressing the different constructs. Thus, assays in the presence of 50μL of crude protein extracts containing the recombinant enzyme SsLPPs3 (SEQ ID NO:1) and 50μL of extracts containing SsTps1132 (SEQ ID NO:3) or 1132-2-5 (SEQ ID NO:74 ) were evaluated for the production of diterpene products. Figure 12 shows the GC profiles of extracts from these incubations in the presence of MgCl2. Sclareol was produced with both 1132 constructs (SEQ ID NO:3 and 74), a result resistant to the assay described above with LPP as substrate. No significant difference was observed when omitting MgCl2 from incubations (data not shown).

(0189) Concluindo, a SsTps1132 (SEQ ID NO:6) codifica a esclareol-sintase e catalisa a conversão de LPP para esclareol.(0189) In conclusion, SsTps1132 (SEQ ID NO:6) encodes sclareol synthase and catalyzes the conversion of LPP to sclareol.

(0190) Dessa forma, mostramos que, na Salvia sclarea, o esclareol é sintetizado do GGPP em duas etapas por duas enzimas distintas, uma LPP-sintase e uma esclareol-sintase. Isolamos cDNAs que codificam cada uma das duas diterpeno- sintases. A LPP-sintase, codificada pelos cDNAs de SsLPPs3 e SsLPPs9, catalisa a conversão de GGPP em LPP e contém os componentes características de diterpeno-sintases de classe II. A esclareol-sintase, codificada pelo cDNA de SsTps1132, catalisa a conversão de LPP em esclareol e é relacionada às diterpeno- sintases de classe I embora com algumas particularidades, isto é, uma deleção grande na extremidade do terminal N.(0190) Thus, we show that, in Salvia sclarea, sclareol is synthesized from GGPP in two stages by two distinct enzymes, an LPP synthase and a sclareol synthase. We isolated cDNAs encoding each of the two diterpene synthases. LPP synthase, encoded by the SsLPPs3 and SsLPPs9 cDNAs, catalyzes the conversion of GGPP to LPP and contains the characteristic components of class II diterpene synthases. Sclareol synthase, encoded by the SsTps1132 cDNA, catalyzes the conversion of LPP to sclareol and is related to class I diterpene synthases although with some peculiarities, i.e. a large deletion at the N-terminal end.

Example 10

(0191) Produção in vivo de esclareol em E. coli por coexpressão das duas diterpeno- sintases.(0191) In vivo production of sclareol in E. coli by coexpression of the two diterpene synthases.

(0192) Para avaliar a produção in vivo de esclareol nas células E. coli, plasmídeos e células transformadas são preparados para a coexpressão das duas diterpeno- sintases (a LPP-sintase e a esclareol-sintase). Além das duas diterpeno-sintases, uma FPP-sintase e uma GGPP-sintase também são coexpressadas para assegurar um agrupamento suficiente de GGPP nas células. Para aumentar adicionalmente o fluxo de carbono na via e aumentar o nível de GGPP e subsequentemente o nível de esclareol produzido, os genes que codificam uma via do mevalonato parcial também são expressados nas mesmas células. Esses últimos genes codificam uma mevalonato quinase (mvaK1), um fosfomevalonato quinase (mvaK2), a mevalonato difosfato decarboxilase (MvaD) e uma isopentenil difosfato isomerase (idi) e convertem mevalonato para isopentenil difosfato (IPP) e dimetilalil difosfato (DMAPP), os dois substratos da FPP-sintase.(0192) To evaluate the in vivo production of sclareol in E. coli cells, plasmids and transformed cells are prepared for the coexpression of two diterpene synthases (LPP synthase and sclareol synthase). In addition to the two diterpene synthases, an FPP synthase and a GGPP synthase are also co-expressed to ensure sufficient assembly of GGPP in cells. To further increase carbon flux in the pathway and increase the level of GGPP and subsequently the level of sclareol produced, genes encoding a partial mevalonate pathway are also expressed in the same cells. These last genes encode a mevalonate kinase (mvaK1), a phosphomevalonate kinase (mvaK2), mevalonate diphosphate decarboxylase (MvaD) and an isopentenyl diphosphate isomerase (idi) and convert mevalonate to isopentenyl diphosphate (IPP) and dimethylallyl diphosphate (DMAPP), the two FPP synthase substrates.

(0193) O gene de FPP-sintase de levedura (Número de acesso J05091) é amplificado do DNA genômico de S. cerevisiae usando os primers FPPy_NcoI (SEQ ID NO:75) e FPPY-Eco (SEQ ID NO:6). O DNA genômica é isolado da S. cerevisiae usando o Kit Qiagen RNA/DNA Maxi (Qiagen AG, Basiléia, Suíça). A PCR é realizada com a polimerase de DNA Pfu (Promega AG, Dubendorf, Suíça) em um volume final de 50μl contendo 0,4μl de cada primer, 200μM de dNTPs, 0,5μl de polimerase de DNA, 5μl de DNA genômico de S. cerevisiae. A condição de ciclo de PCR são as seguintes: 90 seg a 95°C; 28 ciclos de 45 seg a 95°C, 30 seg a 54°C e 4 min a 72°C; e 10 min a 72°C. O DNA amplificado é ligado como fragmento de NdeI- Ecorl no primeiro local de clonagem múltipla (MCS1) do plasmídeo pACYCDuet-1 fornecendo o plasmídeo pACYCDuet-FPPs, que hospeda o gene de FPPs sob o controle de um promotor T7.(0193) The yeast FPP synthase gene (Accession number J05091) is amplified from genomic DNA of S. cerevisiae using primers FPPy_NcoI (SEQ ID NO:75) and FPPY-Eco (SEQ ID NO:6). Genomic DNA is isolated from S. cerevisiae using the Qiagen RNA/DNA Maxi Kit (Qiagen AG, Basel, Switzerland). PCR is performed with Pfu DNA polymerase (Promega AG, Dubendorf, Switzerland) in a final volume of 50μl containing 0.4μl of each primer, 200μM of dNTPs, 0.5μl of DNA polymerase, 5μl of S genomic DNA . cerevisiae. The PCR cycle conditions are as follows: 90 sec at 95°C; 28 cycles of 45 sec at 95°C, 30 sec at 54°C and 4 min at 72°C; and 10 min at 72°C. The amplified DNA is ligated as a NdeI-Ecorl fragment into the first multiple cloning site (MCS1) of plasmid pACYCDuet-1 providing plasmid pACYCDuet-FPPs, which hosts the FPPs gene under the control of a T7 promoter.

(0194) Um operador contendo os genes que codifica mvaKI, mvaK2, MvaD e idi é amplificado do DNA genômico de Streptococcus pneumoniae (ATCC BAA-334, Padrões de LGC, Molsheim, França) com os primers MVA-up1-início (SEQ ID NO:77) e MVA-up2-interrupção (SEQ ID NO:78). A PCR é realizada usando a polimerase de DNA de Fusão HS PfuUltraTM II (Stratagene), a composição da mistura de PCR estando de acordo com as instruções do fabricante. A condição de ciclo térmico é 2 min a 95°C; 30 ciclos de 20 seg a 95°C, 20 seg a 58°C e 90 seg a 72°C; e 3 min a 72°C. O fragmento 3,8 Kb é purificado em um gel de agarose e ligado usando o Kit de Clonagem de PCR In-FusionTM Dry-Down (clontech) no segundo MCS do plasmídeo pACYDuet-FPPs digerido com NdeI e XhoI fornecendo o plasmídeo pACYCDuet-4506 (Figura 13A). As sequências das duas inserções são completamente sequenciadas para excluir qualquer mutação.(0194) An operator containing the genes encoding mvaKI, mvaK2, MvaD and idi is amplified from Streptococcus pneumoniae genomic DNA (ATCC BAA-334, LGC Standards, Molsheim, France) with primers MVA-up1-start (SEQ ID NO:77) and MVA-up2-interrupt (SEQ ID NO:78). PCR is performed using PfuUltraTM II HS Fusion DNA Polymerase (Stratagene), the composition of the PCR mix being according to the manufacturer's instructions. The thermal cycling condition is 2 min at 95°C; 30 cycles of 20 sec at 95°C, 20 sec at 58°C and 90 sec at 72°C; and 3 min at 72°C. The 3.8 kb fragment is purified on an agarose gel and ligated using the In-FusionTM Dry-Down PCR Cloning Kit (clontech) into the second MCS of plasmid pACYDuet-FPPs digested with NdeI and XhoI providing plasmid pACYCDuet-4506 (Figure 13A). The sequences of the two inserts are completely sequenced to exclude any mutations.

(0195) O gene CrtE de Pantoea agglomerans que codifica uma GGPP-sintase (Número de acesso M90698) é selecionado e é sintetizada com otimização de códon (DNA2.0, Menlo Park, CA 94025, EUA). O gene CrtE é amplificado com os primers CrtE_Nco (SEQ ID NO:79) e CrtE_Bam (SEQ ID NO:80) a fim de introduzir os locais de restrição NcoI e BamHI na extremidade 5’ e extremidade 3’, respectivamente. A PCR é realizada com a polimerase de DNA Pfu (Promega AG, Dubendorf, Suíça) nas mesmas condições conforme descrito acima. O produto dessa amplificação é ligado no primeiro MCS de plasmídeo pETDuet entre os locais de restrição Nco I e BamH I, fornecendo o plasmídeo pETDuet-CrtE. O plasmídeo pETDuet-SsLPPS3- del4 (contendo o cDNA de SsLPPS3 com uma deleção de 63 códons (SsLPPS3- del4, SEQ ID NO:31, Exemplo 4) é digerido com as enzimas de restrição Nde I e Kpn I. A inserção é recuperada e transferida para os mesmos locais do plasmídeo pETDuet-CrtE, resultando no plasmídeo pETDuet-CrtE-SsLPPS3-del4 contendo ambos os genes SsLPPS e CrtE sob o controle de um promotor T7 (Figura 13B).(0195) The CrtE gene from Pantoea agglomerans encoding a GGPP synthase (Accession number M90698) is selected and synthesized with codon optimization (DNA2.0, Menlo Park, CA 94025, USA). The CrtE gene is amplified with CrtE_Nco (SEQ ID NO:79) and CrtE_Bam (SEQ ID NO:80) primers in order to introduce NcoI and BamHI restriction sites at the 5' end and 3' end, respectively. PCR is performed with Pfu DNA polymerase (Promega AG, Dubendorf, Switzerland) under the same conditions as described above. The product of this amplification is ligated into the first MCS of plasmid pETDuet between the Nco I and BamH I restriction sites, yielding plasmid pETDuet-CrtE. Plasmid pETDuet-SsLPPS3-del4 (containing the SsLPPS3 cDNA with a 63 codon deletion (SsLPPS3-del4, SEQ ID NO:31, Example 4) is digested with the restriction enzymes Nde I and Kpn I. The insert is recovered and transferred to the same sites as the pETDuet-CrtE plasmid, resulting in the pETDuet-CrtE-SsLPPS3-del4 plasmid containing both the SsLPPS and CrtE genes under the control of a T7 promoter ( Figure 13B ).

(0196) O plasmídeo pET101-1132-2-5 (contendo o cDNA de SsTps1132 com uma deleção de 50 códons (SsTps1132-2-5, SEQ ID NO:73, Exemplo 8)) é digerido com enzimas de restrição Nco I e Sac I e a inserção transferida para os mesmos locais do plasmídeo pRSDuet-1, fornecendo o plasmídeo pRSDuet-1132-2-5 (não representado na figura 13).(0196) Plasmid pET101-1132-2-5 (containing the SsTps1132 cDNA with a 50 codon deletion (SsTps1132-2-5, SEQ ID NO:73, Example 8)) is digested with Nco I restriction enzymes and Sac I and insert transferred to the same sites as plasmid pRSDuet-1, yielding plasmid pRSDuet-1132-2-5 (not shown in Figure 13).

(0197) Células E. coli BL21 Star™(DE3) (Invitrogen) podem ser cotransformados com os 3 plasmídeos pACYCDuet-4506 (Figura 13A), pETDuet-CrtE-SsLPPS3-del4 (Figura 13B) e pRSDuet-1132-2-5 (cada um hospedando uma origem diferente de gene de réplica e resistência). Células transformadas são selecionadas em placas de carbenicilina (50μg/ml) cloranfenicol (34μg/ml) canamicina (35μg/ml) LB-agarose. Colônias únicas são usadas para inocular 5mL de meio de LB líquido, suplementado com os mesmos antibióticos. A cultura é incubada durante à noite a 37°C. No dia seguinte, 2mL do meio de TB suplementado com os mesmos antibióticos são inoculados com 0,2mL da cultura durante à noite. Após 6 horas de incubação a 37°C, a cultura é resfriada para 28°C e 1mM de IPTG, 2mg/mL de mevalonato (preparado por dissolução de mevalonolactona (Sigma) em 0,5N de NaOH em uma concentração de 1g/mL e incubando a solução durante 30 min a 37°C) e 0,2ml de decano são adicionados a cada tubo. As culturas são incubadas durante 48 horas a 28°C. As culturas são, então, extraídas duas vezes com 2 volumes de acetato etílico, a fase orgânica é concentrada a 500μL e analisada por CG-MS, conforme descrito acima no Exemplo 3.(0197) E. coli BL21 Star™(DE3) cells (Invitrogen) can be cotransformed with the 3 plasmids pACYCDuet-4506 (Figure 13A), pETDuet-CrtE-SsLPPS3-del4 (Figure 13B) and pRSDuet-1132-2-5 (each hosting a different replication and resistance gene origin). Transformed cells are selected on carbenicillin (50μg/ml) chloramphenicol (34μg/ml) kanamycin (35μg/ml) LB-agarose plates. Single colonies are used to inoculate 5mL of liquid LB medium, supplemented with the same antibiotics. The culture is incubated overnight at 37°C. The next day, 2mL of TB medium supplemented with the same antibiotics is inoculated with 0.2mL of the overnight culture. After 6 hours of incubation at 37°C, the culture is cooled to 28°C and 1mM IPTG, 2mg/ml mevalonate (prepared by dissolving mevalonolactone (Sigma) in 0.5N NaOH at a concentration of 1g/ml and incubating the solution for 30 min at 37°C) and 0.2 ml of decane are added to each tube. Cultures are incubated for 48 hours at 28°C. Cultures are then extracted twice with 2 volumes of ethyl acetate, the organic phase is concentrated to 500μL and analyzed by GC-MS as described above in Example 3.

(0198) Esse exemplo mostra que uma célula E. coli transformada com LPP-sintase e um esclareol-sintase, conforme definido na presente invenção, é capaz de produzir esclareol. As outras enzimas com as quais a célula E. coli é transformada não são essenciais para a produção de esclareol. Na verdade, o esclareol também é produzido quando uma célula de E. coli é transformada com a LPP-sintase e a esclareol-sintase apenas, mas em quantidades menores. As outras enzimas com as quais a célula de E. coli é transformada são adicionadas para o único propósito de aumentar a quantidade de precursor disponível para a LPP-sintase e esclareol- sintase.(0198) This example shows that an E. coli cell transformed with LPP synthase and a sclareol synthase, as defined in the present invention, is capable of producing sclareol. The other enzymes with which the E. coli cell is transformed are not essential for sclareol production. In fact, sclareol is also produced when an E. coli cell is transformed with LPP synthase and sclareol synthase alone, but in smaller amounts. The other enzymes with which the E. coli cell is transformed are added for the sole purpose of increasing the amount of precursor available for LPP synthase and sclareol synthase.

Example 11

(0199) Produção in vivo de esclareol em E. coli pela expressão de uma proteína de fusão contendo uma LPP-sintase e uma esclareol-sintase(0199) In vivo production of sclareol in E. coli by expression of a fusion protein containing an LPP synthase and a sclareol synthase

(0200) A mesma abordagem é usada para a produção de esclareol com uma proteína de fusão contendo a LPP-sintase e a esclareol-sintase, ligadas em conjunto em um único polipeptídio. Um plasmídeo é preparado contendo um novo cDNA que compreende a sequência SsLLPS3-del4 (SEQ ID NO:31) na parte 5' e sequência 1132-2-5 (SEQ ID NO:73) na parte 3’ (SEQ ID NO:87). Nesse cDNA de fusão, o códon de interrupção de cDNA de SsLPPS3-del4 e o códon de início do cDNA de 1132-2-5 são deletados. Os dois cDNAs são ligados por uma sequência de 15 bp (SEQ ID NO:81) que codifica um peptídeo (SEQ ID NO:82), que constitui o ligador entre os dois domínios de proteína. A sequência de aminoácido do polipeptídio de fusão codificado é fornecida na SEQ ID NO:88.(0200) The same approach is used for the production of sclareol with a fusion protein containing LPP synthase and sclareol synthase linked together in a single polypeptide. A plasmid is prepared containing a new cDNA comprising the sequence SsLLPS3-del4 (SEQ ID NO:31) in the 5' part and sequence 1132-2-5 (SEQ ID NO:73) in the 3' part (SEQ ID NO:87 ). In this fusion cDNA, the cDNA stop codon of SsLPPS3-del4 and the cDNA start codon of 1132-2-5 are deleted. The two cDNAs are linked by a 15 bp sequence (SEQ ID NO:81) that encodes a peptide (SEQ ID NO:82), which constitutes the linker between the two protein domains. The amino acid sequence of the encoded fusion polypeptide is provided in SEQ ID NO:88.

(0201) O cDNA de SsLPPS3-del4 (SEQ ID NO:31) é reamplificado do plasmídeo pETDuet-SsLPPS3-del4 usando os primers Sa3del4-fusão-inf1 (SEQ ID NO:83) e Sa3del-fusão-inf2 (SEQ ID NO:84). O primeiro primer é criado para adicionar na extremidade 5’ uma sequência de 15bp, complementar à região Nde I do plasmídeo pETDuet-1. O segundo primer é criado para remover o códon de interrupção e adicionar a sequência que codifica o peptídeo ligador. O cDNA de 1132-2-5 (SEQ ID NO:73) é reamplificado do plasmídeo pET101-1132-2-5 com os primers 1132-fusão- inf1 (SEQ ID NO:85) e 1132-inf2 (SEQ ID NO:86). Assim para SsLPPS-del4, esses primers são criados para adicionar a sequência do ligador na extremidade 3’ e uma sequência de 15bp, complementar com a sequência da região Kpn I do plasmídeo pETDuet-1. A PCR é realizada com a polimerase de DNA Pfu (Promega AG, Dubendorf, Suíça) nas mesmas condições conforme descrito acima no Exemplo 10. O plasmídeo pETDuet-CrtE-SsLPPS3-del4 é digerido com as enzimas Nde I e Kpn I e o DNA de plasmídeo linear é purificado da inserção. Os dois produtos de PCR e o plasmídeo linear são combinados e ligados juntos usando Kit de Clonagem de PCR In-Fusion™ Dry-Down (clontech). O plasmídeo obtido, pETDuet-CrtE-fusão-SsLPPS- 1132 (Figura13C) é DNA controlado por seqüenciamento da inserção.(0201) The cDNA of SsLPPS3-del4 (SEQ ID NO:31) is reamplified from plasmid pETDuet-SsLPPS3-del4 using primers Sa3del4-fusion-inf1 (SEQ ID NO:83) and Sa3del-fusion-inf2 (SEQ ID NO :84). The first primer is created to add a 15bp sequence at the 5' end, complementary to the Nde I region of plasmid pETDuet-1. The second primer is created to remove the stop codon and add the sequence encoding the linker peptide. The 1132-2-5 cDNA (SEQ ID NO:73) is reamplified from plasmid pET101-1132-2-5 with primers 1132-fusion-inf1 (SEQ ID NO:85) and 1132-inf2 (SEQ ID NO: 86). Thus for SsLPPS-del4, these primers are created to add the linker sequence at the 3' end and a 15bp sequence, complementary to the sequence of the Kpn I region of plasmid pETDuet-1. PCR is performed with Pfu DNA polymerase (Promega AG, Dubendorf, Switzerland) under the same conditions as described above in Example 10. Plasmid pETDuet-CrtE-SsLPPS3-del4 is digested with Nde I and Kpn I enzymes and DNA of linear plasmid is purified from the insert. The two PCR products and the linear plasmid are combined and ligated together using In-Fusion™ Dry-Down PCR Cloning Kit (clontech). The plasmid obtained, pETDuet-CrtE-fusion-SsLPPS-1132 (Figure 13C) is DNA controlled by insert sequencing.

(0202) Para avaliar a produção de esclareol do GGPP por essa enzima, células de E. coli BL21 Star™(DE3) (Invitrogen) podem ser cotransformadas com os plasmídeos pACYCDuet-4506 (Figura 13A) e pETDuet-CrtE-SsLPPS-1132-fusão (Figura 13C). Células transformadas são selecionadas em placas de carbenicilina (50μg/ml) cloranfenicol (34μg/ml) LB-agarose. A cultura, a indução, a suplementação com mevalonato, a extração e a análise são realizadas conforme descrito no Exemplo 10.(0202) To evaluate the production of sclareol from GGPP by this enzyme, E. coli BL21 Star™(DE3) cells (Invitrogen) can be cotransformed with plasmids pACYCDuet-4506 (Figure 13A) and pETDuet-CrtE-SsLPPS-1132 -fusion (Figure 13C). Transformed cells are selected on carbenicillin (50μg/ml) chloramphenicol (34μg/ml) LB-agarose plates. Culture, induction, mevalonate supplementation, extraction and analysis are performed as described in Example 10.

(0203) Esse exemplo mostra que uma célula E. coli transformada para expressar uma proteína de fusão com um domínio de LPP-sintase e um domínio de esclareol-sintase, conforme definido na presente invenção, é capaz de produzir esclareol. As outras enzimas com as quais a célula de E. coli é transformada não são essenciais para a produção de esclareol. Na verdade, o esclareol também é produzido quando uma célula de E. coli é transformada com a LPP-sintase e a esclareol-sintase apenas, mas em quantidades muito menores. As outras enzimas com as quais a célula de E. coli é transformada são adicionadas para o único propósito de aumentar a quantidade de precursor disponível para a LPP-sintase e esclareol-sintase.(0203) This example shows that an E. coli cell transformed to express a fusion protein with an LPP synthase domain and a sclareol synthase domain, as defined in the present invention, is capable of producing sclareol. The other enzymes with which the E. coli cell is transformed are not essential for sclareol production. In fact, sclareol is also produced when an E. coli cell is transformed with LPP synthase and sclareol synthase alone, but in much smaller amounts. The other enzymes with which the E. coli cell is transformed are added for the sole purpose of increasing the amount of precursor available for LPP synthase and sclareol synthase.

Claims

1. METHOD FOR PRODUCING SCLAREOL, characterized in that it comprises a) incubating geranyl geranyl pyrophosphate (GGPP) with an isolated polypeptide comprising the amino acid sequence of SEQ ID NO: 1 or 2, under conditions effective to form labdenediol diphosphate ( LPP); b) incubating the LPP produced in step a) with an isolated polypeptide comprising the amino acid sequence of SEQ ID NO: 3 under conditions effective to produce sclareol, thereby producing sclareol.

2. METHOD FOR PRODUCING SCLAREOL, according to claim 1, CHARACTERIZED by said polypeptide having an LPP synthesis activity comprising an amino acid sequence SEQ ID NO: 1 or 2 and a sclareol synthesis activity comprising an amino acid sequence SEQ ID NO:1.

3. METHOD FOR PRODUCING SCLAREOL, according to claim 2, CHARACTERIZED by said polypeptide having an LPP synthesis activity comprising SEQ ID NO: 1 or 2 and wherein said polypeptide having a sclareol synthesis activity comprising SEQ ID NO:3.

4. METHOD FOR PRODUCING SCLAREOL, according to claim 3, CHARACTERIZED by said polypeptide having an LPP synthesis activity consisting of SEQ ID NO: 1 or 2 and wherein said polypeptide has a sclareol synthesis activity consisting of the SEQ ID NO:3.